今回は、DataFrameをCSV(comma-separated values)ファイルとして保存するテクニックを中心に説明します。
それでは、始めましょう。
Python Pandas モジュールとは?
Pythonにはデータを扱うための様々な機能があり、それぞれ異なる機能を提供します。
PythonのPandasモジュールは、データセットという観点から、大きな値のデータを扱うことを支援します。
このように、Pandasモジュールを使用することで、巨大なデータセットのデータ値を操作し、それを処理することができます。
Pandasはデータの値や要素をDataFrameという形で扱います。
DataFrameは行と列で構成され、行と列は変更したりハイライトしたりすることができます。
それでは、PandasモジュールでDataFrameを作成することに焦点を当てます。
この記事もチェック:Pandas DataFrameの単一カラムの名前を変更する
PythonでDataFrameを作成する
以下のコードを見てください。
import os
import pandas
Domain = [ "IT" , "DATA_SCIENCE" , "NETWORKING" ]
domain_dict = { 'Domain' : Domain}
data_frame = pandas.DataFrame(domain_dict)
|
ここでは、「pandas.DataFrame()関数」を使って、Dictionary形式で渡されたデータからデータフレームを作成します。
出力は以下の通りです。
Domain
0 IT 1 DATA_SCIENCE 2 NETWORKING |
DataFrameを作成したら、次はDataFrameをCSVファイルとして保存する番です。
以下のセクションを参照してください。
この記事もチェック:PandasでデータフレームをHTML形式で表示する
DataFrameをCSVファイルとして保存する
スクラップや分析で作成した膨大なデータを、読みやすく、むしろ共有しやすい形で保存する必要がある場面によく出くわします。
そこで、以下に説明するように、データフレームをCSVファイルに保存することによって、これを実現することができます。
構文は以下の様な感じです。
dataframe.to_csv( 'file.csv' )
|
pandas.to_csv() 関数` は、データフレームを CSV ファイルとして保存することを可能にします。
この関数にパラメータとしてファイル名を渡す必要があります。
以下の例を見てみましょう。
import pandas
Domain = [ "IT" , "DATA_SCIENCE" , "NEYWORKING" ]
domain_dict = { 'Domain' : Domain}
data_frame = pandas.DataFrame(domain_dict)
data_frame.to_csv( 'DEMO.csv' )
|
結果は以下の通りです。
まとめ
ここまでで、このトピックは終了です。
何か疑問があれば、お気軽にコメントください。