多くの場合、CSVやExcel、テキストファイルなどのDataFrameの形でデータを使用したり、保存したりします。
しかし、データをPickleファイルとして保存することもできます。
PickleはPythonのオブジェクトをディスク上に表現する方法の一つです。
オブジェクトをシリアライズした形式で保存し、後でオブジェクトを再構築するために使用できます。
Picklesは、迅速かつ容易にアクセスする必要があるデータを保存するのに便利です。
この記事では、Pandasでpickleファイルからデータを保存したり読み込んだりする方法について学びます。
Pandasを使ったPickleファイルの読み込み
Pandasはpickleファイルを読み書きする方法を提供します。
pickleファイルを読む最も基本的な方法は、read_pickle()関数を使用することです。
この関数はpickleファイルの名前を引数に取り、pandasのDataFrameを返します。
Pythonでpickleファイルを読むには、read_pickle()関数を使用します。
関数の構文
pd.read_pickle(path, compression = 'infer' )
|
read_csv()関数と同様に、この関数もPandas DataFrameを出力として返します。
例えば、以下のようになります。
df = pd.read_pickle( 'data.pkl' )
|
それでは、python でデータを pickle ファイルに保存する方法を見てみましょう。
まず、DataFrame を作成します。
import pandas as pd
data = {
'Name' : [ 'Microsoft Corporation' , 'Google, LLC' , 'Tesla, Inc.' ,
'Apple Inc.' , 'Netflix, Inc.' ],
'Icon' : [ 'MSFT' , 'GOOG' , 'TSLA' , 'AAPL' , 'NFLX' ],
'Field' : [ 'Tech' , 'Tech' , 'Automotive' , 'Tech' , 'Entertainment' ],
'Market Shares' : [ 100 , 50 , 160 , 300 , 80 ]
}
df = pd.DataFrame(data)
# print dataframe print (df)
|
結果は以下の通りです。
Name Icon Field Market Shares
0 Microsoft Corporation MSFT Tech 100
1 Google, LLC GOOG Tech 50
2 Tesla, Inc. TSLA Automotive 160
3 Apple Inc. AAPL Tech 300
4 Netflix, Inc. NFLX Entertainment 80
|
DataFrameをpickleファイルに保存します。
df.to_pickle( 'company info.pkl' )
|
pickleファイルを読みましょう。
df2 = pd.read_pickle( 'company info.pkl' )
# print the dataframe print (df2)
|
結果は以下の通りです。
Name Icon Field Market Shares
0 Microsoft Corporation MSFT Tech 100
1 Google, LLC GOOG Tech 50
2 Tesla, Inc. TSLA Automotive 150
3 Apple Inc. AAPL Tech 200
4 Netflix, Inc. NFLX Entertainment 80
|
この記事もチェック:Pandas DataFrameの単一カラムの名前を変更する
まとめ
Pandasのread_pickle()関数を用いてpickleファイルを読み込む方法を学びました。
また、read_pickle()関数を使用すると、pickle化されたDataFrameを読み込むことができます。
Pickleファイルはデータを保存するには最適ですが、Pickleファイルのデータを使用する場合は、信頼できるソースからのものであることを確認してください。