多くの場合、CSVやExcel、テキストファイルなどのDataFrameの形でデータを使用したり、保存したりします。
しかし、データをPickleファイルとして保存することもできます。
PickleはPythonのオブジェクトをディスク上に表現する方法の一つです。
オブジェクトをシリアライズした形式で保存し、後でオブジェクトを再構築するために使用できます。
Picklesは、迅速かつ容易にアクセスする必要があるデータを保存するのに便利です。
この記事では、Pandasでpickleファイルからデータを保存したり読み込んだりする方法について学びます。
Pandasを使ったPickleファイルの読み込み
Pandasはpickleファイルを読み書きする方法を提供します。
pickleファイルを読む最も基本的な方法は、read_pickle()関数を使用することです。
この関数はpickleファイルの名前を引数に取り、pandasのDataFrameを返します。
Pythonでpickleファイルを読むには、read_pickle()関数を使用します。
関数の構文
pd.read_pickle(path, compression='infer')
|
read_csv()関数と同様に、この関数もPandas DataFrameを出力として返します。
例えば、以下のようになります。
df = pd.read_pickle('data.pkl')
|
それでは、python でデータを pickle ファイルに保存する方法を見てみましょう。
まず、DataFrame を作成します。
import pandas as pd
data = {
'Name': ['Microsoft Corporation', 'Google, LLC', 'Tesla, Inc.',
'Apple Inc.', 'Netflix, Inc.'],
'Icon': ['MSFT', 'GOOG', 'TSLA', 'AAPL', 'NFLX'],
'Field': ['Tech', 'Tech', 'Automotive', 'Tech', 'Entertainment'],
'Market Shares': [100, 50, 160, 300, 80]
}
df = pd.DataFrame(data)
# print dataframeprint(df)
|
結果は以下の通りです。
Name Icon Field Market Shares
0 Microsoft Corporation MSFT Tech 100
1 Google, LLC GOOG Tech 50
2 Tesla, Inc. TSLA Automotive 160
3 Apple Inc. AAPL Tech 300
4 Netflix, Inc. NFLX Entertainment 80
|
DataFrameをpickleファイルに保存します。
df.to_pickle('company info.pkl')
|
pickleファイルを読みましょう。
df2 = pd.read_pickle('company info.pkl')
# print the dataframeprint(df2)
|
結果は以下の通りです。
Name Icon Field Market Shares
0 Microsoft Corporation MSFT Tech 100
1 Google, LLC GOOG Tech 50
2 Tesla, Inc. TSLA Automotive 150
3 Apple Inc. AAPL Tech 200
4 Netflix, Inc. NFLX Entertainment 80
|
この記事もチェック:Pandas DataFrameの単一カラムの名前を変更する
まとめ
Pandasのread_pickle()関数を用いてpickleファイルを読み込む方法を学びました。
また、read_pickle()関数を使用すると、pickle化されたDataFrameを読み込むことができます。
Pickleファイルはデータを保存するには最適ですが、Pickleファイルのデータを使用する場合は、信頼できるソースからのものであることを確認してください。