この記事では、pandasのreplace()メソッドを使ってデータセットの複数の値を変更する方法を紹介します。
Pandasはデータ操作や分析のためのpythonライブラリで、データセットを使いやすくするための様々な機能を備えています。
データセットの複数の値を置換する
pandasライブラリを用いて、データセット内の複数の値を置き換えるチュートリアルを以下に示します。
1. Pandasのインポート
まず、Pandasをインポートすることから始めましょう。
import pandas as pd
|
2. サンプルデータ
以下のデータセットを例として、PandasのDataFrameで実装します。
‘columns’はDataFrameで定義されたDatasetのカラムヘッダを表します。
import pandas as pd
data = pd.DataFrame([
[ 'Jack' , 25 , 'USA' ],
[ 'Rohan' , 20 , 'India' ],
[ 'Sam' , 23 , 'France' ],
[ 'Rini' , 19 , 'UK' ],
[ 'Tywin' , 16 , 'Ireland' ]],
columns = [ 'Name' , 'Age' , 'Country' ])
|
プログラムを実行し、DataFrameをprintメソッドで印刷すると、上記のコードは次のような出力になります – 3つの列 ‘Name’, ‘Age’, ‘Country’ を持ちます。
print (data)
|
new_data = data.replace({ 'Country' :{ 'USA' : 'India' }})
print (new_data)
|
この記事もチェック:Pandas DataFrameの単一カラムの名前を変更する
3. replace() メソッドによる値の置き換え
pandasのreplace()メソッドを使うと、指定した値を別の指定した値で置き換えることができます。
今回作成したサンプルデータセットでは、「国」列のUSAをIndiaに変更したいと思います。
updated_data = new_data.replace({ 'Age' : { 25 : 23 , 16 : 18 }, 'Name' :{ 'Tywin' : 'Stark' }})
print (updated_data)
|
import pandas as pd
data = pd.DataFrame([
[ 'Jack' , 25 , 'USA' ],
[ 'Rohan' , 20 , 'India' ],
[ 'Sam' , 23 , 'France' ],
[ 'Rini' , 19 , 'UK' ],
[ 'Tywin' , 16 , 'Ireland' ]],
columns = [ 'Name' , 'Age' , 'Country' ])
print (data)
print ( ' )
new_data = data.replace({ 'Country' :{ 'USA' : 'India' }})
print (new_data)
updated_data = new_data.replace({ 'Age' : { 25 : 23 , 16 : 18 }, 'Name' :{ 'Tywin' : 'Stark' }})
print ( ' )
print (updated_data)
|
ここで、DataFrameの複数の値を一度に置換しようとすると、例えば、Ageカラムの25を23に、16を18に、Nameカラムの’Tywin’を’Stark’に置換すると、以下のようなコードになります。
目的の値を変更した後の最終的な出力です。
Dataframeの複数の値を置換する完全なコード
Python の replace() メソッドがどのように動作するか、以下のコードを試してみてください。
まとめ
このチュートリアルは以上です。
PythonでPandas DataFrameの複数の値を置換する方法についてよく理解していただけたと思います。
今後もPythonでこのようなチュートリアルを続けていきます。