この記事では、機械学習やデータサイエンスの世界における基本的な要件を学んでいきます。
データをプロットすることは、データを可視化し、データポイントの理解を深めるのに役立ちます。
Python を使って Excel シートのデータをプロットする ## Steps to Plot data from Excel Sheet using Python
今日は、Pythonプログラミングのpandasモジュールとmatplotlibモジュールを使って、Excelシートを使ってデータをプロットしてみましょう。
それでは始めましょう。
ステップ1:モジュールのインポート
matplotlibとpandasのモジュールをインポートします。
matplotlibモジュールはプロットに、pandasはExcelファイルのデータポイントを処理するために使用されます。
モジュールをインポートする前に、モジュールがシステムにインストールされていることを確認する必要があります。
これは、CMD(コマンドプロンプト)上で以下のコマンドを使用して行われます。
1
2
|
pip install pandas pip install matplotlib |
それでは、以下のコードで、両方のモジュールをインポートしてみましょう。
1
2
|
import pandas as pd
import matplotlib.pyplot as plt
|
ステップ2:データセットのロード
データをロードするために、pandasモジュールの read_excel
関数を使用します。
これは、パラメータとしてエクセルファイルのパスを取ります。
この記事では、以下の画像に示すように、いくつかのサンプルデータ点を含むサンプルエクセルシートを作成しました。
1
2
|
var = pd.read_excel( "sample_excel.xlsx" )
print (var)
|
さて、データの読み込みは以下のコードで行います。
1
2
|
x = list (var[ 'X values' ])
y = list (var[ 'Y values' ])
|
ステップ 3: x と y の値を分離する
さて、データセットには2つの列があり、1つはxデータ・ポイント、もう1つはyデータ・ポイントです。
これは、最初の列と2番目の列を別々の変数に分離した後に行われる。
plt.figure(figsize=(10,10)) plt.style.use('seaborn') plt.scatter(x,y,marker="*",s=100,edgecolors="black",c="yellow") plt.title("Excel sheet to Scatter Plot") plt.show() |
xとyの座標を分離した後、次のステップでデータの散布図を作成します。
ステップ 4: 散布図のプロット
散布図は、以下のコードブロックを使って表示されます。
別のデータセットで試すこともできますし、オンラインで無作為にExcel形式のデータセットを検索することもできます。
コンセプトを十分に理解し、自分で実装できるようになることを願っています。
お読みいただきありがとうございました。