この記事では、Pythonで標準偏差の3つのバリエーションに焦点を当てる予定です。
まず、標準偏差とは何でしょうか?
標準偏差は、平均値または中心値に対するデータ値またはエンティティの偏差を表します。
これは主にデータ分析の分野で、データの分布を調査・分析するために使用されます。
では、さらにPythonで標準偏差を計算する様々な方法を見ていきましょう。
この記事もチェック:Python(Numpy)を使って平均と標準偏差を求める方法
変形1: stdev() 関数を使った Python での標準偏差の計算
Python の statistics モジュールには、値の集合の標準偏差を計算するための関数 `statistics.stdev()’ が用意されています。
構文は以下の様な感じです。
statistics.stdev(data) |
以下の例では、リストを作成し、そのデータに対して標準偏差の演算を行いました。
例えば、以下の様になります。
import statistics as std
lst = [ 1 , 2 , 3 , 4 , 5 ]
stat = std.stdev(lst)
print (stat)
|
結果は以下の通りです。
1.5811388300841898 |
バリエーション 2: NumPy モジュールを使った標準偏差
NumPyモジュールは、数値データを扱い、操作するための様々な関数を提供しています。
以下のように numpy.std() 関数
を使って、値の範囲に対する標準偏差を計算することができます。
構文は以下の様な感じです。
numpy.std(data) |
例えば、以下の様になります。
import numpy as np
num = np.arange( 1 , 6 )
stat = np.std(num)
print (stat)
|
ここでは、1〜6の連続した値のセットを生成するために `numpy.arange()’ 関数を使用しました。
さらに、標準偏差は std() 関数を用いて計算されている。
出力は以下の通りです。
1.4142135623730951 |
バリエーション3:Pandasモジュールによる標準偏差
Pandasモジュールは、大量のデータセットを扱うことができ、また、これらのデータセットに対して実行される様々な関数を提供します。
Pandasモジュールで、我々はデータ値に対して様々な統計処理を行うことができ、そのうちの1つが以下に示す標準偏差です。
構文は以下の様な感じです。
dataframe.std() |
例えば、以下の様になります。
import pandas as pd
lst = [ 1 , 2 , 3 , 4 , 5 , 6 , 7 ]
data = pd.DataFrame(lst)
stat = data.std()
print (stat)
|
この例では、リストを作成し、pandas.dataframe()関数を使用してデータフレームに変換しています。
さらに、データフレームに存在するこれらの値の標準偏差を std()
関数を使って計算しました。
結果は、以下の通りになります。
0 2.160247
dtype: float64 |
まとめ
ここまでで、このトピックは終了です。
何か質問があれば、お気軽にコメントください。
Pythonに関するこのような投稿をもっと見るには、@ AskPythonとKeep Learningにご注目ください。