Pythonでstatistics,Numpy,Padnsaを使った標準偏差の実装方法

スポンサーリンク

この記事では、Pythonで標準偏差の3つのバリエーションに焦点を当てる予定です。

まず、標準偏差とは何でしょうか?

標準偏差は、平均値または中心値に対するデータ値またはエンティティの偏差を表します。

これは主にデータ分析の分野で、データの分布を調査・分析するために使用されます。

では、さらにPythonで標準偏差を計算する様々な方法を見ていきましょう。


スポンサーリンク

変形1: stdev() 関数を使った Python での標準偏差の計算

Python の statistics モジュールには、値の集合の標準偏差を計算するための関数 `statistics.stdev()’ が用意されています。

構文は以下の様な感じです。

statistics.stdev(data)

以下の例では、リストを作成し、そのデータに対して標準偏差の演算を行いました。

例えば、以下の様になります。

import statistics as std
lst = [1,2,3,4,5]
  
stat = std.stdev(lst)
print(stat)

結果は以下の通りです。

1.5811388300841898

バリエーション 2: NumPy モジュールを使った標準偏差

NumPyモジュールは、数値データを扱い、操作するための様々な関数を提供しています。

以下のように numpy.std() 関数 を使って、値の範囲に対する標準偏差を計算することができます

構文は以下の様な感じです。

numpy.std(data)

例えば、以下の様になります。

import numpy as np
num = np.arange(1,6)
stat = np.std(num)
print(stat)

ここでは、1〜6の連続した値のセットを生成するために `numpy.arange()’ 関数を使用しました。

さらに、標準偏差は std() 関数を用いて計算されている。

出力は以下の通りです。

1.4142135623730951

バリエーション3:Pandasモジュールによる標準偏差

Pandasモジュールは、大量のデータセットを扱うことができ、また、これらのデータセットに対して実行される様々な関数を提供します。

Pandasモジュールで、我々はデータ値に対して様々な統計処理を行うことができ、そのうちの1つが以下に示す標準偏差です。

構文は以下の様な感じです。

dataframe.std()

例えば、以下の様になります。

import pandas as pd
lst = [1,2,3,4,5,6,7]
data = pd.DataFrame(lst)
stat = data.std()
print(stat)

この例では、リストを作成し、pandas.dataframe()関数を使用してデータフレームに変換しています。

さらに、データフレームに存在するこれらの値の標準偏差を std() 関数を使って計算しました。

結果は、以下の通りになります。

0    2.160247
dtype: float64

まとめ

ここまでで、このトピックは終了です。

何か質問があれば、お気軽にコメントください。

Pythonに関するこのような投稿をもっと見るには、@ AskPythonとKeep Learningにご注目ください。

タイトルとURLをコピーしました