標準偏差 SD は,データのバラツキ具合を表す指標(=散布度)の 1つ。データセットの各データが平均値からどれだけ離れているかを示す。
定義は「データ全体の平均(\(\overline{x}\))と各データ(\(x_i\))との偏差(\(x_i-\overline{x}\))の二乗平均の正の平方根」である。
\(x_i\) = 個々のデータの値,\(\overline{x}\) = 全標本データの平均値
上記の数式から明確なように,基本的に平均 meanとの親和性が高い。そのためデータの要約で代表値として 平均 meanを記すとき,横に併記する散布度は標準偏差 SD とすることが多い。
正規分布との関係,1.96 SD の 95%ルール,チェビシェフの不等式などが重要。
本項の解説内容 標準偏差 SD はデータのバラツキ具合を表す指標(=散布度)の 1つ 計算方法:〈平均からの偏差〉の〈二乗平均〉の平方根 標準偏差が大きい = 平均から離れたデータが多い = 散らばり大 データが正規分布に沿うとき,95 […]