正規分布とは?標準偏差と分散の違い。

多変量解析を勉強しているときの覚書。

※この記事は主にGoogle検索と生成AIによる要約を元に記述されています。 


正規分布とは?

連続的な変数に関する確率分布の一つ。
データのばらつきを表した分布図または式。
平均値を中心にして、山なりの曲線を描く。


参考: 正規分布 - Wikipedia

平均をμ(ミクロン)、分散をσ²(シグマの2乗)とすると1次元正規分布はN(μ, σ²)と表記される。


標準偏差と分散の違い。

両方ともデータの散らばり具合(ばらつき)を表す指標。

  • 標準偏差: 平均値からの散らばり具合の指標。
          σ(シグマ)と表記される。
  • 分散: 標準偏差を2乗した値。
        標準偏差の面積。
        σ²(シグマの2乗)と表記される。

平均値からの差は正と負の値があるため、2乗して正の値とし、まず分散を求める。
それを平方根して標準偏差とする。

標準偏差はデータと同じ単位なので分散で表記するより直感的に評価しやすい。


【関連記事】