最小2乗法とは?誤差がある世界での平均値。

多変量解析を勉強しているときの覚書。

※この記事は主にGoogle検索と生成AIによる要約を元に記述されています。


最小2乗法とは?

全ての測定データの誤差を最小にした関係式を求める方法。

測定データの誤差を2乗した和が最小となる代表値を求める式。
2乗する理由は測定値が負の値のとき、正の値と打ち消し合って誤差がなくなってしまうため、2乗して代表値からの誤差を距離として計測する。

異常値があると関係式の品質が低くなる。
逆に全ての測定データが信頼できるものであれば、最小2乗法は最も品質が高くなる。


平均値と最小2乗法

平均値=最小2乗法の関係式の変数に代入して算出した値。

ちなみに誤差を2乗せず絶対値で計算すると中央値になるらしい。

データ解析の分野での平均値は最小2乗法の式から。
算術の分野で平均値はデータを全部足して総数で割った値。

誤差がない世界ではデータ解析と算術の平均値は一致する。


プログラミングで最小2乗法を計算するとき。

エクセルにはLINESTという関数が用意されている。
参考: LINEST 関数 - Microsoft サポート

ここで疑問が…。
平均値=最小2乗法ならばAVERAGEでないのか?

LINEST関数は配列を返す。
AVERAGE関数は値を返す。


【関連記事】