最小2乗法とは?誤差がある世界での平均値。
多変量解析を勉強しているときの覚書。
※この記事は主にGoogle検索と生成AIによる要約を元に記述されています。
最小2乗法とは?
全ての測定データの誤差を最小にした関係式を求める方法。
測定データの誤差を2乗した和が最小となる代表値を求める式。
2乗する理由は測定値が負の値のとき、正の値と打ち消し合って誤差がなくなってしまうため、2乗して代表値からの誤差を距離として計測する。
異常値があると関係式の品質が低くなる。
逆に全ての測定データが信頼できるものであれば、最小2乗法は最も品質が高くなる。
平均値と最小2乗法
平均値=最小2乗法の関係式の変数に代入して算出した値。
ちなみに誤差を2乗せず絶対値で計算すると中央値になるらしい。
データ解析の分野での平均値は最小2乗法の式から。
算術の分野で平均値はデータを全部足して総数で割った値。
誤差がない世界ではデータ解析と算術の平均値は一致する。
プログラミングで最小2乗法を計算するとき。
エクセルにはLINESTという関数が用意されている。
参考: LINEST 関数 - Microsoft サポート
ここで疑問が…。
平均値=最小2乗法ならばAVERAGEでないのか?
LINEST関数は配列を返す。
AVERAGE関数は値を返す。