[Variance - Wikipedia](https://en.wikipedia.org/wiki/Variance) > 確率論および統計学において、分散とは、確率変数の母平均または標本平均からの偏差の二乗の期待値のことです。分散は分散の尺度であり、数値の集合がその平均値からどの程度広がっているかを示す尺度であることを意味する。... データの統計解析が一般的な科学分野では、分散は重要なツールである。分散とは、[[標準偏差]]の2乗、分布の第2中心モーメント、確率変数の[[共分散]]をいい、よく$\sigma ^{2}$,$s^{2}$, $\operatorname{Var}$ で表現される。 - [[標本分散]] - [[不偏分散]] --- [なぜ分散は2乗の和なのか - 小人さんの妄想](https://rikunora.hatenablog.com/entry/2019/04/09/114614) ### なぜ、差の2乗を計算するのか? [[最小二乗法]]で次の図のように、ばねでひっぱるイメージで、ばねの弾性エネルギーから二乗がきている。 ![[Pasted image 20220128131132.png|400]] ばねでひっぱると、落ち着く先は、ちょうどデータの平均値になる。 平均値とは、「バネに溜まったエネルギーが最小となる点」 => 分散の最小化 バネに溜まったエネルギーとは、各データと平均との差の2乗、つまり分散に比例 ### 差そのものであってはいけないのか? 分散の加法性により説明できる。二乗でマイナスを吸収できる。 - 変位の2乗で溜まるエネルギーのような保存量 - 「各データにエネルギーを等しく分配したとき、1個あたりのデータが変位する大きさ」 ### なぜ、分散と標準偏差の2種類があるのか? --- 分散は[[マンハッタン距離]] 標準偏差は[[ユークリッド距離]]