[問題解決技法入門 クラスタ分析 堀田敬介 文教大学](http://www.bunkyo.ac.jp/~hotta/lab/courses/2014/2014hts/14hts-5.pdf)
- クラスタ分析
- 複数の対象(もの、変数など)を、その属性によって類似度をはかり、均質な集団(cluster)に分類する方法の総称
- クラスタ分析の種類
- 階層的方法
- 樹形図を作成
- 目的により高さを決めてクラスタリング
- 非階層的方法
- 予めクラスタ数を決める
- 類似度の測定
- 距離「間隔尺度」
- [[ユークリッド距離]]
- [[ユークリッド平方距離]]
- [[重み付きユークリッド距離]]
- [[マンハッタン距離]]
- [[ミンコフスキー距離]]
- [[マハラノビス汎距離]]
- 相関「間隔尺度」
- [[ピアソンの相関係数]]
- [[ベクトル内積]]
- 相関「順序尺度」
- [[スピアマンの順位相関係数]]
- [[ケンドールの順位相関係数]]
- 距離「名義尺度」
- 変量間類似度「名義尺度」
![[Pasted image 20220205214040.png]]
- 個体間類似度
- ユークリッド距離 (L2ノルム)
- マンハッタン距離(L1ノルム)
- ミンコフスキー距離 ($L_{p}$ノルム、$L_{\infty}$)
- マハラノビス汎距離
- ユークリッド平方距離 (よく使われる) ユークリッド距離の平方根なし版
- クラスタ間の類似度
- どうやってクラスタ生成時に他のクラスタとの類似度を更新するか?