> クラスタリング(clustering)は、大量の情報を意味のあるグループ(クラスタ)として構造化できる探索的データ解析 ※20 の手法である。この手法では、グループの所属関係が事前にわかっている必要はない。分析によって浮かび上がる各クラスタは、オブジェクトからなるグループを定義する。 グループを構成するオブジェクトは、ある程度の類似性を共有する一方で、他のクラスタ内のオブジェクトと比べて相違が大きくなっている。このような方法でグループを定義することから、クラスタリングは「教師なし分類」とも呼ばれる。クラスタリングは、情報を構造化し、データ間の意味のある関係を導き出すのに適した手法である。
[[📖Python機械学習プログラミング 達人データサイエンティストによる理論と実践]] p.7
- [[階層型クラスタリング]]
- [[分割最適化クラスタリング]]
- クラスタの良さを表す関数を定義し,その関数を最適化するようなクラスタを見つけ出す
## 参考資料
- [[クラスタリング 神嶌 敏弘]]
- [[問題解決技法入門 クラスタ分析 堀田敬介 文教大学]]