[Evaluating Clustering Results. The criteria used to evaluate… | by Vijini Mallawaarachchi | Towards Data Science](https://towardsdatascience.com/evaluating-clustering-results-f13552ee7603)
![[Pasted image 20221221203717.png|600]]
分類問題のように、Ground Truth(記事中Golden Standard)を人間が予め決めて、クラスタに配属された要素数と要素のラベルをもとに、PrecisionとRecallを定義している。
> 理想的なケースでは、クラスタリング・アプローチによって予測されるクラスタ数は、ゴールド・スタンダードに存在するクラス数と同じであるK = Sです。しかし、特定のケースでは、K < SまたはK > Sで、クラスタリングアプローチによって予測されるクラスタ数は、ゴールドスタンダードに存在するクラス数と同じではありません。
クラスタリング結果をKxS行列で表し、次の4指標を計算できる。
- [[Precision]]
- [[Recall]]
- [[F1-score]]
- [[Adjusted Rand Index]]