> HDBSCAN - Hierarchical Density-Based Spatial Clustering of Applications with Noise. Performs [[DBSCAN]] over varying epsilon values and integrates the result to find a clustering that gives the best stability over epsilon. This allows HDBSCAN to find clusters of varying densities (unlike DBSCAN), and be more robust to parameter selection. [HDBSCANを解説 → Pythonでinstall、実行 - Qiita](https://qiita.com/ozaki_inu/items/45fb17cd3596a64ed489) ## FAQ [Frequently Asked Questions — hdbscan 0.8.1 documentation](https://hdbscan.readthedocs.io/en/latest/faq.html#q-i-am-not-getting-the-claimed-performance-why-not) - HDBSCANは50~100次元程度のデータまでは良好な性能を発揮するが、それ以上になると性能が大きく低下する。 - 密度ベースのクラスタリングは、密集した領域を分離するのに十分なデータがあることに依存している。 高次元の空間では、これが難しくなる。 ## 実装 [GitHub - scikit-learn-contrib/hdbscan: A high performance implementation of HDBSCAN clustering.](https://github.com/scikit-learn-contrib/hdbscan) - [[Condensed Trees - HDBSCAN]] - [[Outlier Based Membership - HDBSCAN]] ## Papers - [[2013__PAKDD__Density-Based Clustering Based on Hierarchical Density Estimates]]