# Dan Hendrycks AI 安全性・LLM 評価を専門とする研究者。[[Center for AI Safety]](CAIS)の創設者・エグゼクティブディレクター。MMLU(Massive Multitask Language Understanding)の設計者としても知られ、LLM 評価のデファクトスタンダードとなったベンチマークを複数手がけてきた。 ## 主な業績(wiki 内に関連ソースがあるもの) - MMLU(Measuring Massive Multitask Language Understanding、2021)— LLM の科目別学術能力を評価する初期の広域ベンチマーク - WMDP Benchmark(大量破壊兵器関連知識の測定と機械学習的忘却、2024) - HLE(Humanity's Last Exam)— 飽和した既存ベンチマークを超える最前線学術ベンチマーク([[@2025__arXiv__Humanity's Last Exam]])の上級著者 ## 関連 - [[Center for AI Safety]] — 所属機関 - [[@2025__arXiv__Humanity's Last Exam]] — 上級著者として参加 - [[LLM評価]] — 関連概念