# Dan Hendrycks
AI 安全性・LLM 評価を専門とする研究者。[[Center for AI Safety]](CAIS)の創設者・エグゼクティブディレクター。MMLU(Massive Multitask Language Understanding)の設計者としても知られ、LLM 評価のデファクトスタンダードとなったベンチマークを複数手がけてきた。
## 主な業績(wiki 内に関連ソースがあるもの)
- MMLU(Measuring Massive Multitask Language Understanding、2021)— LLM の科目別学術能力を評価する初期の広域ベンチマーク
- WMDP Benchmark(大量破壊兵器関連知識の測定と機械学習的忘却、2024)
- HLE(Humanity's Last Exam)— 飽和した既存ベンチマークを超える最前線学術ベンチマーク([[@2025__arXiv__Humanity's Last Exam]])の上級著者
## 関連
- [[Center for AI Safety]] — 所属機関
- [[@2025__arXiv__Humanity's Last Exam]] — 上級著者として参加
- [[LLM評価]] — 関連概念