Dan Hendrycks - yuuk1's Digital Garden

# Dan Hendrycks AI 安全性・LLM 評価を専門とする研究者。[[Center for AI Safety]]（CAIS）の創設者・エグゼクティブディレクター。MMLU（Massive Multitask Language Understanding）の設計者としても知られ、LLM 評価のデファクトスタンダードとなったベンチマークを複数手がけてきた。 ## 主な業績（wiki 内に関連ソースがあるもの） - MMLU（Measuring Massive Multitask Language Understanding、2021）— LLM の科目別学術能力を評価する初期の広域ベンチマーク - WMDP Benchmark（大量破壊兵器関連知識の測定と機械学習的忘却、2024） - HLE（Humanity's Last Exam）— 飽和した既存ベンチマークを超える最前線学術ベンチマーク（[[@2025__arXiv__Humanity's Last Exam]]）の上級著者 - **Unsolved Problems in ML Safety（2021）** — デプロイ後監視の必要性を定式化した AI 安全性サーベイ。「モデルはポイントワイズに訓練・評価される→静的ベンチマークは実行時ハザードを見逃す」という主張が [[CoTモニタリング]] の知的起源の一つとして位置づけられている（[[@2026__SAILBlog__CoT-Monitoring-Where-Does-a-Hot-Safety-Problem-Come-From]]）。 ## 関連 - [[Center for AI Safety]] — 所属機関 - [[@2025__arXiv__Humanity's Last Exam]] — 上級著者として参加 - [[LLM評価]] — 関連概念 - [[CoTモニタリング]] — Unsolved Problems in ML Safety が知的起源の一つ - [[@2026__SAILBlog__CoT-Monitoring-Where-Does-a-Hot-Safety-Problem-Come-From]] — Hase & Potts がデプロイ後監視の基礎として引用