[機械学習の解釈性に関する研究動向とシステム運用への応用 / A Survey on Interpretable Machine Learning and Its Application for System Operation - Speaker Deck](https://speakerdeck.com/tsurubee/a-survey-on-interpretable-machine-learning-and-its-application-for-system-operation)
- 解釈性と説明性 同義
- 人間に理解可能な言葉で説明または提示する能力
- モデルの学習や意思決定
- ブラックボックス問題
- 医療診断の所見と整合性確認
- 自動運転の事故原因の究明
- 公的機関 公平性
- AI開発ガイドライン
- 透明性
- 説明責任
- EU: GDPR 22条
- 2016年から論文が増加
![[Pasted image 20210623171331.png|300]]
- FAT/ML, AAAI, NIPS
- 産業界
- DataRobot
- 解釈性得られる
- 正当化のための説明
- 修正のための説明
- 継続改善
- 新たな発見へ
- 批判
- ブラックボックスの一部を近似的に説明
- モデルの機能に忠実ではない
- 解釈手法の分類
- Scope
- Global: モデル自体に解釈性
- Local: 個々の推論時に解釈
- Methodology
- Intrinsic: 本質的に解釈可能なモデルの利用や設計
- Post-hoc: モデルの学習後に解釈性を付与
- Usage
- 代表的な手法 モデル固有かそうでないか
- LIME
- Shapley explanations
- シャープレイ値: 協力ゲーム理論
- 利得 公平分配
- 特徴量がプレーヤー、予測値が利得
- 限界貢献度
- シャープレイ値: 適用時の問題
- 課題1: 計算量
- 課題2: MLでは全ての特徴量が必要なので、ある特徴量がないケースの予測値をどう計算するか
- [[SHAP]]
- 課題1: 重み付き最小二乗問題 + モンテカルロ近似
- 課題2: