- Random Forest の開発者の2001年の論文
- [Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author)](https://projecteuclid.org/journals/statistical-science/volume-16/issue-3/Statistical-Modeling--The-Two-Cultures-with-comments-and-a/10.1214/ss/1009213726.full)
- 予測と情報抽出の2つがデータ分析のゴール
- モデリングの2つの文化
- データが所与の確率的データモデルによって生成されると仮定するアプローチ
- 線形モデルや決定木のようなシンプルで解釈しやすいモデル
- データのメカニズムを未知のものとして入力変数に対する応答をア ルゴリズムを使って予測するアプローチ
- Support Vector MachineやRandom Forest などの複雑なモデルを用いた分析アプローチ
- モデルの単純さ(解釈可能性)と予測精度の間には対立関係がある [[オッカムのジレンマ]]
- 著者は最初に予測精度を追求してからモデルの予測の根拠を理解 することで、オッカムのジレンマは適切に解消できると主張
[[📖機械学習を解釈する技術]]の冒頭解説iiiページより