因果発見 - yuuk1's Digital Garden

# 因果発見 ## 定義因果発見（Causal Discovery）とは、純粋な観測データ（または観測と実験の混合データ）の統計的性質を分析して、変数間の因果関係を表す有向グラフ（DAG）またはその同値類を推定する手法の総称である。介入実験が高コスト・非倫理的・不可能な場合に、観測データのみから因果構造を復元するために発展した。有向グラフィカル因果モデル（DGCM）を表現として用い、因果マルコフ仮定と因果忠実性仮定を理論的基盤とする。(Source: [[@2019__Frontiers in Genetics__Review of Causal Discovery Methods Based on Graphical Models]]) 主要な4系統（Glymour+ 2019 の3系統 + Vowels+ 2022 の拡張）: 1. **制約ベース手法**（PC・FCI）: 条件付き独立性検定で辺を除去し、マルコフ同値類（CPDAG/PAG）を出力。疎グラフで数万変数にスケール 2. **スコアベース手法**（GES）: BIC 等のスコア最適化で同値類を貪欲探索 3. **構造的非対称性の利用**（LiNGAM・ANM・PNL・IGCI）: ノイズと原因の独立性の非対称性、または情報幾何的性質を利用して因果方向を同定。ペアワイズ（局所的）手法が多い。LiNGAM 系にはオリジナルの ICA-LiNGAM（Shimizu+ 2006）と、ICA に依存せず外生変数を逐次同定する DirectLiNGAM（Shimizu+ 2011）がある。後者は固定ステップ数での収束が保証され、アルゴリズムパラメータが不要である (Source: [[@2011__JMLR__DirectLiNGAM - A Direct Method for Learning a Linear Non-Gaussian Structural Equation Model]]) 4. **介入の利用**: 介入データで MEC を縮小し真のグラフを同定。ハード介入（親辺を切断）とソフト介入（条件付き分布変更）を区別さらに、各系統は**組合せ最適化**（探索・SAT ソルバ）と**連続最適化**（勾配降下・拡張ラグランジアン）の2パラダイムに分かれる（Vowels+ 2022）。NOTEARS（Zheng+ 2018）が提案した非巡回性制約 h(A) = tr(e^{A⊙A}) − d = 0 により、組合せ的なグラフ探索が連続最適化問題に変換され、深層学習との融合が加速した。 ## 横断的知見 - **Glymour+ 2019 と Vowels+ 2022 は補完的な視野で因果発見の全体像を照射する——前者は組合せ手法の30年の理論的蓄積を整理し、後者は連続最適化パラダイムの急速な台頭（2018–2020）を初めて体系化した**: Glymour+ 2019 がカバーする手法の大半は Vowels+ 2022 の Table 1（組合せ手法約60件）に含まれるが、Vowels+ 2022 はさらに Table 2 の連続最適化手法約30件と「因果の跳躍（Causal Leap）」の哲学的批判を加える。逆に Glymour+ 2019 が提供する生物学応用ガイドライン10項目やクラメール分解定理に基づく非ガウス性の議論は Vowels+ 2022 にはない。2 つのサーベイは異なる深度で同じ分野をカバーし、組合せ手法の理論的厳密性と連続最適化の実用的スケーラビリティという対比軸を浮かび上がらせる。(Source: [[@2019__Frontiers in Genetics__Review of Causal Discovery Methods Based on Graphical Models]], [[@2022__CSUR__D'ya Like DAGs - A Survey on Structure Learning and Causal Discovery]]) - **連続最適化手法のスケーラビリティ問題は、組合せ手法と異なる瓶首から生じる——探索空間の超指数爆発ではなく非巡回性制約の行列演算の計算量（O(d³)）が支配的**: 組合せ手法の困難は DAG の数が変数数に対して超指数的に増加すること（10 変数で 4×10¹⁸）にあり、条件付き独立性検定のサンプル要求や多重検定補正が実用上の制約となる。一方、連続最適化手法の瓶首は NOTEARS の行列指数関数 tr(e^{A⊙A}) の O(d³) 計算量であり、LEAST（2020）はスペクトル半径上界で O(d) に改善し 160,000 変数でスケールさせた。この対比は、組合せ手法の理論的保証（同値類の同定）と連続最適化手法の実践的スケーラビリティのトレードオフとして構造化できる。(Source: [[@2019__Frontiers in Genetics__Review of Causal Discovery Methods Based on Graphical Models]], [[@2022__CSUR__D'ya Like DAGs - A Survey on Structure Learning and Causal Discovery]]) - **「因果の跳躍」問題は両サーベイに共通するが、批判の焦点が異なる**: Glymour+ 2019 は忠実性仮定の実データでの妥当性と前処理による分布歪みを懸念し、Vowels+ 2022 は因果マルコフ条件（CMC）自体が通常のマルコフ条件の再ブランディングにすぎないという哲学的批判（Dawid 2008「矢印は d 分離意味論の付帯的構成要素にすぎない」）を展開する。前者は実践的な「どの仮定が破れるか」の視点、後者は原理的な「そもそも構造から因果への推論は正当化できるか」の視点であり、両者を組み合わせることで因果発見の適用限界がより明確になる。(Source: [[@2019__Frontiers in Genetics__Review of Causal Discovery Methods Based on Graphical Models]], [[@2022__CSUR__D'ya Like DAGs - A Survey on Structure Learning and Causal Discovery]]) - **DirectLiNGAM は、反復探索ベースの因果発見手法が抱える「アルゴリズムパラメータ依存性」の問題を、外生変数の逐次同定という原理で解消した——これは Glymour+ 2019 が指摘する「非ガウス性による同定可能性の優位」を、推定アルゴリズムの安定性の次元でも実証したものである**: Glymour+ 2019 は非ガウス性の利用により制約ベース手法では同定できない因果方向が同定可能になることを理論的に整理した。DirectLiNGAM はさらに、ICA-LiNGAM が抱える初期値依存性・収束の非保証・スケール依存性という実装上の問題を排除し、p 変数に対して p ステップの固定ステップ数で因果順序を確定させた。ただし計算量は $O(np^3M^2 + p^4M^3)$ と ICA-LiNGAM より大きく、Vowels+ 2022 が指摘する「スケーラビリティと理論的保証のトレードオフ」の具体例となっている。(Source: [[@2011__JMLR__DirectLiNGAM - A Direct Method for Learning a Linear Non-Gaussian Structural Equation Model]], [[@2019__Frontiers in Genetics__Review of Causal Discovery Methods Based on Graphical Models]], [[@2022__CSUR__D'ya Like DAGs - A Survey on Structure Learning and Causal Discovery]]) - **DirectLiNGAM の社会学データ応用は、Glymour+ 2019 が懸念する「モデル仮定違反の実データでの影響」を具体的に例証している**: DirectLiNGAM は潜在交絡因子がないことを仮定するが、社会学の地位達成モデルでは父親の職業・教育・兄弟数の間に潜在交絡因子が存在しうる。実際、大標本（$n = 1380$）にもかかわらず息子の教育→父親の教育という誤った有向辺が推定された。これは Glymour+ 2019 が述べる「忠実性仮定の実データでの妥当性」の問題と並び、因果発見手法のモデル仮定がどの程度まで緩和可能かという実践的な問いを浮き彫りにする。(Source: [[@2011__JMLR__DirectLiNGAM - A Direct Method for Learning a Linear Non-Gaussian Structural Equation Model]], [[@2019__Frontiers in Genetics__Review of Causal Discovery Methods Based on Graphical Models]]) ## 未解決の問い - **制約ベース手法と FCM ベース手法の実用的な組み合わせ方**: Glymour+ 2019 は両者の補完関係を指摘し、非線形 FCM で MEC 内の未方向辺を解消する手法（Zhang & Hyvärinen 2009b）に言及するが、大規模データへの体系的な組み合わせパイプラインは未確立。[[因果推論ベースRCA]] では PC + Granger + LiNGAM が個別に使われるが、段階的組み合わせの体系的評価はない - **忠実性仮定の実データでの妥当性**: 忠実性仮定が成立しない場合（ほぼ忠実性の違反）の系統的対処法は研究途上。Glymour+ 2019 は「パラメータ値の選択にコンセンサスがない」と述べるのみ - **前処理が因果発見を破壊する経路の体系化**: fMRI のハイパスフィルタが非ガウス性を除去し LiNGAM 系を無力化する事例が報告されているが、マイクロサービスメトリクスの正規化・平滑化・集約が因果探索に与える影響の体系的評価は未着手。[[因果推論ベースRCA]] の「入力設計がアルゴリズム選択より先に考慮されるべき」という横断的知見と接続する - **時間集約バイアスの定量的影響**: グレンジャー因果性が時間集約・サブサンプリングに敏感であることは示されたが、集約水準（秒→分→時間）と因果方向推定精度の定量的関係は分野ごとに異なり、統一的なガイドラインは存在しない - **NOTEARS 以降の勾配ベース因果発見のさらなる発展**: Vowels+ 2022 は 2020 年までの連続最適化手法（NOTEARS・DAG-GNN・GranDAG・GOLEM・LEAST 等約30件）を整理したが、2021 年以降の手法（DAGMA・DECI・CausalNex 等）、因果表現学習の潮流、LLM を用いた因果発見との統合は未整理 - **離散変数の因果発見**: 離散ケースでは FCM の関数クラスが未知だと方向同定が困難。変数のカーディナリティが小さいほど情報が失われる。連続変数の離散化は有効標本サイズを大幅に減少させる - **DirectLiNGAM のカーネルベース独立性測度のスケーラビリティ改善**: DirectLiNGAM の計算ボトルネックはカーネルベースの相互情報量推定（Bach and Jordan 2002）にあり、$p = 100$ で約20時間の CPU 時間を要する。より効率的な独立性測度（HSIC 等）への置き換えや、独立性検定の階層的省略による高速化の可能性がある - **LiNGAM 系手法における潜在交絡因子の検出と対処**: DirectLiNGAM は潜在交絡因子の不在を仮定するが、社会学データの実験でこの仮定違反が誤った因果辺の推定につながった。Hoyer ら（2008）の隠れ変数を含む拡張や、モデル仮定の違反を検知する統計的検定の実用的な性能評価が未着手 ## 関連 - [[因果推論ベースRCA]] — 因果発見アルゴリズム（PC・FCI・Granger・LiNGAM・GES）をマイクロサービス RCA に適用する分野。本概念はその基礎理論 - [[根本原因分析]] — 障害原因特定の上位概念。因果発見はその統計的手法基盤 - [[異常検知]] — 因果発見パイプラインの前処理として組み合わされることが多い - `structures/` 参照: 因果推論に関連する MOC があれば一方向リンクで接続 ## 出典 - [[@2019__Frontiers in Genetics__Review of Causal Discovery Methods Based on Graphical Models]]（Glymour, Zhang, Spirtes — 30年間の因果発見手法を3系統に体系化するレビュー） - [[@2022__CSUR__D'ya Like DAGs - A Survey on Structure Learning and Causal Discovery]]（Vowels, Camgoz, Bowden — 連続最適化ベース手法約30件を初めて体系化。組合せ手法約60件との横断比較。「因果の跳躍」への哲学的批判） - [[@2011__JMLR__DirectLiNGAM - A Direct Method for Learning a Linear Non-Gaussian Structural Equation Model]]（Shimizu, Inazumi, Sogawa, Hyvärinen ほか — LiNGAM の直接推定法。ICA に依存せず外生変数を逐次同定し、固定ステップ数での収束を保証。事前知識の体系的組み込みを実現）