診断的正当化 - yuuk1's Digital Garden

# 診断的正当化 ## 定義診断的正当化(Diagnostic Justification)は、根本原因分析(RCA)において最終回答を生成するだけでなく、**証拠・発見・競合仮説・矛盾・次の確認事項を明示的なプロセス状態として維持・エクスポートする**枠組みである。高リスクな運用環境(ロールバック・スロットリング・トラフィック切り替え・サービス再起動を誘発する診断)では、流暢な最終回答だけでは説明責任として不十分であり、「何を根拠にしたか」「どの代替を検討したか」「矛盾はどこか」「なぜ閉包した/しなかったか」を構造化アーティファクトとして記録することが求められる。 JustDiag([[@2026__arXiv__JustDiag! A Diagnostic Justification Engine for Accountable Root Cause Analysis]])が提案した。証明完了(proof-completion)フレームとは異なり、「調査過程で十分な判別的証拠が揃ったかどうかを構造的に問う」フレームとして設計されている。 ## 主要構成要素診断的正当化アーティファクトは 5 つの基本オブジェクトから構成される: | オブジェクト | 形式 | 役割 | |---|---|---| | 証拠(Evidence) | `⟨id, source, span, desc⟩` | テレメトリからのグラウンドされた観察 | | 発見(Finding) | `⟨id, Ef, α, ρ, content⟩` | 証拠群から派生した中間診断陳述 | | 仮説(Hypothesis) | `⟨id, ctx, content, status⟩` | 候補となる因果説明 | | 主張(Claim) | `⟨id, h, priority, content⟩` | 仮説に付属する判別的サブ陳述 | | 評価(Assessment) | `⟨c, v, γ, p, r⟩` | 主張への verdict(`supports/contradicts/insufficient`) | これらを型付き有向グラフ `Gt = (Vt, Et, λV, λE)` として外部化する(診断的正当化グラフ)。エッジ意味論は `supports|contradicts|alternative_to|selected_over`。 ## 4 つの設計原則 1. **証拠から物語へ(Evidence before narrative)**: 最終説明は明示的証拠・発見に根拠付けられなければならない 2. **競合から確約へ(Competition before commitment)**: 最初の記述で採用するのでなく、主張レベル裁定で競争させる 3. **矛盾を保持する(Conflicts should be preserved)**: 矛盾する発見と未解決の緊張は説明責任ある推論の一部として残す 4. **不確実性は一級の結果(Uncertainty is a first-class outcome)**: `stalled`・`need_more_evidence` は判別的支持が不十分な場合の正当な出力 ## 終端状態 `τ(St) ∈ {resolved, provisionally_resolved, need_more_evidence, stalled}` - **stalled** は空出力ではなく、現在最優位仮説・代替仮説・矛盾・推奨する次の確認事項を含む構造化記録として有用な診断状態を提供する。これを**校正された非閉包(calibrated non-closure)**と呼ぶ。 ## 横断的知見 - **診断的正当化は「説明責任」を評価可能な指標へ変換した最初の枠組み**: JustDiag は説明責任という概念を Process Score(証拠根拠付け・代替処理・矛盾管理・トレーサビリティ・不確実性管理の 5 次元)として定量化した。従来の LLM ベース RCA 研究(RCAgent・Flow-of-Action 等)は Outcome Score のみで評価されており、Process Score はほぼ一桁台(RCAgent: 9.5、Flow-of-Action: 9.3)にとどまる。JustDiag のマッチド対照群(DJ なし)ですら 44.0 であることから、Process Score の差は診断的正当化アーティファクトの有無による。(Source: [[@2026__arXiv__JustDiag! A Diagnostic Justification Engine for Accountable Root Cause Analysis]] §4.2) - **証拠根拠付けが最も重要なメカニズム**: アブレーション研究で、証拠根拠付けを除去すると Process Score が 53.8→35.4 に急落し FindLink 信号が 0.000 になる。最終回答の Outcome Score は 49.1 まで中程度の低下にとどまり、「もっともらしい物語は根拠付けなしでも生成可能だが、プロセスアーティファクトが監査不能になる」ことを示す。主張裁定が第二に重要で、仮説の多様性と矛盾質量を消滅させる。(Source: [[@2026__arXiv__JustDiag! A Diagnostic Justification Engine for Accountable Root Cause Analysis]] §4.3) - **校正された非閉包は設計上の利点であり欠陥ではない**: JustDiag は DJ なし制御群より端末完了率が 65/66→62/66 へわずかに低下するが、Outcome Score と Process Score は共に向上する。Case 7 では、制御群がディスク飽和中心で誤った `resolved` を返した一方、JustDiag は `stalled` で終了しながらも接続フラッドによるアプリケーション飽和を現在最優位仮説として構造化記録した。この「誤った確実性より有用な不確実性の保持」がハイリスク運用での説明責任設計の核心。(Source: [[@2026__arXiv__JustDiag! A Diagnostic Justification Engine for Accountable Root Cause Analysis]] §4.5) - **診断的正当化とプロセス監視(process supervision)の接続**: 言語モデルの Chain-of-Thought が事後的・不完全・不誠実である可能性は既存研究(Lanham+ 2023; Turpin+ 2023)で示されているが、診断的正当化は自由形式の CoT とは異なり、証拠リンク・競合仮説・矛盾記録・次の確認事項という「運用上意味のある構造」を評価対象にする。Tree of Thoughts・プロセス監視(Lightman+ 2024)と同じ「中間推論アーティファクトを監査・評価する」方向だが、目的が汎用推論ではなくインシデント診断の説明責任に特化する。(Source: [[@2026__arXiv__JustDiag! A Diagnostic Justification Engine for Accountable Root Cause Analysis]] §2) ## 未解決の問い - `stalled` 状態が何件に 1 件許容されるかの運用指針は、診断コンテキストごとに異なる。許容率をどう設定・伝達するべきか - 診断的正当化グラフの構造(ノード数・エッジ密度・仮説競合質量)が信頼性の代理指標として機能するかどうかの検証が未着手 - 証拠根拠付けが最重要メカニズムという結論は 10 件ミニサブセットでの方向性チェックに基づく。66 件全データセットでの直接アブレーション比較は未実施 - DJ 設計を継承した場合のコスト問題: JustDiag は DJ なし対照群より約 41% 多いトークン・45% 多い時間を要する。コスト削減と Process Score 維持の両立設計は未研究 ## 関連 - 親概念: [[LLMによる根本原因分析]] / [[仮説駆動RCA]] - 評価: [[RCA評価設計]] - 実装: [[@2026__arXiv__JustDiag! A Diagnostic Justification Engine for Accountable Root Cause Analysis]] - 比較システム: [[RCAgent]] / [[Flow-of-Action]]