fold-k4-from-2026-06-05-to-2026-06-05-n16

Level-4 fold of 16 log entries spanning 2026-06-05 to 2026-06-05. Dominant themes: LLM エージェントによるマイクロサービス/DB 障害診断、サービス可用性の定量化と SLO 設計、マルチモーダル障害診断手法。 ## Child Entries | Date | Op | Title | Page | Summary (extractive) | |---|---|---|---|---| | 2026-06-05 | ingest-paper | Flow-of-Action: SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis | [[@2025__WWW__Flow-of-Action - SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis]] | SOP→コード変換で RCA エージェントのドメイン知識明示化が律速であることを定量証明（SOP 知識削除で LA 54.22→8.56）。 | | 2026-06-05 | ingest-paper | TVDiag: A Task-oriented and View-invariant Failure Diagnosis Framework | [[@2026__TOSEM__TVDiag - A Task-oriented and View-invariant Failure Diagnosis Framework for Microservice-based Systems with Multimodal Data]] | タスクごとのモダリティ嗜好を教師あり対照学習で増幅する設計が等価融合を 4 データセットで凌駕。 | | 2026-06-05 | ingest-paper | TAMO: Fine-Grained Root Cause Analysis via Tool-Assisted LLM Agent | [[@2025__TSC__TAMO - Fine-Grained Root Cause Analysis via Tool-Assisted LLM Agent with Multi-Modality Observation Data in Cloud-Native Systems]] | ツール支援型 LLM エージェント設計で、コンテキスト制限・マルチモーダル意味ギャップ・動的依存グラフの 3 課題を統一解決。 | | 2026-06-05 | ingest-paper | D-Bot: Database Diagnosis System using Large Language Models | [[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]] | DB ドメイン特化 LLM 自律診断。NoKnowledge −64.1%、NoTreeSearch −35.85% で知識外在化と木探索が律速と実証。 | | 2026-06-05 | ingest-paper | DBAIOps: A Reasoning LLM-Enhanced Database Operation and Maintenance System | [[@2025__PVLDB__DBAIOps - A Reasoning LLM-Enhanced Database Operation and Maintenance System using Knowledge Graphs]] | ExperienceGraph が LLM 幻覚抑制と RAG 関係断片化を同時解決。グラフ進化で未知異常精度 34% 向上。 | | 2026-06-05 | ingest-paper | OpDiag: Unveiling Database Performance Anomalies Through Query Operator Attribution | [[@2025__TKDE__OpDiag - Unveiling Database Performance Anomalies Through Query Operator Attribution]] | 三段階分割帰属で DB 診断解像度を KPI/クエリの先の演算子レベルへ初めて拡張。 | | 2026-06-05 | ingest-paper | SCELM: A Multimodal Intelligent Change Assessment Framework | [[@2025__FSE Companion__A Multimodal Intelligent Change Assessment Framework for Microservice Systems Based on Large Language Models]] | 変更票×ログ×メトリクスの自然言語化 + RAG + 7B LLM で本番 11 か月・90% 時間短縮を達成。 | | 2026-06-05 | ingest-paper | AgentTune: An Agent-Based LLM Framework for Database Knob Tuning | [[@2025__SIGMOD__AgentTune - An Agent-Based Large Language Model Framework for Database Knob Tuning]] | 4 専門 LLM エージェント＋ビームサーチ木探索で全実験 Invalid Times=0 を実現。 | | 2026-06-05 | ingest-paper | FlowXpert: Expertizing Troubleshooting Workflow Orchestration | [[@2025__KDD__FlowXpert - Expertizing Troubleshooting Workflow Orchestration with Knowledge Base and Multi-Agent Coevolution]] | ワークフロー「生成」を問題設定として追加。本番 22.1 秒・承認率 80% で産業実証済み。 | | 2026-06-05 | ingest-paper | CUJBench: Benchmarking LLM-Agent on Cross-Modal Failure Diagnosis | [[@2026__arXiv__CUJBench - Benchmarking LLM-Agent on Cross-Modal Failure Diagnosis from Browser to Backend]] | ブラウザ可視層〜バックエンド統合の初のクロスモーダル診断ベンチマーク。ツールアクセス拡大が精度を下げる反直感を定量化。 | | 2026-06-05 | ingest-paper | Diffusing High-level SLO in Microservice Pipelines | [[@2024__SOSE__Diffusing High-level SLO in Microservice Pipelines]] | ベイズネットワークで高レベル SLO をパイプライン全体に拡散し最大 100% 充足率を実現。λ 超パラメータの過剰厳格化で充足率 0 への急落あり。 | | 2026-06-05 | ingest-paper | Nines are Not Enough: Meaningful Metrics for Clouds | [[@2019__HotOS__Nines are Not Enough - Meaningful Metrics for Clouds]] | SLO 定義の困難さを統計学的意思決定と同型と捉え、SLE/CBE 双方向枠組みを提示。 | | 2026-06-05 | ingest-paper | A Microservice-Based Platform for Sustainable and Intelligent SLO Fulfilment | [[@2026__arXiv__A Microservice-Based Platform for Sustainable and Intelligent SLO Fulfilment and Service Management]] | CASCA はカーボン認識 SLO を統合し、宣言的設定管理で命令的手法比 −53.7 秒を実現。 | | 2026-06-05 | ingest-paper | Thinking about Availability in Large Service Infrastructures | [[@2017__HotOS__Thinking about Availability in Large Service Infrastructures]] | 可用性定義の多次元性・次元削減・サブシステム分解の三重困難を指摘。敵対的思考・フェイルスタティック設計を提唱。 | | 2026-06-05 | ingest-paper | Live Forensics for HPC Systems: A Case Study on Distributed Storage Systems | [[@2020__SC20__Live Forensics for HPC Systems - A Case Study on Distributed Storage Systems]] | 能動 I/O プローブ＋因子グラフ PGM で HPC 分散ストレージの障害箇所特定。信頼性障害 vs 過負荷の 2 モード弁別を一体で解決。 | | 2026-06-05 | ingest-paper | Meaningful Availability | [[@2020__NSDI__Meaningful Availability]] | ウィンドウ付きユーザーアップタイムが有意義性・比例性・実用性を同時に満たす初の可用性指標。MCR 曲線で障害パターンを定量区別。G Suite 本番展開済み。 | ## Key Outcomes - SOP→コード変換（`generate_sop_code`）によるドメイン知識の明示化が RCA エージェント精度の律速であることを定量証明——SOP 知識削除で LA が 54.22→8.56 に激減（Flow-of-Action エントリ） - DB 診断における知識外在化の律速性を D-Bot（NoKnowledge −64.1%）と DBAIOps（ExperienceGraph による幻覚根絶）が独立実証し、ドメインを超えた AIOps 系 RCA と手法的に同型であることを示唆（D-Bot, DBAIOps エントリ） - マルチモーダル RCA の設計が「等価融合」を否定する方向へ収束——TVDiag のタスク特化対照学習、TAMO のツール支援型分離、SCELM の変更票第 4 モダリティ化がそれぞれ異なるアプローチで実証（TVDiag, TAMO, SCELM エントリ） - ウィンドウ付きユーザーアップタイム＋MCR 曲線が有意義性・比例性・実用性を同時に満たす初の可用性指標として G Suite 本番で展開済み（Meaningful Availability エントリ） - SLO 定義の困難さを統計学的意思決定との同型性として捉え、法律家的思考から統計家的思考への転換を提唱する SLE/CBE 双方向枠組みを提示（Nines are Not Enough エントリ） - ブラウザ可視層〜バックエンドテレメトリ統合の初のクロスモーダル診断ベンチマーク CUJBench が「ツールアクセス拡大が精度を下げる」反直感的結果を定量化（CUJBench エントリ） ## Cross-entry Themes - ドメイン知識の構造的明示化が LLM ベース診断の精度律速: Flow-of-Action の SOP 知識除去で LA 激減、D-Bot の NoKnowledge −64.1%、DBAIOps の知識グラフによる幻覚抑制がそれぞれ独立にこの命題を定量証明（Flow-of-Action, D-Bot, DBAIOps エントリ） - マルチモーダル融合における等価融合の否定: TVDiag（タスク特化モダリティ重み付け）、TAMO（ツール支援型 LLM 分離）、SCELM（変更票を第 4 モダリティ化）、CUJBench（ツール拡大の逆効果）がいずれも単純な等価融合を否定する設計・結果を提示（TVDiag, TAMO, SCELM, CUJBench エントリ） - 可用性指標はウィンドウ・次元・期待値の三軸で深化: Meaningful Availability のウィンドウ付きアップタイム、Nines are Not Enough の SLE/CBE 双方向枠組み、Thinking about Availability の敵対的思考が、可用性の「ナイン」超えの定量化を多角的に前進させる（Meaningful Availability, Nines are Not Enough, Thinking about Availability エントリ） ## Contradictions or Corrections - None detected. ## Child Pages - [[@2025__WWW__Flow-of-Action - SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis]] - [[@2026__TOSEM__TVDiag - A Task-oriented and View-invariant Failure Diagnosis Framework for Microservice-based Systems with Multimodal Data]] - [[@2025__TSC__TAMO - Fine-Grained Root Cause Analysis via Tool-Assisted LLM Agent with Multi-Modality Observation Data in Cloud-Native Systems]] - [[@2024__PVLDB__D-Bot - Database Diagnosis System using Large Language Models]] - [[@2025__PVLDB__DBAIOps - A Reasoning LLM-Enhanced Database Operation and Maintenance System using Knowledge Graphs]] - [[@2025__TKDE__OpDiag - Unveiling Database Performance Anomalies Through Query Operator Attribution]] - [[@2025__FSE Companion__A Multimodal Intelligent Change Assessment Framework for Microservice Systems Based on Large Language Models]] - [[@2025__SIGMOD__AgentTune - An Agent-Based Large Language Model Framework for Database Knob Tuning]] - [[@2025__KDD__FlowXpert - Expertizing Troubleshooting Workflow Orchestration with Knowledge Base and Multi-Agent Coevolution]] - [[@2026__arXiv__CUJBench - Benchmarking LLM-Agent on Cross-Modal Failure Diagnosis from Browser to Backend]] - [[@2024__SOSE__Diffusing High-level SLO in Microservice Pipelines]] - [[@2019__HotOS__Nines are Not Enough - Meaningful Metrics for Clouds]] - [[@2026__arXiv__A Microservice-Based Platform for Sustainable and Intelligent SLO Fulfilment and Service Management]] - [[@2017__HotOS__Thinking about Availability in Large Service Infrastructures]] - [[@2020__SC20__Live Forensics for HPC Systems - A Case Study on Distributed Storage Systems]] - [[@2020__NSDI__Meaningful Availability]] ## Related - [[DragonScale Memory]] - fold-operator spec - [[log]] - source entries - [[index]] - vault catalog