# サービス依存グラフ ## 定義 サービス依存グラフ(Service Dependency Graph、SDG)は、オンラインサービスシステムにおけるサービス間の依存関係を表す有向グラフ G_sdg = (V, E)。各ノード v ∈ V はサービスを、各有向辺 e = (v_i, v_j) ∈ E はサービス v_i が v_j に依存することを示す([[@2024__Electronics__Leveraging Large Language Models for Efficient Alert Aggregation in AIOPs|Zha+ Electronics2024]] Def 6)。 類縁概念に **Enterprise Topology Graph(ETG)** があり、ノードを IT コンポーネント(プロセス・サービス・ソフトウェア・インフラ等)、辺を type 付き関係とする(Zha+ Def 2)。SDG は ETG の "サービス層" を抽出した部分グラフと位置づけられる。マイクロサービス文脈の [[マイクロサービスコールグラフ]] とも近いが、マイクロサービスコールグラフはユーザーリクエスト 1 件あたりのコールパターンを記録するのに対し、SDG は静的な依存関係を表現する。 ## 横断的知見 - **SDG は AIOps の "LLM hallucination 制御材" として機能する**: [[@2024__Electronics__Leveraging Large Language Models for Efficient Alert Aggregation in AIOPs|Zha+ 2024]] が明示的に述べる「LLM はサービス間関係の知識が不足、SDG なしの LLM 直接適用は impractical」(§3.2.2)は、LLM × RCA の重要な工学的制約を示す。LLM はクラスタ要約を SDG ノードに **マッピング**するタスクに限定され、関係推論は SDG の弱連結成分計算という deterministic な処理が担う。VOCE([[@2025__FASE__VOCE - A Virtual On-Call Engineer for Automated Alert Incident Analysis Using a Large Language Model|Chen+ FASE2025]])が "System Topology" を causality mining の制約に使うのも同じ思想。SDG は LLM の自由度を制約することで信頼性を確保する役割を担う。(Source: [[@2024__Electronics__Leveraging Large Language Models for Efficient Alert Aggregation in AIOPs]] §3.2.2, [[@2025__FASE__VOCE - A Virtual On-Call Engineer for Automated Alert Incident Analysis Using a Large Language Model]] §4.3) - **SDG の自動構築は研究済みだが本番運用は別問題**: Zha+ 2024 は SDG が「easily constructed and successfully applied [32, 33]」と言及する。SDG 自動構築の研究は分散トレース・コールグラフ・依存関係抽出の領域で進行している(参照: [[サービス依存性発見]]、[[マイクロサービスコールグラフ]])。一方で 3 論文すべてで「SDG/topology の保守可能性」が limitation として指摘される: VOCE §6.2 は "System Topology Incompleteness" を主要限界、SkyNet([[@2025__SIGCOMM__SkyNet - Analyzing Alert Flooding from Severe Network Failures in Large Cloud Infrastructures]])は location 階層(SDG の variant)を運用 8 年保守。「SDG が古い・部分的・矛盾」した場合の集約/分析精度の劣化曲線は実測がない。(Source: [[@2025__FASE__VOCE - A Virtual On-Call Engineer for Automated Alert Incident Analysis Using a Large Language Model]] §6.2, [[@2025__SIGCOMM__SkyNet - Analyzing Alert Flooding from Severe Network Failures in Large Cloud Infrastructures]] §5.2) ## 未解決の問い - **SDG の自動更新と LLM × AIOps の整合**: マイクロサービス環境は数十秒〜数分単位で新サービスが起動/停止する。SDG が静的だと LLM × SDG 集約は陳腐化する。リアルタイム SDG 更新と LLM 推論レイテンシのトレードオフは何か? - **SDG vs Enterprise Topology Graph vs Service Mesh の依存関係**: Zha+ 2024 は ETG(コンポーネント層、Def 2)と SDG(サービス層、Def 6)を分けるが、実装上の差はどこにあるか。Service Mesh(Istio・Linkerd)の sidecar から得られる依存情報を直接 SDG として使う設計と、Drain / FT-tree 等のログ分析から構築する設計のどちらが本番運用に耐えるか。 - **incomplete SDG への LLM の "推論補完"**: VOCE §6.2 が示す "topology incompleteness" 問題に対し、LLM が SDG の欠損辺を推論で補える可能性。実装すれば SDG 保守コストを下げられるが、hallucination リスクとの均衡。 ## 関連 - 親概念: [[マイクロサービスアーキテクチャ]]、[[サービス依存性発見]] - 兄弟概念: [[マイクロサービスコールグラフ]]、[[ネットワークサービス依存性発見]]、[[トポロジ階層構造]] - 利用研究: Zha+ 2024(SDG を LLM 集約の constraint に)、VOCE(System Topology を causality mining constraint に)、AlertStorm Zhao+ 2020(system topology + textual で hybrid 集約) - ソース: [[@2024__Electronics__Leveraging Large Language Models for Efficient Alert Aggregation in AIOPs]] / [[@2025__FASE__VOCE - A Virtual On-Call Engineer for Automated Alert Incident Analysis Using a Large Language Model]] ## 出典 - [[@2024__Electronics__Leveraging Large Language Models for Efficient Alert Aggregation in AIOPs]] Def 2(Enterprise Topology Graph)、Def 6(Service Dependency Graph)、§3.2.2(LLM × SDG マッピング) - [[@2025__FASE__VOCE - A Virtual On-Call Engineer for Automated Alert Incident Analysis Using a Large Language Model]] §4.3-§4.5(System Topology を causality mining/correction に活用)