## Memo j ## Abstract 最近のクラウドベースのアプリケーションは、分散アプリケーション・コンポーネントとネットワーク・インフラストラクチャの両方に複雑な相互依存関係があるため、そのパフォーマンスを推論することが難しくなっています。その結果、企業ネットワークとそのようなクラウドアプリケーションのパフォーマンス診断を自動化しようとする研究が活発に行われている。しかし、既存の手法は、相互依存関係を無視するため精度が低いか、因果的な非周期的依存関係を必要とするため、一般的な企業環境をモデル化することができない。 我々は、実用的なエンタープライズ環境において、一般的に利用可能なテレメトリで動作し、高い精度を達成できる、自動パフォーマンス診断システムであるMurphyの設計と実装について述べる。Murphyは、一般的に利用可能なモニタリングデータから得られる、エンティティ間の緩く定義された関連付けを利用する。その学習アルゴリズムは[[マルコフ乱数場]](MRF)に基づいており、このような緩やかな関連付けを利用して、特定のインシデントのコンテキストにおいてエンティティが互いにどのような影響を及ぼすかを推論することができる。我々は、エミュレートされたマイクロサービス環境と大企業の実際のインシデントでMurphyを評価した。過去の研究と比較して、Murphyは、過去の研究でサポートされた制限的な環境では≈1.35×、より一般的な環境では≥4.7×の診断エラーを減らすことができた。