## Memo - Microsoft research - https://github.com/PanYicheng/dycause_rca/blob/main/main_netmedic.py ## Structure ### 1. Standpoints ### 2. Contributions ### 3. Major Ideas ### 4. Results ### 5. Discussions & Limitations ## Abstract 小型企業ネットワークのトラブルチケットを研究することで、その運営者 は詳細な故障診断が必要であると結論づけた。つまり、診断システムは、 一般的な故障(例えば、パフォーマンスに関連する)だけでなく、アプリケーション固有の故障(例えば、エラーコード)も診断できる必要がある。ま た、プロセスやファイアウォールの設定など、細かい粒度の犯人を特定す る必要があります。我々は、最新のオペレーティングシステムやアプリケ ーションから公開された豊富な情報を利用することで、詳細な診断を可能 にするNetMedicと呼ばれるシステムを構築しています。このシステムは、 プロセスなどのきめ細かいネットワークコンポーネントの動作や相互作用をより忠実に捉える推論問題として、詳細な診断を定式化しています。この問題を解決するための主な課題は、あるコンポーネントがいつ他のコンポーネントに影響を与える可能性があるかを推論することです。我々のソリューションは、過去の2つのコンポーネントの共同動作を使用して、そ れらが現在において互いに影響を与える可能性を推定する直感的な技術に 基づいています。我々は、配備したプロトタイプが、我々がライブ環境に注入する故障の診断に有効であることを発見した。欠陥のあるコンポーネ ントは、ケースの*において最も可能性の高い犯人として正しく識別され 、ほとんどの場合、上位5つの犯人のリストに含まれています。 ## 1. Introduction