## Memo
## Abstract
現在、大規模なマイクロサービスのテストでは、毎日膨大な数のテストアラームが発生する可能性があります。これらのアラームを手作業で診断することは、テスト担当者にとって時間と労力のかかる作業です。故障の分類と特定による自動故障診断は、テスト担当者が増え続ける故障テストケースを効率的に処理するのに役立ちます。しかし、テストアラームを診断するための現在の方法は、複雑で頻繁に更新されるマイクロサービスに対処するのに苦労している。本論文では、複数のソースログ(実行ログ、トレースログ、テストケース情報)を知識グラフで整理し、マイクロサービスのテストアラームのための新しい故障診断フレームワークであるSynthoDiagを紹介します。故障を示唆するログエントリをローカライズするために、EFA-PV(Entity Fault Association and Position Value)アルゴリズムを提案する。さらに、効率的なブロックベースの差別化アプロー チを使用して、テストケース内の故障に無関係なエントリをフィルタリングし、故障診断の全体的なパフォーマンスを大幅に向上させる。最後に、SynthoDiag を、300 万人以上のユーザーにサービスを提供するトップクラスのグローバルクラウドサービスプロバイダーである Huawei Cloud の大規模な実世界データセットで体系的に評価しました。その結果、SynthoDiagの故障クラス分類におけるベースライン手法に対するMicro-F1およびMacro-F1スコアの向上率はそれぞれ21%および30%であり、故障局在化のトップ5精度は81.9%であり、従来の手法を大幅に上回っていることが示された。