## Memo - ## Memo with LLM ## Abstract 因果推論は、医学、経済学、公共政策など様々な領域において、原因と結果の関係を定量化することができる。プロダクション・コンピューター・システムも同様の複雑さを示し、現象を迅速に診断する必要性が繰り返し生じる。しかしながら、これらのシステムは不完全にしか観測されず、多くの場合、長く、乱雑で、半構造化されたログを経由して観測される。 この研究では、ログに対する因果推論を適用することにより、大規模システムのデバッグを加速し、エンジニアが原理的な方法で問題を診断し、介入策を評価できるようにしたいと考えている。(2)インタラクティブ因果グラフリファイナーは、エンジニアが大規模な手作業による因果グラフの検証を行うことなく、興味のある影響の偏りのない推定を計算することを支援する。両モジュールは、システムの因果関係グラフの一部だけが、目的の効果を正しく定量化するために必要であるという洞察に基づいている。このパイプラインは、データ変換、クリーニング、および抽出から導き出された方法を用いて、生の、厄介な、実世界のログを、因果推論に適した表形式の入力に変換する。 我々は、プロトタイプの実装であるLOGosを実世界と合成ログの両方で評価し、以下のことを発見した: (1)候補原因ランカーは、ベースラインよりも平均1.08×-18×高い精度を達成した。