## Memo - IBM Researchの研究グループによるCLOUD'24の会議論文。 ## Memo with LLM ## Abstract 根本原因分析や障害予測のような自動ログ分析タスクは、アプリケーション全体の健全性を維持する上で極めて重要な役割を果たします。 これらのタスクは、テンプレートを生成するために、ログ行の動的部分(変数)と定数部分(テンプレート)を抽出するログ構文解析器を使用します。 しかし、我々の観察によると、すべてのテンプレートが同じ重要性を持つわけではありません。 したがって、ログ分析に使用するテンプレート/変数に優先順位をつける必要があります。 この論文では、ログから重要なITメトリクスを抽出するために設計された、ログベースのメトリクス識別手法であるLogMIdを紹介します。 LogMIdを通じて、モニタリング、[[Observability|可観測性]]ツール、ひいては[[notes/sre/SRE]]がログデータからより良い洞察を掘り起こせるようにすることを目指します。 異常検知という一般的なログ分析タスクにおける LogMId の有効性を紹介します。 我々の実験では、以前使用されていたベンチマークツールを LogMId の機能と統合することで、結果が改善されることを示しています。 さらに、LogMId は少ないトレーニングデータ量でも有効性を示し、その有用性を強調しています。