## Memo
## Abstract
半構造化ログからログテンプレートを抽出して構造化ログを生成するログ解析は、自動ログ解析の最初のステップであり、最も重要なステップである。しかし、現在のログ解析ツールは、2つの理由から限られた効果しかありません。第一に、伝統的なデータ駆動型ログ構文解析ツールは、ヒューリスティックまたはドメイン専門家によって設計された手作りの特徴のみに依存しており、多様なシステムからのログに対して一貫してうまく機能しない可能性があります。第二に、既存の教師ありログ構文解析ツールは、モデルのチューニングを必要とし、これはしばしば固定されたトレーニングサンプルに制限され、ログソース全体にわたって最適でないパフォーマンスを引き起こします。この限界に対処するために、我々は、大規模言語モデル([[LLM]])のコンテキスト内学習([[In-Context Learning|ICL]])能力に基づく効果的なログ構文解析フレームワークであるDivLogを提案する。具体的には、ログ解析の前に、DivLogは少量のオフラインログを候補としてサンプリングし、その多様性を最大化する。そして、ログ解析中に、DivLogは各対象ログに対して5つの適切なラベル付き候補を例として選択し、プロンプトを構成する。DivLogは、プロンプト内の例のセマンティクスをマイニングすることで、訓練不要でターゲットログのテンプレートを生成する。さらに、プロンプトの出力を抽出し、生成されたログテンプレートの品質を向上させるために、簡単かつ効果的なプロンプトのフォーマットを設計する。広く利用されている16の公開データセットを用いて実験を行った。その結果、DivLogは平均で(1)98.1%の構文解析精度、(2)92.1%の精度テンプレート精度、(3)92.9%の再現テンプレート精度を達成し、最先端の性能を示した。