2023__arXiv__LLMParser - A LLM-based Log Parsing Framework

## Memo - ## Abstract ログメッセージを構造化されたフォーマットに変換するログ解析のプロセスは、様々なログ解析タスクにとって重要なステップです。数多くのログ構文解析ツールが提案されていますが、複雑なログデータに対する有効性は、人間が作成したルールや限られた学習データしか持たない学習ベースのモデルに依存しているため、しばしば妨げられています。最近の強力な大規模言語モデル（[[notes/data-science/LLM]]）の台頭は、コードとログに関連する豊富な事前学習された知識により、ログ解析の可能性を示しています。しかし、専門的なログ構文解析機能がないため、現在のところその精度は限られています。さらに、LLMの答えの一貫性のなさと、大きなオーバーヘッドが、LLMベースのログ解析の実用的な実装を妨げている。これらの課題に取り組むために、我々は、最初の実用的なLLMベースのログ解析フレームワークであるLLMParserを紹介します。LLMParserは、LLMの文脈内学習（ICL）機能を活用し、階層的な候補サンプリングアルゴリズムを採用し、高品質のデモを選択することで、正確でロバストなログ構文解析を可能にします。LLMParserには、LLMによって生成されたテンプレートを保存し、改良するための新しい適応型構文解析キャッシュコンポーネントも含まれています。この設計は、以前に構文解析されたログテンプレートとの迅速なマッチングにより、LLMの非効率性に対処するのに役立ちます。LLMParserはまた、一貫性のある解析結果を保証するために、解析キャッシュ内のテンプレートを適応的に更新します。大規模な公開データセットでの広範な評価により、LLMParserが最先端の手法を上回ることが実証されています。さらに、LLMParserはLLMへのクエリ時間を大幅に短縮し、最も効率的なベースラインであるDrainに匹敵する効率を達成しています。