## Memo
- Google Alertより
- [[Microsoft Research]] Asiaより。
- 貢献
- 異種ログ間のテンプレートやパラメータの共通パターンを捉えることができる統合ログパーサUniParserを提案する。
- 提案したUniParserを16のベンチマークで検証
## Abstract
大規模なオンラインサービスシステムにおいて、ログはエンジニアが故障を診断するための生の情報を提供します。半構造化された生のログメッセージを構造化されたデータに変換するログ解析は、ログベースの異常検出や診断などの自動ログ解析の前提条件となります。既存のログ解析器のほとんどは、共通部分をテンプレートとして抽出し、動的部分をパラメータとして抽出するという一般的な考え方に沿っています。しかし、これらのログ解析手法は、しばしばログメッセージの意味的な部分を無視しています。さらに、様々なログソース間の高い多様性も、異なるシステム間でのログ構文解析の一般化における障害となっている。本論文では、異種ログデータから共通のログ挙動を捕捉するためにUniParserを提案する。UniParserはトークン・エンコーダ・モジュールとコンテキスト・エンコーダ・モジュールを利用し、ログのトークンとその近傍コンテキストからパターンを学習する。Context Similarityモジュールは、学習されたパターンの共通性をモデル化するために特別に設計されている。我々は16の公開ログデータセットに対して広範な実験を行い、その結果、UniParserが最先端のログパーサを大きく上回ることを示した。
[[2022__arXiv__UniParser - A Unified Log Parser for Heterogeneous Log Data__translations]]