## Memo ## Abstract ログデータの異常検知は、IT運用のための人工知能の分野における中核的な要素です。しかし、既存の手法が大量に存在するため、特定のシステムに適したアプローチを選択するのは困難です。さまざまな種類の異常を理解し、どのアルゴリズムがその異常を検出するのに適しているかを知ることは、研究者やIT運用者の助けとなるでしょう。異常に関する一般的な分類法はすでに存在していますが、ログデータに特化して適用されておらず、この分野の特徴や特殊性を指摘しています。 本論文では、ログデータの異常に対する分類法を提示し、ログデータの異常を分析する手法を紹介します。本論文では、Thunderbird、Spirit、BGLの3つの一般的なベンチマークデータに本分類法を適用し、5つの最新の教師なし異常検知アルゴリズムを学習させ、異なる種類の異常を検知する性能を評価した。その結果、最も一般的な異常の種類は、最も予測しやすいものであることがわかりました。さらに、[[深層学習]]ベースのアプローチは、すべての異常タイプにおいてデータマイニングベースのアプローチよりも優れていますが、特に文脈的な異常の検出に関しては、深層学習ベースのアプローチが優れていることがわかりました。 [[2021__A Taxonomy of Anomalies in Log Data__translations]]