## Memo - Google Alert ## Abstract IT運用のための人工知能([[AIOps]])は、例えば異常検出や根本原因分析などのために多様なAI対応の方法とツールを使用して大規模なITシステムを維持・運用し、自己安定化するIT活動の救済、最適化、自動開始をサポートするプロセスを説明する。あらゆるAIOpsワークフローの中核となるステップは異常検出であり、一般的にログメッセージ(log)、メトリクス(例:CPU使用率)、分散トレースなどの大容量の異種データに対して実行されます。本論文では、システムログから信頼性の高い実用的な異常検知の方法を提案します。これは、1000以上のGitHubプロジェクトのソースコードから得たログ命令を用いて異常検知モデルを構築することで、関連研究に共通する欠点、すなわち、人手でラベル付けした大量の学習データが必要であることを克服するものである。多様なシステムからの指示は、多くの異なる正常および異常なITイベントに関する豊富で異質な情報を含んでおり、異常検出の基盤として機能します。ADLILogと名付けられた提案手法は、ログ指示と対象システム(ターゲットシステム)のデータを組み合わせ、2段階の学習手順でディープニューラルネットワークモデルを学習します。実験の結果、ADLILogは教師なし設計、効率的なモデル更新、小さなモデルサイズなど、産業界に展開するための中核的な非機能要件を満たしながら、F1スコアで関連アプローチを最大60%上回る性能を示しました。 [[2022__SCC__Leveraging Log Instructions in Log-based Anomaly Detection__translations]]