## Memo - 引用文献 [113]: [[2020__ICSOC__A Systematic Mapping Study in AIOps]]の2つのマクロ領域のうち[[Failure Management]]に焦点をあてる ## Abstract 現代社会では、複雑で分散したコンピューティングシステムへの移行が進んでいます。このようなシステムの大規模化・複雑化は、日々のモニタリングや修理作業を行うO&Mチームに困難をもたらしており、一方で、現代のアプリケーションの信頼性や拡張性に対する要求が高まっています。このような理由から、自動化されたインテリジェントな監視システムの研究は、近年、応用IT産業や学術界で大きな関心を集めています。[[AIOps]](Artificial Intelligence for IT Operations)は、Machine Learning([[機械学習]])、AI(人工知能)、Big Data(ビッグデータ)により、現代のIT管理の課題に取り組むために提案されています。しかし、研究テーマとしてのAIOpsは、そのデータ要件、目標とするゴール、およびコンポーネントのために貢献を分類する際の規則が欠けているため、まだほとんど構造化されておらず、未開拓です。本研究では、[[Failure Management]](FM)のためのAIOpsに焦点を当て、時間介入のウィンドウと解決される対象の問題に基づいて、5つの異なるカテゴリと14のサブカテゴリの貢献を特徴付け、説明します。AIOpsソリューションの効果的な適用を促進するために、適用性の要件と達成された定量的な結果に焦点を当てて、100のFMソリューションをレビューします。最後に、AIOpsがカバーする領域における現在の開発問題を議論し、AIベースの故障管理の将来的なトレンドの可能性を明らかにする。 [[2021__TIST__A Survey of AIOps Methods for Failure Management__translations]]