## Memo - 本論文は変更誘発型のインシデントの実証分析を扱う。 - 変更誘発型161件 非変更誘発型の158件 - 所見1:変更に起因するインシデントは、全体的な分布においてより深刻なレベルにあり、変更に起因しないインシデントよりも解決に時間がかかる。 - 所見2:半数以上のインシデントがコードの欠陥に起因していますが、40%のインシデントはコードに関連し ない問題に起因しており、慎重な変更操作と効果的な 変更前チェックにより回避することが可能です。 - 所見3:ロールバック、ノードリブート、トラフィックスイッチによる緩和は、インシデントの70%以上を占めており、ほとんどの変更によるインシデントに対してインシ デントの自動緩和が可能であることが示されています。 - 所見4:インターセプトの失敗と緩和の遅れを引き起こす変更管理には4つの重要な課題があり、その解決には新しい技術が必要である。 - ![[Pasted image 20230715162251.png|600]] - ![[Pasted image 20230715162303.png|600]] - ![[Pasted image 20230715162319.png|600]] - ![[Pasted image 20230715162545.png|600]] - 今後の解決策:サービスの依存関係と変化イベントを融合した異種知識グラフを構築 ## Abstract オンライン・サービス・システムのサービス品質を確保するために献身的な努力が払われてきたが、これらのシステムは依然として様々な原因によるインシデントに悩まされており、ユーザーの不満や経済的損失に繋がっている。変更は、オンライン・サービス・システムにおいて、最も破壊的でありながら避けられないメンテナンス・イベントである。インシデントのあらゆる可能性のある原因の中で、変更はインシデントを誘発する主要な原因の1つである。悪影響を最小限に抑えて変更を実施するために、変更管理は産業界で広く適用されてきた。しかし、変更に起因するインシデントは依然として発生している。変化誘発型インシデントをめぐる実証研究のほとんどは、インシデントを誘発する特定のタイプの変化に限定されている。さらに、変化誘発型インシデントの特徴やチェンジ・マネジメントの課題については研究されていない。この知識ギャップを埋めるために、本稿では、オンライン・サービス・システムの変化誘発型インシデントに関する初めての実証研究を行う。アント・グループの2年間にわたる大規模オンライン・サービス・システムから、161件の実際の変更誘発インシデントを収集した。その事後報告書を手作業で調査することで、変更に起因するインシデントの深刻度を明らかにし、変更の種類、根本原因、緩和策の観点から、変更に起因するインシデントの特徴を分析する。さらに、実務における変更管理の一連の重要な課題を明らかにし、研究者や技術者にとってのいくつかの実際的な意味を指摘する。われわれの研究が、変更に起因するインシデントの理解に役立ち、技術者や研究者が変更管理を改善するためのヒントや指針を与えることができると信じている。