## Memo ## Abstract オンライン・サービス・システムの普及が進んでいる。オンライン・サービス・システムの運用中、インシデント(サービスの計画外の中断や停止)は避けられない。インシデント管理の最初のステップとして、インシデント・レポートを自動的に適切なチームに割り当てることができるようにすることが重要である。このステップをインシデント・トリアージと呼び、インシデント管理全体の効率と精度に大きく影響する。産業界におけるインシデント・トリアージの慣行をよりよく理解するために、マイクロソフト社の20の大規模オンライン・サービス・システムで、インシデント・トリアージの実証研究を行った。その結果、インシデントレポートの誤った割り当てが頻繁に発生し、特に重大度の高いインシデントに対して不必要なコストが発生していることがわかった。例えば、約4.11%から91.58%のインシデント・レポートが少なくとも一度は再割り当てされ、再割り当てによるインシデント・トリアージ時間の平均増加は最大10.16倍である。バグトリアージ(ソフトウェア開発者にバグレポートを自動的に割り当てること)とインシデントトリアージの類似性を考慮し、典型的なバグトリアージ技術をオンラインサービスシステムのインシデントトリアージに適用できるかを検討する。その結果、これらのバグトリアージ技法はインシデントレポートをある程度正しく割り当てることができるが、特に初回に誤って割り当てられたインシデントレポートについては、さらなる改善が必要であることが示された。さらに、実証研究に基づいて、インシデントトリアージの精度を向上させるための可能な方法について議論する。我々の知る限り、産業実務におけるインシデント・トリアージを調査したのは我々が初めてである。我々の結果は、オンライン・サービス・システムにおける現在のインシデント・トリアージの実践を改善するための方法とツールを開発するために、実務家と研究者の両方にとって有用である。