# インシデント後の人的回復 ## 定義 インシデント後の人的回復とは、システムが復旧した後も残るエンジニアの心理的・感情的ダメージを認識し、意図的な介入で回復を促す実践概念である。インシデント対応の標準プロセス(検知・対応・復旧)は人間の感情・信頼・自信の回復を含んでいないという問題意識に基づく。 Jaime Woo は SREcon18 Americas で「システムは回復した。しかしエンジニアは?」と問い、組織的なピアサポートの欠如と、医師・コメディアン・オリンピアンの回復実践からの類比を提示した([[@2018__SREcon18Americas__Your System Has Recovered from an Incident, but Have Your Developers]])。 ## 問題の実態 Woo が Shopify の本番エンジニア 40 名を対象に行った調査([[@2018__SREcon18Americas__Your System Has Recovered from an Incident, but Have Your Developers]] p.8): - 42.5% がインシデント後に「ストレス」または「非常に強いストレス」を報告 - インシデント後に「コワーカーが様子を聞いてくれた」頻度: 45% が「まったくない(1)」、35% が「2」——合計 80% が組織的サポートをほぼ受けていない ## 3 つの領域からの学び ### 医師(Doctors) 医療ミス後の医師は「二次被害者(secondary victim)」となる [Waterman et al. 2007]。医師の報告: - 将来のミスへの不安増大: 61% - 自信の喪失: 44% - 睡眠困難: 42% - 職務満足度の低下: 42% - 評判へのダメージ: 13% また 82% がピアサポートとカウンセリングが有効と感じた。SRE において英雄文化(hero culture)からの脱却に同じ枠組みが使える。 ### スタンドアップコメディアン(Stand-up Comedians) コメディアンは高ストレス状況に毎週・自発的に入る。インシデント中の対応: 何かがうまくいっていないと認識し、学習機会として受け入れる。インシデント後の対応: 打率(batting average)で文脈化する、何が悪かったか整理する、精神的に回復する方法を理解する、また馬に乗る。 ### オリンピアン(Olympians) Mosewich et al. (2013) の自己コンパッション(self-compassion)介入研究(n=60): - セルフコンパッション介入を受けたアスリートは、反芻思考(state rumination)・自己批判(state self-criticism)・ミスへの懸念(concern over mistakes)が有意に低下 - セルフコンパッション自体も有意に向上 - 「これは先天的ではなく、意図的に訓練できる」 ## 横断的知見 - [[オンコールストレス管理]]([[Beth Adele Long]], SREcon26 Americas)は「インシデント中のストレスへの身体知性的介入」に焦点を当てるのに対し、本概念はより「インシデント終了後のピアサポートと組織文化」に重点を置く。両者は補完的——身体ツールは個人、ピアサポートは組織的アプローチ。(Source: [[@2018__SREcon18Americas__Your System Has Recovered from an Incident, but Have Your Developers]], [[@2026__SREcon26Americas__The Critical Resource Is You - Practical Destressing for On-Call Engineers]]) ## 未解決の問い - Woo が提起した「人間向けインシデントレスポンス」の具体的プロセスはどう設計されるべきか。ポストモーテムとは別に、感情的回復のためのセッションを設けるべきか。 - 42.5% のストレス率は Shopify 単社の 2018 年データ。他社・他時点でも再現するか。 - セルフコンパッション介入(ジャーナリング等)は SRE チームの文化に組み込めるか。どの程度の時間・コストが現実的か。 - 「ピアサポートをしている/されている」のギャップ(p.18 vs p.19)の原因は何か——組織文化・心理的安全性・時間不足のどれか。 ## 関連 - [[オンコールストレス管理]] — インシデント中・オンコール期間のストレス管理。本概念の「前段」に当たる - [[人的要因]] — 人的ミスと組織安全の観点からの接続 - [[インシデント管理]] — 回復の文脈となる対応プロセス - [[ポストモーテム]] — インシデント後の学習プロセスとして人的側面への言及が増えている - [[Jaime Woo]] — この概念を SRE 文脈に提起した登壇者 ## 出典 - [[@2018__SREcon18Americas__Your System Has Recovered from an Incident, but Have Your Developers]]