# Incident Commanders
## 概要
SREcon23 Americas(2023年、開催都市・正確な開催日は未確認)で、[[Jeli]](ieli.io)所属の [[Vanessa Huerta Granda]] と [[Emily Ruppe]] が共同発表した講演。インシデントコマンダー(IC)とインシデントアナリストという2つの役割を、実際には同一人物が兼務することが多いという現実的な文脈で捉え直し、両者が「似て非なる別々のスキルセット」であり、対応(response)と分析(analysis)の混同がもたらす失敗パターンを、ポップカルチャーのミーム画像を多用したユーモラスな構成で解説する。
## 主要メッセージ
- インシデントは孤立した出来事ではなく「インシデントのサイクル(Circle of Incidents)」の一部である。システムが平常運転→インシデント発生→インシデント解決→事後活動(学習)→学びの適用によるシステム変更→新しい負荷を伴う新システム、という循環をなし、次のインシデントは常に「新しい社会技術システム」を舞台に起きる(Source: transcript、frame-001)。
- IC の実践的な要諦は「指示を出さないこと、壊れたものを直さないこと」。IC の仕事は調整(coordination)の管理であり、臨機応変な思考・傾聴・時間管理・コミュニケーション促進・仮説の把握・修復より緩和の優先を促すことに集約される(Source: transcript)。
- アナリストの実践的な要諦は「事件がなぜそのように起きたかを解明する」調査作業。Slack/Zoom のトランスクリプト、プルリクエストなど多様なデータをレビューし、タイムラインの矛盾する仮説(「red herring」)を整理してストーリーとして再構成する(Source: transcript、frame-009)。
- IC とアナリストは別々のスキルセットだが、互いに強く影響し合う。IC の経験がアナリストとしての能力を高め、アナリストの経験が IC としての能力を高める、という相互作用を発表者2人がともに認める(Source: transcript)。
- IC にすべてを任せる(post-incident review も含めて)ことも、1チームにすべてを任せることも、アンチパターンである。理由の一つは、対応と分析が別スキルであること、もう一つは IC が対応に深く関与しすぎているために社会技術的要因を見落とし、対応の議論(PagerDuty の話等)に偏りがちになることである(Source: transcript)。
- 分析スキルを対応(response)に持ち込む(例: 「Be curious, not judgmental」)、逆に対応スキルを分析(analysis)に持ち込む、という相互のスキル投資を推奨する(Source: transcript、frame-010, frame-011)。
- 人間関係の構築が土台。同僚と友達になる必要はないが「人間として扱う」ことが重要であり、IC が離席(トイレ・軽食等)を宣言する、ジュニアエンジニアが関わる困難なレビューでシニアエンジニア自身の失敗談から会議を始めさせる、といった具体的な実践を挙げる(Source: transcript、frame-012)。
## 映像で確認できる重要点
- ![[_attachments/srecon23amer-granda-incident-commanders/frame-001.jpg]]
「The Circle of Incidents」図。System(平常)→System Incident Begins(インシデント開始)→Incident Resolution(解決)→Post incident activities = learning(事後活動=学習)→Learnings are applied and change the system(学びの適用とシステム変更)→New system + load(新システム+新しい負荷)、という循環を示す。次のインシデントは常に「変化した後のシステム」を舞台にする、という発表全体の前提を視覚化している。
- ![[_attachments/srecon23amer-granda-incident-commanders/frame-003.jpg]]
登壇者紹介スライド「How does one person do this?」。[[Vanessa Huerta Granda]] と [[Emily Ruppe]] の顔写真とフルネームが明示されており、両名の本人確認の裏付けとなる。背景は虹色の演出画像に二人の顔を合成したコラージュで、片手を高く掲げるポーズが共通する。ジュラシックパークの要素は確認できない(この点は本文中の口頭ジョーク「our buddy, Elon, over at Twitter」等とは無関係)。スライド右下に「ieli」ロゴ。
- ![[_attachments/srecon23amer-granda-incident-commanders/frame-009.jpg]]
「Tell a Story」と題したインシデントタイムラインの可視化例。Detection/Diagnosis/Repair/Key Moment の4レーンに沿って、3つの「red herring」仮説・4つ目の「red herring」がトリガーとして浮上・新しい人物が実際のトリガーを発見して3分間議論、という時系列上の混乱がそのまま図示されている。実際のインシデント調査が単純な直線的原因究明ではなく、複数の仮説が並行して浮上・棄却される過程であることを、ストーリーテリングの教材として提示している。
- ![[_attachments/srecon23amer-granda-incident-commanders/frame-011.jpg]]
「Bring Response skills into Analysis」の見出し。Friends のワンシーン(HBO Max)を使い、対応(response)で培った実務的スキルを分析(analysis)の場に持ち込むことの重要性を示唆する(具体的な対応スキルの列挙は転写に現れず、口頭説明が中心と推定される)。
- ![[_attachments/srecon23amer-granda-incident-commanders/frame-012.jpg]]
「Building relationships is the foundation」の見出し。The Good Place の台詞「The real bad place was the friends we made along the way」を引用し、発表の締めくくりとして人間関係構築の重要性を強調する構成。
## 口頭説明・補足
- 両登壇者は共に [[Jeli]](ieli.io、口頭では「jelly.io」と発音)在籍と自己紹介する。この講演の時点(2023年、SREcon23 Americas)で [[Vanessa Huerta Granda]] は [[Jeli]] に在籍しており、既存の [[@2025__SREcon25 Americas__Learning from Incidents at Scale - Actually Doing Cross-Incident Analysis]] や [[@2026__SREcon26 Americas__So You Want a New Incident Commander]] が示す「現在は [[Enova]] に在籍」という記述より時系列的に前の状態にあたる。
- Vanessa: 10年以上 SRE 業界でインシデントに従事。何年も唯一のオンコール IC を務め、エスカレーションプロセスを管理し、他者を訓練し、インシデントプログラムから回顧的学習を実施。その後専任 IC となり、世界中の12人からなる IC チームを立ち上げ、プロセス策定・訓練・ツール導入を繰り返し「スケーリング」した経緯を語る。
- Emily: サポート業務を経てインシデントに関わるようになった。当時はメトリクス・アラートへの投資が薄く、インシデントの兆候をすばやく識別し質問を重ねる方法を独学で身につけた。複数企業(買収を含む)で同時にオンコールを担当し、インシデント分析プロセスの刷新・深刻度基準の(ソーシャルエンジニアリング的な)見直し・IR ボットの開発運用・新しい対応プロセスの展開とトレーニングを重ねてきたと述べる。
- 「インシデントコマンダー」という肩書きへの態度: Vanessa は「Incident Commander」という肩書き自体は好まないと明言しつつ、テクノロジー業界の女性としては肩書きが与える権限を最大限活用する、という両義的な立場を取る。より適切な用語の候補として Incident Manager・Incident Facilitator・Incident Conductor・(社会技術システムの)Troubleshooter・「Professional Cat Herder(猫の世話係)」を挙げる。
- 事後検証(post-incident review)を IC 自身が担当することの問題点として、(1) 対応と分析が異なるスキルセットであり両方を訓練された人材が必要であること、(2) IC は対応に人間として密接に関与しているため、レビューが対応そのもの(PagerDuty の設定など)に偏り、組織の新しいメンバーには読み取れない略語だらけのレポートになりやすいこと、の2点を挙げる。
- IC とアナリストを同一人物が兼務すること自体は(燃え尽きを覚悟する場合を除き)推奨しないとしつつ、両ロールの経験が相互に能力を高め合う点では両登壇者の意見が一致する。
- 講演の締めとして、離席の宣言(トイレ・軽食など)によって「自分自身を大切にしてよい」というシグナルを他の対応者に送ること、ジュニアエンジニアが関わる困難なインシデントのレビューでは、シニアエンジニア自身の「初めて本番環境を壊した話」から会議を始めさせることを提案する。
## Q&A
transcript からは、聴衆との明示的な質疑応答区間を確認できなかった(講演全体が2名の登壇者による対話形式で進行しており、フロアからの質問区間は識別できない)。
## 概念・実体への接続
- [[Vanessa Huerta Granda]] — 共同登壇者。[[Jeli]] 在籍時(2023年)の発表であることを確認する一次資料。
- [[Emily Ruppe]] — 共同登壇者。IC/アナリスト両ロールの実務経歴を語る。
- [[Jeli]] — 両登壇者の当時の所属企業。
- [[Incident Commander]] — IC の核心定義(「指示を出さない・直さない」「調整管理」)を補強。
- [[インシデントアナリスト]] — 本ソースを主要出典として新規作成。
- [[インシデント管理]] — 「インシデントのサイクル」というライフサイクルモデルを提示。
- [[ポストモーテム]] — 事後検証(post-incident review)を IC が担当すべきでない理由を提示。
- [[クロスインシデント分析]] — Vanessa Huerta Granda の後年(2025年)の発表の前段にあたる実務経験。
## 限界・不確実点
- transcript は英語の字幕・自動生成音声起こしに基づく(句読点・話者境界が推定を含む)。本文の要約は文意の再構成であり、直接引用ではない。
- 正確な講演日(年内の月日)・開催都市は確認できていない。年とイベント名(SREcon23 Americas、2023年)、登壇者名は代表フレーム(frame-003)で確認済み。
- transcript 中に「昨年の SREcon でサラ・バット(Sarah Butt)と出会い」という言及があるが、本 wiki に既存の [[Sarah Butt]] エンティティ(SREcon21 登壇者)と同一人物である確証はなく、紐付けは行わない。
- 質疑応答(Q&A)区間の有無は transcript からは確認できなかった(講演全体が2名の登壇者による対話形式で進行)。