## 概要 CrowdStrike の Chad Todd(Lund University 大学院で人的要因・安全科学を専攻)が、USENIX SREcon23 Americas(2023年3月開催、サンフランシスコ)で発表したスライド資料である。現象学(Phenomenology)に着想を得た半構造化インタビューという質的研究手法を用い、ソフトウェア運用組織における引き継ぎ伝達(Handover Communications)が、引き継ぎを受けたエンジニアの確信度(Confidence)にどう影響するかを分析する。同社内の Network Operations Center と Customer Support Center という性質の異なる2部門を対象とした点が特徴である。 ## 主要メッセージ - 引き継ぎ伝達の定義として The Joint Commission(2017; p.1)を引用する。「責任の委譲と受諾を、効果的なコミュニケーションを通じて達成すること。作業状況の継続性と安全性を確保する目的で、ある個人から別の個人へ、あるいはある要員チームから別の要員チームへ、特定の情報をリアルタイムで伝達する過程である」とする(p.4)。 - 引き継ぎ伝達には口頭(Verbally)とデジタル記述(Digitally Written)の2形態があるとする(p.6)。 - 分析の枠組みとして4つの中核概念を置く(p.13)。Joint Activity は Klein et al.(2005)に基づき、参加者間の相互予測可能性と「The Basic Compact」(共同作業を担う責任を果たし合うという合意)に依存するとする(p.14)。Common Ground も同じく Klein et al.(2005)に基づき、参加者が共有する信念・前提・知識の集合であり、一方が共同作業から離脱しても他方が Basic Compact の存続を信じている限りは維持されると説明する(p.15)。Adaptive Capacity は Woods(2019; p.53)の定義を引用し、「将来起こりうる出来事・機会・混乱の種類の変化に対応できるよう活動パターンを調整する潜在能力であり、変化や混乱が生じる以前から存在する」とする(p.16)。Confidence は「何かの能力・資質に対する信念と感覚」であり習得・向上可能なスキルであるとし、領域ごとに増減しうる非一様な性質を持つとする(p.17)。 - Network Operations Center は24時間体制でインシデント解決とコミュニケーションを担い、パンデミック以前は対面での口頭引き継ぎだったが、現在は Slack workflow によるデジタル記述引き継ぎに移行している(p.9)。Customer Support Center は24時間体制で顧客対応・アプリケーション問題を解決し、当初は非公式な引き継ぎだったが、現在は DM による正式なデジタル記述引き継ぎに移行している(p.10)。 - インタビューから6つのテーマを抽出した(p.20-30)。Organizational Context of Handover Communications(部門間での引き継ぎ体験の違い、コミュニケーションの不整合の報告)、Evolving Handover Communications(継続的改善)、Information Exchange(状況把握の速さ、冗長さと簡潔さのトレードオフ)、Preparedness for Handover(高負荷下での複合的責任のバランス、非公式な artifact 収集)、Guidance for Handover Communications(正式な引き継ぎテンプレート、限定的なプロセス・要件)、Closing the Loop(引き継ぎの確認応答、引き継ぎ後の対応可能性)である。 ## 視覚的に重要な図表 **p.5 引き継ぎ伝達研究史のポートレート** ![[_attachments/srecon23americas-todd-handover-communications/page-005.png]] David Woods と Emily Patterson の写真とともに、引き継ぎ伝達研究の系譜を示す。 **p.13 分析枠組みの中核概念一覧** ![[_attachments/srecon23americas-todd-handover-communications/page-013.png]] Joint Activity・Common Ground・Adaptive Capacity・Confidence の4語のみを提示し、以降のスライドで個別に定義する構成になっている。 **p.30 テーマ総括** ![[_attachments/srecon23americas-todd-handover-communications/page-030.png]] インタビューから抽出した6テーマを一覧化し、Putting It Together セクションへの橋渡しとする。 **p.36 Quick Bits** ![[_attachments/srecon23americas-todd-handover-communications/page-036.png]] 登壇者の Twitter アカウント(@lund_hfss)と、研究の元になった修士論文へのリンクを示す。 ## 口頭説明・補足 - Network Operations Center の引き継ぎ手法は 2020年3月11日のパンデミック移行を境に大きく変化した。当初は対面の口頭引き継ぎが不可能になり、まず非公式な DM に移行したが、情報量の多い長文の投稿(huge blog)になりがちでエンジニアが疲弊した。その後、確認応答ボタンと絵文字リアクションを備えた Slack workflow へ移行し、現在の形に至った(transcript L166-183)。 - Information Exchange のテーマについて、あるエンジニアは「引き継ぎを悪くする最大の要因は簡潔さの欠如であり、具体的には顧客影響が何か・何に注意すべきかが抜け落ちていることだ」と述べている(p.24 引用、transcript L184-199 で口頭補足)。 - Preparedness for Handover のテーマでは、あるエンジニアがインシデントごとに専用の仮想デスクトップと4面のフルモニターを用意し、そのうち1画面を常に更新するフォーム(引き継ぎ用メモ)専用に割り当て、当日の状況変化に応じて追記・削除していると説明している(p.26 引用)。口頭説明ではあわせて「マルチタスキングは味方ではない」という趣旨の注意も述べられた(transcript L200-234)。 - Closing the Loop のテーマの核心として、確認応答(Acknowledgement)を巡る次のエピソードが語られた。ある引き継ぎで、退勤するエンジニアが後任のエンジニアがボタンで確認応答するのを30分以上待ち続けたが応答がなく、最終的に電話をかけたところようやく相手が確認応答した、というものである(transcript L309-318)。この経験から、確認応答の徹底(a must)が確信度を高める要因の一つとして位置づけられている。口頭説明では、NASA の引き継ぎ後対応可能時間が1時間であるのに対し、この現場では5〜15分程度で十分だという比較も語られた(transcript L235-257)。 ## 概念・実体への接続 - 中核概念4語は [[Handover Communications]]・[[Joint Activity]]・[[Common Grounding]]・[[レジリエンスエンジニアリング]](Adaptive Capacity)に接続する。 - Joint Activity と Common Ground の引用元 Klein et al.(2005)は [[Gary Klein]] に接続する。 - Adaptive Capacity の引用元 Woods(2019)、および研究史ポートレートに写る人物は [[David D. Woods]]・[[Emily Patterson]] に接続する。 - 登壇者本人は [[Chad Todd]]、所属組織は [[CrowdStrike]]、研究の実施母体は [[Lund University]] に接続する。 ## 限界・不確実点 - p.31 の画像に写るパズルピース図の出典クレジット「KeithRN」の詳細(人物か組織か、著作権表記の全文)はスライド上からは判読できない。 - 修士論文本体(p.36 のリンク先)は本 ingest の対象外であり、参照していない。 - インタビュー対象エンジニアの人数・所属部門比率など、調査設計の詳細な統計はスライド上に明示がなく、質的研究の性質上、定量的な代表性については言及がない。