[What we talk about when we talk about ‘root cause’ · GitHub](https://github.com/readme/guides/root-cause) The Art of Capacity Planning と Web Operationsの著者。 - [[Root cause]]というパッセージの批判 Thinking By Machine (deLatil, 1956) p.153: > “Imagine an iron bar thrust into an electric furnace. The bar lengthens, and the “cause” of the lengthening is said to be the heat of the furnace. One is astonished—why should it not be the introduction of the bar into the furnace? Or the existence of the bar? Or the fact that the bar had been previously kept at a lower temperature? None of these possibilities can be termed secondary causes; they are all primary determining causes without which the lengthening phenomenon could not have occurred.” "電気炉に鉄の棒を突き刺す "ことを想像してください。鉄の棒は長くなり、その "原因 "は炉の熱にあると言われる。なぜ、鉄棒が炉の中に入ったことが原因ではないのか?あるいは棒鋼の存在か?あるいは、棒鋼が以前より低い温度に保たれていたことが原因ではないのか?これらの可能性はどれも二次的原因とは呼べない。これらはすべて、それなしには長さ方向の現象は起こり得なかったという第一の決定要因である。" - Dr. Richard Cookは、その代表的な論文How Complex Systems Fail (Cook, 1998) > 3) Catastrophe requires multiple failures—single point failures are not enough. The array of defenses works. System operations are generally successful. Overt catastrophic failure occurs when small, apparently innocuous failures join to create opportunity for a systemic accident. Each of these small failures is necessary to cause catastrophe but only the combination is sufficient to permit failure. Put another way, there are many more failure opportunities than overt system accidents. Most initial failure trajectories are blocked by designed system safety components. Trajectories that reach the operational level are mostly blocked, usually by practitioners. > 3) 大惨事には複数の故障が必要である-一点故障では十分でない。防御の仕組みが機能する。システムの運用はおおむねうまくいっている。あからさまな大惨事は、小さな、一見何でもないような失敗が重なって、システム事故のきっかけを作ったときに起こる。大惨事を引き起こすには、これらの小さな故障の一つ一つが必要だが、故障を許すにはその組み合わせだけが十分である。言い換えれば、あからさまなシステム事故よりも、故障の機会の方がはるかに多いということである。ほとんどの初期故障の軌道は、設計されたシステム安全部品によってブロックされる。運用レベルに達した軌道は、通常、実務者によってほとんど阻止される。 - [[SREcon19 NA - How Did Things Go Right? Learning More from Incidents]] > “There is no root cause. The problem with this term isn't just that it's singular or that the word root is misleading: there's more. Trying to find causes at all is problematic...looking for causes to explain an incident limits what you'll find and learn. And the irony is that [[Root Cause Analysis]] is built on this idea that incidents can be fully comprehended. They can't. We already have a better phrase for this, and it sounds way cooler: it's called a perfect storm. In this way, separating out causes and breaking down incidents into their multiple contributing factors, we're able to see that the things that led to an incident are either always or transiently present. An incident is just the first time they combined into a perfect storm of normal things that went wrong at the same time.” > "Root cause"は存在しない。この言葉の問題は、単数形であることや、ルートという言葉が誤解を招きやすいということだけではありません。インシデントを説明するために原因を探しても、見つかるものも学べることも限られてしまうのです。皮肉なことに、根本原因分析は、インシデントを完全に理解することができるという考えに基づいているのです。しかし、それは不可能です。これには、「パーフェクト・ストーム(完璧な嵐)」という、よりクールな表現があります。このように、原因を分離し、インシデントを複数の要因に分解することで、インシデントを引き起こしたものは常に存在するのか、あるいは一過性のものであるのかを確認することができるのです。事件というのは、それらが初めて組み合わさって、通常のことが同時にうまくいかなくなったパーフェクト・ストームであるにすぎないのです。" - ポジティブな影響に対する根本原因を考えたりはしない - この記事では、「根本原因」という用語の価値に対する懐疑論が高まっているにもかかわらず、人々が「根本原因」という用語を使い続けている理由は何なのかを探る。 - このテーマに関する研究文献によると、事故や事件に関する説明では、「根本原因」(あるいは複数の「根本原因」)という言葉を使うことが、技術的な目的よりも社会的な目的に役立つことが明らかにされています。 - [What’s allowed to count as a cause? – Surfing Complexity](https://surfingcomplexity.blog/2021/07/18/whats-allowed-to-count-as-a-cause/) ### Providing reassurance about the future - 「根本原因」というレッテルを貼ることで、人はインシデントの経験に伴う(時には暗黙の)不安に対処可能。 - 事件というのは、本当に不安なもので、その説明や原因を探したくなる。 - ニーチェ的不安。これは、ドイツの哲学者が『偶像の黄昏』の中で書いたことを反映している。 > 「未知のものに対して、人は危険、不快、注意に直面する。最初の本能は、これらの苦痛を伴う状態を解消することである。第一原理:どんな説明でも、ないよりはましだ。それは基本的に不快な不確実性を取り除きたいという欲求に過ぎないので、それをどのように取り除くかにはあまりこだわらない。未知のものを身近な言葉で説明する最初の解釈はとても気分がよく、人はそれを「真実として受け入れる」......のである。 可能であれば、「なぜ」は、それ自体のために原因を特定するのではなく、慰め、解放し、安心させるような原因を特定することに帰結しなければならない。この必要性の第二の帰結は、すでに慣れ親しんだもの、経験したもの、記憶にすでに刻まれたものを原因として同定することである。新奇なもの、奇妙なもの、経験したことのないものは除外される"。 - ジョン・キャロル(Carroll, 1995)が「根本原因の誘惑」。何がその出来事を「引き起こした」のかを特定したいという強い欲求をすぐに感じ、そうすれば、自分がコントロールできているという感覚を取り戻すために何か(典型的には何かを修正するということ)をすることができる。 - しかし、根本原因のラベリングは、複雑な出来事の一面を強調し、他の面を割り引くことになる。 ### Purposes and audiences - 同じチームのエンジニア同士の会話で使われる場合は、注意を要すると思われる特定の場所を強調したり、ハイライトしたりする方法として単純に使われるかもしれない。 - しかし、このような使い方は、原因よりもむしろ引き金になることを意味することが多い。「トリガー」という用語は、既に存在する状態を「活性化」させる特定のダイナミックを表現するのに適している傾向がある。 - この用語が法的な契約書やその他の契約文書で使用される場合、法律用語によくある柔軟な解釈を可能にするために、意図的に曖昧な意味を持たせる傾向がある - 企業が自社のサービスや製品が経験した事故について発表する記事の場合、「根本原因」という用語は非常に特殊な意味で使われる傾向がある。 - a) 会社がその事象を十分に理解しているという信頼感 - b) 将来的に状況を改善するための何らかのコミットメントを提供することです。 ### A challenge for readers and listeners - 著者(または話し手)は、この言葉を使って何を伝えようとしているのか? - 著者(または話し手)は、この言葉を使うことによって何を伝えようとしているのだろうか? - 根本原因とみなされるものの他に、語られている物語の結果に影響を及ぼしていると想像できるものは何ですか? - あなたが聞かされているストーリーには、どのような詳細が著しく欠落しているように見えますか? - もしあなたが質問をする機会があったとして、語り手によって却下されたり、割り引かれたりすることを想像できますか?