# FRACAS ## 定義 FRACAS(Failure Reporting, Analysis and Corrective Action System)とは、故障報告・解析・是正処置を一体化し、開発試験・生産・運用で見つかった故障を再発防止へ接続する閉ループである。[[@2012__Wiley__Practical Reliability Engineering|Practical Reliability Engineering]] は、開発試験で起きたすべての故障を報告・調査し、初回の故障モードを「対象外」や「偶発」として捨てないことを強調する(Source: [[@2012__Wiley__Practical Reliability Engineering]] ch.12 §12.6, Appendix 5)。 ## 必須データ 本書が挙げる故障報告項目は、故障症状と影響、即時修理、故障時の運転時間、運転条件、日時、故障分類、故障部品調査と再分類、推奨是正処置、是正処置フォローアップである(Source: [[@2012__Wiley__Practical Reliability Engineering]] ch.12 §12.6)。 Appendix 5 では、FRACAS から故障一覧、上位故障モードのパレート分析、MTBF、傾向分析、確率/ハザードプロットを出すことを想定する。パレート分析は重要項目リストの基礎になり、ランタイムが取得しにくい場合はカレンダー時間での分析も許容される(Source: [[@2012__Wiley__Practical Reliability Engineering]] Appendix 5)。 ## 横断的知見 - **FRACAS は SRE のインシデント管理とポストモーテムの製品信頼性版である**: FRACAS は故障を報告し、調査し、是正処置を追跡する。SRE のインシデント管理/ポストモーテムは、運用障害を記録し、根本原因を分析し、再発防止アクションを追跡する。両者は「失敗をデータ化し、是正処置の効果まで閉じる」点で同型だが、FRACAS は部品・試験・保証データまで含む製品ライフサイクル志向が強い。(Source: [[@2012__Wiley__Practical Reliability Engineering]], [[SRE]], [[インシデント管理]]) ## 未解決の問い - 現代のクラウド運用では、FRACAS の故障報告項目を incident report、アラート、ログ、トレース、変更履歴にどう分解して保存すべきか。 - LLM エージェントが診断・修復を提案する場合、是正処置の有効性確認をどのゲートで自動化できるか。 - 保証データや顧客問い合わせのような粗いフィールドデータを、SRE のポストモーテムや AIOps データセットとどう統合できるか。 ## 関連 - ソース: [[@2012__Wiley__Practical Reliability Engineering]] - 概念: [[Design for Reliability]] / [[インシデント管理]] / [[根本原因分析]] / [[SRE]] ## 出典 - [[@2012__Wiley__Practical Reliability Engineering]](ch.12 §12.6, ch.15 §15.8, Appendix 5)