# FIBench
ログからの障害指示情報抽出(FID・FIP)タスクの評価用ベンチマークデータセット。[[Junjie Huang]]・[[Zhihan Jiang]] らが [[LoFI]](ISSRE 2024)とともに公開した。
## 構成
- **ソースシステム**: Apache Spark(分散ビッグデータ処理フレームワーク)
- **構築方法**: 21 種の障害タイプを Spark に注入し、正常・異常状態のログを収集。障害注入の手順を参照して FID・FIP をアノテーション
- **統計**:
- 総ログ行数: 1,225,287
- セッションあたり平均ログ数: 39.9
- 障害数: 71
- FID アノテーション: 71 件
- FIP アノテーション: 37 件(FIP がない障害が存在)
## 位置付け
ログからの障害指示情報抽出という新タスクに対する最初のベンチマーク。Cloud 産業データセット(CloudA の Industry)に対して公開・再現可能な評価基盤を提供する。FID・FIP の 7 サブタイプ(Error Message / Missing Component / Abnormal Behavior / Wrong Status / Address / Component ID / Parameter Name)の分布を持つ。
## 関連
- ソース: [[@2024__ISSRE__LoFI - Demystifying and Extracting Fault-indicating Information from Logs for Failure Diagnosis]]
- 関連システム: [[LoFI]]
- 概念: [[ログベース障害診断]] / [[ログ解析]]