# OpsFlowBench
Huawei Cloud のデータセンタースイッチ運用ドキュメントに基づいて構築されたトラブルシューティングワークフロー評価ベンチマーク。252 件の (query, workflow) ペアからなり、4 シナリオ(hardware: 83 件、interface: 56 件、network: 31 件、top: 82 件)・56 種の主要インシデントタイプをカバーする。GPT-4o で初期ワークフローを生成し、3 名の AIOps 研究者と Huawei Cloud の OCE が人手で精緻化・検証した。STEPScore 評価指標と組み合わせて使用する、ドメイン特化型ワークフロー生成ベンチマークとして初めて構築された。(Source: [[@2025__KDD__FlowXpert - Expertizing Troubleshooting Workflow Orchestration with Knowledge Base and Multi-Agent Coevolution]])
## 関連
- ソース: [[@2025__KDD__FlowXpert - Expertizing Troubleshooting Workflow Orchestration with Knowledge Base and Multi-Agent Coevolution]]
- エンティティ: [[Huawei Cloud]] / [[FlowXpert]]