# BiAn
中国神話の「比安」(正邪を見分ける神獣)から命名された、[[Alibaba Cloud]] の本番ネットワーク向け LLM ベース障害箇所特定システム。[[Ennan Zhai]]・[[Chen Tian]]・[[Guyue Liu]] らが SIGCOMM 2025 で発表([[@2025__SIGCOMM__Towards LLM-Based Failure Localization in Production-Scale Networks]])。
## 設計
- **3 段階階層推論(Pipeline 1)**: (1) 11 種監視ツールのアラート要約 → (2) 7 種異常シナリオに基づく単デバイス分析 → (3) 統合スコアリング
- **3 パイプライン統合(Stage 2)**: SOP ベース(Pipeline 1)+ ネットワークトポロジー(Pipeline 2)+ イベントタイムライン(Pipeline 3)
- **継続的プロンプト更新**: 探索→リフレクション→知識統合→プロンプト補強の 4 段ループ。LLM パラメータは変えず、プロンプトのみを自動更新する
- **Top-p フィルタ**: Stage 1 後に低疑惑デバイスを除外し、Stage 2 の処理対象を絞る
- **Rank of Ranks**: N=3 回の推論実行の平均ランクで出力のゆらぎを平滑化
- **早期停止**: Stage 1 エントロピーが低いケースは Stage 2 をスキップ(全体の 1/3)
## 性能(17 か月・357 件)
| 指標 | BiAn | Hot Device |
|---|---|---|
| Top-1 精度 | 95.5% | 86.3% |
| Top-2 精度 | 98.6% | 88.9% |
| Top-3 精度 | 99.3% | 93.0% |
本番デプロイ(10 か月): TTR 平均 20.5% 短縮、高リスクインシデント 55.2% 短縮。エンドツーエンドレイテンシ < 30 秒、推論コスト $0.18 /インシデント。
## 関連
- ソース: [[@2025__SIGCOMM__Towards LLM-Based Failure Localization in Production-Scale Networks]]
- 開発組織: [[Alibaba Cloud]] / [[Nanjing University]] / [[Peking University]]
- 責任著者: [[Ennan Zhai]] / [[Chen Tian]] / [[Guyue Liu]]
- 概念: [[Fault Localization]] / [[LLMによる根本原因分析]] / [[ネットワーク監視]]