# ThinkRemed
[[MicroRemed]] の reference methodology の一つで、SRE の反省的・知覚的推論を模す **multi-agent フレームワーク**(Figure 3)。
- 4 つの協調エージェント — **Coordinator**(推論方策、Probe 呼び出しを適応判断し playbook を合成)/ **Probe**(稼働システムから kubectl 等で runtime 情報を動的収集)/ **Execution**(playbook 実行)/ **Verification**(binary $v_t$ で成否判定)— が reasoning–action–reflection ループで動く。
- 失敗時は reflection phase に入り Coordinator へ制御が戻り再生成。反復は最大 trial budget $T_{max}$ で打ち切る(既定 1、Equation 2)。
- one-shot の SoloGen を平均約 +7.07% 上回る。ablation では **reflection(除去 -7.16%)が probe agent(除去 -1.57%)より寄与大**で、過剰 probing はノイズで精度を下げる場合がある(Table 3)。$T_{max}$ を増やすと精度上昇だが逓減(Figure 12)。
- Pod Failure と Configuration Error で SoloGen がほぼ失敗するのに対しある程度成功するが、Configuration Error の精度は 60% を超えにくい。
「失敗を巻き戻して再試行する安全な探索が緩和を改善する」という観察は [[Stratus]] の undo-and-retry / [[Transactional No-Regression]] と通じる(詳細は [[agentic SRE]])。
## 関連
- 本ソース: [[2025__arXiv__MicroRemed - Benchmarking LLMs in Microservices Remediation]]
- 評価ベンチ: [[MicroRemed]]
- 関連概念: [[障害緩和]] / [[agentic SRE]]
- 関連手法: [[Stratus]]
- 関連 MOC: [[LLM4SRE - MOC]] / [[SRE - MOC]]