# ThinkRemed [[MicroRemed]] の reference methodology の一つで、SRE の反省的・知覚的推論を模す **multi-agent フレームワーク**(Figure 3)。 - 4 つの協調エージェント — **Coordinator**(推論方策、Probe 呼び出しを適応判断し playbook を合成)/ **Probe**(稼働システムから kubectl 等で runtime 情報を動的収集)/ **Execution**(playbook 実行)/ **Verification**(binary $v_t$ で成否判定)— が reasoning–action–reflection ループで動く。 - 失敗時は reflection phase に入り Coordinator へ制御が戻り再生成。反復は最大 trial budget $T_{max}$ で打ち切る(既定 1、Equation 2)。 - one-shot の SoloGen を平均約 +7.07% 上回る。ablation では **reflection(除去 -7.16%)が probe agent(除去 -1.57%)より寄与大**で、過剰 probing はノイズで精度を下げる場合がある(Table 3)。$T_{max}$ を増やすと精度上昇だが逓減(Figure 12)。 - Pod Failure と Configuration Error で SoloGen がほぼ失敗するのに対しある程度成功するが、Configuration Error の精度は 60% を超えにくい。 「失敗を巻き戻して再試行する安全な探索が緩和を改善する」という観察は [[Stratus]] の undo-and-retry / [[Transactional No-Regression]] と通じる(詳細は [[agentic SRE]])。 ## 関連 - 本ソース: [[2025__arXiv__MicroRemed - Benchmarking LLMs in Microservices Remediation]] - 評価ベンチ: [[MicroRemed]] - 関連概念: [[障害緩和]] / [[agentic SRE]] - 関連手法: [[Stratus]] - 関連 MOC: [[LLM4SRE - MOC]] / [[SRE - MOC]]