ThinkRemed - yuuk1's Digital Garden

# ThinkRemed [[MicroRemed]] の参照手法の一つで、SRE の反省的・知覚的推論を模す**マルチエージェントフレームワーク**(Figure 3)。 - 4 つの協調エージェント — **Coordinator**(推論方策、Probe 呼び出しを適応的に判断しプレイブックを合成)/ **Probe**(稼働システムから kubectl 等で実行時情報を動的収集)/ **Execution**(プレイブック実行)/ **Verification**(二値 $v_t$ で成否判定)— が推論・行動・リフレクションのループで動く。 - 失敗時はリフレクションの段階に入り Coordinator へ制御が戻り再生成する。反復は最大試行回数 $T_{max}$ で打ち切る(既定 1、Equation 2)。 - ワンショットの SoloGen を平均約 +7.07% 上回る。アブレーションでは**リフレクション(除去で -7.16%)が Probe エージェント(除去で -1.57%)より寄与が大きく**、過剰なプローブはノイズで精度を下げる場合がある(Table 3)。$T_{max}$ を増やすと精度は上がるが逓減する(Figure 12)。 - Pod Failure と Configuration Error で SoloGen がほぼ失敗するのに対しある程度成功するが、Configuration Error の精度は 60% を超えにくい。「失敗を巻き戻して再試行する安全な探索が緩和を改善する」という観察は [[Stratus]] の巻き戻しと再試行 / [[Transactional No-Regression]] と通じる(詳細は [[agentic SRE]])。 ## 関連 - 本ソース: [[@2025__arXiv__MicroRemed - Benchmarking LLMs in Microservices Remediation]] - 評価ベンチ: [[MicroRemed]] - 関連概念: [[障害緩和]] / [[agentic SRE]] - 関連手法: [[Stratus]] - 関連 MOC: [[LLM4SRE - MOC]] / [[SRE - MOC]]