# Saurabh Jha [[ITBench]](ICML'25, "ITBench: Evaluating AI Agents across Diverse Real-World IT Automation Tasks")の主導著者であり、[[Stratus]] 一次論文([[2025__NeurIPS2025__STRATUS - A Multi-agent System for Autonomous Reliability Engineering of Modern Clouds]])の共著者。 - SRE / AIOps エージェント評価のベンチマーク([[ITBench]])とエージェント([[Stratus]])の双方に関与し、[[AIOpsLab]] → [[ITBench]] → [[Stratus]] の系譜を IBM Research 側からつなぐ人物(所属は本ソース取得テキストでは未記載。ITBench は IBM Research のベンチマーク)。 - Stratus は ITBench と AIOpsLab の両ベンチマークで評価されており、Jha が ITBench の設計者かつ Stratus 共著者である構図は、ベンチマーク作者がエージェントも作る近接コミュニティを示す。 ## 関連 - 本ソース: [[2025__NeurIPS2025__STRATUS - A Multi-agent System for Autonomous Reliability Engineering of Modern Clouds]] - 関与プロダクト: [[Stratus]] / [[ITBench]] - 関連研究者: [[Yinfang Chen]] / [[Tianyin Xu]] - 関連 MOC: [[LLM4SRE - MOC]] / [[AIOps - Failure Detection - MOC]]