ブラウザ可視証拠とバックエンド可観測性を統合した初のクロスモーダル障害診断ベンチマーク。[[Haoming Meng]] が単著で発表(arXiv:2604.23455、2026)。[[OpenTelemetry Demo]] と [[Tractor Store]] の 2 アプリケーションを用い、87 シナリオを決定論的スナップショットとして固定ツールインターフェースでパッケージ化する。6 モデル評価で全体 A@1=19.7%・天井=52%、ブラウザ限定エージェントがフルツールエージェントを上回る(28% vs 19.9%)という反直感的結果を示した。