AIエージェントで自律的に時系列基盤モデルを学習させていくラボラトリシステム

- [[2025__MLSys__AIOpsLab - A Holistic Framework for Evaluating AI Agents for Enabling Autonomous Cloud|AIOpsLab]]などを使って、テレメトリーデータを生成し、時系列基盤モデルのデータセットとし、評価も自動で回す仕組み。 - リアルなシナリオを [[VOID]] などのウェブ上から [[ポストモーテム]] などから入手し、アプリケーションを動的生成させて、AIOpsLabに組み込み自動評価させる。 --- - Web系コミュニティからデータを集めるつてはある。いろいろな種類のシステムのデータの配分率を変えたり、除外したりして、性能がどうかわるかみてみたい。 - 時系列基盤モデルのスケーリング則みたいなものがあるのかないのか気になる - AI/HPCとウェブアプリではMoEでエキスパートをわけたほうがいいのか - 時系列基盤モデルにReasoningとかありえるのか - メトリクス、ログ、トレースなどの時系列の数値と半構造化テキストなどのマルチモーダルのアーキテクチャをどう組むか。 - MicrosoftのAIOpsLabを拡張して、OpenClawみたいに自律的にウェブからインシデントデータを収集して、それを小さく再現するアプリケーションを自動作成して、負荷シナリオも自動生成して、データセットを作ったり、新モデルを評価したりする基盤とか作りたい。人間がほぼ介在せず、ずっと動き続けている。