エージェント型科学探索 - yuuk1's Digital Garden

# エージェント型科学探索 ## 定義 LLMエージェントが固定されたコードテンプレートや事前定義ワークフローに縛られず、アイデア生成・実装・実験・評価を反復的なツリー探索で自律的に拡張していくアプローチ。オープンエンドネスアルゴリズム(多様なアーティファクトのアーカイブを保持し続ける)の設計思想をAI研究自動化に適用したもの。(Source: [[@2026__Nature__Towards end-to-end automation of AI research]]) ## 主要コンポーネント(The AI Scientist テンプレート自由版) ### アイデア生成コード実装と切り離した高レベルの研究提案を生成する。各提案は「研究問題・新しい手法・期待される成果」を含む論文アブストラクト形式。文献検索モジュールが Semantic Scholar API でリアルタイムに既存研究との重複を排除する。 ### 実験進行管理(4ステージ) | ステージ | 目的 | |------|------| | 1. 予備調査 | 基本実現可能性の確認 | | 2. ハイパーパラメータ調整 | 安定化と最適化 | | 3. 研究アジェンダ実行 | 中心仮説の検証 | | 4. アブレーション研究 | コンポーネント寄与の分析 | 各ステージが独自のツリー探索を実行し、ステージ末に最良ノードを次ステージの起点として選択する。 ### 並列化エージェントツリー探索ノードを非同期並列実行し、コード生成(Claude Sonnet 4) → 実行 → VLM 図表批評(GPT-4o) → バグ有無の判定 → 子ノード選択の循環を繰り返す。ノード種類: - ハイパーパラメータノード: 体系的な超パラメータ探索 - アブレーションノード: コンポーネント重要度評価 - 複製ノード: 異なるシードで統計的ロバストネスを確保 - 集約ノード: 複製結果の可視化(新実験なし) ## 横断的知見 - テスト時計算量を増やすほど(ノード数30まで確認)論文スコアが向上する——「スケーリング則」が科学探索でも働く可能性を示唆する。(Source: [[@2026__Nature__Towards end-to-end automation of AI research]]) ## 未解決の問い - 探索の多様性をどう担保するか？ベスト優先探索だけでは局所解に収束しないか？ - ステージ数や各ステージのノード予算の最適設計は？ - 数値実験以外(コンピュータビジョン・NLP・ロボティクス)での汎化は？ - 人間の研究者との協働型探索(Human-in-the-loop)での設計はどうあるべきか？ ## 関連 - [[AI研究自動化]] — 上位概念 - [[エージェント型コーディング]] — 個々の実験ノードで使用するコーディング支援 - [[エージェント型強化学習]] — ツリー探索・オープンエンドネスとの共通概念基盤 - [[マルチエージェント協調]] — 並列ノード実行における協調設計 ## 出典 - [[@2026__Nature__Towards end-to-end automation of AI research]] — テンプレート自由版 The AI Scientist の詳細。Nature 651, 2026。