# エージェント型科学探索
## 定義
LLMエージェントが固定されたコードテンプレートや事前定義ワークフローに縛られず、アイデア生成・実装・実験・評価を反復的なツリー探索で自律的に拡張していくアプローチ。オープンエンドネスアルゴリズム(多様なアーティファクトのアーカイブを保持し続ける)の設計思想をAI研究自動化に適用したもの。(Source: [[@2026__Nature__Towards end-to-end automation of AI research]])
## 主要コンポーネント(The AI Scientist テンプレート自由版)
### アイデア生成
コード実装と切り離した高レベルの研究提案を生成する。各提案は「研究問題・新しい手法・期待される成果」を含む論文アブストラクト形式。文献検索モジュールが Semantic Scholar API でリアルタイムに既存研究との重複を排除する。
### 実験進行管理(4ステージ)
| ステージ | 目的 |
|------|------|
| 1. 予備調査 | 基本実現可能性の確認 |
| 2. ハイパーパラメータ調整 | 安定化と最適化 |
| 3. 研究アジェンダ実行 | 中心仮説の検証 |
| 4. アブレーション研究 | コンポーネント寄与の分析 |
各ステージが独自のツリー探索を実行し、ステージ末に最良ノードを次ステージの起点として選択する。
### 並列化エージェントツリー探索
ノードを非同期並列実行し、コード生成(Claude Sonnet 4) → 実行 → VLM 図表批評(GPT-4o) → バグ有無の判定 → 子ノード選択の循環を繰り返す。ノード種類:
- ハイパーパラメータノード: 体系的な超パラメータ探索
- アブレーションノード: コンポーネント重要度評価
- 複製ノード: 異なるシードで統計的ロバストネスを確保
- 集約ノード: 複製結果の可視化(新実験なし)
## 横断的知見
- テスト時計算量を増やすほど(ノード数30まで確認)論文スコアが向上する——「スケーリング則」が科学探索でも働く可能性を示唆する。(Source: [[@2026__Nature__Towards end-to-end automation of AI research]])
## 未解決の問い
- 探索の多様性をどう担保するか?ベスト優先探索だけでは局所解に収束しないか?
- ステージ数や各ステージのノード予算の最適設計は?
- 数値実験以外(コンピュータビジョン・NLP・ロボティクス)での汎化は?
- 人間の研究者との協働型探索(Human-in-the-loop)での設計はどうあるべきか?
## 関連
- [[AI研究自動化]] — 上位概念
- [[エージェント型コーディング]] — 個々の実験ノードで使用するコーディング支援
- [[エージェント型強化学習]] — ツリー探索・オープンエンドネスとの共通概念基盤
- [[マルチエージェント協調]] — 並列ノード実行における協調設計
## 出典
- [[@2026__Nature__Towards end-to-end automation of AI research]] — テンプレート自由版 The AI Scientist の詳細。Nature 651, 2026。