エージェントメモリ - yuuk1's Digital Garden

# エージェントメモリ ## 定義エージェントメモリとは、LLM ベースのエージェントが過去の対話・行動・環境観測を蓄積し、必要に応じて取り出して活用する機構の総称である。Hu+ (2025) は形態(Forms)・機能(Functions)・動態(Dynamics)の 3 軸から成る統一タクソノミを提案し、エージェントメモリを独立した研究領域として位置づけた初の体系的整理を行った ([[@2025__arXiv__Memory in the Age of AI Agents]])。エージェントの行動方策は $a_t = \pi_i(o_{it}, m_{it}, Q)$ と形式化される。$o_{it}$ は観測、$m_{it}$ はメモリ由来の信号、$Q$ はクエリであり、メモリ信号が意思決定に明示的に組み込まれる構造になっている。メモリ状態 $M_t \in \mathcal{M}$ は形成演算子 $F$、進化演算子 $E$、検索演算子 $R$ を通じてライフサイクルを辿る。 ## 形態-機能-動態タクソノミ ### 形態(Forms) — メモリの表現形式 | 形態 | 特徴 | 代表システム | |------|------|-------------| | トークンレベル | 記号的・アドレス可能・人間可読。1D フラット・2D グラフ・3D 階層の 3 構造に細分 | MemGPT, Mem0, A-Mem | | パラメトリック | モデルパラメータへの内部化。暗黙的・汎化可能 | Retroformer, RLKF | | 潜在 | KV キャッシュ圧縮やメモリトークン生成。人間可読でない | MemGen, Titans, MEM1 | ### 機能(Functions) — メモリが担う役割 | 機能 | サブカテゴリ | 概要 | |------|------------|------| | 事実メモリ | ユーザー事実 / 環境事実 | ユーザーの嗜好・プロファイル、環境の知識・状態 | | 経験メモリ | 事例ベース / 戦略ベース / スキルベース | 過去の軌跡・洞察・再利用可能な関数やコード | | 作業メモリ | 単一ターン / マルチターン | 入力圧縮・状態統合・階層的折り畳み・認知的計画 | ### 動態(Dynamics) — メモリのライフサイクル 1. **形成(Formation)**: 意味的要約・知識蒸留・構造化構築・潜在表現化・パラメトリック内部化の 5 経路でメモリを生成する。 2. **進化(Evolution)**: 統合（重複除去・マージ）、更新（追加・置換・編集）、忘却（時間減衰・重要度ベース・明示削除）の 3 機構でメモリを維持する。 3. **検索(Retrieval)**: タイミング/意図の決定、クエリ構成、検索戦略（語彙的・意味的・グラフベース・生成的・ハイブリッド）、後処理（再ランキング・集約圧縮）の 4 段階で構成される。 ## 隣接概念との関係 Hu+ (2025) はエージェントメモリと LLM メモリ・RAG・[[コンテキストエンジニアリング]]の包含/排他関係をベン図で明示した最初の試みである（Figure 2）。 - **LLM メモリ**: アテンション KV 管理など、モデル内部のメモリ機構。エージェントメモリはほぼ包含するが、ニューラルスケーリングの議論など一部は独立。 - **RAG**: 外部知識ベースからの検索拡張。エージェントメモリはこれを部分集合として含む一方、RAG はモジュラー RAG・グラフ RAG 等の固有拡張を持つ。 - **[[コンテキストエンジニアリング]]**: プロンプト・ツール出力・状態をまたいだ情報フローの設計。エージェントメモリは自己進化的メモリ、パラメトリックメモリ、潜在メモリなど、コンテキストウィンドウの外に広がる領域をカバーする点で射程が異なる。 ## 代表的システム | システム | 形態 | 機能 | 特徴 | |---------|------|------|------| | MemGPT | トークンレベル (2D) | 事実 + 作業 | OS 的抽象でメイン/外部コンテキストを階層管理 | | Mem0 | トークンレベル (2D) | 事実 + 経験 | グラフ + ベクトルストアの複合アーキテクチャ | | Reflexion | トークンレベル (1D) | 経験 | 言語的フィードバックをエピソード記憶として蓄積 | | Voyager | トークンレベル (1D/3D) | 経験(スキル) | 再利用可能なコードスキルライブラリを逐次拡張 | | MemOS | トークンレベル (3D) | 事実 + 経験 | ツリー構造メモリ + memcube による階層管理 | | MEM1 | 潜在 | 作業 | 単一セッション内で潜在状態としてメモリを圧縮 | ## 横断的知見 - **[[コンテキストエンジニアリング]]との射程の違い**: [[コンテキストエンジニアリング]]（Boris Tane, 2026）が「エージェントに与える情報の品質を設計・管理する」実践者側の視点を主軸とするのに対し、エージェントメモリ（Hu+, 2025）は「エージェント自身がメモリをいかに形成・進化・検索するか」という自律的管理の側面を主軸とする。両者は補完的な関係にあり、エージェントメモリの検索結果がコンテキストの素材となる点で接続するが、射程は明確に異なる。なお Hu+ の分類では[[コンテキストエンジニアリング]]はエージェントメモリに部分的に包含されるとされており、概念の上下関係が逆転している点は注目に値する。(Source: [[@2025__arXiv__Memory in the Age of AI Agents]], [[コンテキストエンジニアリング]]) - **[[エージェント型強化学習]]との接続**: エージェントメモリの動態フロンティアとして「RL フリー → RL 補助 → 完全 RL 駆動」への進化路線が論じられており（RMM, Mem-α, Memory-R1 等）、[[エージェント型強化学習]]の発展と密接に絡み合う。メモリ管理そのものを RL で学習させるアプローチが次のフェーズとして位置づけられている。(Source: [[@2025__arXiv__Memory in the Age of AI Agents]]) ## 未解決の問い - 完全 RL 駆動のメモリアーキテクチャは、手作業設計の認知心理学的メタファー（エピソード/意味記憶）を本当に超えられるか？評価ベンチマーク自体も人間の認知モデルに基づく可能性があり、循環論法に陥らないか検討が必要だ。 - マルチモーダルメモリのための統一的な表現形式はどうあるべきか？画像・動画は先行しているが、音声・センサーデータなどを含む真のオムニモーダルメモリは未達成であり、統一表現が存在しない。 - マルチエージェント環境での共有メモリのアクセス制御と信頼性モデルはどう構築するか？孤立ローカルメモリからの移行において、メモリの整合性・プライバシー・幻覚耐性をどう担保するかは未解決である。 - コンテキストエンジニアリング（外部設計者の視点）とエージェントメモリ（内部自律の視点）を統合するアーキテクチャ上の原則はあるか？両者の境界が曖昧になる場面（プロンプトでメモリを明示的に操作する場合など）の扱いが問われる。 - エージェントメモリの評価ベンチマーク（MemBench, LongMemEval 等）は、実際の長期エージェント性能とどの程度相関するか？短期評価から長期性能へのギャップはほとんど定量化されていない。 ## 関連 - [[コンテキストエンジニアリング]], [[エージェント型強化学習]] - [[MemGPT]], [[Mem0]] - 関連 MOC: `structures/` に AIOps・システム ML 等の MOC が存在するが、エージェントメモリ専用 MOC は未作成 ## 出典 - [[@2025__arXiv__Memory in the Age of AI Agents]] — Yuyang Hu ほか 47 名（NUS・人民大学・復旦大学・北京大学・NTU ほか）、arXiv:2512.13564、2025-12-18