@2025__arXiv__Memory in the Age of AI Agents

> [!abstract] 概要 > 大規模言語モデル(LLM)に基づくエージェントが急速に進化する中で、メモリはエージェントの永続性・個人化・継続的適応を実現する基盤的構成要素として台頭している。本サーベイでは、エージェントメモリを形態(Forms)・機能(Functions)・動態(Dynamics)の統一的分類法で体系化する。形態ではトークンレベル・パラメトリック・潜在メモリの 3 種を識別し、機能では事実・経験・作業メモリの 3 区分を提案する。動態ではメモリの形成・進化・検索の 3 段階のライフサイクルを分析する。さらにベンチマーク・オープンソースフレームワーク・将来の研究方向を整理し、生成的メモリ・自律的メモリ管理・強化学習統合・マルチモーダルメモリ・共有メモリ・信頼性の各フロンティアを論じる。 ## 論文情報 - **タイトル**: Memory in the Age of AI Agents - **著者**: [[Yuyang Hu]]、[[Siyu Chen]]、[[Wentao Shi]] ほか 47 名（[[National University of Singapore]]、[[Renmin University of China]]、[[Fudan University]]、[[Peking University]]、[[Nanyang Technological University|NTU]] ほか） - **媒体**: arXiv プレプリント（cs.CL, cs.AI） - **投稿日**: 2025-12-18（改訂 2026-01-13） - **arXiv**: 2512.13564 - **ページ数**: 107 ページ（本文約 76 ページ + 参考文献約 31 ページ） ## 概要 LLM ベースのエージェントにおけるメモリシステムを包括的にサーベイし、形態・機能・動態の 3 軸から成る統一的タクソノミを提案する。エージェントメモリを LLM メモリ・RAG・[[コンテキストエンジニアリング]]と明確に区別し、独立した研究領域として位置づけた初の体系的整理である。 **Figure 1: エージェントメモリの統一タクソノミ概観** ![[_attachments/arxiv-2512.13564/fig01-overview-taxonomy.png]] (Figure 1. 形態(トークンレベル・パラメトリック・潜在メモリ)、機能(事実・経験・作業メモリ)、動態(形成・進化・検索)の 3 軸による統一分類。Source: Hu+, arXiv2025 Figure 1.) ## 問題設定 LLM ベースのエージェントが長期的なタスクを遂行するには、過去の対話・行動・環境情報を蓄積し、必要に応じて取り出す仕組みが不可欠である。既存の研究ではメモリの部分的側面（短期/長期の二分法、あるいは RAG やコンテキストウィンドウ管理）が個別に扱われており、統一的な枠組みが欠如していた。本サーベイはこの空白を埋めることを目的とする。エージェントの行動方策を $a_t = \pi_i(o_{it}, m_{it}, Q)$ と形式化する。ここで $o_{it}$ は観測、$m_{it}$ はメモリ由来の信号、$Q$ はエージェントへのクエリである。メモリ状態 $M_t \in \mathcal{M}$ は形成演算子 $F$、進化演算子 $E$、検索演算子 $R$ を通じて進化する。 ## 隣接概念との関係 **Figure 2: エージェントメモリと LLM メモリ・RAG・コンテキストエンジニアリングの概念比較** ![[_attachments/arxiv-2512.13564/fig02-agent-memory-comparison.png]] (Figure 2. 4 概念のベン図。エージェントメモリは他の 3 概念をほぼ包含するが、完全な上位集合ではない。Source: Hu+, arXiv2025 Figure 2.) - **LLM メモリ**: アテンション KV 管理やロングコンテキスト処理など、モデル内部のメモリ機構。エージェントメモリは LLM メモリのほぼ全てを包含するが、ニューラルスケーリングの文脈など一部は独立。 - **RAG**: 外部知識ベースからの検索拡張。エージェントメモリはこれを部分集合として含むが、RAG はモジュラーRAG・グラフ RAG 等の独自拡張を持つ。 - **[[コンテキストエンジニアリング]]**: プロンプト・ツール出力・状態をまたいだ情報フローの設計。部分的に重なるが、エージェントメモリは自己進化的なメモリ、パラメトリックメモリ、潜在メモリなどコンテキストウィンドウの外に広がる。 ## 提案する分類体系 ### 形態(Forms) メモリがどのような形で表現・格納されるかの 3 分類。 | 形態 | 特徴 | 適用場面 | 代表システム | |------|------|---------|-------------| | トークンレベル | 記号的・アドレス可能・透明 | マルチターンチャット・個人化エージェント | MemGPT, Mem0, A-Mem | | パラメトリック | 暗黙的・抽象的・汎化可能 | ロールプレイ・推論集約的タスク | Retroformer, RLKF | | 潜在 | 暗黙的・人間可読でない | マルチモーダルメモリ・エッジ展開 | MemGen, Titans, MEM1 | トークンレベルメモリはさらに 1D フラット（経験・チャンク・対話・要約を一列保持）、2D プレーナー（グラフ構造）、3D 階層的（ピラミッド・多層構造）に細分される。 ### 機能(Functions) **Figure 6: 機能タクソノミ** ![[_attachments/arxiv-2512.13564/fig06-functional-taxonomy.png]] (Figure 6. 長期メモリ（事実・経験）と短期メモリ（作業）の機能分類とサブカテゴリ。Source: Hu+, arXiv2025 Figure 6.) | 機能 | サブカテゴリ | 概要 | |------|------------|------| | 事実メモリ | ユーザー事実 / 環境事実 | ユーザーの嗜好・プロファイル、および環境の知識・状態 | | 経験メモリ | 事例ベース / 戦略ベース / スキルベース | 過去の軌跡・洞察・再利用可能な関数やコード | | 作業メモリ | 単一ターン / マルチターン | 入力圧縮・状態統合・階層的折り畳み・認知的計画 | ### 動態(Dynamics) **Figure 8: メモリの操作的動態** ![[_attachments/arxiv-2512.13564/fig08-operational-dynamics.png]] (Figure 8. メモリ形成・メモリ進化・メモリ検索の 3 段階ライフサイクル。Source: Hu+, arXiv2025 Figure 8.) 1. **形成(Formation)**: 意味的要約、知識蒸留、構造化構築、潜在表現化、パラメトリック内部化の 5 経路。 2. **進化(Evolution)**: 統合（重複除去・マージ）、更新（追加・置換・編集）、忘却（時間減衰・重要度ベース・明示削除）の 3 機構。 3. **検索(Retrieval)**: タイミング/意図、クエリ構成、検索戦略（語彙的・意味的・グラフベース・生成的・ハイブリッド）、後処理（再ランキング・集約圧縮）の 4 段階。 ## 新規性 - **統一タクソノミ**: 従来サーベイの短期/長期の二分法や認知心理学的メタファー（エピソード/意味記憶）に替わり、形態-機能-動態の 3 軸直交分類を提案。個々のシステムの設計判断を体系的に位置づけられる。 - **概念の境界画定**: エージェントメモリと LLM メモリ・RAG・コンテキストエンジニアリングの包含/排他関係を初めて明示的に図示。 - **動態の 3 演算子形式化**: メモリライフサイクルを形成 $F$・進化 $E$・検索 $R$ の形式的演算子で定義し、設計空間を構造化。 ## リソースとフレームワーク **ベンチマーク**: MemBench（53,000 サンプル）、LoCoMo、LongMemEval、MemoryAgentBench 等 20 以上のメモリ指向ベンチマークと、ALFWorld・WebArena・SWE-Bench 等のエージェント汎用ベンチマーク計 30 以上を整理（Table 8）。 **オープンソースフレームワーク**: MemGPT（階層的 S/LTM）、Mem0（グラフ+ベクトル）、MemOS（ツリーメモリ+memcube）、Zep（時間知識グラフ）、LangMem（コア API）等 24 以上を比較（Table 9）。事実メモリ・経験メモリ・マルチモーダル対応・評価ベンチマークの有無で整理。 ## ポジションとフロンティア 1. **検索から生成へ**: retrieve-then-generate に加え、検索ステップなしに潜在メモリトークンを直接生成する direct memory generation が台頭（MemGen, VisMem）。 2. **自律的メモリ管理**: 手作業ルールベースから、エージェント自身がツール呼び出しとしてメモリ操作（追加/更新/削除/検索）を実行する設計へ。階層的・自己組織的なメモリアーキテクチャが次の段階。 3. **強化学習との統合**: RL フリー → RL 補助（RMM, Mem-α, Memory-R1）→ 完全 RL 駆動への進化路線。将来は人間設計の事前知識に依存しない、端から端まで学習されたメモリアーキテクチャが到来する可能性。 4. **マルチモーダルメモリ**: 画像・動画メモリが先行し、音声・その他のモダリティは未開拓。真のオムニモーダルメモリは未達成。 5. **マルチエージェント共有メモリ**: 孤立ローカルメモリからエージェント認識型・学習駆動型の共有メモリへ。 6. **ワールドモデルのためのメモリ**: フレームサンプリング → スライディングウィンドウ → SSM/明示メモリバンク/疎メモリへの進化。デュアルシステムアーキテクチャ（高速+熟慮）が将来の方向。 7. **信頼性あるメモリ**: プライバシー保全・説明可能性・幻覚耐性の 3 柱。OS 的抽象（セグメント化・バージョン管理・監査可能）が長期的展望。 ## 強み - 107 ページにわたる網羅性。300 以上の文献を体系的に整理し、エージェントメモリ研究の全体像を提示。 - 形態-機能-動態の 3 軸は既存サーベイの二分法に比べ、設計空間の記述力が高い。 - 隣接概念（LLM メモリ・RAG・コンテキストエンジニアリング）との境界を明示的に論じた最初の試み。 - 7 つの明確なフロンティアの提示により、今後の研究方向を構造化。 ## 弱点・課題 - サーベイ論文の性格上、独自の実験的検証は含まれない。分類体系の妥当性は事後的に検証される必要がある。 - 多くのシステムが 2024〜2025 年のプレプリント段階であり、再現性や性能の安定性は未確立。 - 47 名の共著であるがゆえに、セクション間でメモリ概念の粒度や用語の統一に揺れがある箇所がある。 - マルチモーダルメモリ（§7.4）やワールドモデルメモリ（§7.6）は展望にとどまり、具体的な比較実験や定量的評価は示されていない。