帰納ヘッド - yuuk1's Digital Garden

## 定義「`... [A] [B] ... [A]`」という形式の入力に対して、最後の `[A]` から `[B]` に注意を向ける[[アテンションヘッド]]。「過去に同じトークンが現れたとき次はどうなったか」をパターンとして参照する（Olsson+ 2022）。拡張形式として `[A']` が `[A]` と類似したトークン列の場合にも帰納ヘッドと呼ぶ（例：意味的に似た映画レビュー文）。 ## 二層構造（Olsson+ 2022）帰納ヘッドは**二つの注意層の協調**で実現される。 1. **第一層（前置きヘッド）**: 自分より一つ前の位置に注意を向け、そのトークン埋め込みを取り込む。位置が自分と似ているという基準で注意先を決定。 2. **第二層（帰納ヘッド本体）**: 第一層が取り込んだトークン埋め込みを用いて、文脈中で「自分のトークンの直前」が現れた位置を探し注意を向ける。 ## 文脈内学習（In-Context Learning）との関係帰納ヘッドにより LLM は**近傍法を実行する汎用プラットフォーム**として機能する。感情分析・分類タスク等を例示なしのルール記述なしに few-shot で解くのは、この帰納ヘッドが過去の例示パターンを参照しているためと解釈できる。重要な含意：表層のトークンレベルでは外挿（訓練時未見のトークンに対応）しているが、仕組み・アルゴリズムのメタレベルでは内挿（訓練時に獲得した近傍法アルゴリズムを適用）にとどまる。 ## 横断的知見 - 帰納ヘッドは[[機構的解釈性]]研究の代表例であり、小規模トランスフォーマーで詳細な回路解析が行われた最初のヘッドの一つ（Olsson+ 2022）。 - この機構が LLM の文脈内学習能力の主要なメカニズムである可能性が高い。 - [[@2025__SpeakerDeck__言語モデルの内部機序：解析と解釈]] は、帰納ヘッドの出現タイミングと文脈内学習(ICL)スコアの向上タイミングが訓練トークン数に対して一致することを示す実測グラフを紹介しており、[[joisino-LLMアテンションと外挿-2025]] が理論的に説明する二層構造の主張を訓練ダイナミクスの観点から補強する(Source: [[@2025__SpeakerDeck__言語モデルの内部機序：解析と解釈]])。 ## 未解決の問い - 実際の大規模 LLM でも二層の前置きヘッド＋帰納ヘッドの分離が観察されるか？ - 帰納ヘッドが多数存在するか少数かは LLM の文脈内学習性能にどう影響するか？ ## 関連ページ - [[アテンションヘッド]] — 帰納ヘッドが属する分類 - [[機構的解釈性]] — 帰納ヘッドを発見した方法論 - [[関数ベクトル]] — 文脈内学習の別実現機構