# ヒューリスティックの束(bag of heuristics) ## 定義 LLM が推論タスクを解く際の機構として、Nikankin ら(ICLR 2025)が提唱した概念。各ニューロンが「粗い条件が成立するときに発火して特定トークン群のロジットを押し上げる」という弱い判定子(ヒューリスティック)として機能し、**多数の弱い判定が積み重なることで正解トークンが傑出した確率を得る**仕組み。個々の判定は正解を一意に定めないが、その束(集合体)が協調して正解を選ぶ。(Source: [[joisino-LLMのキモい算術-2025]]) ## 仕組み ``` ヒューリスティックニューロン1(範囲条件) → トークン群 A のロジット+ ヒューリスティックニューロン2(剰余条件) → トークン群 B のロジット+ ヒューリスティックニューロン3(パターン条件)→ トークン群 C のロジット+ ... → ... ↓ 正解トークンは A∩B∩C∩... に含まれるため繰り返し押し上げられる 誤答候補は少数の条件しか満たさず相対的に低いまま ``` 偽陽性(誤答候補トークンも一部押し上げられる)は存在するが、真の答えだけが多数の条件を同時に満たすため、集計の結果として正解が浮き彫りになる。 ## 弱さと堅牢性のトレードオフ - **弱さ**: 個々のヒューリスティックは計算結果を一意に定めない。単独では確定的な判定ができない。 - **堅牢性**: 多数の独立した弱いシグナルの重ね合わせにより、単一ニューロンの誤作動が全体に影響しにくい。 - **脆弱性**: ヒューリスティックニューロンによる押し上げが少ない状況では計算ミスが起きる([[LLM算術機構]])。 ## 横断的知見 - ヒューリスティックの束という機構は、LLM が「プログラムを実行する汎用計算装置」として振る舞うという([[joisino-LLMアテンションと外挿-2025]])の解釈と対立するように見えるが、両者は相補的である。注意ヘッドがアルゴリズム的な制御フローを担い、MLPニューロンが粗い判定(ヒューリスティック)を担うと読めば整合する。(Source: [[joisino-LLMのキモい算術-2025]], [[joisino-LLMアテンションと外挿-2025]]) ## 未解決の問い - 算術以外のタスク(常識推論・論理・コード生成)でも bag of heuristics が成立するか? - ヒューリスティックの束は訓練データの分布変化(分布外入力)に対してどのように崩壊するか? - 束の「太さ」(ヒューリスティック数)と精度の定量的な関係は? ## 関連ページ - [[LLM算術機構]] — bag of heuristics が確認された具体的タスク - [[ロジットレンズ]] — 各ニューロンの寄与を測定するツール - [[機構的解釈性]] — 方法論的文脈 ## 出典 - [[joisino-LLMのキモい算術-2025]] — Nikankin+ ICLR 2025 を解説、bag of heuristics を紹介