joisino-超人的AIと認知不能情報-2025

# 人間には認知できない情報を活用するAIたち [[佐藤竜馬]] による 2025年1月15日付けのブログ記事（ジョイジョイジョイ）。敵対的摂動研究を起点に、「AI は人間には認知できない情報を活用できる」という観察を掘り下げ、人間と AI の協調のあり方を論じる。英語版は [The Hidden Information AI Understands but Humans Miss](https://data-processing.club/superai/) として公開。 ## 核心的主張 - AI は、人間の感覚器官・認知能力では検知できない情報を「手がかり」として正当に活用している。 - その手がかりは「ランダムなノイズ」でも「モデル固有の癖」でもなく、汎化する真の分類根拠である（Ilyas+ NeurIPS 2019 が実験的に証明）。 - 個々には微弱で統計的に有意でない信号でも、100 万次元規模で束ねると 99.9999% 以上の精度を達成できる（Tsipras+ ICLR 2019 の構成例）。 - 要素還元主義的アプローチでは本質的に解けない問題が存在する。 - AI の推論プロセスの解釈は断念し、**検証可能な形式での出力**（証明・経路・双対解など）を要求することが現実的な協調戦略となる。 ## 敵対的摂動の再解釈 Ilyas+ NeurIPS 2019 による仮説検証実験の骨格： 1. モデル A で犬画像の「猫っぽいパターン δ」を生成し、犬画像に δ を加算して「猫」ラベルを付ける。 2. 同様に猫画像に「犬っぽいパターン」を加えて「犬」ラベルを付け、訓練データセットを構成する。 3. このデータセットは人間には完全に「誤ったラベル」に見えるが、別のモデル B を訓練すると普通の犬画像を正しく「犬」と分類できるようになる。人間は可視的特徴（大きな舌・黒い鼻）しか見えず騙されるが、AI は非可視の分類手がかり（δ に含まれる猫固有パターン）も読み取れるため正答できる。追記（2025-01-16）：AI の観測可能情報を人間と同じ範囲に制限すると、AI も人間と同様に誤分類するようになる。つまり広範な認識は AI の能力制限前の本来の挙動である。 ## 微弱信号の束ね（Tsipras+ ICLR 2019） - 正例：1 次元目が確率 0.95 で +1、2〜1,000,001 次元は平均 +0.01 の正規分布。 - 負例：1 次元目が確率 0.95 で −1、2〜1,000,001 次元は平均 −0.01 の正規分布。 - 各次元の信号は人間が認知するには微弱すぎる（確率差がほぼゼロ）が、100 万次元の平均を取ると精度 99.9999% 超の線形分類器が構成できる。 - **要素還元主義的手法では、各次元を独立に検定しても有意差が出ず問題を見落とす**。 ## AI の判断の解釈困難性クラス活性化マッピング（CAM）や帰属手法（attribution methods）は、「どの箇所を見たか」を計算するが、上記の高次元均一信号では全次元が同等に重要なため： - どの次元が最重要かを特定できない（すべて真っ赤になる）。 - 正例で最大値の次元を示しても、それは負例でも同程度の確率で現れる。 - むしろその次元だけを重視すると誤分類の原因になる。法則そのものが本質的に複雑であれば、人間が理解できるほど単純な説明への近似は常に誤りを含む。 ## では何をすべきか ### 特徴量としての活用 AI の出力を他の自然界の信号と同様に「環境の一部」と捉え、人間の意思決定の根拠の一つとして使う。「うろこ雲があれば雨」と「AI が雨と言えば雨」は原理的に同等であり、自然信号より AI の方が科学的に解析しやすい可能性すらある。 ### 探索と検証の分業科学・工学の多くの問題は「探索（難）+ 検証（易）」に分解できる： - タンパク質設計（探索困難）→ 生物活性の試験（検証相対的に簡単）。 - AlphaFold 等が体現。なぜそのような設計に至ったかが分からなくても、役立つかどうかは判断できる。 ### NP 完全性との接続 NP 完全問題は「探索は難しく、検証は簡単」の典型： - ハミルトン閉路の発見は指数的に困難だが、与えられた経路の検証は線形時間。 - AI に経路を出力させ、人間が検証する分業が可能。 - 意地悪な AI が誤答を出しても、**人間は証拠の検証によって確実に真偽を判断できる**（AI を信頼する必要がない）。 ### 双対問題と対話型証明系巡回セールスマン問題では AI に経路（上界 Y）と双対解（下界 X）の両方を出力させることで、答えを「X ≤ 最適値 ≤ Y」と挟み込んで検証できる。さらに対話型証明系（Goldwasser+ STOC 1985）の技術を応用すると、IP = PSPACE・MIP = NEXPTIME の範囲まで能力の低い人間（検証者）が確信を持って検証可能となる。 ### 検証そのものが知的チャレンジへ探索が AI にオフロードされると扱える問題の難易度が上がり、検証作業が人間の知力のボトルネックになる。検証作業自体が今後の知的フロンティアとなる。 ## 関連ページ - [[敵対的摂動]] — 記事の主題。人間非可知の分類手がかりとしての再解釈。 - [[帰属手法]] — AI の判断解釈手法。高次元均一信号では機能しない限界。 - [[AI検証可能性]] — 探索と検証の分業戦略。NP 完全性・対話型証明系との接続。 - [[機構的解釈性]] — 関連する AI 解釈性研究の方法論。 - [[佐藤竜馬]] — 著者。