# 人間には認知できない情報を活用するAIたち
[[佐藤竜馬]] による 2025年1月15日付けのブログ記事(ジョイジョイジョイ)。敵対的摂動研究を起点に、「AI は人間には認知できない情報を活用できる」という観察を掘り下げ、人間と AI の協調のあり方を論じる。英語版は [The Hidden Information AI Understands but Humans Miss](https://data-processing.club/superai/) として公開。
## 核心的主張
- AI は、人間の感覚器官・認知能力では検知できない情報を「手がかり」として正当に活用している。
- その手がかりは「ランダムなノイズ」でも「モデル固有の癖」でもなく、汎化する真の分類根拠である(Ilyas+ NeurIPS 2019 が実験的に証明)。
- 個々には微弱で統計的に有意でない信号でも、100 万次元規模で束ねると 99.9999% 以上の精度を達成できる(Tsipras+ ICLR 2019 の構成例)。
- 要素還元主義的アプローチでは本質的に解けない問題が存在する。
- AI の推論プロセスの解釈は断念し、**検証可能な形式での出力**(証明・経路・双対解など)を要求することが現実的な協調戦略となる。
## 敵対的摂動の再解釈
Ilyas+ NeurIPS 2019 による仮説検証実験の骨格:
1. モデル A で犬画像の「猫っぽいパターン δ」を生成し、犬画像に δ を加算して「猫」ラベルを付ける。
2. 同様に猫画像に「犬っぽいパターン」を加えて「犬」ラベルを付け、訓練データセットを構成する。
3. このデータセットは人間には完全に「誤ったラベル」に見えるが、別のモデル B を訓練すると普通の犬画像を正しく「犬」と分類できるようになる。
人間は可視的特徴(大きな舌・黒い鼻)しか見えず騙されるが、AI は非可視の分類手がかり(δ に含まれる猫固有パターン)も読み取れるため正答できる。
追記(2025-01-16):AI の観測可能情報を人間と同じ範囲に制限すると、AI も人間と同様に誤分類するようになる。つまり広範な認識は AI の能力制限前の本来の挙動である。
## 微弱信号の束ね(Tsipras+ ICLR 2019)
- 正例:1 次元目が確率 0.95 で +1、2〜1,000,001 次元は平均 +0.01 の正規分布。
- 負例:1 次元目が確率 0.95 で −1、2〜1,000,001 次元は平均 −0.01 の正規分布。
- 各次元の信号は人間が認知するには微弱すぎる(確率差がほぼゼロ)が、100 万次元の平均を取ると精度 99.9999% 超の線形分類器が構成できる。
- **要素還元主義的手法では、各次元を独立に検定しても有意差が出ず問題を見落とす**。
## AI の判断の解釈困難性
クラス活性化マッピング(CAM)や帰属手法(attribution methods)は、「どの箇所を見たか」を計算するが、上記の高次元均一信号では全次元が同等に重要なため:
- どの次元が最重要かを特定できない(すべて真っ赤になる)。
- 正例で最大値の次元を示しても、それは負例でも同程度の確率で現れる。
- むしろその次元だけを重視すると誤分類の原因になる。
法則そのものが本質的に複雑であれば、人間が理解できるほど単純な説明への近似は常に誤りを含む。
## では何をすべきか
### 特徴量としての活用
AI の出力を他の自然界の信号と同様に「環境の一部」と捉え、人間の意思決定の根拠の一つとして使う。「うろこ雲があれば雨」と「AI が雨と言えば雨」は原理的に同等であり、自然信号より AI の方が科学的に解析しやすい可能性すらある。
### 探索と検証の分業
科学・工学の多くの問題は「探索(難)+ 検証(易)」に分解できる:
- タンパク質設計(探索困難)→ 生物活性の試験(検証相対的に簡単)。
- AlphaFold 等が体現。なぜそのような設計に至ったかが分からなくても、役立つかどうかは判断できる。
### NP 完全性との接続
NP 完全問題は「探索は難しく、検証は簡単」の典型:
- ハミルトン閉路の発見は指数的に困難だが、与えられた経路の検証は線形時間。
- AI に経路を出力させ、人間が検証する分業が可能。
- 意地悪な AI が誤答を出しても、**人間は証拠の検証によって確実に真偽を判断できる**(AI を信頼する必要がない)。
### 双対問題と対話型証明系
巡回セールスマン問題では AI に経路(上界 Y)と双対解(下界 X)の両方を出力させることで、答えを「X ≤ 最適値 ≤ Y」と挟み込んで検証できる。さらに対話型証明系(Goldwasser+ STOC 1985)の技術を応用すると、IP = PSPACE・MIP = NEXPTIME の範囲まで能力の低い人間(検証者)が確信を持って検証可能となる。
### 検証そのものが知的チャレンジへ
探索が AI にオフロードされると扱える問題の難易度が上がり、検証作業が人間の知力のボトルネックになる。検証作業自体が今後の知的フロンティアとなる。
## 関連ページ
- [[敵対的摂動]] — 記事の主題。人間非可知の分類手がかりとしての再解釈。
- [[帰属手法]] — AI の判断解釈手法。高次元均一信号では機能しない限界。
- [[AI検証可能性]] — 探索と検証の分業戦略。NP 完全性・対話型証明系との接続。
- [[機構的解釈性]] — 関連する AI 解釈性研究の方法論。
- [[佐藤竜馬]] — 著者。