## Memo - [AIの第一人者ルカン氏、現在のアプローチの多くは真の知能につながらないと批判 - CNET Japan](https://japan.cnet.com/article/35193720/) ## Abstract 機械はどのようにして人間や動物と同じように効率よく学習することができるのだろうか?機械はどのようにして推論と計画を学ぶことができるのだろうか?機械はどのようにして、知覚と行動計画の表現を複数の抽象レベルで学習し、複数の時間軸で推論、予測、計画することができるようになるのだろうか?本論文では、自律型知的エージェントを構築するためのアーキテクチャとトレーニングパラダイムを提案する。本論文では、設定可能な予測世界モデル、内発的動機付けによる行動、自己教師付き学習による階層的結合埋め込みアーキテクチャなどの概念を組み合わせている。 ## 1 Prologue この文書は、伝統的な意味での技術論文でも学術論文でもなく、動物や人間のように学習し、推論や計画ができ、ハードウエア化されたプログラムや外部の監督、外部の報酬ではなく、内在する目的によって行動を起こす知的機械への道についての私のビジョンを表現したポジションペーパーである。この論文で述べられている多くのアイデア(ほとんどすべて)は、多くの著者によって様々な文脈で様々な形で定式化されている。本論文は、これらのアイデアのどれが優先されるかを主張するものではなく、それらをいかにして一貫した全体像に組み立てるかについての提案を行うものである。特に、今後の課題を挙げている。また、成功する可能性のある道、あるいは成功しない可能性のある道をいくつか挙げている。 また、機械学習やロボット工学などの工学分野だけでなく、神経科学、認知科学、哲学など、幅広い分野の読者に読んでいただけるよう、専門用語をできるだけ使わず、数学的な予備知識もできるだけ少なく書いています。本書が、関連性が見えにくいAIの研究の文脈を理解する一助となれば幸いである。 ## 2 Introduction 動物や人間は、現在のAIや[[機械学習]](ML)システムの能力をはるかに超えた学習能力や世界の理解力を発揮しています。 思春期の子供が20時間程度の練習で車の運転を習得し、子供がわずかな露出で言語を習得することができるのはなぜか。ほとんどの人間が、遭遇したことのない多くの状況下でどのように行動すべきかを知ることができるのはなぜだろうか。これに対し、現在の学習システムは、非常に多くの試行錯誤を経て、たとえ稀な状況の組み合わせであっても、学習中に頻繁に遭遇するような信頼性の高い学習が必要とされています。しかし、人間の専門家から膨大な量の監視データを与えられ、仮想環境で何百万回もの強化学習実験を行い、エンジニアが何百もの動作をシステムに組み込んだとしても、運転などの実世界のタスクにおける人間の信頼性にはまだ遠く及ばないのです。 その答えは、人間や多くの動物が持つ世界モデル、つまり世界がどのように機能しているかの内部モデルを学習する能力にあるのかもしれない。 現在、AI研究が取り組むべき主な課題は3つあります。 1. 機械はどのようにして世界を表現することを学び、予測することを学び、主に観察によって行動することを学ぶことができるのか? 現実世界での相互作用は高価で危険である。知的エージェントは、相互作用なしに(観察によって)世界についてできる限り多くを学び、特定のタスクを学ぶのに必要な高価で危険な試行回数を最小にする必要がある。 2. 機械はどのように推論し、勾配に基づく学習と両立する方法で計画を立てることができるか? 我々の最も優れた学習方法は、損失の勾配を推定し利用することに依存しているが、これは微分可能なアーキテクチャでのみ実行可能であり、論理ベースの記号的推論と一致させることは困難である。 3. 知覚や行動計画を階層的、多段階、多時間スケールで表現することを機械はどのように学習するのか? 人間や多くの動物は、複雑な行動を低レベルの連続した行動に分解することで、長期的な予測や長期的な計画を行うことができる多階層の抽象化を考えることができる。 本論文では、これら3つの課題に対する解決策を備えた知的エージェントのアーキテクチャを提案する。 本論文の主な貢献は以下の通りである。 1. すべてのモジュールが微分可能で、その多くが訓練可能な全体的な認知アーキテクチャ(第3節、図2)。 2. JEPA と階層的 JEPA: 表現の階層を学習する予測世界モジュー ルのための非再生的アーキテクチャ(第 4.4 節と第 4.6 節、図 12 と図 15)。 3. 非対称自己教師付き学習パラダイム:情報的かつ予測的な表現を同時に生成する(4.5節、図13)。 4. 不確実性の下での階層的計画のための予測世界モデルの基礎としてH-JEPAを使用する方法(4.7節、図16と17)。 せっかちな読者は、前述の節や図に直接ジャンプすることを好むかもしれない。