身体化認知とエージェンティックAI
この記事は、知能は脳だけに存在するのではなく、道具や環境にも拡張される身体化されたものであると論じています。ChatGPTの成功においてチャットインターフェースが重要な役割を果たしたことを強調し、AIに道具を使用し計画を立てる能力を与えるエージェンティックAIがその能力を大幅に拡張すると紹介しています。著者は純粋な推論への過度な依存(シンキズム)を批判し、現実世界との相互作用を軽視したYoshua BengioのLaw Zeroプロジェクトを誤ったアプローチの例として挙げています。
記事インテリジェンス
要点
- 知能は身体化されており、環境、道具、言語に依存する。
- ChatGPTのブレークスルーは、言語モデルだけでなく、チャットインターフェースという身体化の形態にもあった。
- エージェンティックAIは、AIに道具を使い結果から学ぶ自律性を与え、人間が手や道具で知能を拡張する方法を模倣する。
- 純粋な思考だけでは現実問題を解決できず、AIは実験や相互作用を通じて現実世界と関わる必要がある。
重要な理由
このニュースが重要なのは、知能は身体化されており、環境、道具、言語に依存するためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
あなたの知能はどこにありますか?脳の中ですか?それは単純化しすぎた答えです。より良いモデルは、知能は身体化されているというものです。
高級レストランで働くシェフを考えてみてください。彼はお気に入りの包丁や調理手順をすべて、自分の望む場所に配置しています。彼のキッチンは彼の知能とスキルの一部です。同じシェフがあなたのキッチンで料理しても、あなたよりは上手にできるでしょうが、お気に入りのキッチンで作るのと同じ料理を再現することはできません。
私たちはしばしばコンピュータプログラマーをホワイトボードテストで評価しますが、これは不満の尽きない種です。プログラマーは、これが自分の得意分野から切り離すものであると正しく指摘します。彼らはラップトップを取り上げられると、単にできなくなるわけではありません。それは言い訳ではなく、実際の問題です。つまり、彼らの知能を構成する一部から切り離しているのです。
要約すると、知能を外界から隔離された脳内だけのものとするモデルは馬鹿げています。
身体化された知能の考えを受け入れるなら、私たちが知能の結果と見なす多くの行動は、実際には知能の一部です。まず第一に言語です。お互いに話したり書いたりする能力は、自分自身に制限されないことを意味します。小さな部族に孤立した人間が技術的進歩を遂げたという話を聞いたことがありますか?いいえ。進歩には多くの人々が一緒にコミュニケーションすることが必要です。数十年前までは、進歩には都市が必要でした。今日では、世界中の誰とでもどこからでもコミュニケーションできるようになったため、必ずしもそうとは言えません。しかし言語は依然として重要であり、それ以上に優れたものはまだ発明されていません。同様に、手を持ち、洗練された道具(ラップトップなど)を構築する能力は、私たちの知能を拡張することを可能にします。
2022年末、画期的な技術であるChatGPTが登場しました。これは、(大規模)言語モデルやニューラルネットワークなど、既存のいくつかのアイデアに基づいています。それが「GPT」の部分です。しかし、そのブレークスルーの重要な、そして過小評価されている部分は「Chat」コンポーネントでした。誰かが大規模言語モデルとチャットインターフェースを接続するアイデアを持ちました。このシステムを構築した人々にとっては自然で明白だったかもしれませんが、それが些細で重要でないと考えるべきではありません。
言語は私たちの知能の主要な構成要素であり、したがって機械知能にとっても極めて重要であることは理にかなっています。
私たちはAIソフトウェアをチャットボックスに身体化しました。
次のステップは、今日「エージェンティックAI」と呼ばれるものです。チャットボックスは維持しつつ、AIソフトウェアにツールと対話し、それらを使用する計画を立てる能力を追加します。事実上、AIにより多くの自律性を与えるのです。つまり、物事を行い、その結果から学習することができます。それは、手と道具を持つ人間に似てきています。
今週、同僚と話をしました。その同僚はAI革命に完全に没頭しています。彼はAIを使ってより速く、より良い文章を書き、データ分析をより速く完了させ、技術専門家の助けをあまり必要としなくなっています。
しかし、その同僚はエージェンティックAIのアプローチを知りませんでした。私は電話で説明しようとしました。AIにツールへのアクセスを与えるとはどういう意味でしょうか?それはAIの応答をコピー&ペーストする手間を省くだけのことでしょうか?
結局、私はRStudioと呼ばれるシェル内でAIを起動する動画を作りました。RStudioはRでプログラミングしデータ分析を行うための環境です。私はRもRStudioも使いませんが、AIのおかげで、ウェブからデータを取得する機能も含め、数分で完全な気候研究プロジェクトを構築できました。
AIはどのようにしたのでしょうか?私はそれを記録しました。最初はデータのダウンロードに苦労しながらいくつかの方法を試しました。ある時点で、新しいRパッケージが必要だと気づき、それをインストールし、インストールが完了すると図を生成し、それが機能することを確認しました。
エージェンティックAIは、AIの身体化を改善することで機械知能を大幅に拡張します。
これはまだ十分に理解されていないと私は信じています。
モントリオールでは、AI分野で最も確立された教授はYoshua Bengioです。彼は数年前に自身の重要な企業(Element AI)を立ち上げました。彼の最新のベンチャーはLaw Zeroで、科学者AIの作成を目指しています。このプロジェクトの最初の目標は、エージェンティックコンポーネントなしでAIを構築することです。それは、自身の目標を持たず、自律性も持たない、身体から切り離されたAIであるべきです。
私はBengioがKevin Kellyが「シンキズム」と呼んだものに罹っているのではないかと心配しています。Kellyの2008年のエッセイから引用します。
「どんなに超優秀な知能でも、世界中の既知の科学文献をすべて読んで熟考するだけで人間の体の仕組みを理解することはできません。どんな超AIも、現在および過去の核分裂実験について考えるだけで、短期間で実用的な核融合を思いつくことはできません。物事がどのように機能するかを知らない状態から知っている状態になるまでには、シンキズム以上のものが必要です。現実世界には無数の実験があり、それらは正しい作業仮説を形成するために必要な大量のデータを生み出します。潜在的なデータについて考えることは、正しいデータを生み出しません。思考は科学の一部に過ぎず、おそらく小さな部分でさえあります。(中略)シンキズムだけでは不十分です。実験を行い、プロトタイプを構築し、失敗を経験し、現実に関与しなければ、知能は考えを持つことはできても結果を出すことはできません。世界の問題を解決する方法を考えることはできません。(中略)シンギュラリティは幻想であり、常に後退し続け、常に「近い」が決して到来しません。AIを手に入れた後もなぜ来ないのか不思議に思うでしょう。そして将来のある日、それがすでに起こっていたことに気づくでしょう。超AIが来て、私たちがそれが即座にもたらすと思っていたもの — 個人向けナノテクノロジー、脳のアップグレード、不死 — は来ませんでした。代わりに、予期せず、評価に時間がかかる別の利益がもたらされました。それらが来るのを見ていなかったため、振り返って「そう、あれがシンギュラリティだった」と言うのです。」
大学教授は特にシンキズムに陥りやすいと私は信じています。彼らは知能を自分の脳内で起こっていることに中心があると見なします。象牙の塔に住んでいると、現実世界を知能の核となる源泉として軽視しがちです。さらに、彼らはシンキズムが自然に蔓延する学校で優秀だった人々であることが多いのです。
私は人生の大半を教授として過ごしてきました。しかし、他の教授と話すのはすぐに飽きます。私が最も楽しむのは、現実世界で新しいツールを適用する人々と働くことです。驚くことではありませんが、私は現実に展開されているソフトウェアにほとんどの時間を費やしてきました。
Kellyが言っているのは、高度な知能だけでは何かを成し遂げるのに十分ではないということです。現実世界は思考プロセスの最終段階ではありません。おそらくその最も重要な部分なのです。
そして、AIを現実世界に接続し、実験を実行する能力(今日のソフトウェア開発者のほぼ全員が行っていること)を与えると、AIソフトウェア単独では達成できない印象的な結果が得られます。
自律性は機能ではありません。自律性は基本です。