GPT-3からGemini 3へ:3年間のAI進化
著者は、3年前のChatGPTと現在のGemini 3を比較し、AIがチャットボットからエージェントへと進化したことを示す。Gemini 3はコーディング、ゲーム作成、博士レベルの研究を自律的に行い、「デジタル同僚」の時代の到来を告げている。
ChatGPTのリリースから約3年。3年前、AIはせいぜい首尾一貫した段落や、カワウソについての滑稽な詩を書く程度だった。しかし今日、GoogleのGemini 3はコードを書くだけでなく、完全にインタラクティブなゲームを自ら構築し、「キャンディ駆動の超光速宇宙船」をシミュレートする。これは単なるベンチマークの向上ではなく、AI能力の根本的な変革を示している。
Gemini 3の真の力は、標準的なベンチマークスコアだけではない。本記事で著者は、3年前の投稿のスクリーンショットをGemini 3に与え、「この投稿以来AIがどれだけ進歩したかを見せてくれ」と簡単にプロンプトした。するとGemini 3は即座に応答し、プレイ可能なゲームを作成した——これは説明から実装への飛躍である。3年前、AIはエンジンを説明できただけだが、今ではエンジンをコード化し、インターフェースを設計し、ユーザーが自ら宇宙船を操縦できるようにした。
さらに注目すべきは、Googleが同時にリリースしたエージェントツール「Antigravity」である。従来のチャットインターフェースとは異なり、Antigravityではユーザーが自然言語でタスクを割り当てると、AIが自律的にコンピュータにアクセスし、コードを書き、操作を実行し、必要に応じて承認を求める。例えば、著者はAIに自身のニュースレターの全ファイルが入ったフォルダへのアクセス権を与え、「すべての予測を魅力的にリストアップしたサイトを作成し、ウェブ検索で正誤を確認してほしい」と依頼した。AIはファイルの読み取り、サイトの構築、ブラウザでの動作確認を自律的に行い、そのプロセス全体はまるでチームメンバーを管理しているかのようだった。
コーディングとエージェント能力に加え、Gemini 3は真の判断力を要するタスクでも驚きを見せた。著者は10年前のクラウドファンディング研究で使用した混乱したデータファイルをGemini 3に与え、「データと構造を理解し、初期クリーニングを行い、新しい分析の準備をしてほしい」と指示した。AIは破損したデータを復元し、独自に仮説を生成し、統計テストを実行し、最終的に14ページの論文を作成した。特に印象的だったのは、AIが自然言語処理を用いてクラウドファンディングアイデアの独自性を測定する指標を自ら考案し、コードを書いて検証したことだ。
もちろん、Gemini 3は完璧ではない。博士レベルの研究タスクでは、優秀な大学院生のような長所と短所が見られた。アイデアは良いが、統計手法に改善の余地があり、証拠から飛躍した理論化もあった。しかし、より多くの指示を与えると劇的に改善した。これは「博士レベルの知能」がもはや遠い未来の話ではないことを示唆している。
結論として、3年前に機械が詩を書けることに驚いていたが、1000日足らずで、今や自ら研究環境を構築するエージェントと統計手法について議論している。チャットボットの時代はデジタル同僚の時代へと移行しつつあり、それは「人間がAIのミスを修正する」から「人間がAIの作業を指示する」への変化であり、ChatGPTのリリース以来最大の変革かもしれない。