未来の兆し:GPT-5.5
著者はGPT-5.5を先行体験し、特にコーディング、画像生成、統合アプリケーションにおいてAIの能力が大きく進歩したと評価する。モデル、アプリ、ツールの改善が進む一方、AIの「ギザギザしたフロンティア」は依然として存在し、特に長編創作において課題が残る。3D都市の進化シミュレーション、博士レベルの論文生成、ロールプレイングゲーム作成など、その能力を実例で示す。
私はGPT-5.5を先行体験し、これは大きな進歩だと考えています。それはAIの急速な改善がまだ終わっていないことを示しているからです。また、単純に優れているからでもあります。そして、これらすべてにもかかわらず、AI能力のフロンティアは依然としてギザギザしているからです。
AIが向上するにつれて、世代ごとの変化を素早く示すことが難しくなっています。かつてAIが苦手としていた数学や単語の文字数カウントなどは今や簡単だからです。そこで、複雑な詳細を説明する前に、わかりやすい例を挙げます。AIが最も得意とするのはコーディングなので、OpenAI初の推論モデルo3(1年1週間前リリース!)から現在最高のオープンウェイトモデルKimi K2.6、そして新しいGPT-5.5 Proまで、「紀元前3000年から紀元後3000年までの港町の進化をプロシージャルに生成する3Dシミュレーションを構築し、美しく、かつ制御可能にせよ」というコーディングチャレンジを与えました。
各AIの回答をギャラリーにまとめましたので、実際に試してみてください。GPT-5.5 Proだけが、時間とともに建物が置き換わるだけでなく、実際に進化する町をモデル化しました。また、GPT-5.5 Proは前世代よりも高速で、GPT-5.4 Proが33分かかったタスクを20分で完了しました。
モデル、アプリ、ハーネス
私はAIを単一のものではなく、3つの相互に関連する概念として考えることを推奨してきました。モデル(Opus 4.7、Gemini 3.1、そしてGPT-5.5)、アプリ(chatgpt.comやclaude.aiなどのウェブサイト、そしてClaude CodeやOpenAI Codexなどのデスクトップアプリ)、そしてハーネス(AIが使用するツールとその接続方法)です。OpenAIはこれら3つの分野すべてで進歩を遂げました。モデル面では、GPT-5.5は強力なファミリーであり、GPT-5.5 Proが最も有能です。アプリ面では、OpenAIのCodexがClaude Codeの優れた道を辿り、使いやすいデスクトップアプリになっています。ハーネス面では、新しい画像モデルが注目に値します。
この新しい画像モデルは高品質なテキストをレンダリングし、ほぼどんな画像でも生成できます。例えば、「飛行機の中でWiFiを使っているカワウソの写真」というオッターテストを実行し、さらにその学術論文のページを生成することも可能です。これらは数ヶ月前には不可能だったことであり、実用的でもあります。しかし、これは単なる一ツールであり、真の魔法はハーネス、アプリ、モデルを実際の問題に組み合わせたときに起こります。
統合的な応用
私は学者で、クラウドファンディングに関する何百もの匿名化データファイルを持っています。GPT-5.5搭載のCodexを使って、「データを整理し、興味深い仮説を生成し、洗練された方法で検定し、学術論文を書いてください」と依頼しました。結果は非常に印象的で、特にGPT-5.5 Proに論文をコメントさせ、その結果をCodexにフィードバックした後は、文献レビューも統計もすべて本物でした。しかし、専門家として見ると、仮説はあまり面白くなく、因果関係に関する標準的な懸念があります。要するに、これが2年目の博士課程の学生の成果であれば非常に満足したでしょう。たった4つのプロンプトで、テキストに一切触れることなくこれを実現しました。
また、Codexに完全に新しいテーブルトークロールプレイングゲームを作成させ、プレイヤーをシミュレートしてルールを改訂させました。AIは101ページのPDFを生成し、画像生成機能でイラストを付けました。内容は興味深く独創的ですが、細かく見るとAI能力のギザギザしたフロンティアが完全には消えていないことがわかります。長編創作は依然として苦手で、「天気と建築は異なる速度の同じ議論」といった奇妙な比喩や、過度に装飾された文、均一な口調の会話が見られます。
GPT-5.5は、モデルがより賢くなり、アプリがより有能になり、ハーネスがより良くなっていることを示しています。4つのプロンプトで博士論文に近い品質の論文が得られ、1つのプロンプトでプレイ可能なロールプレイングゲームが得られます。しかし、フィクションは依然として平坦で、仮説は統計が正しくとも面白くないことがあります。それでも、1年前にはこれらのどれも不可能でした。最新リリースにより、能力向上は加速しているように見えます。
GPT-5.5は明らかにこのプロセスの終着点ではなく、注目すべき一歩です。3年以上このニュースレターを書き続けていますが、パターンは変わっていません。数ヶ月ごとに新しいモデルが登場し、不可能だったことが容易になり、飛躍の規模は大きくなっています。ギザギザしたフロンティアは依然として存在します。ただ、以前よりずっと遠くにあるだけです。