2026年のAI:半年間の騒音と方向転換
2026年1月から6月にかけてのAI業界の動きを総括。新モデルの発表、チャットボットからエージェントへのシフト、トークン課金によるコスト問題、業界への一時停止呼びかけなどを解説。
2026年1月から6月までのAIニュースを振り返ると、あらゆる方向に事態が進み、革新は多いものの制御は不十分だったという印象が強い。ほぼ毎週、新しいモデルが「すべてを変える」と約束して登場した。GPT、Claude、先週まで誰も知らなかったベンチマークで全員を打ち負かす中国のモデル、かつてないレベルの動画生成。
そして今週、誰もが予想していたが誰も聞きたくなかったことがついに起こった。AI競争の先頭を走る2社が減速、さらには一時停止について話し始めたのだ。
実際に何が起こったのか、一歩立ち止まって見てみよう。
2026年1月から6月の実際の出来事
ノイズを排除し、実際に重要だった出来事を時系列で挙げる。
- 1月下旬: MoonshotがKimi K2.5をリリース。オープンウェイトのマルチモーダルモデルで、最大100のサブエージェントを調整できる「Agent Swarm」を搭載。一方、2025年12月にリリースされたGPT-5.2は、依然として新モデルの測定基準の1つだった。
- 2月5日: AnthropicがClaude Opus 4.6をリリース。数日後にはClaude Sonnet 4.6も。
- 2月中旬: GoogleがGemini 3.1 Proを発表。推論、コーディング、長時間タスクに強いモデルへの取り組みを強化。
- 2月下旬: PerplexityがComputerを発表。タスクを複数の専門モデルに分割し、外部アプリに接続するエージェントシステム。
- 2月27日: ロイター通信によると、ドナルド・トランプ氏が米国連邦政府機関でのAnthropic技術の段階的廃止を命令。軍事利用をめぐる紛争が原因。国防総省はAnthropicを「サプライチェーンリスク」と指定。パニックが広がるが、Anthropicは立場を堅持し賞賛を集める。ビジネスの世界では誰かが常に隙間を埋めるもので、OpenAIはすぐに国防総省との契約を発表。
- 3月5日: OpenAIがGPT-5.4をリリース。ネイティブのコンピュータ制御、API経由で最大100万トークンのコンテキストウィンドウ(標準は27万2000トークン)、Codexの機能を1つのモデルに統合。真のニュースはコンテキストウィンドウの大きさだけではない。モデルが独自にブラウザとデスクトップ環境を操作できる。これは「答えるチャットボット」から「実際に行動するエージェント」への転換点。OpenAIはGPT-5.2と比較して幻覚が33%減少したと報告。
- 4月2日: GoogleがGemma 4を発表。Apache 2.0ライセンスの新しいオープンモデルファミリーで、高度な推論、エージェント、自前のハードウェアでの実行に最適化。
- 4月16日: AnthropicがClaude Opus 4.7をリリース。新しいトークナイザにより、同じテキストで最大35%(コンテンツに応じて1.0~1.35倍)多くのトークンを生成。
- 4月20日: MoonshotがKimi K2.6をリリース。コンテキストウィンドウ25万6000トークン、Agent Swarmは最大300のサブエージェントを調整可能。
- 4月23日~24日: OpenAIがGPT-5.5を導入。ほぼ同時にDeepSeekがDeepSeek V4で反撃:1.6兆パラメータのPro版、オープンソースのFlash版、100万トークンのコンテキストウィンドウ。
- 5月19日: Google I/Oで、GoogleがGemini 3.5 Flash、Gemini Spark、Gemini Omni、Antigravity 2.0を発表。方向性は明瞭:チャットボットは減り、エージェントが増える。新しいAntigravityインターフェースはGoogleのビジョンを示している。
- 5月28日: AnthropicがClaude Opus 4.8をリリース。Opusラインとしては異例の迅速なアップデート。Dynamic Workflowsなどを搭載。Anthropicはコード作業において4.7より賢く正直だと主張。Effort ControlとFast Modeオプションも登場。
- 6月1日: MiniMaxがMiniMax M3をリリース。オープンウェイトのマルチモーダルモデルで、コンテキストウィンドウは最大100万トークン。コーディング、エージェント、長時間タスクに重点。ClaudeやGPTの安価な代替品としての地位確立を目指す。
- 6月1日: GitHub Copilotが課金モデルを変更。プレミアムリクエストを廃止し、GitHub AI Creditsを通じて消費トークン数と使用モデルに基づいて課金。基本機能は引き続き含まれ、各プランに月額クレジットが付与されるが、最も強力なモデルとエージェントはクレジットを急速に消費。一部のユーザーは数時間または数日でクレジットを使い果たし、同じ使用ペースを維持するには数百ドルかかると試算。
間近に迫る:2026年8月2日、欧州AI法の大部分が施行(ただし例外や調整あり、特に高リスクシステム)。
このリストだけを見ると競争のように見える。確かにそうだ。しかしマーケティングの裏で、真の変化が起きている。チャットボットだけでなく、ますますエージェントについて語るようになった。それは単なるスローガンではなく、急速に定着した現実だ。今や以下のものがある:コンピュータを使うモデル、異なるツールを調整するモデル、長期間にわたりユーザーが一歩一歩ガイドしなくても作業できるモデル、一回限りの質問に答えるだけでなくコードベース全体を移動できるモデル。GPT-5.4とそのコンピュータ使用、PerplexityのComputer、Kimiの群れ、GoogleのAntigravity、コーディングと長時間作業にますます特化するClaude。
現実の世界では?時には結果は本当に印象的で、かなり単純なデモでも驚くことができる。しかし、これらのツールを実際のプロジェクトに投入すると、技術負債、不完全なコンテキスト、検証されていない決定、そして誰も触りたくないコードに直面する。エージェントもまた、独自の技術負債を積み上げ、部分的なコンテキストに基づいて呼び出しを行い、誰もレビューしていないソリューションを出荷する可能性がある。おそらく、もう少し考え、リクエストをより適切に組み立て、より鮮明な指示を書き、各エージェントの役割と制限をより明確に定義する必要があったのだ。
しかし、明らかになったことがある:エージェント、MCP、自動化のおかげで、AIはより速く構築し、特定のトピックをより深く掘り下げ、インターネットのどこかにすでに存在していたアイデアを表面化させ、前進する助けとなる。しかし、人間の貢献は依然としてユニークで、本物で、一層価値がある。
方向性は明らかだ。「答えるアシスタント」や、片隅で好き勝手するエージェントだけでなく、私たちと対話し、タスクや間違いを記憶し、私たちの仕事やプロジェクトを改善しようとするシステムへと向かっている。
しかし、その代償は?GitHub Copilotのビジネスモデル変更は、AI競争の別の側面を示している:モデルとエージェントは膨大なリソースを消費するため、コストが高い。言い換えれば、一部のサービスでは食べ放題プランが消え始めている。AIシステムは単一のリクエストを発して回答を返すだけではない。ファイルを読み、コンテキストを渡し、ツールを呼び出し、コードを生成し、テストを実行し、エラーを分析し、再試行する。そして各ステップでトークンを消費する。これらすべてが月額サブスクリプションに含まれている間は、基本的に無制限であるかのようにツールを使用するのは簡単だった。しかし、課金が使用量に直接依存するようになると、認識が変わる。タスクを開始する前に二度考えるようになる。突然、どのモデルが最も賢いか、どのモデルが最もコードを書くかだけでなく、コスト、タスク完了までに消費するトークン数、そのコストがプロジェクトで実際に報われるかどうかを問わなければならなくなる。GitHub Copilotは、高度なAI利用における無制限プランの終わりの始まりを示しているかもしれない。
2026年半ばの転換点:冷静を求める声
ここからが興味深い。Anthropicは現在、協調した一時停止を呼びかけている。自社だけに課す一時停止ではなく、業界全体で調整されたものだ。主張は、モデルが間もなく再帰的自己改善の段階に近づいている可能性があるというものだ:人間の関与がますます少なくなりながら、システムが他のシステムを改善できるようになる。そこに到達する前に、真の制御、安全性、検証のメカニズムを持つ方が良い。これはAnthropicが常に推してきたメッセージと一致する。しかし正直に言うと、全容を語らなければならない。一部の人々はこの要請を利己的な動きと見なす。Anthropicは依然として競争に参加し、新モデルを出荷し、評価額を上昇させている。ロイター通信によると、同社は今年、特に危険な能力レベルに達した場合に特定のトレーニング実行を停止するという、より明確な内部コミットメントを放棄したとして批判も受けている。言い換えれば、Anthropicは自らに余裕を与えた直後に、皆に減速を求めている。結論はご自身でお出しください。
OpenAI側では、Sam Altmanもトーンをかなり和らげている。1年前、彼はAIがジュニアオフィスジョブの一部を一掃すると警告した。今では自分が「かなり間違っていた」と認めている。影響は彼の予測よりもはるかに小さかった。彼だけではない。オフィスジョブの半分を排除するとまで言っていたDario Amodeiも、現在は自動化が人々の能力を拡張する可能性があると述べている。
したがって、定着しつつある考え方は単に「AIがあなたの仕事を奪う」ではなく、より不快だがおそらくより現実的な「AIはあなたの仕事のどの部分に価値があるかを変える」というものだ。それは同じことではない。
私がこの半年間から学んだこと
モデルを出荷する狂気の競争と、同じ人々が今減速を語ることの間のコントラストは、私たちの現状を物語っている。一方で、誰も遅れを取りたくない。他方で、もはや単にメールをより速く書くための新しいツールについて話しているのではないことが明らかになっている。ソフトウェアを作成、修正、監査し始めているモデルについて、さらにはシステム、意思決定、ワークフロー、会計、企業運営、規制にまで踏み込むモデルについて話しているのだ。
そのような文脈では、その瞬間のベンチマークだけでは十分ではない。出荷されるすべてがニュースではない。「ベンチマークYでXを超える」すべてが実際のプロジェクトで通用するわけではない。デモで革新的に見えるすべてが開発者の日常を変えるわけではない。
したがって、私はこれらすべてを引き続き注視するが、フィルターをかける。本当に重要だと私が感じるビッグモデルと新規プレイヤーについて、可能な限りテストし、ハイプを売り込むことなく公開する。2026年前半がこれほど hectic だったなら、後半も同様に約束されている。特にエネルギー消費、トークン価格設定、無制限プランの終了の可能性について。注意深く見守る必要がある。