關於接下來會發生什麼的一些想法,2026年5月
2026年AI領域將繼續快速發展,開源模型在智慧體能力上仍落後於閉源模型,谷歌的Gemini尚未對Claude Code和Codex構成有力競爭,美國開源模型正在崛起,Anthropic與OpenAI競爭激烈,現有權力結構開始介入AI發展。
文章情報
要點
- 開源模型在智慧體能力上落後閉源模型約12個月。
- 谷歌Gemini在智慧體工具方面無明顯競爭優勢。
- 美國開源模型(如Nemotron、Gemma)正迎頭趕上。
- Anthropic和OpenAI將展開殘酷競爭,推動AI應用兩極分化。
為什麼重要
這條新聞值得關注,因為開源模型在智慧體能力上落後閉源模型約12個月。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
隨著AI進步的步伐逐年加快,其帶來的影響也逐漸顯現。模型能力日益增強,我們的工作方式快速變化,AI的經濟效應變得真實,同時現實世界的風險也日益突出。2026年將是第一個我認為不會有任何喘息機會的年份。需要警惕的是,情況很可能只會愈演愈烈——更多的顛覆、更多的驚喜、更高的風險。
本文討論了幾個關鍵趨勢。首先,開源模型尚未迎來像Opus 4.5那樣的智慧體時刻。2025年12月,Opus 4.5在Claude Code中的出色表現昭示了閉源模型在智慧體領域的領先地位,而以每月5美元的價格達到同等效能的開源模型尚未出現。我預計這個差距可能需要12個月甚至更久才能縮小。
其次,谷歌的Gemini在程式設計智慧體領域仍無法與Claude Code和Codex匹敵。儘管Gemini 3.5 Flash有所改進,但尚無法替代現有工作流程。這讓開源模型在自動化和低成本領域更具優勢,而像Claude Code和Codex這樣的工具正成為推動AI收入增長的主要動力。
第三,我預計今年不會出現開源版的Mythos。Mythos在軟體工程和網路安全領域是一個里程碑,但中國實驗室面臨資源限制,無法像美國大型實驗室那樣擴充套件訓練規模。美國公司(如谷歌、Meta、OpenAI、Anthropic)擁有的計算資源遠超任何中國實驗室。
第四,美國開源模型正在穩步發展。輝達的Nemotron、谷歌的Gemma等模型正在收復失地。Gemma 4採用了Apache 2.0許可證,效能與同等規模的Qwen 3.5/3.6相當或更優,正在重新吸引開發者。
第五,Anthropic和OpenAI將進入殘酷的迭代競爭。GPT 5.5和Codex App改變了工作方式,但Claude在寫作等任務上仍具優勢。AI正在推動企業走向兩個極端:大型公司利用資源保持前沿優勢,而像Interconnects這樣的小型公司則依靠智慧體細化並銷售專業知識。
第六,更多現有權力結構將介入AI領域。教宗釋出長文討論AI,中國限制頂尖AI研究人員流動,美國將Anthropic列為供應鏈風險。這些權力實體意識到影響AI的視窗期有限,可能引發更多控制權的衝突。
最後,技術與社會將更加緊密地交織。美國國內的反AI情緒正在成為發展的最大障礙。許多人反對建設資料中心,而科技行業未能給予他們足夠的發聲機會。這預示著一個充滿挑戰的年份,行業需要更多元的聲音和行動來避免社會衝突。我個人的選擇是致力於建立一個充滿活力的多元開源模型生態,並傳播清晰、無偏見的資訊。