I/O 2026:歡迎進入智慧體Gemini時代
在Google I/O 2026上,CEO Sundar Pichai宣佈了多項AI進展,包括全新模型Gemini Omni、更快的Gemini 3.5 Flash、Ask YouTube、Docs Live等功能,以及TPU第八代晶片和SynthID水印的行業合作。
Google I/O 2026大會於今日舉行,CEO Sundar Pichai發表了主題演講,介紹了公司在AI領域的最新突破。Pichai強調,過去一年是“不斷髮布、技術進步和超高速發展”的時期,AI正在融入使用者日常使用的產品中。
Gemini模型是本次大會的核心。Pichai宣佈了Gemini Omni,這是一個能夠從任何輸入(文本、影像、影片等)生成任何輸出格式(目前以影片為主,未來將包括影像和文本)的模型。這是Gemini智慧與生成式媒體模型的融合,被認為是世界理解的一大飛躍。首款Omni系列模型Gemini Omni Flash即日起在Gemini應用、Google Flow和YouTube Shorts中可用,並將在未來幾周內向開發者和企業開放API。
另一重要釋出是Gemini 3.5 Flash,該模型在幾乎所有基準測試上都優於之前的3.1 Pro,特別是在編碼和GDPVal(衡量經濟價值任務的指標)上取得了巨大進步。它的輸出速度比其他前沿模型快4倍,同時成本不到後者的一半。Pichai舉例稱,如果企業將80%的工作負載從其他前沿模型轉移到3.5 Flash,每年可節省超過10億美元。
在產品方面,YouTube推出了“Ask YouTube”功能,使用者可以用自然語言提問,系統會直接跳轉到相關影片的相關段落。Docs Live則允許使用者透過語音“腦暴”,由Gemini自動生成文件,未來還將支援語音編輯。這些功能將陸續在夏季向訂閱使用者推出。
基礎設施方面,Google宣佈了第八代TPU晶片:TPU 8t用於訓練,效能是前代的3倍;TPU 8i用於推理,大幅降低延遲。兩者能效提升2倍。訓練現已可跨100多萬個TPU分散式進行,使大規模模型訓練從數月縮短至數週。
在AI透明度方面,SynthID水印已標記超過1000億張圖片和影片,以及6萬年的音訊資產。Google將把內容憑證和SynthID驗證擴充套件到搜尋和Chrome。OpenAI、Kakao和Eleven Labs也加入了SynthID合作,共同推動行業標準。
Pichai總結道,AI的採用正在以指數級增長:每月處理超過3.2千萬億個token,模型API每分鐘處理190億個token,超過850萬開發者每月使用Gemini模型。Google將繼續以全棧方式推進AI創新,從定製晶片到平臺產品,覆蓋數十億使用者。