2026-05-20 01:45 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

I/O 2026：歡迎進入智慧體Gemini時代

在Google I/O 2026上，CEO Sundar Pichai宣佈了多項AI進展，包括全新模型Gemini Omni、更快的Gemini 3.5 Flash、Ask YouTube、Docs Live等功能，以及TPU第八代晶片和SynthID水印的行業合作。

來源Google AI Blog

Google I/O 2026大會於今日舉行，CEO Sundar Pichai發表了主題演講，介紹了公司在AI領域的最新突破。Pichai強調，過去一年是“不斷髮布、技術進步和超高速發展”的時期，AI正在融入使用者日常使用的產品中。

Gemini模型是本次大會的核心。Pichai宣佈了Gemini Omni，這是一個能夠從任何輸入（文本、影像、影片等）生成任何輸出格式（目前以影片為主，未來將包括影像和文本）的模型。這是Gemini智慧與生成式媒體模型的融合，被認為是世界理解的一大飛躍。首款Omni系列模型Gemini Omni Flash即日起在Gemini應用、Google Flow和YouTube Shorts中可用，並將在未來幾周內向開發者和企業開放API。

另一重要釋出是Gemini 3.5 Flash，該模型在幾乎所有基準測試上都優於之前的3.1 Pro，特別是在編碼和GDPVal（衡量經濟價值任務的指標）上取得了巨大進步。它的輸出速度比其他前沿模型快4倍，同時成本不到後者的一半。Pichai舉例稱，如果企業將80%的工作負載從其他前沿模型轉移到3.5 Flash，每年可節省超過10億美元。

在產品方面，YouTube推出了“Ask YouTube”功能，使用者可以用自然語言提問，系統會直接跳轉到相關影片的相關段落。Docs Live則允許使用者透過語音“腦暴”，由Gemini自動生成文件，未來還將支援語音編輯。這些功能將陸續在夏季向訂閱使用者推出。

基礎設施方面，Google宣佈了第八代TPU晶片：TPU 8t用於訓練，效能是前代的3倍；TPU 8i用於推理，大幅降低延遲。兩者能效提升2倍。訓練現已可跨100多萬個TPU分散式進行，使大規模模型訓練從數月縮短至數週。

在AI透明度方面，SynthID水印已標記超過1000億張圖片和影片，以及6萬年的音訊資產。Google將把內容憑證和SynthID驗證擴充套件到搜尋和Chrome。OpenAI、Kakao和Eleven Labs也加入了SynthID合作，共同推動行業標準。

Pichai總結道，AI的採用正在以指數級增長：每月處理超過3.2千萬億個token，模型API每分鐘處理190億個token，超過850萬開發者每月使用Gemini模型。Google將繼續以全棧方式推進AI創新，從定製晶片到平臺產品，覆蓋數十億使用者。