在Pixel上透過凍結的多token預測加速Gemini Nano模型 2026-06-27 02:30 UTC+8 Google研究人員提出了一種方法,將多token預測(MTP)改造到已部署的Gemini Nano v3模型上,無需重新訓練主幹網路,從而在移動裝置上實現更快的推理速度和更低的能耗。該方法在Pixel 9和10系列上已部署,使AI通知摘要和校對等功能速度提升50%以上。
透過凍結的主幹網路和輕量級MTP頭部,實現了對現有模型的無縫加速,避免了單獨草稿模型的記憶體開銷。 零複製架構讓MTP頭部直接利用主模型的KV快取,減少了130MB記憶體佔用,並消除了草稿預填充延遲。 最佳化雲經濟:線性彈性快取技術 2026-06-25 18:03 UTC+8 谷歌研究人員提出線性彈性快取,將快取管理建模為滑雪租賃問題,透過輕量級機器學習動態調整快取大小,在Spanner生產環境中降低了15.5%記憶體使用和約5%總擁有成本,同時快取未命中僅增加5.5%,且對I/O成本影響極小。
線性彈性快取將記憶體成本視為連續變數,動態調整快取大小,而非固定分配。 基於滑雪租賃問題,為每個資料項決定“租用”記憶體或“購買”未命中代價。 思考即回憶:推理如何解鎖大語言模型中的引數化知識 2026-06-25 00:51 UTC+8 Google Research 的研究揭示了一個反直覺的現象:即使對於簡單的事實性問題,讓大語言模型生成推理鏈也能提高答案的準確性。研究發現兩種機制:計算緩衝(生成額外標記用於潛在計算)和事實啟動(生成相關事實以幫助召回正確答案)。
推理幫助模型召回原本無法獲取的簡單事實,即使無需逐步推理。 機制一:計算緩衝——生成無意義的推理標記也提供額外計算,提升召回。 AI如何幫助使用者理解皮膚狀況的研究 2026-06-13 01:52 UTC+8 谷歌研究團隊釋出了兩項關於皮膚病AI工具的研究。大型調查顯示,AI輔助使使用者命名皮膚狀況的準確率提高了近三倍,但在決定下一步行動方面仍有挑戰。社群定性研究表明,該應用有助於使用者和臨床醫生溝通,92%的臨床醫生認為其有幫助。
AI輔助使命名準確率從8%提高到23%,提升近三倍。 在決定下一步醫療行動(如家庭療法還是就醫)方面,AI未帶來顯著改善。 機器學習遺忘審計新框架 2026-06-11 01:34 UTC+8 Google研究人員提出正則化f-散度核檢驗框架,用於審計機器學習模型的遺忘和隱私保護。該框架自適應選擇最優散度度量,能夠更敏感地檢測資料洩露和遺忘失敗,且所需樣本更少,調參更少。
傳統雙樣本檢驗在大規模模型中失效,新框架更靈敏且自適應。 利用f-散度(卡方、KL、曲棍球棒)檢測全域性和區域性資料偏移。 藉助 Gemini Enterprise Agent Platform 的智慧體 RAG 解鎖可靠回答 2026-06-05 19:26 UTC+8 Google Research 與 Google Cloud 合作推出智慧體 RAG 框架,透過多智慧體工作流將複雜企業查詢分解,迭代搜尋足夠上下文後生成可靠回答。相比標準 RAG,準確性提升高達 34%。
多智慧體 RAG 透過規劃、重寫和路由分解複雜查詢 Sufficient Context Agent 確保持續搜尋直到上下文完整 透過智慧手機攝像頭實現被動心臟健康監測 2026-06-05 03:47 UTC+8 谷歌研究人員開發了一種名為PHRM的系統,可在日常使用智慧手機時,透過前置攝像頭被動測量心率和靜息心率。這項發表於《自然》雜誌的研究顯示,該系統的心率測量平均絕對百分比誤差(MAPE)低於10%(與心電圖相比),每日靜息心率測量平均絕對誤差(MAE)低於5次/分鐘(與可穿戴裝置相比)。系統在來自近700名參與者的超過35萬段影片片段上進行了訓練,確保膚色均衡代表性。PHRM優於15種領先的遠端光電容積描記法(rPPG)模型,是唯一在真實世界條件下對所有膚色均達到準確性標準的模型。
谷歌的PHRM系統利用智慧手機前置攝像頭,在面部解鎖後被動監測心率和靜息心率。 在《自然》研究中,PHRM的心率MAPE<10%(vs. ECG),每日靜息心率MAE<5 bpm(vs. 可穿戴裝置),適用於所有膚色。 創新新時代:Google Research在I/O 2026的展示 2026-05-29 04:58 UTC+8 在2026年Google I/O大會上,Google Research展示了一系列前沿技術,涵蓋科學發現、健康、邊緣計算和天氣預測等領域。推出了Gemini for Science套件(包括ERA和Co-Scientist),加速科學研究;健康方面有Google Health應用、Symptom AI和AMIE系統;Coral NPU推動邊緣AI發展;還有極端天氣預測模型。這些創新展示了AI如何放大人類的智慧。
Google釋出Gemini for Science,內含ERA和Co-Scientist,加速科學發現。 健康領域推出Google Health應用、Symptom AI和AMIE,提升醫療服務質量。 實證研究助手(ERA):從《自然》論文到推動計算發現 2026-05-20 01:52 UTC+8 谷歌開發的實證研究助手(ERA)利用Gemini編寫和最佳化科學程式碼,今日在《自然》雜誌上發表,並透過Google Labs的受信任測試計劃推出了計算發現原型。ERA在基因組學、流行病學等多個基準測試中達到專家級表現,並在預測、二氧化碳監測等領域帶來實際應用。
ERA是一種AI工具,利用Gemini為科學家編寫和最佳化程式碼,解決實驗中反覆測試的難題。 在《自然》雜誌發表的論文中,ERA在多個科學領域的基準測試中達到專家級效能。 透過全球合作與開放資源催化科學影響力 2026-05-02 00:37 UTC+8 Google Research 秉持開放科學原則,透過開源軟體和開放資料集,與全球科研社群合作,推動基因組學、神經科學、氣候、生物多樣性、醫療等領域的突破性發現。文章詳細介紹了多個工具(如DeepVariant、Neuroglancer、Open Buildings、SpeciesNet、HAI-DEF)及其實際應用案例,展示了開放科學如何賦能全球研究人員併產生積極社會影響。
Google Research 透過與全球多家機構合作,釋放開放科學的力量。 開源工具和資料集已賦能超過25萬研究人員,涵蓋基因組學、神經科學、氣候、生物多樣性和醫療健康。 谷歌研究科學家使用實證研究輔助的四種方式 2026-04-30 05:07 UTC+8 自2025年秋季引入實證研究輔助(ERA)以來,谷歌研究科學家已將其應用於流行病學、宇宙學、大氣監測和神經科學等領域的實際場景,展示了AI加速科學發現的變革能力。
ERA在流感、COVID-19和RSV住院預測中達到或超過CDC工具的準確性。 ERA結合Gemini Deep Think解決了宇宙弦引力輻射的未解問題。 關鍵在於角度:重新構圖你的照片 2026-04-23 01:00 UTC+8 Google Photos 的 Auto frame 功能利用機器學習模型將照片視為 3D 場景,自動調整相機視角,生成全新的照片。該方法分為 3D 場景估計和生成式修補兩個階段,能夠修復透視畸變,改善肖像照片。
Google Photos 推出 Auto frame 功能,利用 AI 自動重新構圖照片。 該技術將 2D 照片解釋為 3D 場景,調整相機角度以生成新視角。 ReasoningBank:讓智慧體從經驗中學習 2026-04-22 00:42 UTC+8 Google Cloud的研究人員提出了ReasoningBank,一種新型智慧體記憶框架,能從成功和失敗經驗中提煉可推廣的推理策略,顯著提升智慧體在複雜任務中的表現和效率。
ReasoningBank從成功和失敗經驗中提取結構化記憶,包含標題、描述和內容。 透過記憶感知測試時擴充套件(MaTTS),進一步利用並行和順序擴充套件提升效能。 為現實世界設計合成資料集:從第一性原理出發的機制設計與推理 2026-04-16 22:41 UTC+8 谷歌推出Simula框架,將合成資料生成重新定義為資料集層面的機制設計。透過從第一性原理出發的推理式方法,Simula實現了對資料覆蓋度、複雜度和質量的精細控制,適用於隱私敏感或資料稀缺的專門領域。
Simula將合成資料生成視為資料集層面的機制設計問題。 框架將生成過程分解為四個可控軸:全域性多樣化、區域性多樣化、複雜化和質量檢查。 AI生成的合成神經元加速大腦圖譜繪製 2026-04-16 20:18 UTC+8 谷歌研究團隊開發了MoGen模型,利用AI生成合成神經元形態,用於訓練腦圖譜重建模型,使重建錯誤率降低4.4%。在完整小鼠大腦尺度上,這相當於節省157人年的人工校對工作。該成果為加速大規模腦連線組學專案提供了新工具。
MoGen模型透過點雲流匹配生成逼真的3D神經元形狀,用於增強訓練資料。 將10%的合成資料加入PATHFINDER模型訓練,減少了4.4%的重建錯誤,主要降低了合併錯誤率。 利用生成式AI培養面向未來的技能 2026-04-14 02:15 UTC+8 谷歌研究與紐約大學合作開發了Vantage,這是一個利用生成式AI評估團隊合作和批判性思維等面向未來技能的系統。該系統透過AI化身模擬對話,由執行LLM動態引導,評估結果與人類專家高度一致。目前Vantage已在Google Labs開放註冊。
Vantage使用生成式AI建立模擬環境,評估學生面向未來的技能。 執行LLM驅動AI化身,在對話中引入特定挑戰以收集技能證據。 ConvApparel:衡量並彌合使用者模擬器中的真實感差距 2026-04-09 19:22 UTC+8 谷歌研究院釋出ConvApparel資料集和評估框架,用於量化LLM使用者模擬器的真實感差距,並訓練更魯棒的對話代理。透過雙代理資料收集和三支柱驗證,研究發現資料驅動模擬器優於提示基礎,但真實感差距依然存在。
ConvApparel包含4000多人機對話,透過“好”與“壞”兩種代理採集資料。 評估框架包括人口統計對齊、人類相似度評分和反事實驗證三支柱。 改善學術工作流程:引入兩個AI代理以改進圖表製作和同行評審 2026-04-09 04:01 UTC+8 Google Cloud 的研究團隊推出了兩個創新的 AI 代理:PaperVizAgent 用於自動生成高質量的學術圖表,ScholarPeer 用於自動進行嚴格的學術論文評審。這兩個系統透過多代理協作和迭代最佳化,在各自任務上顯著超越了現有基線,為科學研究流程帶來了實質性改進。
PaperVizAgent 是一個多代理框架,能夠從學術文本自動生成出版就緒的圖表,包括方法論示意圖和統計圖。 ScholarPeer 模擬高階研究員的評審流程,透過上下文獲取和主動驗證生成深入、基於文獻的評審意見。 評估大語言模型行為傾向的對齊性 2026-04-03 16:00 UTC+8 谷歌研究團隊提出了一種系統評估框架,將心理學問卷轉化為情境判斷測試,量化LLM行為傾向與人類共識的對齊程度。對25個模型的測試發現,模型在高共識場景下存在偏差,且在低共識場景中過度自信,未能反映人類觀點的多樣性。
新框架將心理學問卷轉化為情境判斷測試,評估LLM在現實場景中的行為傾向。 25個模型在人類高共識場景中表現良好,但在共識較低時過度自信且方向不一。