Google Research Blog AI 新聞來源

公開文章 19採集文章 23可信度 92刷新頻率 30 分鐘

健康狀態健康來源類型研究原文權限 官方原文最近入庫 2026-06-26ID google-research-blog運行狀態 已啟用

Official research blog; confirm reuse terms before enabling full body display.

最新公開文章

在Pixel上透過凍結的多token預測加速Gemini Nano模型

2026-06-27 02:30 UTC+8

Google研究人員提出了一種方法，將多token預測（MTP）改造到已部署的Gemini Nano v3模型上，無需重新訓練主幹網路，從而在移動裝置上實現更快的推理速度和更低的能耗。該方法在Pixel 9和10系列上已部署，使AI通知摘要和校對等功能速度提升50%以上。

透過凍結的主幹網路和輕量級MTP頭部，實現了對現有模型的無縫加速，避免了單獨草稿模型的記憶體開銷。
零複製架構讓MTP頭部直接利用主模型的KV快取，減少了130MB記憶體佔用，並消除了草稿預填充延遲。

最佳化雲經濟：線性彈性快取技術

2026-06-25 18:03 UTC+8

谷歌研究人員提出線性彈性快取，將快取管理建模為滑雪租賃問題，透過輕量級機器學習動態調整快取大小，在Spanner生產環境中降低了15.5%記憶體使用和約5%總擁有成本，同時快取未命中僅增加5.5%，且對I/O成本影響極小。

線性彈性快取將記憶體成本視為連續變數，動態調整快取大小，而非固定分配。
基於滑雪租賃問題，為每個資料項決定“租用”記憶體或“購買”未命中代價。

思考即回憶：推理如何解鎖大語言模型中的引數化知識

2026-06-25 00:51 UTC+8

Google Research 的研究揭示了一個反直覺的現象：即使對於簡單的事實性問題，讓大語言模型生成推理鏈也能提高答案的準確性。研究發現兩種機制：計算緩衝（生成額外標記用於潛在計算）和事實啟動（生成相關事實以幫助召回正確答案）。

推理幫助模型召回原本無法獲取的簡單事實，即使無需逐步推理。
機制一：計算緩衝——生成無意義的推理標記也提供額外計算，提升召回。

AI如何幫助使用者理解皮膚狀況的研究

2026-06-13 01:52 UTC+8

谷歌研究團隊釋出了兩項關於皮膚病AI工具的研究。大型調查顯示，AI輔助使使用者命名皮膚狀況的準確率提高了近三倍，但在決定下一步行動方面仍有挑戰。社群定性研究表明，該應用有助於使用者和臨床醫生溝通，92%的臨床醫生認為其有幫助。

AI輔助使命名準確率從8%提高到23%，提升近三倍。
在決定下一步醫療行動（如家庭療法還是就醫）方面，AI未帶來顯著改善。

機器學習遺忘審計新框架

2026-06-11 01:34 UTC+8

Google研究人員提出正則化f-散度核檢驗框架，用於審計機器學習模型的遺忘和隱私保護。該框架自適應選擇最優散度度量，能夠更敏感地檢測資料洩露和遺忘失敗，且所需樣本更少，調參更少。

傳統雙樣本檢驗在大規模模型中失效，新框架更靈敏且自適應。
利用f-散度（卡方、KL、曲棍球棒）檢測全域性和區域性資料偏移。

藉助 Gemini Enterprise Agent Platform 的智慧體 RAG 解鎖可靠回答

2026-06-05 19:26 UTC+8

Google Research 與 Google Cloud 合作推出智慧體 RAG 框架，透過多智慧體工作流將複雜企業查詢分解，迭代搜尋足夠上下文後生成可靠回答。相比標準 RAG，準確性提升高達 34%。

多智慧體 RAG 透過規劃、重寫和路由分解複雜查詢
Sufficient Context Agent 確保持續搜尋直到上下文完整

谷歌研究人員開發了一種名為PHRM的系統，可在日常使用智慧手機時，透過前置攝像頭被動測量心率和靜息心率。這項發表於《自然》雜誌的研究顯示，該系統的心率測量平均絕對百分比誤差（MAPE）低於10%（與心電圖相比），每日靜息心率測量平均絕對誤差（MAE）低於5次/分鐘（與可穿戴裝置相比）。系統在來自近700名參與者的超過35萬段影片片段上進行了訓練，確保膚色均衡代表性。PHRM優於15種領先的遠端光電容積描記法（rPPG）模型，是唯一在真實世界條件下對所有膚色均達到準確性標準的模型。

谷歌的PHRM系統利用智慧手機前置攝像頭，在面部解鎖後被動監測心率和靜息心率。
在《自然》研究中，PHRM的心率MAPE<10%（vs. ECG），每日靜息心率MAE<5 bpm（vs. 可穿戴裝置），適用於所有膚色。

創新新時代：Google Research在I/O 2026的展示

2026-05-29 04:58 UTC+8

在2026年Google I/O大會上，Google Research展示了一系列前沿技術，涵蓋科學發現、健康、邊緣計算和天氣預測等領域。推出了Gemini for Science套件（包括ERA和Co-Scientist），加速科學研究；健康方面有Google Health應用、Symptom AI和AMIE系統；Coral NPU推動邊緣AI發展；還有極端天氣預測模型。這些創新展示了AI如何放大人類的智慧。

Google釋出Gemini for Science，內含ERA和Co-Scientist，加速科學發現。
健康領域推出Google Health應用、Symptom AI和AMIE，提升醫療服務質量。

實證研究助手（ERA）：從《自然》論文到推動計算發現

2026-05-20 01:52 UTC+8

谷歌開發的實證研究助手（ERA）利用Gemini編寫和最佳化科學程式碼，今日在《自然》雜誌上發表，並透過Google Labs的受信任測試計劃推出了計算發現原型。ERA在基因組學、流行病學等多個基準測試中達到專家級表現，並在預測、二氧化碳監測等領域帶來實際應用。

ERA是一種AI工具，利用Gemini為科學家編寫和最佳化程式碼，解決實驗中反覆測試的難題。
在《自然》雜誌發表的論文中，ERA在多個科學領域的基準測試中達到專家級效能。

透過全球合作與開放資源催化科學影響力

2026-05-02 00:37 UTC+8

Google Research 秉持開放科學原則，透過開源軟體和開放資料集，與全球科研社群合作，推動基因組學、神經科學、氣候、生物多樣性、醫療等領域的突破性發現。文章詳細介紹了多個工具（如DeepVariant、Neuroglancer、Open Buildings、SpeciesNet、HAI-DEF）及其實際應用案例，展示了開放科學如何賦能全球研究人員併產生積極社會影響。

Google Research 透過與全球多家機構合作，釋放開放科學的力量。
開源工具和資料集已賦能超過25萬研究人員，涵蓋基因組學、神經科學、氣候、生物多樣性和醫療健康。

谷歌研究科學家使用實證研究輔助的四種方式

2026-04-30 05:07 UTC+8

自2025年秋季引入實證研究輔助（ERA）以來，谷歌研究科學家已將其應用於流行病學、宇宙學、大氣監測和神經科學等領域的實際場景，展示了AI加速科學發現的變革能力。

ERA在流感、COVID-19和RSV住院預測中達到或超過CDC工具的準確性。
ERA結合Gemini Deep Think解決了宇宙弦引力輻射的未解問題。

關鍵在於角度：重新構圖你的照片

2026-04-23 01:00 UTC+8

Google Photos 的 Auto frame 功能利用機器學習模型將照片視為 3D 場景，自動調整相機視角，生成全新的照片。該方法分為 3D 場景估計和生成式修補兩個階段，能夠修復透視畸變，改善肖像照片。

Google Photos 推出 Auto frame 功能，利用 AI 自動重新構圖照片。
該技術將 2D 照片解釋為 3D 場景，調整相機角度以生成新視角。

ReasoningBank：讓智慧體從經驗中學習

2026-04-22 00:42 UTC+8

Google Cloud的研究人員提出了ReasoningBank，一種新型智慧體記憶框架，能從成功和失敗經驗中提煉可推廣的推理策略，顯著提升智慧體在複雜任務中的表現和效率。

ReasoningBank從成功和失敗經驗中提取結構化記憶，包含標題、描述和內容。
透過記憶感知測試時擴充套件（MaTTS），進一步利用並行和順序擴充套件提升效能。

為現實世界設計合成資料集：從第一性原理出發的機制設計與推理

2026-04-16 22:41 UTC+8

谷歌推出Simula框架，將合成資料生成重新定義為資料集層面的機制設計。透過從第一性原理出發的推理式方法，Simula實現了對資料覆蓋度、複雜度和質量的精細控制，適用於隱私敏感或資料稀缺的專門領域。

Simula將合成資料生成視為資料集層面的機制設計問題。
框架將生成過程分解為四個可控軸：全域性多樣化、區域性多樣化、複雜化和質量檢查。

AI生成的合成神經元加速大腦圖譜繪製

2026-04-16 20:18 UTC+8

谷歌研究團隊開發了MoGen模型，利用AI生成合成神經元形態，用於訓練腦圖譜重建模型，使重建錯誤率降低4.4%。在完整小鼠大腦尺度上，這相當於節省157人年的人工校對工作。該成果為加速大規模腦連線組學專案提供了新工具。

MoGen模型透過點雲流匹配生成逼真的3D神經元形狀，用於增強訓練資料。
將10%的合成資料加入PATHFINDER模型訓練，減少了4.4%的重建錯誤，主要降低了合併錯誤率。

利用生成式AI培養面向未來的技能

2026-04-14 02:15 UTC+8

谷歌研究與紐約大學合作開發了Vantage，這是一個利用生成式AI評估團隊合作和批判性思維等面向未來技能的系統。該系統透過AI化身模擬對話，由執行LLM動態引導，評估結果與人類專家高度一致。目前Vantage已在Google Labs開放註冊。

Vantage使用生成式AI建立模擬環境，評估學生面向未來的技能。
執行LLM驅動AI化身，在對話中引入特定挑戰以收集技能證據。

ConvApparel：衡量並彌合使用者模擬器中的真實感差距

2026-04-09 19:22 UTC+8

谷歌研究院釋出ConvApparel資料集和評估框架，用於量化LLM使用者模擬器的真實感差距，並訓練更魯棒的對話代理。透過雙代理資料收集和三支柱驗證，研究發現資料驅動模擬器優於提示基礎，但真實感差距依然存在。

ConvApparel包含4000多人機對話，透過“好”與“壞”兩種代理採集資料。
評估框架包括人口統計對齊、人類相似度評分和反事實驗證三支柱。

改善學術工作流程：引入兩個AI代理以改進圖表製作和同行評審

2026-04-09 04:01 UTC+8

Google Cloud 的研究團隊推出了兩個創新的 AI 代理：PaperVizAgent 用於自動生成高質量的學術圖表，ScholarPeer 用於自動進行嚴格的學術論文評審。這兩個系統透過多代理協作和迭代最佳化，在各自任務上顯著超越了現有基線，為科學研究流程帶來了實質性改進。

PaperVizAgent 是一個多代理框架，能夠從學術文本自動生成出版就緒的圖表，包括方法論示意圖和統計圖。
ScholarPeer 模擬高階研究員的評審流程，透過上下文獲取和主動驗證生成深入、基於文獻的評審意見。

評估大語言模型行為傾向的對齊性

2026-04-03 16:00 UTC+8

谷歌研究團隊提出了一種系統評估框架，將心理學問卷轉化為情境判斷測試，量化LLM行為傾向與人類共識的對齊程度。對25個模型的測試發現，模型在高共識場景下存在偏差，且在低共識場景中過度自信，未能反映人類觀點的多樣性。

新框架將心理學問卷轉化為情境判斷測試，評估LLM在現實場景中的行為傾向。
25個模型在人類高共識場景中表現良好，但在共識較低時過度自信且方向不一。

Google Research Blog