AI News HubLIVE
站內改寫2 分鐘閱讀

透過全球合作與開放資源催化科學影響力

Google Research 秉持開放科學原則,透過開源軟體和開放資料集,與全球科研社群合作,推動基因組學、神經科學、氣候、生物多樣性、醫療等領域的突破性發現。文章詳細介紹了多個工具(如DeepVariant、Neuroglancer、Open Buildings、SpeciesNet、HAI-DEF)及其實際應用案例,展示了開放科學如何賦能全球研究人員併產生積極社會影響。

2026年5月1日,Google Research 科學團隊釋出了一篇關於開放科學的部落格文章,闡述了其透過全球合作伙伴關係和開放資源推動科學影響的理念與實踐。文章指出,一項科學突破只有當他人都能複製和擴充套件時,才能發揮最大潛力。Google Research 認識到開源軟體和開放資料集是現代科學的驅動因素,並致力於以負責任的方式建立這些資源,透過與全球科學社群的合作來維護它們,體現協作精神。

在合作伙伴與生態系統方面,Google Research 與加州大學聖克魯茲分校基因組學研究所、Janelia研究園區、奧地利科學技術研究所、人口基因組學中心、澳大利亞聯邦科學與工業研究組織(CSIRO)、全印度醫學科學研究所(AIIMS)等眾多專業機構合作。此外,他們還支援人類泛基因組研究聯盟、地球生物基因組計劃、美國國立衛生研究院腦計劃等大型科學聯盟。Google Research 還將開放科學理念擴充套件到更廣泛的生態系統,投資建設開發者社群,從印度、韓國、日本和澳大利亞開始。

在開源工具和資料方面,Google Research 在過去十年中開發並維護了多項關鍵技術。基因組學領域:DeepVariant、DeepConsensus和DeepPolisher等深度學習工具改進了DNA分析,全球社群已利用這些方法處理了250萬人的外顯子和全基因組資料。神經科學領域:洪水填充網路、Neuroglancer和TensorStore等工具使科學家能夠無縫分割、導航和分析PB級高解析度腦組織重建資料,包括H01(人類腦組織樣本,訪問次數超過20萬次)和MICrONS(小鼠視覺皮層最大連線圖譜)。地球與大氣建模:Open Buildings資料集包含18億棟建築檢測,覆蓋面積5800萬平方公里;Caravan資料集用於大樣本水文學;Groundsource資料集包含260萬曆史洪水事件;NeuralGCM是一種全微分混合大氣模型。生物多樣性:SpeciesNet模型可對2498種動物進行分類。醫療健康:Health AI Developer Foundations(HAI-DEF)提供一系列開放權重基礎模型,包括MedGemma,下載量超過480萬次;Open Health Stack(OHS)是一套開源工具,已在10多個國家部署,惠及超過6500萬人。

文章強調,開放科學真正的衡量標準是合作伙伴和終端使用者實現的現實世界影響。例如,與UCSC基因組學研究所合作,將泛基因組參考中的遺傳變異識別錯誤減少50%。芝加哥大學利用NeuralGCM提前一個月預測印度季風,並向3800萬農民傳送簡訊。聯合國難民署利用Open Buildings資料集最佳化流離失所人口的災害響應調查。約翰霍普金斯大學利用H01資料集發現了一種新的神經元通訊形式。Stanford和UCSC合作實現了不到8小時的全基因組測序遺傳診斷,創下吉尼斯世界紀錄。DeepSomatic用於更準確地發現癌症變異,Children's Mercy Hospital已部署。HAI-DEF在尚比亞透過MedSigLP構建了AI驅動的宮頸癌教育篩查工具。OHS幫助開發者在低資源環境中構建數字健康解決方案。AIIMS使用MedGemma進行門診分診和皮膚科篩查,馬來西亞衛生部透過MedGemma驅動Ask CPG,方便醫護人員查閱臨床指南。

在生物多樣性與保護方面,Snapshot Serengeti專案使用SpeciesNet在數天內分析了1100萬張野生動物影像。奧塔哥大學利用DeepVariant為瀕危鴞鸚鵡建立遺傳圖譜,幫助其種群從51只增加到252只。CSIRO利用Google Earth模型和基因組工具支援大角藻恢復。脊椎動物基因組計劃和地球生物基因組計劃使用開源基因組學工具,已為13種標誌性瀕危物種提供完整基因組。

展望未來,Google Research 相信生成式AI和代理工作流將深刻改變研究方式,使科學家能夠將知識編碼為專業技能,將方法轉化為可訪問、可擴充套件的工具。開源軟體和開放資料集仍將是這一生態系統的基石。Google Research 將繼續構建支援新發現時代的工具和基礎設施,期待全球科學社群取得更多成就。