AI News HubLIVE
站内改写

未來推理將吃掉70%算力,30%留給訓練丨硅谷投資人張璐@AIGC2026

在2026中國AIGC產業峯會上,Fusion Fund創始合夥人張璐指出,AI算力需求重心正從訓練轉向推理,未來推理將消耗70%的算力;數據中心通信耗電可能比計算高百倍,光學通信等新技術成為關鍵;物理AI的最大瓶頸是高質量真實世界數據稀缺;醫療、太空和納米機器人是三大值得押注的應用方向。

文章情報

投資人進階

要點

  • 推理算力佔比將從50%升至70%,成為AI基礎設施核心優化方向。
  • 數據中心內通信耗電量可能比計算高百倍,光學通信等新技術至關重要。
  • 物理AI缺乏高質量真實數據,合成數據無法替代邊緣場景採集。
  • 醫療、太空、納米機器人是硅谷投資人看好的三大AI應用方向。

為甚麼重要

這條新聞值得關注,因為推理算力佔比將從50%升至70%,成為AI基礎設施核心優化方向。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

未來推理將吃掉70%算力,30%留給訓練丨硅谷投資人張璐@AIGC2026 – 量子位

未來推理將吃掉70%算力,30%留給訓練丨硅谷投資人張璐@AIGC2026

思邈 2026-05-25 09:51:37

來源:量子位

這些AI關鍵詞正在被重新定義

編輯部 整理自 AIGC2026

量子位 | 公眾號 QbitAI

從硅谷投資人的視角望出去,AI的敍事正在悄然換軌。

在這個新舊週期交替的關鍵節點,Fusion Fund創始合夥人張璐帶來了她一線的判斷:

過去兩年,行業所有的目光都聚焦在模型和算力上,但真正的戰場,正在向基礎設施的“通信層”和物理世界的“數據層”轉移。

在本次2026中國AIGC產業峯會上,她將這一輪AI敍事的轉向説得很直白——

推理將超越訓練,成為算力消耗的新主角;而數據中心裏那個鮮少被提及的通信環節,其耗電量可能是計算本身的百倍以上。

至於下一個真正值得押注的方向,在她看來,並非更大的模型,而是更真實、更高質量的數據,以及醫療、太空、納米機器人這三個AI應用方向。

為了完整體現張璐的思考,在不改變原意的基礎上,量子位對演講內容進行了翻譯和編輯整理,希望能給你帶來更多啓發。

2026中國AIGC產業峯會是由量子位主辦的行業峯會,近20位產業代表與會討論。線下參會觀眾超千人,線上直播觀眾近400萬,獲得了主流媒體的廣泛關注與報道。

核心觀點梳理

算力需求的重心正在從訓練轉向推理:訓練是一次性的算力投入,推理才是可持續的長期需求;隨着智能體交互替代對話交互,推理算力的比重將從現在的50%繼續攀升,成為AI基礎設施最核心的優化方向;

數據中心的真正電老虎是通信:在AI數據中心內,通信消耗的電量可能比計算本身高出百倍,這意味着光學通信等新一代通信技術的價值,遠比通常認知的更為關鍵;

物理AI現在卡在數據層:架構和算力都已具備,真正的瓶頸是缺乏足夠高質量的真實世界數據;合成數據可以作為補充,但無法替代邊緣場景中的真實採集;

數據的質量比數量更重要,而醫療恰恰是高質量數據密度最高的行業之一:這是大量AI科技公司在2025年集中入局醫療賽道的底層邏輯,而不只是因為它市場夠大;

技術創新只是起點,產業整合速度才是AI落地的真正競爭力:當500強企業的AI預算從千萬級躍升至數十億級,採購週期從半年壓縮到一兩個月,這種加速度本身就是模型和應用持續迭代的燃料。

以下為張璐演講原文:

AI敍事的新拐點

大家好,我是張璐,我是硅谷Fusion Fund的創始和管理合夥人。

在過去的十到十一年的時間裏,我們一直專注北美市場早期科技公司的投資,尤其專注在三個領域——企業級人工智能、醫療AI以及工業自動化。

過去兩年,大家可能都關注到了,硅谷經歷了快速迭代的創新週期,尤其是以人工智能為驅動的快速的產業創新以及產業植入的進程。

所以我們在過去這兩年非常辛苦,但也非常興奮,看到了很多傑出的企業家、創業者快速地成長起來,也看到了產業中從人工智能、基礎設施,再到人工智能的應用層面上多重創新的開展和發展。

到今年,我覺得已經進入到了一個新時期,可以看到人工智能在整體的敍事上、創新的專注層面上,有了一些新變化。

所以今天也非常高興有機會和大家分享,過去一年我們看到的硅谷新興的人工智能創新風向的變化,以及一些最新的動態。

過去幾年,我們在聊到人工智能創新的時候,有幾個關鍵詞反覆出現,比如大語言模型、生成式AI、訓練、算力需求等等。

但最近這段時間,我們看到在語境層面上也有一些新的轉向,比如,不只是在討論大語言模型,現在更多在討論行業專屬應用,基於的是小語言模型怎麼樣可以通過更加低成本、高效的方式,去進行產業垂直人工智能的植入,另外也是模型對象的轉變。

從語言模型,現在更多討論的是物理AI,還有世界模型的調整。

同時在計算層面,我們也經常講到人工智能的算力需求非常巨大,以前算力的大量消耗可能是在訓練端。

但過去這段時間,大家更多討論的是推理對於算力的需求會越來越大,甚至超過訓練,成為長期可持續的算力需求。

在根本層面上,我們也能看到有越來越多對於數據的討論,從最早我們經常講規模定律(Scaling Law),認為有越多的數據意味着可以去訓練出更好的人工智能模型。

到現在大家更多關注數據的質量——怎麼樣可以拿到高質量的行業數據?怎麼可以通過高質量的行業數據去做更好的數據庫?我們稱之為數據治理(data curation),還有數據圖書館(data library)。

再基於這些數據的質量去優化人工智能,無論是模型能力,還是在應用能力上進行迭代。

重新定義AI基礎設施

今天也想根據這些不同的方向,跟大家快速分享幾個我們非常看好、而且現在正快速發展的人工智能領域。

首先要跟大家分享和聊到的就是人工智能基礎設施。

如果大家有關注英偉達3月的GTC大會,也能看到英偉達的敍事在改變,以前講的是一家GPU芯片企業,到現在黃仁勳已經非常明確——

英偉達是一個人工智能基礎設施公司,一個人工智能工廠。

從Token經濟學來看,未來對人工智能基礎設施的需求,可能就像對電力的需求一樣常見,這是一場非常巨大的基礎層級的產業革命。

所以我們看到,對於人工智能基礎設施的創新需求非常高。人工智能現在進入了產業部署階段,大規模的產業部署也需要非常強力的人工智能基礎設施來輔助和支持。

現在有大量新建的人工智能數據中心,它們面臨很多挑戰,比如電力的消耗、通信層面上的能量消耗,還有各種各樣技術問題。

所以怎麼樣在這個層面上進行更多的技術創新,也帶來了很多的創新機會,其中我們聊得比較多的,就是基礎設施本身的算力優化。

我剛才提到,核心的算力變化在於——以前算力關注更多的是訓練本身,但現在我們看到一個非常清晰的轉變:訓練更多是一次性的算力投入,但是推理是可持續的算力需求。

幾年前,這兩個層面上對算力的需求——訓練的算力需求佔到70%以上,推理可能只有20%到30%,現在推理已經佔到了一半,在未來可能會變成30:70(訓練:推理)。

尤其我們現在已經到了新的轉變階段,即從聊天對話這種交互方式,到現在智能體的交互。如果你有一個智能體,你是不是希望這個智能體一直在線,一直響應你?

這個過程中對於推理的需求就更加具有可持續性,然後也更加大量,這個過程中推理所消耗的算力也更為核心。

因此,怎樣進行推理的優化?怎樣進行推理算力的優化?是未來人工智能基礎設施要去解決的核心問題之一。

我們剛才主要專注的是説計算這部分的算力,在人工智能基礎設施層面上大家探討的,更多是在計算過程中消耗了多大的能量。

現在全世界都在討論,人工智能的核心發展瓶頸之一就是耗電量,但是在計算之後,下一步是什麼呢?是通信(Communication)。

這個通信的過程中有通信能力的需求,有內部通信, 還有交換機(switch)的需求,在人工智能的數據中心裏,通信環節整體的耗電量可能比計算的耗電量要大幾十倍甚至上百倍。

我去年有幸在斯坦福,和我們之前的老校長,也是谷歌的母公司Alphabet的董事會主席John Hennessy做過一個對話,在對話中他專門提到——

在通信的過程中所消耗的電量可能比計算本身要超過百倍以上。

CPU、GPU的設計思路,其實是儘量在本地、在芯片本身做盡量多的計算,而不是去進行更多的傳輸,你可以把計算到處部署,也可以把數據到處挪動,但是挪動數據的過程中它消耗的電量,比移動計算本身的成本更高。

所以這也催生了很多新技術,它們所關注的正是通信的部分——怎麼樣可以有新一代的通信技術?我們經常提到,現在有很多新創新是在光學通信層面上,去大規模降低通信過程中的能量消耗,這也是很關鍵的。

我們剛才也提到一個轉變,就是從語言模型→世界模型→物理AI。

到物理AI,我們所應用到的數據不只是文本數據,還有很多三維的數據、真實世界的數據,而這些數據的量級也更加巨大。

在這個過程中如果你再去到處傳輸數據,它對於能量的消耗也會更加巨大。

這也是為什麼我們在這個領域會看到更多創新。

物理AI的突圍:邊緣計算與新型傳感器

剛才我提到了好多次“物理AI”。

物理AI現在也是一個新興發展的方向,它不只是我們經常講的人形機器人。

物理AI, 它其實涉及到了仿真模擬(simulation),還有數據層、世界模型等領域,這些都覆蓋到物理世界和AI的交互。無論是大家可能關注比較多的無人駕駛,還是工廠領域高精度生產的整體物理AI的投放和使用,還有醫療、物流供應鏈、太空行業等等,都在大規模應用物理AI。

怎麼樣可以讓物理世界和AI更好地互動?這也是現在創新很重要的方向。

我們看到很多創新其實聚焦在一個是仿真模擬層,另一個就是數據層。

現在對於物理AI來講,最大的一個瓶頸,是我們的架構做好了,也有算力,但現在最缺的就是數據,現在最大的瓶頸也是在數據。

我們沒有足夠高質量的真實世界數據去支持物理AI的模型訓練,當然這個過程中有很多人去聊一個相關方向,就是合成數據。

合成數據現在也是發展速度很快的一個方向,包括通過合成數據再去看去支持仿真模擬, 但在這個過程中會發現,合成數據其實存在很多弊端或者盲點。

所以,對真實世界中邊緣場景、邊緣數據的收集,還是非常關鍵的。

這也就意味着,我們不只是要去關注模型層的技術發展,要更努力去投入新型的數據收集平台和數據優化平台的技術創新,這樣才可以有更好的數據庫,去支持物理AI進一步的發展。

既然物理AI現在核心的一個痛點,就是它的數據層。那怎麼樣可以獲得真實世界和工業界的高質量數據?

這個時候你會發現,比如傳統的製造生產行業,它其實產生了很多高質量的真實三維數據,但是它的痛點在於,沒有一個非常好的數據收集平台去進行標準化的數據收集、數據優化和數據治理(curation),讓數據整體達到可以進行人工智能模型訓練的階段。

而在這個過程中,因為很多真實世界的需求,應用場景又對這樣的數據收集平台的消耗,有着天然的限制。

所以怎樣可以在邊緣端更好進行人工智能的部署,也是非常重要的一個方向。

在這裏我提到一個新的技術,就是我們看到了很多年一直在發展的人工皮膚,它核心是柔性電路,叫Flexible Electronics。

△來自斯坦福大學官網

今年出現了很多這樣的公司,其中做得最好的研究之一,是來自斯坦福大學鮑哲南教授的實驗室,他們所做的人工皮膚的傳感器,是一款高精度、低能耗的傳感器,它可以薄到就像手套一樣,無論是套在機械手上,或者套在人的手上,它的觸覺有非常高精度的傳感點,這個觸覺數據,就可以成為非常重要的數據來源,去支持物理世界。

△援引自中國科學院學部

在這個過程中,我們不只看到初創企業在做新型的數據收集平台。

我們在和一些500強企業,尤其是一些500強的製造龍頭企業對話的時候,我發現他們自己內部也在做這方面技術的探索,所以説大家其實意識到了核心的瓶頸是在數據層,也有更多的創新聚焦到數據這一層。

我還想再強調一點,就是邊緣計算。

邊緣計算未來的發展也會非常快,這個方向對我們來説已經不是新方向了,我們從2018、2019年就開始投資邊緣計算。

在過去兩年,我覺得產業形成了一個共識——人工智能發展的未來方向是在邊緣端的人工智能部署。

怎麼樣能夠達到邊緣端人工智能的部署?又回到我們剛才涉及到的問題,它需要的是一個小模型。

比如説我們今年有一家公司剛被高通收購,他們的模型就可以小到——不足10億token, 在這樣的情況下,你可以在一個Raspberry Pi(樹莓派)上面去運行這個小模型,它就可以有和GPT-4同等的人工智能能力。

包括前段時間,谷歌發佈的一些開源模型,也有一些非常小的邊緣模型,所以在邊緣端的人工智能鋪設非常重要。

而邊緣端AI的鋪設,再和新型的數據收集平台整合到一起,我們就可以在邊緣端進行數據收集、本地化處理和本地化的人工智能的應用,所以對於高監管行業,還有那些對數據隱私相對敏感的行業來説,都是非常好的發展方向。

關注三個應用方向:醫療、太空與比細胞還小的機器人

最後,跟大家講幾個我非常看好的具體人工智能應用方向。

今年對於硅谷來講是人工智能醫療領域非常重要的一年,在年初的時候,先是禮來(美國製藥公司)和英偉達成了一個10億美金的合作。

△來自英偉達官網

他們的合作不只是人工智能和醫療的結合,他們也希望構建一個人工智能+醫療+數據技術的生態,去幫助更多的初創企業跟他們達成戰略合作,我們有好幾家公司跟他們在進行合作。

包括在1月份,大家可能有關注到,無論是ChatGPT還是Claude,都發布了針對醫療領域應用的專屬產品,尤其是Claude做的Claude for Health,其實是專注底層的基礎設施,在數據、隱私、安全,還有合規層面上去幫助醫療領域的服務提供商和醫院等等,更好地進行AI醫療的整合。

前一段時間,大概幾周前,默克(美國的製藥企業,世界上最大的製藥企業之一)也和谷歌Gemini發佈了非常重磅的戰略合作。所以我們會看到,很多人工智能的科技企業都在紛紛入局醫療領域。

醫療領域不只是美國市場最大的市場之一(美國20%的GDP都在醫療領域),更重要的一點,是我們剛才提到的很重要的一個轉變,或者説共識——大家意識到數據的質量比數據的量更重要。

哪個行業有海量的高質量數據?其中一個很重要的行業就是醫療領域。

2017年我們就開始發佈AI醫療的報告,去年又做了一個最新版,可以看到很多新的進化。

到現在,我們會看到很多新型的AI醫療公司,它專注的是一個垂直領域小模型。

比如説專門針對細胞療法做一個垂直AI模型,針對MRA(磁共振血管造影)的測序數據專門做一個垂直模型,甚至還有一些是針對特定疾病的,比如説專門針對帕金森、老年痴呆,去結合各種各樣的數據、生物信息學進行個性化的診斷和治療。

這個過程中,不只是AI模型,還有包括機器人和物理AI也在醫療領域進行大規模的鋪設。

這裏我提到一家公司叫Medra, 也是我們去年剛投資的一家公司。

他們是斯坦福背景的團隊,做了整一套的物理AI系統,從AI層面上可以自己去理解怎麼樣進行生物醫療的實驗設計,同時進行機械手臂、還有自動化機器人實驗,到最後整體去自動化整個生命科學,包括醫療領域的科研過程。

幾周前,他們剛剛在舊金山,開啓了他們全球現在最大的一個全無人物理AI機器人的實驗室,現在正在晝夜不停進行各種各樣的實驗搭設。

這家公司在早期的時候就和很多藥廠合作,所以現在我們去聊AI醫療,已經不是幾年前單純的問診、醫生輔助功能,現在已經涉及到了非常核心的個性化治療部分。

個性化治療也不只是我們之前可能看得比較多的癌症、心腦血管疾病,現在尤其是腦部疾病,例如帕金森、老年痴呆、抑鬱症,這些都可以和AI、甚至物理AI進行深度整合。

另外一個我個人非常看好的方向就是——物理AI和太空科技的結合,尤其是未來3-5年整個太空領域的發展,太空經濟學、太空生態、太空基礎設施的崛起都會非常快速。

當然大家現在都在關注馬上要到來的SpaceX的IPO,這也是非常強大的信號,會讓大家看到接下來的三五年整個太空經濟的快速崛起,又因為太空生態的特殊性,它就有天然的AI原生和機器人原生的特性。

比如説我們會講到太空基礎設施的搭設,在這個過程中就會用到很多物理AI, 還有機器人的創新應用,同時包括未來一個很大的發展方向,就是太空工廠。

當然你可以運送人上去太空工廠,但是可能更好的選擇是在短期內運送機器人上去。比如現在探月的任務,你會發現在人類進行登月的嘗試之前,會部署很多的機器人和機械設備。

我們自己也有投資專門做太空基礎設施的公司,尤其是機器人層面上的應用,去進行這種效能提升。

例如太空加油站,所有設備都已經做好了,而且在過去的這一年時間就已經達到了上億美元的訂單收入。所以這個產業的快速迭代發展,也是一個非常新興的、迭代非常迅速的人工智能創新方向。

最後一個方向其實也跟醫療相關,但它需要一定時間去成熟、但會讓大家覺得非常興奮的方向——

就是以更小的維度去看機器人的發展,我們叫它微米機器人或者納米機器人。

更小的機器人可以進到人類的血管裏,比如説去清除血栓;或者更進一步縮小到DNA級別,去進行靶向藥物遞送,實現體內的免疫隱形。

現在有越來越多的技術在這個方向進行迭代,比如説進行血栓清除的微米機器人,已經進入商業化應用的初始階段。包括DNA引擎、Nanoswimmer(納米機器人領域的一個細分形態,指會游泳的納米級機器人),還有靶向遞藥的這些納米機器人的應用,在未來幾年也會有很好的前景和快速的發展。

所以今天就和大家快速地分享一些在過去這一年多的時間裏,我們看到的一些讓人很興奮的AI發展方向。

現在整個生態也處在迭代期,還有很多新的模型架構在湧現。

當然這個過程中整個AI生態也面臨很多挑戰,但對於創業者來講,挑戰就意味着機會,所以我們會看到更多優秀的創業者,跳到產業裏去開展新方向的探索。

作為投資人我們也非常幸福,我覺得現在對早期的AI的投資人來説,是很幸福的時刻,可以看到這麼多的技術,不僅是處在創新的階段,還處在產業快速迭代的時代。

最後想跟大家分享的就是,除了技術創新之外,現在更重要的一個時間節點,就是從今年開始我們會看到產業對於技術整合的態度在快速變化。

我們看到大量500強企業在人工智能方面的預算,從幾千萬變到幾億,甚至變到了幾十億。從以前銷售週期可能需要半年甚至更長的時間,到現在一個月、兩個月的時間,這種產業的快速整合才是人工智能技術能夠快速發展的核心競爭力。

因為只有到達真實的應用場景,快速獲得用户,或者説得到應用場景的反饋,獲得高質量的產業數據,才可以讓我們的模型架構和應用不斷迭代。

所以也非常期待接下來這一年會有更多新的創新出現,也歡迎大家有時間可以多來硅谷,進行更多技術層面上的交流,謝謝。

版權所有,未經授權不得以任何形式轉載及使用,違者必究。

醫療AI 推理 算力 訓練

思邈

華為具身大腦一號位創業,用認知科學造世界模型,獲億元級融資2026-05-25

狂攬F輪融資+拿下4100萬用户!深圳玩家出手,把企業舊系統變成AI能力庫2026-05-22

80集短劇,3天拍完:當電影人下場做Agent,影視生產迎來了“最懂行”的解法2026-05-22

風行在線CEO易正朝:先全員Coding,再All in眾創丨AIGC20262026-05-21

相關閲讀

Token驅動未來,城市如何搶佔算力新賽道?

報名大會現場觀摩

量子位2026-04-27

算力

AI性能基準測試從此有了「中國標準」!英偉達、谷歌可以試試這套算力卷

國產AI試卷——AIPerf

十三2020-11-10

AI MLPerf 算力 英偉達 谷歌

大模型創業太累大牛逃回大廠:融資1億美金捉襟見肘,還胖了30斤

買算力就像買彩票

白交2024-11-26

大模型創業 算力 谷歌

超智算智能算力中心揭牌暨AI算力設備點亮儀式成功舉行

北京在算力基礎設施建設上邁出關鍵一步

夢晨2026-03-06

算力

底層算力也正在進入軟件定義一切的時代 | CCF C³

我們統計20萬篇基礎科研論文,有34%左右都使用了AI。

白交2023-10-08

算力

華為:讓DeepSeek的“專家們”動起來,推理延遲降10%!

MoE的“專家”也有冷熱之分

十三2025-05-20

華為 推理 昇騰

熱門文章

AI水論文封一年,署名連坐!arXiv最嚴新規來了,陶哲軒附議

2026-05-18

智象未來超兩千億參數圖像大模型HiDream-O1-Image-Pro發佈,融資持續提速

2026-05-20

openJiuwen社區開源新招:重磅發佈JiuwenSwarm,拉開羣體智能“養蜂”序幕

2026-05-18

菲爾茲獎得主都看懵了:OpenAI非數學模型首次自主突破80年未解數學難題

2026-05-21

太初元碁洪源:異構計算能力將成為未來AI算力基礎設施的重要方向|AIGC2026

2026-05-20

掃碼關注量子位

量子位 QbitAI 版權所有©北京極客夥伴科技有限公司 京ICP備17005886號-1