Token貴只因你餵給模型的垃圾太多了丨@亞馬遜王曉野AIGC2026
亞馬遜雲科技技術總監王曉野在AIGC2026峯會上指出,87%的企業宣稱大規模部署AI,但僅10%獲得實際價值。他強調企業級Agent落地需跨越模型選擇、構建複雜度、使用門檻和人才缺口四大鴻溝,並介紹了亞馬遜雲科技從算力、模型、數據、Harness平台到Agent應用的五層架構,以及Quick等產品如何助力企業從Demo走向生產。
Token貴只因你餵給模型的垃圾太多了丨@亞馬遜王曉野AIGC2026 – 量子位
Token貴只因你餵給模型的垃圾太多了丨@亞馬遜王曉野AIGC2026
思邈 2026-05-31 18:03:40
來源:量子位
讓世界模型邁向多智能體交互仿真
編輯部 整理自 AIGC2026
量子位 | 公眾號 QbitAI
當全民都在“養龍蝦”的時候,真正的問題才剛開始浮現。
在剛剛結束的2026中國AIGC產業峯會上,亞馬遜雲科技產品技術部技術總監王曉野帶來了一組直觀數據:
87%的企業宣稱已經大規模部署了AI,而真正從中獲得價值的,只有10%。
很顯然,Demo從來都不難做,難的是讓它在企業生產環境裏真正跑起來。
在他看來,個人在Mac mini上跑一個好玩的Agent、隨時可以拔電源重啓,和讓幾千個Agent在企業分佈式環境裏安全、可信、不中斷地穩定運行,完全是兩個維度的工程複雜度。
這場分享還用最硬核的工程視角直擊了企業痛點——
別再指望靠一個模型去搞定所有事了。
算力夠不夠划算、數據安不安全、Agent會不會玩失憶或記憶串台……從底層基礎設施到上層應用,每一層都是必須硬啃的真問題。
為了完整體現王曉野的思考,在不改變原意的基礎上,量子位對演講內容進行了編輯整理,希望能給你帶來更多啓發。
2026中國AIGC產業峯會是由量子位主辦的行業峯會,近20位產業代表與會討論。線下參會觀眾超千人,線上直播觀眾近400萬,獲得了主流媒體的廣泛關注與報道。
核心觀點梳理
87%的企業實現了AI大規模部署,但真正從中獲得生產價值的比例只有10%。
個人養龍蝦和企業養龍蝦,完全是兩碼事。
AI真的不只是大模型,拿掉模型後剩下的Harness才是關鍵。
過去的數據平台是服務人的,今天的數據平台必須服務好AI Agent。
過去30年個人生產力從未被真正顛覆,直到Working Agent出現。
Token貴,很多時候是因為你餵給模型的信息太多太雜,而非單價貴。
以下為王曉野演講原文:
企業級Agent落地的四大鴻溝與落地體感
大家上午好!非常感謝量子位的邀請。
我今天演講的主題叫《跨越Agent落地鴻溝:從模型到企業級AI Agent落地》。
跟前面幾位嘉賓分享的方式不太一樣,我會直白一些,也會通過一系列產品和案例,跟大家分享我們對企業級Agent落地的思考。
作為一家長期服務全球客户的科技企業,亞馬遜雲科技一直在通過雲服務支持數百萬企業客户,今天我也想借由我們產品更新背後的思路,跟大家聊聊:真正把Agent落到企業生產環境時,企業需要回答哪些問題。
過去幾年,無論是Agent產品,還是Agent構建框架,都可以説層出不窮。
但真正能夠在生產環境裏大規模、穩定運行的Agent,其實寥寥無幾。這裏面到底存在怎樣的差距?
接下來我會結合亞馬遜雲科技跟客户一起實踐、總結出來的經驗,通過一些產品能力更新,來分享我們的答案。
我們先快速看一下AI現在的大趨勢。
過去我們經常會先跟客户聊AI應用的use case,也就是它到底能用在什麼場景。
但相信很多細分場景大家已經很熟悉了,如果往大的方向總結,大致可以看到幾個方向。
第一類是AI生成音頻、視頻、音樂,這些方向已經走得非常前沿,大家每天都能感受到日新月異的變化。
第二類是基礎模型,從語言模型開始,大家真正感受到了AI的力量,同時也意識到這件事可能還有一段路要走。
第三類是具身智能。
我們從具身智能企業的變化中可以看到,去年大家還更多關注動態控制,今年已經明顯轉向——如何收集數據,如何跟物理世界形成感知,再形成行動反饋。
還有一個更火、也可以説離成熟更接近的方向就是Agent。
今天我會聚焦在Agent這個話題上,因為它離企業真正落地更近。從落地的角度來看,Agent是當前最值得重點討論的方向。
相信很多嘉賓都反覆提到了養龍蝦在中國已經成為一個非常火熱的話題,很多個人用户都在嘗試,全民都在養龍蝦,甚至有新聞提到深圳的工程師會幫個人用户安裝、配置這些工具。
但個人養龍蝦和企業養龍蝦是兩件事。
個人環境裏,配置好之後可能很少需要再去改動;但在企業環境裏,你能不能讓幾千個Agent在企業環境中安全、可信地運行起來?背後其實有不少鴻溝需要跨越。
首先是模型選擇和響應速度。
企業出於性價比考慮,也因為模型能力每天都在快速變化,所以需要及時響應模型變化,並且能夠在多個模型之間靈活選擇。
第二是構建複雜度。
雲時代我們都知道,一個分佈式系統要長期穩定運行,本身就是非常困難的事情。
一個能跑在Mac mini上的龍蝦,個人用户可以隨時拔電源、重啓;但到了企業生產級場景,它能否可靠、穩定地運行,能否自動重啓且不中斷,能否可信地處理數據,就完全是另一層工程複雜度。
第三是使用門檻。
無論是Hermes,還是龍蝦,還是其他自主性Agent,對工程師來説,使用門檻已經比過去傳統IT系統低很多。
但對於業務人員來説,比如營銷、HR等崗位,他們能否真正把這些工具用起來,依然存在門檻。
第四是人才gap。
前面提到的很多問題,最終都需要人來解決,需要企業裏的平台部門把AI能力賦能給整個組織。
但今天具備端到端推動Agent落地能力的人才,依然有很大缺口。
三個禮拜前,在亞馬遜雲科技全球發佈中,亞馬遜雲科技CEO Matt Garman也分享了幾個觀點。
第一,他認為AI和Agent帶來了極大的市場構建範式變化,很多應用都應該被重新改造一次。
這句話聽起來可能很熟悉,但今天再看,味道已經跟過去不一樣了。
過去我們更多是在暢想未來,但今天我們是基於已經看到的事實,基於企業裏已經落地的東西,來表達這樣的觀點。
Matt還有一句話,我個人也非常認同。他認為,過去30年裏,個人生產力其實從來沒有被真正大規模顛覆過。
大家回想一下,無論是使用Office,還是使用各類通信軟件,軟件本身一直在迭代,但我們的工作方式並沒有發生太大的變化。
但今天Agent的出現,尤其是大家使用龍蝦後的體感,會讓人明顯感受到:我們確實走到了一個節點,個人的工作方式正在發生變化。
在講趨勢之前,我們先用幾組數據找一下感覺。
Gartner的分析顯示,從2028年到2030年,會有超過15%的企業日常工作決策由Agent或AI自主完成。
這裏説的不是人輔助決策,而是由Agent完全自主地完成決策,也不只是幫人執行任務。
一些關於勞動力的研究報告也提到,在2026年到2028年期間,82%的企業領導者表示會增加僱用“數字員工”的比例,為企業服務,而不只是招聘人類員工。
麥肯錫的分析則顯示,Agent以及生成式AI帶來的增量商業市場規模,可能從2.6萬億美元增長到4.4萬億美元,接近翻倍。
那這是不是炒作?
我們再看一些實際企業通過調研反饋回來的數據。
同樣是麥肯錫的報告提到,今天已經有87%的企業宣稱實現了AI在公司裏的大規模生產部署,而一年前這個數字還是78%,進展非常快。
同時,德勤的一些報告也反饋,真正把AI用到生產系統的企業中,確實有一部分企業反映生產力獲得了收益。
這些信號聽起來可能有些矛盾,但本質上都在説明同一件事:今天AI Agent在企業層面的滲透率已經很高,但真正獲得價值、走到生產層面的比例仍然有限。麥肯錫同一份報告裏也提到,這個比例可能只有10%左右。
像龍蝦這樣的Agent,讓我們看到了河對岸長什麼樣。但企業要真正走到生產落地,中間還需要一座橋。
今天我想通過一些產品能力更新,來跟大家分享這座橋應該長什麼樣。
從Demo走向生產的那座橋
簡單來説,亞馬遜雲科技認為,企業IT平台和企業技術決策者真正推動Agent從Demo走向生產時,需要關注五大能力。
第一層是AI Agent所需的算力。
如果回到Agent這個話題,算力可能更強調推理部分。過去我們更多討論訓練算力,但Agent場景對推理算力的需求會更加突出。
第二層是模型。
企業需要能夠快速獲取行業前沿模型,或者是最適合自身場景的模型,同時還要具備很高的性價比。
第三層是數據和知識。
Agent雖然把回答問題轉變成了行動能力,但就像炒菜一樣,如果沒有企業知識這類“獨家配方”,它永遠只能做出西紅柿炒雞蛋這類大眾化動作,真正進入企業流程時,Agent需要的是企業自己的數據和知識。
第四層是Agentic平台。
今天大家已經越來越清楚,AI不只是模型能力,Harness也至關重要。
第五層是Agent應用。
並不是所有事情都需要企業自己構建,很多通用能力已經可以通過垂直、專用或通用Agent應用的形態直接採購和使用。
接下來我會按照這五層展開,分享我們在產品設計理念上如何思考這些問題。
先看AI基礎設施這一層。今天我們仍然在討論Token消耗量、討論延遲,背後的潛台詞是什麼?
就是企業在性價比上還沒有達到可以隨意使用的狀態。這有點像早年大家會計算一條短信多少錢,而不是像今天發微信一樣,完全不需要考慮成本。
所以最底層能夠幫助企業降本增效的能力,應該來自算力層的大量優化。
亞馬遜雲科技的優勢來自20多年服務雲客户的經驗。我們服務了幾百萬客户,也知道客户在雲上跑什麼樣的負載。
即使是推理,我們也會關注這個Agent是更多以規劃為主,還是以執行簡單任務為主,或者更傾向於Workflow。
針對這些不同負載,大家其實會有一個共識:
通用芯片無法在所有場景中都提供最好的性價比。
亞馬遜雲科技從十幾年前就開始自研芯片,把一些虛擬化技術通過硬件能力實現;之後又推出基於Arm的CPU計算Graviton,目前已經走到第五代;再到專用AI芯片Trainium,也已經走到第三代。
簡單來説,在計算這一層,我們認為客户應該享受到面向具體場景的最優性價比計算能力。
模型這一層,我們秉承的觀點很多年來都沒有變:
客户和企業需要的是選擇,而不是被綁定在一個模型上。
Amazon Bedrock也是通過不斷擴大模型能力來支持這一點。包括中國一些優秀模型,比如智譜GLM、MiniMax的模型,我們都在積極推進上架到Bedrock平台。
當然,在企業語境下,Bedrock除了提供平台能力,更重要的是提供企業數據保護和隱私保護。
整個平台基於20多年雲計算積累下來的信任能力,企業可以通過雲上的VPC等技術,保證自己的數據不會被中間的一些路由工具截取或獲得。
數據和知識這一層,我們認為今天需要看到一個變化:傳統的數據平台、數據底座或數據基石,過去主要是服務於人的;但今天,企業平台部門和技術部門需要關注的是,數據平台能否服務好AI Agent。
Agent對數據的調用方式跟人類不一樣。我們面對的可能是數十億個Agent的規模,一次任務也可能帶來無數次調用。
因此企業真正需要的是一個AI-ready的數據平台,這會帶來跟過去傳統數據平台非常不同的挑戰。
結合我們跟客户共創的經驗,可以舉幾個例子。
第一是記憶的共享、隔離與並存。
當企業裏幾千個不同用户、不同Agent同時使用時,既需要大家擁有一定共享記憶,同時又不能串台。
如何通過企業傳統授權和權限管理,把記憶的共享、隔離、長短期管理都做好,是非常重要的事情。
第二是記憶生命週期管理。
很多人會認為記憶存得越多越好,但其實並不是。就像人一樣,如果長期記憶裏有錯誤知識、老舊信息,甚至有自相矛盾的知識,都會影響Agent最終的判斷,這也是為什麼長期記憶管理非常重要。
記憶的生命週期管理,是對底層數據引擎提出的新挑戰。
還有就是Token使用效率。
大家都在關注Token消耗多、Token貴,但真正導致Token貴的,很大一部分原因容易被忽略:並不只是Token單價貴,而是你在調用模型時餵給了模型太多沒用的信息。
比如把幾千個skills一股腦扔給模型,讓它自己去選;又比如在抽取和提取記憶時,沒有優化好最終餵給模型的信息。這些都會導致Token使用量爆炸。
反過來説,在全鏈條上,我們能不能觀察到模型是怎樣被調用的?能不能觀測到它是否產生幻覺?這種全鏈路可觀測性,也是AI-ready數據平台需要滿足的新能力。
如果總結我們在構建數據產品時秉承的理念,可以分成三大基座。
第一是面向AI-ready,同時堅持可信。
除了雲語境下端到端的靜態數據加密、傳輸中數據加密和安全保證之外,真正讓數據可信,還需要清楚瞭解數據代表的業務意義——
它是如何產生的,是由Agent自進化而來,還是由業務輸入而來;它在全鏈路中如何影響決策。
對於數據可解讀、可管理、可治理的需求,我們試圖通過SageMaker Catalog等能力來解決。
第二是底層數據引擎不應該成為上層Agent應用的阻礙,因此需要有卓越的數據底層。
展開來説,就是可信可靠、性能、性價比和持久性等能力,都需要保持在很好的水平。
亞馬遜雲科技這些年也通過豐富的數據經驗,在引擎層不斷優化。
這裏舉一個例子,今天在幾乎所有數據引擎裏,我們都支持向量能力。
為了適應Agent大規模擴展,我們也推出了S3 Vectors,把11個9持久性的對象存儲原生支持到大規模向量檢索和存儲中。
第三是堅持開放的數據架構,不應該形成任何數據技術廠商鎖定或技術鎖定。
比如在數據湖、多模態數據湖以及治理理念上,我們會圍繞Iceberg這樣的開放結構,推出S3 Tables,允許不同數據引擎進行訪問。
最近由於Agent被廣泛使用,大家也知道,無論是管理記憶,還是管理一些其他文件,很多時候都是通過文件系統、Markdown文件等方式實現的。
我們也通過開放方式,讓對象存儲直接支持相應的文件語義,讓Agent可以直接調用。
這些都是我們在產品設計中的一些理念,未來也會有更多對客户數據能力的支持。
從企業級Harness平台到智能化工作應用
接下來這一層,是我更想重點分享的內容。
除了模型之外,企業構建Agent需要的是一整套走向生產的能力。
兩年前我也曾在這個舞台上分享過類似信息,我們一直傳遞的觀點沒有變:
AI真的不只是大模型這一件事。
到了2026年,在Agent語境下,大家通過使用龍蝦,通過感受軟件工程能力,已經更清楚地意識到,把模型拿掉之後,剩下所有關於生產、控制、管控的生產級要求,都可以叫做Harness,也就是如何駕馭它。
打個比方,如果把模型看作CPU,那麼真正使用電腦時,沒有人會把一塊焊着CPU的主板直接給用户用。
我們還需要軟件、操作系統,以及各種可使用的能力,Harness就是把這些可使用、可操作、可管控的能力放在一起,最終讓Agent呈現為一個完整應用形態。
對應到亞馬遜雲科技的產品,Harness就是Amazon Bedrock AgentCore。
它的核心價值,是讓用户不用在Harness上花太多功夫,而是關注自己的業務價值。同時它保持開放,可以接入開源框架,比如LangChain、CrewAI等,都可以自由集成。
它也管理企業需要考慮的大規模安全、穩定、自重啓、可靠性等生產級需求。
如果把Bedrock AgentCore的九大功能模塊快速分成三類。
第一類是讓Agent跑起來。
Runtime提供自動橫向擴展能力,讓Agent可以按照任意規模快速擴展;Memory管理記憶和上下文;Code Interpreter和Browser則給Agent加上調用瀏覽器、操控代碼等能力。
第二類是讓企業裏的數據和系統真正接進來。
Identity和Gateway允許企業把現有系統,比如CRM、ERP等很好地集成進來,同時還能繼承員工使用這些系統時的真實權限。
Agent執行任務時代表的是具體員工,而不是一個擁有無限的管理權限。
第三類是讓Agent真正管得起來、管得住。
通過Policy、Evaluation和Observability等功能,企業可以在Agent執行任務時設置邊界,評估執行結果是否達到預期,並對整個過程形成可觀測能力。
前一陣,我們也跟OpenAI進行了官方聯合發佈,把提供給企業直接使用的Agent構建能力再往上升一級,加入由OpenAI提供支持的Managed Agent。
可以這樣理解:如果大家認為ChatGPT已經遠遠不只是聊天機器人,而是一個可以幫你執行任務的不錯Agent,那麼Managed Agent就是由OpenAI提供前沿模型,也由OpenAI提供他們在構建Agent過程中積累的最佳實踐Harness,再結合亞馬遜雲科技底層安全基礎設施體系,打包形成的一套能力。
如果企業更希望通過OpenAI的能力來執行任務,可以直接採用這個方案。
相比之下,Bedrock AgentCore提供更加開放靈活的Agent框架選擇和模型選擇。
但不變的是,這兩類能力都在同一個平台上,企業可以同時選擇,並繼承亞馬遜雲科技針對企業安全和信任的管控與保護。
這裏也快速引用一個客户案例,紫訊採用AgentCore後,解決的核心問題是:他們不需要過度規劃自己的計算資源,可以更經濟地快速迭代,也不需要投入大量精力優化底層Harness需要處理的生產工程問題。
這樣企業可以更快實現業務價值,同時更好地做成本優化,把精力放在自己的業務訴求上。
Agent應用的落地與展望
最後一層,是企業直接使用Agent應用時需要討論的問題:
誰來用?怎麼用?
Coding Agent大家已經普遍認為比較成熟了。
但在工作場景下,Working Agent也是我們認為下一個會爆發、會被廣泛使用的方向,因為我們已經看到了這類能力。
這裏有一個矛盾的問題是:員工希望Agent什麼事都幫自己做,瞭解自己的日常,瞭解自己的信息;企業則希望員工安全地使用Agent,希望有管控,不能讓Agent什麼事都做。
這兩者其實可以兼得。
在亞馬遜雲科技,我們的答案是通過Quick這樣的深度個性化產品來實現。
簡單來説,最近我們聽到同事分享最多的一句話是:它真的像日常小助手一樣。
我快速分享幾個自己的體驗。
第一,我每天會在CRM、聊天工具、郵件和各種平台之間切換,早上可能要花20分鐘到1個小時清理需要處理的任務。
Quick的主動提醒功能,能把這些連接匯聚在一起。它不只是提醒我有哪些事情,還會主動建議我應該給某位同事約一個會,或者給另一位同事做某件事。
第二,它真正執行任務時,能夠幫我們打破傳統工作的邊界。
比如今天這份PPT裏,有很多需要外部確認的調研數據。過去我可能要花很多時間諮詢各位同事,現在通過Quick很快就可以完成。
第三,它在幫我規劃任務時,會隨着我的使用不斷沉澱。
每個人在使用時都會形成個人知識圖譜,隨着使用越來越多,它的決策也會越來越像我,以上是我認為Quick帶來的幾個非常值得關注和體驗的點。
最後簡單總結一下,我們通過這五層能力,想分享的是:企業真正把Agent從Demo帶到生產,需要關注哪些點。
這裏也可以重新回顧一下我們跟OpenAI的聯合發佈。
除了剛才提到的Managed Agent,也包括OpenAI最前沿的模型在Bedrock上可用;同時,它的Coding Agent Codex也在Bedrock上可用。
也就是説,在我們五層架構裏的三層,通過跟OpenAI的合作都有了新的能力升級。
未來,在這五層能力上,我們也會持續迭代產品,加速對企業的賦能。
簡單來説,我們希望做的事情,就是讓更好的模型,通過可信的數據,真正把生產級平台帶給用户。
Matt Garman説,每一個應用都將會被重構。
我們確實已經看到領先企業走在這條路上,也希望通過五層架構的不斷迭代,跟大家一起加速重構,擁抱Agent時代,謝謝大家。
版權所有,未經授權不得以任何形式轉載及使用,違者必究。
Agent 亞馬遜 龍蝦
思邈
機器人原生世界動作模型問世!首創時空一體架構,復旦系團隊出品2026-05-31
英偉達清華團隊提出Gamma-World:世界模型從「一個人玩」到「多人共處」2026-05-30
清華系團隊給大模型織了一張“智能算力電網”2026-05-29
世界模型接棒語言模型,這家公司全球首創物理AGI“雙金字塔”體系,通用機器人進入“家庭時代”2026-05-28
相關閲讀
華為發佈業界首個擴散語言模型Agent,部分場景提速8倍!
看得更遠,跑得更快
鄧思邈2026-02-10
Agent 華為 擴散語言模型
亞馬遜CEO貝佐斯:人臉識別需要監管
魚羊2019-09-26
亞馬遜 人臉識別
飆着車學「機器學習」?要不是380萬人圍觀我都不敢相信
全球最知名的自動駕駛玩具車競賽
曉查2021-12-16
亞馬遜 亞馬遜雲科技
騰訊智能體開源大動作!關鍵技術都拿出來了,開發平台還全面升級
明敏2025-09-22
Agent 騰訊雲
亞馬遜率先發難禁用“海外版抖音”TikTok,不許員工手機裝,最新回應:郵件發錯了
風口浪尖上的TikTok
魚羊2020-07-11
TikTok 亞馬遜
ArgoAI倒閉內幕:貝佐斯原計劃接盤,最後沒談攏
福特和大眾擔心亞馬遜會完全掌控ArgoAI
昭慧2022-11-29
ArgoAI 亞馬遜 無人車往哪兒開 智能車真high
熱門文章
剛剛,國產AI自己造了AI,全球首例!
2026-05-26
卡帕西Anthropic最新頭銜:技術員工(MTS)
2026-05-26
7B打敗o3、GPT-5!醫學AI智能體讓模型學會“看哪裏、怎麼看”
2026-05-28
面壁智能「開源周」:一場定義端側 AI 終局的系統性「亮劍」
2026-05-29
4nm!比亞迪自研AI芯片來了:製程對齊英偉達,算力拉爆特斯拉
2026-05-29
掃碼關注量子位
量子位 QbitAI 版權所有©北京極客夥伴科技有限公司 京ICP備17005886號-1