2026-05-31 18:03 UTC+8站內改寫11 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Token貴只因你餵給模型的垃圾太多了丨@亞馬遜王曉野AIGC2026

亞馬遜雲科技技術總監王曉野在AIGC2026峰會上指出，87%的企業宣稱大規模部署AI，但僅10%獲得實際價值。他強調企業級Agent落地需跨越模型選擇、構建複雜度、使用門檻和人才缺口四大鴻溝，並介紹了亞馬遜雲科技從算力、模型、資料、Harness平臺到Agent應用的五層架構，以及Quick等產品如何助力企業從Demo走向生產。

來源量子位作者: 思邈

Token貴只因你餵給模型的垃圾太多了丨@亞馬遜王曉野AIGC2026 – 量子位

思邈 2026-05-31 18:03:40

來源：量子位

讓世界模型邁向多智慧體互動模擬

編輯部整理自 AIGC2026

量子位 | 公眾號 QbitAI

當全民都在“養龍蝦”的時候，真正的問題才剛開始浮現。

在剛剛結束的2026中國AIGC產業峰會上，亞馬遜雲科技產品技術部技術總監王曉野帶來了一組直觀資料：

87%的企業宣稱已經大規模部署了AI，而真正從中獲得價值的，只有10%。

很顯然，Demo從來都不難做，難的是讓它在企業生產環境裡真正跑起來。

在他看來，個人在Mac mini上跑一個好玩的Agent、隨時可以拔電源重啟，和讓幾千個Agent在企業分散式環境裡安全、可信、不中斷地穩定執行，完全是兩個維度的工程複雜度。

這場分享還用最硬核的工程視角直擊了企業痛點——

別再指望靠一個模型去搞定所有事了。

算力夠不夠划算、資料安不安全、Agent會不會玩失憶或記憶串臺……從底層基礎設施到上層應用，每一層都是必須硬啃的真問題。

為了完整體現王曉野的思考，在不改變原意的基礎上，量子位對演講內容進行了編輯整理，希望能給你帶來更多啟發。

2026中國AIGC產業峰會是由量子位主辦的行業峰會，近20位產業代表與會討論。線下參會觀眾超千人，線上直播觀眾近400萬，獲得了主流媒體的廣泛關注與報道。

核心觀點梳理

87%的企業實現了AI大規模部署，但真正從中獲得生產價值的比例只有10%。

個人養龍蝦和企業養龍蝦，完全是兩碼事。

AI真的不只是大模型，拿掉模型後剩下的Harness才是關鍵。

過去的資料平臺是服務人的，今天的資料平臺必須服務好AI Agent。

過去30年個人生產力從未被真正顛覆，直到Working Agent出現。

Token貴，很多時候是因為你餵給模型的資訊太多太雜，而非單價貴。

以下為王曉野演講原文：

企業級Agent落地的四大鴻溝與落地體感

大家上午好！非常感謝量子位的邀請。

我今天演講的主題叫《跨越Agent落地鴻溝：從模型到企業級AI Agent落地》。

跟前面幾位嘉賓分享的方式不太一樣，我會直白一些，也會透過一系列產品和案例，跟大家分享我們對企業級Agent落地的思考。

作為一家長期服務全球客戶的科技企業，亞馬遜雲科技一直在透過雲服務支援數百萬企業客戶，今天我也想借由我們產品更新背後的思路，跟大家聊聊：真正把Agent落到企業生產環境時，企業需要回答哪些問題。

過去幾年，無論是Agent產品，還是Agent構建框架，都可以說層出不窮。

但真正能夠在生產環境裡大規模、穩定執行的Agent，其實寥寥無幾。這裡面到底存在怎樣的差距？

接下來我會結合亞馬遜雲科技跟客戶一起實踐、總結出來的經驗，透過一些產品能力更新，來分享我們的答案。

我們先快速看一下AI現在的大趨勢。

過去我們經常會先跟客戶聊AI應用的use case，也就是它到底能用在什麼場景。

但相信很多細分場景大家已經很熟悉了，如果往大的方向總結，大致可以看到幾個方向。

第一類是AI生成音訊、影片、音樂，這些方向已經走得非常前沿，大家每天都能感受到日新月異的變化。

第二類是基礎模型，從語言模型開始，大家真正感受到了AI的力量，同時也意識到這件事可能還有一段路要走。

第三類是具身智慧。

我們從具身智慧企業的變化中可以看到，去年大家還更多關注動態控制，今年已經明顯轉向——如何收集資料，如何跟物理世界形成感知，再形成行動反饋。

還有一個更火、也可以說離成熟更接近的方向就是Agent。

今天我會聚焦在Agent這個話題上，因為它離企業真正落地更近。從落地的角度來看，Agent是當前最值得重點討論的方向。

相信很多嘉賓都反覆提到了養龍蝦在中國已經成為一個非常火熱的話題，很多個人使用者都在嘗試，全民都在養龍蝦，甚至有新聞提到深圳的工程師會幫個人使用者安裝、配置這些工具。

但個人養龍蝦和企業養龍蝦是兩件事。

個人環境裡，配置好之後可能很少需要再去改動；但在企業環境裡，你能不能讓幾千個Agent在企業環境中安全、可信地執行起來？背後其實有不少鴻溝需要跨越。

首先是模型選擇和響應速度。

企業出於價效比考慮，也因為模型能力每天都在快速變化，所以需要及時響應模型變化，並且能夠在多個模型之間靈活選擇。

第二是構建複雜度。

雲時代我們都知道，一個分散式系統要長期穩定執行，本身就是非常困難的事情。

一個能跑在Mac mini上的龍蝦，個人使用者可以隨時拔電源、重啟；但到了企業生產級場景，它能否可靠、穩定地執行，能否自動重啟且不中斷，能否可信地處理資料，就完全是另一層工程複雜度。

第三是使用門檻。

無論是Hermes，還是龍蝦，還是其他自主性Agent，對工程師來說，使用門檻已經比過去傳統IT系統低很多。

但對於業務人員來說，比如營銷、HR等崗位，他們能否真正把這些工具用起來，依然存在門檻。

第四是人才gap。

前面提到的很多問題，最終都需要人來解決，需要企業裡的平臺部門把AI能力賦能給整個組織。

但今天具備端到端推動Agent落地能力的人才，依然有很大缺口。

三個禮拜前，在亞馬遜雲科技全球釋出中，亞馬遜雲科技CEO Matt Garman也分享了幾個觀點。

第一，他認為AI和Agent帶來了極大的市場構建正規化變化，很多應用都應該被重新改造一次。

這句話聽起來可能很熟悉，但今天再看，味道已經跟過去不一樣了。

過去我們更多是在暢想未來，但今天我們是基於已經看到的事實，基於企業裡已經落地的東西，來表達這樣的觀點。

Matt還有一句話，我個人也非常認同。他認為，過去30年裡，個人生產力其實從來沒有被真正大規模顛覆過。

大家回想一下，無論是使用Office，還是使用各類通訊軟體，軟體本身一直在迭代，但我們的工作方式並沒有發生太大的變化。

但今天Agent的出現，尤其是大家使用龍蝦後的體感，會讓人明顯感受到：我們確實走到了一個節點，個人的工作方式正在發生變化。

在講趨勢之前，我們先用幾組資料找一下感覺。

Gartner的分析顯示，從2028年到2030年，會有超過15%的企業日常工作決策由Agent或AI自主完成。

這裡說的不是人輔助決策，而是由Agent完全自主地完成決策，也不只是幫人執行任務。

一些關於勞動力的研究報告也提到，在2026年到2028年期間，82%的企業領導者表示會增加僱用“數字員工”的比例，為企業服務，而不只是招聘人類員工。

麥肯錫的分析則顯示，Agent以及生成式AI帶來的增量商業市場規模，可能從2.6萬億美元增長到4.4萬億美元，接近翻倍。

那這是不是炒作？

我們再看一些實際企業透過調研反饋回來的資料。

同樣是麥肯錫的報告提到，今天已經有87%的企業宣稱實現了AI在公司裡的大規模生產部署，而一年前這個數字還是78%，進展非常快。

同時，德勤的一些報告也反饋，真正把AI用到生產系統的企業中，確實有一部分企業反映生產力獲得了收益。

這些訊號聽起來可能有些矛盾，但本質上都在說明同一件事：今天AI Agent在企業層面的滲透率已經很高，但真正獲得價值、走到生產層面的比例仍然有限。麥肯錫同一份報告裡也提到，這個比例可能只有10%左右。

像龍蝦這樣的Agent，讓我們看到了河對岸長什麼樣。但企業要真正走到生產落地，中間還需要一座橋。

今天我想透過一些產品能力更新，來跟大家分享這座橋應該長什麼樣。

從Demo走向生產的那座橋

簡單來說，亞馬遜雲科技認為，企業IT平臺和企業技術決策者真正推動Agent從Demo走向生產時，需要關注五大能力。

第一層是AI Agent所需的算力。

如果回到Agent這個話題，算力可能更強調推理部分。過去我們更多討論訓練算力，但Agent場景對推理算力的需求會更加突出。

第二層是模型。

企業需要能夠快速獲取行業前沿模型，或者是最適合自身場景的模型，同時還要具備很高的價效比。

第三層是資料和知識。

Agent雖然把回答問題轉變成了行動能力，但就像炒菜一樣，如果沒有企業知識這類“獨家配方”，它永遠只能做出西紅柿炒雞蛋這類大眾化動作，真正進入企業流程時，Agent需要的是企業自己的資料和知識。

第四層是Agentic平臺。

今天大家已經越來越清楚，AI不只是模型能力，Harness也至關重要。

第五層是Agent應用。

並不是所有事情都需要企業自己構建，很多通用能力已經可以透過垂直、專用或通用Agent應用的形態直接採購和使用。

接下來我會按照這五層展開，分享我們在產品設計理念上如何思考這些問題。

先看AI基礎設施這一層。今天我們仍然在討論Token消耗量、討論延遲，背後的潛臺詞是什麼？

就是企業在價效比上還沒有達到可以隨意使用的狀態。這有點像早年大家會計算一條簡訊多少錢，而不是像今天發微信一樣，完全不需要考慮成本。

所以最底層能夠幫助企業降本增效的能力，應該來自算力層的大量最佳化。

亞馬遜雲科技的優勢來自20多年服務雲客戶的經驗。我們服務了幾百萬客戶，也知道客戶在雲上跑什麼樣的負載。

即使是推理，我們也會關注這個Agent是更多以規劃為主，還是以執行簡單任務為主，或者更傾向於Workflow。

針對這些不同負載，大家其實會有一個共識：

通用晶片無法在所有場景中都提供最好的價效比。

亞馬遜雲科技從十幾年前就開始自研晶片，把一些虛擬化技術透過硬體能力實現；之後又推出基於Arm的CPU計算Graviton，目前已經走到第五代；再到專用AI晶片Trainium，也已經走到第三代。

簡單來說，在計算這一層，我們認為客戶應該享受到面向具體場景的最優價效比計算能力。

模型這一層，我們秉承的觀點很多年來都沒有變：

客戶和企業需要的是選擇，而不是被繫結在一個模型上。

Amazon Bedrock也是透過不斷擴大模型能力來支援這一點。包括中國一些優秀模型，比如智譜GLM、MiniMax的模型，我們都在積極推進上架到Bedrock平臺。

當然，在企業語境下，Bedrock除了提供平臺能力，更重要的是提供企業資料保護和隱私保護。

整個平臺基於20多年雲端計算積累下來的信任能力，企業可以透過雲上的VPC等技術，保證自己的資料不會被中間的一些路由工具擷取或獲得。

資料和知識這一層，我們認為今天需要看到一個變化：傳統的資料平臺、資料底座或資料基石，過去主要是服務於人的；但今天，企業平臺部門和技術部門需要關注的是，資料平臺能否服務好AI Agent。

Agent對資料的呼叫方式跟人類不一樣。我們面對的可能是數十億個Agent的規模，一次任務也可能帶來無數次呼叫。

因此企業真正需要的是一個AI-ready的資料平臺，這會帶來跟過去傳統資料平臺非常不同的挑戰。

結合我們跟客戶共創的經驗，可以舉幾個例子。

第一是記憶的共享、隔離與並存。

當企業裡幾千個不同使用者、不同Agent同時使用時，既需要大家擁有一定共享記憶，同時又不能串臺。

如何透過企業傳統授權和許可權管理，把記憶的共享、隔離、長短期管理都做好，是非常重要的事情。

第二是記憶生命週期管理。

很多人會認為記憶存得越多越好，但其實並不是。就像人一樣，如果長期記憶裡有錯誤知識、老舊資訊，甚至有自相矛盾的知識，都會影響Agent最終的判斷，這也是為什麼長期記憶管理非常重要。

記憶的生命週期管理，是對底層資料引擎提出的新挑戰。

還有就是Token使用效率。

大家都在關注Token消耗多、Token貴，但真正導致Token貴的，很大一部分原因容易被忽略：並不只是Token單價貴，而是你在呼叫模型時餵給了模型太多沒用的資訊。

比如把幾千個skills一股腦扔給模型，讓它自己去選；又比如在抽取和提取記憶時，沒有最佳化好最終餵給模型的資訊。這些都會導致Token使用量爆炸。

反過來說，在全鏈條上，我們能不能觀察到模型是怎樣被呼叫的？能不能觀測到它是否產生幻覺？這種全鏈路可觀測性，也是AI-ready資料平臺需要滿足的新能力。

如果總結我們在構建資料產品時秉承的理念，可以分成三大基座。

第一是面向AI-ready，同時堅持可信。

除了雲語境下端到端的靜態資料加密、傳輸中資料加密和安全保證之外，真正讓資料可信，還需要清楚瞭解資料代表的業務意義——

它是如何產生的，是由Agent自進化而來，還是由業務輸入而來；它在全鏈路中如何影響決策。

對於資料可解讀、可管理、可治理的需求，我們試圖透過SageMaker Catalog等能力來解決。

第二是底層資料引擎不應該成為上層Agent應用的阻礙，因此需要有卓越的資料底層。

展開來說，就是可信可靠、效能、價效比和永續性等能力，都需要保持在很好的水平。

亞馬遜雲科技這些年也透過豐富的資料經驗，在引擎層不斷最佳化。

這裡舉一個例子，今天在幾乎所有資料引擎裡，我們都支援向量能力。

為了適應Agent大規模擴充套件，我們也推出了S3 Vectors，把11個9永續性的物件儲存原生支援到大規模向量檢索和儲存中。

第三是堅持開放的資料架構，不應該形成任何資料技術廠商鎖定或技術鎖定。

比如在資料湖、多模態資料湖以及治理理念上，我們會圍繞Iceberg這樣的開放結構，推出S3 Tables，允許不同資料引擎進行訪問。

最近由於Agent被廣泛使用，大家也知道，無論是管理記憶，還是管理一些其他檔案，很多時候都是透過檔案系統、Markdown檔案等方式實現的。

我們也透過開放方式，讓物件儲存直接支援相應的檔案語義，讓Agent可以直接呼叫。

這些都是我們在產品設計中的一些理念，未來也會有更多對客戶資料能力的支援。

從企業級Harness平臺到智慧化工作應用

接下來這一層，是我更想重點分享的內容。

除了模型之外，企業構建Agent需要的是一整套走向生產的能力。

兩年前我也曾在這個舞臺上分享過類似資訊，我們一直傳遞的觀點沒有變：

AI真的不只是大模型這一件事。

到了2026年，在Agent語境下，大家透過使用龍蝦，透過感受軟體工程能力，已經更清楚地意識到，把模型拿掉之後，剩下所有關於生產、控制、管控的生產級要求，都可以叫做Harness，也就是如何駕馭它。

打個比方，如果把模型看作CPU，那麼真正使用電腦時，沒有人會把一塊焊著CPU的主機板直接給使用者用。

我們還需要軟體、作業系統，以及各種可使用的能力，Harness就是把這些可使用、可操作、可管控的能力放在一起，最終讓Agent呈現為一個完整應用形態。

對應到亞馬遜雲科技的產品，Harness就是Amazon Bedrock AgentCore。

它的核心價值，是讓使用者不用在Harness上花太多功夫，而是關注自己的業務價值。同時它保持開放，可以接入開源框架，比如LangChain、CrewAI等，都可以自由整合。

它也管理企業需要考慮的大規模安全、穩定、自重啟、可靠性等生產級需求。

如果把Bedrock AgentCore的九大功能模組快速分成三類。

第一類是讓Agent跑起來。

Runtime提供自動橫向擴充套件能力，讓Agent可以按照任意規模快速擴充套件；Memory管理記憶和上下文；Code Interpreter和Browser則給Agent加上呼叫瀏覽器、操控程式碼等能力。

第二類是讓企業裡的資料和系統真正接進來。

Identity和Gateway允許企業把現有系統，比如CRM、ERP等很好地整合進來，同時還能繼承員工使用這些系統時的真實許可權。

Agent執行任務時代表的是具體員工，而不是一個擁有無限的管理許可權。

第三類是讓Agent真正管得起來、管得住。

透過Policy、Evaluation和Observability等功能，企業可以在Agent執行任務時設定邊界，評估執行結果是否達到預期，並對整個過程形成可觀測能力。

前一陣，我們也跟OpenAI進行了官方聯合釋出，把提供給企業直接使用的Agent構建能力再往上升一級，加入由OpenAI提供支援的Managed Agent。

可以這樣理解：如果大家認為ChatGPT已經遠遠不只是聊天機器人，而是一個可以幫你執行任務的不錯Agent，那麼Managed Agent就是由OpenAI提供前沿模型，也由OpenAI提供他們在構建Agent過程中積累的最佳實踐Harness，再結合亞馬遜雲科技底層安全基礎設施體系，打包形成的一套能力。

如果企業更希望透過OpenAI的能力來執行任務，可以直接採用這個方案。

相比之下，Bedrock AgentCore提供更加開放靈活的Agent框架選擇和模型選擇。

但不變的是，這兩類能力都在同一個平臺上，企業可以同時選擇，並繼承亞馬遜雲科技針對企業安全和信任的管控與保護。

這裡也快速引用一個客戶案例，紫訊採用AgentCore後，解決的核心問題是：他們不需要過度規劃自己的計算資源，可以更經濟地快速迭代，也不需要投入大量精力最佳化底層Harness需要處理的生產工程問題。

這樣企業可以更快實現業務價值，同時更好地做成本最佳化，把精力放在自己的業務訴求上。

Agent應用的落地與展望

最後一層，是企業直接使用Agent應用時需要討論的問題：

誰來用？怎麼用？

Coding Agent大家已經普遍認為比較成熟了。

但在工作場景下，Working Agent也是我們認為下一個會爆發、會被廣泛使用的方向，因為我們已經看到了這類能力。

這裡有一個矛盾的問題是：員工希望Agent什麼事都幫自己做，瞭解自己的日常，瞭解自己的資訊；企業則希望員工安全地使用Agent，希望有管控，不能讓Agent什麼事都做。

這兩者其實可以兼得。

在亞馬遜雲科技，我們的答案是透過Quick這樣的深度個性化產品來實現。

簡單來說，最近我們聽到同事分享最多的一句話是：它真的像日常小助手一樣。

我快速分享幾個自己的體驗。

第一，我每天會在CRM、聊天工具、郵件和各種平臺之間切換，早上可能要花20分鐘到1個小時清理需要處理的任務。

Quick的主動提醒功能，能把這些連線匯聚在一起。它不只是提醒我有哪些事情，還會主動建議我應該給某位同事約一個會，或者給另一位同事做某件事。

第二，它真正執行任務時，能夠幫我們打破傳統工作的邊界。

比如今天這份PPT裡，有很多需要外部確認的調研資料。過去我可能要花很多時間諮詢各位同事，現在透過Quick很快就可以完成。

第三，它在幫我規劃任務時，會隨著我的使用不斷沉澱。

每個人在使用時都會形成個人知識圖譜，隨著使用越來越多，它的決策也會越來越像我，以上是我認為Quick帶來的幾個非常值得關注和體驗的點。

最後簡單總結一下，我們透過這五層能力，想分享的是：企業真正把Agent從Demo帶到生產，需要關注哪些點。

這裡也可以重新回顧一下我們跟OpenAI的聯合釋出。

除了剛才提到的Managed Agent，也包括OpenAI最前沿的模型在Bedrock上可用；同時，它的Coding Agent Codex也在Bedrock上可用。

也就是說，在我們五層架構裡的三層，透過跟OpenAI的合作都有了新的能力升級。

未來，在這五層能力上，我們也會持續迭代產品，加速對企業的賦能。

簡單來說，我們希望做的事情，就是讓更好的模型，透過可信的資料，真正把生產級平臺帶給使用者。

Matt Garman說，每一個應用都將會被重構。

我們確實已經看到領先企業走在這條路上，也希望透過五層架構的不斷迭代，跟大家一起加速重構，擁抱Agent時代，謝謝大家。

Agent 亞馬遜龍蝦

思邈

機器人原生世界動作模型問世！首創時空一體架構，復旦系團隊出品2026-05-31

輝達清華團隊提出Gamma-World：世界模型從「一個人玩」到「多人共處」2026-05-30

清華系團隊給大模型織了一張“智慧算力電網”2026-05-29

世界模型接棒語言模型，這家公司全球首創物理AGI“雙金字塔”體系，通用機器人進入“家庭時代”2026-05-28