我們是否正接近新的人工智能寒冬?
本文探討了人工智能領域情緒的變化,從早期的過度樂觀轉向現實認知。作者認為,由於技術採用不足和擴散緩慢,而非技術瓶頸,我們可能正進入一個“人工智能寒冬”。通過分析“Token最大化”策略的失敗、大公司的裁員藉口以及開發者對AI生成代碼的後悔,文章指出現在正是專注於真正採用人工智能的最佳時機。
2026年6月7日
我不知道你怎麼看,但我感覺圍繞人工智能的情緒正在悄然轉變。曾經,我們聽到的是所有知識工作者即將消失、大家都能享受閒暇愛好的美好承諾,如今卻漸漸冷卻,人們開始意識到這項新技術在當前形式下仍有侷限。雖然它最終必然會讓一部分人類變得多餘,但絕不會像所有人宣揚的那樣,在這麼早的階段就成為點金石。
我認為,我們可能正接近LLM和Agent的蜜月期尾聲。請不要誤解,我不是説這項技術不會有價值,而是説我們將在一段時間內看到更少的樂觀情緒,直到下一個夏季來臨。
這個寒冬並非源於技術停滯或觸頂——我對這一點沒有足夠的發言權——而是由於缺乏採用和技術擴散。但作為從加密貨幣行業過來的人,我可以比較權威地告訴你,寒冬是排除噪音、專注建設的好時機,而現在正是致力於人工智能採用的最佳時機。
> 特別感謝Pablo Grueso在乘車途中與我簡短討論後,幫助我塑造並堅定了這個觀點。乾杯!
什麼是“Token最大化”
大約十八個月裏,企業人工智能採用的主流理論很簡單:員工使用AI越多越好。每個人都必須開始採用這項新技術,成為AI原生,探索如何提升自身能力和產出。AI使用量成為核心指標。公司建立內部排行榜,設定Token消耗目標,衡量AI成功與否的方式——就像當年衡量數字化轉型一樣——看的是採用率,而非成果。
我指的就是臭名昭著的“Token最大化”:儘可能多地向模型輸入Token,最大化吞吐量,從而最大化結果產出。其隱含的假設是:更多輸入會產生更多輸出,進而帶來更多價值。我至今仍在問自己,最初怎麼會有人覺得這是個好主意。
例如,亞馬遜曾運行一個名為KiroRank的內部排行榜,根據工程師在公司AI開發平台Kiro上的活躍度進行評分。這本是衡量工具使用情況的合理方法。但結果可想而知:工程師們分配自主agent運行不必要的任務,只為提升排名。Token消耗上升,但有用工作並未隨之增加(哦,驚喜!)。亞馬遜高級副總裁Dave Treadwell最終告訴員工:“請不要為了使用AI而使用AI。要用AI來幫助解決客户問題、解決業務問題、進行創新。”然而,排行榜激勵的並非這種行為,而是消耗更多Token(去你的上下文壓縮)。顯然,排行榜被關閉了。
亞馬遜取而代之的是更合理的指標:跟蹤工程師是否持續用AI產出有用的代碼,而非消耗了多少Token(一個更主觀的指標,更難衡量,但更符合他們真正追求的輸出)。
這本身並非AI的問題,而是另一個政策設計未考慮目標與激勵的案例。但當AI即將解決一切問題時,更多Token可能意味着更多解決方案。結果證明,AI可能需要適當引導才能解決問題,而策略和領域知識並不消耗那麼多Token,且需要人類真正工作。
第一個警告信號:我們可能尚未弄清楚如何採用這項技術。
為何不再有意義
關於Token最大化失敗的投資回報率,最清晰的數據來自Uber。該公司CTO透露,Uber在2026年4月就用完了整個Claude Code預算。COO Andrew Macdonald隨後公開説出了許多人的想法:“這種聯繫還不存在”,即AI Token消耗與用户真正想要的功能之間的聯繫。Uber踩下了剎車(再次,哦,驚喜!)。
因做空2008年房地產市場而成名的Michael Burry將AI Token最大化描述為“瘋狂、倉促、暫時的階段”,由“配額驅動、排行榜驅動、管理層強制的過度消費”所驅動。他明確將其與1990年代末的互聯網泡沫相提並論,並通過購買100萬股Nvidia股票的看跌期權來支持自己的觀點。我們稍後會回到這個與互聯網泡沫的比較。
《財富》雜誌的分析更正式:大多數公司停留在AI採用的第一或第二階段,即基本實施和工作流重新設計。真正的價值需要業務重塑,而大多數現有企業並未真正嘗試。吃掉它們午餐的是那些從開始就是AI原生的公司。
這並不是説AI不起作用。而是説我們仍然不知道如何高效地使用和應用AI。這就是Token最大化作為企業AI採用和熟練度指標失敗的原因。優化測量而非結果,只會產生你預期的東西:大量活動,但價值不高。
如果每次我從朋友和同事那裏聽到“自從AI出現,我比以往工作更努力,好像永遠沒有時間趕上新進展”這句話時都能得到一分錢,那我早就發財了。而我總是問他們同樣的問題:“你認為你產出的價值比AI之前更多嗎?”劇透:答案差異很大(相關地,如果你還沒讀過,現在可能是個好時機來讀一下我幾個月前寫的關於“我們不是害怕AI,而是害怕被邊緣化”的文章)。
這又是一個支持我論點的事實——現在是開始採用AI的最佳時機,但公眾敍事將開始變冷。
方便的藉口
但AI採用不僅成為某些人的執念,也成為其他人的藉口。在2025年到2026年間,出現了一種模式:公司以AI為理由宣佈大規模裁員。亞馬遜(約30,000人)、UPS(約48,000人)、甲骨文(約30,000人)、微軟(約23,000人)、Salesforce(約5,000人)。僅2026年就有約80,000個工作崗位消失,45位以上CEO將AI列為驅動因素(見我在研究中發現的這個來源)。
Jack Dorsey將Block從超過10,000人削減至不到6,000人,並明確表示:“我們做出這個決定不是因為公司陷入困境。我們的業務很強……但有些事情變了。”Coinbase的Brian Armstrong也類似地説:“我看到工程師使用AI在幾天內完成過去需要團隊幾周才能完成的工作”(然後他們發生了大規模宕機)。他宣佈“純經理”的終結,並將目標描述為“將Coinbase重建為一個智能,人類圍繞其邊緣對齊。”
我不認為這些CEO在撒謊。AI確實改變了用更小團隊實現更多可能的方式。但在許多案例中,AI也充當了社會可接受的框架,用以合理化無論如何都會發生的收縮。公司在低利率繁榮期過度招聘,調整是不可避免的。AI提供了一個乾淨的故事,將原因從“我們做出了糟糕的招聘決策”轉變為“技術發生了變化”。兩者可能同時成立,但我暫時不相信AI敍事。
我預期(至少目前)不會出現大規模淨失業浪潮。更可能的短期模式是收縮,同時人們和組織弄清楚AI到底是什麼,隨後當新一代AI原住民專業人士出現,懂得如何正確使用這些工具時,再迎來擴張。這正是變革性技術擴散的歷史模式。它很少是一條平滑的上升曲線,而且幾乎從未在第一波浪潮中被講述。
我本人是AI擁躉,認為AI是一種不同的技術,將帶來一場完全不同的革命,但仍然覺得為時過早。敍事上很好,但我怎麼強調都不為過:我們還沒有找到利用這項技術的最佳方式。
代碼庫的後悔
以下是説服我寫下“寒冬將至”的原因,源於我們仍在摸索如何利用這項技術。一些開發者開始公開表達,人數越來越多,他們後悔過度依賴AI構建代碼庫。
高級開發者Dragos Nedelcu寫了一篇關於在生產項目中用AI生成約15萬行代碼的經歷。幾個月後,他面對一片混亂:重複邏輯幾乎無複用性,到處是死代碼,單元測試毫無意義斷言,級聯bug同時影響七個或更多文件。他的結論直白:“從頭開始比糾正數百行混亂的AI生成代碼更快。”另一位工程師在七個月後批量刪除了14,000行AI生成代碼,代碼庫從41,000行縮減至27,000行,但保留了所有功能,bug率下降了73%。
老實説,我們都在與編碼agent的關係中遇到過這種情況(至少我遇到過)。
HVM編程語言的構建者Victor Taelin(我已經關注他多年)在X上實時記錄了他的痛苦。他用Opus在一天內實現了一種新方法:3000行C代碼,性能提升5倍。然後花了接下來的15小時審計,發現了他所説的“腦殘問題”:模型默默地假設HVM5本應處理欠應用和過應用的函數,併為此實現了一個龐大的系統,卻從未詢問過。這些本都不該存在。
他的結論顯示了另一個我認為我們尚未學會有效利用這項技術的原因:“我在前5小時內從0到了95%。然而,15小時後,它仍然不是100%……如果我必須全部閲讀、全部審查以確保沒有腦殘代碼……那麼用AI實現了什麼?除了那多巴胺期待?”
最後那個短語,“多巴胺期待”,是我讀到過的最誠實的“氛圍編碼”描述。哦,那美麗的AI垃圾老虎機,我們都如此上癮了。
西班牙開發者Luis Ángel Alda很好地闡述了結構性問題:AI會產生“局部正確、全局不連貫”的系統。模型擅長優化下一步。而架構恰恰相反,是一項需要長期視角和直覺的學科,需要他所謂的“感受軟件”。這來自多年構建、看着它們失敗並重建的經驗。AI不具備這種能力。它擁有的是極好的局部模式補全,這在很多事情上有用,但在需要全局連貫時卻有害。
再次強調,這並不意味着AI編碼無用。我經常使用它,它確實改變了我能交付多少東西。但用AI作為工具並帶有判斷力與將其作為判斷力的替代品是有區別的。發佈這些後悔故事的人大多做了後者——他們交出了架構,而不僅僅是樣板代碼。
這裏真正重要的技能是知道何時使用、何時不使用,而這正是這個寒冬所要解決的。這需要時間和積累的失敗來培養。我們都在學習,包括我自己。“人類/工程品味”仍然非常必要。
[原文因AI成本控制而截斷]