AI的形態:鋸齒狀前沿、瓶頸與突出點
AI的能力分佈不均,被稱為“鋸齒狀前沿”。進步常被瓶頸阻礙,一旦解決,就會帶來突飛猛進,如谷歌Nano Banana Pro提升了圖像生成能力,解鎖了PPT製作等新功能。
早在2023年,我和合著者創造了一個術語來描述AI奇特的能力:某些工作做得極好,另一些卻極差,且與人類直覺的難度不匹配。我們稱之為“鋸齒狀前沿”,它至今仍是AI的核心特徵和困惑之源。AI能在醫學診斷或高難度數學上超越人類,卻仍在簡單視覺謎題或自動售貨機操作上表現糟糕。這種能力的不可預測性使得AI比看起來更難使用。
我認為鋸齒狀將長期存在,但其含義尚不確定。Tomas Pueyo在X上發佈了一張熱門圖片,描繪了他的觀點:不斷擴大的前沿將超越鋸齒狀。即使AI在某些方面相對較差,但人類能力前沿基本固定,而AI能力快速增長。如果AI在運行自動售貨機上相對較差,但最終仍比任何人類都強,那又有什麼關係呢?
然而,這種觀點忽略了工作和技術的一些關鍵方面。首先,前沿確實非常鋸齒狀,可能我們永遠不會得到完全覆蓋人類任務的超級智能。例如,鋸齒狀的一個重要來源是LLM無法永久記住新任務並從中學習。許多AI公司正在尋求解決方案,但這個問題可能比研究人員預期的更難解決。沒有記憶,AI將難以完成人類能做的許多任務,即使在其他領域超越人類。Colin Fraser繪製了AI-人類重疊的兩種可能情況。AI在某些領域確實超越人類,但在其他領域要麼遠低於人類水平,要麼根本不重疊。如果真是這樣,AI將創造與人類互補的工作機會,因為我們各自擁有不同的能力。
這些是概念圖,但一組科學家最近試圖繪製AI能力圖,發現其增長不均勻,正如鋸齒狀前沿所預測的那樣。閲讀、數學、常識、推理——這些方面AI進步迅速。但記憶進展甚微。更好的提示或模型(如GPT-5.2比GPT-5好得多)可能改變前沿形狀,但鋸齒狀依然存在。
瓶頸
即使是微小的鋸齒狀也可能產生問題,使超級智能AI無法自動完成任務。系統的功能受限於其最差的組件,這就是瓶頸。有些瓶頸是因為AI頑固地低於人類水平。LLM的視覺系統不足以讀取醫學影像,因此無法替代醫生;LLM過於有幫助而缺乏反駁,因此無法替代治療師;幻覺雖減少但依然存在,因此無法執行需要100%準確率的任務。隨着前沿擴展,這些問題可能消失,但弱點並非唯一瓶頸。
有些瓶頸與能力無關。即使AI能比傳統方法更快識別候選藥物,臨牀試驗仍需實際患者招募、給藥和監測。FDA仍需人工審查申請。即使AI使好藥物想法增加十倍,瓶頸從發現速度轉移到審批速度,而機構以自身速度運行。
即使在AI幾乎完全超越人類的領域,人類可能仍需處理邊緣案例。例如,一項研究使用AI重現Cochrane綜述(深度研究的薈萃分析)。研究人員發現,GPT-4.1在適當提示和支持下,“在兩天內重現並更新了整期Cochrane綜述(12篇),相當於約12人年的傳統系統綜述工作。”AI篩選了超過14.6萬條引用,閲讀全文,提取數據,進行統計分析,準確度甚至超過人類。但AI無法訪問補充文件或給作者發郵件請求未公開數據,而人類審稿人通常這樣做。這不到1%的錯誤意味着無法完全自動化。12人年變成兩天,但需要懂科研流程的人類處理邊緣情況。
這就是模式:鋸齒狀產生瓶頸,瓶頸意味着即使非常智能的AI也難以輕易替代人類。這至少在防止快速失業方面是好的,但也在阻礙科研加速方面令人沮喪。瓶頸也促使AI公司專注於改進阻礙進展的能力,就像數學能力一旦成為明顯障礙就迅速提升。歷史學家Thomas Hughes稱此為“反向突出點”——單個技術或社會問題阻礙系統飛躍。
反向突出點
瓶頸可能造成AI永遠無法完成某事的印象,而實際上進展受限於單個鋸齒狀弱點。當弱點成為反向突出點,AI實驗室突然解決該問題時,整個系統就會飛躍。
最近最有力的例子是谷歌的新圖像生成AI——Nano Banana Pro。它結合了出色的圖像創建模型和能夠指導模型、根據需要查找信息的智能AI。例如,當我提示生成“水獺科學家用白板解釋Ethan Mollick的水獺飛機WiFi測試,並展示通過照片牆”時,得到了包含連貫文字、不同角度、陰影且無明顯拼寫錯誤的圖像。而2021年同樣提示只能生成拙劣圖像。
事實上,出色的圖像生成曾是許多新能力的瓶頸。例如,每個主要AI公司都試圖讓AI製作PowerPoint,方法是讓AI編寫代碼從頭創建。這是一個艱難的過程,但Claude和ChatGPT都有改進,儘管幻燈片略顯枯燥。而Google的NotebookLM結合智能Gemini和Nano Banana Pro,不是通過代碼,而是將每張幻燈片作為單個圖像創建。當圖像質量低時這不可能,現在突然實現了。由於圖像靈活,我可以嘗試不同風格:手繪風格、1980年代朋克風格、高對比度亮黃色背景,當然還有水獺飛機主題。
在很多方面,困難部分已在Claude和Gemini的前沿之內,它們能根據源材料、主題和想法總結成幻燈片。幻覺很少,來源正確。它們能創造水獺類比或朋克主題描述。這是智力密集部分,AI一年多前就已具備。但製作幻燈片或其他視覺呈現曾是使文本牆有用的瓶頸。問題尚未完全解決:圖像不完美且無法編輯(據説很快會修復),但方向已明朗。
多次躍進
即使AI在分析和PPT上超越人類,我認為它不一定取代諮詢師和設計師的工作。這些工作包含許多Jagged Frontier上AI不擅長而人類擅長的任務:你能收集信息並獲得多方支持嗎?你能理解決定人們真正需求的潛規則嗎?你能提出獨特方案解決深層問題,並區別於AI材料嗎?鋸齒狀前沿為人類工作提供了許多機會。
然而,我們應該期待躍進,即專注於反向突出點導致瓶頸突然消除。以前只有人類能做的領域變成AI也能做。如果你想了解AI的發展方向,不要看基準測試,而要看瓶頸。當一個瓶頸被打破,所有被阻礙的東西就會湧出。圖像生成曾是演示、文檔、視覺通信的瓶頸,現在不是了。下一個瓶頸是什麼?記憶?實時學習?在物理世界中採取行動的能力?
現在,某個AI實驗室正在將每個瓶頸視為反向突出點。當它們突破時,我們不會有太多預警。但鋸齒狀前沿是雙刃劍。到目前為止,每次躍進都會留下更多需要人類的邊緣。未來會有許多躍進,也會有許多機會。關注兩者。