2025-12-21 01:32 UTC+8站內改寫4 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

AI的形態：鋸齒狀前沿、瓶頸與突出點

AI的能力分佈不均，被稱為“鋸齒狀前沿”。進步常被瓶頸阻礙，一旦解決，就會帶來突飛猛進，如谷歌Nano Banana Pro提升了圖像生成能力，解鎖了PPT製作等新功能。

來源One Useful Thing作者: Ethan Mollick

早在2023年，我和合著者創造了一個術語來描述AI奇特的能力：某些工作做得極好，另一些卻極差，且與人類直覺的難度不匹配。我們稱之為“鋸齒狀前沿”，它至今仍是AI的核心特徵和困惑之源。AI能在醫學診斷或高難度數學上超越人類，卻仍在簡單視覺謎題或自動售貨機操作上表現糟糕。這種能力的不可預測性使得AI比看起來更難使用。

我認為鋸齒狀將長期存在，但其含義尚不確定。Tomas Pueyo在X上發佈了一張熱門圖片，描繪了他的觀點：不斷擴大的前沿將超越鋸齒狀。即使AI在某些方面相對較差，但人類能力前沿基本固定，而AI能力快速增長。如果AI在運行自動售貨機上相對較差，但最終仍比任何人類都強，那又有什麼關係呢？

然而，這種觀點忽略了工作和技術的一些關鍵方面。首先，前沿確實非常鋸齒狀，可能我們永遠不會得到完全覆蓋人類任務的超級智能。例如，鋸齒狀的一個重要來源是LLM無法永久記住新任務並從中學習。許多AI公司正在尋求解決方案，但這個問題可能比研究人員預期的更難解決。沒有記憶，AI將難以完成人類能做的許多任務，即使在其他領域超越人類。Colin Fraser繪製了AI-人類重疊的兩種可能情況。AI在某些領域確實超越人類，但在其他領域要麼遠低於人類水平，要麼根本不重疊。如果真是這樣，AI將創造與人類互補的工作機會，因為我們各自擁有不同的能力。

這些是概念圖，但一組科學家最近試圖繪製AI能力圖，發現其增長不均勻，正如鋸齒狀前沿所預測的那樣。閲讀、數學、常識、推理——這些方面AI進步迅速。但記憶進展甚微。更好的提示或模型（如GPT-5.2比GPT-5好得多）可能改變前沿形狀，但鋸齒狀依然存在。

瓶頸

即使是微小的鋸齒狀也可能產生問題，使超級智能AI無法自動完成任務。系統的功能受限於其最差的組件，這就是瓶頸。有些瓶頸是因為AI頑固地低於人類水平。LLM的視覺系統不足以讀取醫學影像，因此無法替代醫生；LLM過於有幫助而缺乏反駁，因此無法替代治療師；幻覺雖減少但依然存在，因此無法執行需要100%準確率的任務。隨着前沿擴展，這些問題可能消失，但弱點並非唯一瓶頸。

有些瓶頸與能力無關。即使AI能比傳統方法更快識別候選藥物，臨牀試驗仍需實際患者招募、給藥和監測。FDA仍需人工審查申請。即使AI使好藥物想法增加十倍，瓶頸從發現速度轉移到審批速度，而機構以自身速度運行。

即使在AI幾乎完全超越人類的領域，人類可能仍需處理邊緣案例。例如，一項研究使用AI重現Cochrane綜述（深度研究的薈萃分析）。研究人員發現，GPT-4.1在適當提示和支持下，“在兩天內重現並更新了整期Cochrane綜述（12篇），相當於約12人年的傳統系統綜述工作。”AI篩選了超過14.6萬條引用，閲讀全文，提取數據，進行統計分析，準確度甚至超過人類。但AI無法訪問補充文件或給作者發郵件請求未公開數據，而人類審稿人通常這樣做。這不到1%的錯誤意味着無法完全自動化。12人年變成兩天，但需要懂科研流程的人類處理邊緣情況。

這就是模式：鋸齒狀產生瓶頸，瓶頸意味着即使非常智能的AI也難以輕易替代人類。這至少在防止快速失業方面是好的，但也在阻礙科研加速方面令人沮喪。瓶頸也促使AI公司專注於改進阻礙進展的能力，就像數學能力一旦成為明顯障礙就迅速提升。歷史學家Thomas Hughes稱此為“反向突出點”——單個技術或社會問題阻礙系統飛躍。

反向突出點

瓶頸可能造成AI永遠無法完成某事的印象，而實際上進展受限於單個鋸齒狀弱點。當弱點成為反向突出點，AI實驗室突然解決該問題時，整個系統就會飛躍。

最近最有力的例子是谷歌的新圖像生成AI——Nano Banana Pro。它結合了出色的圖像創建模型和能夠指導模型、根據需要查找信息的智能AI。例如，當我提示生成“水獺科學家用白板解釋Ethan Mollick的水獺飛機WiFi測試，並展示通過照片牆”時，得到了包含連貫文字、不同角度、陰影且無明顯拼寫錯誤的圖像。而2021年同樣提示只能生成拙劣圖像。

事實上，出色的圖像生成曾是許多新能力的瓶頸。例如，每個主要AI公司都試圖讓AI製作PowerPoint，方法是讓AI編寫代碼從頭創建。這是一個艱難的過程，但Claude和ChatGPT都有改進，儘管幻燈片略顯枯燥。而Google的NotebookLM結合智能Gemini和Nano Banana Pro，不是通過代碼，而是將每張幻燈片作為單個圖像創建。當圖像質量低時這不可能，現在突然實現了。由於圖像靈活，我可以嘗試不同風格：手繪風格、1980年代朋克風格、高對比度亮黃色背景，當然還有水獺飛機主題。

在很多方面，困難部分已在Claude和Gemini的前沿之內，它們能根據源材料、主題和想法總結成幻燈片。幻覺很少，來源正確。它們能創造水獺類比或朋克主題描述。這是智力密集部分，AI一年多前就已具備。但製作幻燈片或其他視覺呈現曾是使文本牆有用的瓶頸。問題尚未完全解決：圖像不完美且無法編輯（據説很快會修復），但方向已明朗。

多次躍進

即使AI在分析和PPT上超越人類，我認為它不一定取代諮詢師和設計師的工作。這些工作包含許多Jagged Frontier上AI不擅長而人類擅長的任務：你能收集信息並獲得多方支持嗎？你能理解決定人們真正需求的潛規則嗎？你能提出獨特方案解決深層問題，並區別於AI材料嗎？鋸齒狀前沿為人類工作提供了許多機會。

然而，我們應該期待躍進，即專注於反向突出點導致瓶頸突然消除。以前只有人類能做的領域變成AI也能做。如果你想了解AI的發展方向，不要看基準測試，而要看瓶頸。當一個瓶頸被打破，所有被阻礙的東西就會湧出。圖像生成曾是演示、文檔、視覺通信的瓶頸，現在不是了。下一個瓶頸是什麼？記憶？實時學習？在物理世界中採取行動的能力？

現在，某個AI實驗室正在將每個瓶頸視為反向突出點。當它們突破時，我們不會有太多預警。但鋸齒狀前沿是雙刃劍。到目前為止，每次躍進都會留下更多需要人類的邊緣。未來會有許多躍進，也會有許多機會。關注兩者。