AI News HubLIVE
站內改寫4 分鐘閱讀

Claude Dispatch 與介面的力量

AI的能力遠超人們想象,但大部分使用者僅透過聊天機器人訪問,這導致了認知負擔。文章探討了專門化介面(如程式設計代理Claude Code)、Google的實驗性工具、以及個人代理(如OpenClaw和Claude Cowork)如何透過更好的介面釋放AI潛力。

來源One Useful Thing作者: Ethan Mollick

AI已經遠比大多數人意識到的更強大。這種所謂的“能力過剩”很大程度上並非來自AI的極限(儘管它們確實還有很多限制),而是源於人們與AI互動的方式。絕大多數人透過聊天機器人訪問AI,而且通常是免費版本,模型能力較弱。聊天機器人適合快速提問,但對於真正的工作來說,它是一種糟糕的方式。

事實上,最近的研究表明,使用聊天機器人介面工作時,我們會付出一種“心智稅”。一篇新論文讓一小群金融專業人士用GPT-4o1完成複雜的估值任務,並透過逐輪對話記錄測量了他們的認知負荷。人們確實透過AI獲得了生產力提升,但部分提升被AI呈現資訊的方式抵消了:巨大的文本牆、提供探索新主題的建議、以及龐雜的討論。聊天機器人介面成了障礙,而不是工作本身。一旦對話變得混亂,就會一直混亂下去。AI被最佳化為有用,只會映象使用者提供的任何雜亂結構,而使用者則被淹沒,無法重新組織。雙方都在加劇問題。受影響最大的是經驗較少的員工,而這正是最需要AI幫助的人群——如果他們能跟得上自己在做什麼的話。

如果你用過聊天機器人完成工作,這應該不奇怪。你問一個具體問題,得到五段話(答案在其中某處!),同時AI還提出三個你沒問的新內容。介面本身造成了認知成本,壓倒了AI智慧帶來的好處。那麼,更好的介面是什麼樣的呢?

專門化介面 一種選擇是為特定工作或任務構建專門的介面。在所有專門的AI介面中,唯一真正完善的是程式設計介面。這完全在意料之中:AI實驗室由程式設計師組成,模型在程式碼上經過大量訓練,構建這些工具的人常常是為自己打造的。

我之前寫過Claude Code,Anthropic的編碼代理,可以自主工作數小時。OpenAI的Codex和Google的Antigravity也做類似的事情。我用Claude Code做了很多事,從賺點小錢到製作遊戲,完全沒碰程式碼。我也覺得Codex非常有用,能力相當。這些工具很棒,但實際上是面向程式設計師的。它們假設你懂Python和Git。它們的介面看起來像1980年代的計算機實驗室。對於99%的非開發者知識工作者來說,這些強大的AI工具並未針對他們最佳化。

Pomelli, Stitch, 和 NotebookLM 在所有AI實驗室中,Google似乎在嘗試為其他職業構建專門介面方面做得最多。雖然都有點粗糙,但它們展示了當AI工具為其他型別知識專業人士構建時,未來可能是什麼樣子。Google的Stitch暗示了AI原生設計可能的樣子——一個無限畫布,你用自然語言描述一個應用,然後得到多個相互連線的螢幕,帶有一致的設計系統。類似地,Pomelli讓你貼上網站URL,自動生成品牌一致的社交媒體活動,它使用營銷語言而非提示,從而降低技術感。而最知名的NotebookLM提供了一種研究、展示和處理多樣化資訊源的方式。每一個都展示了未來的方向,但還不是像Claude Code對程式設計師那樣的變革性工具。但還有另一種介面增長迅速:個人代理。

使用你已經擁有的介面 如果你還沒聽說過,OpenClaw是一個開源AI代理,符號是紅龍蝦,它是一個安全噩夢,但已成為歷史上增長最快的開源專案。OpenClaw之所以成功,是因為它是一個真正的個人代理。系統設計讓你透過WhatsApp、Telegram或Slack與你AI代理對話,這些是你與人們聊天時使用的相同應用。你讓它檢視郵件、訂位、找檔案,它就在你的電腦上執行。它以一種事後看來顯而易見的方式解決了介面問題:不是聊天機器人或命令列,而是讓你像與人交談一樣與AI對話,使用你已經非常熟悉的介面,如WhatsApp。

然而,OpenClaw很難用,且安全風險大。Anthropic的答案是帶有Dispatch的Claude Cowork。Cowork於1月推出,是面向知識工作者的Claude Code版本。它透過桌面工作區讓Claude訪問你的本地檔案和應用程式。它還透過聯結器連線到幾十個應用,如果沒有聯結器,則退化為直接控制你的滑鼠和鍵盤。Dispatch在幾周前釋出,增加了關鍵功能:你可以從手機給Claude發訊息,而它在你的桌面上工作。你掃描二維碼,手機就變成了一個遠端控制,控制著坐在你電腦前的AI代理。

結合使用Dispatch和Claude Code,創造了一種與能幹助手對話的感覺。例如,我從手機上讓Claude準備一份晨間簡報,它讀取我的日曆、郵件和線上頻道,然後給我一份下一步需要做什麼的報告。但Cowork也能處理更復雜的工作。從手機上,我讓它檢視我最近做的簡報,檢查幻燈片3中的圖表是否是最新的,如果不是,就更新。你可以看到它在一個地方卡住了(某個網站阻止它下載檔案),但除此之外,結果非常令人印象深刻。它開啟並“檢視”了PowerPoint,並在整個電腦中搜尋更新的資料。當我給它一個更新的線上論文連結時,它下載了PDF,找到了較新的圖表,裁剪出圖表影像,併為我更新了PowerPoint。這是複雜且困難的工作,即使不總是無縫,通常也足夠接近,能節省大量時間。

它像OpenClaw一樣靈活嗎?不。Cowork被沙盒化,更安全但更受限(但這並不意味著沒有安全風險)。聯結器生態系統在增長但不完整。Cowork能使用你的電腦,這個概念令人印象深刻,但在實踐中容易出錯。但核心見解與OpenClaw偶然發現的一樣。人們不想要聊天機器人。他們想要一個能在實際檔案上工作、使用實際工具、以他們與人交流的方式可訪問的代理。

按需介面 所有這些都假設我們需要預先決定介面。但最新的AI系統實際上可以為你構建介面。例如,過去幾周,Claude獲得了在對話中直接生成視覺化圖表的能力。這些不是靜態影像。它們是互動式的、可調整的,Claude可以隨著你提出後續問題而修改它們。

這解決了介面問題的一種不同方法。不是讓公司為每種工作構建專門介面,而是AI即時生成合適的介面。我猜想未來不是單一介面統治一切,而是AI生成適用於特定時刻的介面:桌面上的代理、對話中的圖表、解決某個問題的自定義應用。我們正從適應AI的介面轉向AI適應你的介面。

AI能力一直領先於AI可訪問性。模型已經足夠聰明,能做非凡的事情,但我們卻讓人們透過聊天機器人訪問這種智慧。而且,正如認知負荷研究表明的,聊天機器人格式正在積極阻礙他們。隨著介面改進,我們將看到當更多人能實際使用AI能力時會發生什麼。每一個縮小哪怕部分差距的新介面都將感覺像AI能力的飛躍,即使模型本身沒有變化(儘管它們仍在變化)。我猜測人們有時表達的“AI失望”並非來自AI糟糕,而是介面不合適。我們建造了近代史上最強大的技術之一,卻讓人們透過打字進入聊天視窗來訪問它。這很快將會改變。