Claude Dispatch 與接口的力量
AI的能力遠超人們想象,但大部分用户僅通過聊天機器人訪問,這導致了認知負擔。文章探討了專門化接口(如編程代理Claude Code)、Google的實驗性工具、以及個人代理(如OpenClaw和Claude Cowork)如何通過更好的接口釋放AI潛力。
AI已經遠比大多數人意識到的更強大。這種所謂的“能力過剩”很大程度上並非來自AI的極限(儘管它們確實還有很多限制),而是源於人們與AI互動的方式。絕大多數人通過聊天機器人訪問AI,而且通常是免費版本,模型能力較弱。聊天機器人適合快速提問,但對於真正的工作來説,它是一種糟糕的方式。
事實上,最近的研究表明,使用聊天機器人界面工作時,我們會付出一種“心智税”。一篇新論文讓一小羣金融專業人士用GPT-4o1完成複雜的估值任務,並通過逐輪對話記錄測量了他們的認知負荷。人們確實通過AI獲得了生產力提升,但部分提升被AI呈現信息的方式抵消了:巨大的文本牆、提供探索新主題的建議、以及龐雜的討論。聊天機器人界面成了障礙,而不是工作本身。一旦對話變得混亂,就會一直混亂下去。AI被優化為有用,只會鏡像用户提供的任何雜亂結構,而用户則被淹沒,無法重新組織。雙方都在加劇問題。受影響最大的是經驗較少的員工,而這正是最需要AI幫助的人羣——如果他們能跟得上自己在做什麼的話。
如果你用過聊天機器人完成工作,這應該不奇怪。你問一個具體問題,得到五段話(答案在其中某處!),同時AI還提出三個你沒問的新內容。界面本身造成了認知成本,壓倒了AI智能帶來的好處。那麼,更好的界面是什麼樣的呢?
專門化界面 一種選擇是為特定工作或任務構建專門的界面。在所有專門的AI界面中,唯一真正完善的是編程界面。這完全在意料之中:AI實驗室由程序員組成,模型在代碼上經過大量訓練,構建這些工具的人常常是為自己打造的。
我之前寫過Claude Code,Anthropic的編碼代理,可以自主工作數小時。OpenAI的Codex和Google的Antigravity也做類似的事情。我用Claude Code做了很多事,從賺點小錢到製作遊戲,完全沒碰代碼。我也覺得Codex非常有用,能力相當。這些工具很棒,但實際上是面向程序員的。它們假設你懂Python和Git。它們的界面看起來像1980年代的計算機實驗室。對於99%的非開發者知識工作者來説,這些強大的AI工具並未針對他們優化。
Pomelli, Stitch, 和 NotebookLM 在所有AI實驗室中,Google似乎在嘗試為其他職業構建專門界面方面做得最多。雖然都有點粗糙,但它們展示了當AI工具為其他類型知識專業人士構建時,未來可能是什麼樣子。Google的Stitch暗示了AI原生設計可能的樣子——一個無限畫布,你用自然語言描述一個應用,然後得到多個相互連接的屏幕,帶有一致的設計系統。類似地,Pomelli讓你粘貼網站URL,自動生成品牌一致的社交媒體活動,它使用營銷語言而非提示,從而降低技術感。而最知名的NotebookLM提供了一種研究、展示和處理多樣化信息源的方式。每一個都展示了未來的方向,但還不是像Claude Code對程序員那樣的變革性工具。但還有另一種界面增長迅速:個人代理。
使用你已經擁有的界面 如果你還沒聽説過,OpenClaw是一個開源AI代理,符號是紅龍蝦,它是一個安全噩夢,但已成為歷史上增長最快的開源項目。OpenClaw之所以成功,是因為它是一個真正的個人代理。系統設計讓你通過WhatsApp、Telegram或Slack與你AI代理對話,這些是你與人們聊天時使用的相同應用。你讓它查看郵件、訂位、找文件,它就在你的電腦上執行。它以一種事後看來顯而易見的方式解決了界面問題:不是聊天機器人或命令行,而是讓你像與人交談一樣與AI對話,使用你已經非常熟悉的界面,如WhatsApp。
然而,OpenClaw很難用,且安全風險大。Anthropic的答案是帶有Dispatch的Claude Cowork。Cowork於1月推出,是面向知識工作者的Claude Code版本。它通過桌面工作區讓Claude訪問你的本地文件和應用程序。它還通過連接器連接到幾十個應用,如果沒有連接器,則退化為直接控制你的鼠標和鍵盤。Dispatch在幾周前發佈,增加了關鍵功能:你可以從手機給Claude發消息,而它在你的桌面上工作。你掃描二維碼,手機就變成了一個遠程控制,控制着坐在你電腦前的AI代理。
結合使用Dispatch和Claude Code,創造了一種與能幹助手對話的感覺。例如,我從手機上讓Claude準備一份晨間簡報,它讀取我的日曆、郵件和在線頻道,然後給我一份下一步需要做什麼的報告。但Cowork也能處理更復雜的工作。從手機上,我讓它查看我最近做的演示文稿,檢查幻燈片3中的圖表是否是最新的,如果不是,就更新。你可以看到它在一個地方卡住了(某個網站阻止它下載文件),但除此之外,結果非常令人印象深刻。它打開並“查看”了PowerPoint,並在整個電腦中搜索更新的數據。當我給它一個更新的在線論文鏈接時,它下載了PDF,找到了較新的圖表,裁剪出圖表圖像,併為我更新了PowerPoint。這是複雜且困難的工作,即使不總是無縫,通常也足夠接近,能節省大量時間。
它像OpenClaw一樣靈活嗎?不。Cowork被沙盒化,更安全但更受限(但這並不意味着沒有安全風險)。連接器生態系統在增長但不完整。Cowork能使用你的電腦,這個概念令人印象深刻,但在實踐中容易出錯。但核心見解與OpenClaw偶然發現的一樣。人們不想要聊天機器人。他們想要一個能在實際文件上工作、使用實際工具、以他們與人交流的方式可訪問的代理。
按需接口 所有這些都假設我們需要預先決定接口。但最新的AI系統實際上可以為你構建接口。例如,過去幾周,Claude獲得了在對話中直接生成可視化圖表的能力。這些不是靜態圖像。它們是交互式的、可調整的,Claude可以隨着你提出後續問題而修改它們。
這解決了接口問題的一種不同方法。不是讓公司為每種工作構建專門接口,而是AI即時生成合適的接口。我猜想未來不是單一接口統治一切,而是AI生成適用於特定時刻的接口:桌面上的代理、對話中的圖表、解決某個問題的自定義應用。我們正從適應AI的接口轉向AI適應你的接口。
AI能力一直領先於AI可訪問性。模型已經足夠聰明,能做非凡的事情,但我們卻讓人們通過聊天機器人訪問這種智能。而且,正如認知負荷研究表明的,聊天機器人格式正在積極阻礙他們。隨着接口改進,我們將看到當更多人能實際使用AI能力時會發生什麼。每一個縮小哪怕部分差距的新接口都將感覺像AI能力的飛躍,即使模型本身沒有變化(儘管它們仍在變化)。我猜測人們有時表達的“AI失望”並非來自AI糟糕,而是接口不合適。我們建造了近代史上最強大的技術之一,卻讓人們通過打字進入聊天窗口來訪問它。這很快將會改變。