AI News HubLIVE
站內改寫4 分鐘閱讀

本週AI動態:多供應商戰略

在本期節目中,Andreas Welsch和Matt Palmer討論了美國對前沿AI模型出口限制的影響、委託給AI代理的挑戰,以及Sakana AI的新Fugu系統作為多供應商編排解決方案。他們強調了採用多供應商戰略以避免基礎設施依賴的必要性。

來源O'Reilly AI & ML Radar作者: Michelle Smith

本期的《本週AI動態》在大多數團隊習以為常的AI基礎設施突然變得不那麼穩定的背景下展開。Andreas Welsch和Matt Palmer一起探討了美國政府針對前沿AI模型的出口限制對從業者的實際意義,為何將任務委託給代理並不像聽起來那麼輕鬆,以及Sakana AI的新Fugu系統作為替代架構提供了什麼。

當API消失時

Andreas和Matt首先跟進Fable 5和Mythos傳奇的最新進展。美國政府現已放寬對Anthropic的Fable 5和Mythos Preview的限制,將其限制在100家精心挑選的美國組織。OpenAI隨後對GPT-5.6實施了類似限制,將早期訪問限制在大約20個組織。對於大多數從業者來說,這些模型突然消失了。

Andreas指出了許多歐洲技術領導者已經在思考的問題:出口限制可能反映了政策擔憂,但實際上這是一個基礎設施故事。如果你的技術棧依賴於一個可能在沒有警告的情況下變得不可用的前沿模型,那麼你已經將硬依賴構建到你的架構中,而不是一個供應商關係。

Matt從構建者的角度提出了一個補充觀點。任何在限制生效前花時間使用Fable 5的人都開始感受到它與其他可用選項之間的能力差距。當競爭對手擁有訪問許可權而你卻沒有時,這種差距就是一種商業風險。

這裡的討論落在了O'Reilly一直在關注的領域:組織應該牢記的問題是,如何以足夠的靈活性進行構建,以便在情況變化時能夠在模型之間路由。這意味著將多供應商戰略視為一個基本的架構要求,就像團隊對待資料庫可移植性或雲提供商的獨立性一樣。Anthropic表示希望訪問限制能迅速發展。這可能是真的……但也可能不是。假設它會發生似乎風險更大。

委託陷阱

隨著代理開發的普及,我們越來越多地聽到關於認知疲勞的訊息。隨著開發者將更多工作委託給編碼代理,他們報告了更高的疲憊度。上週,Andreas指出,另一篇文章流傳開來,突出顯示了更多工程師從孩子的足球賽到床上全天候檢查代理的故事。更多的代理執行意味著更多的會話需要監控,更多的審批需要給出,更多的半成品工作需要在早上審查。“它在你睡覺時執行”的承諾變成類似於同時管理多個工作流的輪班。

Matt指出:

我認為每個人現在都在某種程度上管理一群代理,或者只是協調這些代理之間的工作流。有時候感覺就像管理一箇中等規模的團隊。你一直髮送訊息,檢查事情是否完成。編寫程式碼曾經是一項非常放鬆的活動——你坐下,喝著咖啡,聽著爵士樂,放鬆下來,專注於一項任務——現在那種專注感似乎不再存在。

Andreas將這與哈佛商業評論今年早些時候的一項研究聯絡起來,該研究跟蹤了一家200人的軟體公司:隨著AI工具變得更有能力,人們開始承擔以前屬於相鄰角色的工作。產品經理在製作原型。開發人員在做設計工作。這些工具擴充套件了可能的感覺,而可能的感覺變成了必要的感覺,這意味著更多的工作,而不是更少。

Andreas還借鑑了自己從個人貢獻者到企業領導層的背景,在那裡委託是一種有框架的正式技能:任務是什麼?目標是什麼?應該使用什麼資料?好的輸出是什麼樣子?需要多長時間?今天大多數使用AI的專業人士在沒有培訓的情況下進行委託,即興制定委託協議。

這是一個行業的工具投資遠遠領先於使工具可用的組織技能投資的領域。更有能力的代理不會自動減輕負擔;它們以更難看到和管理的方式重新分配負擔。能夠長期良好實踐的從業者是那些弄清楚如何清晰設定範圍、高效檢查輸出並保護深度協作仍需要的專注工作時間的人。

一次API呼叫,多個模型

這一集的技術核心是Matt對Sakana Fugu的講解,這是一種來自東京研究實驗室Sakana AI的新型模型/多代理系統。Fugu是一個經過訓練的協調模型,它將你的查詢路由到一組前沿模型,組建一個專家團隊,並返回綜合結果,全部透過一個與OpenAI相容的端點。多代理編排完全發生在那個單一API呼叫之後。

Matt逐步講解了架構。查詢到達一個輕量級協調模型,該模型分配角色。一個模型思考最佳方法,另一個執行實現工作,第三個充當驗證者。系統可以是遞迴的,協調者將一部分工作以更小的規模透過相同的過程分配回去。Sakana稱之為學習編排,這一概念由兩篇論文支援:“TRINITY: An Evolved LLM Coordinator”和“Learning to Orchestrate Agents in Natural Language with the Conductor”,探討了系統如何學習路由和協調,而不是遵循手工設計的工作流。Matt還展示瞭如何透過curl將Fugu快速設定為直接API呼叫(它是OpenAI相容端點的即插即用替代品)、透過Codex框架(一行安裝程式)以及透過OpenRouter的開源OpenCode框架。Sakana聲稱其新穎的編排方法從現有模型中提取了更好的效能。Fugu的Ultra模型在Terminal-Bench等代理基準測試中與Fable 5得分相當,並且定價與GPT-5.5相同。這些效能宣告是否能在更廣泛的實際工作負載中成立,將取決於社群,但無論這些基準測試最終如何驗證,可移植性論點都成立。

Sakana在美國對Fable 5和Mythos的出口限制生效10天后推出了Fugu,並明確提出了AI主權的概念。由於Fugu編排來自多個提供商的模型,對任何單個模型的限制都不會使系統癱瘓,而且你可以選擇特定提供商。對於面臨訪問不確定性的地區的團隊(例如,歐洲目前因監管合規而被鎖定),這種架構直接回應了Andreas在節目開始時提出的問題。

高通對Modular的收購,同一周宣佈,大約39億美元,在硬體層面符合相同的模式。Modular的平臺允許AI模型在不同的晶片架構上執行,包括NVIDIA、AMD和定製ASIC,而無需開發人員為每個架構重寫程式碼。高通獲得了一個硬體無關的抽象層,市場得到了另一個證據,表明可移植性正在成為整個棧的投資優先事項。

接下來是什麼

加入我們的下一期《本週AI動態》,於7月6日星期一美國東部時間上午10:00-10:30,Christina Stathopoulos將分析AI的最新發展。

在O'Reilly學習平臺上註冊參加現場直播。如果您還不是會員,可以免費試用10天。

《本週AI動態》可在YouTube、Spotify、Apple或您獲取播客的任何地方收聽。