AI News HubLIVE
站内改写2 分鐘閱讀

智慧體工程:一門新興學科

智慧體工程是一門結合產品思維、工程和資料科學的新學科,旨在透過迭代構建、測試、釋出、觀察和最佳化的迴圈,將非確定性的LLM系統轉變為可靠的工業生產體驗。文章介紹了該學科的核心概念、所需技能、實踐場景以及為什麼現在需要它。

在構建智慧體的過程中,許多開發團隊都遇到過這樣的困境:在本地環境執行良好,一上線就問題頻出。傳統軟體假設你大致知道輸入並能定義輸出,但智慧體卻完全相反——使用者可能輸入任何內容,行為空間極為廣闊。這正是智慧體強大的原因,也是它們可能出乎意料地“跑偏”的根源。

過去三年間,數千個團隊都陷入了這一現實。而那些成功將可靠系統投入生產的團隊——例如Clay、Vanta、LinkedIn和Cloudflare——並未遵循傳統的軟體工程方法,而是開創了一門新學科:智慧體工程。

智慧體工程究竟指什麼?它是一種透過迭代過程,將非確定性的LLM系統逐步打磨成可靠生產體驗的方法。其核心迴圈是:構建、測試、釋出、觀察、最佳化、重複。關鍵在於,釋出並非終點,而是獲取新洞察、改進智慧體的手段。你在這個迴圈中前進得越快,智慧體就越可靠。

智慧體工程融合了三種技能:產品思維負責定義範圍並塑造行為,例如編寫驅動智慧體行為的提示詞(往往長達數百甚至數千行)、深刻理解智慧體要完成的“任務”,以及定義檢驗任務完成度的評估標準;工程負責構建使智慧體能夠投產的基礎設施,包括編寫工具、開發互動介面(支援流式傳輸、中斷處理等),以及建立處理持久執行、人機協作暫停和記憶體管理的穩健執行時;資料科學則負責測量和持續改進效能,透過構建評估系統(如評估集、A/B測試、監控等)分析使用模式和錯誤。

在實際團隊中,智慧體工程並非一個新職位,而是一系列職責的集合。軟體工程師和機器學習工程師編寫提示詞、構建工具、追蹤智慧體呼叫工具的原因,並最佳化底層模型;平臺工程師構建支援持久執行和人機協作流程的智慧體基礎設施;產品經理編寫提示詞、定義智慧體範圍,確保其解決正確的問題;資料科學家則衡量智慧體可靠性,識別改進機會。這些團隊擁抱快速迭代,軟體工程師追蹤錯誤後交給產品經理調整提示詞,產品經理發現範圍問題後要求工程師開發新工具——每個人都知道,真正讓智慧體變得可靠,正是透過觀察生產行為並系統性地加以改進來實現的。

為什麼現在需要智慧體工程?有兩個根本性轉變。第一,LLM已足夠強大,能夠處理複雜的多步驟工作流。例如,Clay用智慧體處理從潛在客戶研究到個性化外聯和CRM更新的整個流程;LinkedIn用智慧體掃描海量人才庫進行招聘,即時排名並匹配最強候選人。我們正在跨越一個門檻:智慧體正在生產中交付有意義的商業價值。第二,這種強大伴隨著真正的不可預測性。簡單的LLM應用雖然是非確定性的,但行為相對可控;智慧體則不同,它們跨步驟推理、呼叫工具、根據上下文適應。這導致:每個輸入都是邊緣情況,無法用傳統方式除錯,“工作”不再是二進位制狀態。

在實踐中,成功的工程團隊遵循這樣的開發節奏:構建智慧體基礎,根據設想的場景進行測試,釋出以觀察真實行為,追蹤每一次互動,執行評估,識別失敗模式後最佳化提示詞和工具定義,然後重複。每一個週期都讓你更深入地瞭解使用者如何與智慧體互動,以及可靠性在你的情境下究竟意味著什麼。

可靠智慧體團隊的一個共同點是:他們不再試圖在釋出前將智慧體打磨到完美,而是將生產環境視為主要的老師。追蹤每一個決策,大規模評估,以天為單位而非季度進行改進。智慧體工程之所以興起,是因為時機已到:智慧體現在能夠處理此前需要人類判斷的工作流,但前提是你能讓它們足夠可靠並值得信任。沒有捷徑,只有系統性地迭代。問題不在於智慧體工程是否會成為標準實踐,而在於你的團隊需要多快採用它,以釋放智慧體的全部潛力。