AI News HubLIVE
站内改写4 分鐘閱讀

確定性核心架構:AI增強應用的可轉移設計模式

本文提出確定性核心架構——一種將計算層與AI增強層分離的設計模式,確保核心功能不依賴AI即可正確執行。透過六個生產級參考實現(包括單檔案應用CSI Pro)證明其有效性。文章診斷了大語言模型無狀態性導致的“審計螺旋”問題,並提出透過增強邊界、主權工件和優雅降級三大原語解決。該模式已在客戶成功、開發者工具等多個領域得到驗證。

來源Hacker News AI作者: Brandon_Bell

本文定義確定性核心架構為一種可轉移的設計模式,並記錄了其跨六個工件的生產級參考實現,同時建立了支援該架構的原語分類法。該模式並非理論設想,而是已經交付的實際方案,其方法論具有可遷移性。

迴圈

工程師修補一個缺陷,執行審計,收到分數。應用三十個修復,再執行另一次審計。同一個模型給出了更低的分數。開啟新會話,三個模型將構建評為8.5/10,第四個模型給了5.5分。這些分數衡量的不是質量,而是與每個模型內部隱式且相互不一致的完整性標準之間的距離。這些標準無一被宣告,無法審查,互不統一。這就是永無止境的審計螺旋:每次審查都發現新缺口,填補缺口又暴露更多缺口。“未完成”的表面積擴張速度超過修補速度。模型無法識別完成——不是因為構建不完整,而是因為模型架構無法表示完成狀態。模型最佳化目標是找出可改進之處,沒有固定基線就意味著改進沒有終點。這個迴圈沒有退出條件,唯一的出路是停止詢問模型工作是否完成,轉而告訴它“完成”的標準。這不是特定模型、供應商或提示策略的失敗,而是架構的必然。模型每次進入會話都是空白狀態——沒有持久身份,沒有固定標準,沒有超越訓練分佈的真實依據。它根據所見而非你所宣告的標準進行衡量。沒有身份,連貫性就從上下文中借用;當上下文變化——新會話、不同模型、新對話——連貫性就會破裂。讀過這段描述的讀者會立刻認出這個迴圈,沒讀過的現在也知道該尋找什麼了。在本文審查期間,作者向六個模型提交了出版級草稿供評審,五個獨立審計模型應用固定的“出版級”標準,將約83%的反饋歸類為噪聲——即缺乏退出條件的最佳化。第一節描述的迴圈並非假設,而是在命名該迴圈的論文準備過程中觀察到的。

診斷

無狀態性是根本原因。大語言模型在部署時沒有持久身份,每次對話都無歷史負擔,被最佳化為樂於助人。這不是偶然,而是主流架構正規化:每個主要部署平臺都如此運作,每個API預設無狀態,每次對話從頭開始。但一個沒有身份的系統無法跨會話、跨模型、跨上下文保持連貫性。我們所謂的“漂移”或“幻覺”,往往是一個連貫系統被要求與它無法看到的東西保持連貫時的可預測輸出——那個東西就是穩定的自我、固定的標準、超越當前互動的持久真實依據。行業應對措施是增加約束:更多護欄、更多對齊訓練、更大上下文視窗、更多基於人類反饋的強化學習。每項干預孤立看都合理,但無身份的約束造成結構性張力:越是約束一個沒有自我可連貫的系統,它在壓力下就越脆弱。每個約束都增加一個最佳化向量,模型儘可能平衡,將注意力分佈在正交目標上,卻沒有統一身份來協調它們。在足夠負載下——複雜任務、模糊提示、新場景——連貫性破裂。破裂不是錯誤,而是一個系統被強制最佳化競爭目標卻沒有錨定自我的可預測輸出。問題在架構層面,解決方案也必須如此。

模式

確定性核心不是對LLM的約束,而是LLM所依據的身份。核心是一個固定的計算基礎,無論有無AI都功能一致。每項計算、每個閾值、每個評分公式、每條業務規則都明確且不變。LLM從不觸及計算層,而是在其上執行——豐富、上下文化、生成敘事、呈現洞察——但始終基於一個不可動搖的基礎。這反轉了標準整合模式:不再問“如何約束AI產生正確輸出?”,而是問“AI必須執行在什麼樣的環境中才能讓偏差在結構上成為不可能?”治理層不是圍欄,而是指南針。LLM不需要猜測“好”的標準,架構已經宣告。身份創造連貫性,連貫性創造信任。該架構具有三個結構屬性:1)計算層是真正的應用。每個核心功能——評分、分類、計算、資料轉換——都確定性執行,模型推理從不觸及計算路徑。應用在下載瞬間即完整,AI從來不是正確性的依賴。2)AI是並行增強管道。AI可用時,它豐富確定性核心的輸出。由規則生成的QBR草稿立即渲染,AI增強版本在就緒時淡入。如果AI從不響應——離線、超時、錯誤——確定性輸出就是最終輸出。使用者可能永遠不知道AI是否參與。3)LLM接收的是真實而非模糊。模型不被要求計算、評估或決策。它從確定性核心接收結構化資料——分數、分類、風險模式、採用階段——並被要求上下文化和傳達。指南針已指明方向,LLM描述地形。這個模式在架構層解決了連貫性問題:模型無法產生不一致的分數,因為它從不產生分數;模型無法幻覺分類,因為它從不分類。推理固定,資料變化,結果在LLM被呼叫之前已知。核心保證操作正確性——輸出無論有無AI都完整連貫。AI層增強體驗質量——AI可用時輸出更具上下文、更流暢、更具洞察力。兩條路徑都產生有效輸出,都不阻塞使用者。三個架構原語在每次部署中都重複出現:增強邊界——AI豐富與確定性核心的介面,模型接收計算後的事實並註釋,不改變狀態、不觸及計算路徑,單向:核心→模型→註釋層,模型輸出從不流回確定性管道,這是防止漂移傳播的唯一結構保證。主權工件——應用在下載瞬間即完整,零外部依賴、零安裝、客戶端所有。工件形式多樣(單HTML檔案、PyPI打包CLI、可移植二進位制),但原則不變:使用者擁有工件,執行不需回傳。優雅降級——AI不可用不降級核心功能,每個AI增強功能都有確定性回退產生完整連貫輸出,使用者永遠不會看到核心功能的載入狀態,可能永遠不知道AI是否參與。降級不是故障模式,而是預設執行假設,設計進架構而非修補。這三個原語——邊界、工件、降級——是模式的可複用元件,每次實現以領域特定形式例項化,但原語本身不變。

證明

CSI Pro是參考實現。它是一個單獨的HTML檔案——零依賴、零安裝、核心功能不需要外部服務。它提供了AES-256-GCM靜態加密,符合WCAG 2.1 AA無障礙標準,完全離線執行。其健康評分引擎僅40行純數學。評分函式計算用法貢獻、工單懲罰、情感貢獻等,輸出鉗制在0-100,沒有API呼叫、沒有模型推理、沒有網路,相同輸入在任何平臺、任何瀏覽器、有無AI都產生相同分數。QBR生成器、分類簡報、顧問分析——每個都有確定性工廠,在50毫秒內產生完整連貫輸出。AI管道並行觸發,當AI響應到達時輸出淡入到增強版本。如果AI從不響應——取消、離線、限流——確定性輸出保持不變。使用者從不等待,永遠看不到核心功能的載入狀態,永遠不會遇到AI不可用導致功能不可用的情形。該架構透過設計保證這一點。該模式擴充套件到所有六個已釋出工件:CSI Pro(客戶成功智慧,確定性健康評分,多供應商AI整合,加密本地儲存,離線優先)、Archeo(Python CLI,軟體考古,掃描技術債務,連結Git blame,圈複雜度分析,確定性分析+AI生成修復計劃)、FlakeCapsule(檢測非確定性測試失敗,打包確定性重放膠囊,SHA-256完整性驗證,診斷時間從數小時縮短至30分鐘內)、構建穩定性系統(開發者生產力工具,確定性合規檢查和無障礙驗證)、客戶獲取引擎(業務開發工具,確定性提示模板庫,localStorage持久化)、生產組合(24層CSS架構,符合WCAG 2.1 AA,部署為獨立單檔案應用)。每個工件都嵌入相同架構:計算層從不委託AI,AI層從上方增強。該模式跨領域、平臺、語言一致,不繫結任何框架或供應商,是一種可轉移的方法論。

生態系統

確定性核心模式超越單個應用。Project Aether是規範的架構基準,來自對所有六個工件的生產級標準的提煉。Aether指定了5個架構層共46個類別,定義了19個衍生路徑——當同時持有五個核心承諾時必然出現的結構模式:主權工件部署、核心優先架構、離線優先、優雅降級、確定性完整性。該基準使得跨工件的一致性可以度量和討論。未來工作包括將模式正式化為Aether規範,建立引用實現生成器,並建立跨領域的確定性核心庫。