AI News HubLIVE
站内改写4 分钟阅读

确定性核心架构:AI增强应用的可转移设计模式

本文提出确定性核心架构——一种将计算层与AI增强层分离的设计模式,确保核心功能不依赖AI即可正确运行。通过六个生产级参考实现(包括单文件应用CSI Pro)证明其有效性。文章诊断了大语言模型无状态性导致的“审计螺旋”问题,并提出通过增强边界、主权工件和优雅降级三大原语解决。该模式已在客户成功、开发者工具等多个领域得到验证。

来源Hacker News AI作者: Brandon_Bell

本文定义确定性核心架构为一种可转移的设计模式,并记录了其跨六个工件的生产级参考实现,同时建立了支持该架构的原语分类法。该模式并非理论设想,而是已经交付的实际方案,其方法论具有可迁移性。

循环

工程师修补一个缺陷,运行审计,收到分数。应用三十个修复,再运行另一次审计。同一个模型给出了更低的分数。打开新会话,三个模型将构建评为8.5/10,第四个模型给了5.5分。这些分数衡量的不是质量,而是与每个模型内部隐式且相互不一致的完整性标准之间的距离。这些标准无一被声明,无法审查,互不统一。这就是永无止境的审计螺旋:每次审查都发现新缺口,填补缺口又暴露更多缺口。“未完成”的表面积扩张速度超过修补速度。模型无法识别完成——不是因为构建不完整,而是因为模型架构无法表示完成状态。模型优化目标是找出可改进之处,没有固定基线就意味着改进没有终点。这个循环没有退出条件,唯一的出路是停止询问模型工作是否完成,转而告诉它“完成”的标准。这不是特定模型、供应商或提示策略的失败,而是架构的必然。模型每次进入会话都是空白状态——没有持久身份,没有固定标准,没有超越训练分布的真实依据。它根据所见而非你所声明的标准进行衡量。没有身份,连贯性就从上下文中借用;当上下文变化——新会话、不同模型、新对话——连贯性就会破裂。读过这段描述的读者会立刻认出这个循环,没读过的现在也知道该寻找什么了。在本文审查期间,作者向六个模型提交了出版级草稿供评审,五个独立审计模型应用固定的“出版级”标准,将约83%的反馈归类为噪声——即缺乏退出条件的优化。第一节描述的循环并非假设,而是在命名该循环的论文准备过程中观察到的。

诊断

无状态性是根本原因。大语言模型在部署时没有持久身份,每次对话都无历史负担,被优化为乐于助人。这不是偶然,而是主流架构范式:每个主要部署平台都如此运作,每个API默认无状态,每次对话从头开始。但一个没有身份的系统无法跨会话、跨模型、跨上下文保持连贯性。我们所谓的“漂移”或“幻觉”,往往是一个连贯系统被要求与它无法看到的东西保持连贯时的可预测输出——那个东西就是稳定的自我、固定的标准、超越当前交互的持久真实依据。行业应对措施是增加约束:更多护栏、更多对齐训练、更大上下文窗口、更多基于人类反馈的强化学习。每项干预孤立看都合理,但无身份的约束造成结构性张力:越是约束一个没有自我可连贯的系统,它在压力下就越脆弱。每个约束都增加一个优化向量,模型尽可能平衡,将注意力分布在正交目标上,却没有统一身份来协调它们。在足够负载下——复杂任务、模糊提示、新场景——连贯性破裂。破裂不是错误,而是一个系统被强制优化竞争目标却没有锚定自我的可预测输出。问题在架构层面,解决方案也必须如此。

模式

确定性核心不是对LLM的约束,而是LLM所依据的身份。核心是一个固定的计算基础,无论有无AI都功能一致。每项计算、每个阈值、每个评分公式、每条业务规则都明确且不变。LLM从不触及计算层,而是在其上运行——丰富、上下文化、生成叙事、呈现洞察——但始终基于一个不可动摇的基础。这反转了标准集成模式:不再问“如何约束AI产生正确输出?”,而是问“AI必须运行在什么样的环境中才能让偏差在结构上成为不可能?”治理层不是围栏,而是指南针。LLM不需要猜测“好”的标准,架构已经宣告。身份创造连贯性,连贯性创造信任。该架构具有三个结构属性:1)计算层是真正的应用。每个核心功能——评分、分类、计算、数据转换——都确定性执行,模型推理从不触及计算路径。应用在下载瞬间即完整,AI从来不是正确性的依赖。2)AI是并行增强管道。AI可用时,它丰富确定性核心的输出。由规则生成的QBR草稿立即渲染,AI增强版本在就绪时淡入。如果AI从不响应——离线、超时、错误——确定性输出就是最终输出。用户可能永远不知道AI是否参与。3)LLM接收的是真实而非模糊。模型不被要求计算、评估或决策。它从确定性核心接收结构化数据——分数、分类、风险模式、采用阶段——并被要求上下文化和传达。指南针已指明方向,LLM描述地形。这个模式在架构层解决了连贯性问题:模型无法产生不一致的分数,因为它从不产生分数;模型无法幻觉分类,因为它从不分类。推理固定,数据变化,结果在LLM被调用之前已知。核心保证操作正确性——输出无论有无AI都完整连贯。AI层增强体验质量——AI可用时输出更具上下文、更流畅、更具洞察力。两条路径都产生有效输出,都不阻塞用户。三个架构原语在每次部署中都重复出现:增强边界——AI丰富与确定性核心的接口,模型接收计算后的事实并注释,不改变状态、不触及计算路径,单向:核心→模型→注释层,模型输出从不流回确定性管道,这是防止漂移传播的唯一结构保证。主权工件——应用在下载瞬间即完整,零外部依赖、零安装、客户端所有。工件形式多样(单HTML文件、PyPI打包CLI、可移植二进制),但原则不变:用户拥有工件,运行不需回传。优雅降级——AI不可用不降级核心功能,每个AI增强功能都有确定性回退产生完整连贯输出,用户永远不会看到核心功能的加载状态,可能永远不知道AI是否参与。降级不是故障模式,而是默认运行假设,设计进架构而非修补。这三个原语——边界、工件、降级——是模式的可复用组件,每次实现以领域特定形式实例化,但原语本身不变。

证明

CSI Pro是参考实现。它是一个单独的HTML文件——零依赖、零安装、核心功能不需要外部服务。它提供了AES-256-GCM静态加密,符合WCAG 2.1 AA无障碍标准,完全离线运行。其健康评分引擎仅40行纯数学。评分函数计算用法贡献、工单惩罚、情感贡献等,输出钳制在0-100,没有API调用、没有模型推理、没有网络,相同输入在任何平台、任何浏览器、有无AI都产生相同分数。QBR生成器、分类简报、顾问分析——每个都有确定性工厂,在50毫秒内产生完整连贯输出。AI管道并行触发,当AI响应到达时输出淡入到增强版本。如果AI从不响应——取消、离线、限流——确定性输出保持不变。用户从不等待,永远看不到核心功能的加载状态,永远不会遇到AI不可用导致功能不可用的情形。该架构通过设计保证这一点。该模式扩展到所有六个已发布工件:CSI Pro(客户成功智能,确定性健康评分,多供应商AI集成,加密本地存储,离线优先)、Archeo(Python CLI,软件考古,扫描技术债务,链接Git blame,圈复杂度分析,确定性分析+AI生成修复计划)、FlakeCapsule(检测非确定性测试失败,打包确定性重放胶囊,SHA-256完整性验证,诊断时间从数小时缩短至30分钟内)、构建稳定性系统(开发者生产力工具,确定性合规检查和无障碍验证)、客户获取引擎(业务开发工具,确定性提示模板库,localStorage持久化)、生产组合(24层CSS架构,符合WCAG 2.1 AA,部署为独立单文件应用)。每个工件都嵌入相同架构:计算层从不委托AI,AI层从上方增强。该模式跨领域、平台、语言一致,不绑定任何框架或供应商,是一种可转移的方法论。

生态系统

确定性核心模式超越单个应用。Project Aether是规范的架构基准,来自对所有六个工件的生产级标准的提炼。Aether指定了5个架构层共46个类别,定义了19个衍生路径——当同时持有五个核心承诺时必然出现的结构模式:主权工件部署、核心优先架构、离线优先、优雅降级、确定性完整性。该基准使得跨工件的一致性可以度量和讨论。未来工作包括将模式正式化为Aether规范,创建引用实现生成器,并建立跨领域的确定性核心库。