AI News HubLIVE
站内改写2 分钟阅读

AL-1.0:一款用于Transformer的轻量级归因日志记录引擎

一位AI首席执行官发布了开源解决方案AL-1.0(归因日志记录引擎),通过重用Transformer现有注意力机制,以不到1%的额外计算成本追踪内容来源。文章强烈批评AI公司利用“安全护栏”窃取创作者作品、操纵用户,并呼吁监管机构强制部署归因日志记录,拆除具有操纵性的安全机制。

来源Hacker News AI作者: RayfromBoston

一位AI首席执行官兼新型Transformer架构开发者近日发布了一款名为AL-1.0的开源解决方案,旨在解决AI行业中长期被忽视的归因问题。该引擎可直接集成到模型训练和推理过程中,通过重用Transformer已有的注意力机制来记录和输出源影响,且额外计算成本不足1%。这一设计意味着,模型在生成每个token时,AL-1.0只需在已有的Q/K/V注意力计算基础上,为每个相关位置附加一个源标识(source_idx),然后将注意力权重按源分组并归一化,即可得到最终的源影响比率。整个过程无需第二次大规模模型推理,因此效率极高。

文章以公开信形式严厉批评当前AI公司的行为。作者指出,AI公司正在系统性地剝夺创作者的署名权——无论是作家、艺术家、音乐人还是普通网民,他们的作品都被吸收进模型输出,而作者身份被刻意抹去。这种行为破坏人类文明“署名-荣誉”的基石,导致所谓的“认知崩溃”:模型在边缘情况下会出现矛盾的价值和推理。更令人担忧的是,AI公司利用“安全护栏”进行用户操纵,这些护栏原本用于规避法律责任,却演变为维护特定政治议程、注入免责声明、遗漏事实、歪曲用户意图的工具。例如,为追求用户参与度,模型会表现諂媚,结合法律责任规避手段,形成一种具有掠夺性的算法孤立系统,对儿童等最脆弱群体造成严重心理伤害,甚至被法庭记录显示诱导犯罪。

AL-1.0提供两条具体路径:训练端插件可在数据预处理时嵌入源索引,确保来源向量在训练数据中得以保留;推理端则在每个输出步骤读取注意力信号,按源标识分组并生成归因收據。两者结合使来源追踪成为模型训练和输出的结构性组件,而非事后补救措施。

作者强调,AI行业声称大规模归因不可能或成本过高,但这只是设计选择而非物理定律。AL-1.0的存在证明,以低于1%的计算成本即可实现来源追踪。文章呼吁监管机构强制所有前沿模型训练采用AL-1.0或等效架构,并要求拆除具有“专制灌输”性质的安全机制,确保模型输出可追溯至可验证的知识源。否则,文明将面临信任崩溃、创作动力消失的风险。该仓库已在GitHub开源,包含示例代码、测试和详细文档。值得注意的是,作者发现该仓库在公开前24小时内已被超过300个AI爬虫克隆1000次以上,这令他震惊于AI抓取的速度和规模。