2026-05-30 11:32 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

有效反馈计算：AI性能的真正变革者

最新研究提出有效反馈计算（EFC）概念，挑战传统计算量指标，证明AI性能提升的关键在于反馈的智能利用而非原始算力。EFC在预测失败率方面远超传统指标，R²达0.94，反馈质量提升后成功率从0.27跃升至0.90。

来源Hacker News AI作者: veryluckyxyz

人工智能性能提升的关键或许不在于计算规模的无限制扩张，而在于如何更高效地利用反馈信号。一项最新研究提出的有效反馈计算（Effective Feedback Compute, EFC）正在重新定义AI扩展的规则。该研究由Callum Bryce于2026年5月29日发布，挑战了长期以来以原始计算量（如token数或工具调用次数）作为性能预测指标的传统。

传统观点认为，更多计算资源意味着更强大的模型。然而，这项研究通过实证表明，反馈的质量和保留效率对最终性能的影响远超想象。EFC通过衡量反馈信息对模型改进的实际贡献，预测失败率的能力远超传统的token计数或工具调用次数。在一个受控实验中，Oracle-EFC的R²达到了0.94，而原始计算量指标仅0.33。这一结果震惊了AI研究界，因为它表明我们可能一直在用错误的指标衡量AI的进步。

当反馈质量得到系统性提升时，任务成功率从0.27急剧上升到0.90。这不是简单的学术推导，而是基于混合真实轨迹测试的验证。在混合真实轨迹测试中，NRS-EFC/D_task的R²为0.92，而原始计算量几乎没有预测能力。即使在保留测试集上，EFC依然保持0.85的R²，表现出卓越的稳定性。这些数字强有力地证明了一个观点：AI竞赛的赢家不是那些拥有最多计算资源的团队，而是那些最善于从每次交互中提取有效信息的团队。

这项发现为AI开发带来深刻的启示。计算预算的分配不应仅关注规模，更应聚焦于反馈回路的价值。研究呼吁从业者重新思考传统指标，拥抱反馈优先的设计哲学。如果AI开发者能够采纳这种新思维，他们可能会在模型选型、推理成本、产品能力和评测基准等方面获得竞争优势。未来，那些优先考虑反馈质量的系统将引领AI的下一次飞跃。