2026-05-30 11:32 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

有效反饋計算：AI性能的真正變革者

最新研究提出有效反饋計算（EFC）概念，挑戰傳統計算量指標，證明AI性能提升的關鍵在於反饋的智能利用而非原始算力。EFC在預測失敗率方面遠超傳統指標，R²達0.94，反饋質量提升後成功率從0.27躍升至0.90。

來源Hacker News AI作者: veryluckyxyz

人工智能性能提升的關鍵或許不在於計算規模的無限制擴張，而在於如何更高效地利用反饋信號。一項最新研究提出的有效反饋計算（Effective Feedback Compute, EFC）正在重新定義AI擴展的規則。該研究由Callum Bryce於2026年5月29日發佈，挑戰了長期以來以原始計算量（如token數或工具調用次數）作為性能預測指標的傳統。

傳統觀點認為，更多計算資源意味着更強大的模型。然而，這項研究通過實證表明，反饋的質量和保留效率對最終性能的影響遠超想象。EFC通過衡量反饋信息對模型改進的實際貢獻，預測失敗率的能力遠超傳統的token計數或工具調用次數。在一個受控實驗中，Oracle-EFC的R²達到了0.94，而原始計算量指標僅0.33。這一結果震驚了AI研究界，因為它表明我們可能一直在用錯誤的指標衡量AI的進步。

當反饋質量得到系統性提升時，任務成功率從0.27急劇上升到0.90。這不是簡單的學術推導，而是基於混合真實軌跡測試的驗證。在混合真實軌跡測試中，NRS-EFC/D_task的R²為0.92，而原始計算量幾乎沒有預測能力。即使在保留測試集上，EFC依然保持0.85的R²，表現出卓越的穩定性。這些數字強有力地證明了一個觀點：AI競賽的贏家不是那些擁有最多計算資源的團隊，而是那些最善於從每次交互中提取有效信息的團隊。

這項發現為AI開發帶來深刻的啓示。計算預算的分配不應僅關注規模，更應聚焦於反饋迴路的價值。研究呼籲從業者重新思考傳統指標，擁抱反饋優先的設計哲學。如果AI開發者能夠採納這種新思維，他們可能會在模型選型、推理成本、產品能力和評測基準等方面獲得競爭優勢。未來，那些優先考慮反饋質量的系統將引領AI的下一次飛躍。