AI News HubLIVE
站內改寫1 分鐘閱讀

AI是否遵守架構規則?我們測量了,就連Opus也忽視了60%

一項新的測量表明,即使是最先進的AI模型也經常忽視架構規則,其中Opus模型在測試中忽略了60%的規則。這引發了對AI可靠性和安全性的擔憂。

來源Hacker News AI作者: davesheffer

一項來自Hunch Blog的實驗評估了當前AI模型在遵守架構規則方面的表現。研究人員設計了一系列測試,要求模型在生成代碼或設計時遵循特定的架構約束。結果令人驚訝:即使是表現最佳的模型Opus,也在60%的情況下忽視了這些規則。其他模型的表現更差。這一發現對AI在實際應用中的可靠性和安全性提出了重要問題。