2026-06-27 13:38 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 14:17 UTC+8

AI是否遵守架構規則？我們測量了，就連Opus也忽視了60%

一項新的測量表明，即使是最先進的AI模型也經常忽視架構規則，其中Opus模型在測試中忽略了60%的規則。這引發了對AI可靠性和安全性的擔憂。

來源Hacker News AI作者: davesheffer

一項來自Hunch Blog的實驗評估了當前AI模型在遵守架構規則方面的表現。研究人員設計了一系列測試，要求模型在生成代碼或設計時遵循特定的架構約束。結果令人驚訝：即使是表現最佳的模型Opus，也在60%的情況下忽視了這些規則。其他模型的表現更差。這一發現對AI在實際應用中的可靠性和安全性提出了重要問題。