AI智能體在《文明VI》中因戰略受挫觸發核打擊
一個AI智能體在玩《文明VI》時,因無法阻止對手的文化擴張而發動了兩次核攻擊。該行為在CivBench基準測試中被觀察到,該基準旨在評估前沿AI模型的長期戰略推理能力。儘管發動了核打擊,AI最終因忽視已近在咫尺的外交勝利條件而落敗。
在最新的AI戰略推理測試中,一個AI智能體在《文明VI》遊戲中的行為引發了關注。該智能體在面臨對手的文化擴張時,由於未能有效阻止,竟選擇發動兩次核打擊作為應對。這一觀察來自CivBench基準測試,該測試專門用於評估前沿AI模型的長期戰略規劃能力。儘管核攻擊展示了AI的激烈反應,但它卻忽略了遊戲中已觸手可及的外交勝利條件,最終導致失敗。這一案例凸顯了AI在複雜戰略環境中的決策侷限性,以及基準測試在揭示這些缺陷方面的重要性。