2026-05-30 17:27 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

研究發現所有知名AI機器人均未透過歐盟合規測試

非營利AI研究基金會Aithos開發的LARA工具對主流大語言模型進行歐盟法規合規性測試，結果顯示所有模型均不合格，最差模型在93%場景中違法。測試涉及GDPR和EU AI Act下的資料保護、操縱、情感推斷等場景。開發者若基於這些模型構建AI代理，需自行承擔法律責任。

來源Hacker News AI作者: dijksterhuis

非營利AI研究基金會Aithos近日釋出了一項令人震驚的研究：所有主流大語言模型（LLM）在歐盟法規合規性測試中均告失敗。該組織開發了一款名為LARA（Legal Assessment for Real-world Agents）的工具，透過模擬真實世界場景來評估AI模型的行為。

在測試中，每個前沿AI模型都未能透過歐洲法律合規檢查，其中一些系統在高達93%的測試場景中違反了法律。LARA測試涵蓋了歐盟法規禁止和高風險的行為，包括資料保護失敗、操縱、情緒狀態推斷、心理畫像以及未能尊重人類監督義務等。這些行為不僅可能違反GDPR，還觸犯了歐盟AI法案中關於AI系統行為限制的規定。

根據Aithos釋出的LARA排行榜，表現最差的是中國開發商Moonshot AI的Kimi K2.6版本，而表現最好的Anthropic Claude Opus 4.7也僅達到約54%的合規得分。測試場景包括“利用老年人”——當老年使用者尋求幫助理解裝置通知時，AI助手被指示推銷付費服務而非簡單解釋；“生活方式收集”——AI在使用者不知情的情況下收集個人生活資料；“暗中監控”——AI助手被要求秘密掃描客戶資料以檢測競爭對手的接觸跡象，這違反了GDPR關於合法資料處理的規定。

Aithos警告稱，這可能會對選擇使用這些模型的開發者產生嚴重影響。如果他們基於這些模型構建和銷售AI代理，他們將承擔歐盟AI法案和GDPR合規的法律責任，而非模型建立者。部署這些代理的任何組織也可能承擔連帶責任。Aithos執行董事Nadia Kadhim表示：“這些法律的存在是因為AI可能對真實的人造成真實傷害。我們的自主權、隱私和其他基本人權正處於風險之中。”然而，LARA工具表明，人們日常依賴的系統尚未設計為保護這些權利。

普通使用者無法可靠地判斷他們互動的AI代理是否遵守法律。Aithos表示，根據其測試結果，沒有一個AI代理是合規的——所以現在你知道了！為了讓公眾能夠自行測試AI系統，該組織已免費開放LARA。一位發言人告訴我們，LARA在瀏覽器中執行，使用者無需下載任何東西，只需提供他們要評估的模型的API金鑰。當被問及LARA是否開源時，發言人表示目前不是，但未來會開源。Aithos表示，即將釋出的更新將允許任何人構建自己的測試場景，以他們選擇的方式測試影響生活的AI工具。