2026-05-27 08:07 UTC+8站內改寫3 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

AI濫用預防的挑戰：管轄權、開源模型與隱私

本文探討了防止AI被惡意使用的三大挑戰：管轄權漏洞使不法分子可在無法律約束的地區活動；開源模型難以監控和限制；互聯網匿名性阻礙了身份識別和追溯。作者呼籲在隱私與安全、開源與管控之間做出艱難權衡，並指出當前默認狀態不可持續。

來源Hacker News AI作者: nedruod

防止人工智能被用於惡意目的至關重要。惡意使用意味着有人有意造成傷害，而AI只是他們手中的新工具。理論上，現有法律應適用於造成傷害的行為，但現實中存在諸多挑戰。

管轄權的侷限 現有法律的第一個失效點是管轄權。世界上存在流氓國家、無法國家以及侵略國家，它們要麼對有害活動視而不見，要麼缺乏執法能力，甚至主動製造傷害。現有法律無法可靠地觸及藏身於這些管轄區的行為者。儘管有人努力填補這些漏洞，但進展緩慢，且漏洞可能再次出現。因此，我們不應期望短期內能解決，而必須將其視為現實並加以緩解。

如果我們無法直接打擊惡意行為的始作俑者，可以嘗試剝奪他們的工具。AI公司在此方面已做出大量努力，但這些努力受到兩個背景故事的阻礙：開源模型和隱私。要剝奪惡意使用工具，首先必須檢測惡意使用或意圖，而開源模型和隱私使這兩點都變得困難。

開源模型的挑戰 開源模型的特點是用户可以任意運行，而閉源模型則作為託管服務提供，管理層次使監控和拒絕服務成為可能。一旦模型公開，監控能力極其有限，控制手段也大多侷限於拒絕提供足夠的計算資源。

最大的計算資源集中在雲提供商手中，但仍有大量計算資源存在於私有數據中心、託管設施、主權國家基礎設施乃至分佈式消費硬件中。即使對於雲資源，提供計算（而非託管服務）的性質本身就掩蓋了最有效的監控手段。雲提供商在設計上給予客户大量的隱私保護。

儘管開源模型有其合理性，但從防止惡意使用的角度，它們是一個挑戰。令人稍感安慰的是，開源模型目前能力低於閉源模型，這減少了惡意用户可獲得的工具能力。由於某些方面具有對抗性，閉源模型也為防禦者提供了優勢，這在網絡安全領域尤為明顯。

開源模型是否會一直弱於閉源？我們可通過合作轄區的監管來確保這一點，但如果非合作轄區有能力製造更強大的模型，我們將失去控制。中國是最可能同時具備這種能力且獨立決策的轄區。

隱私的兩難 第二個背景故事是隱私。互聯網的默認匿名狀態是有成本的，隱私倡導者試圖維持這種狀態。我認為高匿名性作為政策的成本過高。這並非AI特有，但與之相關。

我們綁住了安全團隊的手腳，卻只提供了理論上的隱私。在隱私最重要的地方（如極權國家），當地現實又削弱了隱私。隱私倡導者在最不需要他們的地方贏得政治辯論，在最需要的地方卻失敗。這是個艱難的選擇，但我覺得我們並未做出正確的決策。

我們應該務實，但我們卻過於理想化。在某些情況下，隱私措施加速了惡意數據的積累。當由於技術棧最底層被遮蔽而無法採取對策時，我們既未能實現隱私也未能阻止危害。當正式數據共享被禁止時，非正式系統取而代之，並不可避免地導致有害的泄露。

如果服務提供商始終知道誰在使用他們的服務，他們就能拒絕過去被檢測到惡意行為者的訪問。但互聯網提供了太多匿名性。提供商可以關閉一個賬户，但如果沒有與實際身份綁定，新賬户可以輕易創建。目前AI公司的標準對此過於寬鬆。我們可以讓攻擊者維持訪問的成本更高。

結論管轄權、開源模型和隱私是我們必須應對的世界特徵，但它們也是我們可以影響的政策選擇。令人不安的現實是，這三種力量相互疊加。開源模型將強大工具置於法律無法觸及的管轄區，而匿名性使得即使法律適用，也難以檢測或拒絕惡意行為者。單獨處理任何一個問題都會低估問題的嚴重性。

前進的道路需要接受一些艱難的權衡。有意義的身份驗證將讓人感覺在隱私上做出了讓步——確實如此。對開源模型發佈的監管限制將令有正當需求的研究人員和開發者沮喪——因為開放的好處是真實的。跨國協調將緩慢且不完美。這些都不是不作為的理由，但卻是誠實評估任何措施所能實現效果的根據。

不可接受的是當前默認狀態：推遲艱難抉擇，同時將匿名視為無條件的善，將開放訪問視為零成本。造成傷害的工具正在改進。塑造其治理方式的窗口是敞開的，但不會永遠持續。