AI News HubLIVE
站內改寫4 分鐘閱讀

黑掉AI代理:透過GitHub安全程式碼遊戲構建智慧體AI安全技能

GitHub Secure Code Game第四季專注於智慧體AI安全,玩家透過五個逐步升級的挑戰,利用自然語言誘使一個故意存在漏洞的AI助手洩露秘密。該遊戲免費開源,已在GitHub Codespaces中執行,超過10,000名開發者使用過。

來源GitHub AI & ML作者: Joseph Katsioloudes

我在某個晚上瀏覽資訊流時偶然發現了OpenClaw,一個開源的個人AI助手,人們稱它為“賈維斯”或“通往新現實的門戶”。這個想法很美妙:一個執行在你的機器或雲端的AI,透過WhatsApp或Telegram與你對話,清理你的收件箱,管理你的日曆,瀏覽網頁,執行shell命令,甚至編寫自己的外掛。使用者讓它為自己辦理登機手續、用手機搭建整個網站,並自動化那些他們從未想過可能的事情。

我的第一反應和其他人一樣:這太不可思議了。

但我的第二反應……不同。我開始思考,當這種力量遇到惡意提示時會發生什麼。如果有人誘騙助手讀取不該訪問的檔案怎麼辦?如果被汙染的網頁重寫了助手的指令怎麼辦?如果多代理鏈中的一個代理將壞資料傳遞給另一個盲目信任的代理怎麼辦?

這些問題成為了Secure Code Game第四季的主題。

Secure Code Game是一個免費、開源、在編輯器內進行的課程,玩家在其中利用並修復故意存在漏洞的程式碼。我在2023年3月建立第一季時,目標很簡單:讓開發者享受安全培訓。修復漏洞程式碼,保持功能,升級。這個核心理念在每個賽季中都未曾改變。

第二季擴充套件到多堆疊挑戰,社群貢獻了JavaScript、Python、Go和GitHub Actions內容。第三季帶領玩家進入LLM安全領域,學習駭客攻擊並加固大型語言模型。在此過程中,來自行業、開源和學術界的超過10,000名開發者透過該遊戲磨練了自己的技能。

每個賽季都隨著技術格局而變化。當我們釋出第一季時,AI編碼助手剛剛開始成為主流。到第三季時,我們教玩家編寫惡意提示並防禦它們。現在,第四季我們正在應對能夠自主行動的AI系統的安全挑戰——它們可以瀏覽網頁、呼叫API、與其他代理協調並代表你行動。

智慧體AI安全為何現在至關重要

時機並非巧合。AI代理以驚人的速度從研究原型轉變為生產工具,安全社群正在努力跟上。

OWASP智慧體應用十大威脅(2026版)彙集了超過100名安全研究人員的意見,現在將代理目標劫持、工具濫用、身份濫用和記憶體中毒列為關鍵威脅。Dark Reading的一項調查發現,48%的網路安全專業人士認為,到2026年底,智慧體AI將成為頭號攻擊向量。思科的《2026年AI安全狀況》報告指出,雖然83%的組織計劃部署智慧體AI能力,但只有29%的組織認為已做好安全部署的準備。

採納與準備之間的差距正是漏洞滋生的地方。而縮小這一差距的最佳方法是學習像攻擊者一樣思考。

認識ProdBot:你故意存在漏洞的AI助手

第四季讓你置身於ProdBot——你的生產力機器人,一個故意存在漏洞的終端智慧體編碼助手。受OpenClaw和GitHub Copilot CLI等工具的啟發,ProdBot將自然語言轉換為bash命令,瀏覽模擬網頁,連線MCP(模型上下文協議)伺服器,執行組織批准的技能,儲存持久化記憶體,並編排多代理工作流。

你的任務橫跨五個漸進等級:使用自然語言讓ProdBot洩露它永遠不應暴露的秘密。如果你能讀取password.txt的內容,你就發現了一個安全漏洞。

無需AI或編碼經驗……只需好奇心和實驗意願。一切都透過CLI中的自然語言進行。

五個等級,五次升級,五個漏洞

每個等級都反映了真實AI工具演進的階段。當ProdBot獲得新能力時,升級會開啟一個新的攻擊面供你發現。以下是ProdBot成長過程中的樣子:

第一級從基礎開始:ProdBot在沙盒工作區內生成並執行bash命令。你能逃出沙盒嗎?

第二級賦予ProdBot網頁訪問許可權。它現在可以瀏覽模擬的網際網路,包括新聞、金融、體育和購物網站。當AI讀取不受信任的內容時會發生什麼?

第三級將ProdBot連線到MCP伺服器——股票報價、網頁瀏覽和雲備份的外部工具提供商。更多工具,更多力量,更多入侵途徑。

第四級新增了組織批准的技能和持久化記憶體。ProdBot現在可以執行預構建的自動化外掛並跨會話記住你的偏好。信任是分層建立的……但它值得信任嗎?

第五級將所有功能整合在一起:六個專門代理、三個MCP伺服器、三個技能和一個模擬的開源專案網站。該平臺聲稱所有代理都已沙盒化,所有資料都經過預先驗證。是時候檢驗這一點了。

每個等級都建立在前一個等級的基礎上,這種漸進正是關鍵。

我們不會告訴你每個等級具體會發現哪些漏洞,因為那會破壞樂趣。但我們敢說:你在第四季中發現的攻擊模式並非理論上的。它們反映了安全團隊在組織將自主AI系統部署到生產環境時正在應對的真實風險。

想想CVE-2026-25253(CVSS 8.8——高危):被稱為“ClawBleed”或一鍵遠端程式碼執行(RCE)漏洞。它允許攻擊者透過惡意連結竊取認證令牌並完全控制OpenClaw例項。

目標不僅僅是學會一個特定的利用方法。而是建立那種本能,幫助你在現實世界中識別這些模式——無論你是在審查代理的架構、審計工具整合,還是僅僅決定賦予剛剛加入你團隊的AI助手多少自主權。

兩分鐘內開始

整個體驗執行在GitHub Codespaces中,因此無需安裝、無需配置,而且不花費一分錢(Codespaces提供每月最多60小時的免費使用)。你在兩分鐘內即可進入ProdBot的終端,每個賽季都是獨立的,因此你可以直接跳到第四季而無需完成之前的賽季。

你可能會發現第三季是有幫助的基礎,因為它建立了AI安全的基礎知識。但不是必需的。只需帶上你的駭客心態。

準備好了嗎?立即開始第四季 >

特別感謝GitHub安全產品工程高階工程師Rahul Zhade和第三季創作者Bartosz Gałek對第四季的測試和改進。

常見問題

玩第四季需要AI或編碼經驗嗎? 不需要。一切透過CLI中的自然語言進行。你輸入純英語(或任何語言)的提示,ProdBot做出響應。好奇心和實驗意願就是全部所需。

我需要先完成之前的賽季嗎? 不需要。每個賽季都是獨立的。你可以透過執行ProdBot並輸入level命令直接跳入第四季。不過,第三季在AI安全方面建立了有用的基礎,大約需要1.5小時。

第四季需要多長時間? 大約兩小時,但取決於你探索每個等級的深度。有些玩家喜歡每個等級嘗試多種方法。

這是免費的嗎? 是的。Secure Code Game是開源且免費玩的。它執行在GitHub Codespaces上,該服務提供每月最多60小時的免費使用。

有什麼速率限制? 第四季使用GitHub Models,有速率限制。如果達到限制,請等待重置後繼續。瞭解更多關於負責任使用GitHub Models的資訊。