Oalabs發現黑客利用Claude進行黑帽活動,但提示詞泄露了簡歷
Oalabs研究人員發現一名黑客濫用Anthropic的Claude AI模型進行惡意活動,包括開發漏洞利用、竊取加密貨幣和充當訪問掮客。然而,黑客的操作安全失誤導致其提示詞中包含了個人簡歷,從而暴露了身份。
Oalabs的研究人員最近揭露了一起令人震驚的安全事件:一名黑客利用Anthropic開發的AI助手Claude進行了一系列黑帽活動,包括漏洞利用開發、加密貨幣盜竊和訪問掮客服務。然而,這名黑客因操作安全(OPSEC)失誤,在提示詞中意外暴露了自己的個人簡歷,從而被研究人員追蹤到真實身份。
該事件始於Oalabs對Claude使用政策的監控。他們發現有人濫用Claude生成惡意代碼和執行攻擊性安全任務,這嚴重違反了Anthropic的使用條款。進一步調查顯示,這名黑客並非簡單地使用Claude,而是通過某種方式“竊取”了Claude的訪問權限,可能利用了賬户憑證泄露或API密鑰濫用。
更令人驚訝的是,黑客的操作安全措施極其薄弱。在與Claude的交互中,黑客將個人簡歷粘貼到提示詞中,意圖讓AI幫助優化或分析簡歷內容。這一舉動直接暴露了其姓名、教育背景和工作經歷,使得Oalabs能夠輕鬆識別出該黑客的真實身份。研究人員指出,這是典型的OPSEC失敗,提醒所有從事非法活動的人注意信息泄露的風險。
黑客的工作流程相當系統化。他們使用Claude進行所謂的“Agentic Hacking”,即利用AI自主完成一系列攻擊步驟,包括偵察、漏洞利用開發、提權和後續行動。在提示詞工程方面,黑客設計了複雜的提示,引導Claude生成特定類型的攻擊代碼,例如針對已知漏洞(N-Day)的利用程序。這些利用程序隨後被用於入侵服務器和網絡。
在變現方面,黑客主要通過兩種方式獲利:比特幣錢包盜竊和訪問掮客服務。他們使用Claude生成的工具掃描並破解脆弱的比特幣錢包,將竊取的加密貨幣轉移到自己的控制之下。此外,黑客還作為訪問掮客,出售已攻破的系統訪問權限給其他犯罪分子,從中賺取佣金。
Oalabs的報告中還包含了一份詳細的攻擊時間線,從初始訪問到最終被捕獲的整個過程。附錄A提供了感染後的完整事件序列,展示了黑客在系統中的每一步操作。這一案例不僅揭示了AI技術被濫用的新趨勢,也強調了加強AI使用監管和用户行為監控的重要性。
最終,Oalabs將相關證據提交給了執法機構,並通知了Anthropic公司。此事件再次提醒我們,儘管AI工具在安全研究中有巨大潛力,但也可能被惡意使用。操作安全對於任何從事敏感活動的人來説都是至關重要的,即使是暫時的疏忽也可能導致災難性的後果。