AI News HubLIVE
公開文章 105採集文章 109可信度 78刷新頻率 30 分鐘
健康狀態 健康來源類型 媒體原文權限 站內改寫最近入庫 2026-06-26ID the-new-stack-ai運行狀態 已啟用

Technical media source; summary-only unless authorization is obtained.

最新公開文章

在Fable 5禁令之後,Anthropic與19家組織共同發起開源安全機構

Linux基金會推出Akrites,這是一個協調開源軟件漏洞發現、修復和披露的機構,創始成員包括Anthropic、AWS、谷歌、微軟等20家組織。該倡議旨在應對AI驅動的漏洞發現帶來的挑戰,因為現有協調模式已跟不上速度。

  • Anthropic在Fable 5被禁後,與其他19家組織共同發起Akrites,這是一個由Linux基金會管理的開源安全協調機構。
  • Akrites通過共享的SIRT團隊整合漏洞報告,減少重複,加快關鍵開源項目的修復速度。
站內正文

美國政府剛剛告知OpenAI誰可以使用下一個GPT-5.6模型

美國政府出於網絡安全考量,指示OpenAI對即將發佈的GPT-5.6模型實施訪問限制,僅限政府批准的合作伙伴使用。此舉引發行業爭議,有專家認為這將推動開發者轉向開源或中國模型,可能削弱美國在AI領域的領先地位。

  • 特朗普政府要求OpenAI分階段發佈GPT-5.6,並逐客户審批訪問權限。
  • OpenAI CEO薩姆·奧爾特曼對此表示不滿,稱這不是長期模式。
站內正文

“代碼應被重新生成,而非維護”:Codeplain 為規範驅動開發辯護

Codeplain 公司主張代碼應通過規範驅動進行重新生成,而非維護。其開源規範語言 Plain 將結構化文檔作為唯一真相來源,並推出 agentic 框架 plain-forge 讓 AI 代理協助編寫規範。公司已獲得 300 萬美元融資,並認為規範而非代碼才是應維護的資產。

  • Codeplain 提出代碼應被重新生成而非維護,規範才是應審查和維護的對象。
  • 新框架 plain-forge 讓 AI 代理通過對話自動編寫和迭代規範。
站內正文

Azul 希望在 AI 之前發現你未打補丁的 JVM

Azul Systems 提供免費的 Java 虛擬機(JVM)漏洞風險評估工具,旨在幫助 DevOps 和 SecOps 團隊發現 Java 運行時的暴露情況,以防 AI 輔助的攻擊者利用。該工具掃描網絡中的 JVM 實例,包括嵌入式和管理不善的運行時,並返回基於 CISA KEV 和 NVD 的優先修復路線圖。Azul 還強調其安全更新策略,即僅提供安全補丁,降低修復風險。文章還討論了 AI 威脅,尤其是 Anthropic 的 Mythos 模型,但 Azul 並未實際測試該模型。

  • Azul 提供免費的 JVM 漏洞評估,掃描網絡並識別未打補丁的實例。
  • 該工具輸出安全儀表板和修復路線圖,對標 CISA KEV 和 NVD。
站內正文

Anthropic 將 @Claude 永久植入 Slack 頻道

Anthropic 推出 Claude Tag,將 Claude 作為持久、共享的團隊成員直接嵌入 Slack,能夠隨時間積累機構知識、異步工作且無需提示即可行動。該產品面向企業版和團隊版客户提供測試版,取代了之前的 Claude in Slack 應用。

  • Claude Tag 讓 Claude 成為 Slack 頻道中的永久成員,可執行長期任務並積累上下文。
  • 它使用“代理身份”概念,為 Claude 分配獨立的工具和數據訪問權限,確保安全。
站內正文

OpenClaw與Hermes在智能體定義上一致,但在控制權上存在分歧

OpenClaw和Hermes Agent是兩種開源智能體框架,前者以網關為核心,強調跨平台連接;後者以內存為核心,注重持久化學習和技能提升。微軟和英偉達已分別採納OpenClaw,而Hermes在開發者中流行。兩者代表了智能體控制層的不同設計哲學,企業需根據場景權衡。

  • OpenClaw採用網關優先設計,支持多消息渠道,已被微軟和英偉達集成。
  • Hermes Agent以持久內存和自我改進技能為核心,注重開發者上下文。
站內正文

開發者正在驗證他們未曾編寫——甚至可能不理解——的代碼

GitLab的AI問責制報告顯示,43%的開發者無法可靠區分AI生成的代碼與人類編寫的代碼,85%的人表示AI已將瓶頸從編寫代碼轉移到審查代碼。報告強調需要治理和集成工具鏈來管理AI生成的代碼。

  • 91%的組織正在使用兩個或更多AI編碼工具。
  • 43%的開發者無法可靠區分AI代碼與人類代碼。
站內正文

DNS能否成為AI代理身份的基礎?

Linux基金會宣佈啓動代理名稱服務(ANS),這是一個開放標準,通過將AI代理與互聯網的域名系統(DNS)綁定,為其提供可驗證的身份。該標準源於OWASP GenAI安全項目的研究論文,並經過多次迭代。ANS利用現有DNS基礎設施和證書頒發機構,實現代理身份的註冊、更新和撤銷。此外,還有DNS-AID等發現標準。儘管有多個類似方案,但大型AI公司如Google、微軟等尚未參與。

  • Linux基金會推出ANS,基於DNS為AI代理提供可驗證身份。
  • ANS通過ACME協議控制域名,並頒發證書,變更寫入追加日誌。
站內正文

Cursor悄然收購開源代碼助手Continue,GitHub Copilot的替代品

AI開發者工具整合加速,Cursor收購了開源編程助手Continue,該產品已被關閉。Continue曾定位為GitHub Copilot的開源替代品,注重數據控制。此次收購是Cursor在18個月內的一系列收購之一,但Continue可能只是人才收購,其聯合創始人Nate Sesti將加入Cursor。

  • Cursor收購了開源代碼助手Continue,該產品被關閉。
  • Continue曾是Y Combinator孵化的開源編程助手,強調數據隱私。
站內正文

Qodo推出跨倉庫代碼審查:為何對AI氾濫的團隊至關重要

Qodo發佈跨倉庫代碼審查等新功能,應對AI生成代碼帶來的治理挑戰。AI導致PR更大、審查更慢、錯誤更多。Qodo通過自動發現編碼模式、集中管理規則,幫助團隊保持控制。

  • Qodo推出跨倉庫代碼審查、自定義規則挖掘和技能審查標準三大新功能。
  • AI生成的PR比人類大154%,審查時間長91%,引入的bug多9%(DORA報告)。
站內正文

向後移植錯誤修復已死,Valkey 項目現在派遣機器人

Valkey 項目在 9.1 版本中使用 AI 代理自動處理錯誤修復的向後移植,節省了維護者大量時間,同時推出了代碼溯源守護工具來保護代碼完整性。

  • Valkey 9.1 使用 AI 代理自動向後移植錯誤修復,處理合併衝突和 CI 測試。
  • Provenance Guard 自動掃描拉取請求,防止未經授權的代碼被合併。
站內正文

Checkmarx 的新 SAST 引擎重點不在 LLM,而在後續處理

Checkmarx 發佈了一款新的靜態應用安全測試(SAST)引擎,該引擎結合了確定性規則掃描器、基於安全數據訓練的 LLM 以及專門用於分類真/假陽性的引擎。公司聲稱其 F1 得分為 0.499,遠高於行業平均水平,並在測試中發現了領先前沿模型遺漏的 327 個真陽性。該架構的核心是編排層,它將三個引擎自動整合在一起,無需客户自行構建多引擎工作流。

  • Checkmarx 新 SAST 引擎包含三個引擎:確定性規則掃描器、LLM 和發現分析引擎(FAE),用於在結果到達開發團隊前過濾假陽性。
  • 公司聲稱 F1 得分為 0.499,是行業平均水平(0.20)的兩倍多,並在測試中找到了領先前沿模型遺漏的 327 個真陽性。
站內正文

Anthropic 改造 Claude Design 以修復交接問題,設計師與工程師意見分歧

Anthropic 對 Claude Design 進行了重大更新,旨在簡化設計與工程團隊之間的交接,新增雙向設計-代碼集成、品牌一致性功能及共享使用配額。但設計師 Alfie Martin 認為令牌效率問題依舊,交接未顯著改善;工程師 Roman Martynenko 則對設計-代碼集成持樂觀態度,認為混合工作模式將是未來趨勢。

  • Anthropic 重新設計了 Claude Design,加入雙向設計-代碼集成,支持從代碼庫拉取設計系統或從終端創建編輯項目。
  • 新功能包括品牌一致性自動繼承、新編輯器和更多連接器(如 Adobe、Canva、Vercel 等)。
站內正文

MCP獲得缺失的企業授權層

MCP(模型上下文協議)現在擁有了企業級管理授權擴展,允許企業通過現有身份提供商集中控制MCP服務器訪問。Anthropic和微軟率先支持,Okta作為首個身份提供商。該擴展使用新興的OAuth擴展ID-JAG,無需用户同意即可安全交換令牌。

  • Anthropic和微軟在Claude、VS Code等客户端中支持企業託管授權。
  • 擴展利用ID-JAG協議,通過身份提供商進行無同意屏幕的令牌交換。
站內正文

Cursor、GitLab和Zed一致認為GitHub正在崩潰。他們對如何重建意見不一。

AI編碼工具Cursor被SpaceX以600億美元收購的同一天,其聯合創始人Tomas Reimers發佈了名為Origin的Git兼容代碼託管平台,旨在為AI代理時代重新設計基礎設施。GitLab和Zed也分別推出了自己的解決方案,顯示出對現有版本控制系統的普遍不滿。

  • SpaceX收購Cursor後,Origin平台亮相,旨在取代GitHub。
  • GitLab推出Project Switch,通過重新設計架構提升代理執行速度。
站內正文

Vercel 推出 eve:將智能體視為目錄的開源框架

Vercel 在 Ship 大會上發佈了開源框架 eve,它將每個 AI 智能體定義為一個文件目錄,類似於 Next.js 對 Web 應用的處理方式。框架內置持久化工作流、沙箱隔離、人工審批工具,並支持 Slack、Discord 等多渠道集成。eve 已內部運行超過 100 個智能體,目前處於公開預覽階段,採用 Apache 2.0 許可。

  • eve 是 Vercel 推出的開源框架,將 AI 智能體視為文件目錄,類似 Next.js 的目錄即應用理念。
  • 框架支持持久化工作流、工具人工審批、沙箱隔離,並集成 Slack、Discord 等渠道。
站內正文

Block如何通過Slack管理其AI編碼代理艦隊

Block(Square、Cash App母公司)開發了BuilderBot,基於開源Goose框架,使工程師能在Slack線程中通過標記@builderbot來管理AI編碼代理。BuilderBot能處理跨數百個服務和數億行代碼的任務,從Linear/Jira獲取工單,創建分支,發起PR,監控CI並根據反饋迭代。它理解公司所有服務、API和慣例,但絕不接觸客户數據或支付信息。系統每天運行超20萬次操作,每週合併約1500個PR,佔生產代碼變更的15%。Block已將Goose貢獻給Linux基金會旗下的Agentic AI Foundation,並與Anthropic共同開發了MCP協議。儘管面臨大規模裁員,Block堅持向AI原生工程轉型。

  • Block通過BuilderBot在Slack中管理AI編碼代理,實現跨服務和倉庫的協作。
  • BuilderBot基於開源Goose框架,可自動處理工單、創建分支、發起PR並監控CI。
站內正文

Chainguard 代理技能成熟:推出超1000個加固代理技能公共註冊表

Chainguard 擴展其 AI 編碼代理安全解決方案,推出包含 1000 多個加固代理技能的公共註冊表、私有註冊表以及內部技能加固服務。該服務將代理技能視為一等軟件工件,提供持續加固、審計跟蹤,並支持 Claude Code、Cursor、GitHub Copilot 和 Gemini CLI 等工具。同時,解決組織內部代理技能混亂問題,提供版本控制和訪問控制。

  • Chainguard 推出超 1000 個加固代理技能的公共註冊表,每週更新。
  • 提供私有註冊表和組織內部技能加固服務(封閉測試)。
站內正文

AWS在合併隊列中引入AI把關人

AWS在紐約峯會上宣佈為DevOps Agent新增發佈管理功能,包括髮布就緒審查和自主發佈測試,旨在應對AI生成代碼激增帶來的交付瓶頸。

  • AWS DevOps Agent新增發佈就緒審查和自主發佈測試功能,現已提供預覽。
  • 發佈就緒審查可評估代碼變更對生產環境的潛在影響,並檢測跨倉庫依賴風險。
站內正文

Google、Microsoft和OpenAI聯手打造AI缺失的信任層

Linux基金會旗下的Appia基金會宣佈成立,旨在為AI供應鏈提供開放的信任驗證規範。Google、Microsoft、OpenAI等13家創始成員參與,將制定模塊化的合規規格,讓組織能夠以透明、可追溯的方式證明其AI系統符合監管和標準要求。

  • Appia基金會致力於為AI供應鏈創建開放、模塊化的信任驗證規範。
  • 創始成員包括Google、Microsoft、OpenAI、Arm、西門子等科技與工業巨頭。
站內正文

你的AI沒問題,是你的數據有問題

企業在AI上投入數十億卻收效甚微,新創公司Clario指出問題根源在於數據中的冗餘、過時和瑣碎文件(ROT),並推出了首個專門解決該問題的平台。該公司從隱身模式中脱穎而出,獲得600萬美元種子輪融資。Clario通過掃描元數據識別垃圾文件,並通過Slack或Teams通知用户處理,採用基於結果的收費模式。早期客户分析顯示垃圾文件比例高達60%,嚴重影響了AI項目的質量。

  • Clario平台旨在解決企業數據中的ROT(冗餘、過時、瑣碎)問題,這些文件佔據了存儲成本並污染AI項目。
  • 公司獲得600萬美元種子輪融資,由五位前CIO兼CEO領導,採用結果導向的定價模式。
站內正文

Databricks 欲合併企業運行的兩大數據庫

Databricks 在數據+AI峯會上推出LTAP架構,旨在消除事務處理與分析系統之間的隔閡,為AI智能體重建數據基礎設施。

  • LTAP 統一事務與分析數據,支持AI智能體同時讀寫實時數據和歷史上下文。
  • 湖庫//RT提供毫秒級實時分析,無需額外數據副本。
站內正文

AWS賬單為何飆升?現在有智能代理來解答

AWS推出FinOps代理,以自然語言交互分析雲成本、識別異常、自動創建工單,幫助團隊從週期性審查轉向持續優化。

  • FinOps代理是AWS第三款面向IT運營的AI代理,專注於雲賬單管理。
  • 該代理可通過自然語言提問,自動關聯CloudTrail日誌定位成本異常根因。
站內正文

Anthropic在生效日當天暫停Claude Agent SDK訂閲變更

Anthropic在計劃生效日當天暫停了對使用Claude Agent SDK的開發者訂閲計費變更。此前,該公司曾宣佈將把Agent SDK使用量從標準訂閲中分離,設置單獨的月度限額。這一暫停發生在Anthropic因美國政府出口管制指令而撤回兩款模型之後,旨在安撫開發者社區。

  • Anthropic暫停了原定於6月15日生效的Claude Agent SDK計費變更。
  • 變更計劃將Agent SDK使用量從標準訂閲中分離,設置單獨的月度限額。
站內正文

Anthropic Fable 混亂事件解析

自上週五以來,Anthropic與Mythos和Fable模型相關的爭議持續發酵。本文梳理了事件時間線,包括Anthropic與國防部的爭端、Mythos模型的發佈、白宮的分歧、Fable 5的推出及其安全限制引發的批評、以及最終導致特朗普政府實施出口管制的風波。文章分析了支持與反對Anthropic的論點,作者認為Anthropic大體上做出了正確決定,並間接為Fable做了廣告。

  • Anthropic因對軍事使用其AI模型設限而被視為供應鏈風險。
  • Mythos模型展現了強大的網絡安全能力,促使Anthropic啓動Project Glasswing。
站內正文

Cohere將主權AI推銷給企業,現在通過首個編程模型瞄準開發者

Cohere發佈其首個開源編程模型North Mini Code(Apache 2.0許可),瞄準希望擁有和控制AI基礎設施的開發者。該30B MoE模型可在單張H100 GPU上運行,在代理編程任務上與Mistral、Qwen和Gemma競爭。

  • Cohere推出North Mini Code,一個300億參數的MoE編程模型,活躍參數30億,採用Apache 2.0許可。
  • 該模型可在單張英偉達H100 GPU上運行,使開發者能夠實際自託管。
站內正文

你的AI生成應用運行在他們的雲上——這就是問題所在

AI代碼生成工具能快速將提示轉化為應用,但多數應用運行在供應商的雲上,導致鎖定問題。生產環境中面臨可見性、測試、合規性和基礎設施分離的挑戰。本文分析了Lovable、Base44、Replit等工具的鎖定程度,並提出了評估AI應用構建器的標準:可觀測性、測試、合規性和可移植性。

  • AI應用構建器雖能快速生成應用,但默認運行在供應商雲上,導致鎖定。
  • 生產環境中,鎖定導致可見性、測試、合規性和基礎設施問題。
站內正文

Fable 5和Mythos 5仍被暫停:“球在Anthropic這邊”

Anthropic在週五晚因美國政府發現Fable 5存在特定越獄漏洞而突然禁用其新旗艦模型Fable 5和Mythos 5。Anthropic認為漏洞輕微,但白宮AI負責人David Sacks和亞馬遜CEO的介入使得事態複雜化。該事件為AI安全監管樹立了新先例。

  • 美國政府對Fable 5發佈出口管制令,Anthropic被迫禁用模型。
  • 亞馬遜CEO Andy Jassy向官員報告了研究人員發現的越獄方法。
站內正文

JetBrains能否在AI擴大技能差距之前彌合IDE技能鴻溝?

JetBrains推出課程創作者計劃,將動手編碼練習集成到專業IDE中,旨在彌合在線編程教育與行業實踐之間的鴻溝。儘管該計劃尚處於早期階段,僅有5位創作者完成集成,但其強調在AI輔助時代,基礎開發技能和IDE熟練度的重要性。

  • JetBrains發佈課程創作者計劃,允許教育者在Udemy、Coursera等平台嵌入IDE內編碼練習。
  • 該計劃旨在解決在線教育缺乏專業工具實踐的問題,但僅與5位創作者完成集成。
站內正文

Fable 5 vs Opus 4.8:真正的較量,而非規格表

Anthropic發佈了新模型Fable 5,聲稱比Opus 4.8更智能,但價格翻倍且存在安全限制。實際測試顯示,兩者在推理和編程任務上表現接近,Fable 5的優勢有限,而Opus 4.8性價比更高。

  • Fable 5定價為Opus 4.8的兩倍,且部分安全限制將敏感提示路由到Opus。
  • 測試表明,Fable 5在歷史分析和診斷上略勝一籌,但Opus 4.8以一半價格提供等效結果。
站內正文

全部來源