AI News HubLIVE
公開文章 105採集文章 109可信度 78刷新頻率 30 分鐘
健康狀態 健康來源類型 媒體原文權限 站內改寫最近入庫 2026-06-26ID the-new-stack-ai運行狀態 已啟用

Technical media source; summary-only unless authorization is obtained.

最新公開文章

在Fable 5禁令之後,Anthropic與19家組織共同發起開源安全機構

Linux基金會推出Akrites,這是一個協調開源軟體漏洞發現、修復和披露的機構,創始成員包括Anthropic、AWS、谷歌、微軟等20家組織。該倡議旨在應對AI驅動的漏洞發現帶來的挑戰,因為現有協調模式已跟不上速度。

  • Anthropic在Fable 5被禁後,與其他19家組織共同發起Akrites,這是一個由Linux基金會管理的開源安全協調機構。
  • Akrites透過共享的SIRT團隊整合漏洞報告,減少重複,加快關鍵開源專案的修復速度。
站內正文

美國政府剛剛告知OpenAI誰可以使用下一個GPT-5.6模型

美國政府出於網路安全考量,指示OpenAI對即將釋出的GPT-5.6模型實施訪問限制,僅限政府批准的合作伙伴使用。此舉引發行業爭議,有專家認為這將推動開發者轉向開源或中國模型,可能削弱美國在AI領域的領先地位。

  • 特朗普政府要求OpenAI分階段釋出GPT-5.6,並逐客戶審批訪問許可權。
  • OpenAI CEO薩姆·奧爾特曼對此表示不滿,稱這不是長期模式。
站內正文

“程式碼應被重新生成,而非維護”:Codeplain 為規範驅動開發辯護

Codeplain 公司主張程式碼應透過規範驅動進行重新生成,而非維護。其開源規範語言 Plain 將結構化文件作為唯一真相來源,並推出 agentic 框架 plain-forge 讓 AI 代理協助編寫規範。公司已獲得 300 萬美元融資,並認為規範而非程式碼才是應維護的資產。

  • Codeplain 提出程式碼應被重新生成而非維護,規範才是應審查和維護的物件。
  • 新框架 plain-forge 讓 AI 代理透過對話自動編寫和迭代規範。
站內正文

Azul 希望在 AI 之前發現你未打補丁的 JVM

Azul Systems 提供免費的 Java 虛擬機器(JVM)漏洞風險評估工具,旨在幫助 DevOps 和 SecOps 團隊發現 Java 執行時的暴露情況,以防 AI 輔助的攻擊者利用。該工具掃描網路中的 JVM 例項,包括嵌入式和管理不善的執行時,並返回基於 CISA KEV 和 NVD 的優先修復路線圖。Azul 還強調其安全更新策略,即僅提供安全補丁,降低修復風險。文章還討論了 AI 威脅,尤其是 Anthropic 的 Mythos 模型,但 Azul 並未實際測試該模型。

  • Azul 提供免費的 JVM 漏洞評估,掃描網路並識別未打補丁的例項。
  • 該工具輸出安全儀表板和修復路線圖,對標 CISA KEV 和 NVD。
站內正文

Anthropic 將 @Claude 永久植入 Slack 頻道

Anthropic 推出 Claude Tag,將 Claude 作為持久、共享的團隊成員直接嵌入 Slack,能夠隨時間積累機構知識、非同步工作且無需提示即可行動。該產品面向企業版和團隊版客戶提供測試版,取代了之前的 Claude in Slack 應用。

  • Claude Tag 讓 Claude 成為 Slack 頻道中的永久成員,可執行長期任務並積累上下文。
  • 它使用“代理身份”概念,為 Claude 分配獨立的工具和資料訪問許可權,確保安全。
站內正文

OpenClaw與Hermes在智慧體定義上一致,但在控制權上存在分歧

OpenClaw和Hermes Agent是兩種開源智慧體框架,前者以閘道器為核心,強調跨平臺連線;後者以記憶體為核心,注重持久化學習和技能提升。微軟和輝達已分別採納OpenClaw,而Hermes在開發者中流行。兩者代表了智慧體控制層的不同設計哲學,企業需根據場景權衡。

  • OpenClaw採用閘道器優先設計,支援多訊息渠道,已被微軟和輝達整合。
  • Hermes Agent以持久記憶體和自我改進技能為核心,注重開發者上下文。
站內正文

開發者正在驗證他們未曾編寫——甚至可能不理解——的程式碼

GitLab的AI問責制報告顯示,43%的開發者無法可靠區分AI生成的程式碼與人類編寫的程式碼,85%的人表示AI已將瓶頸從編寫程式碼轉移到審查程式碼。報告強調需要治理和整合工具鏈來管理AI生成的程式碼。

  • 91%的組織正在使用兩個或更多AI編碼工具。
  • 43%的開發者無法可靠區分AI程式碼與人類程式碼。
站內正文

DNS能否成為AI代理身份的基礎?

Linux基金會宣佈啟動代理名稱服務(ANS),這是一個開放標準,透過將AI代理與網際網路的域名系統(DNS)繫結,為其提供可驗證的身份。該標準源於OWASP GenAI安全專案的研究論文,並經過多次迭代。ANS利用現有DNS基礎設施和證書頒發機構,實現代理身份的註冊、更新和撤銷。此外,還有DNS-AID等發現標準。儘管有多個類似方案,但大型AI公司如Google、微軟等尚未參與。

  • Linux基金會推出ANS,基於DNS為AI代理提供可驗證身份。
  • ANS透過ACME協議控制域名,並頒發證書,變更寫入追加日誌。
站內正文

Cursor悄然收購開原始碼助手Continue,GitHub Copilot的替代品

AI開發者工具整合加速,Cursor收購了開源程式設計助手Continue,該產品已被關閉。Continue曾定位為GitHub Copilot的開源替代品,注重資料控制。此次收購是Cursor在18個月內的一系列收購之一,但Continue可能只是人才收購,其聯合創始人Nate Sesti將加入Cursor。

  • Cursor收購了開原始碼助手Continue,該產品被關閉。
  • Continue曾是Y Combinator孵化的開源程式設計助手,強調資料隱私。
站內正文

Qodo推出跨倉庫程式碼審查:為何對AI氾濫的團隊至關重要

Qodo釋出跨倉庫程式碼審查等新功能,應對AI生成程式碼帶來的治理挑戰。AI導致PR更大、審查更慢、錯誤更多。Qodo透過自動發現編碼模式、集中管理規則,幫助團隊保持控制。

  • Qodo推出跨倉庫程式碼審查、自定義規則挖掘和技能審查標準三大新功能。
  • AI生成的PR比人類大154%,審查時間長91%,引入的bug多9%(DORA報告)。
站內正文

向後移植錯誤修復已死,Valkey 專案現在派遣機器人

Valkey 專案在 9.1 版本中使用 AI 代理自動處理錯誤修復的向後移植,節省了維護者大量時間,同時推出了程式碼溯源守護工具來保護程式碼完整性。

  • Valkey 9.1 使用 AI 代理自動向後移植錯誤修復,處理合併衝突和 CI 測試。
  • Provenance Guard 自動掃描拉取請求,防止未經授權的程式碼被合併。
站內正文

Checkmarx 的新 SAST 引擎重點不在 LLM,而在後續處理

Checkmarx 釋出了一款新的靜態應用安全測試(SAST)引擎,該引擎結合了確定性規則掃描器、基於安全資料訓練的 LLM 以及專門用於分類真/假陽性的引擎。公司聲稱其 F1 得分為 0.499,遠高於行業平均水平,並在測試中發現了領先前沿模型遺漏的 327 個真陽性。該架構的核心是編排層,它將三個引擎自動整合在一起,無需客戶自行構建多引擎工作流。

  • Checkmarx 新 SAST 引擎包含三個引擎:確定性規則掃描器、LLM 和發現分析引擎(FAE),用於在結果到達開發團隊前過濾假陽性。
  • 公司聲稱 F1 得分為 0.499,是行業平均水平(0.20)的兩倍多,並在測試中找到了領先前沿模型遺漏的 327 個真陽性。
站內正文

Anthropic 改造 Claude Design 以修復交接問題,設計師與工程師意見分歧

Anthropic 對 Claude Design 進行了重大更新,旨在簡化設計與工程團隊之間的交接,新增雙向設計-程式碼整合、品牌一致性功能及共享使用配額。但設計師 Alfie Martin 認為令牌效率問題依舊,交接未顯著改善;工程師 Roman Martynenko 則對設計-程式碼整合持樂觀態度,認為混合工作模式將是未來趨勢。

  • Anthropic 重新設計了 Claude Design,加入雙向設計-程式碼整合,支援從程式碼庫拉取設計系統或從終端建立編輯專案。
  • 新功能包括品牌一致性自動繼承、新編輯器和更多聯結器(如 Adobe、Canva、Vercel 等)。
站內正文

MCP獲得缺失的企業授權層

MCP(模型上下文協議)現在擁有了企業級管理授權擴充套件,允許企業透過現有身份提供商集中控制MCP伺服器訪問。Anthropic和微軟率先支援,Okta作為首個身份提供商。該擴充套件使用新興的OAuth擴充套件ID-JAG,無需使用者同意即可安全交換令牌。

  • Anthropic和微軟在Claude、VS Code等客戶端中支援企業託管授權。
  • 擴充套件利用ID-JAG協議,透過身份提供商進行無同意螢幕的令牌交換。
站內正文

Cursor、GitLab和Zed一致認為GitHub正在崩潰。他們對如何重建意見不一。

AI編碼工具Cursor被SpaceX以600億美元收購的同一天,其聯合創始人Tomas Reimers釋出了名為Origin的Git相容程式碼託管平臺,旨在為AI代理時代重新設計基礎設施。GitLab和Zed也分別推出了自己的解決方案,顯示出對現有版本控制系統的普遍不滿。

  • SpaceX收購Cursor後,Origin平臺亮相,旨在取代GitHub。
  • GitLab推出Project Switch,透過重新設計架構提升代理執行速度。
站內正文

Vercel 推出 eve:將智慧體視為目錄的開源框架

Vercel 在 Ship 大會上釋出了開源框架 eve,它將每個 AI 智慧體定義為一個檔案目錄,類似於 Next.js 對 Web 應用的處理方式。框架內建持久化工作流、沙箱隔離、人工審批工具,並支援 Slack、Discord 等多渠道整合。eve 已內部執行超過 100 個智慧體,目前處於公開預覽階段,採用 Apache 2.0 許可。

  • eve 是 Vercel 推出的開源框架,將 AI 智慧體視為檔案目錄,類似 Next.js 的目錄即應用理念。
  • 框架支援持久化工作流、工具人工審批、沙箱隔離,並整合 Slack、Discord 等渠道。
站內正文

Block如何透過Slack管理其AI編碼代理艦隊

Block(Square、Cash App母公司)開發了BuilderBot,基於開源Goose框架,使工程師能在Slack執行緒中透過標記@builderbot來管理AI編碼代理。BuilderBot能處理跨數百個服務和數億行程式碼的任務,從Linear/Jira獲取工單,建立分支,發起PR,監控CI並根據反饋迭代。它理解公司所有服務、API和慣例,但絕不接觸客戶資料或支付資訊。系統每天執行超20萬次操作,每週合併約1500個PR,佔生產程式碼變更的15%。Block已將Goose貢獻給Linux基金會旗下的Agentic AI Foundation,並與Anthropic共同開發了MCP協議。儘管面臨大規模裁員,Block堅持向AI原生工程轉型。

  • Block透過BuilderBot在Slack中管理AI編碼代理,實現跨服務和倉庫的協作。
  • BuilderBot基於開源Goose框架,可自動處理工單、建立分支、發起PR並監控CI。
站內正文

Chainguard 代理技能成熟:推出超1000個加固代理技能公共登錄檔

Chainguard 擴充套件其 AI 編碼代理安全解決方案,推出包含 1000 多個加固代理技能的公共登錄檔、私有登錄檔以及內部技能加固服務。該服務將代理技能視為一等軟體工件,提供持續加固、審計跟蹤,並支援 Claude Code、Cursor、GitHub Copilot 和 Gemini CLI 等工具。同時,解決組織內部代理技能混亂問題,提供版本控制和訪問控制。

  • Chainguard 推出超 1000 個加固代理技能的公共登錄檔,每週更新。
  • 提供私有登錄檔和組織內部技能加固服務(封閉測試)。
站內正文

AWS在合併佇列中引入AI把關人

AWS在紐約峰會上宣佈為DevOps Agent新增釋出管理功能,包括髮布就緒審查和自主釋出測試,旨在應對AI生成程式碼激增帶來的交付瓶頸。

  • AWS DevOps Agent新增釋出就緒審查和自主釋出測試功能,現已提供預覽。
  • 釋出就緒審查可評估程式碼變更對生產環境的潛在影響,並檢測跨倉庫依賴風險。
站內正文

Google、Microsoft和OpenAI聯手打造AI缺失的信任層

Linux基金會旗下的Appia基金會宣佈成立,旨在為AI供應鏈提供開放的信任驗證規範。Google、Microsoft、OpenAI等13家創始成員參與,將制定模組化的合規規格,讓組織能夠以透明、可追溯的方式證明其AI系統符合監管和標準要求。

  • Appia基金會致力於為AI供應鏈建立開放、模組化的信任驗證規範。
  • 創始成員包括Google、Microsoft、OpenAI、Arm、西門子等科技與工業巨頭。
站內正文

你的AI沒問題,是你的資料有問題

企業在AI上投入數十億卻收效甚微,新創公司Clario指出問題根源在於資料中的冗餘、過時和瑣碎檔案(ROT),並推出了首個專門解決該問題的平臺。該公司從隱身模式中脫穎而出,獲得600萬美元種子輪融資。Clario透過掃描後設資料識別垃圾檔案,並透過Slack或Teams通知使用者處理,採用基於結果的收費模式。早期客戶分析顯示垃圾檔案比例高達60%,嚴重影響了AI專案的質量。

  • Clario平臺旨在解決企業資料中的ROT(冗餘、過時、瑣碎)問題,這些檔案佔據了儲存成本並汙染AI專案。
  • 公司獲得600萬美元種子輪融資,由五位前CIO兼CEO領導,採用結果導向的定價模式。
站內正文

Databricks 欲合併企業執行的兩大數據庫

Databricks 在資料+AI峰會上推出LTAP架構,旨在消除事務處理與分析系統之間的隔閡,為AI智慧體重建資料基礎設施。

  • LTAP 統一事務與分析資料,支援AI智慧體同時讀寫即時資料和歷史上下文。
  • 湖庫//RT提供毫秒級即時分析,無需額外資料副本。
站內正文

AWS賬單為何飆升?現在有智慧代理來解答

AWS推出FinOps代理,以自然語言互動分析雲成本、識別異常、自動建立工單,幫助團隊從週期性審查轉向持續最佳化。

  • FinOps代理是AWS第三款面向IT運營的AI代理,專注於雲賬單管理。
  • 該代理可透過自然語言提問,自動關聯CloudTrail日誌定位成本異常根因。
站內正文

Anthropic在生效日當天暫停Claude Agent SDK訂閱變更

Anthropic在計劃生效日當天暫停了對使用Claude Agent SDK的開發者訂閱計費變更。此前,該公司曾宣佈將把Agent SDK使用量從標準訂閱中分離,設定單獨的月度限額。這一暫停發生在Anthropic因美國政府出口管制指令而撤回兩款模型之後,旨在安撫開發者社群。

  • Anthropic暫停了原定於6月15日生效的Claude Agent SDK計費變更。
  • 變更計劃將Agent SDK使用量從標準訂閱中分離,設定單獨的月度限額。
站內正文

Anthropic Fable 混亂事件解析

自上週五以來,Anthropic與Mythos和Fable模型相關的爭議持續發酵。本文梳理了事件時間線,包括Anthropic與國防部的爭端、Mythos模型的釋出、白宮的分歧、Fable 5的推出及其安全限制引發的批評、以及最終導致特朗普政府實施出口管制的風波。文章分析了支援與反對Anthropic的論點,作者認為Anthropic大體上做出了正確決定,並間接為Fable做了廣告。

  • Anthropic因對軍事使用其AI模型設限而被視為供應鏈風險。
  • Mythos模型展現了強大的網路安全能力,促使Anthropic啟動Project Glasswing。
站內正文

Cohere將主權AI推銷給企業,現在透過首個程式設計模型瞄準開發者

Cohere釋出其首個開源程式設計模型North Mini Code(Apache 2.0許可),瞄準希望擁有和控制AI基礎設施的開發者。該30B MoE模型可在單張H100 GPU上執行,在代理程式設計任務上與Mistral、Qwen和Gemma競爭。

  • Cohere推出North Mini Code,一個300億引數的MoE程式設計模型,活躍引數30億,採用Apache 2.0許可。
  • 該模型可在單張輝達H100 GPU上執行,使開發者能夠實際自託管。
站內正文

你的AI生成應用執行在他們的雲上——這就是問題所在

AI程式碼生成工具能快速將提示轉化為應用,但多數應用執行在供應商的雲上,導致鎖定問題。生產環境中面臨可見性、測試、合規性和基礎設施分離的挑戰。本文分析了Lovable、Base44、Replit等工具的鎖定程度,並提出了評估AI應用構建器的標準:可觀測性、測試、合規性和可移植性。

  • AI應用構建器雖能快速生成應用,但預設執行在供應商雲上,導致鎖定。
  • 生產環境中,鎖定導致可見性、測試、合規性和基礎設施問題。
站內正文

Fable 5和Mythos 5仍被暫停:“球在Anthropic這邊”

Anthropic在週五晚因美國政府發現Fable 5存在特定越獄漏洞而突然停用其新旗艦模型Fable 5和Mythos 5。Anthropic認為漏洞輕微,但白宮AI負責人David Sacks和亞馬遜CEO的介入使得事態複雜化。該事件為AI安全監管樹立了新先例。

  • 美國政府對Fable 5釋出出口管制令,Anthropic被迫停用模型。
  • 亞馬遜CEO Andy Jassy向官員報告了研究人員發現的越獄方法。
站內正文

JetBrains能否在AI擴大技能差距之前彌合IDE技能鴻溝?

JetBrains推出課程創作者計劃,將動手編碼練習整合到專業IDE中,旨在彌合線上程式設計教育與行業實踐之間的鴻溝。儘管該計劃尚處於早期階段,僅有5位創作者完成整合,但其強調在AI輔助時代,基礎開發技能和IDE熟練度的重要性。

  • JetBrains釋出課程創作者計劃,允許教育者在Udemy、Coursera等平臺嵌入IDE內編碼練習。
  • 該計劃旨在解決線上教育缺乏專業工具實踐的問題,但僅與5位創作者完成整合。
站內正文

Fable 5 vs Opus 4.8:真正的較量,而非規格表

Anthropic釋出了新模型Fable 5,聲稱比Opus 4.8更智慧,但價格翻倍且存在安全限制。實際測試顯示,兩者在推理和程式設計任務上表現接近,Fable 5的優勢有限,而Opus 4.8價效比更高。

  • Fable 5定價為Opus 4.8的兩倍,且部分安全限制將敏感提示路由到Opus。
  • 測試表明,Fable 5在歷史分析和診斷上略勝一籌,但Opus 4.8以一半價格提供等效結果。
站內正文

全部來源