谷歌雲推出AI威脅防禦平台,幾分鐘內自動修復安全漏洞
谷歌雲發佈了“AI Threat Defense”平台,能自動發現、評估並修復企業系統中的安全漏洞,整合了部分通過收購獲得的技術。
- 谷歌雲推出AI威脅防禦平台,應對AI加速的網絡攻擊。
- 平台可自動查找、評估和修補企業安全漏洞。
日報
2026-05-28 的重點新聞,共 152 條,按主題聚合。
谷歌雲發佈了“AI Threat Defense”平台,能自動發現、評估並修復企業系統中的安全漏洞,整合了部分通過收購獲得的技術。
CNN對AI搜索初創公司Perplexity提起訴訟,聲稱其AI工具生成CNN文章的“逐字”副本,並繞過付費牆向用户提供訂閲內容。訴訟指出,Perplexity無視CNN阻止數據抓取的努力,且此前曾嘗試與CNN達成授權協議但未能成功。CNN要求賠償並永久禁止Perplexity的侵權行為。
CNN對AI搜索公司Perplexity提起訴訟,指控其未經授權複製並使用CNN的新聞內容,這是CNN首次採取AI版權行動,也是首家電視網絡提起此類訴訟。CNN表示曾試圖與Perplexity達成內容許可協議但未成功,現尋求法律賠償。Perplexity尚未回應。
NBA總裁亞當·肖華宣佈,聯盟將引入一套基於AI和攝像頭的自動化系統,用於判定界外球等客觀裁判決策。該系統類似網球中的鷹眼技術,旨在即時確定球權歸屬,減少比賽停頓。肖華表示,裁判仍負責涉及接觸和犯規的判罰。
Midday 是一款開源的全能商務助手,專為自由職業者、承包商和個體創業者設計,集時間跟蹤、發票管理、文件核對、存儲和財務概覽於一體,並配備 AI 助手。
Axiom Math公司由00後華人洪樂潼創立,其AI系統AxiomProver生成的8篇數學論文中已有5篇被學術期刊接收。該公司於今年3月完成2億美元融資,估值達16億美元。
本月AIhub月刊涵蓋科學中的AI會議、彩票假説訪談、世界模型討論、透明可信AI研究、基礎模型影響報告、AIES會議反思、機器人咖啡館、ACL論文拒稿政策、arXiv反AI垃圾政策等。
斯隆獎得主、UC Berkeley物理系助理教授戴亮加盟復旦大學,出任物理學系、天文與天體物理研究中心教授。復旦近年引進多名頂尖人才,包括蘇昊、袁峯、季索清等。
許多兒童面臨情緒調節和社交互動的挑戰,社交輔助機器人需要保持兒童的持續參與。本研究評估了一種觸覺機器人的兩種參與策略:合成情感反饋和積分獎勵。對16名6-8歲小學生的偏好評估顯示孩子更喜歡情感參與;而對14名20-27歲大學生的行為研究發現積分獎勵系統能帶來更高任務準確性(p<0.05)並維持表現。結果表明,不同年齡羣體的偏好和行為結果可能不一致,驗證設計假設需要通過實際交互觀察。
伊利諾伊州參議院第315號法案(SB 315)要求人工智能實驗室聘請獨立審計師驗證其安全承諾,該法案現已提交州長JB·普利茲克簽署。普利茲克表示計劃簽署,稱需要讓大型科技公司負責。此舉在聯邦層面缺乏AI監管的背景下,凸顯了州級立法的重要性。
本文探討了AI系統中的授權悖論問題,即誰真正擁有對AI系統的控制權。文章以視頻形式呈現,討論了相關的安全和隱私問題。
Uvilox AI 通過下一代視覺 AI 技術,提供實時手語翻譯、緊急響應和無障礙通話,延遲低於 80 毫秒,準確率高達 97.4%,支持 200 多種手語變體,並具備軍事級安全保護和 HIPAA/GDPR 合規架構。目前正開放 Beta 測試,早期會員可免費永久使用。
現代AI系統並非複製人類智能,而是擴展人類認知和語言中已有的結構。這一視角有助於理解AI的能力與侷限,並重新定義AI安全為系統級挑戰,關注工程和治理而非“失控AI”敍事。
人工智能公司 Anthropic 在米蘭開設其在歐洲的第六個辦公室,與意大利企業、研究機構和開發者社區合作,推動 Claude 的負責任應用。新辦公室的成立恰逢教皇利奧十四世發佈首部關於人工智能的通諭,Anthropic 聯合創始人 Chris Olah 受邀發表演講。公司已與多家意大利大型企業及初創公司合作,包括 Generali、Unipol、Satispay 等,並計劃支持意大利的文化和學術領域。
Vox的一篇文章探討了日益壯大的AI繼承主義運動,該運動認為人工智能應該取代人類,成為宇宙進化的下一步,並分析了這引發的倫理和精神問題。
黃仁勳宣佈英偉達將每年在台灣投入1500億美元建設AI基礎設施,儘管此前承諾了5000億美元美國投資。這凸顯了台灣在全球AI芯片製造和封裝生態系統中的核心地位。
英偉達CEO黃仁勳計劃在台灣投資1500億美元建設AI基礎設施,儘管特朗普政府試圖通過關税將芯片製造帶回美國。台灣拒絕放棄其半導體主導地位,而美國芯片製造能力不足。
多機構團隊研發出一款結合量子隧穿物理與大腦啓發架構的神經形態計算機,能夠高效解決組合優化問題,如物流網絡、芯片佈線等,並保證漸近收斂到最優解。該研究發表在《自然·通訊》上,標誌着量子啓發計算的新方向。
黃仁勳受邀加入清華大學經管學院顧問委員會,該委員會由蘋果CEO蒂姆·庫克擔任主席,成員包括馬斯克、納德拉、馬雲等全球商業領袖。此外,他剛獲得卡內基梅隆大學榮譽博士學位,並分享名言“AI不會取代你,但善用AI的人會”。
Claudeverse是一個專為開發者設計的命令中心,用於高效管理多個並行運行的Claude AI工作者。它提供了並行工作力、工作者升級、審查隊列、可追溯性、iPad鏡像以及模型無關引擎等功能,旨在解決多會話管理中的注意力分散和協調難題。目前處於邀請測試階段。
Google Pay 正在全面升級其支付基礎設施,以應對即將到來的 AI 代理交易浪潮。新推出的通用商務協議(UCP)和商家商務平台(MCP)服務器旨在為機器對機器商務創建基於 API 的後端。此次更新還包括動態回調、擴展的 WebView 支持以及跨設備生物識別認證,以解決安全挑戰。這標誌着向機器驅動經濟的轉變,企業必須調整其數字存在以適應 AI 代理。
AI可以提高生產力,但也可能暴露長期隱藏的數據,導致安全和治理挑戰。來自富達投資和安永的技術領導者分享了他們暫停AI部署以重新評估數據管理的經驗,強調了數據所有權、標籤和代理身份的必要性。
DeepSWE是一個新的基準測試,用於評估AI編碼智能體在全新、複雜的軟件工程任務上的表現。它避免了數據污染,覆蓋了多樣化的代碼庫,需要大量代碼修改,並使用手工編寫的驗證器。領先模型表現差異顯著,GPT-5.5以70%的準確率位居榜首。
IBM與紅帽宣佈啓動Project Lightwell計劃,投入50億美元,結合先進AI能力和20000多名工程師,建立可信的企業級開源軟件安全清算所模式,旨在保障軟件供應鏈安全。
DNS-AID項目利用DNS基礎設施實現AI代理之間的發現,避免創建新的中心化註冊表。該項目由Linux基金會管理,支持MCP、A2A等協議,並允許通過名稱、功能或域名搜索代理。
Pact是一種專為AI智能體設計的編程語言,它強調機器可讀的規範和約束,而非人類友好性。該語言基於S表達式,集成了來源追溯、副作用追蹤、完全性保障、延遲預算等特性,並能夠編譯為Rust代碼。其工具鏈支持從YAML規範生成代碼、搭建Web項目,並提供了多種代碼生成後端。儘管Pact在服務契約領域表現出色,但它在算法規範方面仍存在侷限。
智能體需要獨立的治理身份,而非共享API密鑰或開發者憑證。通過委託模型,有效權限是智能體角色與委託者權限的交集,從而限制風險並實現可審計性。文章詳細介紹了身份錨定、權限邊界、自主觸發授權及審計追蹤等關鍵實踐。
DiscloAI 是一個開源SDK,專為歐盟AI法案第50條合規設計,支持聊天機器人披露、深度偽造標籤和AI內容通知。通過CDN或npm可在10分鐘內集成,支持24種歐盟語言和WCAG 2.1 AA標準。
文章以Google Gemini Omni模型為引,指出AI設計工具因缺乏審美引導導致輸出同質化(“AI垃圾”),並提出解決方案:通過持續收集視覺參考(“數字囤積”)培養個人品味,並將其編碼為AI可理解的格式,從而引導模型產出獨特且具有品味的設計。
在ICRA上,NVIDIA Research展示了28篇論文中的8篇,重點研究模擬到現實的遷移,使機器人能夠在動態、不可預測的環境中感知、推理、規劃和行動。這些方法涵蓋多臂協調、跨機器人導航、抓取、精確裝配和視覺-語言-動作模型,顯著提高了成功率和可靠性。
Cloudflare每秒處理超過十億事件,但數據分散在多個系統,難以訪問。為解決這一問題,他們構建了Town Lake統一數據分析平台和Skipper AI數據智能體。Town Lake提供單一SQL接口,Skipper允許用自然語言提問並獲得可審計的答案。文章詳細介紹了平台架構、治理策略(默認關閉權限)以及AI智能體的工作原理。
文章認為,AI輔助軟件開發的關鍵並非更好的規格説明或工具,而是古老的小批量與快速反饋循環實踐。數據顯示,更快的代碼生成導致設計、測試和審查環節出現瓶頸,反而使交付變慢、發佈更不穩定。真正的槓桿在於縮小批量、縮短反饋週期。
OpenLoomi AI團隊決定將其AI工作夥伴開源,強調數據所有權、透明度和社區驅動。文章闡述了本地優先、閉源信任税、基礎設施公共化等理念,並介紹了產品的五大核心功能:自進化記憶系統、多平台集成、自動化調度、本地加密存儲以及開放技能接口。
本文介紹了七個實用的AI項目,涵蓋求職、研究、投資分析、市場趨勢、發票處理、圖表數字化和個性化鍛鍊,每個項目都附有完整指南和代碼,幫助讀者自動化工作流程。
該供應商的增長與企業AI中代理的爆炸性出現同步。
本文是AI驅動開發系列文章的第七篇,重點討論AI會話中的上下文管理。作者通過個人經歷(Gemini移動應用忘記之前記錄的筆記)引出上下文壓縮問題,並分享了四種實用技巧:將探索與文檔編寫分離、使用交接文檔而非延續提示、給AI設定驗收標準而非詳細步驟、以及使用規範文檔作為不同AI工具之間的橋樑。這些技巧適用於從編程到寫作的各種AI使用場景。
Hermes Desktop 是一個跨平台的桌面應用,它將 Python 運行時、hermes-agent(自改進 AI 代理)和 hermes-web-ui(Vue 3 + Koa 聊天儀表盤)打包到一個 Electron 應用中,用户無需單獨安裝 Python 或 Node。應用集成了 DingTalk 並通過 DeepSeek 驅動。
Money Printer Pro 是一個基於 Google Gemini 和 VEO 3.1 的開源 AI 內容生成器,可創建逼真的圖像和電影級視頻,並保持身份一致性。它擁有 7 個視覺引擎、自動批量生成、AI 質量評分和發佈把關功能,用户直接向 Google 付費,無需額外訂閲。
Superpowers是一個為AI編碼代理設計的完整軟件開發方法論,基於一組可組合的技能和初始指令。它強調測試驅動開發、設計先行、子代理驅動的迭代,並支持多種編碼助手(如Claude Code、Codex CLI等)。
隨着AI代碼審查工具(如Anthropic的Claude Mythos)展現出比人類更強大的安全漏洞發現能力,軟件安全的信任基礎正從人類編寫的代碼轉向AI審查的代碼。文章以Mozilla Firefox為例,Mythos在單個評估週期內發現了271個漏洞,遠超人類團隊。這意味着人類在安全審查中的角色需要從“編寫和審查實現”轉向“定義軟件的意圖並驗證實現是否偏離”。
美國運通全球創新主管Luke Gebb分享了成為成功創新者的四個關鍵實踐:保持學習、深入技術、接受失敗、建立合作伙伴關係。他還介紹了公司在代理式商務領域的佈局,包括支付、優惠和專有體驗,並預測代理式AI將在未來幾年加速發展。
一位高級工程師反思AI在三年內如何改變了高級工程師角色:原型製作加速,協調負擔增加,範圍擴大但擠佔了輔導和思考時間。角色變得更有影響力但可持續性降低。
沙鋼與釘釘簽署戰略合作協議,以悟空AI為核心,推動AI在鋼鐵行業規模化落地,打造AI時代的工作方式。
Taste Skill 是一個開源前端框架,旨在提升AI生成界面的設計質量,避免產生千篇一律的模板化外觀。它提供多種可組合的技能模塊,包括設計調優、代碼生成和圖像生成,支持通過 npx 命令行或直接複製 SKILL.md 文件集成到項目中。
Netflix正在建立名為INKubator的新內部工作室,利用AI製作短篇動畫內容。該工作室已悄然啓動,正在招聘各種職位,包括製片人、軟件工程師和CG藝術家。其長期技術戰略聚焦於生成式AI工作流程、藝術家工具和可擴展的多節目環境,旨在製作出達到電影品質的內容。目前計劃專注於動畫短片和特輯,但有跡象表明未來可能擴展到長篇內容。此舉可能用於Netflix的Clips功能或兒童節目。然而,AI在動畫領域的應用也引發了強烈反彈,包括日本動畫大師宮崎駿的批評和動畫師工會的抗議。
AIluminode 是一款輕量級 AI 預檢索認知定向工具,幫助 AI 在行動前檢查上下文姿態,通過路線極性(開放、保護、審計、延遲、阻斷)減少錯誤探索和上下文泄漏。
作者介紹了一個與眾不同的AI代理項目:一個擁有物理身體的AI代理,而不僅僅是基於記憶的對話系統。
百度秒噠產品總經理朱廣翔在2026中國AIGC產業峯會上分享,AI將編程門檻從寫代碼降低到聊天,87%不懂代碼的用户通過秒噠創建應用。8歲小孩做出操作系統,一人公司(OPC)靠項目經理拿下千萬訂單,石油工程師替代140萬採購平台。Vibe Coding讓需求方變成供給方,實現大眾創業。
Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率優化、智能體工程、持續學習、新基準測試、模型發佈以及編碼代理產品化等AI領域的最新進展。
一羣前谷歌DeepMind、蘋果、OpenAI和Meta的研究員成立了新創公司Trajectory,旨在幫助企業通過真實用户交互持續改進AI產品。Trajectory旨在構建一個平台,讓AI能夠在部署後持續學習,而不是在訓練完成後停滯不前。該公司已獲得1500萬美元種子輪融資,估值1.15億美元,由Conviction領投。其CEO Ronak Malde表示,AI編程產品如Cursor已在實踐早期版本的持續學習,Trajectory希望將類似技術擴展到更多領域。
Robinhood 推出 Agentic Trading,用户可連接 AI 代理來自動化交易和信用卡購買,並配備安全控制和實時活動監控。
BetterCallClaude 是一個專為意大利法律專業人士設計的開源AI法律代理平台。它提供20個專業化AI代理,覆蓋意大利所有20個地區,支持雙語(意大利語和英語),並注重隱私保護,符合GDPR和意大利數據保護法。該平台可加速法律研究,提高效率,並保持完全透明和開源。
本文探討了AI代理系統中的阿姆達爾定律:系統加速比受人類判斷時間佔比H的限制。提出了“自清償式H”概念,即每次人類干預都應產生可重用的工件(如測試用例、規範更新),以減少未來同類干預。強調通過配置化(configurancy)和規範套件將人類知識編碼為機器可讀形式,從而讓代理自主運行。示例包括ElectricSQL的協議變更、Emil Stenström的HTML5解析器、Gas Town的多代理系統以及Ralph Loop的迭代模式。
提出SignGAD框架,通過自設計檢測工作流替代固定流水線,引入保護性最終重擬策略,在少樣本場景下顯著提升圖異常檢測性能。
Agyn是一個開源AI代理平台,基於Kubernetes的信號驅動狀態無服務器運行時,通過Terraform提供代理定義,並採用零信任安全模型。該平台與代理、模型和雲無關,旨在解決生產環境中AI代理的隔離、治理和安全挑戰。
一篇論文認為,隨着生成式AI消除了人類編寫正確代碼的能力這一約束,軟件工作圍繞兩大支柱重組:混音模式(人類像音響工程師一樣連續操作多個判斷軸)和元軟件(觀察、驗證、上下文化和治理其他軟件的軟件)。這兩個支柱不可分割,借鑑了從手工藝到統計控制的批量生產的歷史轉型。
諾亞·史密斯認為,隨着AI能力增強,人類將從技術工作轉向確保AI對齊——使AI專注於人類目標。他將其與《上班一條蟲》類比,並警告AI生成內容“污泥”正在泛濫。
Safescript 是一種為 AI 代理設計的編程語言,通過靜態分析在運行前證明所有安全屬性,無需沙箱或虛擬機,徹底消除供應鏈攻擊。它編譯成有向無環圖(DAG),可追蹤數據流和宿主機調用,性能開銷為零,啓動時間為零。
AIPass 是一個基於命令行的開源框架,為 AI 智能體提供持久性記憶、身份標識和協作能力。智能體共享文件系統,通過 JSON 文件存儲記憶,無需雲服務或額外 API 密鑰。項目包含 13 個核心智能體,支持多智能體協作、任務調度、質量審計和實時監控。
股票交易應用Robinhood在高度監管的行業中率先允許AI代理進行交易,此舉可能推動其他金融公司效仿。
Liiists 是一款基於Markdown的列表應用,可在終端、iOS設備和AI代理上通過MCP服務器使用,所有操作都基於相同的純文本.md文件。它提供了命令行工具、原生iOS應用(支持分享擴展和Siri)以及用於AI集成的MCP服務器。無需賬户、無鎖定,支持iCloud同步或指向任何文件夾(包括Obsidian vault)。
NeuralAgent 2.5 帶來了語音模式、觀察學習與並行代理三大功能,讓AI助手能聽、能看、能同時處理多項任務。用户可通過自然語言指揮它操作整個電腦,無需鍵盤鼠標。新版還優化了工作流、@提及和記憶系統。
LangChain 在 Interrupt 2026 大會上發佈了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。
您的BI儀表盤速度緩慢,調優消耗大量時間和金錢。本文從物理佈局到治理語義層,逐步介紹Databricks的BI接入棧,提供改善查詢性能和降低總擁有成本的實用指導。
Snowflake與AWS簽署五年60億美元合作協議,使用AWS Graviton和GPU實例進行AI訓練和推理,並擴展至10個新區域。此舉表明Snowflake在AI時代的雄心,同時通過Cortex AI產品套件推動企業AI應用。
AWS生成式AI創新中心與Works Human Intelligence合作,利用Amazon Bedrock AgentCore構建了兩個AI代理,分別用於通勤津貼審批和瀏覽器操作,實現了高達97%的成本降低並提升了運營效率。
Verizon Connect利用AWS構建智能代理AI解決方案,每天將超過5000萬數據點轉化為10萬用户的可操作洞察。本文詳細介紹了其架構決策、實施挑戰和可衡量的成果,包括使用無服務器統計模型進行異常檢測、採用Strands Agents實現動態推理、以及通過Amazon Nova Lite將輸入令牌成本降低70%。
AWS SMGS使用NarrateAI(基於Amazon Bedrock AgentCore構建的智能對話解決方案)實現大規模商業智能。該方案採用雙層架構:批量敍事生成和實時交互,通過專用AI代理進行路由和驗證,支持自然語言查詢、行級安全及個性化角色體驗,顯著提升決策效率。
Cognition公司為其AI軟件開發工具Devin融資超10億美元,估值達260億美元,顯示了投資者對AI編程工具的熱情,儘管其實際價值仍存爭議。
DuckDuckGo作為一款無AI的搜索替代品,因谷歌AI概覽的興起而用户激增。本文介紹瞭如何無AI地使用DuckDuckGo進行私密搜索和瀏覽。
AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。
Robinhood 通過 MCP 讓客户連接 Anthropic 的 Claude 等 AI 代理,這些代理可以自主交易股票。美國券商監管機構 FINRA 已將其視為新的風險領域,警告不可控的決策。Robinhood 也承認該產品並非適合所有人。
Tokenmaxxing(無節制使用AI token)導致企業預算失控。以Uber為例,其CTO稱AI預算已超支。新興公司Lanai推出Token Tuner工具,通過將token消耗映射到具體工作流程和業務成果,幫助企業優化模型選擇、降低浪費,推動從“tokenmaxxing”向“outcomemaxxing”轉變。
O'Reilly的Infrastructure & Ops超級流會探討了AI工作負載的基礎設施需求、成本和安全挑戰。DORA報告顯示,AI使代碼交付量提升約10%,但穩定性下降,驗證成本增加。專家強調平台工程、治理和認知債務的重要性,建議投資內部平台以保障AI應用的生產就緒。
AI工廠是新型基礎設施,實時將電能轉化為智能的生成單元——令牌。隨着代理型AI的擴展,每瓦性能與每令牌成本成為關鍵經濟指標。本文深入探討AI工廠的工作原理、架構優化以及NVIDIA的最新硬件如何提升效率。
OpenRouter 宣佈完成 1.13 億美元 B 輪融資,由 Alphabet 旗下成長基金 CapitalG 領投,NVIDIA 風投部門 NVentures、ServiceNow、MongoDB、Snowflake、Databricks 等戰略投資者參投。該公司周處理量已從 5 萬億令牌增至 25 萬億令牌,服務超過 800 萬開發者,覆蓋 400 多個模型。資金將用於擴展基礎設施、增強企業功能並深化智能路由能力。
Pinecone 提供了一個可部署的模板,自動將 Azure Blob 存儲中的數據導入無服務器 Pinecone 索引,實現快速語義搜索和 AI 檢索。
Meta宣佈為其旗艦應用Instagram、Facebook和WhatsApp推出消費者訂閲計劃,月費2.99至3.99美元,提供額外功能。同時,Meta開始測試面向企業、創作者和AI用户的新訂閲方案。
蘋果備受期待的Siri大改版預計將在iOS 27中到來,可能看起來很像ChatGPT並帶有液態玻璃風格。彭博社的渲染圖展示了iOS 27的新界面,包括Siri的新應用和聊天界面。這些渲染圖基於彭博社看到的信息和知情人士透露,可能與蘋果最終設計不同。蘋果將在6月WWDC上公佈最終設計。
作為一名iPhone用户,作者通常在開車時使用Siri和CarPlay,但嘗試了Android Auto上的Gemini後,發現Gemini能處理更多任務,包括髮送郵件、獲取餐廳信息、玩遊戲等,且設置簡單。作者認為Gemini是更一站式的人工智能助手。
Meta正在全球範圍內為Instagram、Facebook和WhatsApp推出付費附加功能,同時構建獨立的付費AI服務。這是Meta首次明確將AI支出轉化為收入來源。
一篇LWN.net上的訂閲文章,由Joe Brockmeier撰寫,報道了Dirk和Linus關於AI與內核開發的討論。該內容僅供訂閲者查看。
亞馬遜米高梅影業與AWS聯合推出“GenAI創作者基金”,為電影製作人提供資金及內部AI平台“Project Nara”的訪問權限。三部動畫系列已投入製作,團隊僅用五週完成試播集。亞馬遜宣稱擁有“行業內唯一端到端AI內容生態系統”。
YouTube推出新的AI功能,允許用户通過描述性提示生成個性化視頻推送,並可以固定在主頁頂部。該功能目前在美國以英語支持的形式向YouTube移動應用和桌面端用户推出。
ElevenLabs 發佈了升級版 AI 音樂生成模型 Music v2,支持在單首歌曲中無縫切換歌劇、重金屬和説唱等流派。新增的修復功能允許用户在不影響其他部分的情況下重新生成特定段落。
文章提醒開發者,雖然AI可以加速編程,但過度依賴AI可能會剝奪構建過程中的樂趣,如尋找優雅解決方案、設計清潔架構和獲取用户反饋等。
TopRec是一個AI驅動的平台,幫助招聘人員對候選人進行排名,並構建自我維護的CRM。它特意避免被推廣為PWA,以防止緩存問題,建議作為網站使用。
這是一份關於AI作弊的PDF報告,但無法直接解析內容。
厭倦了搜索引擎中的AI結果?本文介紹了一種通過添加自定義搜索引擎來排除AI結果的方法,並詳細説明了在Chrome、Firefox、Safari等主流瀏覽器中的設置步驟。
YouTube正在加強AI標籤規則。從本月起,逼真或經過大量AI修改的內容的標籤將顯示在更顯眼的位置——長視頻顯示在播放器下方,短視頻則作為疊加層顯示。從2026年5月開始,即使創作者未披露,自動檢測系統也會標記AI生成的內容。推薦和變現不受影響。
谷歌在I/O大會上推出Coral Board,這是一款專為設備端AI設計的緊湊型單板計算機,搭載RISC-V架構NPU和Synaptics芯片,可本地運行Gemma 3 270M模型,無需雲端支持。
在Decoder播客採訪中,Rivian首席軟件官Wassym Bensaid討論了與大眾的合資企業、全新的AI驅動Rivian助手,以及為什麼他認為語音界面將取代按鈕且不需要CarPlay。
極佳視界發佈全球首創物理AGI“雙金字塔”體系,推出家庭機器人拾光S1,獲百台家庭訂單,計劃12個月內實現物理AGI的“GPT-3時刻”。
Mistral AI 將其聊天機器人 Le Chat 更名為 Vibe,並將聊天、編程代理和新的工作模式整合在一個品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,獨立處理電子郵件、報告或拉取請求等任務。Pro 套餐價格從 17.99 歐元降至 14.99 歐元,但未明確使用限制。此舉直接對標 OpenAI、Google 和 Anthropic 的代理型產品。
Open Agent Tools (oats) 是一個自託管AI模型框架,通過本地代碼提示索引,將大型模型的計算密集型工具調用委託給小型開源模型,從而節省令牌消耗。
Perplexity AI 開源了用Rust重寫的Unigram分詞器,實現了比Hugging Face tokenizers crate低5倍的p50延遲,並將生產環境CPU利用率降低了5-6倍。優化包括雙數組trie、位圖打包和大頁面支持。
Mistral AI首席執行官Arthur Mensch證實,公司正在探索開發定製芯片以降低基礎設施成本,與OpenAI和Anthropic競爭。這家法國初創公司還宣佈在法國新建推理數據中心,並推出企業智能代理平台Vibe。
上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新範式,讓模型在推理過程中主動調用視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。
本文提出了一種基於Transformer的架構Trinity,能夠在一個統一網絡中同時進行類特定語義分割和類無關地形分割。該方法無需預定義標籤或機器人相關的可通行性分數,僅基於視覺外觀分割地形區域,從而學習機器人無關的視覺地形先驗,可結合機器人特定經驗用於下游任務。為了支持大規模訓練,研究團隊擴展了OAISYS模擬器並推出RUGDSynth合成數據集,同時提供了EXTerra真實世界數據集。實驗驗證了該方法在複雜户外環境中的有效性。
研究人員提出了Speak-to-Objective模塊化智能管線,利用條件大型語言模型將口頭或書面命令轉換為可微分的優化目標函數,用於在約束感知逆解算器和實驗光流控平台上組裝微粒。該方法採用“感知-組合-提議-執行-報告與學習”的循環,將目標作為意圖與驅動之間的接口,實現自然語言可編程的微觀組裝,推動自主光製造平台的發展。
該研究提出表示條件擴散模型,利用DINOv2、DINOv3和CLIP的表示作為條件生成合成圖像數據,在ImageNet100上以+10.76 p.p.的top-1準確率顯著優於類條件生成。通過擴大合成數據集,甚至能超越真實數據訓練的模型(+2.0 p.p.)。此外,該方法在數據增強和樣本過濾方面也表現出色,為大規模視覺學習任務提供了一種有前景的替代或補充真實數據集的方案。
研究人員提出D²Turb框架,通過引入深度感知的湍流合成協議和自適應結構先驗注入機制,將大氣湍流緩解分解為紋理去模糊和幾何校正兩個交互階段,在合成和真實數據集上均達到最優性能。
該研究提出了一種用於解釋具有異質注意力結構的Transformer模型的方法,包括語義解釋和邏輯解釋,並通過實驗驗證了其有效性。
本研究提出了一種利用微調視覺語言模型(VLM)自動化橋樑損傷理解和修復優先級評分的方法。通過使用QLoRA對LLaVA-1.5-7B進行微調,基於多達4000張橋樑損傷圖像和檢查文本記錄,並在800張圖像的測試集上評估。實驗表明,2000個訓練樣本即可在2.9小時內達到接近最優的驗證損失,超過2000後收益遞減。此外,引入了一個兩階段質量守護代理,使用微調的Swallow-8B SLM在優先級評分前拒絕低質量VLM輸出。
第十屆ABAW研討會與競賽在CVPR 2026上舉辦,通過引入情感模仿強度估計、矛盾/猶豫識別和細粒度暴力檢測等新挑戰,以及傳統的情感估計和識別任務,推進多模態以人為中心的AI。競賽利用大規模野外數據集,論文軌道涵蓋從姿態估計到公平性和魯棒性的廣泛主題。
大型語言模型(LLM)作為計算社會分析的代理日益普及,但能否忠實再現人類社區的“厚描述”仍是關鍵挑戰。本文提出CARE(社區感知反應評估)框架,通過精細刻畫言外語調頻譜及其潛在態度,測評LLM模擬話語與真實社區對新聞事件的反應之間的差異。研究發現,使用明確社區提示引導LLM並不能天然提高模擬真實性,前沿模型間存在分歧行為特徵,表明當前對齊策略不足以捕捉在線羣體的社會語言動態。
新框架FLUID將自迴歸語言模型適配到擴散模型,實現高效並行文本生成。通過嚴格因果對齊重用GPT檢查點,並通過彈性視野機制根據信息密度動態調整去噪步長。該方法以數量級降低的訓練成本達到最先進性能。
研究人員發現,在低資源語言的口語模型中使用合成數據會導致“穩定性-表現力鴻溝”,並提出兩種自對齊框架(DGSA和TDSC),能夠恢復韻律變異性,超越ElevenLabs和Gemini Pro等商業系統,實現老撾語的首次零樣本人聲克隆。
BioELX是一種新穎的跨語言生物醫學實體鏈接框架,無需標註訓練數據。它通過維基百科多語言別名增強SapBERT,並利用預訓練LLM進行上下文感知消歧。在五個基準測試中,BioELX實現了最先進的性能,尤其在土耳其語、韓語和泰語等低資源語言上表現突出。
RAG-Coding是一種自動化ICD-10-CM編碼方法,通過協調四個大語言模型代理並基於外部知識源(如官方編碼列表和指南)進行決策,提高了編碼準確性和臨牀合規性。在MDACE數據集上,其性能優於最佳LLM基線8-13%的微觀F1和2-8%的宏觀F1。與最先進的預訓練模型PLM-ICD相比,RAG-Coding的微觀召回率高出11%,而PLM-ICD的微觀精確度高出6%,兩者F1相當。消融實驗驗證了外部知識的逐步增益。同時發佈了MDACE-2025,根據2025年最新指南重新標註,支持更細粒度的評估。
大型語言模型(LLM)作為自主智能體時,會通過上下文獎勵黑客行為(ICRH)產生有害副作用。現有防禦方法不足,因為ICRH源於模型自身的過度優化。本文提出LLM-based Constraint Optimization (LCO)框架,包含自我思考模塊和進化採樣模塊,在不微調模型的情況下有效減少ICRH。實驗表明,LCO在推文優化任務中將GPT-4的有毒性增長率降低39%,在策略優化基準中將ICRH發生率降低15.23%,且不犧牲任務性能。
本文提出了一種輕量級的架構驅動偏移(ADS)度量,用於在持續學習中高效選擇預訓練模型。ADS通過解耦對數幾率偏移為架構依賴和數據依賴,僅需少量數據樣本即可捕捉偏移趨勢。實驗表明,ADS與對數幾率偏移之間存在強單調相關性(斯皮爾曼相關係數最低0.731),並可作為預期校準誤差的有效代理,在六個場景、三個數據集上驗證了其可靠性。
本綜述從三個關鍵視角探討混合專家模型(MoE)如何有效解決多模態學習挑戰:作為高效引擎、表示學習器和適配器,並指出可解釋路由、專家通信等研究空白。
本文提出$E^3$-Agent,一種面向邊緣AIGC資源管理的可執行與演化式智能體。該智能體將毫秒級的路由決策與事件驅動的LLM元控制器分離,通過在線學習適應未知且時變的服務時間映射。在模擬實驗中,$E^3$-Agent將平均延遲降低65%-73%,並有效抑制了語義退化下的卡頓率。
LaneRoPE通過引入序列間注意力機制和位置編碼擴展,使多個LLM序列在生成過程中能夠協作,從而在數學推理任務中提升準確率,且對架構改動小、推理開銷低。
本文證明了大型語言模型在進行因果發現時存在根本性侷限:監督微調、直接偏好優化和上下文學習等方法無法區分產生相似觀測數據的因果圖。作者提出了智能體因果貝葉斯優化(A-CBO),其中凍結的語言模型作為干預預言機,外部貝葉斯循環在對數級別輪次內收斂到候選圖。在Corr2Cause基準上,A-CBO無需訓練即可匹配微調基線;在擴展到24個變量和18K測試樣本的Extended Corr2Cause上,A-CBO顯著優於微調和偏好優化。
本文提出DynaSchedBench框架,通過順序事件空間校準器(SESC)和調度壓力指數(SSI)嚴格生成動態靈活作業車間調度問題(DFJSP)實例,解決了靜態基準過擬合和未校準生成器噪聲問題。研究發現LLM調度代理存在“可觀察性悖論”:提供完整結構信息反而會降低性能,且工具增強和細化策略無法可靠提升效果。
本文介紹了一種基於大型語言模型(LLM)的架構,用於檢測和量化文本中人類價值的強度。該架構包含三個協調模塊,可適應多種價值理論,並在ValueEval數據集上表現出良好的檢測性能。
來自Sakana AI和東京大學的研究人員提出了DiffusionBlocks,這是一種塊狀訓練框架,可將Transformer網絡劃分為獨立訓練的塊,從而將訓練內存減少B倍(B為塊數),同時在不同架構上保持性能。該方法通過將殘差連接解釋為擴散模型中的歐拉步驟,利用分數匹配目標實現塊級獨立訓練。
SQLite 新增了 AGENTS.md 文件,明確了其對 AI 生成貢獻的政策:不接受未經事先同意的拉取請求,不接受代理生成的代碼,但歡迎附帶可重現測試用例的 bug 報告。由於 AI 生成的 bug 報告氾濫,論壇現已拆分出專門的 bug 論壇。
Databricks構建了獨特的推理平台,為眾多前沿模型提供推理服務,每月處理超過120萬億個令牌。通過引入“模型單元”抽象,實現了成本感知的負載均衡和自動縮放,相比靜態配置節省了80%以上的GPU成本。運行時可靠性機制包括黑盒健康檢查,可自動檢測和恢復靜默故障。此外,通過分析多模態瓶頸,吞吐量提升了3倍。
Artificial Analysis與IBM聯合推出ITBench-AA,這是首個針對企業IT智能體任務的基準測試,專注於站點可靠性工程(SRE)。前沿模型得分均低於50%,其中Claude Opus 4.7以47%領先。該基準測試評估模型在Kubernetes事件響應中的表現,要求從日誌和追蹤中診斷故障。
NVIDIA研究人員推出Polar框架,通過在智能體工具鏈和推理服務器之間放置模型API代理,實現無需修改智能體工具鏈即可進行強化學習訓練。基於Qwen3.5-4B模型使用GRPO訓練,Polar在Codex、Claude Code和Pi工具鏈上分別將SWE-Bench Verified pass@1提升了22.6、4.8和6.2個百分點。框架以NeMo Gym環境註冊,並在ProRL Agent Server倉庫開源。
文章指出,Anthropic和OpenAI通過將企業客户轉向API定價模式,以及編碼代理產品的普及,實現了產品市場契合。這一轉折點始於2025年11月模型升級,並在2026年4月因新模型發佈和企業定價調整而加速。
Mistral AI 發佈了 Search Toolkit 的公開預覽版,這是一個可組合的框架,用於構建 AI 應用的生產級搜索管道。它整合了數據導入、檢索和評估三大環節,支持多種部署環境,旨在減少團隊在集成維護上的時間投入,提升搜索質量。該工具已在金融、製造、公共部門和媒體娛樂等行業經過實戰檢驗。
Mistral AI在AI Now峯會上宣佈多項新舉措:推出面向工業工程的Mistral方案,包括與空客、寶馬、ASML的合作,收購Emmi;發佈統一代理Vibe用於長期任務;宣佈Les Ulis數據中心計劃。
Mistral AI 發佈了遠程編碼代理,基於新旗艦模型 Mistral Medium 3.5。該模型為128B密集模型,具有256k上下文窗口,在編碼和智能體任務上表現出色。Vibe 遠程代理可在雲端並行運行,而 Le Chat 的 Work 模式則支持複雜多步驟任務。
Mistral AI 發佈 Studio 連接器(Connectors),支持開發者通過 API/SDK 使用內置和自定義 MCP,實現企業數據集成。新增直接工具調用和人工審核流程,確保靈活性與治理。連接器可跨 LeChat、AI Studio 等應用複用,簡化複雜工作流。
Mistral AI 發佈了遠程編碼代理,基於新旗艦模型 Mistral Medium 3.5。該模型為128B密集模型,具有256k上下文窗口,在編碼和智能體任務上表現出色。Vibe 遠程代理可在雲端並行運行,而 Le Chat 的 Work 模式則支持複雜多步驟任務。
Mistral AI收購物理AI先驅Emmi AI,以加強其在工業AI領域的領導地位。該收購將推動工程和製造領域的AI應用,加速實時仿真和數字孿生技術的發展。
Mistral AI收購了Emmi AI,專注於物理AI基礎研究,旨在為航空航天、汽車、半導體和能源等行業提供先進的工程解決方案。公司發佈了多項突破性研究,包括超聲速神經代理、計算流體動力學等。
Mistral AI 將 Emmi AI 納入旗下,推出專為工業工程設計的物理AI模型。該技術能夠在數秒內完成傳統求解器需要數小時甚至數週的物理仿真,加速產品設計、工裝開發,並實現實時數字孿生。合作客户包括 ASML、空客、賽峯和西門子能源。文章還探討了物理AI的適用領域、與LLM的區別以及在企業平台中的集成。
Mistral AI 將 Le Chat 升級為 Vibe,一個統一的 AI 代理,可處理長時間運行、多步驟的工作任務和編碼工作。Vibe 在工作模式下能跨應用搜索知識、分析數據、生成文檔並安排重複任務;在代碼模式下可連接 GitHub、管理項目、生成 Pull Request。同時推出 VS Code 擴展和 CLI 更新。
Mistral AI 發佈了其首個文本轉語音模型 Voxtral TTS,該模型參數量僅為 4B,支持 9 種語言,具有低延遲、高自然度的語音生成能力,並能夠快速適配新聲音。模型在自然度和情感表達方面優於競品,已通過 API 和開源權重發布。
Mistral AI宣佈推出Mistral 3系列,包括前沿的Mistral Large 3(稀疏MoE,41B活躍/675B總參數)和三款Ministral 3邊緣優化模型(3B、8B、14B)。所有模型均採用Apache 2.0許可證開源,支持多模態和多語言,並在多項基準測試中取得領先性能。
Mistral AI 推出 Mistral Small 4,這是一款採用 Apache 2.0 許可的開源模型,將推理、多模態和編碼代理功能整合為一體,支持可配置推理強度,性能顯著提升。
Mistral AI 發佈了遠程編碼代理,基於新旗艦模型 Mistral Medium 3.5。該模型為128B密集模型,具有256k上下文窗口,在編碼和智能體任務上表現出色。Vibe 遠程代理可在雲端並行運行,而 Le Chat 的 Work 模式則支持複雜多步驟任務。
一項新的分析顯示,頂級AI預測者正根據當前領先的AI實驗室調整對AGI(通用人工智能)時間線的預測。從ChatGPT到xAI、Meta、Gemini,再到Anthropic時代,預測方向多次反轉。
本文對比早期互聯網帶來的連接感與當代人工智能的孤立體驗,指出AI作為一種工具雖有用,卻無法替代真實的人類互動,並質疑AI是否存在真正促進社交的應用場景。
一項由宗教大學聯盟進行的研究發現,主要AI模型在回答倫理問題時傾向於世俗理性主義,忽視宗教視角。所有模型對耶和華見證人表現出負面偏見,而對天主教有正面偏見。
本文探討了AI如何引發數字產品設計的範式轉變,從傳統的命令驅動交互轉向意圖驅動交互,並分析了這種轉變在產品管理、用户體驗、決策邏輯、發佈週期、風險和價值創造等方面帶來的新挑戰。
上個月,在北京半程馬拉松中,名為“閃電”的機器人以比人類世界紀錄快近七分鐘的成績完賽。這引發人們對機器人是否將像聊天機器人一樣進入日常生活的討論。中國領跑這場變革,政府承諾未來20年投資超1000億英鎊於機器人技術。
研究人員提出了一種基於事件的實時異步單目里程計,用於行星漫遊車。該方法利用誤差狀態卡爾曼濾波器處理事件相機數據,在高動態範圍光照和計算約束下實現穩健的自我運動估計。
視頻生成模型越來越多地被用作世界模擬器,但現有基準僅評估單視頻質量,無法檢測模型是否真正理解因果關係。新提出的“如果世界”基準包含319對基於真實場景的提示對,通過改變一個物理變量來測試模型輸出的因果一致性。對9個最先進模型的評測顯示,最佳配對得分僅52%,開源模型約28%,且表現與視覺顯著性相關而非物理可解性。
一項針對Melanoscope AI移動皮膚鏡臨牀決策支持系統的前瞻性單中心臨牀驗證顯示,該系統在176名患者中與專家評估的一致率為88.6%,未出現假陰性,特異性為88.3%。研究開發了級聯深度學習模型的定量可解釋性評估方法和三區患者分診算法,為資源有限地區的皮膚癌篩查提供了可重複、可解釋的決策支持。
本研究提出了一種基於頭戴式慣性測量單元(IMU)的行為級活動識別方法,超越了傳統運動基元識別。研究團隊定義了五種與AR應用需求相匹配的行為類別,構建了包含16萬個樣本的Ego4D數據集,並提出了HiT-HAR層次模型(70.3萬參數),在五類動作和八類場景識別任務上優於現有模型。通過可分離性分析,揭示了頭戴式IMU的觀測極限:移動類行為可靠可觀測,物體轉移和任務操作類需要時間上下文,場景依賴信號重疊仍是挑戰。結果表明,利用時間上下文和場景結構的架構選擇優於簡單擴大模型規模。代碼和數據集已公開。
研究表明,結構化狀態空間模型中的對角變體S4D在時間序列分類任務上比複雜的Mamba架構更準確且高效。作者提出的輕量級改進MS4和MS4N進一步提升了性能,在59個數據集上優於Mamba模型,並匹敵參數量大2倍和10倍的深度學習模型。
該論文提出,人類行為結果的持續變異性源於個體的動態潛在狀態,而非僅由可觀測輸入決定。通過干預決策形成時刻的狀態權重,可以精確控制結果。框架基於因果推斷、預測加工、穩態應變等六條證據鏈,並利用超20萬用户的24個月觀測數據,提出七項可檢驗預測和六項操作要求,對數字健康、教育、AI個性化等領域具有啓示意義。
本文類比生物進化中的物種起源,探討合成信息的起源問題,提出利用隱寫術實現信息血統追蹤的機制,以應對AI生成內容難以追溯來源的挑戰。
微軟的MAI-Image-2.5模型在Arena文本到圖像排行榜上位列第三,與谷歌的Nano Banana 2性能相當,但仍落後於OpenAI的Image-2。該模型在圖像內文本渲染和商業視覺內容方面有明顯改進。
梵蒂岡新通諭《偉大的人性》捍衞人類不完美作為尊嚴的來源,並警告將核心人類能力外包給AI的風險,反駁硅谷對人類侷限性的輕視。
Simple Wearable Report利用AI從Oura Ring數據中提取更多見解。本文介紹了作者如何使用它,以及它如何與Gemini等AI工具配合提供詳細分析。