AI 日報 2026-06-03

今日必讀

Agent

Windsurf 現已更名為 Devin Desktop

2026-06-02

Devin Desktop 是 Windsurf 的下一代升級版，整合了 Agent 控制中心，支援透過 Kanban 檢視管理本地和雲端代理，並引入 Spaces 共享上下文。同時支援 Agent Client Protocol (ACP)，相容第三方代理。

Windsurf 升級為 Devin Desktop，引入 Agent 控制中心
新增 Spaces 功能，用於在代理之間共享上下文

輝達與微軟合作打造統一堆疊，實現從Windows裝置到雲端與本地的智慧體AI部署

2026-06-02

在Microsoft Build大會上，輝達與微軟宣佈擴充套件合作，推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA開放模型、在GitHub Copilot中整合NVIDIA OpenShell安全執行時，以及下一代NVIDIA驅動的AI工廠。

輝達與微軟合作推出RTX Spark和DGX Station for Windows，為Windows PC帶來專為智慧體AI設計的硬體。
NVIDIA Nemotron 3 Ultra等開放模型現已在Microsoft Foundry上可用，支援企業級智慧體工作流。

Build 2026：微軟MDASH退出預覽，推出100多個專業威脅獵殺AI代理

2026-06-02

微軟在Build 2026上宣佈其多模型智慧掃描工具MDASH退出預覽，並整合到企業安全控制平面中，連線Defender、GitHub程式碼安全等。MDASH使用超過100個專門的AI代理對漏洞進行分診和優先順序排序，顯著降低安全告警的噪聲，幫助開發人員更快修復真實可利用的漏洞。

MDASH是一個基於多模型智慧代理的漏洞分診系統，能夠從大量告警中篩選出真正可利用的風險。
該系統使用超過100個專門的AI代理，結合先進模型進行推理，低成本模型處理高容量任務，實現模型無關。

當AI開始向AI銷售時會發生什麼？

2026-06-02

AI已經在編寫銷售郵件、更新CRM系統、生成提案和響應RFP。下一階段可能更具顛覆性：在人類加入對話之前，AI代理之間進行談判。本文探討了AI如何改變企業銷售、採購和商業關係，以及人類信任和判斷力的重要性。

AI自動化了CRM更新和RFP回覆等行政任務，讓銷售代表專注於建立關係。
代理型AI可能處理冷啟動外聯和盡職調查，但企業銷售中的人際信任仍至關重要。

微軟在Build大會上釋出首批推理模型，共7款AI模型亮相——目前已知資訊

2026-06-02

微軟在年度Build開發者大會上釋出了七款新AI模型，其中包括其首個推理模型MAI-Thinking-1。該模型基於企業級、乾淨且商業授權的資料進行訓練。同時釋出的還有新的程式碼模型、影像模型和語音模型。公司強調所有模型均內建水印，並提升了成本效率。微軟還宣佈與梅奧診所合作開發醫療AI前沿模型。

微軟釋出七款新AI模型，包括首個推理模型MAI-Thinking-1。
MAI-Thinking-1是一款350億引數的推理模型，使用企業級資料訓練。

政策

我寫了一本書，拒絕認領AI‘百萬美元’證明的作者身份

2026-06-02

伊戈爾·拉基（Igor Racki）的新書《作者身份的道德現實：我如何拒絕了一百萬美元》講述了他拒絕接受百萬美元以認領AI生成證明作者身份的經歷，深入探討了AI時代作者身份的倫理問題。

伊戈爾·拉基出版了《作者身份的道德現實：我如何拒絕了一百萬美元》一書。
書中詳述了他拒絕金錢以認領AI生成證明作者身份的決定及其背後的道德考量。

模型

微軟Build 2026：七大重要公告

2026-06-02

在Build 2026大會上，微軟釋出了多款新硬體、AI模型和開發者工具，包括面向AI開發的Surface RTX Spark Dev Box、基於OpenClaw的始終線上助手Scout、首個推理模型MAI-Thinking-1、下一代量子計算晶片Majorana 2等。

Surface RTX Spark Dev Box：專為本地AI模型開發設計的迷你PC，搭載Nvidia Arm晶片和128GB記憶體。
Scout助手：基於開源平臺OpenClaw，可自動執行日曆管理、費用報告等任務。

創業融資

為AI初創公司構建獨特的盲文載入元件

2026-06-02

德國軟體工程師 Dominik Koch 為他的 AI 聊天應用開發了一款盲文載入動畫元件，可將公司名稱轉換為盲文字元，並支援多種動畫樣式。

元件將文本轉換為盲文，為載入動畫增添品牌個性
透過 shadcn CLI 輕鬆安裝，支援自定義文本和動畫

工具

谷歌推出虛假來電檢測，防範AI深度偽造冒充詐騙

2026-06-02

谷歌宣佈在Android裝置上推出虛假來電檢測功能，利用AI技術識別深度偽造冒充詐騙，保護使用者免受偽裝成信任聯絡人的欺詐電話騷擾。

虛假來電檢測功能將幫助使用者識別AI深度偽造的詐騙電話。
該功能面向Android 12+裝置全球推送，Pixel裝置首批支援。

晶片

“成功攻擊可能造成災難”：Anthropic 向更多團體開放 Claude Mythos 訪問許可權

2026-06-02

Anthropic 宣佈擴大 Project Glasswing 專案，新增約 150 個合作伙伴，提供更強大的 Claude Mythos Preview 模型訪問許可權，用於防禦性網路安全。該專案已發現超過 10,000 個高危漏洞，但面臨透明度不足的批評。

Anthropic 將 Project Glasswing 合作範圍擴大至約 150 個新組織，涵蓋電力、水利、醫療等行業。
Claude Mythos 模型已發現數千個高危漏洞，包括主要作業系統和瀏覽器中的漏洞。

其餘更新（25 條）

創業融資

OpenAI擴充套件Codex，新增角色特定外掛，面向非開發者打造通用工作應用

2026-06-02

OpenAI正在為Codex新增資料分析、銷售和投資銀行等角色特定外掛。該工具每週有五百萬使用者使用，其中五分之一不是開發者，且非開發者群體的增長速度是開發者的三倍，表明OpenAI正將Codex定位為通用工作應用。

OpenAI為Codex推出針對資料分析、銷售和投資銀行等職位的專用外掛。
Codex每週活躍使用者達500萬，其中20%為非開發者。

模型

特朗普簽署行政令，要求AI模型釋出前接受聯邦審查

2026-06-02

美國總統特朗普簽署行政令，建立“自願框架”，要求AI公司在釋出前沿模型前與聯邦政府共享，以促進安全創新並加強關鍵基礎設施的網路安全。該指令要求多家聯邦機構制定框架，在模型公開發布前評估其先進網路能力。公司可自願共享，但若選擇共享，將獲得保密保護。

特朗普簽署行政令，建立AI模型釋出前自願審查框架。
聯邦機構將評估AI模型的網路能力，公司可自願參與。

微軟首個高階推理AI模型問世

2026-06-02

微軟在Build 2026大會上釋出了一系列新的內部AI模型，包括旗艦推理模型MAI-Thinking-1。該模型基於清潔資料從頭訓練，在關鍵軟體工程基準測試中達到領先水平，未使用第三方蒸餾技術。此外，微軟還推出了影像生成、高速轉錄、多語言語音及編碼模型，進一步減少對OpenAI的依賴。

微軟釋出旗艦推理模型MAI-Thinking-1，從頭訓練且未使用第三方蒸餾。
新模型在軟體工程基準測試中達到領先水平。

微軟推出Surface RTX Spark Dev Box，無需雲成本即可執行大語言模型

2026-06-02

微軟在Build 2026大會上釋出了Surface RTX Spark Dev Box，一款緊湊型桌面電腦，配備Nvidia Blackwell架構RTX Spark處理器和128GB統一記憶體，提供1 petaflop AI算力，讓開發者可在本地載入和執行超過1200億引數的大模型，無需支付雲API費用。此舉直接挑戰了自ChatGPT推出以來主導AI行業經濟的按token付費模式。

Surface RTX Spark Dev Box可本地執行1200億引數以上的AI模型
配備Nvidia Blackwell架構RTX Spark處理器和128GB統一記憶體

Mythos和GPT-5.5會發現大量漏洞。但這夠了嗎？

2026-06-02

前沿AI模型如Mythos和GPT-5.5能發現真實漏洞，但企業級進攻性安全需要更多：覆蓋範圍、驗證、安全性、治理和運營整合。本文探討了如何將AI能力轉化為可靠的安全系統。

AI模型可以發現漏洞，但企業防禦需要全面覆蓋和驗證。
多步推理、持續覆蓋和安全防護是AI安全系統的關鍵挑戰。

特朗普簽署行政令，要求科技公司提前向政府提交AI模型供審查

2026-06-02

特朗普總統簽署一項行政令，建立自願框架，要求科技公司在公開發布強大AI模型前最多提前30天提交給政府審查，以加強網路安全和國家安全。此舉標誌著他從之前的放鬆監管立場轉向更嚴格的控制。

特朗普簽署行政令，要求科技公司自願向政府提交AI模型進行釋出前審查
審查時間為公開發布前最多30天

Agent

我最期待嘗試的4款Nvidia RTX Spark筆記型電腦——包括微軟的新款Ultra

2026-06-02

Nvidia在Computex 2026上宣佈了其新款RTX Spark CPU，用於筆記型電腦，與英特爾、AMD和高通競爭。該晶片基於Arm架構，提供高達1 petaflop的AI效能和128GB統一記憶體。微軟的Surface Laptop Ultra、戴爾XPS 16 Creator Edition、華碩ProArt P14/P16和微星Prestige N16 Flip AI Plus是首批亮點機型，預計今年秋季上市，售價超過2000美元。

Nvidia釋出RTX Spark CPU，面向筆記型電腦，採用Arm架構，AI效能達1 petaflop。
與微軟合作，重新定義Windows PC，整合智慧體AI功能。

Anthropic IPO申請標誌著AI向企業公用事業成熟

2026-06-02

Anthropic的IPO申請標誌著生成式AI從以研究為主的風險投資階段轉向穩定的企業公用事業，對定價、許可和市場整合產生影響。

Anthropic上市將工程目標與企業採購對齊，引入結構化釋出計劃和定價框架。
企業使用者可圍繞正式化的定價層級和API限制進行規劃，但可能面臨更嚴格的許可和模型淘汰。

微軟Scout：基於OpenClaw的新型AI個人助手

2026-06-02

微軟推出Scout，一款基於OpenClaw的始終線上AI助手，整合於Microsoft 365，可自動執行日程安排、費用報告等任務。它能監控交通和日曆，從Teams和電子郵件中學習，並推薦行動。桌面預覽版現面向美國Frontier客戶提供。

微軟Scout是基於OpenClaw的新型AI個人助手，整合於Microsoft 365。
它能監控交通、日曆，並從Teams和電子郵件中學習以建議行動。

如何贏回開發者：GitHub的計劃

2026-06-02

由於AI程式碼生成帶來的前所未有的增長，GitHub遭遇頻繁宕機。該公司正在擴充套件基礎設施，遷移至Azure，並重建核心系統以恢復可靠性。

過去一年，由於AI工具帶來的意外增長，GitHub遭遇數百次宕機。
公司正擴充套件至處理當前30倍流量，遷移至Azure並重建核心系統。

微軟非常非常希望開發者重新愛上Windows

2026-06-02

在Build開發者大會上，微軟推出一系列面向開發者的新功能，包括預設開啟深色模式的開發者最佳化Windows 11體驗、預配置開發工具、在PowerShell中原生執行Unix核心工具、WSL容器、智慧終端Agent面板、以及用於執行AI Agent的執行容器和本地AI模型。微軟旨在透過減少干擾和提供熟悉的環境，吸引Mac和Linux開發者轉向Windows。

微軟推出開發者最佳化的Windows 11體驗，預設開啟深色模式，關閉干擾通知，預配置VS Code等工具。
新功能包括原生Unix工具（如grep、ls）、WSL容器、智慧終端Agent面板（整合Claude Code、Codex等）。

微軟透過智慧終端重新定義Windows終端

2026-06-02

微軟推出智慧終端（Intelligent Terminal）實驗性功能，將AI智慧體直接整合到Windows 11終端中，支援GitHub Copilot、Claude Code等代理，可自動檢測錯誤並建議修復，簡化開發者工作流程。

微軟釋出智慧終端，將AI代理引入Windows 11終端。
支援GitHub Copilot、Claude Code、Codex等多種代理協議。

如何使用Claude託管代理？

2026-06-02

Anthropic的Claude託管代理提供了一個完全託管的平臺，用於執行AI代理，無需管理基礎設施。本文涵蓋了功能、定價、最新更新以及逐步構建代理的實踐指南。

Claude託管代理處理沙箱化、狀態管理、工具執行等底層操作。
核心概念包括代理、環境、會話和事件。

微軟Project Solara：為AI代理裝置打造的安卓作業系統

2026-06-02

微軟在Build 2026上宣佈了Project Solara，這是一款專為執行AI代理的小工具設計的新作業系統，基於安卓而非Windows。公司展示了兩款概念裝置：桌面概念（類似亞馬遜Echo Show）和徽章概念（可穿戴工作徽章）。微軟不計劃自行生產這些裝置，而是作為參考設計供其他硬體製造商使用。多家企業如AccuWeather、百思買、CVS醫療和塔吉特計劃開展硬體試點。

微軟在Build 2026上釋出Project Solara，一個基於安卓的AI代理作業系統。
展示了桌面和徽章兩種概念裝置，用於不同的AI代理互動場景。

AI漏洞情報代理：將CVE轉化為可操作的安全報告

2026-06-02

CVE AI Agent是一個自主執行的漏洞情報引擎，能夠持續採集、豐富和分類CVE資料，並透過n8n、Jira、Slack、Splunk等第三方工具將發現結果推送到使用者選擇的平臺。其採用令牌高效架構，透過確定性最小化邏輯過濾噪音，平均提示詞僅1000個令牌。代理遵循嚴格的兩遍架構：第一遍確定性提取所有可測量資料，第二遍由LLM填充定性部分。支援多種LLM提供商，包括Gemini、OpenAI、Claude等，並提供Web儀表盤。

CVE AI Agent是一個自主的漏洞情報管道，專為SOC級別的可審計漏洞情報設計。
採用兩遍架構：確定性引擎提取資料，LLM僅填充定性部分，減少幻覺風險。

Work IQ：微軟對企業級AI代理優先IT的重大押注，我有很多疑問

2026-06-02

微軟推出Work IQ，專為代理優先的企業設計，讓AI代理動態發現資料結構和執行操作，但成本、治理和資料暴露問題令人擔憂。

微軟Work IQ重新設計企業軟體，使AI代理能即時發現資料結構。
代理無需預定模型，可透過getSchema在執行時動態瞭解資料。

如何評估面向生產環境的程式設計代理模型

2026-06-02

本文深入分析LLM編碼基準測試與現實生產環境之間的差距，指出單純依賴排行榜分數選擇模型的弊端。文章分類介紹了HumanEval、SWE-bench等主流基準測試的實際測量內容，並提出一套包含五步的評估框架：定義質量指標、選擇匹配任務的基準、執行內部評估、使用加權評分、建立持續評估機制。同時警示了過度依賴單一基準、忽略執行評估、不考慮基礎設施開銷等常見陷阱。最後強調，內部評估集才是模型選擇最可靠的依據。

基準測試分數與生產效能存在顯著差距，需要批判性解讀
不同基準測試測量不同的編碼能力，單一基準無法全面評估

微軟打造了高通未能實現的迷你Surface開發機

2026-06-02

微軟推出Surface RTX Spark Dev Box，這是一款專為開發者設計的迷你PC，搭載輝達Arm架構RTX Spark晶片，擁有128GB統一記憶體，支援本地執行高達1200億引數的AI模型，預裝Visual Studio Code、GitHub Copilot等開發工具，將於今年晚些時候在美國上市。

Surface RTX Spark Dev Box採用類似Xbox Series X頂部的鋁製散熱底盤，熱設計功耗為100瓦。
配備128GB統一記憶體，可本地執行高達1200億引數的模型。

OpenAI的Codex新增工具——站點、註釋及更多外掛——面向知識工作者

2026-06-02

OpenAI宣佈Codex的500萬周活躍使用者中20%是知識工作者而非程式設計師，因此推出針對他們的新功能：Sites（建立和分享互動式網站）、Annotations（在文件中指定區域讓AI修改）以及面向資料分析、銷售等領域的外掛。

Codex 20%的使用者是知識工作者，OpenAI為此推出新工具。
Sites功能允許使用者建立並共享互動式網站，無需編碼。

MAI-Thinking-1 即將登陸 Baseten

2026-06-02

Baseten 與微軟 AI 宣佈，MAI-Thinking-1 即將在 Baseten 平臺上提供。該模型是微軟 AI 的旗艦推理模型，結合了開源模型的靈活性與閉源模型的管理便利性，具有乾淨資料來源、商業級質量和定製化能力。

MAI-Thinking-1 是微軟 AI 的新旗艦推理模型，填補了開源與閉源模型之間的空白。
模型採用無蒸餾的乾淨資料訓練，資料來源可審計且商業安全。

政策

谷歌電話應用將提醒你騙子冒充你的聯絡人

2026-06-02

谷歌為電話應用推出新功能，利用端到端加密的RCS技術檢測冒充聯絡人的AI詐騙電話。詐騙者越來越普遍地使用AI模仿聲音進行詐騙，FBI報告2025年美國損失超8.93億美元。該功能預設開啟於Android 12及以上裝置，從Pixel手機開始，要求雙方使用谷歌電話應用。此外，還推出了兒童安全、AirDrop支援、AI試穿等功能。