AI 日報 2026-06-03

今日必讀

模型

微軟Build 2026：七大重要公告

2026-06-02

在Build 2026大會上，微軟發佈了多款新硬件、AI模型和開發者工具，包括面向AI開發的Surface RTX Spark Dev Box、基於OpenClaw的始終在線助手Scout、首個推理模型MAI-Thinking-1、下一代量子計算芯片Majorana 2等。

Surface RTX Spark Dev Box：專為本地AI模型開發設計的迷你PC，搭載Nvidia Arm芯片和128GB內存。
Scout助手：基於開源平台OpenClaw，可自動執行日曆管理、費用報告等任務。

特朗普簽署行政令，要求AI模型發佈前接受聯邦審查

2026-06-02

美國總統特朗普簽署行政令，建立“自願框架”，要求AI公司在發佈前沿模型前與聯邦政府共享，以促進安全創新並加強關鍵基礎設施的網絡安全。該指令要求多家聯邦機構制定框架，在模型公開發布前評估其先進網絡能力。公司可自願共享，但若選擇共享，將獲得保密保護。

特朗普簽署行政令，創建AI模型發佈前自願審查框架。
聯邦機構將評估AI模型的網絡能力，公司可自願參與。

微軟首個高級推理AI模型問世

2026-06-02

微軟在Build 2026大會上發佈了一系列新的內部AI模型，包括旗艦推理模型MAI-Thinking-1。該模型基於清潔數據從頭訓練，在關鍵軟件工程基準測試中達到領先水平，未使用第三方蒸餾技術。此外，微軟還推出了圖像生成、高速轉錄、多語言語音及編碼模型，進一步減少對OpenAI的依賴。

微軟發佈旗艦推理模型MAI-Thinking-1，從頭訓練且未使用第三方蒸餾。
新模型在軟件工程基準測試中達到領先水平。

Agent

英偉達與微軟合作打造統一堆棧，實現從Windows設備到雲端與本地的智能體AI部署

2026-06-02

在Microsoft Build大會上，英偉達與微軟宣佈擴展合作，推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA開放模型、在GitHub Copilot中集成NVIDIA OpenShell安全運行時，以及下一代NVIDIA驅動的AI工廠。

英偉達與微軟合作推出RTX Spark和DGX Station for Windows，為Windows PC帶來專為智能體AI設計的硬件。
NVIDIA Nemotron 3 Ultra等開放模型現已在Microsoft Foundry上可用，支持企業級智能體工作流。

Build 2026：微軟MDASH退出預覽，推出100多個專業威脅獵殺AI代理

2026-06-02

微軟在Build 2026上宣佈其多模型智能掃描工具MDASH退出預覽，並整合到企業安全控制平面中，連接Defender、GitHub代碼安全等。MDASH使用超過100個專門的AI代理對漏洞進行分診和優先級排序，顯著降低安全告警的噪聲，幫助開發人員更快修復真實可利用的漏洞。

MDASH是一個基於多模型智能代理的漏洞分診系統，能夠從大量告警中篩選出真正可利用的風險。
該系統使用超過100個專門的AI代理，結合先進模型進行推理，低成本模型處理高容量任務，實現模型無關。

當AI開始向AI銷售時會發生什麼？

2026-06-02

AI已經在編寫銷售郵件、更新CRM系統、生成提案和響應RFP。下一階段可能更具顛覆性：在人類加入對話之前，AI代理之間進行談判。本文探討了AI如何改變企業銷售、採購和商業關係，以及人類信任和判斷力的重要性。

AI自動化了CRM更新和RFP回覆等行政任務，讓銷售代表專注於建立關係。
代理型AI可能處理冷啓動外聯和盡職調查，但企業銷售中的人際信任仍至關重要。

微軟在Build大會上發佈首批推理模型，共7款AI模型亮相——目前已知信息

2026-06-02

微軟在年度Build開發者大會上發佈了七款新AI模型，其中包括其首個推理模型MAI-Thinking-1。該模型基於企業級、乾淨且商業授權的數據進行訓練。同時發佈的還有新的代碼模型、圖像模型和語音模型。公司強調所有模型均內置水印，並提升了成本效率。微軟還宣佈與梅奧診所合作開發醫療AI前沿模型。

微軟發佈七款新AI模型，包括首個推理模型MAI-Thinking-1。
MAI-Thinking-1是一款350億參數的推理模型，使用企業級數據訓練。

我最期待嘗試的4款Nvidia RTX Spark筆記本電腦——包括微軟的新款Ultra

2026-06-02

Nvidia在Computex 2026上宣佈了其新款RTX Spark CPU，用於筆記本電腦，與英特爾、AMD和高通競爭。該芯片基於Arm架構，提供高達1 petaflop的AI性能和128GB統一內存。微軟的Surface Laptop Ultra、戴爾XPS 16 Creator Edition、華碩ProArt P14/P16和微星Prestige N16 Flip AI Plus是首批亮點機型，預計今年秋季上市，售價超過2000美元。

Nvidia發佈RTX Spark CPU，面向筆記本電腦，採用Arm架構，AI性能達1 petaflop。
與微軟合作，重新定義Windows PC，集成智能體AI功能。

芯片

“成功攻擊可能造成災難”：Anthropic 向更多團體開放 Claude Mythos 訪問權限

2026-06-02

Anthropic 宣佈擴大 Project Glasswing 項目，新增約 150 個合作伙伴，提供更強大的 Claude Mythos Preview 模型訪問權限，用於防禦性網絡安全。該項目已發現超過 10,000 個高危漏洞，但面臨透明度不足的批評。

Anthropic 將 Project Glasswing 合作範圍擴大至約 150 個新組織，涵蓋電力、水利、醫療等行業。
Claude Mythos 模型已發現數千個高危漏洞，包括主要操作系統和瀏覽器中的漏洞。

創業融資

OpenAI擴展Codex，添加角色特定插件，面向非開發者打造通用工作應用

2026-06-02

OpenAI正在為Codex添加數據分析、銷售和投資銀行等角色特定插件。該工具每週有五百萬用户使用，其中五分之一不是開發者，且非開發者羣體的增長速度是開發者的三倍，表明OpenAI正將Codex定位為通用工作應用。

OpenAI為Codex推出針對數據分析、銷售和投資銀行等職位的專用插件。
Codex每週活躍用户達500萬，其中20%為非開發者。

其餘更新（19 條）

Agent

Anthropic IPO申請標誌着AI向企業公用事業成熟

2026-06-02

Anthropic的IPO申請標誌着生成式AI從以研究為主的風險投資階段轉向穩定的企業公用事業，對定價、許可和市場整合產生影響。

Anthropic上市將工程目標與企業採購對齊，引入結構化發佈計劃和定價框架。
企業用户可圍繞正式化的定價層級和API限制進行規劃，但可能面臨更嚴格的許可和模型淘汰。

微軟Scout：基於OpenClaw的新型AI個人助手

2026-06-02

微軟推出Scout，一款基於OpenClaw的始終在線AI助手，集成於Microsoft 365，可自動執行日程安排、費用報告等任務。它能監控交通和日曆，從Teams和電子郵件中學習，並推薦行動。桌面預覽版現面向美國Frontier客户提供。

微軟Scout是基於OpenClaw的新型AI個人助手，集成於Microsoft 365。
它能監控交通、日曆，並從Teams和電子郵件中學習以建議行動。

如何贏回開發者：GitHub的計劃

2026-06-02

由於AI代碼生成帶來的前所未有的增長，GitHub遭遇頻繁宕機。該公司正在擴展基礎設施，遷移至Azure，並重建核心系統以恢復可靠性。

過去一年，由於AI工具帶來的意外增長，GitHub遭遇數百次宕機。
公司正擴展至處理當前30倍流量，遷移至Azure並重建核心系統。

微軟非常非常希望開發者重新愛上Windows

2026-06-02

在Build開發者大會上，微軟推出一系列面向開發者的新功能，包括默認開啓深色模式的開發者優化Windows 11體驗、預配置開發工具、在PowerShell中原生運行Unix核心工具、WSL容器、智能終端Agent面板、以及用於運行AI Agent的執行容器和本地AI模型。微軟旨在通過減少干擾和提供熟悉的環境，吸引Mac和Linux開發者轉向Windows。

微軟推出開發者優化的Windows 11體驗，默認開啓深色模式，關閉干擾通知，預配置VS Code等工具。
新功能包括原生Unix工具（如grep、ls）、WSL容器、智能終端Agent面板（集成Claude Code、Codex等）。

微軟通過智能終端重新定義Windows終端

2026-06-02

微軟推出智能終端（Intelligent Terminal）實驗性功能，將AI智能體直接集成到Windows 11終端中，支持GitHub Copilot、Claude Code等代理，可自動檢測錯誤並建議修復，簡化開發者工作流程。

微軟發佈智能終端，將AI代理引入Windows 11終端。
支持GitHub Copilot、Claude Code、Codex等多種代理協議。

微軟Project Solara：為AI代理設備打造的安卓操作系統

2026-06-02

微軟在Build 2026上宣佈了Project Solara，這是一款專為運行AI代理的小工具設計的新操作系統，基於安卓而非Windows。公司展示了兩款概念設備：桌面概念（類似亞馬遜Echo Show）和徽章概念（可穿戴工作徽章）。微軟不計劃自行生產這些設備，而是作為參考設計供其他硬件製造商使用。多家企業如AccuWeather、百思買、CVS醫療和塔吉特計劃開展硬件試點。

微軟在Build 2026上發佈Project Solara，一個基於安卓的AI代理操作系統。
展示了桌面和徽章兩種概念設備，用於不同的AI代理交互場景。

AI漏洞情報代理：將CVE轉化為可操作的安全報告

2026-06-02

CVE AI Agent是一個自主運行的漏洞情報引擎，能夠持續採集、豐富和分類CVE數據，並通過n8n、Jira、Slack、Splunk等第三方工具將發現結果推送到用户選擇的平台。其採用令牌高效架構，通過確定性最小化邏輯過濾噪音，平均提示詞僅1000個令牌。代理遵循嚴格的兩遍架構：第一遍確定性提取所有可測量數據，第二遍由LLM填充定性部分。支持多種LLM提供商，包括Gemini、OpenAI、Claude等，並提供Web儀表盤。

CVE AI Agent是一個自主的漏洞情報管道，專為SOC級別的可審計漏洞情報設計。
採用兩遍架構：確定性引擎提取數據，LLM僅填充定性部分，減少幻覺風險。

Work IQ：微軟對企業級AI代理優先IT的重大押注，我有很多疑問

2026-06-02

微軟推出Work IQ，專為代理優先的企業設計，讓AI代理動態發現數據結構和執行操作，但成本、治理和數據暴露問題令人擔憂。

微軟Work IQ重新設計企業軟件，使AI代理能實時發現數據結構。
代理無需預定模型，可通過getSchema在運行時動態瞭解數據。

如何評估面向生產環境的編程代理模型

2026-06-02

本文深入分析LLM編碼基準測試與現實生產環境之間的差距，指出單純依賴排行榜分數選擇模型的弊端。文章分類介紹了HumanEval、SWE-bench等主流基準測試的實際測量內容，並提出一套包含五步的評估框架：定義質量指標、選擇匹配任務的基準、運行內部評估、使用加權評分、建立持續評估機制。同時警示了過度依賴單一基準、忽略執行評估、不考慮基礎設施開銷等常見陷阱。最後強調，內部評估集才是模型選擇最可靠的依據。

基準測試分數與生產性能存在顯著差距，需要批判性解讀
不同基準測試測量不同的編碼能力，單一基準無法全面評估

微軟打造了高通未能實現的迷你Surface開發機

2026-06-02

微軟推出Surface RTX Spark Dev Box，這是一款專為開發者設計的迷你PC，搭載英偉達Arm架構RTX Spark芯片，擁有128GB統一內存，支持本地運行高達1200億參數的AI模型，預裝Visual Studio Code、GitHub Copilot等開發工具，將於今年晚些時候在美國上市。

Surface RTX Spark Dev Box採用類似Xbox Series X頂部的鋁製散熱底盤，熱設計功耗為100瓦。
配備128GB統一內存，可本地運行高達1200億參數的模型。

OpenAI的Codex新增工具——站點、註釋及更多插件——面向知識工作者

2026-06-02

OpenAI宣佈Codex的500萬周活躍用户中20%是知識工作者而非程序員，因此推出針對他們的新功能：Sites（創建和分享交互式網站）、Annotations（在文檔中指定區域讓AI修改）以及面向數據分析、銷售等領域的插件。

Codex 20%的用户是知識工作者，OpenAI為此推出新工具。
Sites功能允許用户創建並共享交互式網站，無需編碼。

政策

谷歌電話應用將提醒你騙子冒充你的聯繫人

2026-06-02

谷歌為電話應用推出新功能，利用端到端加密的RCS技術檢測冒充聯繫人的AI詐騙電話。詐騙者越來越普遍地使用AI模仿聲音進行詐騙，FBI報告2025年美國損失超8.93億美元。該功能默認開啓於Android 12及以上設備，從Pixel手機開始，要求雙方使用谷歌電話應用。此外，還推出了兒童安全、AirDrop支持、AI試穿等功能。

谷歌電話應用新增AI詐騙電話檢測功能，可識別冒充聯繫人的號碼。
詐騙者通過AI模仿聲音，2025年美國損失超8.93億美元。

使用Amazon Nova 2 Lite進行目標檢測

2026-06-02

本文介紹瞭如何通過Amazon Nova 2 Lite實現目標檢測，無需訓練模型或管理基礎設施。利用Amazon Bedrock、Lambda和API Gateway構建應用，通過自然語言提示即可檢測物體並獲取邊界框座標。涵蓋製造業、農業和物流等實際應用場景。

Amazon Nova 2 Lite通過自然語言提示檢測物體，無需訓練。
結合Amazon Bedrock、Lambda和API Gateway可快速部署。

用AI為每個職位量身定製簡歷 | Show HN

2026-06-02

Refer Me推出了AI簡歷定製工具，可根據職位描述自動優化簡歷，提高通過ATS篩選的幾率，讓求職者在競爭激烈的市場中脱穎而出。

AI簡歷定製工具，根據職位描述自動調整簡歷內容
優化簡歷以通過ATS（申請人追蹤系統）篩選

工具

錘子和釘子：AI能為數據分析師做什麼，不能做什麼

2026-06-02

本文探討了AI在數據分析領域的實際效用與侷限。AI在編寫代碼和加速數據資產開發方面有顯著優勢，但在回答臨時數據問題、分析指標變化時，誤差率較高（約86%準確性），且需要大量前期數據準備。AI無法替代分析師所需的判斷力、背景知識和機構記憶。文章建議以清醒的態度使用AI工具，避免過度投資或完全忽視。

AI在編寫代碼方面效率提升顯著，幫助團隊更快構建高質量數據資產。
AI回答臨時數據問題的準確性約為86%，且一致性不足，無法完全替代儀表盤。

研究

標誌位將Microsoft 365應用變成賬户劫持管道

2026-06-02

研究發現在Android設備上，任何應用都可以靜默獲取Microsoft 365賬户的令牌，從而劫持賬户。問題已修復，建議立即更新應用。

Microsoft 365 Android應用存在一個開發標誌位，導致安全驗證失效。
任何第三方應用均可竊取已登錄用户的令牌，訪問郵件、文件等。

模型

微軟推出Surface RTX Spark Dev Box，無需雲成本即可運行大語言模型

2026-06-02

微軟在Build 2026大會上發佈了Surface RTX Spark Dev Box，一款緊湊型桌面電腦，配備Nvidia Blackwell架構RTX Spark處理器和128GB統一內存，提供1 petaflop AI算力，讓開發者可在本地加載和運行超過1200億參數的大模型，無需支付雲API費用。此舉直接挑戰了自ChatGPT推出以來主導AI行業經濟的按token付費模式。

Surface RTX Spark Dev Box可本地運行1200億參數以上的AI模型
配備Nvidia Blackwell架構RTX Spark處理器和128GB統一內存

Mythos和GPT-5.5會發現大量漏洞。但這夠了嗎？

2026-06-02

前沿AI模型如Mythos和GPT-5.5能發現真實漏洞，但企業級進攻性安全需要更多：覆蓋範圍、驗證、安全性、治理和運營集成。本文探討了如何將AI能力轉化為可靠的安全系統。

AI模型可以發現漏洞，但企業防禦需要全面覆蓋和驗證。
多步推理、持續覆蓋和安全防護是AI安全系統的關鍵挑戰。

特朗普簽署行政令，要求科技公司提前向政府提交AI模型供審查

2026-06-02

特朗普總統簽署一項行政令，建立自願框架，要求科技公司在公開發布強大AI模型前最多提前30天提交給政府審查，以加強網絡安全和國家安全。此舉標誌着他從之前的放鬆監管立場轉向更嚴格的控制。

特朗普簽署行政令，要求科技公司自願向政府提交AI模型進行發佈前審查
審查時間為公開發布前最多30天