Windsurf 現已更名為 Devin Desktop
Devin Desktop 是 Windsurf 的下一代升級版,整合了 Agent 控制中心,支援透過 Kanban 檢視管理本地和雲端代理,並引入 Spaces 共享上下文。同時支援 Agent Client Protocol (ACP),相容第三方代理。
- Windsurf 升級為 Devin Desktop,引入 Agent 控制中心
- 新增 Spaces 功能,用於在代理之間共享上下文
日報
2026-06-03 精選 10 條,按主題聚合。其餘新聞折疊歸檔。
Devin Desktop 是 Windsurf 的下一代升級版,整合了 Agent 控制中心,支援透過 Kanban 檢視管理本地和雲端代理,並引入 Spaces 共享上下文。同時支援 Agent Client Protocol (ACP),相容第三方代理。
在Microsoft Build大會上,輝達與微軟宣佈擴充套件合作,推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA開放模型、在GitHub Copilot中整合NVIDIA OpenShell安全執行時,以及下一代NVIDIA驅動的AI工廠。
微軟在Build 2026上宣佈其多模型智慧掃描工具MDASH退出預覽,並整合到企業安全控制平面中,連線Defender、GitHub程式碼安全等。MDASH使用超過100個專門的AI代理對漏洞進行分診和優先順序排序,顯著降低安全告警的噪聲,幫助開發人員更快修復真實可利用的漏洞。
AI已經在編寫銷售郵件、更新CRM系統、生成提案和響應RFP。下一階段可能更具顛覆性:在人類加入對話之前,AI代理之間進行談判。本文探討了AI如何改變企業銷售、採購和商業關係,以及人類信任和判斷力的重要性。
微軟在年度Build開發者大會上釋出了七款新AI模型,其中包括其首個推理模型MAI-Thinking-1。該模型基於企業級、乾淨且商業授權的資料進行訓練。同時釋出的還有新的程式碼模型、影像模型和語音模型。公司強調所有模型均內建水印,並提升了成本效率。微軟還宣佈與梅奧診所合作開發醫療AI前沿模型。
伊戈爾·拉基(Igor Racki)的新書《作者身份的道德現實:我如何拒絕了一百萬美元》講述了他拒絕接受百萬美元以認領AI生成證明作者身份的經歷,深入探討了AI時代作者身份的倫理問題。
在Build 2026大會上,微軟釋出了多款新硬體、AI模型和開發者工具,包括面向AI開發的Surface RTX Spark Dev Box、基於OpenClaw的始終線上助手Scout、首個推理模型MAI-Thinking-1、下一代量子計算晶片Majorana 2等。
德國軟體工程師 Dominik Koch 為他的 AI 聊天應用開發了一款盲文載入動畫元件,可將公司名稱轉換為盲文字元,並支援多種動畫樣式。
谷歌宣佈在Android裝置上推出虛假來電檢測功能,利用AI技術識別深度偽造冒充詐騙,保護使用者免受偽裝成信任聯絡人的欺詐電話騷擾。
Anthropic 宣佈擴大 Project Glasswing 專案,新增約 150 個合作伙伴,提供更強大的 Claude Mythos Preview 模型訪問許可權,用於防禦性網路安全。該專案已發現超過 10,000 個高危漏洞,但面臨透明度不足的批評。
OpenAI正在為Codex新增資料分析、銷售和投資銀行等角色特定外掛。該工具每週有五百萬使用者使用,其中五分之一不是開發者,且非開發者群體的增長速度是開發者的三倍,表明OpenAI正將Codex定位為通用工作應用。
美國總統特朗普簽署行政令,建立“自願框架”,要求AI公司在釋出前沿模型前與聯邦政府共享,以促進安全創新並加強關鍵基礎設施的網路安全。該指令要求多家聯邦機構制定框架,在模型公開發布前評估其先進網路能力。公司可自願共享,但若選擇共享,將獲得保密保護。
微軟在Build 2026大會上釋出了一系列新的內部AI模型,包括旗艦推理模型MAI-Thinking-1。該模型基於清潔資料從頭訓練,在關鍵軟體工程基準測試中達到領先水平,未使用第三方蒸餾技術。此外,微軟還推出了影像生成、高速轉錄、多語言語音及編碼模型,進一步減少對OpenAI的依賴。
微軟在Build 2026大會上釋出了Surface RTX Spark Dev Box,一款緊湊型桌面電腦,配備Nvidia Blackwell架構RTX Spark處理器和128GB統一記憶體,提供1 petaflop AI算力,讓開發者可在本地載入和執行超過1200億引數的大模型,無需支付雲API費用。此舉直接挑戰了自ChatGPT推出以來主導AI行業經濟的按token付費模式。
前沿AI模型如Mythos和GPT-5.5能發現真實漏洞,但企業級進攻性安全需要更多:覆蓋範圍、驗證、安全性、治理和運營整合。本文探討了如何將AI能力轉化為可靠的安全系統。
特朗普總統簽署一項行政令,建立自願框架,要求科技公司在公開發布強大AI模型前最多提前30天提交給政府審查,以加強網路安全和國家安全。此舉標誌著他從之前的放鬆監管立場轉向更嚴格的控制。
Nvidia在Computex 2026上宣佈了其新款RTX Spark CPU,用於筆記型電腦,與英特爾、AMD和高通競爭。該晶片基於Arm架構,提供高達1 petaflop的AI效能和128GB統一記憶體。微軟的Surface Laptop Ultra、戴爾XPS 16 Creator Edition、華碩ProArt P14/P16和微星Prestige N16 Flip AI Plus是首批亮點機型,預計今年秋季上市,售價超過2000美元。
Anthropic的IPO申請標誌著生成式AI從以研究為主的風險投資階段轉向穩定的企業公用事業,對定價、許可和市場整合產生影響。
微軟推出Scout,一款基於OpenClaw的始終線上AI助手,整合於Microsoft 365,可自動執行日程安排、費用報告等任務。它能監控交通和日曆,從Teams和電子郵件中學習,並推薦行動。桌面預覽版現面向美國Frontier客戶提供。
由於AI程式碼生成帶來的前所未有的增長,GitHub遭遇頻繁宕機。該公司正在擴充套件基礎設施,遷移至Azure,並重建核心系統以恢復可靠性。
在Build開發者大會上,微軟推出一系列面向開發者的新功能,包括預設開啟深色模式的開發者最佳化Windows 11體驗、預配置開發工具、在PowerShell中原生執行Unix核心工具、WSL容器、智慧終端Agent面板、以及用於執行AI Agent的執行容器和本地AI模型。微軟旨在透過減少干擾和提供熟悉的環境,吸引Mac和Linux開發者轉向Windows。
微軟推出智慧終端(Intelligent Terminal)實驗性功能,將AI智慧體直接整合到Windows 11終端中,支援GitHub Copilot、Claude Code等代理,可自動檢測錯誤並建議修復,簡化開發者工作流程。
Anthropic的Claude託管代理提供了一個完全託管的平臺,用於執行AI代理,無需管理基礎設施。本文涵蓋了功能、定價、最新更新以及逐步構建代理的實踐指南。
微軟在Build 2026上宣佈了Project Solara,這是一款專為執行AI代理的小工具設計的新作業系統,基於安卓而非Windows。公司展示了兩款概念裝置:桌面概念(類似亞馬遜Echo Show)和徽章概念(可穿戴工作徽章)。微軟不計劃自行生產這些裝置,而是作為參考設計供其他硬體製造商使用。多家企業如AccuWeather、百思買、CVS醫療和塔吉特計劃開展硬體試點。
CVE AI Agent是一個自主執行的漏洞情報引擎,能夠持續採集、豐富和分類CVE資料,並透過n8n、Jira、Slack、Splunk等第三方工具將發現結果推送到使用者選擇的平臺。其採用令牌高效架構,透過確定性最小化邏輯過濾噪音,平均提示詞僅1000個令牌。代理遵循嚴格的兩遍架構:第一遍確定性提取所有可測量資料,第二遍由LLM填充定性部分。支援多種LLM提供商,包括Gemini、OpenAI、Claude等,並提供Web儀表盤。
微軟推出Work IQ,專為代理優先的企業設計,讓AI代理動態發現資料結構和執行操作,但成本、治理和資料暴露問題令人擔憂。
本文深入分析LLM編碼基準測試與現實生產環境之間的差距,指出單純依賴排行榜分數選擇模型的弊端。文章分類介紹了HumanEval、SWE-bench等主流基準測試的實際測量內容,並提出一套包含五步的評估框架:定義質量指標、選擇匹配任務的基準、執行內部評估、使用加權評分、建立持續評估機制。同時警示了過度依賴單一基準、忽略執行評估、不考慮基礎設施開銷等常見陷阱。最後強調,內部評估集才是模型選擇最可靠的依據。
微軟推出Surface RTX Spark Dev Box,這是一款專為開發者設計的迷你PC,搭載輝達Arm架構RTX Spark晶片,擁有128GB統一記憶體,支援本地執行高達1200億引數的AI模型,預裝Visual Studio Code、GitHub Copilot等開發工具,將於今年晚些時候在美國上市。
OpenAI宣佈Codex的500萬周活躍使用者中20%是知識工作者而非程式設計師,因此推出針對他們的新功能:Sites(建立和分享互動式網站)、Annotations(在文件中指定區域讓AI修改)以及面向資料分析、銷售等領域的外掛。
Baseten 與微軟 AI 宣佈,MAI-Thinking-1 即將在 Baseten 平臺上提供。該模型是微軟 AI 的旗艦推理模型,結合了開源模型的靈活性與閉源模型的管理便利性,具有乾淨資料來源、商業級質量和定製化能力。
谷歌為電話應用推出新功能,利用端到端加密的RCS技術檢測冒充聯絡人的AI詐騙電話。詐騙者越來越普遍地使用AI模仿聲音進行詐騙,FBI報告2025年美國損失超8.93億美元。該功能預設開啟於Android 12及以上裝置,從Pixel手機開始,要求雙方使用谷歌電話應用。此外,還推出了兒童安全、AirDrop支援、AI試穿等功能。
本文介紹瞭如何透過Amazon Nova 2 Lite實現目標檢測,無需訓練模型或管理基礎設施。利用Amazon Bedrock、Lambda和API Gateway構建應用,透過自然語言提示即可檢測物體並獲取邊界框座標。涵蓋製造業、農業和物流等實際應用場景。
Refer Me推出了AI簡歷定製工具,可根據職位描述自動最佳化簡歷,提高透過ATS篩選的機率,讓求職者在競爭激烈的市場中脫穎而出。
本文探討了AI在資料分析領域的實際效用與侷限。AI在編寫程式碼和加速資料資產開發方面有顯著優勢,但在回答臨時資料問題、分析指標變化時,誤差率較高(約86%準確性),且需要大量前期資料準備。AI無法替代分析師所需的判斷力、背景知識和機構記憶。文章建議以清醒的態度使用AI工具,避免過度投資或完全忽視。
研究發現在Android裝置上,任何應用都可以靜默獲取Microsoft 365賬戶的令牌,從而劫持賬戶。問題已修復,建議立即更新應用。