AI News HubLIVE

今日必讀

Agent

Windsurf 現已更名為 Devin Desktop

Devin Desktop 是 Windsurf 的下一代升級版,整合了 Agent 控制中心,支援透過 Kanban 檢視管理本地和雲端代理,並引入 Spaces 共享上下文。同時支援 Agent Client Protocol (ACP),相容第三方代理。

  • Windsurf 升級為 Devin Desktop,引入 Agent 控制中心
  • 新增 Spaces 功能,用於在代理之間共享上下文
站內正文

輝達與微軟合作打造統一堆疊,實現從Windows裝置到雲端與本地的智慧體AI部署

在Microsoft Build大會上,輝達與微軟宣佈擴充套件合作,推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA開放模型、在GitHub Copilot中整合NVIDIA OpenShell安全執行時,以及下一代NVIDIA驅動的AI工廠。

  • 輝達與微軟合作推出RTX Spark和DGX Station for Windows,為Windows PC帶來專為智慧體AI設計的硬體。
  • NVIDIA Nemotron 3 Ultra等開放模型現已在Microsoft Foundry上可用,支援企業級智慧體工作流。
站內正文

Build 2026:微軟MDASH退出預覽,推出100多個專業威脅獵殺AI代理

微軟在Build 2026上宣佈其多模型智慧掃描工具MDASH退出預覽,並整合到企業安全控制平面中,連線Defender、GitHub程式碼安全等。MDASH使用超過100個專門的AI代理對漏洞進行分診和優先順序排序,顯著降低安全告警的噪聲,幫助開發人員更快修復真實可利用的漏洞。

  • MDASH是一個基於多模型智慧代理的漏洞分診系統,能夠從大量告警中篩選出真正可利用的風險。
  • 該系統使用超過100個專門的AI代理,結合先進模型進行推理,低成本模型處理高容量任務,實現模型無關。
站內正文

當AI開始向AI銷售時會發生什麼?

AI已經在編寫銷售郵件、更新CRM系統、生成提案和響應RFP。下一階段可能更具顛覆性:在人類加入對話之前,AI代理之間進行談判。本文探討了AI如何改變企業銷售、採購和商業關係,以及人類信任和判斷力的重要性。

  • AI自動化了CRM更新和RFP回覆等行政任務,讓銷售代表專注於建立關係。
  • 代理型AI可能處理冷啟動外聯和盡職調查,但企業銷售中的人際信任仍至關重要。
站內正文

微軟在Build大會上釋出首批推理模型,共7款AI模型亮相——目前已知資訊

微軟在年度Build開發者大會上釋出了七款新AI模型,其中包括其首個推理模型MAI-Thinking-1。該模型基於企業級、乾淨且商業授權的資料進行訓練。同時釋出的還有新的程式碼模型、影像模型和語音模型。公司強調所有模型均內建水印,並提升了成本效率。微軟還宣佈與梅奧診所合作開發醫療AI前沿模型。

  • 微軟釋出七款新AI模型,包括首個推理模型MAI-Thinking-1。
  • MAI-Thinking-1是一款350億引數的推理模型,使用企業級資料訓練。
站內正文
政策

我寫了一本書,拒絕認領AI‘百萬美元’證明的作者身份

伊戈爾·拉基(Igor Racki)的新書《作者身份的道德現實:我如何拒絕了一百萬美元》講述了他拒絕接受百萬美元以認領AI生成證明作者身份的經歷,深入探討了AI時代作者身份的倫理問題。

  • 伊戈爾·拉基出版了《作者身份的道德現實:我如何拒絕了一百萬美元》一書。
  • 書中詳述了他拒絕金錢以認領AI生成證明作者身份的決定及其背後的道德考量。
站內正文
模型

微軟Build 2026:七大重要公告

在Build 2026大會上,微軟釋出了多款新硬體、AI模型和開發者工具,包括面向AI開發的Surface RTX Spark Dev Box、基於OpenClaw的始終線上助手Scout、首個推理模型MAI-Thinking-1、下一代量子計算晶片Majorana 2等。

  • Surface RTX Spark Dev Box:專為本地AI模型開發設計的迷你PC,搭載Nvidia Arm晶片和128GB記憶體。
  • Scout助手:基於開源平臺OpenClaw,可自動執行日曆管理、費用報告等任務。
站內正文
創業融資

為AI初創公司構建獨特的盲文載入元件

德國軟體工程師 Dominik Koch 為他的 AI 聊天應用開發了一款盲文載入動畫元件,可將公司名稱轉換為盲文字元,並支援多種動畫樣式。

  • 元件將文本轉換為盲文,為載入動畫增添品牌個性
  • 透過 shadcn CLI 輕鬆安裝,支援自定義文本和動畫
站內正文
工具

谷歌推出虛假來電檢測,防範AI深度偽造冒充詐騙

谷歌宣佈在Android裝置上推出虛假來電檢測功能,利用AI技術識別深度偽造冒充詐騙,保護使用者免受偽裝成信任聯絡人的欺詐電話騷擾。

  • 虛假來電檢測功能將幫助使用者識別AI深度偽造的詐騙電話。
  • 該功能面向Android 12+裝置全球推送,Pixel裝置首批支援。
站內正文
晶片

“成功攻擊可能造成災難”:Anthropic 向更多團體開放 Claude Mythos 訪問許可權

Anthropic 宣佈擴大 Project Glasswing 專案,新增約 150 個合作伙伴,提供更強大的 Claude Mythos Preview 模型訪問許可權,用於防禦性網路安全。該專案已發現超過 10,000 個高危漏洞,但面臨透明度不足的批評。

  • Anthropic 將 Project Glasswing 合作範圍擴大至約 150 個新組織,涵蓋電力、水利、醫療等行業。
  • Claude Mythos 模型已發現數千個高危漏洞,包括主要作業系統和瀏覽器中的漏洞。
站內正文
其餘更新(25 條)
創業融資

OpenAI擴充套件Codex,新增角色特定外掛,面向非開發者打造通用工作應用

OpenAI正在為Codex新增資料分析、銷售和投資銀行等角色特定外掛。該工具每週有五百萬使用者使用,其中五分之一不是開發者,且非開發者群體的增長速度是開發者的三倍,表明OpenAI正將Codex定位為通用工作應用。

  • OpenAI為Codex推出針對資料分析、銷售和投資銀行等職位的專用外掛。
  • Codex每週活躍使用者達500萬,其中20%為非開發者。
站內正文
模型

特朗普簽署行政令,要求AI模型釋出前接受聯邦審查

美國總統特朗普簽署行政令,建立“自願框架”,要求AI公司在釋出前沿模型前與聯邦政府共享,以促進安全創新並加強關鍵基礎設施的網路安全。該指令要求多家聯邦機構制定框架,在模型公開發布前評估其先進網路能力。公司可自願共享,但若選擇共享,將獲得保密保護。

  • 特朗普簽署行政令,建立AI模型釋出前自願審查框架。
  • 聯邦機構將評估AI模型的網路能力,公司可自願參與。
站內正文

微軟首個高階推理AI模型問世

微軟在Build 2026大會上釋出了一系列新的內部AI模型,包括旗艦推理模型MAI-Thinking-1。該模型基於清潔資料從頭訓練,在關鍵軟體工程基準測試中達到領先水平,未使用第三方蒸餾技術。此外,微軟還推出了影像生成、高速轉錄、多語言語音及編碼模型,進一步減少對OpenAI的依賴。

  • 微軟釋出旗艦推理模型MAI-Thinking-1,從頭訓練且未使用第三方蒸餾。
  • 新模型在軟體工程基準測試中達到領先水平。
站內正文

微軟推出Surface RTX Spark Dev Box,無需雲成本即可執行大語言模型

微軟在Build 2026大會上釋出了Surface RTX Spark Dev Box,一款緊湊型桌面電腦,配備Nvidia Blackwell架構RTX Spark處理器和128GB統一記憶體,提供1 petaflop AI算力,讓開發者可在本地載入和執行超過1200億引數的大模型,無需支付雲API費用。此舉直接挑戰了自ChatGPT推出以來主導AI行業經濟的按token付費模式。

  • Surface RTX Spark Dev Box可本地執行1200億引數以上的AI模型
  • 配備Nvidia Blackwell架構RTX Spark處理器和128GB統一記憶體
站內正文

Mythos和GPT-5.5會發現大量漏洞。但這夠了嗎?

前沿AI模型如Mythos和GPT-5.5能發現真實漏洞,但企業級進攻性安全需要更多:覆蓋範圍、驗證、安全性、治理和運營整合。本文探討了如何將AI能力轉化為可靠的安全系統。

  • AI模型可以發現漏洞,但企業防禦需要全面覆蓋和驗證。
  • 多步推理、持續覆蓋和安全防護是AI安全系統的關鍵挑戰。
站內正文

特朗普簽署行政令,要求科技公司提前向政府提交AI模型供審查

特朗普總統簽署一項行政令,建立自願框架,要求科技公司在公開發布強大AI模型前最多提前30天提交給政府審查,以加強網路安全和國家安全。此舉標誌著他從之前的放鬆監管立場轉向更嚴格的控制。

  • 特朗普簽署行政令,要求科技公司自願向政府提交AI模型進行釋出前審查
  • 審查時間為公開發布前最多30天
站內正文
Agent

我最期待嘗試的4款Nvidia RTX Spark筆記型電腦——包括微軟的新款Ultra

Nvidia在Computex 2026上宣佈了其新款RTX Spark CPU,用於筆記型電腦,與英特爾、AMD和高通競爭。該晶片基於Arm架構,提供高達1 petaflop的AI效能和128GB統一記憶體。微軟的Surface Laptop Ultra、戴爾XPS 16 Creator Edition、華碩ProArt P14/P16和微星Prestige N16 Flip AI Plus是首批亮點機型,預計今年秋季上市,售價超過2000美元。

  • Nvidia釋出RTX Spark CPU,面向筆記型電腦,採用Arm架構,AI效能達1 petaflop。
  • 與微軟合作,重新定義Windows PC,整合智慧體AI功能。
站內正文

Anthropic IPO申請標誌著AI向企業公用事業成熟

Anthropic的IPO申請標誌著生成式AI從以研究為主的風險投資階段轉向穩定的企業公用事業,對定價、許可和市場整合產生影響。

  • Anthropic上市將工程目標與企業採購對齊,引入結構化釋出計劃和定價框架。
  • 企業使用者可圍繞正式化的定價層級和API限制進行規劃,但可能面臨更嚴格的許可和模型淘汰。
站內正文

微軟Scout:基於OpenClaw的新型AI個人助手

微軟推出Scout,一款基於OpenClaw的始終線上AI助手,整合於Microsoft 365,可自動執行日程安排、費用報告等任務。它能監控交通和日曆,從Teams和電子郵件中學習,並推薦行動。桌面預覽版現面向美國Frontier客戶提供。

  • 微軟Scout是基於OpenClaw的新型AI個人助手,整合於Microsoft 365。
  • 它能監控交通、日曆,並從Teams和電子郵件中學習以建議行動。
站內正文

如何贏回開發者:GitHub的計劃

由於AI程式碼生成帶來的前所未有的增長,GitHub遭遇頻繁宕機。該公司正在擴充套件基礎設施,遷移至Azure,並重建核心系統以恢復可靠性。

  • 過去一年,由於AI工具帶來的意外增長,GitHub遭遇數百次宕機。
  • 公司正擴充套件至處理當前30倍流量,遷移至Azure並重建核心系統。
站內正文

微軟非常非常希望開發者重新愛上Windows

在Build開發者大會上,微軟推出一系列面向開發者的新功能,包括預設開啟深色模式的開發者最佳化Windows 11體驗、預配置開發工具、在PowerShell中原生執行Unix核心工具、WSL容器、智慧終端Agent面板、以及用於執行AI Agent的執行容器和本地AI模型。微軟旨在透過減少干擾和提供熟悉的環境,吸引Mac和Linux開發者轉向Windows。

  • 微軟推出開發者最佳化的Windows 11體驗,預設開啟深色模式,關閉干擾通知,預配置VS Code等工具。
  • 新功能包括原生Unix工具(如grep、ls)、WSL容器、智慧終端Agent面板(整合Claude Code、Codex等)。
站內正文

微軟透過智慧終端重新定義Windows終端

微軟推出智慧終端(Intelligent Terminal)實驗性功能,將AI智慧體直接整合到Windows 11終端中,支援GitHub Copilot、Claude Code等代理,可自動檢測錯誤並建議修復,簡化開發者工作流程。

  • 微軟釋出智慧終端,將AI代理引入Windows 11終端。
  • 支援GitHub Copilot、Claude Code、Codex等多種代理協議。
站內正文

如何使用Claude託管代理?

Anthropic的Claude託管代理提供了一個完全託管的平臺,用於執行AI代理,無需管理基礎設施。本文涵蓋了功能、定價、最新更新以及逐步構建代理的實踐指南。

  • Claude託管代理處理沙箱化、狀態管理、工具執行等底層操作。
  • 核心概念包括代理、環境、會話和事件。
站內正文

微軟Project Solara:為AI代理裝置打造的安卓作業系統

微軟在Build 2026上宣佈了Project Solara,這是一款專為執行AI代理的小工具設計的新作業系統,基於安卓而非Windows。公司展示了兩款概念裝置:桌面概念(類似亞馬遜Echo Show)和徽章概念(可穿戴工作徽章)。微軟不計劃自行生產這些裝置,而是作為參考設計供其他硬體製造商使用。多家企業如AccuWeather、百思買、CVS醫療和塔吉特計劃開展硬體試點。

  • 微軟在Build 2026上釋出Project Solara,一個基於安卓的AI代理作業系統。
  • 展示了桌面和徽章兩種概念裝置,用於不同的AI代理互動場景。
站內正文

AI漏洞情報代理:將CVE轉化為可操作的安全報告

CVE AI Agent是一個自主執行的漏洞情報引擎,能夠持續採集、豐富和分類CVE資料,並透過n8n、Jira、Slack、Splunk等第三方工具將發現結果推送到使用者選擇的平臺。其採用令牌高效架構,透過確定性最小化邏輯過濾噪音,平均提示詞僅1000個令牌。代理遵循嚴格的兩遍架構:第一遍確定性提取所有可測量資料,第二遍由LLM填充定性部分。支援多種LLM提供商,包括Gemini、OpenAI、Claude等,並提供Web儀表盤。

  • CVE AI Agent是一個自主的漏洞情報管道,專為SOC級別的可審計漏洞情報設計。
  • 採用兩遍架構:確定性引擎提取資料,LLM僅填充定性部分,減少幻覺風險。
站內正文

Work IQ:微軟對企業級AI代理優先IT的重大押注,我有很多疑問

微軟推出Work IQ,專為代理優先的企業設計,讓AI代理動態發現資料結構和執行操作,但成本、治理和資料暴露問題令人擔憂。

  • 微軟Work IQ重新設計企業軟體,使AI代理能即時發現資料結構。
  • 代理無需預定模型,可透過getSchema在執行時動態瞭解資料。
站內正文

如何評估面向生產環境的程式設計代理模型

本文深入分析LLM編碼基準測試與現實生產環境之間的差距,指出單純依賴排行榜分數選擇模型的弊端。文章分類介紹了HumanEval、SWE-bench等主流基準測試的實際測量內容,並提出一套包含五步的評估框架:定義質量指標、選擇匹配任務的基準、執行內部評估、使用加權評分、建立持續評估機制。同時警示了過度依賴單一基準、忽略執行評估、不考慮基礎設施開銷等常見陷阱。最後強調,內部評估集才是模型選擇最可靠的依據。

  • 基準測試分數與生產效能存在顯著差距,需要批判性解讀
  • 不同基準測試測量不同的編碼能力,單一基準無法全面評估
站內正文

微軟打造了高通未能實現的迷你Surface開發機

微軟推出Surface RTX Spark Dev Box,這是一款專為開發者設計的迷你PC,搭載輝達Arm架構RTX Spark晶片,擁有128GB統一記憶體,支援本地執行高達1200億引數的AI模型,預裝Visual Studio Code、GitHub Copilot等開發工具,將於今年晚些時候在美國上市。

  • Surface RTX Spark Dev Box採用類似Xbox Series X頂部的鋁製散熱底盤,熱設計功耗為100瓦。
  • 配備128GB統一記憶體,可本地執行高達1200億引數的模型。
站內正文

OpenAI的Codex新增工具——站點、註釋及更多外掛——面向知識工作者

OpenAI宣佈Codex的500萬周活躍使用者中20%是知識工作者而非程式設計師,因此推出針對他們的新功能:Sites(建立和分享互動式網站)、Annotations(在文件中指定區域讓AI修改)以及面向資料分析、銷售等領域的外掛。

  • Codex 20%的使用者是知識工作者,OpenAI為此推出新工具。
  • Sites功能允許使用者建立並共享互動式網站,無需編碼。
站內正文

MAI-Thinking-1 即將登陸 Baseten

Baseten 與微軟 AI 宣佈,MAI-Thinking-1 即將在 Baseten 平臺上提供。該模型是微軟 AI 的旗艦推理模型,結合了開源模型的靈活性與閉源模型的管理便利性,具有乾淨資料來源、商業級質量和定製化能力。

  • MAI-Thinking-1 是微軟 AI 的新旗艦推理模型,填補了開源與閉源模型之間的空白。
  • 模型採用無蒸餾的乾淨資料訓練,資料來源可審計且商業安全。
站內正文
政策

谷歌電話應用將提醒你騙子冒充你的聯絡人

谷歌為電話應用推出新功能,利用端到端加密的RCS技術檢測冒充聯絡人的AI詐騙電話。詐騙者越來越普遍地使用AI模仿聲音進行詐騙,FBI報告2025年美國損失超8.93億美元。該功能預設開啟於Android 12及以上裝置,從Pixel手機開始,要求雙方使用谷歌電話應用。此外,還推出了兒童安全、AirDrop支援、AI試穿等功能。

  • 谷歌電話應用新增AI詐騙電話檢測功能,可識別冒充聯絡人的號碼。
  • 詐騙者透過AI模仿聲音,2025年美國損失超8.93億美元。
站內正文

使用Amazon Nova 2 Lite進行目標檢測

本文介紹瞭如何透過Amazon Nova 2 Lite實現目標檢測,無需訓練模型或管理基礎設施。利用Amazon Bedrock、Lambda和API Gateway構建應用,透過自然語言提示即可檢測物體並獲取邊界框座標。涵蓋製造業、農業和物流等實際應用場景。

  • Amazon Nova 2 Lite透過自然語言提示檢測物體,無需訓練。
  • 結合Amazon Bedrock、Lambda和API Gateway可快速部署。
站內正文

用AI為每個職位量身定製簡歷 | Show HN

Refer Me推出了AI簡歷定製工具,可根據職位描述自動最佳化簡歷,提高透過ATS篩選的機率,讓求職者在競爭激烈的市場中脫穎而出。

  • AI簡歷定製工具,根據職位描述自動調整簡歷內容
  • 最佳化簡歷以透過ATS(申請人追蹤系統)篩選
站內正文
工具

錘子和釘子:AI能為資料分析師做什麼,不能做什麼

本文探討了AI在資料分析領域的實際效用與侷限。AI在編寫程式碼和加速資料資產開發方面有顯著優勢,但在回答臨時資料問題、分析指標變化時,誤差率較高(約86%準確性),且需要大量前期資料準備。AI無法替代分析師所需的判斷力、背景知識和機構記憶。文章建議以清醒的態度使用AI工具,避免過度投資或完全忽視。

  • AI在編寫程式碼方面效率提升顯著,幫助團隊更快構建高質量資料資產。
  • AI回答臨時資料問題的準確性約為86%,且一致性不足,無法完全替代儀表盤。
站內正文
研究

標誌位將Microsoft 365應用變成賬戶劫持管道

研究發現在Android裝置上,任何應用都可以靜默獲取Microsoft 365賬戶的令牌,從而劫持賬戶。問題已修復,建議立即更新應用。

  • Microsoft 365 Android應用存在一個開發標誌位,導致安全驗證失效。
  • 任何第三方應用均可竊取已登入使用者的令牌,訪問郵件、檔案等。