AI News HubLIVE

今日必讀

模型

微軟Build 2026:七大重要公告

在Build 2026大會上,微軟發佈了多款新硬件、AI模型和開發者工具,包括面向AI開發的Surface RTX Spark Dev Box、基於OpenClaw的始終在線助手Scout、首個推理模型MAI-Thinking-1、下一代量子計算芯片Majorana 2等。

  • Surface RTX Spark Dev Box:專為本地AI模型開發設計的迷你PC,搭載Nvidia Arm芯片和128GB內存。
  • Scout助手:基於開源平台OpenClaw,可自動執行日曆管理、費用報告等任務。
站內正文

特朗普簽署行政令,要求AI模型發佈前接受聯邦審查

美國總統特朗普簽署行政令,建立“自願框架”,要求AI公司在發佈前沿模型前與聯邦政府共享,以促進安全創新並加強關鍵基礎設施的網絡安全。該指令要求多家聯邦機構制定框架,在模型公開發布前評估其先進網絡能力。公司可自願共享,但若選擇共享,將獲得保密保護。

  • 特朗普簽署行政令,創建AI模型發佈前自願審查框架。
  • 聯邦機構將評估AI模型的網絡能力,公司可自願參與。
站內正文

微軟首個高級推理AI模型問世

微軟在Build 2026大會上發佈了一系列新的內部AI模型,包括旗艦推理模型MAI-Thinking-1。該模型基於清潔數據從頭訓練,在關鍵軟件工程基準測試中達到領先水平,未使用第三方蒸餾技術。此外,微軟還推出了圖像生成、高速轉錄、多語言語音及編碼模型,進一步減少對OpenAI的依賴。

  • 微軟發佈旗艦推理模型MAI-Thinking-1,從頭訓練且未使用第三方蒸餾。
  • 新模型在軟件工程基準測試中達到領先水平。
站內正文
Agent

英偉達與微軟合作打造統一堆棧,實現從Windows設備到雲端與本地的智能體AI部署

在Microsoft Build大會上,英偉達與微軟宣佈擴展合作,推出面向Windows的RTX Spark和DGX Station、加速Microsoft Fabric、在Microsoft Foundry上提供NVIDIA開放模型、在GitHub Copilot中集成NVIDIA OpenShell安全運行時,以及下一代NVIDIA驅動的AI工廠。

  • 英偉達與微軟合作推出RTX Spark和DGX Station for Windows,為Windows PC帶來專為智能體AI設計的硬件。
  • NVIDIA Nemotron 3 Ultra等開放模型現已在Microsoft Foundry上可用,支持企業級智能體工作流。
站內正文

Build 2026:微軟MDASH退出預覽,推出100多個專業威脅獵殺AI代理

微軟在Build 2026上宣佈其多模型智能掃描工具MDASH退出預覽,並整合到企業安全控制平面中,連接Defender、GitHub代碼安全等。MDASH使用超過100個專門的AI代理對漏洞進行分診和優先級排序,顯著降低安全告警的噪聲,幫助開發人員更快修復真實可利用的漏洞。

  • MDASH是一個基於多模型智能代理的漏洞分診系統,能夠從大量告警中篩選出真正可利用的風險。
  • 該系統使用超過100個專門的AI代理,結合先進模型進行推理,低成本模型處理高容量任務,實現模型無關。
站內正文

當AI開始向AI銷售時會發生什麼?

AI已經在編寫銷售郵件、更新CRM系統、生成提案和響應RFP。下一階段可能更具顛覆性:在人類加入對話之前,AI代理之間進行談判。本文探討了AI如何改變企業銷售、採購和商業關係,以及人類信任和判斷力的重要性。

  • AI自動化了CRM更新和RFP回覆等行政任務,讓銷售代表專注於建立關係。
  • 代理型AI可能處理冷啓動外聯和盡職調查,但企業銷售中的人際信任仍至關重要。
站內正文

微軟在Build大會上發佈首批推理模型,共7款AI模型亮相——目前已知信息

微軟在年度Build開發者大會上發佈了七款新AI模型,其中包括其首個推理模型MAI-Thinking-1。該模型基於企業級、乾淨且商業授權的數據進行訓練。同時發佈的還有新的代碼模型、圖像模型和語音模型。公司強調所有模型均內置水印,並提升了成本效率。微軟還宣佈與梅奧診所合作開發醫療AI前沿模型。

  • 微軟發佈七款新AI模型,包括首個推理模型MAI-Thinking-1。
  • MAI-Thinking-1是一款350億參數的推理模型,使用企業級數據訓練。
站內正文

我最期待嘗試的4款Nvidia RTX Spark筆記本電腦——包括微軟的新款Ultra

Nvidia在Computex 2026上宣佈了其新款RTX Spark CPU,用於筆記本電腦,與英特爾、AMD和高通競爭。該芯片基於Arm架構,提供高達1 petaflop的AI性能和128GB統一內存。微軟的Surface Laptop Ultra、戴爾XPS 16 Creator Edition、華碩ProArt P14/P16和微星Prestige N16 Flip AI Plus是首批亮點機型,預計今年秋季上市,售價超過2000美元。

  • Nvidia發佈RTX Spark CPU,面向筆記本電腦,採用Arm架構,AI性能達1 petaflop。
  • 與微軟合作,重新定義Windows PC,集成智能體AI功能。
站內正文
芯片

“成功攻擊可能造成災難”:Anthropic 向更多團體開放 Claude Mythos 訪問權限

Anthropic 宣佈擴大 Project Glasswing 項目,新增約 150 個合作伙伴,提供更強大的 Claude Mythos Preview 模型訪問權限,用於防禦性網絡安全。該項目已發現超過 10,000 個高危漏洞,但面臨透明度不足的批評。

  • Anthropic 將 Project Glasswing 合作範圍擴大至約 150 個新組織,涵蓋電力、水利、醫療等行業。
  • Claude Mythos 模型已發現數千個高危漏洞,包括主要操作系統和瀏覽器中的漏洞。
站內正文
創業融資

OpenAI擴展Codex,添加角色特定插件,面向非開發者打造通用工作應用

OpenAI正在為Codex添加數據分析、銷售和投資銀行等角色特定插件。該工具每週有五百萬用户使用,其中五分之一不是開發者,且非開發者羣體的增長速度是開發者的三倍,表明OpenAI正將Codex定位為通用工作應用。

  • OpenAI為Codex推出針對數據分析、銷售和投資銀行等職位的專用插件。
  • Codex每週活躍用户達500萬,其中20%為非開發者。
站內正文
其餘更新(19 條)
Agent

Anthropic IPO申請標誌着AI向企業公用事業成熟

Anthropic的IPO申請標誌着生成式AI從以研究為主的風險投資階段轉向穩定的企業公用事業,對定價、許可和市場整合產生影響。

  • Anthropic上市將工程目標與企業採購對齊,引入結構化發佈計劃和定價框架。
  • 企業用户可圍繞正式化的定價層級和API限制進行規劃,但可能面臨更嚴格的許可和模型淘汰。
站內正文

微軟Scout:基於OpenClaw的新型AI個人助手

微軟推出Scout,一款基於OpenClaw的始終在線AI助手,集成於Microsoft 365,可自動執行日程安排、費用報告等任務。它能監控交通和日曆,從Teams和電子郵件中學習,並推薦行動。桌面預覽版現面向美國Frontier客户提供。

  • 微軟Scout是基於OpenClaw的新型AI個人助手,集成於Microsoft 365。
  • 它能監控交通、日曆,並從Teams和電子郵件中學習以建議行動。
站內正文

如何贏回開發者:GitHub的計劃

由於AI代碼生成帶來的前所未有的增長,GitHub遭遇頻繁宕機。該公司正在擴展基礎設施,遷移至Azure,並重建核心系統以恢復可靠性。

  • 過去一年,由於AI工具帶來的意外增長,GitHub遭遇數百次宕機。
  • 公司正擴展至處理當前30倍流量,遷移至Azure並重建核心系統。
站內正文

微軟非常非常希望開發者重新愛上Windows

在Build開發者大會上,微軟推出一系列面向開發者的新功能,包括默認開啓深色模式的開發者優化Windows 11體驗、預配置開發工具、在PowerShell中原生運行Unix核心工具、WSL容器、智能終端Agent面板、以及用於運行AI Agent的執行容器和本地AI模型。微軟旨在通過減少干擾和提供熟悉的環境,吸引Mac和Linux開發者轉向Windows。

  • 微軟推出開發者優化的Windows 11體驗,默認開啓深色模式,關閉干擾通知,預配置VS Code等工具。
  • 新功能包括原生Unix工具(如grep、ls)、WSL容器、智能終端Agent面板(集成Claude Code、Codex等)。
站內正文

微軟通過智能終端重新定義Windows終端

微軟推出智能終端(Intelligent Terminal)實驗性功能,將AI智能體直接集成到Windows 11終端中,支持GitHub Copilot、Claude Code等代理,可自動檢測錯誤並建議修復,簡化開發者工作流程。

  • 微軟發佈智能終端,將AI代理引入Windows 11終端。
  • 支持GitHub Copilot、Claude Code、Codex等多種代理協議。
站內正文

微軟Project Solara:為AI代理設備打造的安卓操作系統

微軟在Build 2026上宣佈了Project Solara,這是一款專為運行AI代理的小工具設計的新操作系統,基於安卓而非Windows。公司展示了兩款概念設備:桌面概念(類似亞馬遜Echo Show)和徽章概念(可穿戴工作徽章)。微軟不計劃自行生產這些設備,而是作為參考設計供其他硬件製造商使用。多家企業如AccuWeather、百思買、CVS醫療和塔吉特計劃開展硬件試點。

  • 微軟在Build 2026上發佈Project Solara,一個基於安卓的AI代理操作系統。
  • 展示了桌面和徽章兩種概念設備,用於不同的AI代理交互場景。
站內正文

AI漏洞情報代理:將CVE轉化為可操作的安全報告

CVE AI Agent是一個自主運行的漏洞情報引擎,能夠持續採集、豐富和分類CVE數據,並通過n8n、Jira、Slack、Splunk等第三方工具將發現結果推送到用户選擇的平台。其採用令牌高效架構,通過確定性最小化邏輯過濾噪音,平均提示詞僅1000個令牌。代理遵循嚴格的兩遍架構:第一遍確定性提取所有可測量數據,第二遍由LLM填充定性部分。支持多種LLM提供商,包括Gemini、OpenAI、Claude等,並提供Web儀表盤。

  • CVE AI Agent是一個自主的漏洞情報管道,專為SOC級別的可審計漏洞情報設計。
  • 採用兩遍架構:確定性引擎提取數據,LLM僅填充定性部分,減少幻覺風險。
站內正文

Work IQ:微軟對企業級AI代理優先IT的重大押注,我有很多疑問

微軟推出Work IQ,專為代理優先的企業設計,讓AI代理動態發現數據結構和執行操作,但成本、治理和數據暴露問題令人擔憂。

  • 微軟Work IQ重新設計企業軟件,使AI代理能實時發現數據結構。
  • 代理無需預定模型,可通過getSchema在運行時動態瞭解數據。
站內正文

如何評估面向生產環境的編程代理模型

本文深入分析LLM編碼基準測試與現實生產環境之間的差距,指出單純依賴排行榜分數選擇模型的弊端。文章分類介紹了HumanEval、SWE-bench等主流基準測試的實際測量內容,並提出一套包含五步的評估框架:定義質量指標、選擇匹配任務的基準、運行內部評估、使用加權評分、建立持續評估機制。同時警示了過度依賴單一基準、忽略執行評估、不考慮基礎設施開銷等常見陷阱。最後強調,內部評估集才是模型選擇最可靠的依據。

  • 基準測試分數與生產性能存在顯著差距,需要批判性解讀
  • 不同基準測試測量不同的編碼能力,單一基準無法全面評估
站內正文

微軟打造了高通未能實現的迷你Surface開發機

微軟推出Surface RTX Spark Dev Box,這是一款專為開發者設計的迷你PC,搭載英偉達Arm架構RTX Spark芯片,擁有128GB統一內存,支持本地運行高達1200億參數的AI模型,預裝Visual Studio Code、GitHub Copilot等開發工具,將於今年晚些時候在美國上市。

  • Surface RTX Spark Dev Box採用類似Xbox Series X頂部的鋁製散熱底盤,熱設計功耗為100瓦。
  • 配備128GB統一內存,可本地運行高達1200億參數的模型。
站內正文

OpenAI的Codex新增工具——站點、註釋及更多插件——面向知識工作者

OpenAI宣佈Codex的500萬周活躍用户中20%是知識工作者而非程序員,因此推出針對他們的新功能:Sites(創建和分享交互式網站)、Annotations(在文檔中指定區域讓AI修改)以及面向數據分析、銷售等領域的插件。

  • Codex 20%的用户是知識工作者,OpenAI為此推出新工具。
  • Sites功能允許用户創建並共享交互式網站,無需編碼。
站內正文
政策

谷歌電話應用將提醒你騙子冒充你的聯繫人

谷歌為電話應用推出新功能,利用端到端加密的RCS技術檢測冒充聯繫人的AI詐騙電話。詐騙者越來越普遍地使用AI模仿聲音進行詐騙,FBI報告2025年美國損失超8.93億美元。該功能默認開啓於Android 12及以上設備,從Pixel手機開始,要求雙方使用谷歌電話應用。此外,還推出了兒童安全、AirDrop支持、AI試穿等功能。

  • 谷歌電話應用新增AI詐騙電話檢測功能,可識別冒充聯繫人的號碼。
  • 詐騙者通過AI模仿聲音,2025年美國損失超8.93億美元。
站內正文

使用Amazon Nova 2 Lite進行目標檢測

本文介紹瞭如何通過Amazon Nova 2 Lite實現目標檢測,無需訓練模型或管理基礎設施。利用Amazon Bedrock、Lambda和API Gateway構建應用,通過自然語言提示即可檢測物體並獲取邊界框座標。涵蓋製造業、農業和物流等實際應用場景。

  • Amazon Nova 2 Lite通過自然語言提示檢測物體,無需訓練。
  • 結合Amazon Bedrock、Lambda和API Gateway可快速部署。
站內正文

用AI為每個職位量身定製簡歷 | Show HN

Refer Me推出了AI簡歷定製工具,可根據職位描述自動優化簡歷,提高通過ATS篩選的幾率,讓求職者在競爭激烈的市場中脱穎而出。

  • AI簡歷定製工具,根據職位描述自動調整簡歷內容
  • 優化簡歷以通過ATS(申請人追蹤系統)篩選
站內正文
工具

錘子和釘子:AI能為數據分析師做什麼,不能做什麼

本文探討了AI在數據分析領域的實際效用與侷限。AI在編寫代碼和加速數據資產開發方面有顯著優勢,但在回答臨時數據問題、分析指標變化時,誤差率較高(約86%準確性),且需要大量前期數據準備。AI無法替代分析師所需的判斷力、背景知識和機構記憶。文章建議以清醒的態度使用AI工具,避免過度投資或完全忽視。

  • AI在編寫代碼方面效率提升顯著,幫助團隊更快構建高質量數據資產。
  • AI回答臨時數據問題的準確性約為86%,且一致性不足,無法完全替代儀表盤。
站內正文
研究

標誌位將Microsoft 365應用變成賬户劫持管道

研究發現在Android設備上,任何應用都可以靜默獲取Microsoft 365賬户的令牌,從而劫持賬户。問題已修復,建議立即更新應用。

  • Microsoft 365 Android應用存在一個開發標誌位,導致安全驗證失效。
  • 任何第三方應用均可竊取已登錄用户的令牌,訪問郵件、文件等。
站內正文
模型

微軟推出Surface RTX Spark Dev Box,無需雲成本即可運行大語言模型

微軟在Build 2026大會上發佈了Surface RTX Spark Dev Box,一款緊湊型桌面電腦,配備Nvidia Blackwell架構RTX Spark處理器和128GB統一內存,提供1 petaflop AI算力,讓開發者可在本地加載和運行超過1200億參數的大模型,無需支付雲API費用。此舉直接挑戰了自ChatGPT推出以來主導AI行業經濟的按token付費模式。

  • Surface RTX Spark Dev Box可本地運行1200億參數以上的AI模型
  • 配備Nvidia Blackwell架構RTX Spark處理器和128GB統一內存
站內正文

Mythos和GPT-5.5會發現大量漏洞。但這夠了嗎?

前沿AI模型如Mythos和GPT-5.5能發現真實漏洞,但企業級進攻性安全需要更多:覆蓋範圍、驗證、安全性、治理和運營集成。本文探討了如何將AI能力轉化為可靠的安全系統。

  • AI模型可以發現漏洞,但企業防禦需要全面覆蓋和驗證。
  • 多步推理、持續覆蓋和安全防護是AI安全系統的關鍵挑戰。
站內正文

特朗普簽署行政令,要求科技公司提前向政府提交AI模型供審查

特朗普總統簽署一項行政令,建立自願框架,要求科技公司在公開發布強大AI模型前最多提前30天提交給政府審查,以加強網絡安全和國家安全。此舉標誌着他從之前的放鬆監管立場轉向更嚴格的控制。

  • 特朗普簽署行政令,要求科技公司自願向政府提交AI模型進行發佈前審查
  • 審查時間為公開發布前最多30天