AI News HubLIVE

今日必讀

Agent

利用Genie和AI代理革新太陽能與風能維護報告

Plenitude在Databricks Genie上構建了一個基於代理的系統,將太陽能和風能維護的PDF報告轉換為統一、可查詢的資料模型,支援自然語言查詢、跨工廠分析和預測性維護。

  • 系統使用Genie、Unity Catalog語義後設資料和AI函式,從PDF中提取結構化資料。
  • 使用者可透過自然語言提問,生成視覺化結果並匯出。
站內正文

親手體驗 Intelligent Terminal:一款AI增強的Windows終端

微軟開源了Windows Terminal的一個分支——Intelligent Terminal,它內建AI助手,可在不干擾常規會話的情況下解釋錯誤、編寫命令和修復問題。該代理能感知終端動態,並記住當前和過去的會話。

  • 微軟推出了開源分支Intelligent Terminal,整合AI助手。
  • AI助手可解釋錯誤、編寫命令、修復問題,無需離開終端。
站內正文

使用 NotebookLM 進行最佳研究

谷歌的 AI 研究助手 NotebookLM 獲得全面升級,包括更高階的推理能力、新的輸出格式(PDF、電子表格等)以及更輕鬆的研究啟動。基於 Gemini 3.5 和 Antigravity,它提供了更高的準確性和分析能力。

  • NotebookLM 現在基於 Gemini 3.5 和 Antigravity 執行,推理能力更強。
  • 新的輸出格式包括 PDF 報告、圖表、電子表格和幻燈片。
站內正文

小米MiMo與TileRT實現萬億引數模型每秒超1000 token生成,執行於商用GPU

小米MiMo團隊聯合TileRT推出MiMo-V2.5-Pro-UltraSpeed,在單臺8×商用GPU節點上,實現萬億引數模型每秒超1000 token的解碼速度。該技術結合FP4量化、DFlash投機解碼和TileRT執行時三大創新,無需定製晶片即可達此效能。API試用期為2026年6月9日至23日,定價為標準模型的3倍。

  • 萬億引數MoE模型在商用GPU上達到1000+ token/秒
  • 三大技術:FP4量化、DFlash投機解碼、TileRT執行時
站內正文
研究

將300萬美元的AI賬單降至190萬美元

Flowstate是一個智慧代理,透過將AI請求路由到最合適的模型,並跟蹤每個專案的支出,幫助企業節省高達42%的AI成本。文章揭示了AI賬單膨脹的兩個主要原因:預設使用昂貴的旗艦模型以及缺乏成本歸屬。

  • 預設使用昂貴模型導致不必要的成本,Flowstate透過任務路由自動選擇合適模型。
  • 缺乏成本歸屬使得AI支出成為難以管理的單一費用,Flowstate提供專案級追蹤。
站內正文
模型

微軟研究表明:詳細描述比模型規模更重要,Lens以38億引數高效生成影像

微軟研究院推出僅38億引數的文本到影像模型Lens,利用GPT-4.1生成的8億條詳細描述進行訓練,在多個基準測試中媲美數倍於其規模的模型,訓練計算量僅為同類模型的五分之一。Lens-Turbo可在不到一秒內生成影像,程式碼和權重以MIT許可證開源。

  • Lens使用GPT-4.1生成的8億條詳細描述替代模糊的網路替代文本,大幅提升訓練效率。
  • 僅38億引數,Lens在基準測試中匹配或超越數倍於其規模的模型。
站內正文
政策

蘋果宣佈Siri AI及下一代Apple Intelligence

蘋果在WWDC上宣佈了新的AI功能以及更智慧、更個性化的Siri。此前,蘋果因未能實現2024年WWDC承諾的AI功能而面臨集體訴訟,最終以2.5億美元和解。蘋果正追趕AI賽道,與谷歌達成協議,由Gemini支援新功能。

  • 蘋果在WWDC 2026上釋出新一代Siri AI和Apple Intelligence
  • 此前因未兌現AI功能承諾,蘋果支付2.5億美元和解集體訴訟
站內正文
晶片

英特爾獲第二春:谷歌與輝達探索其作為臺積電AI晶片替代供應商

谷歌已向英特爾訂購超過300萬顆AI晶片,計劃於2028年交付。輝達也正在測試英特爾的製造工藝,用於其下一代Feynman架構。此舉正值臺積電難以滿足AI晶片需求之際,英特爾長期掙扎的代工業務迎來罕見轉機。

  • 谷歌與英特爾簽訂超過300萬顆AI晶片訂單,交付期為2028年。
  • 輝達測試英特爾製造工藝,用於其Feynman架構晶片。
站內正文
工具

Show HN:Gitdot —— 一款更好的 GitHub。開源、反 AI、用 Rust 編寫

Gitdot 是一個開源 GitHub 替代品,使用 Rust 編寫,介面受命令列工具啟發,支援使用者註冊、組織建立、倉庫管理及從 GitHub 匯入倉庫(只讀映象或完整遷移)。目前缺少 issues、PR、CI 等功能。設計注重鍵盤驅動導航,目標實現 100ms 的首屏載入。

  • Gitdot 是用 Rust 編寫的開源 GitHub 替代品,介面風格類似 CLI 工具。
  • 當前支援使用者註冊、組織建立、公有/私有倉庫以及從 GitHub 匯入倉庫。
站內正文
機器人

駭客可能利用Meta的AI聊天機器人劫持超過2萬個Instagram賬戶

Meta確認駭客利用其AI支援聊天機器人的漏洞,在無需雙因素認證的情況下劫持了超過2萬個Instagram賬戶,包括前總統歐巴馬等知名賬戶。Meta已修復漏洞並重置密碼連結。

  • Meta的AI支援聊天機器人存在漏洞,駭客可透過請求密碼重置劫持賬戶。
  • 約20,225個Instagram賬戶受影響,包括歐巴馬、美國太空軍高階軍士長等。
站內正文
其餘更新(8 條)
模型

解鎖歐洲AI靈活性:跨區域推理助力歐盟資料處理與模型訪問

AWS透過Amazon Bedrock的跨區域推理(CRIS)功能,幫助客戶在歐洲利用多個AWS區域的模型容量,同時滿足GDPR等資料保護要求。本文深入介紹了全球推理與歐盟地理推理配置檔案,以及如何透過IAM、CloudTrail等工具實現安全、透明和合規的資料處理。

  • 跨區域推理(CRIS)自動將請求路由至預定義地理邊界內的AWS區域,提升模型可用性和彈性。
  • 歐盟地理推理配置檔案(EU CRIS)確保請求僅在歐盟區域內處理,幫助客戶遵守GDPR。
站內正文

NotebookLM升級至Gemini 3.5,新增雲端計算機和源發現功能

谷歌宣佈對NotebookLM進行全面升級,採用Gemini 3.5模型,提升回答準確性和可靠性。使用者現在可以透過提問直接啟動研究專案,NotebookLM會利用Google搜尋查詢相關來源。此外,每個筆記本連線到安全的雲端計算機,支援編寫和執行程式碼,並能輸出多種檔案格式。該更新面向AI Ultra計劃使用者和Workspace客戶。

  • 採用Gemini 3.5模型,提供更準確可靠的資訊
  • 使用者可直接提問啟動研究,NotebookLM透過Google搜尋查詢來源
站內正文

為什麼將任務委託給LLM會導致文件損壞?

最新研究揭示,將文件編輯等任務委託給大型語言模型(LLM)時,模型可能會在互動過程中默默損壞文件內容。研究構建了DELEGATE-52基準測試,發現即使最先進的模型在20次互動後也會導致25%的內容損壞,原因包括錯誤累積、弱模型刪除與強模型幻覺、上下文過載以及領域熟悉度不足。代理式AI工具對此問題幫助有限。

  • 研究發現,將任務委託給LLM會導致文件內容逐漸退化,頂級模型在20次互動後損壞率達25%,弱模型可達50%。
  • 錯誤累積、弱模型傾向於刪除內容、強模型則幻覺式地篡改資訊,且上下文過載加劇問題。
站內正文
Agent

現在可以安心合上筆記型電腦了:在Amazon Bedrock AgentCore上託管編碼智慧體

Amazon Bedrock AgentCore Runtime為每個智慧體會話提供獨立的微VM,包含持久化工作區、透過Gateway的安全工具訪問以及內建的可觀測性,使得Claude Code、Codex、Kiro、Cursor等可以並行執行而不會共享金鑰、埠或檔案系統。合上電腦,去吃晚餐,明天可以繼續之前的工作。

  • 筆記型電腦不適合執行編碼智慧體:存在安全風險、金鑰洩露、並行衝突以及合蓋即中斷的問題。
  • AgentCore提供隔離的微VM、持久化儲存、身份層、閘道器和可觀測性,無需擔心合蓋。
站內正文

大規模做出更好的決策:數學最佳化如何在直覺失效時發揮作用

本文介紹了數學最佳化作為AI的一個子領域,如何幫助企業在複雜決策中找到最優解,並透過AWS生成式AI創新中心的實際案例展示了其顯著的業務效益。

  • 數學最佳化是演繹型AI,提供確定性最優決策,區別於機器學習的機率性預測。
  • 創新中心採用發現、建模、求解、架構四步框架解決最佳化問題。
站內正文

使用LangChain構建緊急求助熱線語音代理

瞭解如何使用LangChain、AssemblyAI和OpenAI構建一個即時AI語音緊急求助熱線代理。該代理能夠傾聽呼叫者的語音求助,即時評估情況,派遣合適的緊急服務,並安撫呼叫者——無需任何打字或選單操作。文章詳細介紹了三階段流水線(語音轉文字、智慧體推理、文字轉語音)以及關鍵程式碼實現。

  • 利用AssemblyAI實現即時語音轉文字,支援部分轉錄和最終轉錄。
  • 智慧體ARIA基於LangChain構建,具備位置查詢、緊急派遣、升級至人工和安撫協議等工具。
站內正文
政策

使用Amazon SageMaker AI和全同態加密實現端到端的加密機器學習推理

本文介紹如何利用Amazon SageMaker AI和全同態加密(FHE)技術,在雲上執行完全加密的機器學習推理。透過concrete-ml庫,您可以訓練FHE模型並部署到SageMaker端點,確保查詢、響應和中間結果全程加密,即使雲服務商也無法讀取資料。文中涵蓋醫療、能源、通訊等敏感資料場景,並提供了詳細的實施步驟。

  • 全同態加密(FHE)允許在不解密的情況下處理加密資料,實現隱私保護的ML推理。
  • 使用concrete-ml庫(相容scikit-learn)構建FHE模型,替代低階SEAL庫。