AI News HubLIVE

今日必讀

Agent

利用Genie和AI代理革新太陽能與風能維護報告

Plenitude在Databricks Genie上構建了一個基於代理的系統,將太陽能和風能維護的PDF報告轉換為統一、可查詢的數據模型,支持自然語言查詢、跨工廠分析和預測性維護。

  • 系統使用Genie、Unity Catalog語義元數據和AI函數,從PDF中提取結構化數據。
  • 用户可通過自然語言提問,生成可視化結果並導出。
站內正文

親手體驗 Intelligent Terminal:一款AI增強的Windows終端

微軟開源了Windows Terminal的一個分支——Intelligent Terminal,它內置AI助手,可在不干擾常規會話的情況下解釋錯誤、編寫命令和修復問題。該代理能感知終端動態,並記住當前和過去的會話。

  • 微軟推出了開源分支Intelligent Terminal,集成AI助手。
  • AI助手可解釋錯誤、編寫命令、修復問題,無需離開終端。
站內正文

使用 NotebookLM 進行最佳研究

谷歌的 AI 研究助手 NotebookLM 獲得全面升級,包括更高級的推理能力、新的輸出格式(PDF、電子表格等)以及更輕鬆的研究啓動。基於 Gemini 3.5 和 Antigravity,它提供了更高的準確性和分析能力。

  • NotebookLM 現在基於 Gemini 3.5 和 Antigravity 運行,推理能力更強。
  • 新的輸出格式包括 PDF 報告、圖表、電子表格和幻燈片。
站內正文

小米MiMo與TileRT實現萬億參數模型每秒超1000 token生成,運行於商用GPU

小米MiMo團隊聯合TileRT推出MiMo-V2.5-Pro-UltraSpeed,在單台8×商用GPU節點上,實現萬億參數模型每秒超1000 token的解碼速度。該技術結合FP4量化、DFlash投機解碼和TileRT運行時三大創新,無需定製芯片即可達此性能。API試用期為2026年6月9日至23日,定價為標準模型的3倍。

  • 萬億參數MoE模型在商用GPU上達到1000+ token/秒
  • 三大技術:FP4量化、DFlash投機解碼、TileRT運行時
站內正文
研究

將300萬美元的AI賬單降至190萬美元

Flowstate是一個智能代理,通過將AI請求路由到最合適的模型,並跟蹤每個項目的支出,幫助企業節省高達42%的AI成本。文章揭示了AI賬單膨脹的兩個主要原因:默認使用昂貴的旗艦模型以及缺乏成本歸屬。

  • 默認使用昂貴模型導致不必要的成本,Flowstate通過任務路由自動選擇合適模型。
  • 缺乏成本歸屬使得AI支出成為難以管理的單一費用,Flowstate提供項目級追蹤。
站內正文
模型

微軟研究表明:詳細描述比模型規模更重要,Lens以38億參數高效生成圖像

微軟研究院推出僅38億參數的文本到圖像模型Lens,利用GPT-4.1生成的8億條詳細描述進行訓練,在多個基準測試中媲美數倍於其規模的模型,訓練計算量僅為同類模型的五分之一。Lens-Turbo可在不到一秒內生成圖像,代碼和權重以MIT許可證開源。

  • Lens使用GPT-4.1生成的8億條詳細描述替代模糊的網絡替代文本,大幅提升訓練效率。
  • 僅38億參數,Lens在基準測試中匹配或超越數倍於其規模的模型。
站內正文
政策

蘋果宣佈Siri AI及下一代Apple Intelligence

蘋果在WWDC上宣佈了新的AI功能以及更智能、更個性化的Siri。此前,蘋果因未能實現2024年WWDC承諾的AI功能而面臨集體訴訟,最終以2.5億美元和解。蘋果正追趕AI賽道,與谷歌達成協議,由Gemini支持新功能。

  • 蘋果在WWDC 2026上發佈新一代Siri AI和Apple Intelligence
  • 此前因未兑現AI功能承諾,蘋果支付2.5億美元和解集體訴訟
站內正文
芯片

英特爾獲第二春:谷歌與英偉達探索其作為台積電AI芯片替代供應商

谷歌已向英特爾訂購超過300萬顆AI芯片,計劃於2028年交付。英偉達也正在測試英特爾的製造工藝,用於其下一代Feynman架構。此舉正值台積電難以滿足AI芯片需求之際,英特爾長期掙扎的代工業務迎來罕見轉機。

  • 谷歌與英特爾簽訂超過300萬顆AI芯片訂單,交付期為2028年。
  • 英偉達測試英特爾製造工藝,用於其Feynman架構芯片。
站內正文
工具

Show HN:Gitdot —— 一款更好的 GitHub。開源、反 AI、用 Rust 編寫

Gitdot 是一個開源 GitHub 替代品,使用 Rust 編寫,界面受命令行工具啓發,支持用户註冊、組織創建、倉庫管理及從 GitHub 導入倉庫(只讀鏡像或完整遷移)。目前缺少 issues、PR、CI 等功能。設計注重鍵盤驅動導航,目標實現 100ms 的首屏加載。

  • Gitdot 是用 Rust 編寫的開源 GitHub 替代品,界面風格類似 CLI 工具。
  • 當前支持用户註冊、組織創建、公有/私有倉庫以及從 GitHub 導入倉庫。
站內正文
機械人

黑客可能利用Meta的AI聊天機器人劫持超過2萬個Instagram賬户

Meta確認黑客利用其AI支持聊天機器人的漏洞,在無需雙因素認證的情況下劫持了超過2萬個Instagram賬户,包括前總統奧巴馬等知名賬户。Meta已修復漏洞並重置密碼鏈接。

  • Meta的AI支持聊天機器人存在漏洞,黑客可通過請求密碼重置劫持賬户。
  • 約20,225個Instagram賬户受影響,包括奧巴馬、美國太空軍高級軍士長等。
站內正文
其餘更新(8 條)
模型

解鎖歐洲AI靈活性:跨區域推理助力歐盟數據處理與模型訪問

AWS通過Amazon Bedrock的跨區域推理(CRIS)功能,幫助客户在歐洲利用多個AWS區域的模型容量,同時滿足GDPR等數據保護要求。本文深入介紹了全球推理與歐盟地理推理配置文件,以及如何通過IAM、CloudTrail等工具實現安全、透明和合規的數據處理。

  • 跨區域推理(CRIS)自動將請求路由至預定義地理邊界內的AWS區域,提升模型可用性和彈性。
  • 歐盟地理推理配置文件(EU CRIS)確保請求僅在歐盟區域內處理,幫助客户遵守GDPR。
站內正文

NotebookLM升級至Gemini 3.5,新增雲計算機和源發現功能

谷歌宣佈對NotebookLM進行全面升級,採用Gemini 3.5模型,提升回答準確性和可靠性。用户現在可以通過提問直接啓動研究項目,NotebookLM會利用Google搜索查找相關來源。此外,每個筆記本連接到安全的雲計算機,支持編寫和運行代碼,並能輸出多種文件格式。該更新面向AI Ultra計劃用户和Workspace客户。

  • 採用Gemini 3.5模型,提供更準確可靠的信息
  • 用户可直接提問啓動研究,NotebookLM通過Google搜索查找來源
站內正文

為什麼將任務委託給LLM會導致文檔損壞?

最新研究揭示,將文檔編輯等任務委託給大型語言模型(LLM)時,模型可能會在交互過程中默默損壞文檔內容。研究構建了DELEGATE-52基準測試,發現即使最先進的模型在20次交互後也會導致25%的內容損壞,原因包括錯誤累積、弱模型刪除與強模型幻覺、上下文過載以及領域熟悉度不足。代理式AI工具對此問題幫助有限。

  • 研究發現,將任務委託給LLM會導致文檔內容逐漸退化,頂級模型在20次交互後損壞率達25%,弱模型可達50%。
  • 錯誤累積、弱模型傾向於刪除內容、強模型則幻覺式地篡改信息,且上下文過載加劇問題。
站內正文
Agent

現在可以安心合上筆記本電腦了:在Amazon Bedrock AgentCore上託管編碼智能體

Amazon Bedrock AgentCore Runtime為每個智能體會話提供獨立的微VM,包含持久化工作區、通過Gateway的安全工具訪問以及內置的可觀測性,使得Claude Code、Codex、Kiro、Cursor等可以並行運行而不會共享密鑰、端口或文件系統。合上電腦,去吃晚餐,明天可以繼續之前的工作。

  • 筆記本電腦不適合運行編碼智能體:存在安全風險、密鑰泄露、並行衝突以及合蓋即中斷的問題。
  • AgentCore提供隔離的微VM、持久化存儲、身份層、網關和可觀測性,無需擔心合蓋。
站內正文

大規模做出更好的決策:數學優化如何在直覺失效時發揮作用

本文介紹了數學優化作為AI的一個子領域,如何幫助企業在複雜決策中找到最優解,並通過AWS生成式AI創新中心的實際案例展示了其顯著的業務效益。

  • 數學優化是演繹型AI,提供確定性最優決策,區別於機器學習的概率性預測。
  • 創新中心採用發現、建模、求解、架構四步框架解決優化問題。
站內正文

使用LangChain構建緊急求助熱線語音代理

瞭解如何使用LangChain、AssemblyAI和OpenAI構建一個實時AI語音緊急求助熱線代理。該代理能夠傾聽呼叫者的語音求助,實時評估情況,派遣合適的緊急服務,並安撫呼叫者——無需任何打字或菜單操作。文章詳細介紹了三階段流水線(語音轉文字、智能體推理、文字轉語音)以及關鍵代碼實現。

  • 利用AssemblyAI實現實時語音轉文字,支持部分轉錄和最終轉錄。
  • 智能體ARIA基於LangChain構建,具備位置查詢、緊急派遣、升級至人工和安撫協議等工具。
站內正文
政策

使用Amazon SageMaker AI和全同態加密實現端到端的加密機器學習推理

本文介紹如何利用Amazon SageMaker AI和全同態加密(FHE)技術,在雲上執行完全加密的機器學習推理。通過concrete-ml庫,您可以訓練FHE模型並部署到SageMaker端點,確保查詢、響應和中間結果全程加密,即使雲服務商也無法讀取數據。文中涵蓋醫療、能源、通信等敏感數據場景,並提供了詳細的實施步驟。

  • 全同態加密(FHE)允許在不解密的情況下處理加密數據,實現隱私保護的ML推理。
  • 使用concrete-ml庫(兼容scikit-learn)構建FHE模型,替代低階SEAL庫。