AI 日報 2026-06-09

今日必讀

Agent

利用Genie和AI代理革新太陽能與風能維護報告

2026-06-08

Plenitude在Databricks Genie上構建了一個基於代理的系統，將太陽能和風能維護的PDF報告轉換為統一、可查詢的資料模型，支援自然語言查詢、跨工廠分析和預測性維護。

系統使用Genie、Unity Catalog語義後設資料和AI函式，從PDF中提取結構化資料。
使用者可透過自然語言提問，生成視覺化結果並匯出。

親手體驗 Intelligent Terminal：一款AI增強的Windows終端

2026-06-08

微軟開源了Windows Terminal的一個分支——Intelligent Terminal，它內建AI助手，可在不干擾常規會話的情況下解釋錯誤、編寫命令和修復問題。該代理能感知終端動態，並記住當前和過去的會話。

微軟推出了開源分支Intelligent Terminal，整合AI助手。
AI助手可解釋錯誤、編寫命令、修復問題，無需離開終端。

使用 NotebookLM 進行最佳研究

2026-06-08

谷歌的 AI 研究助手 NotebookLM 獲得全面升級，包括更高階的推理能力、新的輸出格式（PDF、電子表格等）以及更輕鬆的研究啟動。基於 Gemini 3.5 和 Antigravity，它提供了更高的準確性和分析能力。

NotebookLM 現在基於 Gemini 3.5 和 Antigravity 執行，推理能力更強。
新的輸出格式包括 PDF 報告、圖表、電子表格和幻燈片。

小米MiMo與TileRT實現萬億引數模型每秒超1000 token生成，執行於商用GPU

2026-06-08

小米MiMo團隊聯合TileRT推出MiMo-V2.5-Pro-UltraSpeed，在單臺8×商用GPU節點上，實現萬億引數模型每秒超1000 token的解碼速度。該技術結合FP4量化、DFlash投機解碼和TileRT執行時三大創新，無需定製晶片即可達此效能。API試用期為2026年6月9日至23日，定價為標準模型的3倍。

萬億引數MoE模型在商用GPU上達到1000+ token/秒
三大技術：FP4量化、DFlash投機解碼、TileRT執行時

研究

將300萬美元的AI賬單降至190萬美元

2026-06-08

Flowstate是一個智慧代理，透過將AI請求路由到最合適的模型，並跟蹤每個專案的支出，幫助企業節省高達42%的AI成本。文章揭示了AI賬單膨脹的兩個主要原因：預設使用昂貴的旗艦模型以及缺乏成本歸屬。

預設使用昂貴模型導致不必要的成本，Flowstate透過任務路由自動選擇合適模型。
缺乏成本歸屬使得AI支出成為難以管理的單一費用，Flowstate提供專案級追蹤。

模型

微軟研究表明：詳細描述比模型規模更重要，Lens以38億引數高效生成影像

2026-06-08

微軟研究院推出僅38億引數的文本到影像模型Lens，利用GPT-4.1生成的8億條詳細描述進行訓練，在多個基準測試中媲美數倍於其規模的模型，訓練計算量僅為同類模型的五分之一。Lens-Turbo可在不到一秒內生成影像，程式碼和權重以MIT許可證開源。

Lens使用GPT-4.1生成的8億條詳細描述替代模糊的網路替代文本，大幅提升訓練效率。
僅38億引數，Lens在基準測試中匹配或超越數倍於其規模的模型。

政策

蘋果宣佈Siri AI及下一代Apple Intelligence

2026-06-08

蘋果在WWDC上宣佈了新的AI功能以及更智慧、更個性化的Siri。此前，蘋果因未能實現2024年WWDC承諾的AI功能而面臨集體訴訟，最終以2.5億美元和解。蘋果正追趕AI賽道，與谷歌達成協議，由Gemini支援新功能。

蘋果在WWDC 2026上釋出新一代Siri AI和Apple Intelligence
此前因未兌現AI功能承諾，蘋果支付2.5億美元和解集體訴訟

晶片

英特爾獲第二春：谷歌與輝達探索其作為臺積電AI晶片替代供應商

2026-06-08

谷歌已向英特爾訂購超過300萬顆AI晶片，計劃於2028年交付。輝達也正在測試英特爾的製造工藝，用於其下一代Feynman架構。此舉正值臺積電難以滿足AI晶片需求之際，英特爾長期掙扎的代工業務迎來罕見轉機。

谷歌與英特爾簽訂超過300萬顆AI晶片訂單，交付期為2028年。
輝達測試英特爾製造工藝，用於其Feynman架構晶片。

工具

Show HN：Gitdot —— 一款更好的 GitHub。開源、反 AI、用 Rust 編寫

2026-06-08

Gitdot 是一個開源 GitHub 替代品，使用 Rust 編寫，介面受命令列工具啟發，支援使用者註冊、組織建立、倉庫管理及從 GitHub 匯入倉庫（只讀映象或完整遷移）。目前缺少 issues、PR、CI 等功能。設計注重鍵盤驅動導航，目標實現 100ms 的首屏載入。

Gitdot 是用 Rust 編寫的開源 GitHub 替代品，介面風格類似 CLI 工具。
當前支援使用者註冊、組織建立、公有/私有倉庫以及從 GitHub 匯入倉庫。

機器人

駭客可能利用Meta的AI聊天機器人劫持超過2萬個Instagram賬戶

2026-06-08

Meta確認駭客利用其AI支援聊天機器人的漏洞，在無需雙因素認證的情況下劫持了超過2萬個Instagram賬戶，包括前總統歐巴馬等知名賬戶。Meta已修復漏洞並重置密碼連結。

Meta的AI支援聊天機器人存在漏洞，駭客可透過請求密碼重置劫持賬戶。
約20,225個Instagram賬戶受影響，包括歐巴馬、美國太空軍高階軍士長等。

其餘更新（8 條）

模型

解鎖歐洲AI靈活性：跨區域推理助力歐盟資料處理與模型訪問

2026-06-08

AWS透過Amazon Bedrock的跨區域推理（CRIS）功能，幫助客戶在歐洲利用多個AWS區域的模型容量，同時滿足GDPR等資料保護要求。本文深入介紹了全球推理與歐盟地理推理配置檔案，以及如何透過IAM、CloudTrail等工具實現安全、透明和合規的資料處理。

跨區域推理（CRIS）自動將請求路由至預定義地理邊界內的AWS區域，提升模型可用性和彈性。
歐盟地理推理配置檔案（EU CRIS）確保請求僅在歐盟區域內處理，幫助客戶遵守GDPR。

NotebookLM升級至Gemini 3.5，新增雲端計算機和源發現功能

2026-06-08

谷歌宣佈對NotebookLM進行全面升級，採用Gemini 3.5模型，提升回答準確性和可靠性。使用者現在可以透過提問直接啟動研究專案，NotebookLM會利用Google搜尋查詢相關來源。此外，每個筆記本連線到安全的雲端計算機，支援編寫和執行程式碼，並能輸出多種檔案格式。該更新面向AI Ultra計劃使用者和Workspace客戶。

採用Gemini 3.5模型，提供更準確可靠的資訊
使用者可直接提問啟動研究，NotebookLM透過Google搜尋查詢來源

為什麼將任務委託給LLM會導致文件損壞？

2026-06-08

最新研究揭示，將文件編輯等任務委託給大型語言模型（LLM）時，模型可能會在互動過程中默默損壞文件內容。研究構建了DELEGATE-52基準測試，發現即使最先進的模型在20次互動後也會導致25%的內容損壞，原因包括錯誤累積、弱模型刪除與強模型幻覺、上下文過載以及領域熟悉度不足。代理式AI工具對此問題幫助有限。

研究發現，將任務委託給LLM會導致文件內容逐漸退化，頂級模型在20次互動後損壞率達25%，弱模型可達50%。
錯誤累積、弱模型傾向於刪除內容、強模型則幻覺式地篡改資訊，且上下文過載加劇問題。

Agent

現在可以安心合上筆記型電腦了：在Amazon Bedrock AgentCore上託管編碼智慧體

2026-06-08

Amazon Bedrock AgentCore Runtime為每個智慧體會話提供獨立的微VM，包含持久化工作區、透過Gateway的安全工具訪問以及內建的可觀測性，使得Claude Code、Codex、Kiro、Cursor等可以並行執行而不會共享金鑰、埠或檔案系統。合上電腦，去吃晚餐，明天可以繼續之前的工作。

筆記型電腦不適合執行編碼智慧體：存在安全風險、金鑰洩露、並行衝突以及合蓋即中斷的問題。
AgentCore提供隔離的微VM、持久化儲存、身份層、閘道器和可觀測性，無需擔心合蓋。

大規模做出更好的決策：數學最佳化如何在直覺失效時發揮作用

2026-06-08

本文介紹了數學最佳化作為AI的一個子領域，如何幫助企業在複雜決策中找到最優解，並透過AWS生成式AI創新中心的實際案例展示了其顯著的業務效益。

數學最佳化是演繹型AI，提供確定性最優決策，區別於機器學習的機率性預測。
創新中心採用發現、建模、求解、架構四步框架解決最佳化問題。

使用LangChain構建緊急求助熱線語音代理

2026-06-08

瞭解如何使用LangChain、AssemblyAI和OpenAI構建一個即時AI語音緊急求助熱線代理。該代理能夠傾聽呼叫者的語音求助，即時評估情況，派遣合適的緊急服務，並安撫呼叫者——無需任何打字或選單操作。文章詳細介紹了三階段流水線（語音轉文字、智慧體推理、文字轉語音）以及關鍵程式碼實現。

利用AssemblyAI實現即時語音轉文字，支援部分轉錄和最終轉錄。
智慧體ARIA基於LangChain構建，具備位置查詢、緊急派遣、升級至人工和安撫協議等工具。

ReARM：AI程式設計代理治理演示 [影片]

2026-06-08

該影片演示了ReARM框架，旨在治理AI程式設計代理。

展示ReARM框架在AI程式設計代理治理中的應用
影片演示了關鍵功能與流程

政策

使用Amazon SageMaker AI和全同態加密實現端到端的加密機器學習推理

2026-06-08

本文介紹如何利用Amazon SageMaker AI和全同態加密（FHE）技術，在雲上執行完全加密的機器學習推理。透過concrete-ml庫，您可以訓練FHE模型並部署到SageMaker端點，確保查詢、響應和中間結果全程加密，即使雲服務商也無法讀取資料。文中涵蓋醫療、能源、通訊等敏感資料場景，並提供了詳細的實施步驟。

全同態加密（FHE）允許在不解密的情況下處理加密資料，實現隱私保護的ML推理。
使用concrete-ml庫（相容scikit-learn）構建FHE模型，替代低階SEAL庫。