AI News HubLIVE

即時更新

BI接入要點:優化性能與總擁有成本

您的BI儀表盤速度緩慢,調優消耗大量時間和金錢。本文從物理佈局到治理語義層,逐步介紹Databricks的BI接入棧,提供改善查詢性能和降低總擁有成本的實用指導。

  • 星型模式與託管表構成BI性能的基礎。
  • 液簇與預測優化自動進行數據優化。
站內正文

Snowflake承諾向AWS投入60億美元,深入AI領域

Snowflake與AWS簽署五年60億美元合作協議,使用AWS Graviton和GPU實例進行AI訓練和推理,並擴展至10個新區域。此舉表明Snowflake在AI時代的雄心,同時通過Cortex AI產品套件推動企業AI應用。

  • Snowflake承諾五年內向AWS投資60億美元,用於Graviton計算和AI基礎設施。
  • 合作涵蓋AWS的ARM Graviton處理器和GPU加速EC2實例,用於AI模型訓練和推理。
站內正文

使用Amazon Bedrock AgentCore構建企業支持AI代理

AWS生成式AI創新中心與Works Human Intelligence合作,利用Amazon Bedrock AgentCore構建了兩個AI代理,分別用於通勤津貼審批和瀏覽器操作,實現了高達97%的成本降低並提升了運營效率。

  • AI代理自動化HR例行任務,如通勤津貼審批和瀏覽器操作。
  • 通過遷移至AgentCore和Strand Agents架構,成本降低97%。
站內正文

從數據過載到可操作洞察:Verizon Connect如何將智能代理AI擴展至10萬用户

Verizon Connect利用AWS構建智能代理AI解決方案,每天將超過5000萬數據點轉化為10萬用户的可操作洞察。本文詳細介紹了其架構決策、實施挑戰和可衡量的成果,包括使用無服務器統計模型進行異常檢測、採用Strands Agents實現動態推理、以及通過Amazon Nova Lite將輸入令牌成本降低70%。

  • Verizon Connect通過智能代理AI處理每日5億數據點,為10萬用户提供洞察。
  • 採用無服務器統計模型進行異常檢測,避免LLM處理原始表格數據的侷限性。
站內正文

AWS SMGS如何利用基於Amazon Bedrock AgentCore的AI對話助手轉變業務管理

AWS SMGS使用NarrateAI(基於Amazon Bedrock AgentCore構建的智能對話解決方案)實現大規模商業智能。該方案採用雙層架構:批量敍事生成和實時交互,通過專用AI代理進行路由和驗證,支持自然語言查詢、行級安全及個性化角色體驗,顯著提升決策效率。

  • NarrateAI通過雙層架構(批量處理+實時交互)解決傳統BI的延遲和數據碎片化問題。
  • 使用Amazon Bedrock AgentCore實現多代理編排,支持自然語言查詢和上下文感知響應。
站內正文

微軟MAI-Image-2.5在基準測試中與谷歌Nano Banana 2持平

微軟的MAI-Image-2.5模型在Arena文本到圖像排行榜上位列第三,與谷歌的Nano Banana 2性能相當,但仍落後於OpenAI的Image-2。該模型在圖像內文本渲染和商業視覺內容方面有明顯改進。

  • MAI-Image-2.5在Arena排行榜上排名第三,與谷歌Nano Banana 2持平
  • 模型在文本渲染和商業視覺內容方面有顯著提升
站內正文

AI編程助手Devin開發商Cognition估值九個月內翻倍至260億美元

Cognition公司為其AI軟件開發工具Devin融資超10億美元,估值達260億美元,顯示了投資者對AI編程工具的熱情,儘管其實際價值仍存爭議。

  • Cognition融資超10億美元,估值九個月內翻倍至260億美元。
  • 投資者對AI編程代理興趣濃厚。
站內正文

這款無AI的谷歌替代品人氣飆升 - 快來親自體驗

DuckDuckGo作為一款無AI的搜索替代品,因谷歌AI概覽的興起而用户激增。本文介紹瞭如何無AI地使用DuckDuckGo進行私密搜索和瀏覽。

  • DuckDuckGo在谷歌I/O 2026後安裝量激增,iOS應用增幅最高達69.9%。
  • DuckDuckGo提供無AI搜索和AI聊天選項,用户可自由選擇。
站內正文

利用 Amazon Bedrock AgentCore 賦能代理型 AI 銷售策略

AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。

  • Field Advisor 通過單一對話界面編排 20 多個專業代理。
  • 人工參與的工作流確保數據準確性和問責制。
站內正文

Robinhood 允許 AI 代理為客户交易股票和使用信用卡購買

Robinhood 通過 MCP 讓客户連接 Anthropic 的 Claude 等 AI 代理,這些代理可以自主交易股票。美國券商監管機構 FINRA 已將其視為新的風險領域,警告不可控的決策。Robinhood 也承認該產品並非適合所有人。

  • Robinhood 推出功能,客户可通過 MCP 連接 AI 代理(如 Claude)進行股票交易和使用信用卡購買。
  • AI 代理可以自主決策,無需客户逐一確認。
站內正文

“Tokenmaxxing 是真實的、昂貴的,而且正在蔓延”:新工具遏制AI預算爆炸

Tokenmaxxing(無節制使用AI token)導致企業預算失控。以Uber為例,其CTO稱AI預算已超支。新興公司Lanai推出Token Tuner工具,通過將token消耗映射到具體工作流程和業務成果,幫助企業優化模型選擇、降低浪費,推動從“tokenmaxxing”向“outcomemaxxing”轉變。

  • Tokenmaxxing使企業AI預算爆炸,Uber等公司已出現嚴重超支。
  • Lanai推出Token Tuner,通過追蹤token與工作流程、成果的關聯,提供效率評分和模型推薦。
站內正文

ITBench-AA:前沿模型在企業IT智能體任務基準測試中得分低於50%——由Artificial Analysis與IBM聯合發佈

Artificial Analysis與IBM聯合推出ITBench-AA,這是首個針對企業IT智能體任務的基準測試,專注於站點可靠性工程(SRE)。前沿模型得分均低於50%,其中Claude Opus 4.7以47%領先。該基準測試評估模型在Kubernetes事件響應中的表現,要求從日誌和追蹤中診斷故障。

  • Claude Opus 4.7以47%領先,GPT-5.5為46%,Qwen3.7 Max為42%。
  • 所有前沿模型得分低於50%,使ITBench-AA成為飽和度最低的智能體基準之一。
站內正文

NVIDIA發佈Polar:用於跨Codex、Claude Code和Qwen Code進行GRPO訓練的忠實令牌回滾框架

NVIDIA研究人員推出Polar框架,通過在智能體工具鏈和推理服務器之間放置模型API代理,實現無需修改智能體工具鏈即可進行強化學習訓練。基於Qwen3.5-4B模型使用GRPO訓練,Polar在Codex、Claude Code和Pi工具鏈上分別將SWE-Bench Verified pass@1提升了22.6、4.8和6.2個百分點。框架以NeMo Gym環境註冊,並在ProRL Agent Server倉庫開源。

  • Polar通過模型API代理捕獲令牌級交互,無需修改現有智能體工具鏈即可進行RL訓練
  • 使用GRPO在Qwen3.5-4B上訓練,SWE-Bench Verified最高提升22.6個百分點
站內正文

我找到了一個簡單的方法,自動將AI排除在搜索結果之外——幾乎在所有瀏覽器上都有效

厭倦了搜索引擎中的AI結果?本文介紹了一種通過添加自定義搜索引擎來排除AI結果的方法,並詳細説明了在Chrome、Firefox、Safari等主流瀏覽器中的設置步驟。

  • 添加自定義搜索引擎可排除AI搜索結果,避免AI帶來的能源消耗和不準確信息。
  • 在Firefox中通過設置搜索快捷方式添加URL https://www.google.com/search?q=%s&udm=14。
站內正文

YouTube將從本月開始嘗試自動標記AI視頻

YouTube正在加強AI標籤規則。從本月起,逼真或經過大量AI修改的內容的標籤將顯示在更顯眼的位置——長視頻顯示在播放器下方,短視頻則作為疊加層顯示。從2026年5月開始,即使創作者未披露,自動檢測系統也會標記AI生成的內容。推薦和變現不受影響。

  • YouTube收緊AI標籤規定,標籤位置更加顯眼。
  • 2026年5月起自動檢測AI生成內容,無需創作者主動披露。
站內正文

讓你的AI投資獲得良好回報

O'Reilly的Infrastructure & Ops超級流會探討了AI工作負載的基礎設施需求、成本和安全挑戰。DORA報告顯示,AI使代碼交付量提升約10%,但穩定性下降,驗證成本增加。專家強調平台工程、治理和認知債務的重要性,建議投資內部平台以保障AI應用的生產就緒。

  • AI工具提高了個人生產力,但團隊交付穩定性下降,驗證成本(驗證税)需要納入考量。
  • 良好的流程會被AI放大,糟糕的流程同樣會被放大,組織應主動改善流程而非僅期待技術提升。
站內正文

我認為Anthropic和OpenAI已找到產品市場契合點

文章指出,Anthropic和OpenAI通過將企業客户轉向API定價模式,以及編碼代理產品的普及,實現了產品市場契合。這一轉折點始於2025年11月模型升級,並在2026年4月因新模型發佈和企業定價調整而加速。

  • Anthropic和OpenAI已將其企業計劃定價調整為API價格,編碼代理(如Claude Code和Codex)成為主要收入來源。
  • 2026年4月,兩家公司發佈新前沿模型並提高API價格,同時鎖定企業客户以新價格簽約。
站內正文

AI工廠:智能時代的新基礎設施

AI工廠是新型基礎設施,實時將電能轉化為智能的生成單元——令牌。隨着代理型AI的擴展,每瓦性能與每令牌成本成為關鍵經濟指標。本文深入探討AI工廠的工作原理、架構優化以及NVIDIA的最新硬件如何提升效率。

  • AI工廠將電能轉化為令牌,是智能時代的“發電廠”。
  • 代理型AI使推理工作負載更深更復雜,要求實時協調。
站內正文

通過人工智能擴展人類智能

現代AI系統並非複製人類智能,而是擴展人類認知和語言中已有的結構。這一視角有助於理解AI的能力與侷限,並重新定義AI安全為系統級挑戰,關注工程和治理而非“失控AI”敍事。

  • AI系統通過建模語言中沉澱的人類理解結構來擴展智能,而非複製人類思維。
  • 幻覺和組合性差距源於AI缺乏與世界的有生命接觸,無法錨定意義和真理。
站內正文

AI巨頭互相攻擊,卻意外捧紅了一位無名議員

OpenAI和Anthropic的爭鬥意外地讓紐約州議員Alex Bores成為AI安全監管的代言人。儘管背後有超級政治行動委員會投入數百萬美元攻擊他,Bores卻因這些攻擊而聲名鵲起,目前在初選中領先。

  • OpenAI和Anthropic在紐約第12國會選區的初選中花費數百萬美元互相攻擊,但受益者卻是議員Alex Bores。
  • Bores撰寫了美國首批AI監管法案之一,因此成為AI公司的攻擊目標。
站內正文

AI 是一場軍備競賽,美國需要 90 億美元的英偉達超級芯片來跟上步伐

美國情報機構秘密申請 90 億美元採購英偉達 GB10 超級芯片,以幫助 CIA 和 NSA 追趕 Anthropic、OpenAI 等 AI 巨頭的步伐。這筆資金尚待國會批准,同時國防預算已調撥 8 億美元用於雲算力。文章詳細介紹了芯片規格、成本以及 AI 硬件競賽的升級趨勢。

  • 美國政府秘密申請 90 億美元為 CIA 和 NSA 購買英偉達 GB10 超級芯片。
  • GB10 芯片功耗僅 140 瓦,卻提供 1 petaflop FP4 性能,可微調 700 億參數模型。
站內正文

Lyft 如何利用 LangGraph 和 LangSmith 構建自助式 AI 代理平台

Lyft 採用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平台,用於客户支持,將代理開發時間從數月縮短至數週。該平台通過路由多代理架構、LangGraph 的子圖功能以及 LangSmith 的追蹤與監控工具,賦能非技術領域專家獨立開發 AI 代理,並藉助 LLM-as-a-Judge 評估系統確保質量。

  • Lyft 通過讓運營團隊、VoC 負責人和產品經理直接使用提示和配置來定義代理,減少了機器學習工程師的介入。
  • 基於路由器的多代理架構使用 LangGraph 協調專業子代理,實現安全檢查和狀態管理。
站內正文

教皇錯在哪裏

教皇利奧十四世的AI通諭《偉大的人性》雖然正確指出了算法偏見、水資源使用和數據主權等問題,但未能正視通用人工智能和災難性風險,缺乏應對大規模失業的具體方案,被批評為過時且令人失望。

  • 教皇利奧十四世的AI通諭《偉大的人性》被批評為過時,未能解決AI時代的關鍵問題。
  • 通諭雖提及算法偏見、水資源使用等問題,但缺乏對通用人工智能和災難性風險的討論。
站內正文

谷歌登場後,最重要的AI代理功能變得最無聊

谷歌在其I/O大會上推出管理型AI代理運行時,與Anthropic和AWS在六週內幾乎同時發佈類似產品。這標誌着AI代理運行時已成為標配,競爭焦點轉向數據位置、成本和可移植性等實際問題。

  • 谷歌、Anthropic和AWS在六週內相繼發佈了幾乎相同形態的管理型AI代理運行時。
  • 代理運行時已成為基礎功能,不再具備差異化優勢。
站內正文

英偉達暗示將在台灣投入1500億美元

英偉達CEO黃仁勳在即將在台灣設立總部的發佈會上稱該國為AI革命的“中心”。

  • 英偉達CEO黃仁勳稱台灣為AI革命的中心
  • 英偉達將投資約1500億美元在台灣建設新總部
站內正文

湖倉架構如何保持對雲故障的彈性

隨着AI代理工作負載激增,雲基礎設施面臨新的可靠性挑戰。Databricks的湖倉架構通過無狀態Postgres計算、區域冗餘存儲、控制平面與數據平面分離、單元化隔離以及混沌測試等措施,實現了高可用性和彈性,確保數據庫啓動時間等關鍵操作的高可靠性。

  • 代理工作負載導致數據庫創建量激增,每天啓動數千萬個數據庫。
  • 無狀態Postgres計算和區域冗餘存儲實現即時故障切換。
站內正文

AI的未來在本地:來自戴爾科技世界2026的商業建議

隨着成本上升、主權需求以及智能體採用,戴爾最新會議聚焦企業如何將AI工作負載過渡到混合基礎設施。

  • 戴爾科技世界2026強調企業AI執行,尤其是本地AI能力的構建。
  • 雲LLM成本激增,推動企業將AI工作負載轉向本地計算。
站內正文

Robinhood將允許AI代理交易股票,大賺(或大虧)一筆

Robinhood宣佈開放其交易平台給AI代理,用户可以創建獨立賬户併為代理分配資金,讓其自動買賣股票。該功能旨在自動化投資決策,但Robinhood發出重大風險警告,稱AI驅動策略可能表現不佳,用户可能損失全部投資。此外,Robinhood Gold Card用户可連接AI代理進行信用卡購物。該功能通過MCP協議實現,初期支持股票,未來將擴展至期權、加密貨幣等。

  • Robinhood推出AI代理交易功能,用户可為代理設立獨立賬户並分配資金。
  • 公司警告代理交易風險極高,可能導致全部投資損失。
站內正文

AI寫作醜聞越來越令人困惑

史蒂文·羅森鮑姆的書《真相的未來》中包含虛假引文,他指責AI聊天機器人導致錯誤。本週湧現多起文學AI醜聞,包括諾貝爾獎得主和英聯邦短篇小説獎爭議。隨着AI工具滲透創作領域,重新界定何為合理使用AI寫作的呼聲日益高漲。

  • 羅森鮑姆稱ChatGPT破壞了其書籍,但承認未核實AI生成的引文。
  • 一週內接連出現諾貝爾獎得主被誤解、作家被指控用AI寫小説等事件。
站內正文

Show HN: Mneme HQ – 面向AI編碼代理的倉庫原生架構規則

Mneme HQ 提供AI輔助開發的架構治理層,在代碼生成前強制執行約束,防止架構漂移,減少審查負擔。它直接集成到AI編碼代理的工作流中,攔截禁止的框架、跨邊界調用和過時決策,同時支持多種編碼助手和代理框架。

  • 在AI生成代碼之前強制執行架構規則,從源頭阻止違規
  • 支持Claude Code、Cursor、GitHub Copilot等主流AI編碼工具
站內正文