AI News HubLIVE

即時更新

從資料過載到可操作洞察:Verizon Connect如何將智慧代理AI擴充套件至10萬使用者

Verizon Connect利用AWS構建智慧代理AI解決方案,每天將超過5000萬資料點轉化為10萬使用者的可操作洞察。本文詳細介紹了其架構決策、實施挑戰和可衡量的成果,包括使用無伺服器統計模型進行異常檢測、採用Strands Agents實現動態推理、以及透過Amazon Nova Lite將輸入令牌成本降低70%。

  • Verizon Connect透過智慧代理AI處理每日5億資料點,為10萬使用者提供洞察。
  • 採用無伺服器統計模型進行異常檢測,避免LLM處理原始表格資料的侷限性。
站內正文

AWS SMGS如何利用基於Amazon Bedrock AgentCore的AI對話助手轉變業務管理

AWS SMGS使用NarrateAI(基於Amazon Bedrock AgentCore構建的智慧對話解決方案)實現大規模商業智慧。該方案採用雙層架構:批次敘事生成和即時互動,透過專用AI代理進行路由和驗證,支援自然語言查詢、行級安全及個性化角色體驗,顯著提升決策效率。

  • NarrateAI透過雙層架構(批次處理+即時互動)解決傳統BI的延遲和資料碎片化問題。
  • 使用Amazon Bedrock AgentCore實現多代理編排,支援自然語言查詢和上下文感知響應。
站內正文

微軟MAI-Image-2.5在基準測試中與谷歌Nano Banana 2持平

微軟的MAI-Image-2.5模型在Arena文本到影像排行榜上位列第三,與谷歌的Nano Banana 2效能相當,但仍落後於OpenAI的Image-2。該模型在影像內文本渲染和商業視覺內容方面有明顯改進。

  • MAI-Image-2.5在Arena排行榜上排名第三,與谷歌Nano Banana 2持平
  • 模型在文本渲染和商業視覺內容方面有顯著提升
站內正文

這款無AI的谷歌替代品人氣飆升 - 快來親自體驗

DuckDuckGo作為一款無AI的搜尋替代品,因谷歌AI概覽的興起而使用者激增。本文介紹瞭如何無AI地使用DuckDuckGo進行私密搜尋和瀏覽。

  • DuckDuckGo在谷歌I/O 2026後安裝量激增,iOS應用增幅最高達69.9%。
  • DuckDuckGo提供無AI搜尋和AI聊天選項,使用者可自由選擇。
站內正文

利用 Amazon Bedrock AgentCore 賦能代理型 AI 銷售策略

AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。

  • Field Advisor 透過單一對話介面編排 20 多個專業代理。
  • 人工參與的工作流確保資料準確性和問責制。
站內正文

Robinhood 允許 AI 代理為客戶交易股票和使用信用卡購買

Robinhood 透過 MCP 讓客戶連線 Anthropic 的 Claude 等 AI 代理,這些代理可以自主交易股票。美國券商監管機構 FINRA 已將其視為新的風險領域,警告不可控的決策。Robinhood 也承認該產品並非適合所有人。

  • Robinhood 推出功能,客戶可透過 MCP 連線 AI 代理(如 Claude)進行股票交易和使用信用卡購買。
  • AI 代理可以自主決策,無需客戶逐一確認。
站內正文

“Tokenmaxxing 是真實的、昂貴的,而且正在蔓延”:新工具遏制AI預算爆炸

Tokenmaxxing(無節制使用AI token)導致企業預算失控。以Uber為例,其CTO稱AI預算已超支。新興公司Lanai推出Token Tuner工具,透過將token消耗對映到具體工作流程和業務成果,幫助企業最佳化模型選擇、降低浪費,推動從“tokenmaxxing”向“outcomemaxxing”轉變。

  • Tokenmaxxing使企業AI預算爆炸,Uber等公司已出現嚴重超支。
  • Lanai推出Token Tuner,透過追蹤token與工作流程、成果的關聯,提供效率評分和模型推薦。
站內正文

ITBench-AA:前沿模型在企業IT智慧體任務基準測試中得分低於50%——由Artificial Analysis與IBM聯合釋出

Artificial Analysis與IBM聯合推出ITBench-AA,這是首個針對企業IT智慧體任務的基準測試,專注於站點可靠性工程(SRE)。前沿模型得分均低於50%,其中Claude Opus 4.7以47%領先。該基準測試評估模型在Kubernetes事件響應中的表現,要求從日誌和追蹤中診斷故障。

  • Claude Opus 4.7以47%領先,GPT-5.5為46%,Qwen3.7 Max為42%。
  • 所有前沿模型得分低於50%,使ITBench-AA成為飽和度最低的智慧體基準之一。
站內正文

NVIDIA釋出Polar:用於跨Codex、Claude Code和Qwen Code進行GRPO訓練的忠實令牌回滾框架

NVIDIA研究人員推出Polar框架,透過在智慧體工具鏈和推理伺服器之間放置模型API代理,實現無需修改智慧體工具鏈即可進行強化學習訓練。基於Qwen3.5-4B模型使用GRPO訓練,Polar在Codex、Claude Code和Pi工具鏈上分別將SWE-Bench Verified pass@1提升了22.6、4.8和6.2個百分點。框架以NeMo Gym環境註冊,並在ProRL Agent Server倉庫開源。

  • Polar透過模型API代理捕獲令牌級互動,無需修改現有智慧體工具鏈即可進行RL訓練
  • 使用GRPO在Qwen3.5-4B上訓練,SWE-Bench Verified最高提升22.6個百分點
站內正文

我找到了一個簡單的方法,自動將AI排除在搜尋結果之外——幾乎在所有瀏覽器上都有效

厭倦了搜尋引擎中的AI結果?本文介紹了一種透過新增自定義搜尋引擎來排除AI結果的方法,並詳細說明了在Chrome、Firefox、Safari等主流瀏覽器中的設定步驟。

  • 新增自定義搜尋引擎可排除AI搜尋結果,避免AI帶來的能源消耗和不準確資訊。
  • 在Firefox中透過設定搜尋快捷方式新增URL https://www.google.com/search?q=%s&udm=14。
站內正文

YouTube將從本月開始嘗試自動標記AI影片

YouTube正在加強AI標籤規則。從本月起,逼真或經過大量AI修改的內容的標籤將顯示在更顯眼的位置——長影片顯示在播放器下方,短影片則作為疊加層顯示。從2026年5月開始,即使創作者未披露,自動檢測系統也會標記AI生成的內容。推薦和變現不受影響。

  • YouTube收緊AI標籤規定,標籤位置更加顯眼。
  • 2026年5月起自動檢測AI生成內容,無需創作者主動披露。
站內正文

讓你的AI投資獲得良好回報

O'Reilly的Infrastructure & Ops超級流會探討了AI工作負載的基礎設施需求、成本和安全挑戰。DORA報告顯示,AI使程式碼交付量提升約10%,但穩定性下降,驗證成本增加。專家強調平臺工程、治理和認知債務的重要性,建議投資內部平臺以保障AI應用的生產就緒。

  • AI工具提高了個人生產力,但團隊交付穩定性下降,驗證成本(驗證稅)需要納入考量。
  • 良好的流程會被AI放大,糟糕的流程同樣會被放大,組織應主動改善流程而非僅期待技術提升。
站內正文

我認為Anthropic和OpenAI已找到產品市場契合點

文章指出,Anthropic和OpenAI透過將企業客戶轉向API定價模式,以及編碼代理產品的普及,實現了產品市場契合。這一轉折點始於2025年11月模型升級,並在2026年4月因新模型釋出和企業定價調整而加速。

  • Anthropic和OpenAI已將其企業計劃定價調整為API價格,編碼代理(如Claude Code和Codex)成為主要收入來源。
  • 2026年4月,兩家公司釋出新前沿模型並提高API價格,同時鎖定企業客戶以新價格簽約。
站內正文

AI工廠:智慧時代的新基礎設施

AI工廠是新型基礎設施,即時將電能轉化為智慧的生成單元——令牌。隨著代理型AI的擴充套件,每瓦效能與每令牌成本成為關鍵經濟指標。本文深入探討AI工廠的工作原理、架構最佳化以及NVIDIA的最新硬體如何提升效率。

  • AI工廠將電能轉化為令牌,是智慧時代的“發電廠”。
  • 代理型AI使推理工作負載更深更復雜,要求即時協調。
站內正文

透過人工智慧擴充套件人類智慧

現代AI系統並非複製人類智慧,而是擴充套件人類認知和語言中已有的結構。這一視角有助於理解AI的能力與侷限,並重新定義AI安全為系統級挑戰,關注工程和治理而非“失控AI”敘事。

  • AI系統透過建模語言中沉澱的人類理解結構來擴充套件智慧,而非複製人類思維。
  • 幻覺和組合性差距源於AI缺乏與世界的有生命接觸,無法錨定意義和真理。
站內正文

AI巨頭互相攻擊,卻意外捧紅了一位無名議員

OpenAI和Anthropic的爭鬥意外地讓紐約州議員Alex Bores成為AI安全監管的代言人。儘管背後有超級政治行動委員會投入數百萬美元攻擊他,Bores卻因這些攻擊而聲名鵲起,目前在初選中領先。

  • OpenAI和Anthropic在紐約第12國會選區的初選中花費數百萬美元互相攻擊,但受益者卻是議員Alex Bores。
  • Bores撰寫了美國首批AI監管法案之一,因此成為AI公司的攻擊目標。
站內正文

AI 是一場軍備競賽,美國需要 90 億美元的輝達超級晶片來跟上步伐

美國情報機構秘密申請 90 億美元採購輝達 GB10 超級晶片,以幫助 CIA 和 NSA 追趕 Anthropic、OpenAI 等 AI 巨頭的步伐。這筆資金尚待國會批准,同時國防預算已調撥 8 億美元用於雲算力。文章詳細介紹了晶片規格、成本以及 AI 硬體競賽的升級趨勢。

  • 美國政府秘密申請 90 億美元為 CIA 和 NSA 購買輝達 GB10 超級晶片。
  • GB10 晶片功耗僅 140 瓦,卻提供 1 petaflop FP4 效能,可微調 700 億引數模型。
站內正文

Lyft 如何利用 LangGraph 和 LangSmith 構建自助式 AI 代理平臺

Lyft 採用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平臺,用於客戶支援,將代理開發時間從數月縮短至數週。該平臺透過路由多代理架構、LangGraph 的子圖功能以及 LangSmith 的追蹤與監控工具,賦能非技術領域專家獨立開發 AI 代理,並藉助 LLM-as-a-Judge 評估系統確保質量。

  • Lyft 透過讓運營團隊、VoC 負責人和產品經理直接使用提示和配置來定義代理,減少了機器學習工程師的介入。
  • 基於路由器的多代理架構使用 LangGraph 協調專業子代理,實現安全檢查和狀態管理。
站內正文

教皇錯在哪裡

教皇利奧十四世的AI通諭《偉大的人性》雖然正確指出了演算法偏見、水資源使用和資料主權等問題,但未能正視通用人工智慧和災難性風險,缺乏應對大規模失業的具體方案,被批評為過時且令人失望。

  • 教皇利奧十四世的AI通諭《偉大的人性》被批評為過時,未能解決AI時代的關鍵問題。
  • 通諭雖提及演算法偏見、水資源使用等問題,但缺乏對通用人工智慧和災難性風險的討論。
站內正文

谷歌登場後,最重要的AI代理功能變得最無聊

谷歌在其I/O大會上推出管理型AI代理執行時,與Anthropic和AWS在六週內幾乎同時釋出類似產品。這標誌著AI代理執行時已成為標配,競爭焦點轉向資料位置、成本和可移植性等實際問題。

  • 谷歌、Anthropic和AWS在六週內相繼釋出了幾乎相同形態的管理型AI代理執行時。
  • 代理執行時已成為基礎功能,不再具備差異化優勢。
站內正文

輝達暗示將在臺灣投入1500億美元

輝達CEO黃仁勳在即將在臺灣設立總部的釋出會上稱該國為AI革命的“中心”。

  • 輝達CEO黃仁勳稱臺灣為AI革命的中心
  • 輝達將投資約1500億美元在臺灣建設新總部
站內正文

湖倉架構如何保持對雲故障的彈性

隨著AI代理工作負載激增,雲基礎設施面臨新的可靠性挑戰。Databricks的湖倉架構透過無狀態Postgres計算、區域冗餘儲存、控制平面與資料平面分離、單元化隔離以及混沌測試等措施,實現了高可用性和彈性,確保資料庫啟動時間等關鍵操作的高可靠性。

  • 代理工作負載導致資料庫建立量激增,每天啟動數千萬個資料庫。
  • 無狀態Postgres計算和區域冗餘儲存實現即時故障切換。
站內正文

AI的未來在本地:來自戴爾科技世界2026的商業建議

隨著成本上升、主權需求以及智慧體採用,戴爾最新會議聚焦企業如何將AI工作負載過渡到混合基礎設施。

  • 戴爾科技世界2026強調企業AI執行,尤其是本地AI能力的構建。
  • 雲LLM成本激增,推動企業將AI工作負載轉向本地計算。
站內正文

Robinhood將允許AI代理交易股票,大賺(或大虧)一筆

Robinhood宣佈開放其交易平臺給AI代理,使用者可以建立獨立賬戶併為代理分配資金,讓其自動買賣股票。該功能旨在自動化投資決策,但Robinhood發出重大風險警告,稱AI驅動策略可能表現不佳,使用者可能損失全部投資。此外,Robinhood Gold Card使用者可連線AI代理進行信用卡購物。該功能透過MCP協議實現,初期支援股票,未來將擴充套件至期權、加密貨幣等。

  • Robinhood推出AI代理交易功能,使用者可為代理設立獨立賬戶並分配資金。
  • 公司警告代理交易風險極高,可能導致全部投資損失。
站內正文

AI寫作醜聞越來越令人困惑

史蒂文·羅森鮑姆的書《真相的未來》中包含虛假引文,他指責AI聊天機器人導致錯誤。本週湧現多起文學AI醜聞,包括諾貝爾獎得主和英聯邦短篇小說獎爭議。隨著AI工具滲透創作領域,重新界定何為合理使用AI寫作的呼聲日益高漲。

  • 羅森鮑姆稱ChatGPT破壞了其書籍,但承認未核實AI生成的引文。
  • 一週內接連出現諾貝爾獎得主被誤解、作家被指控用AI寫小說等事件。
站內正文

Show HN: Mneme HQ – 面向AI編碼代理的倉庫原生架構規則

Mneme HQ 提供AI輔助開發的架構治理層,在程式碼生成前強制執行約束,防止架構漂移,減少審查負擔。它直接整合到AI編碼代理的工作流中,攔截禁止的框架、跨邊界呼叫和過時決策,同時支援多種編碼助手和代理框架。

  • 在AI生成程式碼之前強制執行架構規則,從源頭阻止違規
  • 支援Claude Code、Cursor、GitHub Copilot等主流AI編碼工具
站內正文

Buffer API

一個API即可在所有社交平臺上釋出內容。

  • Buffer API 提供單一介面,可釋出到多個社交平臺。
  • 簡化社交媒體管理流程。
站內正文

這款智慧鳥餵食器捕捉到更多我家後院的鳥類活動

這款名為Aura的智慧鳥餵食器與主流的Birdbuddy Pro相比,提供更寬視野、更長續航和更大容量,但影像質量和AI識別準確性稍遜。作者透過測試對比了兩款裝置,認為Aura適合追求更多活動記錄的使用者,而Birdbuddy則提供更精緻的觀賞體驗。

  • Aura智慧鳥餵食器採用旁置攝像頭,提供150度廣角2.5K影片,視野更自然。
  • Aura內建雙太陽能板,電池續航長達兩個月,優於Birdbuddy Pro。
站內正文

Greg Kroah-Hartman稱Rust將拯救Linux於AI威脅

Linux穩定核心維護者Greg Kroah-Hartman在Rust Week大會上表示,Rust語言將幫助Linux抵禦AI發現的大量安全漏洞。他指出,Rust的編譯時檢查能消除約60%的核心錯誤,並且核心維護者已認定Rust不再是實驗性技術,將全力推進。

  • Greg Kroah-Hartman認為Rust能解決AI發現的眾多Linux安全漏洞。
  • Rust的編譯時檢查可消除60%的核心錯誤,如記憶體洩漏和鎖問題。
站內正文