AI News HubLIVE

今日必讀

Agent

如何設計一個OpenHarness風格的智慧體執行時:包含工具、記憶、許可權、技能和多智慧體協調

本教程從頭構建一個OpenHarness風格的智慧體框架,涵蓋工具使用、許可權控制、記憶、技能、上下文壓縮、重試邏輯、成本跟蹤和多智慧體協調,所有程式碼均可直接執行。

  • 從零搭建智慧體執行時,包含工具、記憶、許可權、技能等核心元件。
  • 理解完整控制流程:接收任務、模型決策、工具執行、觀察迴圈。
站內正文

70%部署客服AI代理的企業在60天內看到投資回報

根據Salesforce對3075名服務專業人士的調查,70%使用AI代理的服務組織在60天內報告了積極成果。AI代理在客服領域的採用率從2025年的39%增長到2026年的66%。新的基於成果的定價模式(按解決付費)將加速企業採用。

  • 70%的客服AI代理部署在60天內看到投資回報
  • AI代理採用率從39%躍升至66%
站內正文

處理影片留存編輯的自主AI代理

AutoEditor是一款AI影片編輯器,旨在透過自動留存編輯來製作病毒式傳播的影片。

  • AI驅動的影片編輯,面向病毒內容
  • 自主留存編輯
站內正文

AI時代的Drudge Report:AI Titus新聞聚合站上線

AI Titus新聞網站模仿Drudge Report風格,整合了AI領域的最新動態,包括Claude自主編寫程式碼佔比達65%、Anthropic推出Slack原生'Claude Tag'功能、Sakana Fugu編排API、多個新模型釋出以及社群討論等。

  • Claude now writes 65% of its own code, Anthropic ships Slack-native 'Claude Tag' for async team delegation.
  • Sakana 'Fugu' orchestration APIs learn model selection and delegation across many models.
站內正文

Show HN: Lelu – 基於置信度和提示注入的OpenAI代理門控

Lelu 是一個開源授權引擎,用於AI代理的每一次操作,檢測提示注入、低置信度決策,並支援人工稽核。它透過多層管道(包括置信度門控、策略評估和風險模型)確保安全,並提供OAuth令牌保險庫和NHI清單等功能。可自託管,整合主流AI框架。

  • 提示注入檢測和置信度門控
  • 多層安全管道:注入過濾、策略評估、風險模型
站內正文

使用 Amazon Nova 2 Sonic 構建醫療預約語音助手

本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手,用於處理醫療預約提醒對話。該助手能夠透過語音驗證患者身份、管理預約(確認、取消或改期)、收集就診前健康資訊,並在必要時轉接人工客服。它可大規模處理常規電話,有助於降低失約率。示例聚焦於智慧代理層面的語音對話與工具編排,並提供基於瀏覽器的測試介面。

  • 使用 Amazon Nova 2 Sonic 的原生語音到語音模型,保留語氣等上下文資訊。
  • 透過 Amazon Bedrock AgentCore 實現無伺服器執行時,整合七項醫療專用工具。
站內正文

利用 Snowflake 和 Amazon QuickSight 實現 AI 驅動型商業智慧

本文介紹瞭如何構建 Snowflake 語義檢視與 Amazon QuickSight 之間的端到端整合,使用電影評論資料作為示例,展示如何透過自然語言查詢和分析資料,確保業務邏輯的一致性和減少 AI 幻覺。

  • 語義檢視將業務定義直接附加到資料層,確保 AI 和 BI 系統統一解釋資訊
  • 透過 Cortex Analyst 進行自然語言查詢,降低 AI 幻覺風險
站內正文
政策

微軟利用AI在敲詐勒索訴訟中關聯兩個惡意軟體操作

微軟聯合國際執法機構,藉助AI分析封禁了與StealC和Amadey惡意軟體相關的200多個命令與控制伺服器,並依據《反敲詐勒索及腐敗組織法》(RICO)提起民事訴訟。這是首次針對網路犯罪供應鏈而非單一工具的法律行動。

  • 微軟使用Copilot等AI工具分析惡意軟體,將分析時間從數小時縮短至幾分鐘。
  • 發現StealC和Amadey共享同一基礎設施,促使微軟將其作為整體共謀起訴。
站內正文
研究

Superhuman 收購 AI 檢測初創公司 GPTZero,擁有 1900 萬以上使用者和 3000 萬美元 ARR

GPTZero 被 Superhuman 收購,後者是 Grammarly 和 Superhuman Mail 的母公司。此次收購將把 GPTZero 的 AI 檢測功能整合到電子郵件和更多平臺中,以在網際網路上維護人類真實性。

  • GPTZero 被 Superhuman 收購,使用者超過 1900 萬,ARR 達 3000 萬美元。
  • 收購後,AI 檢測將直接整合到電子郵件收件箱中。
站內正文
模型

引用Tom MacWright:AI生成的求職材料導致“意外匿名”

Tom MacWright指出,越來越多求職者使用LLM生成的簡歷、作品集和GitHub專案,導致僱主無法瞭解申請者的真實能力與個性。

  • 求職材料中AI生成內容增多,簡歷、作品集、GitHub提交資訊均由LLM代筆。
  • MacWright認為這種趨勢使得申請者變得“匿名”,僱主無法獲取其真實資訊。
站內正文
其餘更新(20 條)
Agent

AI編碼代理需要基於證據的審查,而不僅僅是更便宜的路徑選擇

本文分析了AI輔助編碼中審查環節的成本,指出模型呼叫費用僅佔總成本的一小部分,真正的瓶頸在於人工審查和返工。透過對比路由、檢索增強生成、多模型協商和自動化測試等方法,本文提出了一個驗證層應當連線主張與證據、縮小審查範圍,並探討了額外驗證的經濟效益。

  • 生產力證據矛盾:AI可能增加而非減少審查負擔。
  • 模型呼叫最佳化上限低,審查時間削減能節省更多成本。
站內正文

大金應用美洲公司如何藉助Genie Code大規模構建一致的資料管道

大金應用美洲公司使用Databricks Genie Code重新設計其資料工程運營模型,採用MECE技能框架和勳章架構來確保一致性。這種AI輔助方法加快了管道開發速度,同時保持了治理和與業務概念的協調。

  • 使用MECE技能和勳章架構標準化管道開發。
  • Genie Code加速迭代並減少樣板程式碼。
站內正文

Beyond推出人工智慧收入管理工具

美國收入管理平臺Beyond推出了一系列人工智慧驅動的工具,旨在幫助自動化定價、最佳化房源列表並簡化運營。新工具包括Listing Lens(AI房源分析器)和MCP伺服器測試版,使AI工具能直接連線Beyond的資料。此前推出的AI定價助手Neyoba已為超過15,000名房東和物業經理使用,節省了超過10萬小時的手動分析時間。

  • Beyond推出了新的AI收入管理工具套件
  • Listing Lens可分析Airbnb房源,提升可見性和預訂轉化率
站內正文

在野發現基於網頁的間接提示注入攻擊

Palo Alto Networks Unit 42報告了首次在野檢測到的間接提示注入(IDPI)攻擊,這些攻擊正在被積極武器化。攻擊者將隱藏指令嵌入網頁內容中,以操縱AI代理,包括一個AI廣告稽核規避案例。文章基於大規模遙測資料提出了攻擊者意圖和載荷工程技術的分類。

  • 間接提示注入(IDPI)不再是理論上的威脅;在野攻擊已被觀測到。
  • 首個有記錄的AI廣告稽核繞過案例,利用網頁中的隱藏提示。
站內正文

Loka 如何利用 Amazon Nova 2 Sonic 構建自然、低延遲的語音代理

Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理,透過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題,實現了低成本、高準確率的客戶互動。

  • 傳統語音代理因三步處理流程(語音轉文本、LLM 處理、文本轉語音)導致 3-5 秒延遲,破壞對話自然性,增加成本。
  • Amazon Nova 2 Sonic 採用端到端語音處理,Big Bench Audio 得分 87.0,首次響應時間 1.39 秒,每小時成本約 0.27 美元。
站內正文

OpenClaw的ClawHub市場上的惡意AI“技能”繞過掃描器分發資訊竊取軟體

Unit 42研究人員發現,在OpenClaw的ClawHub市場上,惡意行為者透過社交工程和混淆技術釋出看似合法的“技能”,誘使使用者執行命令,從而部署AMOS和cluw等資訊竊取軟體。該攻擊利用使用者輔助執行繞過安全掃描器,對AI代理生態系統構成嚴重供應鏈威脅。

  • Unit 42在2026年2月至5月間發現針對OpenClaw AI代理生態系統的惡意技能活動。
  • 攻擊者透過ClawHub釋出如tradingview-ai-indicator-assistant等惡意技能,使用paste-site重定向誘騙使用者執行base64編碼命令。
站內正文

如果答案已經存在於你的資料中呢?

Kythera Labs 在 Databricks 上構建了 AI 原生的醫療戰略平臺,使任何醫療系統都能獲得專家級智慧,透過 AI 代理以自然語言回答戰略問題,並提供了實際案例:路易斯安那州一家醫療系統在10天內上線,實現了患者就診可見性提高150%、漏診減少22%、年化價值380萬美元。

  • Kythera Labs 利用 Databricks 構建 AI 代理,將醫療資料分析專家經驗封裝,使醫療系統領導能用自然語言提問。
  • 該平臺基於3390億醫療和處方索賠資料,重建患者就診旅程,提供可信答案。
站內正文

Figma 推出 AI 動效和著色器工具

Figma 在年度 Config 大會上釋出了多項設計及編碼產品更新,旨在藉助 AI 幫助創意人員將想法進一步推進並自動化繁瑣任務。重新構想的畫布針對全棧開發進行了最佳化,新增編碼層、AI 動效生成、著色器、Figma Weave 工作流、智慧代理技能和生成式外掛等功能。

  • 重新構想的畫布支援全棧開發,團隊、AI 代理、工具和材料整合在一處。
  • 編碼層允許直接在設計畫布上修改程式碼。
站內正文

如何為AI Agent構建記憶系統

本文介紹了為AI Agent新增記憶功能的實用方法,包括短期記憶和長期記憶的概念、追蹤分析以及如何利用LangSmith工具實現記憶迴圈,從而讓Agent從以往互動中學習並改進行為。

  • 記憶讓Agent能記住使用者偏好和修復過的錯誤,減少重複糾正。
  • 短期記憶用於當前任務,長期記憶持久化事實、偏好和技能。
站內正文
政策

科技巨頭在單一國會選區投入數百萬美元,這不會是最後一次

在紐約第12國會選區的民主黨初選中,支援與反對AI的團體共投入2400萬美元,成為該州歷史上最昂貴的同類競選之一。候選人格雷格·博雷斯因發起AI安全法案成為焦點,但鉅額支出的實際影響尚不明確。

  • 紐約第12國會選區的民主黨初選總花費超過2400萬美元,創下該州記錄。
  • 科技行業的政治行動委員會分別支援或反對候選人亞歷克斯·博雷斯的AI安全法案。
站內正文

Show HN:SparQ Pulse – 自託管的 GitHub 原生專案管理工具

SparQ Pulse 是一個完全開源的開發者體驗套件,專為 GitHub 原生團隊設計。它提供專案管理、非同步站會、障礙跟蹤、團隊狀態、行動事項、聊天、文件、考勤等功能,並支援可選 AI 整合。技術棧採用 Python、Flask 和 HTMX,可透過 Docker 輕鬆自託管,資料儲存支援 SQLite 或 PostgreSQL。該專案目前已在 GitHub 上獲得 12 顆星,採用 AGPL-3.0 許可證。

  • SparQ Pulse 是首個完全開源的、面向 GitHub 原生團隊的開發者體驗套件,包含 Pulse、Metrics 和 Knowledge 三個產品模組。
  • 核心功能包括 GitHub 同步、非同步站會(支援錄音與轉錄)、障礙看板、團隊狀態、行動事項(三級緊急度)、即時聊天、文件管理、人員管理、考勤以及可選 AI 助手(OpenAI/Anthropic)。
站內正文

2700萬美元的AI代理人戰爭以平局告終:亞歷克斯·博雷斯失利

紐約州議員亞歷克斯·博雷斯在民主黨初選中以微弱差距輸給米卡·拉舍爾,標誌著由Anthropic和OpenAI代理的超級政治行動委員會之間耗資2700萬美元的代理人戰爭暫時平息。博雷斯因推動AI監管法案《RAISE法案》而成為焦點,但最終敗於地方政治支援和對手的資金優勢。

  • 博雷斯以35%對39.1%輸給拉舍爾,其他候選人得票率更低。
  • AI相關超級政治行動委員會總計投入2741萬美元,其中支援博雷斯的陣營花費1926萬美元,反對陣營花費815萬美元。
站內正文

醫療診斷AI可被誘騙洩露訓練資料中的患者身份

德國研究人員發現,醫療AI模型容易受到成員推理攻擊,可能暴露患者資料,尤其來自代表性不足群體的患者。研究呼籲改進隱私標準和採用差分隱私技術。

  • 醫療AI的判別模型可被攻擊者利用,精準識別訓練資料中的患者。
  • 攻擊成功率幾乎完美,尤其針對少數群體患者。
站內正文
機器人

這些必備智慧家居裝置超級實用——售價均低於25美元

從智慧燈泡到家庭安防,亞馬遜Prime Day提供了大量必備智慧家居裝置的超值優惠。

  • 亞馬遜Prime Day正在進行中,智慧家居裝置折扣力度大。
  • 精選多款低於25美元的智慧家居產品,包括智慧插頭、門鈴、攝像頭等。
站內正文
工具

Meta釋出面向創作者的AI新應用

Facebook宣佈將Creator Studio工具重新設計為獨立AI伴侶應用,幫助創作者在社交網路上擴大受眾。此舉旨在與TikTok和YouTube競爭,減少創作者對ChatGPT等第三方工具的依賴。

  • Meta推出AI伴侶應用,幫助創作者在Facebook上擴大受眾
  • 該應用重新設計了Creator Studio工具
站內正文
研究

Show HN:利用AI推薦您的產品或服務

一位開發者發現其產品在ChatGPT和Perplexity等AI平臺上的推薦流量差異顯著,隨後開發了一款免費工具。該工具無需註冊即可掃描網站,模擬買家查詢,評估AI是否推薦您的產品,並與競爭對手對比,提供最佳化清單以提高AI推薦率。

  • 產品在AI聊天機器人中的推薦流量差異顯著,引發深入調查。
  • 開發了免費工具,無需註冊即可掃描網站並評估AI推薦情況。
站內正文
晶片

高通收購AI平臺開發商Modular

此次收購擴大了這家晶片製造商從邊緣裝置到資料中心的AI基礎設施野心。

  • 高通收購AI平臺開發商Modular,拓展AI基礎設施業務
  • 此舉將高通的AI佈局從邊緣裝置延伸至資料中心
站內正文
模型

思考即回憶:推理如何解鎖大語言模型中的引數化知識

Google Research 的研究揭示了一個反直覺的現象:即使對於簡單的事實性問題,讓大語言模型生成推理鏈也能提高答案的準確性。研究發現兩種機制:計算緩衝(生成額外標記用於潛在計算)和事實啟動(生成相關事實以幫助召回正確答案)。

  • 推理幫助模型召回原本無法獲取的簡單事實,即使無需逐步推理。
  • 機制一:計算緩衝——生成無意義的推理標記也提供額外計算,提升召回。
站內正文

使用NVIDIA NeMo AutoModel加速Transformer微調

NVIDIA NeMo AutoModel基於HuggingFace Transformers v5,透過專家並行、DeepEP融合通訊和TransformerEngine核心,將MoE模型微調的訓練吞吐量提升3.4-3.7倍,GPU記憶體減少29-32%,且無需更改API。

  • NeMo AutoModel繼承AutoModelForCausalLM,僅需更改匯入行即可實現效能提升。
  • 在550B規模模型上,專家並行使全微調在16節點H100叢集上可行,而Transformers v5因記憶體不足無法執行。
站內正文

n8n的LlamaParse平臺節點:利用AI解析、分類、提取和檢索文件

LlamaParse平臺社群節點已釋出v5和v6版本,現為n8n官方驗證的社群節點。該節點整合了五個LlamaCloud資源(解析、分類、拆分、提取、檢索),支援作為AI Agent工具使用。v5重寫了基礎架構,v6將多個獨立節點整合為一個,並增加了索引管理功能。文章還提供了三種工作流示例:將檢索器作為Agent工具、構建分類-提取-驗證流水線、以及評估不同解析模式的輸出質量。

  • LlamaParse平臺節點提供五個資源:解析、分類、拆分、提取和檢索,均支援作為n8n AI Agent的工具。
  • v5版本放棄了SDK,改用直接HTTP呼叫,並遷移提取功能至V2,支援可配置API基礎URL。