AI News HubLIVE

今日必讀

Agent

如何設計一個OpenHarness風格的智能體運行時:包含工具、記憶、權限、技能和多智能體協調

本教程從頭構建一個OpenHarness風格的智能體框架,涵蓋工具使用、權限控制、記憶、技能、上下文壓縮、重試邏輯、成本跟蹤和多智能體協調,所有代碼均可直接運行。

  • 從零搭建智能體運行時,包含工具、記憶、權限、技能等核心組件。
  • 理解完整控制流程:接收任務、模型決策、工具執行、觀察循環。
站內正文

70%部署客服AI代理的企業在60天內看到投資回報

根據Salesforce對3075名服務專業人士的調查,70%使用AI代理的服務組織在60天內報告了積極成果。AI代理在客服領域的採用率從2025年的39%增長到2026年的66%。新的基於成果的定價模式(按解決付費)將加速企業採用。

  • 70%的客服AI代理部署在60天內看到投資回報
  • AI代理採用率從39%躍升至66%
站內正文

處理視頻留存編輯的自主AI代理

AutoEditor是一款AI視頻編輯器,旨在通過自動留存編輯來製作病毒式傳播的視頻。

  • AI驅動的視頻編輯,面向病毒內容
  • 自主留存編輯
站內正文

AI時代的Drudge Report:AI Titus新聞聚合站上線

AI Titus新聞網站模仿Drudge Report風格,整合了AI領域的最新動態,包括Claude自主編寫代碼佔比達65%、Anthropic推出Slack原生'Claude Tag'功能、Sakana Fugu編排API、多個新模型發佈以及社區討論等。

  • Claude now writes 65% of its own code, Anthropic ships Slack-native 'Claude Tag' for async team delegation.
  • Sakana 'Fugu' orchestration APIs learn model selection and delegation across many models.
站內正文

Show HN: Lelu – 基於置信度和提示注入的OpenAI代理門控

Lelu 是一個開源授權引擎,用於AI代理的每一次操作,檢測提示注入、低置信度決策,並支持人工審核。它通過多層管道(包括置信度門控、策略評估和風險模型)確保安全,並提供OAuth令牌保險庫和NHI清單等功能。可自託管,集成主流AI框架。

  • 提示注入檢測和置信度門控
  • 多層安全管道:注入過濾、策略評估、風險模型
站內正文

使用 Amazon Nova 2 Sonic 構建醫療預約語音助手

本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手,用於處理醫療預約提醒對話。該助手能夠通過語音驗證患者身份、管理預約(確認、取消或改期)、收集就診前健康信息,並在必要時轉接人工客服。它可大規模處理常規電話,有助於降低失約率。示例聚焦於智能代理層面的語音對話與工具編排,並提供基於瀏覽器的測試界面。

  • 使用 Amazon Nova 2 Sonic 的原生語音到語音模型,保留語氣等上下文信息。
  • 通過 Amazon Bedrock AgentCore 實現無服務器運行時,集成七項醫療專用工具。
站內正文

利用 Snowflake 和 Amazon QuickSight 實現 AI 驅動型商業智能

本文介紹瞭如何構建 Snowflake 語義視圖與 Amazon QuickSight 之間的端到端集成,使用電影評論數據作為示例,展示如何通過自然語言查詢和分析數據,確保業務邏輯的一致性和減少 AI 幻覺。

  • 語義視圖將業務定義直接附加到數據層,確保 AI 和 BI 系統統一解釋信息
  • 通過 Cortex Analyst 進行自然語言查詢,降低 AI 幻覺風險
站內正文
政策

微軟利用AI在敲詐勒索訴訟中關聯兩個惡意軟件操作

微軟聯合國際執法機構,藉助AI分析封禁了與StealC和Amadey惡意軟件相關的200多個命令與控制服務器,並依據《反敲詐勒索及腐敗組織法》(RICO)提起民事訴訟。這是首次針對網絡犯罪供應鏈而非單一工具的法律行動。

  • 微軟使用Copilot等AI工具分析惡意軟件,將分析時間從數小時縮短至幾分鐘。
  • 發現StealC和Amadey共享同一基礎設施,促使微軟將其作為整體共謀起訴。
站內正文
研究

Superhuman 收購 AI 檢測初創公司 GPTZero,擁有 1900 萬以上用户和 3000 萬美元 ARR

GPTZero 被 Superhuman 收購,後者是 Grammarly 和 Superhuman Mail 的母公司。此次收購將把 GPTZero 的 AI 檢測功能整合到電子郵件和更多平台中,以在互聯網上維護人類真實性。

  • GPTZero 被 Superhuman 收購,用户超過 1900 萬,ARR 達 3000 萬美元。
  • 收購後,AI 檢測將直接集成到電子郵件收件箱中。
站內正文
模型

引用Tom MacWright:AI生成的求職材料導致“意外匿名”

Tom MacWright指出,越來越多求職者使用LLM生成的簡歷、作品集和GitHub項目,導致僱主無法瞭解申請者的真實能力與個性。

  • 求職材料中AI生成內容增多,簡歷、作品集、GitHub提交信息均由LLM代筆。
  • MacWright認為這種趨勢使得申請者變得“匿名”,僱主無法獲取其真實信息。
站內正文
其餘更新(20 條)
Agent

AI編碼代理需要基於證據的審查,而不僅僅是更便宜的路徑選擇

本文分析了AI輔助編碼中審查環節的成本,指出模型調用費用僅佔總成本的一小部分,真正的瓶頸在於人工審查和返工。通過對比路由、檢索增強生成、多模型協商和自動化測試等方法,本文提出了一個驗證層應當連接主張與證據、縮小審查範圍,並探討了額外驗證的經濟效益。

  • 生產力證據矛盾:AI可能增加而非減少審查負擔。
  • 模型調用優化上限低,審查時間削減能節省更多成本。
站內正文

大金應用美洲公司如何藉助Genie Code大規模構建一致的數據管道

大金應用美洲公司使用Databricks Genie Code重新設計其數據工程運營模型,採用MECE技能框架和勳章架構來確保一致性。這種AI輔助方法加快了管道開發速度,同時保持了治理和與業務概念的協調。

  • 使用MECE技能和勳章架構標準化管道開發。
  • Genie Code加速迭代並減少樣板代碼。
站內正文

Beyond推出人工智能收入管理工具

美國收入管理平台Beyond推出了一系列人工智能驅動的工具,旨在幫助自動化定價、優化房源列表並簡化運營。新工具包括Listing Lens(AI房源分析器)和MCP服務器測試版,使AI工具能直接連接Beyond的數據。此前推出的AI定價助手Neyoba已為超過15,000名房東和物業經理使用,節省了超過10萬小時的手動分析時間。

  • Beyond推出了新的AI收入管理工具套件
  • Listing Lens可分析Airbnb房源,提升可見性和預訂轉化率
站內正文

在野發現基於網頁的間接提示注入攻擊

Palo Alto Networks Unit 42報告了首次在野檢測到的間接提示注入(IDPI)攻擊,這些攻擊正在被積極武器化。攻擊者將隱藏指令嵌入網頁內容中,以操縱AI代理,包括一個AI廣告審核規避案例。文章基於大規模遙測數據提出了攻擊者意圖和載荷工程技術的分類。

  • 間接提示注入(IDPI)不再是理論上的威脅;在野攻擊已被觀測到。
  • 首個有記錄的AI廣告審核繞過案例,利用網頁中的隱藏提示。
站內正文

Loka 如何利用 Amazon Nova 2 Sonic 構建自然、低延遲的語音代理

Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理,通過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題,實現了低成本、高準確率的客户互動。

  • 傳統語音代理因三步處理流程(語音轉文本、LLM 處理、文本轉語音)導致 3-5 秒延遲,破壞對話自然性,增加成本。
  • Amazon Nova 2 Sonic 採用端到端語音處理,Big Bench Audio 得分 87.0,首次響應時間 1.39 秒,每小時成本約 0.27 美元。
站內正文

OpenClaw的ClawHub市場上的惡意AI“技能”繞過掃描器分發信息竊取軟件

Unit 42研究人員發現,在OpenClaw的ClawHub市場上,惡意行為者通過社交工程和混淆技術發佈看似合法的“技能”,誘使用户執行命令,從而部署AMOS和cluw等信息竊取軟件。該攻擊利用用户輔助執行繞過安全掃描器,對AI代理生態系統構成嚴重供應鏈威脅。

  • Unit 42在2026年2月至5月間發現針對OpenClaw AI代理生態系統的惡意技能活動。
  • 攻擊者通過ClawHub發佈如tradingview-ai-indicator-assistant等惡意技能,使用paste-site重定向誘騙用户執行base64編碼命令。
站內正文

如果答案已經存在於你的數據中呢?

Kythera Labs 在 Databricks 上構建了 AI 原生的醫療戰略平台,使任何醫療系統都能獲得專家級智能,通過 AI 代理以自然語言回答戰略問題,並提供了實際案例:路易斯安那州一家醫療系統在10天內上線,實現了患者就診可見性提高150%、漏診減少22%、年化價值380萬美元。

  • Kythera Labs 利用 Databricks 構建 AI 代理,將醫療數據分析專家經驗封裝,使醫療系統領導能用自然語言提問。
  • 該平台基於3390億醫療和處方索賠數據,重建患者就診旅程,提供可信答案。
站內正文

Figma 推出 AI 動效和着色器工具

Figma 在年度 Config 大會上發佈了多項設計及編碼產品更新,旨在藉助 AI 幫助創意人員將想法進一步推進並自動化繁瑣任務。重新構想的畫布針對全棧開發進行了優化,新增編碼層、AI 動效生成、着色器、Figma Weave 工作流、智能代理技能和生成式插件等功能。

  • 重新構想的畫布支持全棧開發,團隊、AI 代理、工具和材料整合在一處。
  • 編碼層允許直接在設計畫布上修改代碼。
站內正文

如何為AI Agent構建記憶系統

本文介紹了為AI Agent添加記憶功能的實用方法,包括短期記憶和長期記憶的概念、追蹤分析以及如何利用LangSmith工具實現記憶循環,從而讓Agent從以往交互中學習並改進行為。

  • 記憶讓Agent能記住用户偏好和修復過的錯誤,減少重複糾正。
  • 短期記憶用於當前任務,長期記憶持久化事實、偏好和技能。
站內正文
政策

科技巨頭在單一國會選區投入數百萬美元,這不會是最後一次

在紐約第12國會選區的民主黨初選中,支持與反對AI的團體共投入2400萬美元,成為該州歷史上最昂貴的同類競選之一。候選人格雷格·博雷斯因發起AI安全法案成為焦點,但鉅額支出的實際影響尚不明確。

  • 紐約第12國會選區的民主黨初選總花費超過2400萬美元,創下該州記錄。
  • 科技行業的政治行動委員會分別支持或反對候選人亞歷克斯·博雷斯的AI安全法案。
站內正文

Show HN:SparQ Pulse – 自託管的 GitHub 原生項目管理工具

SparQ Pulse 是一個完全開源的開發者體驗套件,專為 GitHub 原生團隊設計。它提供項目管理、異步站會、障礙跟蹤、團隊狀態、行動事項、聊天、文檔、考勤等功能,並支持可選 AI 集成。技術棧採用 Python、Flask 和 HTMX,可通過 Docker 輕鬆自託管,數據存儲支持 SQLite 或 PostgreSQL。該項目目前已在 GitHub 上獲得 12 顆星,採用 AGPL-3.0 許可證。

  • SparQ Pulse 是首個完全開源的、面向 GitHub 原生團隊的開發者體驗套件,包含 Pulse、Metrics 和 Knowledge 三個產品模塊。
  • 核心功能包括 GitHub 同步、異步站會(支持錄音與轉錄)、障礙看板、團隊狀態、行動事項(三級緊急度)、實時聊天、文檔管理、人員管理、考勤以及可選 AI 助手(OpenAI/Anthropic)。
站內正文

2700萬美元的AI代理人戰爭以平局告終:亞歷克斯·博雷斯失利

紐約州議員亞歷克斯·博雷斯在民主黨初選中以微弱差距輸給米卡·拉舍爾,標誌着由Anthropic和OpenAI代理的超級政治行動委員會之間耗資2700萬美元的代理人戰爭暫時平息。博雷斯因推動AI監管法案《RAISE法案》而成為焦點,但最終敗於地方政治支持和對手的資金優勢。

  • 博雷斯以35%對39.1%輸給拉舍爾,其他候選人得票率更低。
  • AI相關超級政治行動委員會總計投入2741萬美元,其中支持博雷斯的陣營花費1926萬美元,反對陣營花費815萬美元。
站內正文

醫療診斷AI可被誘騙泄露訓練數據中的患者身份

德國研究人員發現,醫療AI模型容易受到成員推理攻擊,可能暴露患者數據,尤其來自代表性不足羣體的患者。研究呼籲改進隱私標準和採用差分隱私技術。

  • 醫療AI的判別模型可被攻擊者利用,精準識別訓練數據中的患者。
  • 攻擊成功率幾乎完美,尤其針對少數羣體患者。
站內正文
機械人

這些必備智能家居設備超級實用——售價均低於25美元

從智能燈泡到家庭安防,亞馬遜Prime Day提供了大量必備智能家居設備的超值優惠。

  • 亞馬遜Prime Day正在進行中,智能家居設備折扣力度大。
  • 精選多款低於25美元的智能家居產品,包括智能插頭、門鈴、攝像頭等。
站內正文
工具

Meta發佈面向創作者的AI新應用

Facebook宣佈將Creator Studio工具重新設計為獨立AI伴侶應用,幫助創作者在社交網絡上擴大受眾。此舉旨在與TikTok和YouTube競爭,減少創作者對ChatGPT等第三方工具的依賴。

  • Meta推出AI伴侶應用,幫助創作者在Facebook上擴大受眾
  • 該應用重新設計了Creator Studio工具
站內正文
研究

Show HN:利用AI推薦您的產品或服務

一位開發者發現其產品在ChatGPT和Perplexity等AI平台上的推薦流量差異顯著,隨後開發了一款免費工具。該工具無需註冊即可掃描網站,模擬買家查詢,評估AI是否推薦您的產品,並與競爭對手對比,提供優化清單以提高AI推薦率。

  • 產品在AI聊天機器人中的推薦流量差異顯著,引發深入調查。
  • 開發了免費工具,無需註冊即可掃描網站並評估AI推薦情況。
站內正文
芯片

高通收購AI平台開發商Modular

此次收購擴大了這家芯片製造商從邊緣設備到數據中心的AI基礎設施野心。

  • 高通收購AI平台開發商Modular,拓展AI基礎設施業務
  • 此舉將高通的AI佈局從邊緣設備延伸至數據中心
站內正文
模型

思考即回憶:推理如何解鎖大語言模型中的參數化知識

Google Research 的研究揭示了一個反直覺的現象:即使對於簡單的事實性問題,讓大語言模型生成推理鏈也能提高答案的準確性。研究發現兩種機制:計算緩衝(生成額外標記用於潛在計算)和事實啓動(生成相關事實以幫助召回正確答案)。

  • 推理幫助模型召回原本無法獲取的簡單事實,即使無需逐步推理。
  • 機制一:計算緩衝——生成無意義的推理標記也提供額外計算,提升召回。
站內正文

使用NVIDIA NeMo AutoModel加速Transformer微調

NVIDIA NeMo AutoModel基於HuggingFace Transformers v5,通過專家並行、DeepEP融合通信和TransformerEngine內核,將MoE模型微調的訓練吞吐量提升3.4-3.7倍,GPU內存減少29-32%,且無需更改API。

  • NeMo AutoModel繼承AutoModelForCausalLM,僅需更改導入行即可實現性能提升。
  • 在550B規模模型上,專家並行使全微調在16節點H100集羣上可行,而Transformers v5因內存不足無法運行。
站內正文

n8n的LlamaParse平台節點:利用AI解析、分類、提取和檢索文檔

LlamaParse平台社區節點已發佈v5和v6版本,現為n8n官方驗證的社區節點。該節點整合了五個LlamaCloud資源(解析、分類、拆分、提取、檢索),支持作為AI Agent工具使用。v5重寫了基礎架構,v6將多個獨立節點整合為一個,並增加了索引管理功能。文章還提供了三種工作流示例:將檢索器作為Agent工具、構建分類-提取-驗證流水線、以及評估不同解析模式的輸出質量。

  • LlamaParse平台節點提供五個資源:解析、分類、拆分、提取和檢索,均支持作為n8n AI Agent的工具。
  • v5版本放棄了SDK,改用直接HTTP調用,並遷移提取功能至V2,支持可配置API基礎URL。