AI 日報 2026-06-25

今日必讀

Agent

如何設計一個OpenHarness風格的智能體運行時：包含工具、記憶、權限、技能和多智能體協調

2026-06-25 03:08 UTC+8

本教程從頭構建一個OpenHarness風格的智能體框架，涵蓋工具使用、權限控制、記憶、技能、上下文壓縮、重試邏輯、成本跟蹤和多智能體協調，所有代碼均可直接運行。

從零搭建智能體運行時，包含工具、記憶、權限、技能等核心組件。
理解完整控制流程：接收任務、模型決策、工具執行、觀察循環。

70%部署客服AI代理的企業在60天內看到投資回報

2026-06-25 02:52 UTC+8

根據Salesforce對3075名服務專業人士的調查，70%使用AI代理的服務組織在60天內報告了積極成果。AI代理在客服領域的採用率從2025年的39%增長到2026年的66%。新的基於成果的定價模式（按解決付費）將加速企業採用。

70%的客服AI代理部署在60天內看到投資回報
AI代理採用率從39%躍升至66%

處理視頻留存編輯的自主AI代理

2026-06-25 02:46 UTC+8

AutoEditor是一款AI視頻編輯器，旨在通過自動留存編輯來製作病毒式傳播的視頻。

AI驅動的視頻編輯，面向病毒內容
自主留存編輯

AI時代的Drudge Report：AI Titus新聞聚合站上線

2026-06-25 02:39 UTC+8

AI Titus新聞網站模仿Drudge Report風格，整合了AI領域的最新動態，包括Claude自主編寫代碼佔比達65%、Anthropic推出Slack原生'Claude Tag'功能、Sakana Fugu編排API、多個新模型發佈以及社區討論等。

Claude now writes 65% of its own code, Anthropic ships Slack-native 'Claude Tag' for async team delegation.
Sakana 'Fugu' orchestration APIs learn model selection and delegation across many models.

Show HN: Lelu – 基於置信度和提示注入的OpenAI代理門控

2026-06-25 02:39 UTC+8

Lelu 是一個開源授權引擎，用於AI代理的每一次操作，檢測提示注入、低置信度決策，並支持人工審核。它通過多層管道（包括置信度門控、策略評估和風險模型）確保安全，並提供OAuth令牌保險庫和NHI清單等功能。可自託管，集成主流AI框架。

提示注入檢測和置信度門控
多層安全管道：注入過濾、策略評估、風險模型

使用 Amazon Nova 2 Sonic 構建醫療預約語音助手

2026-06-25 02:20 UTC+8

本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手，用於處理醫療預約提醒對話。該助手能夠通過語音驗證患者身份、管理預約（確認、取消或改期）、收集就診前健康信息，並在必要時轉接人工客服。它可大規模處理常規電話，有助於降低失約率。示例聚焦於智能代理層面的語音對話與工具編排，並提供基於瀏覽器的測試界面。

使用 Amazon Nova 2 Sonic 的原生語音到語音模型，保留語氣等上下文信息。
通過 Amazon Bedrock AgentCore 實現無服務器運行時，集成七項醫療專用工具。

利用 Snowflake 和 Amazon QuickSight 實現 AI 驅動型商業智能

2026-06-25 02:19 UTC+8

本文介紹瞭如何構建 Snowflake 語義視圖與 Amazon QuickSight 之間的端到端集成，使用電影評論數據作為示例，展示如何通過自然語言查詢和分析數據，確保業務邏輯的一致性和減少 AI 幻覺。

語義視圖將業務定義直接附加到數據層，確保 AI 和 BI 系統統一解釋信息
通過 Cortex Analyst 進行自然語言查詢，降低 AI 幻覺風險

政策

微軟利用AI在敲詐勒索訴訟中關聯兩個惡意軟件操作

2026-06-25 02:57 UTC+8

微軟聯合國際執法機構，藉助AI分析封禁了與StealC和Amadey惡意軟件相關的200多個命令與控制服務器，並依據《反敲詐勒索及腐敗組織法》(RICO)提起民事訴訟。這是首次針對網絡犯罪供應鏈而非單一工具的法律行動。

微軟使用Copilot等AI工具分析惡意軟件，將分析時間從數小時縮短至幾分鐘。
發現StealC和Amadey共享同一基礎設施，促使微軟將其作為整體共謀起訴。

研究

Superhuman 收購 AI 檢測初創公司 GPTZero，擁有 1900 萬以上用户和 3000 萬美元 ARR

2026-06-25 02:56 UTC+8

GPTZero 被 Superhuman 收購，後者是 Grammarly 和 Superhuman Mail 的母公司。此次收購將把 GPTZero 的 AI 檢測功能整合到電子郵件和更多平台中，以在互聯網上維護人類真實性。

GPTZero 被 Superhuman 收購，用户超過 1900 萬，ARR 達 3000 萬美元。
收購後，AI 檢測將直接集成到電子郵件收件箱中。

模型

引用Tom MacWright：AI生成的求職材料導致“意外匿名”

2026-06-25 02:13 UTC+8

Tom MacWright指出，越來越多求職者使用LLM生成的簡歷、作品集和GitHub項目，導致僱主無法瞭解申請者的真實能力與個性。

求職材料中AI生成內容增多，簡歷、作品集、GitHub提交信息均由LLM代筆。
MacWright認為這種趨勢使得申請者變得“匿名”，僱主無法獲取其真實信息。

其餘更新（20 條）

Agent

AI編碼代理需要基於證據的審查，而不僅僅是更便宜的路徑選擇

2026-06-25 02:06 UTC+8

本文分析了AI輔助編碼中審查環節的成本，指出模型調用費用僅佔總成本的一小部分，真正的瓶頸在於人工審查和返工。通過對比路由、檢索增強生成、多模型協商和自動化測試等方法，本文提出了一個驗證層應當連接主張與證據、縮小審查範圍，並探討了額外驗證的經濟效益。

生產力證據矛盾：AI可能增加而非減少審查負擔。
模型調用優化上限低，審查時間削減能節省更多成本。

大金應用美洲公司如何藉助Genie Code大規模構建一致的數據管道

2026-06-25 02:00 UTC+8

大金應用美洲公司使用Databricks Genie Code重新設計其數據工程運營模型，採用MECE技能框架和勳章架構來確保一致性。這種AI輔助方法加快了管道開發速度，同時保持了治理和與業務概念的協調。

使用MECE技能和勳章架構標準化管道開發。
Genie Code加速迭代並減少樣板代碼。

Beyond推出人工智能收入管理工具

2026-06-25 01:56 UTC+8

美國收入管理平台Beyond推出了一系列人工智能驅動的工具，旨在幫助自動化定價、優化房源列表並簡化運營。新工具包括Listing Lens（AI房源分析器）和MCP服務器測試版，使AI工具能直接連接Beyond的數據。此前推出的AI定價助手Neyoba已為超過15,000名房東和物業經理使用，節省了超過10萬小時的手動分析時間。

Beyond推出了新的AI收入管理工具套件
Listing Lens可分析Airbnb房源，提升可見性和預訂轉化率

在野發現基於網頁的間接提示注入攻擊

2026-06-25 01:00 UTC+8

Palo Alto Networks Unit 42報告了首次在野檢測到的間接提示注入（IDPI）攻擊，這些攻擊正在被積極武器化。攻擊者將隱藏指令嵌入網頁內容中，以操縱AI代理，包括一個AI廣告審核規避案例。文章基於大規模遙測數據提出了攻擊者意圖和載荷工程技術的分類。

間接提示注入（IDPI）不再是理論上的威脅；在野攻擊已被觀測到。
首個有記錄的AI廣告審核繞過案例，利用網頁中的隱藏提示。

Loka 如何利用 Amazon Nova 2 Sonic 構建自然、低延遲的語音代理

2026-06-25 00:56 UTC+8

Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理，通過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題，實現了低成本、高準確率的客户互動。

傳統語音代理因三步處理流程（語音轉文本、LLM 處理、文本轉語音）導致 3-5 秒延遲，破壞對話自然性，增加成本。
Amazon Nova 2 Sonic 採用端到端語音處理，Big Bench Audio 得分 87.0，首次響應時間 1.39 秒，每小時成本約 0.27 美元。

OpenClaw的ClawHub市場上的惡意AI“技能”繞過掃描器分發信息竊取軟件

2026-06-25 00:52 UTC+8

Unit 42研究人員發現，在OpenClaw的ClawHub市場上，惡意行為者通過社交工程和混淆技術發佈看似合法的“技能”，誘使用户執行命令，從而部署AMOS和cluw等信息竊取軟件。該攻擊利用用户輔助執行繞過安全掃描器，對AI代理生態系統構成嚴重供應鏈威脅。

Unit 42在2026年2月至5月間發現針對OpenClaw AI代理生態系統的惡意技能活動。
攻擊者通過ClawHub發佈如tradingview-ai-indicator-assistant等惡意技能，使用paste-site重定向誘騙用户執行base64編碼命令。

如果答案已經存在於你的數據中呢？

2026-06-25 00:45 UTC+8

Kythera Labs 在 Databricks 上構建了 AI 原生的醫療戰略平台，使任何醫療系統都能獲得專家級智能，通過 AI 代理以自然語言回答戰略問題，並提供了實際案例：路易斯安那州一家醫療系統在10天內上線，實現了患者就診可見性提高150%、漏診減少22%、年化價值380萬美元。

Kythera Labs 利用 Databricks 構建 AI 代理，將醫療數據分析專家經驗封裝，使醫療系統領導能用自然語言提問。
該平台基於3390億醫療和處方索賠數據，重建患者就診旅程，提供可信答案。

Figma 推出 AI 動效和着色器工具

2026-06-25 00:15 UTC+8

Figma 在年度 Config 大會上發佈了多項設計及編碼產品更新，旨在藉助 AI 幫助創意人員將想法進一步推進並自動化繁瑣任務。重新構想的畫布針對全棧開發進行了優化，新增編碼層、AI 動效生成、着色器、Figma Weave 工作流、智能代理技能和生成式插件等功能。

重新構想的畫布支持全棧開發，團隊、AI 代理、工具和材料整合在一處。
編碼層允許直接在設計畫布上修改代碼。

如何為AI Agent構建記憶系統

2026-06-25 00:11 UTC+8

本文介紹了為AI Agent添加記憶功能的實用方法，包括短期記憶和長期記憶的概念、追蹤分析以及如何利用LangSmith工具實現記憶循環，從而讓Agent從以往交互中學習並改進行為。

記憶讓Agent能記住用户偏好和修復過的錯誤，減少重複糾正。
短期記憶用於當前任務，長期記憶持久化事實、偏好和技能。

政策

科技巨頭在單一國會選區投入數百萬美元，這不會是最後一次

2026-06-25 01:55 UTC+8

在紐約第12國會選區的民主黨初選中，支持與反對AI的團體共投入2400萬美元，成為該州歷史上最昂貴的同類競選之一。候選人格雷格·博雷斯因發起AI安全法案成為焦點，但鉅額支出的實際影響尚不明確。

紐約第12國會選區的民主黨初選總花費超過2400萬美元，創下該州記錄。
科技行業的政治行動委員會分別支持或反對候選人亞歷克斯·博雷斯的AI安全法案。

Show HN：SparQ Pulse – 自託管的 GitHub 原生項目管理工具

2026-06-25 01:53 UTC+8

SparQ Pulse 是一個完全開源的開發者體驗套件，專為 GitHub 原生團隊設計。它提供項目管理、異步站會、障礙跟蹤、團隊狀態、行動事項、聊天、文檔、考勤等功能，並支持可選 AI 集成。技術棧採用 Python、Flask 和 HTMX，可通過 Docker 輕鬆自託管，數據存儲支持 SQLite 或 PostgreSQL。該項目目前已在 GitHub 上獲得 12 顆星，採用 AGPL-3.0 許可證。

SparQ Pulse 是首個完全開源的、面向 GitHub 原生團隊的開發者體驗套件，包含 Pulse、Metrics 和 Knowledge 三個產品模塊。
核心功能包括 GitHub 同步、異步站會（支持錄音與轉錄）、障礙看板、團隊狀態、行動事項（三級緊急度）、實時聊天、文檔管理、人員管理、考勤以及可選 AI 助手（OpenAI/Anthropic）。

2700萬美元的AI代理人戰爭以平局告終：亞歷克斯·博雷斯失利

2026-06-25 01:25 UTC+8

紐約州議員亞歷克斯·博雷斯在民主黨初選中以微弱差距輸給米卡·拉舍爾，標誌着由Anthropic和OpenAI代理的超級政治行動委員會之間耗資2700萬美元的代理人戰爭暫時平息。博雷斯因推動AI監管法案《RAISE法案》而成為焦點，但最終敗於地方政治支持和對手的資金優勢。

博雷斯以35%對39.1%輸給拉舍爾，其他候選人得票率更低。
AI相關超級政治行動委員會總計投入2741萬美元，其中支持博雷斯的陣營花費1926萬美元，反對陣營花費815萬美元。

醫療診斷AI可被誘騙泄露訓練數據中的患者身份

2026-06-25 00:46 UTC+8

德國研究人員發現，醫療AI模型容易受到成員推理攻擊，可能暴露患者數據，尤其來自代表性不足羣體的患者。研究呼籲改進隱私標準和採用差分隱私技術。

醫療AI的判別模型可被攻擊者利用，精準識別訓練數據中的患者。
攻擊成功率幾乎完美，尤其針對少數羣體患者。

機械人

這些必備智能家居設備超級實用——售價均低於25美元

2026-06-25 01:49 UTC+8

從智能燈泡到家庭安防，亞馬遜Prime Day提供了大量必備智能家居設備的超值優惠。

亞馬遜Prime Day正在進行中，智能家居設備折扣力度大。
精選多款低於25美元的智能家居產品，包括智能插頭、門鈴、攝像頭等。

工具

Meta發佈面向創作者的AI新應用

2026-06-25 01:48 UTC+8

Facebook宣佈將Creator Studio工具重新設計為獨立AI伴侶應用，幫助創作者在社交網絡上擴大受眾。此舉旨在與TikTok和YouTube競爭，減少創作者對ChatGPT等第三方工具的依賴。

Meta推出AI伴侶應用，幫助創作者在Facebook上擴大受眾
該應用重新設計了Creator Studio工具

研究

Show HN：利用AI推薦您的產品或服務

2026-06-25 01:47 UTC+8

一位開發者發現其產品在ChatGPT和Perplexity等AI平台上的推薦流量差異顯著，隨後開發了一款免費工具。該工具無需註冊即可掃描網站，模擬買家查詢，評估AI是否推薦您的產品，並與競爭對手對比，提供優化清單以提高AI推薦率。

產品在AI聊天機器人中的推薦流量差異顯著，引發深入調查。
開發了免費工具，無需註冊即可掃描網站並評估AI推薦情況。

芯片

高通收購AI平台開發商Modular

2026-06-25 01:25 UTC+8

此次收購擴大了這家芯片製造商從邊緣設備到數據中心的AI基礎設施野心。

高通收購AI平台開發商Modular，拓展AI基礎設施業務
此舉將高通的AI佈局從邊緣設備延伸至數據中心

模型

思考即回憶：推理如何解鎖大語言模型中的參數化知識

2026-06-25 00:51 UTC+8

Google Research 的研究揭示了一個反直覺的現象：即使對於簡單的事實性問題，讓大語言模型生成推理鏈也能提高答案的準確性。研究發現兩種機制：計算緩衝（生成額外標記用於潛在計算）和事實啓動（生成相關事實以幫助召回正確答案）。

推理幫助模型召回原本無法獲取的簡單事實，即使無需逐步推理。
機制一：計算緩衝——生成無意義的推理標記也提供額外計算，提升召回。

使用NVIDIA NeMo AutoModel加速Transformer微調

2026-06-25 00:00 UTC+8

NVIDIA NeMo AutoModel基於HuggingFace Transformers v5，通過專家並行、DeepEP融合通信和TransformerEngine內核，將MoE模型微調的訓練吞吐量提升3.4-3.7倍，GPU內存減少29-32%，且無需更改API。

NeMo AutoModel繼承AutoModelForCausalLM，僅需更改導入行即可實現性能提升。
在550B規模模型上，專家並行使全微調在16節點H100集羣上可行，而Transformers v5因內存不足無法運行。

n8n的LlamaParse平台節點：利用AI解析、分類、提取和檢索文檔

2026-06-25 00:08 UTC+8

LlamaParse平台社區節點已發佈v5和v6版本，現為n8n官方驗證的社區節點。該節點整合了五個LlamaCloud資源（解析、分類、拆分、提取、檢索），支持作為AI Agent工具使用。v5重寫了基礎架構，v6將多個獨立節點整合為一個，並增加了索引管理功能。文章還提供了三種工作流示例：將檢索器作為Agent工具、構建分類-提取-驗證流水線、以及評估不同解析模式的輸出質量。

LlamaParse平台節點提供五個資源：解析、分類、拆分、提取和檢索，均支持作為n8n AI Agent的工具。
v5版本放棄了SDK，改用直接HTTP調用，並遷移提取功能至V2，支持可配置API基礎URL。