如何設計一個OpenHarness風格的智能體運行時:包含工具、記憶、權限、技能和多智能體協調
本教程從頭構建一個OpenHarness風格的智能體框架,涵蓋工具使用、權限控制、記憶、技能、上下文壓縮、重試邏輯、成本跟蹤和多智能體協調,所有代碼均可直接運行。
- 從零搭建智能體運行時,包含工具、記憶、權限、技能等核心組件。
- 理解完整控制流程:接收任務、模型決策、工具執行、觀察循環。
日報
2026-06-25 精選 10 條,按主題聚合。其餘新聞摺疊歸檔。
本教程從頭構建一個OpenHarness風格的智能體框架,涵蓋工具使用、權限控制、記憶、技能、上下文壓縮、重試邏輯、成本跟蹤和多智能體協調,所有代碼均可直接運行。
根據Salesforce對3075名服務專業人士的調查,70%使用AI代理的服務組織在60天內報告了積極成果。AI代理在客服領域的採用率從2025年的39%增長到2026年的66%。新的基於成果的定價模式(按解決付費)將加速企業採用。
AutoEditor是一款AI視頻編輯器,旨在通過自動留存編輯來製作病毒式傳播的視頻。
AI Titus新聞網站模仿Drudge Report風格,整合了AI領域的最新動態,包括Claude自主編寫代碼佔比達65%、Anthropic推出Slack原生'Claude Tag'功能、Sakana Fugu編排API、多個新模型發佈以及社區討論等。
Lelu 是一個開源授權引擎,用於AI代理的每一次操作,檢測提示注入、低置信度決策,並支持人工審核。它通過多層管道(包括置信度門控、策略評估和風險模型)確保安全,並提供OAuth令牌保險庫和NHI清單等功能。可自託管,集成主流AI框架。
本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手,用於處理醫療預約提醒對話。該助手能夠通過語音驗證患者身份、管理預約(確認、取消或改期)、收集就診前健康信息,並在必要時轉接人工客服。它可大規模處理常規電話,有助於降低失約率。示例聚焦於智能代理層面的語音對話與工具編排,並提供基於瀏覽器的測試界面。
本文介紹瞭如何構建 Snowflake 語義視圖與 Amazon QuickSight 之間的端到端集成,使用電影評論數據作為示例,展示如何通過自然語言查詢和分析數據,確保業務邏輯的一致性和減少 AI 幻覺。
微軟聯合國際執法機構,藉助AI分析封禁了與StealC和Amadey惡意軟件相關的200多個命令與控制服務器,並依據《反敲詐勒索及腐敗組織法》(RICO)提起民事訴訟。這是首次針對網絡犯罪供應鏈而非單一工具的法律行動。
GPTZero 被 Superhuman 收購,後者是 Grammarly 和 Superhuman Mail 的母公司。此次收購將把 GPTZero 的 AI 檢測功能整合到電子郵件和更多平台中,以在互聯網上維護人類真實性。
Tom MacWright指出,越來越多求職者使用LLM生成的簡歷、作品集和GitHub項目,導致僱主無法瞭解申請者的真實能力與個性。
本文分析了AI輔助編碼中審查環節的成本,指出模型調用費用僅佔總成本的一小部分,真正的瓶頸在於人工審查和返工。通過對比路由、檢索增強生成、多模型協商和自動化測試等方法,本文提出了一個驗證層應當連接主張與證據、縮小審查範圍,並探討了額外驗證的經濟效益。
大金應用美洲公司使用Databricks Genie Code重新設計其數據工程運營模型,採用MECE技能框架和勳章架構來確保一致性。這種AI輔助方法加快了管道開發速度,同時保持了治理和與業務概念的協調。
美國收入管理平台Beyond推出了一系列人工智能驅動的工具,旨在幫助自動化定價、優化房源列表並簡化運營。新工具包括Listing Lens(AI房源分析器)和MCP服務器測試版,使AI工具能直接連接Beyond的數據。此前推出的AI定價助手Neyoba已為超過15,000名房東和物業經理使用,節省了超過10萬小時的手動分析時間。
Palo Alto Networks Unit 42報告了首次在野檢測到的間接提示注入(IDPI)攻擊,這些攻擊正在被積極武器化。攻擊者將隱藏指令嵌入網頁內容中,以操縱AI代理,包括一個AI廣告審核規避案例。文章基於大規模遙測數據提出了攻擊者意圖和載荷工程技術的分類。
Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理,通過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題,實現了低成本、高準確率的客户互動。
Unit 42研究人員發現,在OpenClaw的ClawHub市場上,惡意行為者通過社交工程和混淆技術發佈看似合法的“技能”,誘使用户執行命令,從而部署AMOS和cluw等信息竊取軟件。該攻擊利用用户輔助執行繞過安全掃描器,對AI代理生態系統構成嚴重供應鏈威脅。
Kythera Labs 在 Databricks 上構建了 AI 原生的醫療戰略平台,使任何醫療系統都能獲得專家級智能,通過 AI 代理以自然語言回答戰略問題,並提供了實際案例:路易斯安那州一家醫療系統在10天內上線,實現了患者就診可見性提高150%、漏診減少22%、年化價值380萬美元。
Figma 在年度 Config 大會上發佈了多項設計及編碼產品更新,旨在藉助 AI 幫助創意人員將想法進一步推進並自動化繁瑣任務。重新構想的畫布針對全棧開發進行了優化,新增編碼層、AI 動效生成、着色器、Figma Weave 工作流、智能代理技能和生成式插件等功能。
本文介紹了為AI Agent添加記憶功能的實用方法,包括短期記憶和長期記憶的概念、追蹤分析以及如何利用LangSmith工具實現記憶循環,從而讓Agent從以往交互中學習並改進行為。
在紐約第12國會選區的民主黨初選中,支持與反對AI的團體共投入2400萬美元,成為該州歷史上最昂貴的同類競選之一。候選人格雷格·博雷斯因發起AI安全法案成為焦點,但鉅額支出的實際影響尚不明確。
SparQ Pulse 是一個完全開源的開發者體驗套件,專為 GitHub 原生團隊設計。它提供項目管理、異步站會、障礙跟蹤、團隊狀態、行動事項、聊天、文檔、考勤等功能,並支持可選 AI 集成。技術棧採用 Python、Flask 和 HTMX,可通過 Docker 輕鬆自託管,數據存儲支持 SQLite 或 PostgreSQL。該項目目前已在 GitHub 上獲得 12 顆星,採用 AGPL-3.0 許可證。
紐約州議員亞歷克斯·博雷斯在民主黨初選中以微弱差距輸給米卡·拉舍爾,標誌着由Anthropic和OpenAI代理的超級政治行動委員會之間耗資2700萬美元的代理人戰爭暫時平息。博雷斯因推動AI監管法案《RAISE法案》而成為焦點,但最終敗於地方政治支持和對手的資金優勢。
德國研究人員發現,醫療AI模型容易受到成員推理攻擊,可能暴露患者數據,尤其來自代表性不足羣體的患者。研究呼籲改進隱私標準和採用差分隱私技術。
從智能燈泡到家庭安防,亞馬遜Prime Day提供了大量必備智能家居設備的超值優惠。
Facebook宣佈將Creator Studio工具重新設計為獨立AI伴侶應用,幫助創作者在社交網絡上擴大受眾。此舉旨在與TikTok和YouTube競爭,減少創作者對ChatGPT等第三方工具的依賴。
一位開發者發現其產品在ChatGPT和Perplexity等AI平台上的推薦流量差異顯著,隨後開發了一款免費工具。該工具無需註冊即可掃描網站,模擬買家查詢,評估AI是否推薦您的產品,並與競爭對手對比,提供優化清單以提高AI推薦率。
此次收購擴大了這家芯片製造商從邊緣設備到數據中心的AI基礎設施野心。
Google Research 的研究揭示了一個反直覺的現象:即使對於簡單的事實性問題,讓大語言模型生成推理鏈也能提高答案的準確性。研究發現兩種機制:計算緩衝(生成額外標記用於潛在計算)和事實啓動(生成相關事實以幫助召回正確答案)。
NVIDIA NeMo AutoModel基於HuggingFace Transformers v5,通過專家並行、DeepEP融合通信和TransformerEngine內核,將MoE模型微調的訓練吞吐量提升3.4-3.7倍,GPU內存減少29-32%,且無需更改API。
LlamaParse平台社區節點已發佈v5和v6版本,現為n8n官方驗證的社區節點。該節點整合了五個LlamaCloud資源(解析、分類、拆分、提取、檢索),支持作為AI Agent工具使用。v5重寫了基礎架構,v6將多個獨立節點整合為一個,並增加了索引管理功能。文章還提供了三種工作流示例:將檢索器作為Agent工具、構建分類-提取-驗證流水線、以及評估不同解析模式的輸出質量。