如何設計一個OpenHarness風格的智慧體執行時:包含工具、記憶、許可權、技能和多智慧體協調
本教程從頭構建一個OpenHarness風格的智慧體框架,涵蓋工具使用、許可權控制、記憶、技能、上下文壓縮、重試邏輯、成本跟蹤和多智慧體協調,所有程式碼均可直接執行。
- 從零搭建智慧體執行時,包含工具、記憶、許可權、技能等核心元件。
- 理解完整控制流程:接收任務、模型決策、工具執行、觀察迴圈。
日報
2026-06-25 精選 10 條,按主題聚合。其餘新聞折疊歸檔。
本教程從頭構建一個OpenHarness風格的智慧體框架,涵蓋工具使用、許可權控制、記憶、技能、上下文壓縮、重試邏輯、成本跟蹤和多智慧體協調,所有程式碼均可直接執行。
根據Salesforce對3075名服務專業人士的調查,70%使用AI代理的服務組織在60天內報告了積極成果。AI代理在客服領域的採用率從2025年的39%增長到2026年的66%。新的基於成果的定價模式(按解決付費)將加速企業採用。
AutoEditor是一款AI影片編輯器,旨在透過自動留存編輯來製作病毒式傳播的影片。
AI Titus新聞網站模仿Drudge Report風格,整合了AI領域的最新動態,包括Claude自主編寫程式碼佔比達65%、Anthropic推出Slack原生'Claude Tag'功能、Sakana Fugu編排API、多個新模型釋出以及社群討論等。
Lelu 是一個開源授權引擎,用於AI代理的每一次操作,檢測提示注入、低置信度決策,並支援人工稽核。它透過多層管道(包括置信度門控、策略評估和風險模型)確保安全,並提供OAuth令牌保險庫和NHI清單等功能。可自託管,整合主流AI框架。
本文介紹如何利用 Amazon Nova 2 Sonic 和 Amazon Bedrock AgentCore 構建一個語音助手,用於處理醫療預約提醒對話。該助手能夠透過語音驗證患者身份、管理預約(確認、取消或改期)、收集就診前健康資訊,並在必要時轉接人工客服。它可大規模處理常規電話,有助於降低失約率。示例聚焦於智慧代理層面的語音對話與工具編排,並提供基於瀏覽器的測試介面。
本文介紹瞭如何構建 Snowflake 語義檢視與 Amazon QuickSight 之間的端到端整合,使用電影評論資料作為示例,展示如何透過自然語言查詢和分析資料,確保業務邏輯的一致性和減少 AI 幻覺。
微軟聯合國際執法機構,藉助AI分析封禁了與StealC和Amadey惡意軟體相關的200多個命令與控制伺服器,並依據《反敲詐勒索及腐敗組織法》(RICO)提起民事訴訟。這是首次針對網路犯罪供應鏈而非單一工具的法律行動。
GPTZero 被 Superhuman 收購,後者是 Grammarly 和 Superhuman Mail 的母公司。此次收購將把 GPTZero 的 AI 檢測功能整合到電子郵件和更多平臺中,以在網際網路上維護人類真實性。
Tom MacWright指出,越來越多求職者使用LLM生成的簡歷、作品集和GitHub專案,導致僱主無法瞭解申請者的真實能力與個性。
本文分析了AI輔助編碼中審查環節的成本,指出模型呼叫費用僅佔總成本的一小部分,真正的瓶頸在於人工審查和返工。透過對比路由、檢索增強生成、多模型協商和自動化測試等方法,本文提出了一個驗證層應當連線主張與證據、縮小審查範圍,並探討了額外驗證的經濟效益。
大金應用美洲公司使用Databricks Genie Code重新設計其資料工程運營模型,採用MECE技能框架和勳章架構來確保一致性。這種AI輔助方法加快了管道開發速度,同時保持了治理和與業務概念的協調。
美國收入管理平臺Beyond推出了一系列人工智慧驅動的工具,旨在幫助自動化定價、最佳化房源列表並簡化運營。新工具包括Listing Lens(AI房源分析器)和MCP伺服器測試版,使AI工具能直接連線Beyond的資料。此前推出的AI定價助手Neyoba已為超過15,000名房東和物業經理使用,節省了超過10萬小時的手動分析時間。
Palo Alto Networks Unit 42報告了首次在野檢測到的間接提示注入(IDPI)攻擊,這些攻擊正在被積極武器化。攻擊者將隱藏指令嵌入網頁內容中,以操縱AI代理,包括一個AI廣告稽核規避案例。文章基於大規模遙測資料提出了攻擊者意圖和載荷工程技術的分類。
Loka 使用 Amazon Nova 2 Sonic 構建了對話式 AI 代理,透過原生語音到語音模型解決了傳統語音助手延遲高、不自然的問題,實現了低成本、高準確率的客戶互動。
Unit 42研究人員發現,在OpenClaw的ClawHub市場上,惡意行為者透過社交工程和混淆技術釋出看似合法的“技能”,誘使使用者執行命令,從而部署AMOS和cluw等資訊竊取軟體。該攻擊利用使用者輔助執行繞過安全掃描器,對AI代理生態系統構成嚴重供應鏈威脅。
Kythera Labs 在 Databricks 上構建了 AI 原生的醫療戰略平臺,使任何醫療系統都能獲得專家級智慧,透過 AI 代理以自然語言回答戰略問題,並提供了實際案例:路易斯安那州一家醫療系統在10天內上線,實現了患者就診可見性提高150%、漏診減少22%、年化價值380萬美元。
Figma 在年度 Config 大會上釋出了多項設計及編碼產品更新,旨在藉助 AI 幫助創意人員將想法進一步推進並自動化繁瑣任務。重新構想的畫布針對全棧開發進行了最佳化,新增編碼層、AI 動效生成、著色器、Figma Weave 工作流、智慧代理技能和生成式外掛等功能。
本文介紹了為AI Agent新增記憶功能的實用方法,包括短期記憶和長期記憶的概念、追蹤分析以及如何利用LangSmith工具實現記憶迴圈,從而讓Agent從以往互動中學習並改進行為。
在紐約第12國會選區的民主黨初選中,支援與反對AI的團體共投入2400萬美元,成為該州歷史上最昂貴的同類競選之一。候選人格雷格·博雷斯因發起AI安全法案成為焦點,但鉅額支出的實際影響尚不明確。
SparQ Pulse 是一個完全開源的開發者體驗套件,專為 GitHub 原生團隊設計。它提供專案管理、非同步站會、障礙跟蹤、團隊狀態、行動事項、聊天、文件、考勤等功能,並支援可選 AI 整合。技術棧採用 Python、Flask 和 HTMX,可透過 Docker 輕鬆自託管,資料儲存支援 SQLite 或 PostgreSQL。該專案目前已在 GitHub 上獲得 12 顆星,採用 AGPL-3.0 許可證。
紐約州議員亞歷克斯·博雷斯在民主黨初選中以微弱差距輸給米卡·拉舍爾,標誌著由Anthropic和OpenAI代理的超級政治行動委員會之間耗資2700萬美元的代理人戰爭暫時平息。博雷斯因推動AI監管法案《RAISE法案》而成為焦點,但最終敗於地方政治支援和對手的資金優勢。
德國研究人員發現,醫療AI模型容易受到成員推理攻擊,可能暴露患者資料,尤其來自代表性不足群體的患者。研究呼籲改進隱私標準和採用差分隱私技術。
從智慧燈泡到家庭安防,亞馬遜Prime Day提供了大量必備智慧家居裝置的超值優惠。
Facebook宣佈將Creator Studio工具重新設計為獨立AI伴侶應用,幫助創作者在社交網路上擴大受眾。此舉旨在與TikTok和YouTube競爭,減少創作者對ChatGPT等第三方工具的依賴。
一位開發者發現其產品在ChatGPT和Perplexity等AI平臺上的推薦流量差異顯著,隨後開發了一款免費工具。該工具無需註冊即可掃描網站,模擬買家查詢,評估AI是否推薦您的產品,並與競爭對手對比,提供最佳化清單以提高AI推薦率。
此次收購擴大了這家晶片製造商從邊緣裝置到資料中心的AI基礎設施野心。
Google Research 的研究揭示了一個反直覺的現象:即使對於簡單的事實性問題,讓大語言模型生成推理鏈也能提高答案的準確性。研究發現兩種機制:計算緩衝(生成額外標記用於潛在計算)和事實啟動(生成相關事實以幫助召回正確答案)。
NVIDIA NeMo AutoModel基於HuggingFace Transformers v5,透過專家並行、DeepEP融合通訊和TransformerEngine核心,將MoE模型微調的訓練吞吐量提升3.4-3.7倍,GPU記憶體減少29-32%,且無需更改API。
LlamaParse平臺社群節點已釋出v5和v6版本,現為n8n官方驗證的社群節點。該節點整合了五個LlamaCloud資源(解析、分類、拆分、提取、檢索),支援作為AI Agent工具使用。v5重寫了基礎架構,v6將多個獨立節點整合為一個,並增加了索引管理功能。文章還提供了三種工作流示例:將檢索器作為Agent工具、構建分類-提取-驗證流水線、以及評估不同解析模式的輸出質量。