Box AI如何藉助Deep Agents構建企業內容代理
Box AI基於Deep Agents構建了Box Agent,支援跨企業內容庫搜尋、分析和綜合,同時保留安全性和許可權模型。採用父/子代理架構,動態生成子代理處理複雜任務,並透過中介軟體實現引用生成、快取和上下文管理。
- Box Agent從單檔案問答演進到企業級多文件分析。
- 採用Deep Agents實現模型無關性和快速迭代。
長尾標籤
追蹤 Agent 框架、編排、記憶、評測、工作流程自動化和生產部署。
Box AI基於Deep Agents構建了Box Agent,支援跨企業內容庫搜尋、分析和綜合,同時保留安全性和許可權模型。採用父/子代理架構,動態生成子代理處理複雜任務,並透過中介軟體實現引用生成、快取和上下文管理。
瞭解如何為AI代理選擇安全的沙箱,包括檔案系統隔離、網路訪問控制、資源限制和微虛擬機器等方面的指導。
OpenAI宣佈收購Ona,這是一家提供雲沙箱平臺管理長時間執行AI代理的初創公司。Ona的技術使AI代理能在開發者關機後繼續工作,並增強安全性。OpenAI將利用該技術改進其Codex AI助手,提升其執行長時間任務的能力。交易條款未披露。
Benchling,一家生命科學研發資料平臺,在2025年10月推出了Benchling AI,包含一個由智慧體支援的聊天介面。其AI主管Nicholas Larus-Stone與LangChain CEO Harrison Chase討論了構建科學工作智慧體的複雜性,包括使用多模型架構、生產追蹤審查以及可驗證科學任務的策略。
Agent-EvalKit 是一個開源工具包 (Apache 2.0),透過整合 AI 編碼助手(包括 Claude Code、Kiro CLI 和 Kilo Code)來提供評估基礎設施。本文介紹了 Agent-EvalKit 的六個評估階段,並以使用 Strands Agents SDK 和 Amazon Bedrock 構建的旅行研究代理為例進行說明。
SmithDB支援對代理追蹤進行全文搜尋和JSON過濾,中位延遲僅為400毫秒,儘管底層資料是儲存在物件儲存中的大型巢狀JSON文件。本文詳細介紹了為物件儲存和大型代理追蹤負載量身定製的倒排索引設計,包括面臨的獨特挑戰(大型負載、Zipfian分佈、多種查詢模式、物件儲存約束)、為何不採用Tantivy,以及兩次設計迭代的經驗教訓。
大多數AI代理工具執行在伺服器上,限制了瀏覽器API、裝置功能和前端狀態的訪問。瞭解LangChain的無頭工具如何為現代代理應用啟用安全的客戶端工具執行。
本教程介紹如何使用Amazon Bedrock AgentCore構建AI驅動的裝置維修助手,幫助農民和現場技術人員透過自然語言診斷裝置問題、識別所需零件並獲取製造商批准的維修流程。解決方案採用AgentCore Runtime與Strands Agents SDK、Amazon Nova 2 Lite基礎模型、Amazon Bedrock Knowledge Base進行檢索增強生成(RAG),以及AgentCore Memory實現對話持久化。
本文展示了一種擴音式首次損失通知(FNOL)錄入系統,該系統結合了基於Strands Agents SDK構建的領域推理智慧體與Amazon Bedrock AgentCore Browser Tool的即時門戶互動,在保留人類專業知識的同時消除了重複的螢幕操作。
史蒂夫·耶格擁有四十年程式設計經驗,曾在亞馬遜和谷歌任職近二十年,以技術文集和行業洞察聞名。目前他專注於多智慧體與編排系統的未來探索,運營Gas Town、Beads和Gas City等專案,並提供AI轉型諮詢。
OxyJen是一個開源的Java框架,用於編排LLM工作負載,提供圖形風格執行、上下文感知記憶體和確定性重試/回退。它專為Java企業環境設計,旨在提供可靠的生產級AI管道執行引擎。
本文提出VoLoAgent,一種利用視覺語言模型(VLM)編排多種機器人能力的系統,用於開放詞彙長程操控任務。該系統將機器人動作視為可中斷的工具,實現即時規劃、監控和故障恢復。同時引入RoboVoLo基準測試,實驗表明VoLoAgent顯著優於單一VLA/VLM或基於工具的系統。
瞭解如何使用LangChain、AssemblyAI和OpenAI構建一個即時AI語音緊急求助熱線代理。該代理能夠傾聽呼叫者的語音求助,即時評估情況,派遣合適的緊急服務,並安撫呼叫者——無需任何打字或選單操作。文章詳細介紹了三階段流水線(語音轉文字、智慧體推理、文字轉語音)以及關鍵程式碼實現。
Multica 是一個開源平臺,將程式設計智慧體轉變為真正的團隊成員。您可以分配任務、跟蹤進度、積累技能,在同一個地方管理人類與智慧體員工隊伍。
terradev-cli 是一個用於編排 AI 工作負載的命令列介面,可在 PyPI 上獲取。
AI代理執行程式碼需要安全的隔離環境。LangSmith Sandboxes透過硬體虛擬化的微VM為每個代理提供獨立的計算機,支援快速啟動、持久狀態和批次擴充套件,適用於程式碼生成、資料分析、CI代理等場景。
Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-伺服器推理編排器,能夠自動將 AI 任務在裝置端和雲端模型之間路由,無需使用者手動選擇。該功能將於2026年7月登陸 Perplexity Computer。
LangGraph 提供了內建的重試、超時和錯誤處理原語,用於構建健壯的 AI 代理。本文介紹瞭如何使用 RetryPolicy、TimeoutPolicy 和 error_handler,並透過 SAGA 模式展示了具有副作用的多步驟工作流中的補償邏輯。
本文探討了AI智慧體如何重塑資料科學工作流程,自動化日常任務,並需要系統設計、工具整合和智慧體可觀測性等新技能。介紹了LangGraph、AutoGen和smolagents等框架,以及從程式性到評估性工作的轉變和新興角色。
SALIMORY是一個新框架,透過訓練單一語言模型管理結構化認知記憶(包括使用者事實、偏好和工作記憶),解決了對話代理長期記憶難題。它引入分層階段過程獎勵和獎勵分解對比細化,端到端監督選擇性過濾、整合和線索驅動回憶等操作。該方法將記憶相關故障減少三分之一,端到端準確率提升超10%,良好個性化率翻倍。
本文探討模型中立性對AI代理的重要性,並指出各大實驗室正透過工具層鎖定客戶,而開源的抽象層解決方案是關鍵。
JackHamr 是一個雲平臺,它提供具備個性與自主能力的AI編碼代理、快速部署的開發環境以及完整的流水線編排。開發者可以像與同事協作一樣,透過自然語言或語音與代理互動,實現從規格制定到程式碼釋出的全自動化流程。平臺支援自定義LLM、技能和編排規則,並提供靈活的資源配置和信用計費。
Lookspan 是一個本地優先的 AI 代理可觀測性儀表板,支援 MCP、LangGraph、CrewAI 和 OpenTelemetry。所有資料儲存在本地 SQLite 中,無需雲服務。提供即時追蹤、成本跟蹤、警報、回放評估和資料集實驗等功能。透過一行命令即可啟動。
本文對比了三種常用的智慧體可觀測性工具:LangSmith、Langfuse 和 Arize。透過設定一個基於 LangChain 的測試智慧體,展示了各工具的整合方式、追蹤能力和評估工作流。LangSmith 與 LangChain 原生整合,提供完整的執行樹檢視和提示除錯功能;Langfuse 是開源且框架無關的,支援會話分組和事後評分;Arize 專注於生產級 ML 監控,使用 OpenInference 標準。文章幫助讀者根據需求選擇合適的工具。
本文介紹了使用LangChain的create_agent和中介軟體構建自定義代理腳手架的方法。代理由模型和腳手架組成,腳手架負責將模型連線到真實世界。透過中介軟體,可以在代理迴圈的各個階段插入自定義邏輯、工具、狀態管理等,從而實現高度定製化的代理。
Harmonic 使用 Deep Agents 和 LangSmith 重建了其 AI Scout,將使用者留存率提高了 4 倍,並將工具從僵化的搜尋介面轉變為能夠處理複雜投資查詢的可信賴顧問。
LiteHarness 是一個統一的 SDK,為多種 AI 智慧體工具提供單一的 TypeScript 和 Python 介面,包括 Claude Agent SDK 和 OpenAI Agents SDK。它支援輕鬆切換不同的智慧體和模型,並支援流式訊息。該專案目前處於預覽階段。
加速計算已將工程模擬時間從數週壓縮至數小時,但端到端工作流仍面臨挑戰。在COMPUTEX的GTC臺北大會上,NVIDIA與十餘家工程軟體提供商展示基於NemoClaw的自主AI代理如何自動化整個流程。NemoClaw是一個開放藍圖,提供安全執行時和前沿模型,可整合多種編排框架。多家工業軟體巨頭和初創公司正在利用它構建針對計算機輔助工程和電子設計自動化的AI工程師,顯著縮短設計、模擬和驗證週期。
Deep Agents 的 RubricMiddleware 透過在智慧體執行中新增自我評估迴圈,使其能夠根據預定義的評價標準反覆修正輸出,直到滿足所有條件。該工具特別適用於具有明確可驗證成功標準的任務,如透過測試、避免禁止模式、覆蓋必要部分等。
許多AI代理系統在生產環境中失敗,原因是智慧集中在了難以測試、替換和推理的中心。本文提出了一種架構原則:啞核心,智慧邊緣,即編排器應僅負責控制流,而領域智慧分佈在邊緣的專有節點中。這種設計提高了可測試性、可替換性和成本效益,並降低了耦合風險。
AI智慧編碼正在將軟體團隊從專業化模式轉變為構建者模式,個體透過編排AI來交付端到端解決方案。這一轉變要求文化變革,強調所有權,並凸顯技術判斷和領導力的重要性。
Rippling利用LangChain的Deep Agents和LangSmith,在6個月內為其跨HR、IT、財務、薪資和全球運營的平臺構建了生產級AI系統,採用多智慧體架構和上下文工程解決大規模本體推理難題。
本文提供了一個結構化的六步LLMOps路線圖,涵蓋可觀測性、評估、成本控制和代理編排,幫助您構建生產級LLM系統。預計LLMOps市場將從2024年的19.7億美元增長到2028年的49億美元,複合年增長率為42%。
MAVEN(模組化智慧體驗證與執行網路)是一種輕量級符號推理框架,旨在透過結構化分解、自適應工具編排和中間驗證來增強智慧體在工具呼叫環境中的泛化能力。在MAVEN-Bench壓力測試中,MAVEN將GPT-OSS-120b基礎模型的準確率從48%提升至71%,且無需額外訓練。該框架在使用開源模型的情況下,成本僅為專有模型的1/10,展現了輕量級驗證中心框架在組合推理方面的潛力。
銷售團隊每天花費數小時在可自動化的重複性任務上。本文展示瞭如何使用LangGraph構建多智慧體系統,自動完成潛在客戶研究、資格認定和CRM更新,從而提高效率、一致性和可擴充套件性。系統包括三個專用智慧體:研究智慧體、資格認定智慧體和CRM智慧體,透過有狀態圖進行編排,支援條件路由和並行執行。
OWASP Agent Memory Guard 是一個執行時防禦層,在AI代理的記憶體讀取和寫入時進行篩查,防止提示注入、秘密洩漏和完整性篡改。它是OWASP ASI06記憶體投毒攻擊的參考實現,支援LangChain、OpenAI Agents等多種框架。
Autolang是一種專為AI Agent設計的指令碼語言,旨在提供安全、快速且低成本的程式碼執行環境。它作為編排層,允許AI呼叫預定義的包裝函式,同時透過靜態編譯和嚴格的執行時限制防止惡意操作。文章詳細介紹了Autolang的設計哲學、效能最佳化、安全機制以及適用場景。
本文介紹了LangChain提出的直譯器技能(Interpreter Skills)概念,這是一種將確定性程式碼與智慧體指令結合的方法。透過讓智慧體在直譯器中匯入並執行TypeScript模組,可以構建更可靠、可評估的工作流,例如用於GitHub問題分類等任務。
本文介紹了一個使用Deep Agents、LangSmith和You.com金融研究API構建的宏觀經濟研究代理,該代理在約45分鐘內分析所有27個歐盟成員國的GDP資料,檢測異常並生成帶有引用的簡報。報告詳細分析了愛爾蘭和德國的異常增長與收縮原因,並強調了方法透明性和可審計性的重要性。
本文結合 LangChain 評估深度智慧體的經驗和 Anthropic 的 AI 智慧體評估指南,提供了實用指南。您將學習如何應用五種評估模式、使用 pytest 和 LangSmith 構建離線評估,以及配置生產環境的線上監控。文中以文本到 SQL 的深度智慧體為例,使用 Amazon Bedrock 覆蓋從開發到生產的完整生命週期。
文章探討了AI編碼工具從開發者緊密耦合的本地工作流到後臺非同步智慧體的演進,強調2025年12月的模型拐點使“規格到PR”流程成為現實,並深入分析了Devin等後臺智慧體的架構、安全、測試、記憶和多智慧體編排等關鍵話題。
截至2026年5月,七大AI智慧體框架(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)在設計理念、架構、生產就緒度等方面各有千秋。LangGraph在生產部署中領先,Claude Agent SDK在單一提供商能力上最強,OpenAI Agents SDK提供最清晰的多智慧體交接,CrewAI在開發效率上佔優。市場預計從2025年的78.4億美元增長至2030年的526.2億美元。
LangChain 在 Interrupt 2026 大會上釋出了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。
LangChain在4月釋出了多項產品更新,包括LangSmith的30多個評估器模板、成本警報功能,以及與Arcade.dev的整合。Deep Agents推出單命令部署工具,支援生產級擴充套件。Interrupt 2026大會將於5月13-14日在舊金山舉行,議程已公佈。此外,還有多場使用者故事和即將舉辦的活動。
AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。
Lyft 採用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平臺,用於客戶支援,將代理開發時間從數月縮短至數週。該平臺透過路由多代理架構、LangGraph 的子圖功能以及 LangSmith 的追蹤與監控工具,賦能非技術領域專家獨立開發 AI 代理,並藉助 LLM-as-a-Judge 評估系統確保質量。
AI模型在原始智慧方面似乎已達到平臺期,下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念,包括工具、記憶和人類參與,並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。
本文提供了一種在 AWS 上構建高度可擴充套件、無伺服器的多智慧體生成式 AI 系統的解決方案,該系統使用 LangGraph 智慧體作為編排器,並與 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 整合。文章詳細介紹瞭如何結合 AWS Lambda 和 AWS Step Functions 等無伺服器技術來構建自動擴充套件、即時響應且無需管理基礎設施的 LangGraph 智慧體,並討論了 LangGraph 的圖執行模型如何實現確定性協調、並行處理和條件路由。此外,文章還涵蓋了一個基於此架構的營銷活動稽核系統的實現,包括先決條件、部署步驟和清理指南。
瞭解如何構建一個多智慧體活動稽核系統,該系統利用NVIDIA NIM進行GPU加速推理、Amazon Bedrock AgentCore提供託管執行時、Strands Agents實現無伺服器編排,支援並行推理、上下文持久化和可觀測性。
華為在2026創新資料基礎設施論壇上釋出AI DC資料基礎設施全棧方案,涵蓋資料湖、知識與記憶平臺、模型工程、Agent框架和資料韌性,旨在加速企業AI規模化落地。
追蹤 AI 編程助理、程式碼生成、IDE 外掛、開發者工作流程和軟體工程自動化。
追蹤 Model Context Protocol、工具呼叫、連接器、Agent 上下文和企業整合。
追蹤開源權重模型、開放授權、社群評測、模型蒸餾和本地部署。
追蹤推理價格、延遲、吞吐、快取、量化、服務商成本和部署效率。
追蹤中國 AI 公司、模型、政策、晶片生態、開源社群和商業化進展。
追蹤 GPU、資料中心、叢集網路、AI 雲、訓練基礎設施和供應鏈。
追蹤模型 API 價格、方案、上下文視窗、免費額度、單位 token 成本和商業模式。
追蹤 DeepSeek 模型、API、開源權重、推理效率、生態合作和全球影響。
追蹤 Qwen/通義千問模型、開源權重、多模態、Agent 能力、API 和企業落地。