AI News HubLIVE

Agent 框架動態

Box AI如何藉助Deep Agents構建企業內容代理

Box AI基於Deep Agents構建了Box Agent,支援跨企業內容庫搜尋、分析和綜合,同時保留安全性和許可權模型。採用父/子代理架構,動態生成子代理處理複雜任務,並透過中介軟體實現引用生成、快取和上下文管理。

  • Box Agent從單檔案問答演進到企業級多文件分析。
  • 採用Deep Agents實現模型無關性和快速迭代。
站內正文

如何為AI代理選擇合適的沙箱

瞭解如何為AI代理選擇安全的沙箱,包括檔案系統隔離、網路訪問控制、資源限制和微虛擬機器等方面的指導。

  • AI代理需要沙箱來安全執行程式碼,減輕提示注入風險。
  • “致命三要素”(敏感資料、不受信任內容、外部通訊)使代理易受攻擊。
站內正文

OpenAI收購AI代理編排初創公司Ona

OpenAI宣佈收購Ona,這是一家提供雲沙箱平臺管理長時間執行AI代理的初創公司。Ona的技術使AI代理能在開發者關機後繼續工作,並增強安全性。OpenAI將利用該技術改進其Codex AI助手,提升其執行長時間任務的能力。交易條款未披露。

  • OpenAI收購了Gitpod GmbH旗下的Ona公司,後者提供雲沙箱環境以執行長時間AI代理。
  • Ona平臺透過雜湊技術檢測偽裝程式,並防止代理訪問敏感檔案或惡意伺服器。
站內正文

當最聰明的AI還不夠聰明時,Benchling如何構建智慧體

Benchling,一家生命科學研發資料平臺,在2025年10月推出了Benchling AI,包含一個由智慧體支援的聊天介面。其AI主管Nicholas Larus-Stone與LangChain CEO Harrison Chase討論了構建科學工作智慧體的複雜性,包括使用多模型架構、生產追蹤審查以及可驗證科學任務的策略。

  • Benchling在同一任務上執行多個模型(來自不同提供商),利用不同模型的錯誤模式差異提高質量。
  • 透過每週輪換的‘消防隊長’審查生產追蹤,結合使用者反饋進行異常檢測。
站內正文

使用 Agent-EvalKit 系統化評估 AI 代理

Agent-EvalKit 是一個開源工具包 (Apache 2.0),透過整合 AI 編碼助手(包括 Claude Code、Kiro CLI 和 Kilo Code)來提供評估基礎設施。本文介紹了 Agent-EvalKit 的六個評估階段,並以使用 Strands Agents SDK 和 Amazon Bedrock 構建的旅行研究代理為例進行說明。

  • Agent-EvalKit 透過六個階段(計劃、資料、追蹤、執行代理、評估、報告)實現系統化評估。
  • 該工具包與 AI 編碼助手整合,將評估工作流帶入開發環境。
站內正文

SmithDB中的全文搜尋:為物件儲存設計倒排索引

SmithDB支援對代理追蹤進行全文搜尋和JSON過濾,中位延遲僅為400毫秒,儘管底層資料是儲存在物件儲存中的大型巢狀JSON文件。本文詳細介紹了為物件儲存和大型代理追蹤負載量身定製的倒排索引設計,包括面臨的獨特挑戰(大型負載、Zipfian分佈、多種查詢模式、物件儲存約束)、為何不採用Tantivy,以及兩次設計迭代的經驗教訓。

  • SmithDB的倒排索引針對物件儲存和大型代理追蹤負載進行了最佳化
  • 傳統搜尋引擎如Tantivy因基於mmap和本地磁碟而不適合
站內正文

代理與應用之間的缺失環節

大多數AI代理工具執行在伺服器上,限制了瀏覽器API、裝置功能和前端狀態的訪問。瞭解LangChain的無頭工具如何為現代代理應用啟用安全的客戶端工具執行。

  • 伺服器端工具無法直接訪問瀏覽器、應用和裝置的寶貴狀態與功能。
  • 無頭工具將客戶端能力引入代理迴圈,使代理能呼叫瀏覽器API、本地記憶體和應用特定操作。
站內正文

使用Amazon Bedrock AgentCore構建AI驅動的裝置維修助手

本教程介紹如何使用Amazon Bedrock AgentCore構建AI驅動的裝置維修助手,幫助農民和現場技術人員透過自然語言診斷裝置問題、識別所需零件並獲取製造商批准的維修流程。解決方案採用AgentCore Runtime與Strands Agents SDK、Amazon Nova 2 Lite基礎模型、Amazon Bedrock Knowledge Base進行檢索增強生成(RAG),以及AgentCore Memory實現對話持久化。

  • 構建AI維修助手,支援自然語言診斷和維修指導
  • 使用Amazon Bedrock AgentCore、Strands Agents SDK和Nova 2 Lite模型
站內正文

擴音式首次損失通知:利用Strands Agents與Amazon Bedrock AgentCore Browser Tool實現智慧理賠錄入

本文展示了一種擴音式首次損失通知(FNOL)錄入系統,該系統結合了基於Strands Agents SDK構建的領域推理智慧體與Amazon Bedrock AgentCore Browser Tool的即時門戶互動,在保留人類專業知識的同時消除了重複的螢幕操作。

  • Strands Agents SDK與Amazon Bedrock AgentCore Browser Tool結合,實現擴音式FNOL錄入。
  • 領域推理智慧體負責證據解讀、跨模態關聯和理賠複雜性評估。
站內正文

史蒂夫·耶格:四十年程式設計生涯與AI探索

史蒂夫·耶格擁有四十年程式設計經驗,曾在亞馬遜和谷歌任職近二十年,以技術文集和行業洞察聞名。目前他專注於多智慧體與編排系統的未來探索,運營Gas Town、Beads和Gas City等專案,並提供AI轉型諮詢。

  • 40年程式設計經驗,包括在亞馬遜和谷歌的近20年工作經歷。
  • 自2004年起寫作技術文章,影響諸多公司和程式設計師。
站內正文

OxyJen v0.5:用於AI工作流的確定性圖形執行時

OxyJen是一個開源的Java框架,用於編排LLM工作負載,提供圖形風格執行、上下文感知記憶體和確定性重試/回退。它專為Java企業環境設計,旨在提供可靠的生產級AI管道執行引擎。

  • OxyJen是一個基於圖形的編排框架,用於在Java中構建AI應用,支援多步驟工作流和型別安全
  • 與LangChain4j不同,OxyJen專注於執行時可靠性和開發者體驗,包括非同步、Project Loom和併發支援
站內正文

VoLo:面向開放詞彙長程操控的物理編排器

本文提出VoLoAgent,一種利用視覺語言模型(VLM)編排多種機器人能力的系統,用於開放詞彙長程操控任務。該系統將機器人動作視為可中斷的工具,實現即時規劃、監控和故障恢復。同時引入RoboVoLo基準測試,實驗表明VoLoAgent顯著優於單一VLA/VLM或基於工具的系統。

  • VoLoAgent透過閉環智慧體迴圈,使用VLM作為物理編排器排程異構機器人能力。
  • 系統將VLA/WAM視為可中斷工具,實現推理時不暫停的真實物理世界操控。
站內正文

使用LangChain構建緊急求助熱線語音代理

瞭解如何使用LangChain、AssemblyAI和OpenAI構建一個即時AI語音緊急求助熱線代理。該代理能夠傾聽呼叫者的語音求助,即時評估情況,派遣合適的緊急服務,並安撫呼叫者——無需任何打字或選單操作。文章詳細介紹了三階段流水線(語音轉文字、智慧體推理、文字轉語音)以及關鍵程式碼實現。

  • 利用AssemblyAI實現即時語音轉文字,支援部分轉錄和最終轉錄。
  • 智慧體ARIA基於LangChain構建,具備位置查詢、緊急派遣、升級至人工和安撫協議等工具。
站內正文

Multica:像真實領導團隊一樣編排業務智慧體

Multica 是一個開源平臺,將程式設計智慧體轉變為真正的團隊成員。您可以分配任務、跟蹤進度、積累技能,在同一個地方管理人類與智慧體員工隊伍。

  • Multica 是開源平臺,將編碼智慧體變為協作夥伴
  • 支援 Claude Code、Codex、Gemini CLI 等工具
站內正文

為你的AI代理分配專屬計算機

AI代理執行程式碼需要安全的隔離環境。LangSmith Sandboxes透過硬體虛擬化的微VM為每個代理提供獨立的計算機,支援快速啟動、持久狀態和批次擴充套件,適用於程式碼生成、資料分析、CI代理等場景。

  • AI代理需要真實的計算機環境(檔案系統、Shell、包管理器等),但直接訪問基礎設施風險極高。
  • 容器隔離不足,無法抵禦核心級別漏洞,硬體級分離是必要選擇。
站內正文

Perplexity AI 推出面向個人電腦的混合本地-伺服器推理編排器:自動裝置端與雲端任務路由

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-伺服器推理編排器,能夠自動將 AI 任務在裝置端和雲端模型之間路由,無需使用者手動選擇。該功能將於2026年7月登陸 Perplexity Computer。

  • Perplexity AI 推出混合推理編排器,自動在本地和雲端之間分配 AI 任務。
  • 本地輕量模型評估任務敏感性和計算需求,決定路由。
站內正文

LangGraph 中的容錯機制:重試、超時和錯誤處理器

LangGraph 提供了內建的重試、超時和錯誤處理原語,用於構建健壯的 AI 代理。本文介紹瞭如何使用 RetryPolicy、TimeoutPolicy 和 error_handler,並透過 SAGA 模式展示了具有副作用的多步驟工作流中的補償邏輯。

  • LangGraph 提供三種容錯原語:RetryPolicy、TimeoutPolicy 和 error_handler。
  • 這些原語直接附加到節點,支援每步配置自動重試和退避。
站內正文

智慧體時代對資料科學的意義

本文探討了AI智慧體如何重塑資料科學工作流程,自動化日常任務,並需要系統設計、工具整合和智慧體可觀測性等新技能。介紹了LangGraph、AutoGen和smolagents等框架,以及從程式性到評估性工作的轉變和新興角色。

  • 智慧體時代已至:AI智慧體自主規劃、執行多步驟任務並評估結果,重新定義資料科學。
  • 資料科學家需掌握新技能:系統設計、提示工程、工具設計、智慧體可觀測性和多智慧體架構。
站內正文

SaliMory:為對話代理編排認知記憶

SALIMORY是一個新框架,透過訓練單一語言模型管理結構化認知記憶(包括使用者事實、偏好和工作記憶),解決了對話代理長期記憶難題。它引入分層階段過程獎勵和獎勵分解對比細化,端到端監督選擇性過濾、整合和線索驅動回憶等操作。該方法將記憶相關故障減少三分之一,端到端準確率提升超10%,良好個性化率翻倍。

  • SALIMORY使用單一語言模型統一管理使用者事實、偏好和工作記憶,避免傳統多階段強化學習的信用分配瓶頸。
  • 透過分層階段過程獎勵和獎勵分解對比細化,為不同記憶操作提供獨立監督。
站內正文

模型中立性:為什麼避免AI供應商鎖定至關重要

本文探討模型中立性對AI代理的重要性,並指出各大實驗室正透過工具層鎖定客戶,而開源的抽象層解決方案是關鍵。

  • 模型中立性比雲端計算中立性更重要,因為模型更新速度更快
  • 實驗室透過工具層鎖定客戶,類似雲時代的做法
站內正文

JackHamr:用AI代理加速軟體交付的雲工作區

JackHamr 是一個雲平臺,它提供具備個性與自主能力的AI編碼代理、快速部署的開發環境以及完整的流水線編排。開發者可以像與同事協作一樣,透過自然語言或語音與代理互動,實現從規格制定到程式碼釋出的全自動化流程。平臺支援自定義LLM、技能和編排規則,並提供靈活的資源配置和信用計費。

  • 擁有名字和性格的AI代理,能夠自主完成從規劃到釋出的全部工作
  • 即時啟動的開發環境,內建VS Code、終端、Docker和Git整合
站內正文

Show HN: Lookspan – AI代理的本地優先可觀測性工具(npx lookspan)

Lookspan 是一個本地優先的 AI 代理可觀測性儀表板,支援 MCP、LangGraph、CrewAI 和 OpenTelemetry。所有資料儲存在本地 SQLite 中,無需雲服務。提供即時追蹤、成本跟蹤、警報、回放評估和資料集實驗等功能。透過一行命令即可啟動。

  • 本地優先:資料永不離開機器,零基礎設施成本
  • 支援多種 AI 代理框架,包括 MCP、LangGraph、CrewAI 和 OpenTelemetry
站內正文

LangSmith、Langfuse 和 Arize 的智慧體可觀測性對比實踐

本文對比了三種常用的智慧體可觀測性工具:LangSmith、Langfuse 和 Arize。透過設定一個基於 LangChain 的測試智慧體,展示了各工具的整合方式、追蹤能力和評估工作流。LangSmith 與 LangChain 原生整合,提供完整的執行樹檢視和提示除錯功能;Langfuse 是開源且框架無關的,支援會話分組和事後評分;Arize 專注於生產級 ML 監控,使用 OpenInference 標準。文章幫助讀者根據需求選擇合適的工具。

  • 智慧體可觀測性需要捕獲完整的執行圖,包括每一步、決策、LLM 輸入輸出、工具呼叫、令牌使用和延遲。
  • LangSmith 透過環境變數與 LangChain 無縫整合,提供深入的追蹤和提示除錯功能。
站內正文

如何構建自定義代理腳手架

本文介紹了使用LangChain的create_agent和中介軟體構建自定義代理腳手架的方法。代理由模型和腳手架組成,腳手架負責將模型連線到真實世界。透過中介軟體,可以在代理迴圈的各個階段插入自定義邏輯、工具、狀態管理等,從而實現高度定製化的代理。

  • 代理 = 模型 + 腳手架,腳手架決定代理的實用性。
  • create_agent提供核心代理迴圈,中介軟體允許在迴圈各階段定製。
站內正文

Harmonic 如何利用 Deep Agents 和 LangSmith 重建 Scout 並實現 4 倍留存

Harmonic 使用 Deep Agents 和 LangSmith 重建了其 AI Scout,將使用者留存率提高了 4 倍,並將工具從僵化的搜尋介面轉變為能夠處理複雜投資查詢的可信賴顧問。

  • Scout V1 是僵化的 LangGraph 管線,需要大量評估;V2 使用單一前沿模型和兩類工具,簡化了架構。
  • 新使用者體驗允許使用者自然互動,生成視覺化和搜尋結果,代理可以引用這些結果,建立共享真實源。
站內正文

Show HN:LiteHarness – 用於Claude Agent、OpenAI Agent和Pi AI的統一SDK

LiteHarness 是一個統一的 SDK,為多種 AI 智慧體工具提供單一的 TypeScript 和 Python 介面,包括 Claude Agent SDK 和 OpenAI Agents SDK。它支援輕鬆切換不同的智慧體和模型,並支援流式訊息。該專案目前處於預覽階段。

  • 為Claude Agent和OpenAI Agents提供統一介面
  • 支援TypeScript和Python
站內正文

工業軟體領導者藉助NVIDIA NemoClaw構建安全自主AI工程師

加速計算已將工程模擬時間從數週壓縮至數小時,但端到端工作流仍面臨挑戰。在COMPUTEX的GTC臺北大會上,NVIDIA與十餘家工程軟體提供商展示基於NemoClaw的自主AI代理如何自動化整個流程。NemoClaw是一個開放藍圖,提供安全執行時和前沿模型,可整合多種編排框架。多家工業軟體巨頭和初創公司正在利用它構建針對計算機輔助工程和電子設計自動化的AI工程師,顯著縮短設計、模擬和驗證週期。

  • NVIDIA釋出NemoClaw開放藍圖,用於構建安全、長期執行的自主AI工程師。
  • Cadence、Dassault、Siemens、Synopsys等工業軟體領導者正在整合NemoClaw實現工作流自動化。
站內正文

引入評價標準:構建能夠自我評估和修正工作的智慧體

Deep Agents 的 RubricMiddleware 透過在智慧體執行中新增自我評估迴圈,使其能夠根據預定義的評價標準反覆修正輸出,直到滿足所有條件。該工具特別適用於具有明確可驗證成功標準的任務,如透過測試、避免禁止模式、覆蓋必要部分等。

  • RubricMiddleware 允許智慧體根據評價標準自我評估並迭代改進。
  • 它使用獨立的評分子智慧體來審查輸出並提供逐條反饋。
站內正文

AI代理中的“啞核心,智慧邊緣”架構

許多AI代理系統在生產環境中失敗,原因是智慧集中在了難以測試、替換和推理的中心。本文提出了一種架構原則:啞核心,智慧邊緣,即編排器應僅負責控制流,而領域智慧分佈在邊緣的專有節點中。這種設計提高了可測試性、可替換性和成本效益,並降低了耦合風險。

  • 智慧核心(一體化編排器)是常見架構失敗的原因,因為它導致耦合、不可測試和成本高。
  • 啞核心原則:編排器僅處理狀態轉換和路由,專有節點擁有領域知識和智慧。
站內正文

從專家到構建者:AI智慧編碼如何重塑軟體團隊

AI智慧編碼正在將軟體團隊從專業化模式轉變為構建者模式,個體透過編排AI來交付端到端解決方案。這一轉變要求文化變革,強調所有權,並凸顯技術判斷和領導力的重要性。

  • 傳統專業化分工造成瓶頸,AI使單個構建者能處理多領域任務。
  • 構建者角色崛起,關注成果而非部門界限。
站內正文

Rippling如何在6個月內藉助Deep Agents和LangSmith實現全產品AI化

Rippling利用LangChain的Deep Agents和LangSmith,在6個月內為其跨HR、IT、財務、薪資和全球運營的平臺構建了生產級AI系統,採用多智慧體架構和上下文工程解決大規模本體推理難題。

  • Rippling的AI層使用監督智慧體協調5-7個專業子智慧體,涵蓋讀取、RAG和操作三類智慧體。
  • 上下文工程透過動態技能注入、程式碼執行和變數引腳(REPL)減少上下文膨脹100-500倍。
站內正文

掌握LLMOps的路線圖:2026年指南

本文提供了一個結構化的六步LLMOps路線圖,涵蓋可觀測性、評估、成本控制和代理編排,幫助您構建生產級LLM系統。預計LLMOps市場將從2024年的19.7億美元增長到2028年的49億美元,複合年增長率為42%。

  • LLMOps與傳統MLOps不同,重點在於提示版本控制、非確定性輸出評估和成本最佳化。
  • 在開始LLMOps工具之前,需要掌握Python、LLM基礎、雲基礎設施和版本控制。
站內正文

MAVEN:提升智慧體工具呼叫中的泛化能力

MAVEN(模組化智慧體驗證與執行網路)是一種輕量級符號推理框架,旨在透過結構化分解、自適應工具編排和中間驗證來增強智慧體在工具呼叫環境中的泛化能力。在MAVEN-Bench壓力測試中,MAVEN將GPT-OSS-120b基礎模型的準確率從48%提升至71%,且無需額外訓練。該框架在使用開源模型的情況下,成本僅為專有模型的1/10,展現了輕量級驗證中心框架在組合推理方面的潛力。

  • MAVEN是一種輕量級符號推理框架,專注於智慧體工具呼叫的泛化問題。
  • 在MAVEN-Bench基準測試中,MAVEN將GPT-OSS-120b準確率從48%提升至71%,無需額外訓練。
站內正文

用於銷售團隊的AI工作流:使用LangGraph自動進行潛在客戶研究、資格認定和CRM更新

銷售團隊每天花費數小時在可自動化的重複性任務上。本文展示瞭如何使用LangGraph構建多智慧體系統,自動完成潛在客戶研究、資格認定和CRM更新,從而提高效率、一致性和可擴充套件性。系統包括三個專用智慧體:研究智慧體、資格認定智慧體和CRM智慧體,透過有狀態圖進行編排,支援條件路由和並行執行。

  • AI工作流透過多智慧體系統自動化銷售團隊的重複性任務,如潛在客戶研究、資格認定和CRM更新。
  • LangGraph框架支援有狀態的多步驟工作流,具有條件路由、共享狀態和檢查點功能。
站內正文

Show HN: OWASP Agent Memory Guard – 阻止AI代理記憶體投毒

OWASP Agent Memory Guard 是一個執行時防禦層,在AI代理的記憶體讀取和寫入時進行篩查,防止提示注入、秘密洩漏和完整性篡改。它是OWASP ASI06記憶體投毒攻擊的參考實現,支援LangChain、OpenAI Agents等多種框架。

  • Agent Memory Guard 是OWASP孵化專案,專注於防止AI代理記憶體投毒。
  • 它提供執行時防禦,篩查記憶體讀寫,檢測提示注入、秘密洩漏等威脅。
站內正文

Show HN:面向不可信AI Agent指令碼的輕量級編譯器

Autolang是一種專為AI Agent設計的指令碼語言,旨在提供安全、快速且低成本的程式碼執行環境。它作為編排層,允許AI呼叫預定義的包裝函式,同時透過靜態編譯和嚴格的執行時限制防止惡意操作。文章詳細介紹了Autolang的設計哲學、效能最佳化、安全機制以及適用場景。

  • Autolang是一個輕量級編譯器,用於安全執行AI生成的短指令碼。
  • 它透過靜態分析和執行時限制(如操作碼上限)防止無限迴圈、空指標訪問等常見AI錯誤。
站內正文

直譯器技能:為智慧體構建工作流

本文介紹了LangChain提出的直譯器技能(Interpreter Skills)概念,這是一種將確定性程式碼與智慧體指令結合的方法。透過讓智慧體在直譯器中匯入並執行TypeScript模組,可以構建更可靠、可評估的工作流,例如用於GitHub問題分類等任務。

  • 直譯器技能擴充套件了傳統技能,包含一個TypeScript模組供智慧體在直譯器中執行。
  • 確定性部分以程式碼形式存在,智慧體決定何時呼叫並傳入引數,提高了可靠性和可評估性。
站內正文

金融AI宏觀趨勢調查:利用You.com和Langchain進行歐盟經濟分析

本文介紹了一個使用Deep Agents、LangSmith和You.com金融研究API構建的宏觀經濟研究代理,該代理在約45分鐘內分析所有27個歐盟成員國的GDP資料,檢測異常並生成帶有引用的簡報。報告詳細分析了愛爾蘭和德國的異常增長與收縮原因,並強調了方法透明性和可審計性的重要性。

  • 構建的AI代理可在45分鐘內分析27個歐盟國家的GDP資料並生成詳細簡報,API成本約2.20美元。
  • 愛爾蘭12.3%的GDP增長主要由製藥出口激增驅動,而德國則因汽車和建築業收縮出現結構性衰退。
站內正文

使用 AWS 上的 LangSmith 評估深度智慧體

本文結合 LangChain 評估深度智慧體的經驗和 Anthropic 的 AI 智慧體評估指南,提供了實用指南。您將學習如何應用五種評估模式、使用 pytest 和 LangSmith 構建離線評估,以及配置生產環境的線上監控。文中以文本到 SQL 的深度智慧體為例,使用 Amazon Bedrock 覆蓋從開發到生產的完整生命週期。

  • 深度智慧體的評估面臨非確定性、錯誤傳播和創造性解決方案等挑戰。
  • 介紹了程式碼基礎、模型基礎和人工三種評估器,並推薦組合使用。
站內正文

非同步智慧體時代 —— Cognition的Walden Yan與OpenInspect的Cole Murray

文章探討了AI編碼工具從開發者緊密耦合的本地工作流到後臺非同步智慧體的演進,強調2025年12月的模型拐點使“規格到PR”流程成為現實,並深入分析了Devin等後臺智慧體的架構、安全、測試、記憶和多智慧體編排等關鍵話題。

  • 後臺智慧體正成為主流,Devin在Cognition倉庫中的合併PR佔比從16%升至80%。
  • 2025年12月的模型升級(Opus 4.5/GPT 5.2)使智慧體能夠自主從規格生成完整PR。
站內正文

AI智慧體框架對比分析

截至2026年5月,七大AI智慧體框架(DSPy、Claude Agent SDK、OpenAI Agents SDK、CrewAI、AutoGen、LangGraph、Google ADK)在設計理念、架構、生產就緒度等方面各有千秋。LangGraph在生產部署中領先,Claude Agent SDK在單一提供商能力上最強,OpenAI Agents SDK提供最清晰的多智慧體交接,CrewAI在開發效率上佔優。市場預計從2025年的78.4億美元增長至2030年的526.2億美元。

  • LangGraph擁有最成熟的持久執行模型,部署於約400家企業。
  • Claude Agent SDK提供了最強大的單提供商操作能力,但侷限於Anthropic模型。
站內正文

在生產環境中修復代理故障:Interrupt 2026 回顧 | LangChain 新聞通訊

LangChain 在 Interrupt 2026 大會上釋出了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。

  • LangSmith Engine 自動分析生產軌跡、聚類故障並推薦修復方案。
  • LangSmith Sandboxes 正式釋出,提供安全的代理程式碼執行環境。
站內正文

2026年4月:LangChain新聞通訊

LangChain在4月釋出了多項產品更新,包括LangSmith的30多個評估器模板、成本警報功能,以及與Arcade.dev的整合。Deep Agents推出單命令部署工具,支援生產級擴充套件。Interrupt 2026大會將於5月13-14日在舊金山舉行,議程已公佈。此外,還有多場使用者故事和即將舉辦的活動。

  • LangSmith新增30+評估模板、成本警報和RBAC/ABAC工具控制。
  • Deep Agents推出`deepagents deploy`命令,實現一鍵生產部署。
站內正文

利用 Amazon Bedrock AgentCore 賦能代理型 AI 銷售策略

AWS 銷售團隊使用 Amazon Bedrock AgentCore 構建了 Field Advisor,以編排超過 20 個領域特定代理,減輕銷售代表認知負擔並提高效率。該解決方案每週為每位代表節省最多 2 小時,並將延遲降低 41%。

  • Field Advisor 透過單一對話介面編排 20 多個專業代理。
  • 人工參與的工作流確保資料準確性和問責制。
站內正文

Lyft 如何利用 LangGraph 和 LangSmith 構建自助式 AI 代理平臺

Lyft 採用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平臺,用於客戶支援,將代理開發時間從數月縮短至數週。該平臺透過路由多代理架構、LangGraph 的子圖功能以及 LangSmith 的追蹤與監控工具,賦能非技術領域專家獨立開發 AI 代理,並藉助 LLM-as-a-Judge 評估系統確保質量。

  • Lyft 透過讓運營團隊、VoC 負責人和產品經理直接使用提示和配置來定義代理,減少了機器學習工程師的介入。
  • 基於路由器的多代理架構使用 LangGraph 協調專業子代理,實現安全檢查和狀態管理。
站內正文

AI代理馬具:將LLM轉變為數字工人的粘合劑

AI模型在原始智慧方面似乎已達到平臺期,下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念,包括工具、記憶和人類參與,並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。

  • AI模型智慧提升放緩,代理馬具成為新焦點。
  • 代理馬具為LLM提供工具、記憶和糾錯能力。
站內正文

在 AWS 上使用 Amazon Bedrock AgentCore 構建高度可擴充套件的無伺服器 LangGraph 多智慧體系統

本文提供了一種在 AWS 上構建高度可擴充套件、無伺服器的多智慧體生成式 AI 系統的解決方案,該系統使用 LangGraph 智慧體作為編排器,並與 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 整合。文章詳細介紹瞭如何結合 AWS Lambda 和 AWS Step Functions 等無伺服器技術來構建自動擴充套件、即時響應且無需管理基礎設施的 LangGraph 智慧體,並討論了 LangGraph 的圖執行模型如何實現確定性協調、並行處理和條件路由。此外,文章還涵蓋了一個基於此架構的營銷活動稽核系統的實現,包括先決條件、部署步驟和清理指南。

  • 結合 LangGraph、Amazon Bedrock AgentCore 和無伺服器 AWS 服務,構建可投入生產的可擴充套件多智慧體 AI 系統。
  • LangGraph 的顯式圖執行模型支援智慧體間的確定性協調、並行處理和條件路由。
站內正文

使用Strands Agents、NVIDIA NIM和Amazon Bedrock AgentCore構建高效能生成式AI系統

瞭解如何構建一個多智慧體活動稽核系統,該系統利用NVIDIA NIM進行GPU加速推理、Amazon Bedrock AgentCore提供託管執行時、Strands Agents實現無伺服器編排,支援並行推理、上下文持久化和可觀測性。

  • 結合NVIDIA NIM、Amazon Bedrock AgentCore和Strands Agents,實現高效能多智慧體AI系統。
  • 支援並行推理、上下文持久化和可追蹤的執行路徑。
站內正文

華為釋出AI DC資料基礎設施全棧方案,加速行業智慧化躍升

華為在2026創新資料基礎設施論壇上釋出AI DC資料基礎設施全棧方案,涵蓋資料湖、知識與記憶平臺、模型工程、Agent框架和資料韌性,旨在加速企業AI規模化落地。

  • 華為在巴黎論壇釋出AI DC資料基礎設施全棧方案
  • 方案包含資料湖、知識與記憶平臺、模型工程、Agent框架和資料韌性
站內正文

更多增長標籤

Agent 框架 AI News | AI News Hub