AI News HubLIVE
站内改写

LangChain Labs 正式成立

LangChain Labs 是一項新的應用研究計劃,專注於智能體的持續學習,與多家合作伙伴共同推進自我改進型AI系統的開放研究。

文章情報

工程師進階

要點

  • LangChain Labs 聚焦智能體持續學習,利用智能體產生的數據進行自我改進。
  • 與 Harvey、NVIDIA、Prime Intellect、Fireworks 和 Baseten 等研究夥伴合作。
  • 研究方向包括成本與延遲優化、評估與模擬環境構建、以及跨模型提示優化。

為甚麼重要

這條新聞值得關注,因為LangChain Labs 聚焦智能體持續學習,利用智能體產生的數據進行自我改進。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

近日,LangChain 宣佈成立 LangChain Labs,這是一個全新的應用研究團隊,旨在推動智能體持續學習的開放研究。該實驗室專注於利用智能體在實際運行中產生的數據——包括追蹤記錄、用户反饋、評估結果和生產行為——來幫助智能體不斷自我改進。

LangChain 認為,每次智能體運行都藴含着有價值的信息,但如何從海量數據中提取有效信號並將其轉化為可用的改進措施,仍是當前面臨的關鍵挑戰。而 LangChain 旗下的 LangSmith 平台正是為數據捕捉、轉換和存儲而生,這為 LangChain Labs 在持續學習領域的研究提供了先發優勢。

LangChain Labs 已與 Harvey、NVIDIA、Prime Intellect、Fireworks 和 Baseten 等領先機構建立了研究合作伙伴關係。Harvey 應用研究主管 Niko Grupen 表示:“我們很高興與 LangChain Labs 團隊合作,推動針對複雜法律工作的高效、自我改進型智能體的應用研究。”

研究初期將聚焦以下方向:

  1. 從大規模智能體數據中挖掘改進信息:隨着智能體快速融入軟件系統,它們將在短時間內產生前所未有的數據量。如何從這些數據中提取有效信號用於評估/模擬環境生成、工程優化和後續訓練,仍是難題。LangChain 希望幫助團隊利用追蹤數據構建更好的智能體。
  1. 實現帕累託前沿的高效智能體:智能體在成本、延遲和任務性能方面面臨實際約束。對於許多關鍵任務,我們尚未找到模型、工程和反饋循環的最優組合,使智能體實現自我改進。
  1. 系統化構建評估與模擬環境:為了正確評估智能體,通常需要在其生產環境的代表性環境中進行端到端測試。這些環境創建起來既困難又耗時。LangChain 正在研究簡化環境創建和運行的方法,以支持評估、模擬和強化學習。
  1. 提示優化:提示策略因模型系列而異,在不同模型之間遷移往往繁瑣且耗時。LangChain 相信多模型未來,團隊應能輕鬆為任務選擇合適模型。跨模型的提示優化有助於簡化遷移過程並減少手動調優工作量。

早期合作項目包括:測量智能體在不同垂直領域(如法律服務)間的泛化能力;利用 Nemotron 等開放模型進行工程優化和微調,構建成本效益高的子智能體;以及建立評估和模擬環境,幫助團隊將追蹤數據轉化為可用於改進智能體的實用數據。

LangChain 表示,其開源生態系統一直是構建者相互學習的重要基礎,LangChain Labs 將繼續秉承這一傳統,持續發佈研究、評估和開源集成,助力更廣泛的智能體構建社區。

“我們期待與探索智能體學習、適應和改進的團隊合作,推動更開放的下一代自我改進型智能體研究。迫不及待與社區分享我們的成果,並持續共同建設。”