AI News HubLIVE
站内改写

LangChain Labs 正式成立

LangChain Labs 是一項新的應用研究計劃,專注於智慧體的持續學習,與多家合作伙伴共同推進自我改進型AI系統的開放研究。

文章情報

工程師進階

要點

  • LangChain Labs 聚焦智慧體持續學習,利用智慧體產生的資料進行自我改進。
  • 與 Harvey、NVIDIA、Prime Intellect、Fireworks 和 Baseten 等研究夥伴合作。
  • 研究方向包括成本與延遲最佳化、評估與模擬環境構建、以及跨模型提示最佳化。

為什麼重要

這條新聞值得關注,因為LangChain Labs 聚焦智慧體持續學習,利用智慧體產生的資料進行自我改進。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

近日,LangChain 宣佈成立 LangChain Labs,這是一個全新的應用研究團隊,旨在推動智慧體持續學習的開放研究。該實驗室專注於利用智慧體在實際執行中產生的資料——包括追蹤記錄、使用者反饋、評估結果和生產行為——來幫助智慧體不斷自我改進。

LangChain 認為,每次智慧體執行都蘊含著有價值的資訊,但如何從海量資料中提取有效訊號並將其轉化為可用的改進措施,仍是當前面臨的關鍵挑戰。而 LangChain 旗下的 LangSmith 平臺正是為資料捕捉、轉換和儲存而生,這為 LangChain Labs 在持續學習領域的研究提供了先發優勢。

LangChain Labs 已與 Harvey、NVIDIA、Prime Intellect、Fireworks 和 Baseten 等領先機構建立了研究合作伙伴關係。Harvey 應用研究主管 Niko Grupen 表示:“我們很高興與 LangChain Labs 團隊合作,推動針對複雜法律工作的高效、自我改進型智慧體的應用研究。”

研究初期將聚焦以下方向:

  1. 從大規模智慧體資料中挖掘改進資訊:隨著智慧體快速融入軟體系統,它們將在短時間內產生前所未有的資料量。如何從這些資料中提取有效訊號用於評估/模擬環境生成、工程最佳化和後續訓練,仍是難題。LangChain 希望幫助團隊利用追蹤資料構建更好的智慧體。
  1. 實現帕累託前沿的高效智慧體:智慧體在成本、延遲和任務效能方面面臨實際約束。對於許多關鍵任務,我們尚未找到模型、工程和反饋迴圈的最優組合,使智慧體實現自我改進。
  1. 系統化構建評估與模擬環境:為了正確評估智慧體,通常需要在其生產環境的代表性環境中進行端到端測試。這些環境建立起來既困難又耗時。LangChain 正在研究簡化環境建立和執行的方法,以支援評估、模擬和強化學習。
  1. 提示最佳化:提示策略因模型系列而異,在不同模型之間遷移往往繁瑣且耗時。LangChain 相信多模型未來,團隊應能輕鬆為任務選擇合適模型。跨模型的提示最佳化有助於簡化遷移過程並減少手動調優工作量。

早期合作專案包括:測量智慧體在不同垂直領域(如法律服務)間的泛化能力;利用 Nemotron 等開放模型進行工程最佳化和微調,構建成本效益高的子智慧體;以及建立評估和模擬環境,幫助團隊將追蹤資料轉化為可用於改進智慧體的實用資料。

LangChain 表示,其開源生態系統一直是構建者相互學習的重要基礎,LangChain Labs 將繼續秉承這一傳統,持續釋出研究、評估和開源整合,助力更廣泛的智慧體構建社群。

“我們期待與探索智慧體學習、適應和改進的團隊合作,推動更開放的下一代自我改進型智慧體研究。迫不及待與社群分享我們的成果,並持續共同建設。”