AI News HubLIVE

來源分布

  • LangChain Blog25
  • Hacker News AI5
  • AWS Machine Learning Blog3
  • MarkTechPost2
  • Analytics Vidhya1
  • arXiv AI1
  • Cerebras Blog1
  • Hugging Face Blog1

主題分布

  • Agent38
  • 政策13
  • 模型13
  • 研究13
  • 工具11
  • 芯片6
  • 創業融資1

日期線

  • 2026-04-306
  • 2026-05-135
  • 2026-05-144
  • 2026-05-093
  • 2026-05-153
  • 2026-05-273
  • 2026-05-062
  • 2026-05-192

最新動態

在生產環境中修復代理故障:Interrupt 2026 回顧 | LangChain 新聞通訊

LangChain 在 Interrupt 2026 大會上發佈了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。

  • LangSmith Engine 自動分析生產軌跡、聚類故障並推薦修復方案。
  • LangSmith Sandboxes 正式發佈,提供安全的代理代碼執行環境。
站內正文

Lyft 如何利用 LangGraph 和 LangSmith 構建自助式 AI 代理平台

Lyft 採用 LangGraph 和 LangSmith 構建了一個自助式 AI 代理平台,用於客户支持,將代理開發時間從數月縮短至數週。該平台通過路由多代理架構、LangGraph 的子圖功能以及 LangSmith 的追蹤與監控工具,賦能非技術領域專家獨立開發 AI 代理,並藉助 LLM-as-a-Judge 評估系統確保質量。

  • Lyft 通過讓運營團隊、VoC 負責人和產品經理直接使用提示和配置來定義代理,減少了機器學習工程師的介入。
  • 基於路由器的多代理架構使用 LangGraph 協調專業子代理,實現安全檢查和狀態管理。
站內正文

AI代理馬具:將LLM轉變為數字工人的粘合劑

AI模型在原始智能方面似乎已達到平台期,下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念,包括工具、記憶和人類參與,並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。

  • AI模型智能提升放緩,代理馬具成為新焦點。
  • 代理馬具為LLM提供工具、記憶和糾錯能力。
站內正文

在 AWS 上使用 Amazon Bedrock AgentCore 構建高度可擴展的無服務器 LangGraph 多智能體系統

本文提供了一種在 AWS 上構建高度可擴展、無服務器的多智能體生成式 AI 系統的解決方案,該系統使用 LangGraph 智能體作為編排器,並與 Amazon Bedrock AgentCore Memory 和 Amazon Bedrock AgentCore Observability 集成。文章詳細介紹瞭如何結合 AWS Lambda 和 AWS Step Functions 等無服務器技術來構建自動擴展、實時響應且無需管理基礎設施的 LangGraph 智能體,並討論了 LangGraph 的圖執行模型如何實現確定性協調、並行處理和條件路由。此外,文章還涵蓋了一個基於此架構的營銷活動審核系統的實現,包括先決條件、部署步驟和清理指南。

  • 結合 LangGraph、Amazon Bedrock AgentCore 和無服務器 AWS 服務,構建可投入生產的可擴展多智能體 AI 系統。
  • LangGraph 的顯式圖執行模型支持智能體間的確定性協調、並行處理和條件路由。
站內正文

基於全自主國產核心智能大模型的實用量子CIM賦能

本研究將飛秒激光泵浦的相干伊辛機(CIM)與大語言模型(LLM)驅動的智能體系統集成,利用LangGraph和LangChain框架實現了量子建模的自動化。LLM能夠有效執行QUBO/Ising模型校準、約束權重迭代和文獻方案驗證。所有任務均基於國產大模型和國產CIM硬件實現,完全依賴自主核心技術。研究還意外發現,智能體輔助量子計算迭代積累的知識能夠反向增強智能體自身的問題解決能力,形成新的協同範式。

  • 集成飛秒激光泵浦CIM與LLM驅動的智能體系統,實現量子建模自動化
  • LLM可執行QUBO/Ising模型校準、約束權重迭代和方案驗證
站內正文

一個用Java編寫的簡單AI代理

一個基於LangChain4j的Java AI代理,類似於Claude Code,免費使用,需註冊Mistral賬户。首次嘗試生成了一個功能良好的計算器應用。

  • 使用Java和LangChain4j構建的AI代理
  • 免費使用,需註冊Mistral賬户
站內正文

LangSmith Auth Proxy:如何保障AI代理沙箱的網絡安全性

LangSmith的Auth Proxy通過將憑據隔離在沙箱之外,在網絡層注入認證頭,並允許團隊定義出口策略和動態憑據流程,從而為AI代理沙箱提供更安全的網絡訪問控制。

  • 憑據不出現在沙箱運行時,減少提示注入、惡意依賴等風險
  • 通過代理控制所有出站流量,實現精細的出口策略
站內正文

從令牌流到代理流

Deep Agents、LangChain 和 LangGraph 的最新流式原語引入了類型化事件、作用域訂閲、子代理可見性、多模態輸出和彈性前端體驗,支持構建生產級代理應用。

  • 流式處理需要超越令牌,現代代理生成消息、工具調用、子代理活動、狀態變更、審批和媒體,需要結構化事件流。
  • 類型化事件和投影簡化了前端開發,應用直接訂閲消息、工具調用、狀態、子代理或自定義通道,運行時處理組裝、排序和重連。
站內正文

宣佈 Amazon SageMaker AI 端點支持 OpenAI 兼容 API

Amazon SageMaker AI 現在為實時推理端點提供 OpenAI 兼容的 API 支持。使用 OpenAI SDK、LangChain 或 Strands Agents 的用户只需更改端點 URL 即可調用 SageMaker AI 上的模型,無需自定義客户端、SigV4 包裝器或代碼重寫。該功能支持聊天補全請求和流式響應,並通過 bearer token 進行身份驗證。

  • Amazon SageMaker AI 端點現在支持 OpenAI 兼容的 API,簡化了模型調用流程。
  • 用户可以使用現有的 OpenAI SDK 或框架,僅需修改端點 URL。
站內正文

深度代理中的解釋器:工具調用與沙盒之間的代碼

深度代理現在支持解釋器:小型嵌入式運行時,代理可在其中編寫代碼以協調工具、保持工作狀態,並決定哪些內容進入模型上下文。解釋器提供了一種介於串行工具調用和完整沙盒之間的中間地帶,使代理能夠表達多步驟工作、將中間狀態保留在模型上下文之外,並以更可預測的方式執行代碼和操作。

  • 解釋器位於串行工具調用和完整沙盒之間,代理可以在受限能力上獲得代碼級組合,而無需繼承整個環境。
  • 解釋器狀態是第三種上下文表面:消息歷史用於模型當前推理,文件系統用於持久工件,解釋器狀態用於尚不需要進入模型輸入的實時工作值。
站內正文

我們如何構建 LangSmith Engine:用於改進代理的代理

LangSmith Engine 是一個位於代理追蹤之上的智能代理,能夠發現重複出現的問題並提出改進建議。本文詳細介紹了其技術架構,包括如何大規模篩選追蹤、識別問題、生成評估器和數據集示例,並持續更新代理概覽以優化後續運行。

  • Engine 自動發現追蹤中的失敗模式並轉化為可操作的問題。
  • 採用兩階段處理:先通過軌跡摘要快速篩選,再深入調查可疑追蹤。
站內正文

2026年最佳企業級自主AI平台

2026年,企業級自主AI已從試點轉向生產。本文對Salesforce Agentforce、Microsoft Copilot Studio、ServiceNow、LangGraph等十大平台進行排名,提供已驗證的定價、實際採用數據及誠實限制,幫助團隊做出決策。

  • Salesforce Agentforce在CRM原生工作流中表現最佳,但僅限於Salesforce生態系統。
  • Microsoft Copilot Studio擁有最高採用量,適合Microsoft 365企業。
站內正文

調優深度代理以適配不同模型

深度代理此前採用通用設計以適配各模型家族。今天,我們推出模型特定配置文件,可調整提示、工具和中間件。我們內置了針對OpenAI、Anthropic和Google模型的配置文件,在tau2-bench子集上相比默認配置實現了10-20分的提升。

  • 深度代理引入模型特定配置文件,針對不同模型優化提示、工具和中間件。
  • 針對OpenAI、Anthropic和Google模型的定製配置文件在tau2-bench上帶來10-20分的提升。
站內正文

關於運行時無關的AI代理工作流規範(LangGraph/Mastra)的反饋

itsharness是一個用於構建、運行和監控AI代理工作流的完整工具集。它提供可視化畫布設計流程,導出運行時無關的規範,編譯到不同框架,並支持運行、追蹤和調試。當前規範版本0.2.0,包含14種節點類型和5個參考流程。

  • itsharness提供了一個可視化畫布,用於設計AI代理工作流,並導出運行時無關的JSON規範。
  • 支持通過適配器將規範編譯到LangGraph、CrewAI、Mastra和Microsoft Agent Framework等框架。
站內正文

【AINews】萬物皆為指揮家

本期AI新聞涵蓋多個熱點:GitHub Copilot App模仿Conductor的形態引發討論;OpenAI推出Codex移動版,支持遠程控制編碼代理;LangChain發佈SmithDB和Engine,將代理追蹤數據轉化為改進循環;Anthropic限制Claude Code使用引發開發者強烈反彈;Figure展示人形機器人24/7自主分揀直播;以及多項研究進展,包括擴散語言模型、時間序列基礎模型和可解釋性等。

  • GitHub Copilot App採用類似Conductor的代理優先形態,Conductor創始人獲YC CEO Garry Tan公開支持。
  • OpenAI Codex登陸ChatGPT移動端,支持遠程啓動、審查和執行編碼任務。
站內正文

我們在 Interrupt 上發佈的所有產品

LangChain 在 Interrupt 2026 上發佈了一系列新產品和功能,旨在幫助團隊加速智能體開發週期,包括自動調試、託管基礎設施、可觀測性和治理等。

  • LangSmith Engine 可自動監控生產環境中的追蹤數據,聚類故障並生成修復 PR。
  • Managed Deep Agents 提供 API 優先的託管運行時,用於創建和運行深度智能體。
站內正文

LangChain Labs 正式成立

LangChain Labs 是一項新的應用研究計劃,專注於智能體的持續學習,與多家合作伙伴共同推進自我改進型AI系統的開放研究。

  • LangChain Labs 聚焦智能體持續學習,利用智能體產生的數據進行自我改進。
  • 與 Harvey、NVIDIA、Prime Intellect、Fireworks 和 Baseten 等研究夥伴合作。
站內正文

Halgorithem:用樹結構捕捉AI幻覺,管道中無需AI

Halgorithem 是一種無需依賴AI即可檢測AI幻覺的算法,通過將輸入文件解析為樹結構並與文件塊樹比較來標記不一致之處。該算法可輕鬆集成到LangGraph、CrewAI等Python AI工作流中,並在多項基準測試中展現出高準確率。

  • Halgorithem 不依賴自身AI,通過樹結構比對檢測AI幻覺。
  • 可無縫集成到LangGraph、CrewAI等主流Python AI管道。
站內正文

智能體‘牽引系統’解剖:模型如何變身自主工作引擎

瞭解代理牽引系統如何將AI模型轉變為自主工作引擎。探索核心組件:文件系統、沙箱和記憶。

  • 分解複雜目標:規劃工具使代理能夠分解任務、跟蹤進度並根據學習情況調整。
  • 並行委派工作:為獨立的子任務生成子代理,每個代理具有隔離的上下文。
站內正文

LangSmith LLM網關:內置於代理生命週期中的運行時治理

LangSmith推出LLM網關私有測試版,這是一層運行時治理,可在請求到達模型前強制執行成本限制和敏感數據編輯,並將策略事件直接集成到LangSmith工作區,無需額外工具。

  • LLM網關位於代理與LLM提供商之間,可強制執行支出限制和PII編輯,從源頭阻止問題。
  • 策略違規作為可追蹤事件出現在LangSmith中,便於從阻止的請求到觸發追蹤再到修復。
站內正文

推出 LangSmith Context Hub

LangSmith 發佈 Context Hub,一個集中存儲、版本管理和協作管理 AI 代理行為文件(如 AGENTS.md、技能、策略)的平台。它解決了上下文文件常由非工程人員編寫且更新頻繁的問題,提供版本控制、標籤、評論等功能,支持 CLI 和 UI 操作,並能與 Deep Agents 集成實現持久化記憶。

  • Context Hub 集中管理代理上下文文件,包括 AGENTS.md、技能、策略等。
  • 上下文對代理行為影響巨大,許多失敗源於缺失或過時的上下文。
站內正文

LangSmith Sandbox 正式發佈

LangSmith Sandbox 現已正式發佈 (GA),提供基於硬件虛擬化的微虛擬機,實現內核級隔離,確保運行不受信任的AI生成代碼的安全性。新特性包括快照與分支、服務URL、CLI工具、認證代理等,適用於編碼代理、CI代理和數據管道等場景。

  • 每個 Sandbox 都是硬件虛擬化的微虛擬機,與主機及其他 Sandbox 實現內核隔離,比容器更安全。
  • 新增快照與寫時複製分支、服務URL、Sandbox CLI、認證代理(支持自定義回調)等特性。
站內正文

託管深度代理:快速部署生產級深度代理的最佳方式

LangChain推出Managed Deep Agents私有測試版,提供API優先的託管運行時,處理持久化執行、沙箱、工具訪問和可觀測性,讓開發者專注於代理行為而非基礎設施。

  • Managed Deep Agents提供託管運行時,支持持久化線程、流式運行、檢查點和人機協同。
  • Context Hub允許代理跨運行保留和更新上下文,並結合LangSmith Engine從實際使用中學習改進。
站內正文

Show HN:Torrix —— 自託管的大語言模型可觀測性工具(無需 Postgres 和 Redis)

Torrix 是一款自託管的 LLM 可觀測性工具,支持跟蹤令牌數、成本、延遲、完整提示追蹤、推理令牌捕獲和 PII 脱敏。兼容 OpenAI、Anthropic、Google Gemini 等眾多提供商。通過 Docker 一鍵部署,無需 Postgres 或 Redis。提供 Python、Node.js、Go、C#、Java SDK 以及 LangChain 回調和 HTTP 代理。

  • 自託管 LLM 可觀測性,無需 Postgres 或 Redis。
  • 跟蹤令牌數、成本、延遲、提示追蹤、推理令牌和 PII 脱敏。
站內正文

OncoAgent:一種用於隱私保護腫瘤臨牀決策支持的雙層多智能體框架

OncoAgent是一個開源、隱私保護的腫瘤臨牀決策支持系統。它採用雙層大語言模型架構(9B快速模型和27B深度推理模型)、多智能體LangGraph拓撲、糾正性RAG流程(涵蓋70餘項NCCN和ESMO指南)以及三層反射安全驗證器。系統通過複雜性評分路由查詢,在AMD Instinct MI300X上微調,實現了56倍的吞吐量加速,並支持本地部署以確保數據主權。

  • 開源、隱私保護的腫瘤決策支持系統,支持本地部署。
  • 雙層LLM架構:9B快速模型和27B深度推理模型,通過複雜性評分路由。
站內正文

代理開發生命週期

本文介紹了代理開發生命週期的四個階段:構建、測試、部署和監控。強調了在部署前進行測試、使用運行時和沙箱進行可靠部署、以及通過追蹤和反饋進行監控的重要性。涵蓋了從代碼優先到無代碼的多種工具,並討論了評估數據集、模擬和信號採集等最佳實踐。

  • 生命週期包括構建、測試、部署和監控四個階段。
  • 測試應在部署前開始,使用數據集和實驗系統化評估代理。
站內正文

人工智能代理記憶模式:認知科學與AI系統的橋樑

記憶對人類思維和AI代理的行為至關重要。本文從認知科學角度出發,介紹了AI代理的短時記憶、情景記憶、語義記憶和長時記憶等類型,並探討了它們的設計權衡。通過LangGraph在Google Colab中的實踐演示,展示瞭如何構建包含多種記憶模式的AI代理。

  • AI代理記憶包括短時、情景、語義和長時記憶,各有不同的存儲、保留和檢索權衡。
  • 記憶架構通過分層設計,將信息從短時存儲逐步轉化為可重用的語義知識。
站內正文

使用 Deep Agents、LangSmith 和 Parallel 構建公司盡職調查智能體

本文詳細介紹瞭如何利用 LangChain 的 Deep Agents 進行編排和 Parallel 的 Task API 進行結構化網絡研究,構建自動化公司盡職調查智能體。該智能體包含五個研究子智能體,並通過 LangSmith 實現合規可觀測性,確保每項主張都有源可查。

  • Deep Agents 編排五個研究子智能體,分別負責企業檔案、財務狀況、訴訟監管、新聞輿情和競爭格局。
  • Parallel 的 Task API 返回帶來源引用和置信度分數(Basis)的結構化發現,支持可驗證研究。
站內正文

用Groq搭建智能研究助手:結合LangGraph、工具調用、子代理和記憶功能

本教程詳細演示瞭如何利用Groq的免費OpenAI兼容推理端點,結合LangGraph、LangChain以及自定義工具(包括網頁搜索、文件操作、Python執行、技能加載、子代理委派和長期記憶),構建一個可運行的多步驟研究代理。通過一個實際任務(小型語言模型簡報),展示了代理發現技能、委派子研究、生成結構化輸出和保存記憶的完整流程。

  • 使用Groq的API作為後端,通過LangChain的ChatOpenAI接口調用llama-3.3-70b-versatile模型。
  • 構建了包含網頁搜索、文件讀寫、代碼執行、技能管理和記憶存儲的工具集。
站內正文

智能體可觀測性需要反饋以驅動學習

本文由LangChain創始人Harrison Chase撰寫,闡述了智能體可觀測性的核心價值不僅是調試,而是驅動學習循環。他強調,僅靠追蹤是不夠的,必須結合反饋信號(用户反饋、間接信號、大模型評判、規則等)才能系統地改進模型、框架和上下文。文章詳細探討了學習發生的多個層面(模型、框架、上下文),以及如何通過追蹤與反饋結合實現人工或自動化的持續改進。最後,他指出一個完善的可觀測性平台應具備存儲追蹤、存儲反饋和生成反饋三大能力。

  • 智能體可觀測性的核心是驅動學習,而不僅僅是調試。
  • 反饋信號(用户、間接、LLM評判、規則)將追蹤從被動記錄轉化為訓練信號。
站內正文

赫伯羅特如何利用Amazon Bedrock將客户反饋轉化為可操作的洞察

赫伯羅特數字客户體驗團隊利用Amazon Bedrock、Elasticsearch和LangChain/LangGraph構建了基於生成式AI的反饋分析解決方案,自動進行情感分類、趨勢分析和報告生成,減少人工工作,實現更快的數據驅動產品決策。

  • 使用生成式AI自動分析客户反饋,將人工工作量從數小時縮短到數秒。
  • 解決方案利用Amazon Bedrock進行情感分類和內容審核,並配備防護措施。
站內正文

開放模型已跨越門檻

像GLM-5和MiniMax M2.7這樣的開放權重模型在核心智能體任務(文件操作、工具使用、指令遵循)上已媲美封閉前沿模型,同時成本更低、延遲更短。LangChain的評估顯示其正確率接近頂級閉源模型,使開放模型適用於生產環境。本文詳細介紹評估方法、結果及如何在Deep Agents SDK中使用開放模型。

  • 開放模型GLM-5和MiniMax M2.7在智能體任務上追平閉源模型。
  • 成本和延遲優勢:價格低至閉源模型的1/20,推理速度更快。
站內正文

Interrupt 2026前瞻:企業級Agent規模化部署

LangChain宣佈將於2026年5月13日至14日在舊金山Midway舉辦第二屆Interrupt大會,聚焦企業級Agent的規模化部署。大會將邀請Harrison Chase、Andrew Ng、MongoDB CEO Chirantan Desai及Box CEO Aaron Levie等嘉賓,分享Lyft、LinkedIn等企業的生產實踐,並提供產品演示、工作坊和AMA環節。

  • 大會主題從去年的“Agent能否投產”轉向“如何實現企業級規模化”,涵蓋團隊、工具和基礎設施。
  • 演講嘉賓包括LangChain CEO Harrison Chase、DeepLearning.AI創始人Andrew Ng、MongoDB CEO CJ Desai及Box CEO Aaron Levie。
站內正文

使用LangSmith進行迴歸測試

LangSmith 的迴歸測試功能幫助 AI 工程師通過比較實驗、跟蹤性能並深入分析運行間的變化,自信地評估和迭代 LLM 應用。與傳統的軟件測試不同,AI 測試可能無法獲得滿分,因此隨時間追蹤結果並比較單個數據點至關重要。LangSmith 提供了比較視圖、顯示選項、基線運行中自動高亮變化的數據點、過濾以及展開行詳細查看等功能,使快速迭代和探索數據變得簡單。

  • LangSmith 改進了 LLM 應用的迴歸測試流程。
  • AI 測試不同於傳統軟件測試,需要跟蹤性能變化。
站內正文

LangSmith 現已在 Azure 市場中作為可交易產品推出

LangSmith 是一個用於 LLM 應用的統一 DevOps 平台,現已在 Azure 市場中作為 Azure Kubernetes 應用提供,支持在 Azure VPC 內部署,完全控制數據,並支持 MACC 信用額度。

  • LangSmith 現可通過 Azure 市場購買,作為 Azure Kubernetes 應用部署。
  • 數據完全保留在 Azure VPC 內,無需與第三方共享。
站內正文

通過評估驅動開發迭代實現LLM可靠性

Dosu公司採用評估驅動開發(EDD)和LangSmith來構建可靠的LLM產品,監控生產性能,並自信地進行迭代。本文詳細介紹了Dosu的起源、早期挑戰、如何實施EDD以及利用LangSmith大規模監控和改進產品。

  • Dosu使用評估驅動開發(EDD)來確保LLM產品的可靠性,類似於測試驅動開發。
  • LangSmith的SDK易於集成,提供了細粒度的控制和可定製性,幫助Dosu監控所有活動。
站內正文

測試運行對比功能

LangSmith 推出了測試運行對比功能,允許用户並排查看多個測試運行的結果,結合人工檢查和自動評估,更高效地優化 LLM 應用。

  • 測試運行對比支持並排查看多個測試運行,便於比較。
  • 用户可以使用 LLM 輔助評估或正則表達式獲得初步分數,再手動深入分析。
站內正文

智能代理工程:AI代理集羣如何重新定義軟件工程

多代理系統模擬真實工程團隊,不僅能更快編寫代碼,還能將調試時間縮短93%並壓縮跨團隊交付。本文介紹了基於LangGraph的架構及其在Cisco的試點成果。

  • 智能代理工程是一種多代理協調模型,AI代理作為數字團隊成員,具有明確角色、共享記憶和共同可觀測層。
  • 在20多個調試工作流程的試點中,協調代理執行使根因定位時間減少93%,一個月內節省200多工程小時。
站內正文

智能體可觀測性:如何在生產環境中監控和評估LLM智能體

LLM智能體在生產環境中的行為與傳統軟件截然不同,需要新的可觀測性方法。本文探討了智能體監控的獨特挑戰,包括無限輸入空間、非確定性行為,以及如何通過標註隊列、LLM替代人工評估和專用工具(如LangSmith的Insights Agent、在線評估和儀表板)來擴展評估,並強調了跨職能團隊協作的重要性。

  • 智能體具有無限輸入空間,語言模型對細微變化敏感,導致行為非確定性。
  • 生產監控需關注自然語言交互本身,而不僅是系統指標。
站內正文

使用本地小語言模型構建AI代理

本文介紹瞭如何在自己的計算機上使用小型語言模型(SLM)構建完全本地運行的AI代理,無需互聯網連接或API費用。涵蓋AI代理和SLM的概念、本地運行的優勢、Ollama和LangChain的設置、逐步構建代理以及添加記憶和工具的方法,並討論了SLM的侷限性。

  • AI代理是使用語言模型進行推理和決策的程序,比普通聊天機器人更強大。
  • 小型語言模型(如Phi-3、Mistral 7B)可在標準硬件上運行,提供隱私和零成本。
站內正文

Cerebras

Cerebras生態系統正將超低延遲推理從差異化優勢轉變為關鍵基礎設施。通過其晶圓級芯片架構,Cerebras在推理速度上比傳統GPU系統快15倍,並迅速擴展模型支持、雲服務和開發者工具集成,使開發者能夠輕鬆利用這一速度構建從代理、編碼助手到語音界面等新一代應用。生態系統的快速擴展——包括支持主流開源模型、通過雲市場提供服務、以及集成LangChain、Docker等工具——正在將速度轉化為實際生產力,推動AI推理進入寬帶時代。

  • Cerebras的晶圓級芯片架構實現高達15倍的推理速度提升,是行業領先的低延遲解決方案。
  • 生態系統快速擴展:支持多種主流開源模型,並通過雲市場和自服務雲降低使用門檻。
站內正文

公司導航