Groq Blog AI 新聞來源

公開文章 9採集文章 10可信度 84刷新頻率 120 分鐘

健康狀態健康來源類型官方原文權限 官方原文最近入庫 2026-05-15ID groq-blog運行狀態 已啟用

Official AI inference platform blog; confirm reuse terms before full body display.

最新公開文章

GroqCloud Beta版推出遠端MCP支援

2026-05-15 10:17 UTC+8

GroqCloud宣佈其遠端模型上下文協議（MCP）伺服器整合功能已進入Beta階段，開發者可無縫連線外部工具，實現更快、更低成本的AI應用。該功能相容OpenAI API，支援零程式碼遷移。

遠端MCP整合使AI模型能呼叫外部工具（如GitHub、瀏覽器、資料庫等）。
相容OpenAI Responses API和遠端MCP規範，遷移無需修改程式碼。

GroqCloud為GPT-OSS模型推出提示快取與降價措施

2026-05-15 10:16 UTC+8

Groq宣佈對其GPT-OSS模型進行兩項重要更新：降低價格和推出提示快取功能，旨在提升AI推理的成本效益和速度。降價立即生效，並追溯至2025年10月所有未付款發票。提示快取可帶來高達50%的快取令牌折扣、更低的延遲以及更高的速率限制，且無需任何配置。

GPT-OSS模型降價，立即生效並追溯至2025年10月。
推出提示快取，快取令牌享50%折扣，降低延遲。

產品內整合LLM：實用現場指南

2026-05-15 10:16 UTC+8

本文基於實踐經驗，介紹如何將開源LLM可靠地整合到產品中。核心是四步迴圈：讀取（僅取必要上下文）、約束（明確系統和格式規則）、執行（結構化輸出、函式呼叫或純文本）、解釋（向使用者展示步驟和引用）。還涵蓋常見模式（路由器、提取器、翻譯器等）、安全釋出（測試、監控、回退）及常見陷阱。目標是打造使用者無感知、可靠的AI特性。

最佳AI特性往往是隱形的，使用者無需意識到AI的存在即可完成任務。
核心工作流是四步迴圈：讀取、約束、執行、解釋。

GroqCloud 宣佈即日起支援 OpenAI 最新開源安全模型 GPT-OSS-Safeguard-20B，提供超過 1000 t/s 的推理速度。該模型專為安全分類工作負載設計，支援使用者自定義策略、可配置推理力度及完整推理軌跡，適用於企業文件掃描、AI 聊天機器人、政策審計和使用者生成內容平臺等場景。定價與基礎 GPT-OSS-20B 相同，輸入 token $0.075/M，輸出 token $0.30/M。

OpenAI 釋出全新開源安全模型 GPT-OSS-Safeguard-20B，基於 GPT-OSS-20B 微調。
GroqCloud 提供首發支援，推理速度超過 1000 t/s。

GroqCloud 推出遠端 MCP 支援測試版

2026-05-15 10:15 UTC+8

Groq 宣佈在 GroqCloud 上推出 MCP 聯結器測試版，率先支援 Google Workspace（Gmail、雲端硬碟和日曆）。這些預建的 MCP 伺服器由 Groq 託管，使 AI 代理能夠透過 Responses API 與 Google 工具互動，而無需管理自己的 MCP 伺服器。

GroqCloud 推出 MCP 聯結器測試版，率先支援 Google Workspace。
提供即插即用相容性，零部署負擔，低延遲和低成本。

Groq 被 2025 年 Gartner® AI 基礎架構酷供應商報告收錄

2026-05-15 10:14 UTC+8

Groq 憑藉其 LPU 晶片的確定性、低延遲推理和線性擴充套件能力，被 Gartner 評為 2025 年 AI 基礎架構領域的酷供應商。超過 250 萬開發者使用 Groq，其效能比 GPU 快 5 倍且成本更低。

Groq 的 LPU 提供確定性、低延遲推理，線性擴充套件，與 GPU 不同。
該認可凸顯了 Groq 在即時 AI 應用基礎架構中的獨特地位。

推動美國人工智慧堆疊發展

2026-05-15 10:14 UTC+8

文章討論了美國在人工智慧計算領域的領導地位，特別是推理計算的重要性，以及如何透過出口政策維持優勢。強調了市場驅動的生態系統和行業聯盟的作用，建議採用靈活的多模型框架。

美國在AI計算領域佔據主導地位，控制全球74%的高階訓練計算能力。
推理計算成為AI部署的關鍵瓶頸，其需求正迅速增長。

GroqCloud：擴充套件以滿足需求

2026-05-15 10:13 UTC+8

GroqCloud正在全球擴充套件其AI推理基礎設施，以應對即時應用從實驗轉向生產帶來的需求增長。最近在英國新建的資料中心，與Equinix合作，為歐洲開發者和企業提供低延遲、高效能的推理服務。GroqCloud現已擁有超過350萬開發者，生產流量持續增長。

GroqCloud開發者數量超過350萬，生產流量持續增長。
在英國新建資料中心，與Equinix合作，擴充套件歐洲業務。

深度解析 LPU：Groq 速度背後的秘密

2026-05-15 10:12 UTC+8

Groq 的 LPU 是專為推理設計的硬體，透過 TruePoint 數字、SRAM 儲存、靜態排程和即時張量並行等技術，在不犧牲精度的情況下實現超低延遲推理。Moonshot 的 Kimi K2 模型在 Groq 上以 40 倍效能執行，展示了 LPU 架構的優勢。

LPU 為推理而生，消除了準確性與速度之間的權衡
TruePoint 數字技術透過選擇性精度降低，在保持精度的同時實現 2-4 倍加速

Groq Blog