AI News HubLIVE
公開記事 9収集記事 10信頼度 84更新頻度 120 分
稼働状態 正常ソース種別 公式全文利用権限 公式全文最終取り込み 2026-05-15ID groq-blog状態 有効

Official AI inference platform blog; confirm reuse terms before full body display.

最新公開記事

GroqCloudでリモートMCPサポートがベータ版に

GroqCloudは、リモートモデルコンテキストプロトコル(MCP)サーバー統合のベータ版提供を発表。OpenAI互換のAPIを介して外部ツールに接続でき、コード変更なしで高速かつ低コストなAIアプリケーションを実現します。

  • リモートMCP統合により、AIモデルがGitHubやブラウザ、データベースなどの外部ツールと連携可能に。
  • OpenAI Responses APIおよびリモートMCP仕様と互換性があり、ゼロコードで移行可能。
サイト内本文

GroqCloud、GPT‑OSSモデルにプロンプトキャッシングと値下げを導入

Groqは、GPT-OSSモデルに対する2つの重要なアップデート、価格引き下げとプロンプトキャッシング機能の提供を発表しました。これらはAI推論のコスト効率と速度を向上させることを目的としています。新価格は即時発効し、2025年10月の未払い請求書にも遡及適用されます。プロンプトキャッシングにより、キャッシュされたトークンが最大50%割引、レイテンシが低減、レート制限が緩和され、設定は不要です。

  • GPT-OSSモデルの価格引き下げ、即時発効、2025年10月に遡及。
  • プロンプトキャッシングを開始、キャッシュトークン50%割引、レイテンシ低減。
サイト内本文

プロダクト内でのLLM活用:実践的フィールドガイド

本稿は、オープンソースLLMを実際のプロダクトに確実に統合するための実践的ガイドです。核となるのは4ステップのループ:Read(必要なコンテキストのみ)、Constrain(明確なシステムとフォーマットルール)、Act(構造化出力、関数呼び出し、またはプレーンテキスト)、Explain(ユーザーにステップと引用を表示)。また、一般的なパターン(ルーター、抽出器、翻訳器など)、安全なリリース(テスト、監視、フォールバック)、よくある落とし穴についてもカバーしています。目標は、ユーザーが毎日依存する、目に見えない信頼性の高いAI機能を構築することです。

  • 優れたAI機能はしばしば目に見えず、ユーザーはAIを意識せずにタスクを完了できる。
  • コアワークフローは4ステップのループ:Read、Constrain、Act、Explain。
サイト内本文

OpenAIオープンセーフティモデルのデイゼロサポート

GroqCloudは、OpenAIの最新オープンソースセーフティモデルGPT-OSS-Safeguard-20Bを即日サポートし、1000 t/s超の推論速度を提供します。このモデルはセーフティ分類ワークロード向けに設計され、独自ポリシーの持ち込み、設定可能な推論努力、完全な推論トレースを備え、コストはベースモデルと同じです。

  • OpenAIがGPT-OSS-20Bをベースにした安全分類モデルGPT-OSS-Safeguard-20Bを公開。
  • GroqCloudが即日サポート、推論速度は1000 t/s超。
サイト内本文

GroqCloud でリモート MCP サポートのベータ版を開始

Groq は GroqCloud 上で MCP コネクタのベータ版を発表しました。最初に Google Workspace(Gmail、ドライブ、カレンダー)をサポートします。これらのプリビルドされた Groq ホストの MCP サーバーにより、AI エージェントは Responses API を介して Google ツールと対話でき、独自の MCP サーバーを管理する必要がありません。

  • GroqCloud が MCP コネクタのベータ版を開始、最初に Google Workspace をサポート。
  • ドロップイン互換性、ゼロデプロイ負担、低レイテンシ、低コスト。
サイト内本文

Groqが2025年Gartner® AIインフラストラクチャのクールベンダーに選出

Groqは、Gartnerの2025年AIインフラストラクチャレポートでクールベンダーに選ばれました。LPUチップの決定論的で低レイテンシな推論と線形スケーリングが評価されています。250万人以上の開発者がGroqを利用し、GPU比で最大5倍高速で低コストです。

  • GroqのLPUは、GPUとは異なり、決定論的で低レイテンシな推論を提供し、線形にスケールします。
  • この認定は、リアルタイムAIアプリケーション向けインフラストラクチャにおけるGroqの独自の地位を示しています。
サイト内本文

アメリカのAIスタックを前進させる

記事は、アメリカのAIコンピューティング、特に推論におけるリーダーシップと、その優位性を維持するための輸出政策について論じています。市場主導のエコシステムと業界連合の役割を強調し、柔軟なマルチモデルフレームワークを提案しています。

  • 米国はAIコンピューティングで支配的で、ハイエンドトレーニング能力の74%を掌握。
  • 推論コンピューティングがAI展開の重要なボトルネックになりつつある。
サイト内本文

GroqCloud:需要に応える拡大

GroqCloudは、リアルタイムアプリケーションが実験から本番へ移行する需要の高まりに応えるため、AI推論インフラをグローバルに拡大しています。最近英国にEquinixと提携して新データセンターを開設し、ヨーロッパの開発者や企業に低遅延で高性能な推論を提供します。GroqCloudは現在350万人以上の開発者を擁し、本番トラフィックは増加し続けています。

  • GroqCloudの開発者数が350万人を超え、本番トラフィックが増加。
  • 英国の新データセンターをEquinixと提携して開設、欧州でのプレゼンス拡大。
サイト内本文

LPUの内部構造:Groqの速度を解き明かす

GroqのLPUは推論専用に設計されたハードウェアであり、TruePoint数値方式、SRAMストレージ、静的スケジューリング、テンソル並列処理などを通じて、精度を犠牲にすることなく超低遅延推論を実現します。MoonshotのKimi K2はGroq上で40倍のパフォーマンスを発揮し、LPUアーキテクチャの優位性を示しています。

  • LPUは精度と速度のトレードオフを解消する推論専用設計
  • TruePoint数値方式により、BF16比2~4倍の高速化と精度維持を両立
サイト内本文

全ソース