2026-04-29站内改写

DeepInfra が Hugging Face Inference Providers に登場 🔥

DeepInfra が Hugging Face Hub の Inference Provider に加わり、100以上のモデルを低コストのサーバーレス推論で提供。会話・テキスト生成タスクから始まり、UI や SDK から簡単に利用可能。

記事インテリジェンス

エンジニア上級

要点

DeepInfra が Hugging Face の Inference Provider エコシステムに参加し、100以上のモデルに対応。
初期対応モデルは DeepSeek V4、Kimi-K2.6、GLM-5.1 などで、今後画像・動画タスクも追加予定。
カスタムキー方式または HF 経由のルーティング方式が選択可能。課金は直接または HF 経由でマークアップなし。
PRO ユーザーは毎月2ドルの推論クレジットを獲得でき、無料ユーザーにも少額枠あり。

重要な理由

このニュースが重要なのは、DeepInfra が Hugging Face の Inference Provider エコシステムに参加し、100以上のモデルに対応ためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

Hugging Face は、DeepInfra が同社の Inference Provider エコシステムに新たに加わったことを発表しました。DeepInfra はサーバーレス AI 推論プラットフォームであり、業界で最もコスト効率の高いトークン単価を提供し、100以上のモデルを保有しています。LLM からテキスト画像生成、テキスト動画生成、埋め込みなど、幅広いモデルタイプをサポートしています。今回の初期統合では、会話およびテキスト生成タスクが Hugging Face 上で利用可能となり、DeepSeek V4、Kimi-K2.6、GLM-5.1 などの人気オープンウェイト LLM にアクセスできます。今後、テキスト画像生成、テキスト動画生成、埋め込みなどの追加タスクも展開予定です。

Hugging Face のモデルページでは、ユーザーはアカウント設定で自らの DeepInfra API キーを設定するか、HF 経由でリクエストをルーティングできます。カスタムキーモードでは直接 DeepInfra にリクエストが送られ、DeepInfra の標準料金が適用されます。ルーティングモードでは、プロバイダーの API 料金のみが HF アカウントに請求され、Hugging Face による追加マークアップはありません。さらに、PRO ユーザーは毎月2ドルの推論クレジットを取得でき、すべてのプロバイダーで使用可能です。

開発者は、Hugging Face の Python SDK（huggingface_hub >= 1.11.2）および JavaScript SDK（@huggingface/inference）を介して DeepInfra を簡単に統合できます。例えば、Python では OpenAI 互換クライアントを使用し、base_url を https://router.huggingface.co/v1 に設定し、HF_TOKEN を渡すだけで DeepSeek V4 Pro を呼び出せます。JavaScript でも同様のコードで実現可能です。

Hugging Face はユーザーからのフィードバックを歓迎しており、今後のプロバイダーとの収益共有契約も検討しています。詳細は DeepInfra の専用ドキュメントページをご覧ください。