DeepInfra が Hugging Face Inference Providers に登場 🔥
DeepInfra が Hugging Face Hub の Inference Provider に加わり、100以上のモデルを低コストのサーバーレス推論で提供。会話・テキスト生成タスクから始まり、UI や SDK から簡単に利用可能。
記事インテリジェンス
要点
- DeepInfra が Hugging Face の Inference Provider エコシステムに参加し、100以上のモデルに対応。
- 初期対応モデルは DeepSeek V4、Kimi-K2.6、GLM-5.1 などで、今後画像・動画タスクも追加予定。
- カスタムキー方式または HF 経由のルーティング方式が選択可能。課金は直接または HF 経由でマークアップなし。
- PRO ユーザーは毎月2ドルの推論クレジットを獲得でき、無料ユーザーにも少額枠あり。
重要な理由
このニュースが重要なのは、DeepInfra が Hugging Face の Inference Provider エコシステムに参加し、100以上のモデルに対応ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
Hugging Face は、DeepInfra が同社の Inference Provider エコシステムに新たに加わったことを発表しました。DeepInfra はサーバーレス AI 推論プラットフォームであり、業界で最もコスト効率の高いトークン単価を提供し、100以上のモデルを保有しています。LLM からテキスト画像生成、テキスト動画生成、埋め込みなど、幅広いモデルタイプをサポートしています。今回の初期統合では、会話およびテキスト生成タスクが Hugging Face 上で利用可能となり、DeepSeek V4、Kimi-K2.6、GLM-5.1 などの人気オープンウェイト LLM にアクセスできます。今後、テキスト画像生成、テキスト動画生成、埋め込みなどの追加タスクも展開予定です。
Hugging Face のモデルページでは、ユーザーはアカウント設定で自らの DeepInfra API キーを設定するか、HF 経由でリクエストをルーティングできます。カスタムキーモードでは直接 DeepInfra にリクエストが送られ、DeepInfra の標準料金が適用されます。ルーティングモードでは、プロバイダーの API 料金のみが HF アカウントに請求され、Hugging Face による追加マークアップはありません。さらに、PRO ユーザーは毎月2ドルの推論クレジットを取得でき、すべてのプロバイダーで使用可能です。
開発者は、Hugging Face の Python SDK(huggingface_hub >= 1.11.2)および JavaScript SDK(@huggingface/inference)を介して DeepInfra を簡単に統合できます。例えば、Python では OpenAI 互換クライアントを使用し、base_url を https://router.huggingface.co/v1 に設定し、HF_TOKEN を渡すだけで DeepSeek V4 Pro を呼び出せます。JavaScript でも同様のコードで実現可能です。
Hugging Face はユーザーからのフィードバックを歓迎しており、今後のプロバイダーとの収益共有契約も検討しています。詳細は DeepInfra の専用ドキュメントページをご覧ください。