AI News HubLIVE
站内改写

DeepInfra 登陆 Hugging Face 推理提供商 🔥

DeepInfra 成为 Hugging Face Hub 上最新的推理提供商,提供100多个模型的低成本无服务器推理服务,初始支持对话和文本生成任务,用户可通过 UI 或 SDK 轻松使用。

文章情报

工程师进阶

要点

  • DeepInfra 加入 Hugging Face 推理提供商生态系统,提供 100 多个模型的无服务器推理。
  • 初始支持 DeepSeek V4、Kimi-K2.6、GLM-5.1 等模型,后续将扩展到图像、视频等模态。
  • 用户可通过 Hugging Face 门户直接使用或通过 SDK 集成,支持直接计费和路由计费两种模式。
  • PRO 用户每月可获得 2 美元推理积分,并享受免费额度。

为什么重要

这条新闻值得关注,因为DeepInfra 加入 Hugging Face 推理提供商生态系统,提供 100 多个模型的无服务器推理。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

Hugging Face 宣布 DeepInfra 正式成为其推理提供商(Inference Provider)生态系统的一部分。DeepInfra 是一个无服务器 AI 推理平台,以业内最具性价比的每 token 定价著称,提供超过 100 种模型,涵盖从大语言模型(LLM)到文本到图像、文本到视频、嵌入等多个类别。作为初步集成,DeepInfra 在 Hugging Face 上首先支持对话和文本生成任务,用户可直接访问 DeepSeek V4、Kimi-K2.6、GLM-5.1 等流行的开源权重 LLM。未来还将推出对文本到图像、文本到视频、嵌入等更多任务的支持。

在 Hugging Face 的模型页面上,用户可以在账户设置中添加自己的 DeepInfra API 密钥,或直接通过 Hugging Face 路由请求。对于自定义密钥模式,请求直接发送到 DeepInfra,按 DeepInfra 的标准计费;对于路由模式,用户无需额外令牌,费用通过 Hugging Face 账户支付,且 Hugging Face 不收取任何加价。此外,PRO 用户每月可获得 2 美元推理积分,适用于所有提供商。

开发者还可以通过 Hugging Face 的 Python 和 JavaScript SDK 轻松集成 DeepInfra。例如,使用 Python 的 OpenAI 兼容客户端,设置 base_url 为 https://router.huggingface.co/v1 并传入 HF_TOKEN 即可调用 DeepSeek V4 Pro 等模型。JavaScript 用户同样可以通过 OpenAI SDK 实现类似功能。

Hugging Face 鼓励用户提供反馈,并计划未来与其他提供商建立收益共享协议。更多信息可查阅 DeepInfra 在 Hugging Face 上的专用文档页面。