AI News HubLIVE
站内改写

DeepInfra 登陸 Hugging Face 推理提供商 🔥

DeepInfra 成為 Hugging Face Hub 上最新的推理提供商,提供100多個模型的低成本無服務器推理服務,初始支持對話和文本生成任務,用户可通過 UI 或 SDK 輕鬆使用。

文章情報

工程師進階

要點

  • DeepInfra 加入 Hugging Face 推理提供商生態系統,提供 100 多個模型的無服務器推理。
  • 初始支持 DeepSeek V4、Kimi-K2.6、GLM-5.1 等模型,後續將擴展到圖像、視頻等模態。
  • 用户可通過 Hugging Face 門户直接使用或通過 SDK 集成,支持直接計費和路由計費兩種模式。
  • PRO 用户每月可獲得 2 美元推理積分,並享受免費額度。

為甚麼重要

這條新聞值得關注,因為DeepInfra 加入 Hugging Face 推理提供商生態系統,提供 100 多個模型的無服務器推理。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Hugging Face 宣佈 DeepInfra 正式成為其推理提供商(Inference Provider)生態系統的一部分。DeepInfra 是一個無服務器 AI 推理平台,以業內最具性價比的每 token 定價著稱,提供超過 100 種模型,涵蓋從大語言模型(LLM)到文本到圖像、文本到視頻、嵌入等多個類別。作為初步集成,DeepInfra 在 Hugging Face 上首先支持對話和文本生成任務,用户可直接訪問 DeepSeek V4、Kimi-K2.6、GLM-5.1 等流行的開源權重 LLM。未來還將推出對文本到圖像、文本到視頻、嵌入等更多任務的支持。

在 Hugging Face 的模型頁面上,用户可以在賬户設置中添加自己的 DeepInfra API 密鑰,或直接通過 Hugging Face 路由請求。對於自定義密鑰模式,請求直接發送到 DeepInfra,按 DeepInfra 的標準計費;對於路由模式,用户無需額外令牌,費用通過 Hugging Face 賬户支付,且 Hugging Face 不收取任何加價。此外,PRO 用户每月可獲得 2 美元推理積分,適用於所有提供商。

開發者還可以通過 Hugging Face 的 Python 和 JavaScript SDK 輕鬆集成 DeepInfra。例如,使用 Python 的 OpenAI 兼容客户端,設置 base_url 為 https://router.huggingface.co/v1 並傳入 HF_TOKEN 即可調用 DeepSeek V4 Pro 等模型。JavaScript 用户同樣可以通過 OpenAI SDK 實現類似功能。

Hugging Face 鼓勵用户提供反饋,並計劃未來與其他提供商建立收益共享協議。更多信息可查閲 DeepInfra 在 Hugging Face 上的專用文檔頁面。