AI News HubLIVE
站内改写

DeepInfra 登陸 Hugging Face 推理提供商 🔥

DeepInfra 成為 Hugging Face Hub 上最新的推理提供商,提供100多個模型的低成本無伺服器推理服務,初始支援對話和文本生成任務,使用者可透過 UI 或 SDK 輕鬆使用。

文章情報

工程師進階

要點

  • DeepInfra 加入 Hugging Face 推理提供商生態系統,提供 100 多個模型的無伺服器推理。
  • 初始支援 DeepSeek V4、Kimi-K2.6、GLM-5.1 等模型,後續將擴充套件到影像、影片等模態。
  • 使用者可透過 Hugging Face 門戶直接使用或透過 SDK 整合,支援直接計費和路由計費兩種模式。
  • PRO 使用者每月可獲得 2 美元推理積分,並享受免費額度。

為什麼重要

這條新聞值得關注,因為DeepInfra 加入 Hugging Face 推理提供商生態系統,提供 100 多個模型的無伺服器推理。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

Hugging Face 宣佈 DeepInfra 正式成為其推理提供商(Inference Provider)生態系統的一部分。DeepInfra 是一個無伺服器 AI 推理平臺,以業內最具價效比的每 token 定價著稱,提供超過 100 種模型,涵蓋從大語言模型(LLM)到文本到影像、文本到影片、嵌入等多個類別。作為初步整合,DeepInfra 在 Hugging Face 上首先支援對話和文本生成任務,使用者可直接訪問 DeepSeek V4、Kimi-K2.6、GLM-5.1 等流行的開源權重 LLM。未來還將推出對文本到影像、文本到影片、嵌入等更多工的支援。

在 Hugging Face 的模型頁面上,使用者可以在賬戶設定中新增自己的 DeepInfra API 金鑰,或直接透過 Hugging Face 路由請求。對於自定義金鑰模式,請求直接傳送到 DeepInfra,按 DeepInfra 的標準計費;對於路由模式,使用者無需額外令牌,費用透過 Hugging Face 賬戶支付,且 Hugging Face 不收取任何加價。此外,PRO 使用者每月可獲得 2 美元推理積分,適用於所有提供商。

開發者還可以透過 Hugging Face 的 Python 和 JavaScript SDK 輕鬆整合 DeepInfra。例如,使用 Python 的 OpenAI 相容客戶端,設定 base_url 為 https://router.huggingface.co/v1 並傳入 HF_TOKEN 即可呼叫 DeepSeek V4 Pro 等模型。JavaScript 使用者同樣可以透過 OpenAI SDK 實現類似功能。

Hugging Face 鼓勵使用者提供反饋,並計劃未來與其他提供商建立收益共享協議。更多資訊可查閱 DeepInfra 在 Hugging Face 上的專用文件頁面。