DeepInfra 成为 Hugging Face 推理提供商之一
Hugging Face Blog··作者 Aray Sultanbekova
关键信息
用户可以选择使用自己的 DeepInfra API 密钥(由 DeepInfra 直接计费)或通过 Hugging Face 路由请求(费用计入 HF 账户),且 Hugging Face 不收取任何额外费用。
资讯摘要
Hugging Face 宣布 DeepInfra 已成为其支持的推理提供商,用户可直接从模型页面或 SDK 运行 DeepSeek V4 Pro、Kimi-K2.6 和 GLM-5.1 等模型。该集成支持直接调用和通过 Hugging Face 路由两种方式,费用透明。
开发者还能设置偏好并使用 Pi、OpenCode 和 Hermes Agent 等工具,无需额外开发代码。这使得团队在构建 AI 应用时能更快更简便地部署模型。

资讯正文
我们很高兴地宣布,DeepInfra现已作为Hugging Face Hub的受支持推理提供商上线!
DeepInfra加入了我们的不断扩展的生态系统,增强了Hub模型页面上原生无服务器推理的广度和能力。推理提供商也已无缝集成到我们的客户端SDK(适用于JavaScript和Python),使您能够轻松使用各种模型,并通过您偏好的提供商进行部署。
DeepInfra是一个无服务器AI推理平台,提供行业内最具成本效益的每token定价之一。其包含超过100个模型的目录,让开发者能够以最少的配置将多种AI功能集成到自己的应用中。
DeepInfra支持广泛的模型类型——从大语言模型(LLM)到文生图、文生视频、嵌入向量等。在本次初始集成中,DeepInfra将在Hugging Face上推出对话和文本生成任务的支持,使用户可以访问如DeepSeek V4、Kimi-K2.6、GLM-5.1等流行的开源权重大语言模型。更多任务(包括文生图、文生视频、嵌入向量等)的支持也将很快推出!
有关如何使用DeepInfra作为推理提供商的更多信息,请参阅其专用文档页面。
查看DeepInfra支持的完整模型列表:此处链接。
关注DeepInfra在Hugging Face上的主页:https://huggingface.co/DeepInfra。
在您的用户账户设置中,您可以:
- 为已注册的提供商设置自己的API密钥。如果没有设置自定义密钥,请求将通过Hugging Face路由。
- 按偏好顺序排列提供商。此设置适用于模型页面中的小部件和代码片段。
如前所述,调用推理提供商时有两种模式:
- 自定义密钥(请求直接发送至推理提供商,使用您对应的提供商API密钥)
- 由HF路由(此时无需提供商Token,费用直接计入您的Hugging Face账户,而非提供商账户)
模型页面会展示兼容当前模型的第三方推理提供商(按用户偏好排序)。
DeepInfra可通过Hugging Face SDK使用——Python版本为huggingface_hub(>= 1.11.2),JavaScript版本为@huggingface/inference。
以下示例展示了如何通过DeepInfra使用DeepSeek V4 Pro。使用Hugging Face Token进行身份验证——请求将自动路由至DeepInfra。
Hugging Face推理提供商已集成到大多数Agent Harness中,包括Pi、OpenCode、Hermes Agents、OpenClaw等。这意味着您可以直接将DeepInfra托管的模型接入您喜爱的工具,无需额外的适配代码。浏览完整的集成列表:此处链接。
import os
from openai import OpenAI
client = OpenAI(
base_url="https://router.huggingface.co/v1",
api_key=os.environ["HF_TOKEN"],
completion = client.chat.completions.create(
model="deepseek-ai/DeepSeek-V4-Pro:deepinfra",
messages=[
{
"role": "user",
"content": "Write a Python function that returns the nth Fibonacci number using memoization."
}
print(completion.choices[0].message)
import { OpenAI } from "openai";
const client = new OpenAI({
baseURL: "https://router.huggingface.co/v1",
apiKey: process.env.HF_TOKEN,
});
const chatCompletion = await client.chat.completions.create({
model: "deepseek-ai/DeepSeek-V4-Pro:deepinfra",
messages: [
{
role: "user",
content: "Write a Python function that returns the nth Fibonacci number using memoization.",
},
});
console.log(chatCompletion.choices[0].message);
对于直接请求,即当你使用推理提供商提供的密钥时,费用将由该提供商收取。例如,如果你使用 DeepInfra 的 API 密钥,费用将计入你的 DeepInfra 账户。
对于路由请求,即当你通过 Hugging Face Hub 认证时,你只需支付标准提供商的 API 费用。我们不会加收额外费用;我们只是直接传递提供商的成本。(未来,我们可能会与提供商合作伙伴建立收入分成协议。)
重要提示 ‼️ PRO 用户每月可获得价值 2 美元的推理积分,这些积分可在所有提供商之间使用。🔥
订阅 Hugging Face PRO 计划以获取推理积分、ZeroGPU、Spaces 开发模式、20 倍更高的限制等更多功能。
我们还为已登录的免费用户提供少量免费推理额度,但如果你可以的话,请升级到 PRO 版本!
我们非常希望听到你的反馈!请在这里分享你的想法和评论:https://huggingface.co/spaces/huggingface/HuggingDiscussions/discussions/49
来源与参考
收录于 2026-04-30