DeepSeek V4：最大开源模型，成本低性能高

Simon Willison·4月24日 14:01 UTC·作者 Simon Willison

关键信息

Pro模型在Hugging Face上为865GB，Flash为160GB。Pro版本可能通过从磁盘流式加载活跃专家的方式在128GB M5 MacBook Pro上运行。量化版本可实现消费级硬件上的本地部署。

资讯摘要

DeepSeek发布了其V4系列模型，包括DeepSeek-V4-Pro（总参数1.6万亿，活跃参数490亿）和DeepSeek-V4-Flash（总参数2840亿，活跃参数130亿），两者均采用专家混合架构，支持最多100万token上下文。这些模型采用MIT开源许可，相比之前的V3.2版本在规模和价格上都有显著提升。Simon Willison通过OpenRouter测试了它们，发现图像生成能力出色，例如画出骑自行车的鹈鹕。

定价非常低廉：Flash输入每百万token仅0.14美元，Pro为1.74美元，远低于GPT-5或Claude Opus等竞品。这使得大型语言模型更易于在消费级设备上本地部署，尤其是结合量化技术后。

资讯正文

中国人工智能实验室DeepSeek上一次发布模型是V3.2（以及V3.2 Speciale）<a href="https://simonwillison.net/2025/Dec/1/deepseek-v32/">去年12月</a>。他们刚刚推出了备受期待的V4系列中的首个预览模型，分别是<a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro">DeepSeek-V4-Pro</a>和<a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash">DeepSeek-V4-Flash</a>。

这两个模型都是拥有100万token上下文的专家混合模型（MoE）。Pro版本总参数量为1.6万亿，活跃参数为490亿；Flash版本总参数量为2840亿，活跃参数为130亿。它们采用的是标准的MIT许可证。

我认为这使得DeepSeek-V4-Pro成为目前最大的开源权重模型，它的规模超过了Kimi K2.6（1.1万亿）和GLM-5.1（7540亿），并且比DeepSeek V3.2（6850亿）大了两倍还多。

Pro版本在Hugging Face上的大小是865GB，Flash版本是160GB。我希望能用一个轻量量化后的Flash版本在我的128GB M5 MacBook Pro上运行。如果我能从磁盘流式加载必要的活跃专家，Pro模型或许也能跑起来。

目前我通过<a href="https://openrouter.ai/">OpenRouter</a>来试用这些模型，使用的是<a href="https://github.com/simonw/llm-openrouter">llm-openrouter</a>工具：

<pre><code>llm install llm-openrouter

llm openrouter refresh

llm -m openrouter/deepseek/deepseek-v4-pro 'Generate an SVG of a pelican riding a bicycle'

</code></pre>

这是DeepSeek-V4-Flash生成的鹈鹕骑自行车的SVG：<a href="https://gist.github.com/simonw/4a7a9e75b666a58a0cf81495acddf529">链接</a>。

而这是DeepSeek-V4-Pro的结果：<a href="https://gist.github.com/simonw/9e8dfed68933ab752c9cf27a03250a7c">链接</a>。

作为对比，请看我在去年12月使用的<a href="https://simonwillison.net/2025/Dec/1/deepseek-v32/">DeepSeek V3.2</a>、8月的<a href="https://simonwillison.net/2025/Aug/22/deepseek-31/">V3.1</a>，以及2025年3月的<a href="https://simonwillison.net/2025/Mar/24/deepseek/">V3-0324</a>所生成的鹈鹕图像。

所以这些鹈鹕图像已经相当不错了，但真正引人注目的是它们的成本。DeepSeek V4是一个非常、非常便宜的模型。

这是<a href="https://api-docs.deepseek.com/quick_start/pricing">DeepSeek的定价页面</a>。他们对Flash模型收取每百万token输入0.14美元、输出0.28美元的费用；对Pro模型则收取每百万token输入1.74美元、输出3.48美元的费用。

以下是与Gemini、OpenAI和Anthropic前沿模型的价格对比表：

DeepSeek V4-Flash 是小型模型中最便宜的，甚至比 OpenAI 的 GPT-5.4 Nano 还要便宜。DeepSeek V4-Pro 则是大型前沿模型中价格最低的。

来自 DeepSeek 论文的一段说明帮助解释了它们为何能将价格定得如此之低——在这一版本中，他们非常注重效率，尤其是在处理长上下文提示时：

在 100 万 token 上下文场景下，即使 DeepSeek-V4-Pro 拥有更多激活参数，其单 token FLOPs（以等效 FP8 FLOPs 计算）也仅为 DeepSeek-V3.2 的 27%，KV 缓存大小仅为后者的 10%。而 DeepSeek-V4-Flash 因为激活参数更少，在相同场景下进一步提升了效率：其单 token FLOPs 仅为 DeepSeek-V3.2 的 10%，KV 缓存大小仅为后者的 7%。

DeepSeek 自行报告的基准测试结果（见论文）显示，他们的 Pro 模型在性能上可与其它前沿模型竞争，但附有一条说明：

通过增加推理 token 数量，DeepSeek-V4-Pro-Max 在标准推理基准测试中表现优于 GPT-5.2 和 Gemini-3.0-Pro。然而，它的性能略逊于 GPT-5.4 和 Gemini-3.1-Pro，表明其发展轨迹落后于最先进前沿模型约 3 到 6 个月。

我正在关注 huggingface.co/unsloth/models，预计 Unsloth 团队很快会推出一系列量化版本。我很期待看到这个 Flash 模型在我的个人设备上运行效果如何。

DeepSeek V4——几乎站在前沿，价格却仅为几分之一

在人工智能领域，DeepSeek最新发布的V4模型正引发广泛关注。它不仅在性能上接近当前最先进的大语言模型，而且定价策略极具竞争力，仅需其他同类模型的几分之一费用。

这一突破性进展尤其受到开发者和企业的青睐，尤其是在中国AI快速发展的背景下，DeepSeek V4被视为推动生成式AI普及的重要力量。其开放的API接口和灵活的部署选项，使得中小型企业也能负担得起高性能AI服务。

值得注意的是，尽管DeepSeek来自中国，但其技术标准和开源生态已与国际接轨，吸引了全球开发者社区的关注。OpenRouter等平台也已集成该模型，进一步扩大了其应用场景。

从技术角度看，DeepSeek V4在多语言处理、代码生成和复杂推理任务中表现优异，同时保持了极高的性价比。这标志着AI模型正在从‘昂贵实验品’向‘实用生产力工具’转变。

对于希望降低AI使用门槛的用户来说，DeepSeek V4无疑是一个值得关注的选择。

来源与参考

收录于 2026-04-25