DeepSeek V4:最大开源模型,成本低性能高

Simon Willison··作者 Simon Willison

关键信息

Pro模型在Hugging Face上为865GB,Flash为160GB。Pro版本可能通过从磁盘流式加载活跃专家的方式在128GB M5 MacBook Pro上运行。量化版本可实现消费级硬件上的本地部署。

资讯摘要

DeepSeek发布了其V4系列模型,包括DeepSeek-V4-Pro(总参数1.6万亿,活跃参数490亿)和DeepSeek-V4-Flash(总参数2840亿,活跃参数130亿),两者均采用专家混合架构,支持最多100万token上下文。这些模型采用MIT开源许可,相比之前的V3.2版本在规模和价格上都有显著提升。Simon Willison通过OpenRouter测试了它们,发现图像生成能力出色,例如画出骑自行车的鹈鹕。

定价非常低廉:Flash输入每百万token仅0.14美元,Pro为1.74美元,远低于GPT-5或Claude Opus等竞品。这使得大型语言模型更易于在消费级设备上本地部署,尤其是结合量化技术后。

DeepSeek V4:最大开源模型,成本低性能高

资讯正文

中国人工智能实验室DeepSeek上一次发布模型是V3.2(以及V3.2 Speciale)<a href="https://simonwillison.net/2025/Dec/1/deepseek-v32/">去年12月</a>。他们刚刚推出了备受期待的V4系列中的首个预览模型,分别是<a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro">DeepSeek-V4-Pro</a>和<a href="https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash">DeepSeek-V4-Flash</a>。

这两个模型都是拥有100万token上下文的专家混合模型(MoE)。Pro版本总参数量为1.6万亿,活跃参数为490亿;Flash版本总参数量为2840亿,活跃参数为130亿。它们采用的是标准的MIT许可证。

我认为这使得DeepSeek-V4-Pro成为目前最大的开源权重模型,它的规模超过了Kimi K2.6(1.1万亿)和GLM-5.1(7540亿),并且比DeepSeek V3.2(6850亿)大了两倍还多。

Pro版本在Hugging Face上的大小是865GB,Flash版本是160GB。我希望能用一个轻量量化后的Flash版本在我的128GB M5 MacBook Pro上运行。如果我能从磁盘流式加载必要的活跃专家,Pro模型或许也能跑起来。

目前我通过<a href="https://openrouter.ai/">OpenRouter</a>来试用这些模型,使用的是<a href="https://github.com/simonw/llm-openrouter">llm-openrouter</a>工具:

<pre><code>llm install llm-openrouter

llm openrouter refresh

llm -m openrouter/deepseek/deepseek-v4-pro 'Generate an SVG of a pelican riding a bicycle'

</code></pre>

这是DeepSeek-V4-Flash生成的鹈鹕骑自行车的SVG:<a href="https://gist.github.com/simonw/4a7a9e75b666a58a0cf81495acddf529">链接</a>。

<p><img alt="Excellent bicycle - good frame shape, nice chain, even has a reflector on the front wheel. Pelican has a mean looking expression but has its wings on the handlebars and feet on the pedals. Pouch is a little sharp." src="https://static.simonwillison.net/static/2026/deepseek-v4-flash.png" /></p>

而这是DeepSeek-V4-Pro的结果:<a href="https://gist.github.com/simonw/9e8dfed68933ab752c9cf27a03250a7c">链接</a>。

<p><img alt="Another solid bicycle, albeit the spokes are a little jagged and the frame is compressed a bit. Pelican has gone a bit wrong - it has a VERY large body, only one wing, a weirdly hairy backside and generally loos like it was drown be a different artist from the bicycle." src="https://static.simonwillison.net/static/2026/deepseek-v4-pro.png" /></p>

作为对比,请看我在去年12月使用的<a href="https://simonwillison.net/2025/Dec/1/deepseek-v32/">DeepSeek V3.2</a>、8月的<a href="https://simonwillison.net/2025/Aug/22/deepseek-31/">V3.1</a>,以及2025年3月的<a href="https://simonwillison.net/2025/Mar/24/deepseek/">V3-0324</a>所生成的鹈鹕图像。

所以这些鹈鹕图像已经相当不错了,但真正引人注目的是它们的<strong>成本</strong>。DeepSeek V4是一个非常、非常便宜的模型。

这是<a href="https://api-docs.deepseek.com/quick_start/pricing">DeepSeek的定价页面</a>。他们对Flash模型收取每百万token输入0.14美元、输出0.28美元的费用;对Pro模型则收取每百万token输入1.74美元、输出3.48美元的费用。

以下是与Gemini、OpenAI和Anthropic前沿模型的价格对比表:

DeepSeek V4-Flash 是小型模型中最便宜的,甚至比 OpenAI 的 GPT-5.4 Nano 还要便宜。DeepSeek V4-Pro 则是大型前沿模型中价格最低的。

来自 DeepSeek 论文的一段说明帮助解释了它们为何能将价格定得如此之低——在这一版本中,他们非常注重效率,尤其是在处理长上下文提示时:

在 100 万 token 上下文场景下,即使 DeepSeek-V4-Pro 拥有更多激活参数,其单 token FLOPs(以等效 FP8 FLOPs 计算)也仅为 DeepSeek-V3.2 的 27%,KV 缓存大小仅为后者的 10%。而 DeepSeek-V4-Flash 因为激活参数更少,在相同场景下进一步提升了效率:其单 token FLOPs 仅为 DeepSeek-V3.2 的 10%,KV 缓存大小仅为后者的 7%。

DeepSeek 自行报告的基准测试结果(见论文)显示,他们的 Pro 模型在性能上可与其它前沿模型竞争,但附有一条说明:

通过增加推理 token 数量,DeepSeek-V4-Pro-Max 在标准推理基准测试中表现优于 GPT-5.2 和 Gemini-3.0-Pro。然而,它的性能略逊于 GPT-5.4 和 Gemini-3.1-Pro,表明其发展轨迹落后于最先进前沿模型约 3 到 6 个月。

我正在关注 huggingface.co/unsloth/models,预计 Unsloth 团队很快会推出一系列量化版本。我很期待看到这个 Flash 模型在我的个人设备上运行效果如何。

DeepSeek V4——几乎站在前沿,价格却仅为几分之一

在人工智能领域,DeepSeek最新发布的V4模型正引发广泛关注。它不仅在性能上接近当前最先进的大语言模型,而且定价策略极具竞争力,仅需其他同类模型的几分之一费用。

这一突破性进展尤其受到开发者和企业的青睐,尤其是在中国AI快速发展的背景下,DeepSeek V4被视为推动生成式AI普及的重要力量。其开放的API接口和灵活的部署选项,使得中小型企业也能负担得起高性能AI服务。

值得注意的是,尽管DeepSeek来自中国,但其技术标准和开源生态已与国际接轨,吸引了全球开发者社区的关注。OpenRouter等平台也已集成该模型,进一步扩大了其应用场景。

从技术角度看,DeepSeek V4在多语言处理、代码生成和复杂推理任务中表现优异,同时保持了极高的性价比。这标志着AI模型正在从‘昂贵实验品’向‘实用生产力工具’转变。

对于希望降低AI使用门槛的用户来说,DeepSeek V4无疑是一个值得关注的选择。

来源与参考

  1. 原始链接
  2. DeepSeek previews new AI model that 'closes the gap' with frontier models | TechCrunch
  3. DeepSeek V4—almost on the frontier, a fraction of the price

收录于 2026-04-25