中国开源AI战略挑战硅谷

MIT Technology Review AI·4月22日 04:45 UTC·作者 Caiwei Chen

关键信息

中国模型在严格的内容审核政策下训练，且存在关于不当蒸馏技术的指控；但它们现在在Hugging Face等平台上已领先全球模型下载量和用户生成变体数量。

资讯摘要

中国正通过发布高性能开源权重模型（如DeepSeek的R1）迅速提升其在全球AI领域的影响力，这些模型性能媲美美国顶尖系统但成本更低。这使全球开发者无需依赖美国企业即可自主适配和部署AI。一项研究显示，截至2025年8月，中国模型首次在全球下载量上超过美国。

尽管西方公司担忧知识产权泄露和滥用问题，许多全球南方国家将开源视为实现AI主权的途径。中国实验室也从中受益：开源策略弥补了先进芯片受限带来的不足，通过外部反馈和贡献构建强大生态系统。

资讯正文

中国开源押注

硅谷的人工智能公司遵循一套熟悉的策略：将核心技术隐藏在API背后，并对每一次使用收费。而中国的领先AI实验室则采取了不同的方式：他们以可下载的“开源权重”包形式发布模型。这使得开发者能够根据自己的需求调整模型，并在自有硬件上运行，从而构建产品，而无需与美国的科技巨头建立商业合作关系。

这一策略在2025年1月DeepSeek开源其R1推理模型后迅速普及。该模型性能堪比美国最先进的系统，据称成本仅为后者的一小部分。从纯粹的能力来看，中美实验室之间的差距似乎突然缩小了。但中国还赢得了一个更微妙、也更持久的优势：开发者的信任。向竞争对手收费的东西免费提供，自然会赢得好感。

中国紧抓这一势头不放。在DeepSeek发布一年后，一批中国开源巨头正沿着同样的路线前进，包括Z.ai（前身为智谱AI）、Moonshot、阿里巴巴的Qwen以及MiniMax。它们都在竞相推出更强大的模型，且追赶美国同行的速度远超多数人的预期。

这一点至关重要，因为人工智能热潮正在降温，企业正从热热闹闹的试点项目转向部署和集成阶段，在这个阶段，价格更低、更易定制的工具往往更具优势。中国的低价策略让预算有限的开发者可以更大胆地进行实验；而开源权重意味着他们无需获得许可即可灵活调整模型。

麻省理工学院与Hugging Face的研究人员的一项研究表明，截至2025年8月的一年内，中国开源权重模型占全球AI模型下载量的17.1%，略微超过了美国的15.86%——这是中国首次在这一指标上领先。而Hugging Face上个月的数据也显示，阿里巴巴的模型（包括其Qwen系列）如今拥有最多的用户自定义变体，数量甚至超过谷歌和Meta所有模型的总和。

然而，开源理想面临一些现实挑战。中国模型带有中国内容审核制度的印记，训练时被要求避免输出与政府政策相冲突的内容。今年2月，Anthropic指控多家中国实验室通过蒸馏技术非法提取Claude模型的能力——这是一种利用一个模型输出来训练另一个模型的标准行业做法，但OpenAI和Anthropic等顶级美国公司声称，中国企业使用了欺诈手段完成此类操作。

尽管西方有所抵制，全球南方国家却越来越接受中国模型，视开源为实现人工智能自主权的路径。新加坡政府支持的AI Singapore计划选择阿里巴巴的Qwen而非Meta的Llama来构建其最新区域模型；去年，马来西亚宣布其主权人工智能生态系统将基于DeepSeek运行。与此同时，从内罗毕到圣保罗再到旧金山的初创企业家们，正在中国技术的基础上搭建自己的产品。

中国押注开源

美国科技公司首席执行官认为，最优秀的模型应保持专有，一方面是为了回收高昂的训练成本，另一方面是担心强大的前沿模型可能被武器化。而中国的实验室则并非纯粹理想主义：开源不仅免费宣传，也是一种精明的应对策略。在无法获得受美国出口管制限制的尖端芯片的情况下，公开发布模型可以加速外部反馈和贡献的循环，从而弥补计算资源受限的问题。开发者基于你的模型构建得越多，你的生态系统就越强大，就像Linux和Android所展示的那样。这种采用自然会转化为API使用量和收入。

无论如何，开源模型已经让人工智能的未来比硅谷预期的更加多元。而且，已无回头之路。

深度解析

OpenAI正在全力投入打造一名全自动研究员

独家专访OpenAI首席科学家雅库布·帕霍奇基，探讨该公司新设立的重大挑战以及人工智能的未来。

宝可梦GO如何为配送机器人提供精确到厘米的世界视角

独家报道：Niantic的人工智能衍生公司正利用玩家提供的300亿张城市地标图像，训练一种全新的世界模型。

保持联系

获取《麻省理工科技评论》的最新动态

发现特别优惠、热门新闻、即将举行的活动等内容。

来源与参考

收录于 2026-04-22