中国开源AI战略挑战硅谷
MIT Technology Review AI··作者 Caiwei Chen
关键信息
中国模型在严格的内容审核政策下训练,且存在关于不当蒸馏技术的指控;但它们现在在Hugging Face等平台上已领先全球模型下载量和用户生成变体数量。
资讯摘要
中国正通过发布高性能开源权重模型(如DeepSeek的R1)迅速提升其在全球AI领域的影响力,这些模型性能媲美美国顶尖系统但成本更低。这使全球开发者无需依赖美国企业即可自主适配和部署AI。一项研究显示,截至2025年8月,中国模型首次在全球下载量上超过美国。
尽管西方公司担忧知识产权泄露和滥用问题,许多全球南方国家将开源视为实现AI主权的途径。中国实验室也从中受益:开源策略弥补了先进芯片受限带来的不足,通过外部反馈和贡献构建强大生态系统。
资讯正文
中国开源押注
硅谷的人工智能公司遵循一套熟悉的策略:将核心技术隐藏在API背后,并对每一次使用收费。而中国的领先AI实验室则采取了不同的方式:他们以可下载的“开源权重”包形式发布模型。这使得开发者能够根据自己的需求调整模型,并在自有硬件上运行,从而构建产品,而无需与美国的科技巨头建立商业合作关系。
这一策略在2025年1月DeepSeek开源其R1推理模型后迅速普及。该模型性能堪比美国最先进的系统,据称成本仅为后者的一小部分。从纯粹的能力来看,中美实验室之间的差距似乎突然缩小了。但中国还赢得了一个更微妙、也更持久的优势:开发者的信任。向竞争对手收费的东西免费提供,自然会赢得好感。
中国紧抓这一势头不放。在DeepSeek发布一年后,一批中国开源巨头正沿着同样的路线前进,包括Z.ai(前身为智谱AI)、Moonshot、阿里巴巴的Qwen以及MiniMax。它们都在竞相推出更强大的模型,且追赶美国同行的速度远超多数人的预期。
这一点至关重要,因为人工智能热潮正在降温,企业正从热热闹闹的试点项目转向部署和集成阶段,在这个阶段,价格更低、更易定制的工具往往更具优势。中国的低价策略让预算有限的开发者可以更大胆地进行实验;而开源权重意味着他们无需获得许可即可灵活调整模型。
麻省理工学院与Hugging Face的研究人员的一项研究表明,截至2025年8月的一年内,中国开源权重模型占全球AI模型下载量的17.1%,略微超过了美国的15.86%——这是中国首次在这一指标上领先。而Hugging Face上个月的数据也显示,阿里巴巴的模型(包括其Qwen系列)如今拥有最多的用户自定义变体,数量甚至超过谷歌和Meta所有模型的总和。
然而,开源理想面临一些现实挑战。中国模型带有中国内容审核制度的印记,训练时被要求避免输出与政府政策相冲突的内容。今年2月,Anthropic指控多家中国实验室通过蒸馏技术非法提取Claude模型的能力——这是一种利用一个模型输出来训练另一个模型的标准行业做法,但OpenAI和Anthropic等顶级美国公司声称,中国企业使用了欺诈手段完成此类操作。
尽管西方有所抵制,全球南方国家却越来越接受中国模型,视开源为实现人工智能自主权的路径。新加坡政府支持的AI Singapore计划选择阿里巴巴的Qwen而非Meta的Llama来构建其最新区域模型;去年,马来西亚宣布其主权人工智能生态系统将基于DeepSeek运行。与此同时,从内罗毕到圣保罗再到旧金山的初创企业家们,正在中国技术的基础上搭建自己的产品。
中国押注开源
美国科技公司首席执行官认为,最优秀的模型应保持专有,一方面是为了回收高昂的训练成本,另一方面是担心强大的前沿模型可能被武器化。而中国的实验室则并非纯粹理想主义:开源不仅免费宣传,也是一种精明的应对策略。在无法获得受美国出口管制限制的尖端芯片的情况下,公开发布模型可以加速外部反馈和贡献的循环,从而弥补计算资源受限的问题。开发者基于你的模型构建得越多,你的生态系统就越强大,就像Linux和Android所展示的那样。这种采用自然会转化为API使用量和收入。
无论如何,开源模型已经让人工智能的未来比硅谷预期的更加多元。而且,已无回头之路。
深度解析
OpenAI正在全力投入打造一名全自动研究员
独家专访OpenAI首席科学家雅库布·帕霍奇基,探讨该公司新设立的重大挑战以及人工智能的未来。
宝可梦GO如何为配送机器人提供精确到厘米的世界视角
独家报道:Niantic的人工智能衍生公司正利用玩家提供的300亿张城市地标图像,训练一种全新的世界模型。
保持联系
获取《麻省理工科技评论》的最新动态
发现特别优惠、热门新闻、即将举行的活动等内容。
来源与参考
收录于 2026-04-22