深度求索发布V4模型预览,对标美国领先AI系统

The Verge AI··作者 Robert Hart

关键信息

V4拥有1万亿MoE(专家混合)参数,支持高达100万token的上下文长度,每百万token成本为0.3美元。深度求索未披露训练成本或具体使用的硬件,但声称兼容国产华为Ascend芯片。

资讯摘要

中国AI公司深度求索发布了其V4模型的预览版,定位为OpenAI、谷歌和Anthropic等闭源模型的高性能开源替代品。V4具备1万亿参数、先进的编码能力及多模态支持,适用于AI代理和复杂任务。

此次发布正值中国加强自主研发AI生态系统的背景下,使用国产华为Ascend系列芯片备受关注。然而,深度求索也面临严重指控——包括使用被禁的英伟达芯片以及涉嫌通过伪造账号从Anthropic的Claude模型中提取知识——引发了国际AI发展中伦理和合规性的广泛担忧。

深度求索发布V4模型预览,对标美国领先AI系统

资讯正文

中国人工智能公司DeepSeek周五发布其备受期待的下一代AI模型V4的预览版本,称这款开源模型能够与美国竞争对手如Anthropic、谷歌和OpenAI的领先闭源系统相媲美。

DeepSeek表示,V4相比之前版本有显著提升,尤其是在编程能力方面——这一能力已成为AI代理的核心功能,并推动了ChatGPT Codex和Claude Code等工具的成功。此次发布对中国芯片产业也具有里程碑意义,DeepSeek明确强调该模型兼容国产华为技术。

这一发布距离DeepSeek一年前凭借R1模型震惊美国AI行业已有一年时间,当时该公司声称该模型的训练成本仅为美国主流系统的几分之一。不过,DeepSeek尚未披露V4的训练成本或所用硬件信息。美国官员指责该公司使用了被禁的英伟达芯片,而Anthropic则指控DeepSeek滥用其Claude模型来改进自身产品。

来源与参考

  1. 原始链接
  2. China’s DeepSeek previews new AI model a year after jolting US rivals

收录于 2026-04-25