美团 LongCat-2.0 挑战英伟达依赖
The Decoder··作者 Maximilian Schreiner
关键信息
美团称 LongCat 团队直到 2023 年才成立,首个模型则在去年底发布。基准测试结果并不均衡:LongCat-2.0 在 SWE-bench Pro 和 SWE-bench Multilingual 上领先,但在其他多项测试中落后于 Gemini 和 GPT-5.5,而且该模型尚未上线 HuggingFace,外界难以独立验证。
资讯摘要
美团的 LongCat-2.0 被描述为一个重要信号,表明中国已经能够在不依赖英伟达的情况下训练超大规模 AI 模型。公司称,这个模型拥有 1.6 万亿参数,并且完全使用国产中国 AI 芯片完成训练。报道指出,训练过程依托一个由超过 5 万颗国产 AI ASIC 组成的集群,处理了超过 35 万亿个 token。美团还表示,LongCat 团队成立于 2023 年,而其首个模型是在去年底发布的。
在基准测试方面,LongCat-2.0 在部分项目上表现具有竞争力:它在 SWE-bench Pro 上得分 59.5,在 SWE-bench Multilingual 上得分 77.3,在这两项具体结果上超过了 Gemini 3.1 Pro 和 GPT-5.5,但仍低于 Claude Opus 4.7 和 4.8。另一方面,它在 IFEval、IMO-AnswerBench 和 GPQA-diamond 等测试上的表现没有那么亮眼,报道说在某些情况下明显落后于 Gemini 和 GPT-5.5。文章将这一结果解读为对华盛顿的一个信号,因为美国自 2022 年以来一直实施出口管制。美团没有公布具体的芯片制造商,而且该模型尚未出现在 HuggingFace 上,因此外界仍然难以进行独立验证。

资讯正文
美团的 LongCat-2.0 证明了中国可以在没有 Nvidia 的情况下训练超大规模 AI 模型
美团训练了一个拥有 1.6 万亿参数的 AI 模型,完全基于中国芯片,不需要 Nvidia。“LongCat-2.0 已经证明,我们现在有能力在国产算力集群上训练大规模模型,”这家中国公司表示。该模型的训练运行在一个由超过 5 万颗国产 AI ASIC 组成的集群上,训练数据覆盖了超过 35 万亿个 token。LongCat 团队自 2023 年才成立,其首个模型于去年底发布。
在一些基准测试中,LongCat-2.0 的表现超过了领先的西方模型。在 SWE-bench Pro(59.5)和 SWE-bench Multilingual(77.3)上,它位居 Gemini 3.1 Pro 和 GPT-5.5 之上,但仍不及 Claude Opus 4.7 和 4.8。在 IFEval(90.0)、IMO-AnswerBench(81.8)和 GPQA-diamond(88.9)等其他测试中,它在某些情况下又明显落后于 Gemini 和 GPT-5.5。
华盛顿方面想必很难忽视这一信号。尽管美国自 2022 年起实施出口管制,中国似乎已经造出了首个具有竞争力、且完全基于国产硬件训练的万亿参数模型。不过,美团并未透露具体芯片制造商。而且该模型目前还没有上线 HuggingFace,因此外界很难进行独立验证。
来源与参考
收录于 2026-07-01