GLM-5.2 作为超大开权重文本模型发布
Simon Willison··作者 Simon Willison
关键信息
Artificial Analysis 表示,GLM-5.2 在 Intelligence Index v4.1 上是领先的开权重模型,但也指出它相比其他顶级模型更耗 token。Z.ai 另有独立的视觉模型系列,但这次公开的是纯文本模型;尽管如此,它在前端网页开发排行榜上的表现仍然很强。
资讯摘要
中国 AI 实验室 Z.ai 在 6 月 13 日先向 coding plan 订阅者开放了 GLM-5.2,随后又在 6 月 16 日以 MIT 许可证正式公开了完整权重。文中把它描述为一个 7530 亿参数、体积达到 1.51TB 的开权重模型,并采用 Mixture of Experts 架构,其中只有 40 个参数处于激活状态。它是纯文本模型,不像 Z.ai 另一条视觉模型线那样支持图像输入;后者最近的代表是 GLM-5V-Turbo,但并不是开权重。GLM-5.2 还把上下文窗口扩大到了 100 万 token,相比 GLM-5.1 的 20 万 token 有明显提升。独立基准测试带来了很高关注度:Artificial Analysis 认为它在 Intelligence Index v4.1 上是领先的开权重模型。
与此同时,该测试也指出它的 token 消耗偏高,每个任务使用的输出 token 多于其他领先开权重模型。它还在 Code Arena WebDev 排行榜上位列第二,这个榜单衡量的是前端网页开发与 agentic coding 工作流。文章作者 Simon Willison 通过 OpenRouter 测试了它,发现多个供应商的定价相对便宜,明显低于一些顶级闭源模型。作者还提到,这个模型在“鹈鹕骑自行车”的 SVG 提示词上表现很出色,但在“NORTH VIRGINIA OPOSSUM ON AN E-SCOOTER”这个提示词上就逊色很多。

资讯正文
中国 AI 实验室 <a href="https://z.ai/">Z.ai</a> 于 6 月 13 日向其 coding plan 订阅用户发布了 GLM-5.2 <a href="https://x.com/Zai_org/status/2065704919299235870"></a>,随后在昨天(6 月 16 日)以 MIT 许可证发布了完整的开源权重。它的规模与此前的 GLM-5 和 GLM-5.1 发布相近,是一个拥有 7530 亿参数、<a href="https://huggingface.co/zai-org/GLM-5.2">1.51TB</a> 的庞然大物——其中有 40 个活跃参数(Mixture of Experts,专家混合)。GLM-5.2 是一个仅支持文本输入的模型——Z.ai 还有一个独立的视觉模型系列,最近的代表是 <a href="https://x.com/Zai_org/status/2039371126984360085">GLM-5V-Turbo</a>,但那一款并没有开源权重。GLM-5.2 的上下文窗口达到 100 万 token,较 GLM-5.1 的 20 万有了提升。
围绕这个模型的热度很高。
运营着业内最受尊敬的独立基准测试之一的 Artificial Analysis 表示:<a href="https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index">GLM-5.2 是 Artificial Analysis Intelligence Index 上新的领先开源权重模型</a>。
<blockquote>
<p><strong>GLM-5.2 是 Intelligence Index v4.1 上领先的开源权重模型。</strong> 在 51 分上,它领先于 MiniMax-M3(44 分)、DeepSeek V4 Pro(max,44 分)以及 Kimi K2.6(43 分)</p>
</blockquote>
不过,他们也发现它的 token 消耗相当大:
<blockquote>
<p><strong>GLM-5.2 在每项任务上使用的输出 token 数量多于其他领先的开源权重模型:</strong>该模型在每个 Intelligence Index 任务上使用 4.3 万个输出 token,高于 GLM-5.1(2.6 万),也高于 MiniMax-M3(2.4 万)、Kimi K2.6(3.5 万)和 DeepSeek V4 Pro(max,3.7 万)</p>
</blockquote>
该模型目前也在 <a href="https://arena.ai/leaderboard/code/webdev">Code Arena WebDev 排行榜</a> 上排名第 2,仅次于 Claude Fable 5。该排行榜衡量的是“前端网页开发任务,包括 agentic coding 工作流”。考虑到它没有图像输入,我对它能排到这么高感到很惊讶;我原本错误地认为,图像输入是打造真正出色的前端编码模型的关键部分。
<h4 id="excellent-pelican-disappointing-opossum">出色的鹈鹕,令人失望的负鼠</h4>
GLM-5.1 曾给我带来<a href="https://simonwillison.net/2026/Apr/7/glm-51/">我最喜欢的鹈鹕之一</a>,以及我<a href="https://simonwillison.net/2026/Apr/7/glm-51/#opossum">有史以来最喜欢的负鼠</a>(提示词是“Generate an SVG of a NORTH VIRGINIA OPOSSUM ON AN E-SCOOTER”.)。有趣的是,在这两种情况下,模型都选择返回包裹在 HTML 文档中的 SVG,并通过 CSS 添加了额外动画。
我们来试试 GLM-5.2。对于“Generate an SVG of a pelican riding a bicycle”,我<a href="https://gist.github.com/simonw/5c989366b796f054d9ae1ad7e38dc03a">得到了这个</a>:
这是一幅完全自包含、全动画的 SVG,而且动画都没有坏!我经常会看到眼睛掉下来,或者车轮脱离自行车自行转动之类的问题,但这里一切都运作得很好。它也是一幅非常漂亮的鹈鹕矢量插图。非常令人印象深刻。
可惜的是,骑着电动滑板车的北弗吉尼亚负鼠效果就<a href="https://gist.github.com/simonw/5913b56e3d0ba9a2ece75ce1471f87bb">差得多</a>:
这比 GLM-5.1 退步太多了!提醒一下,那个负鼠当时看起来是这样的:
5.2 甚至都没有试着给它做动画。
来源与参考
收录于 2026-06-19