GLM-5.2 作为超大开权重文本模型发布

Simon Willison·6月18日 07:58 UTC·作者 Simon Willison

关键信息

Artificial Analysis 表示，GLM-5.2 在 Intelligence Index v4.1 上是领先的开权重模型，但也指出它相比其他顶级模型更耗 token。Z.ai 另有独立的视觉模型系列，但这次公开的是纯文本模型；尽管如此，它在前端网页开发排行榜上的表现仍然很强。

资讯摘要

中国 AI 实验室 Z.ai 在 6 月 13 日先向 coding plan 订阅者开放了 GLM-5.2，随后又在 6 月 16 日以 MIT 许可证正式公开了完整权重。文中把它描述为一个 7530 亿参数、体积达到 1.51TB 的开权重模型，并采用 Mixture of Experts 架构，其中只有 40 个参数处于激活状态。它是纯文本模型，不像 Z.ai 另一条视觉模型线那样支持图像输入；后者最近的代表是 GLM-5V-Turbo，但并不是开权重。GLM-5.2 还把上下文窗口扩大到了 100 万 token，相比 GLM-5.1 的 20 万 token 有明显提升。独立基准测试带来了很高关注度：Artificial Analysis 认为它在 Intelligence Index v4.1 上是领先的开权重模型。

与此同时，该测试也指出它的 token 消耗偏高，每个任务使用的输出 token 多于其他领先开权重模型。它还在 Code Arena WebDev 排行榜上位列第二，这个榜单衡量的是前端网页开发与 agentic coding 工作流。文章作者 Simon Willison 通过 OpenRouter 测试了它，发现多个供应商的定价相对便宜，明显低于一些顶级闭源模型。作者还提到，这个模型在“鹈鹕骑自行车”的 SVG 提示词上表现很出色，但在“NORTH VIRGINIA OPOSSUM ON AN E-SCOOTER”这个提示词上就逊色很多。

资讯正文

中国 AI 实验室 <a href="https://z.ai/">Z.ai</a> 于 6 月 13 日向其 coding plan 订阅用户发布了 GLM-5.2 <a href="https://x.com/Zai_org/status/2065704919299235870"></a>，随后在昨天（6 月 16 日）以 MIT 许可证发布了完整的开源权重。它的规模与此前的 GLM-5 和 GLM-5.1 发布相近，是一个拥有 7530 亿参数、<a href="https://huggingface.co/zai-org/GLM-5.2">1.51TB</a> 的庞然大物——其中有 40 个活跃参数（Mixture of Experts，专家混合）。GLM-5.2 是一个仅支持文本输入的模型——Z.ai 还有一个独立的视觉模型系列，最近的代表是 <a href="https://x.com/Zai_org/status/2039371126984360085">GLM-5V-Turbo</a>，但那一款并没有开源权重。GLM-5.2 的上下文窗口达到 100 万 token，较 GLM-5.1 的 20 万有了提升。

围绕这个模型的热度很高。

运营着业内最受尊敬的独立基准测试之一的 Artificial Analysis 表示：<a href="https://artificialanalysis.ai/articles/glm-5-2-is-the-new-leading-open-weights-model-on-the-artificial-analysis-intelligence-index">GLM-5.2 是 Artificial Analysis Intelligence Index 上新的领先开源权重模型</a>。

<p><strong>GLM-5.2 是 Intelligence Index v4.1 上领先的开源权重模型。</strong> 在 51 分上，它领先于 MiniMax-M3（44 分）、DeepSeek V4 Pro（max，44 分）以及 Kimi K2.6（43 分）</p>

</blockquote>

不过，他们也发现它的 token 消耗相当大：

<p><strong>GLM-5.2 在每项任务上使用的输出 token 数量多于其他领先的开源权重模型：</strong>该模型在每个 Intelligence Index 任务上使用 4.3 万个输出 token，高于 GLM-5.1（2.6 万），也高于 MiniMax-M3（2.4 万）、Kimi K2.6（3.5 万）和 DeepSeek V4 Pro（max，3.7 万）</p>

</blockquote>

该模型目前也在 <a href="https://arena.ai/leaderboard/code/webdev">Code Arena WebDev 排行榜</a> 上排名第 2，仅次于 Claude Fable 5。该排行榜衡量的是“前端网页开发任务，包括 agentic coding 工作流”。考虑到它没有图像输入，我对它能排到这么高感到很惊讶；我原本错误地认为，图像输入是打造真正出色的前端编码模型的关键部分。

<h4 id="excellent-pelican-disappointing-opossum">出色的鹈鹕，令人失望的负鼠</h4>

GLM-5.1 曾给我带来<a href="https://simonwillison.net/2026/Apr/7/glm-51/">我最喜欢的鹈鹕之一</a>，以及我<a href="https://simonwillison.net/2026/Apr/7/glm-51/#opossum">有史以来最喜欢的负鼠</a>（提示词是“Generate an SVG of a NORTH VIRGINIA OPOSSUM ON AN E-SCOOTER”.）。有趣的是，在这两种情况下，模型都选择返回包裹在 HTML 文档中的 SVG，并通过 CSS 添加了额外动画。

我们来试试 GLM-5.2。对于“Generate an SVG of a pelican riding a bicycle”，我<a href="https://gist.github.com/simonw/5c989366b796f054d9ae1ad7e38dc03a">得到了这个</a>：

这是一幅完全自包含、全动画的 SVG，而且动画都没有坏！我经常会看到眼睛掉下来，或者车轮脱离自行车自行转动之类的问题，但这里一切都运作得很好。它也是一幅非常漂亮的鹈鹕矢量插图。非常令人印象深刻。

可惜的是，骑着电动滑板车的北弗吉尼亚负鼠效果就<a href="https://gist.github.com/simonw/5913b56e3d0ba9a2ece75ce1471f87bb">差得多</a>：

这比 GLM-5.1 退步太多了！提醒一下，那个负鼠当时看起来是这样的：

5.2 甚至都没有试着给它做动画。

来源与参考

收录于 2026-06-19