Meta发布Muse Spark，其超智能实验室的首个公开AI模型

Ars Technica AI·4月9日 03:59 UTC·作者 Kyle Orland

关键信息

Muse Spark包含一种名为“沉思”的模式，最多可同时使用16个并行推理代理以提升性能，在使用外部工具的情况下于《人类最后的考试》中获得58.4分。它还引入了带有‘思考时间惩罚’的强化学习机制，以平衡准确性和效率。

资讯摘要

Meta宣布推出Muse Spark，这是其超智能实验室发布的首个公开模型，旨在通过整合Instagram、Facebook和Threads的内容打造个性化AI体验。尽管是专有模型，Meta承诺未来将推出Muse系列的新开源模型。该模型在AIME 2025和《人类最后的考试》等基准测试中表现优异，得益于多代理推理和强化学习等创新技术，提升了准确率并优化了token使用效率。

Meta还更新了高级AI扩展框架，声称该模型在所有前沿风险类别中均处于安全范围内。目前Muse Spark已在Meta AI应用、meta.ai上线，并通过私有API提供给部分合作伙伴；未来几周将逐步推广至WhatsApp、Reels及AI眼镜。

资讯正文

Meta周三宣布推出Spark，这是其Muse系列中的首个AI模型，该公司称这标志着“对AI工作的全面重构”。

Muse Spark是Meta超级智能实验室的首款产品，该实验室约一年前成立，目标宏大，旨在“为每个人实现个人超级智能的承诺”。此次发布标志着与Meta此前在开源Llama模型系列上的工作彻底决裂，后者在用户和独立大型语言模型排行榜上反响平平。尽管Spark将是专有模型，但Meta创始人兼CEO马克·扎克伯格在Threads上发文表示，未来Muse系列将“包括新的开源模型”。

Meta表示，Muse Spark将利用Instagram、Facebook和Threads等平台上的内容，就像xAI的Grok集成X平台内容一样。目前这意味着，当你询问某个地点或热门话题时，Muse Spark可以链接到相关公共帖子。Meta称，未来这一功能将扩展至“引用他人分享的推荐和内容的新特性”，以及“将Reels、照片和帖子直接编织进你的回答中，并向内容创作者致谢”。

思考与压缩

在伴随Spark发布的技术博客文章中，Meta列出了如今已成为标配的AI基准测试结果：Muse Spark的标准思考模式在性能上可与OpenAI、Anthropic、Google和xAI的竞品模型相当甚至更优。但该文也坦率承认，“我们仍在投资当前存在性能差距的领域，比如长周期代理系统和编码工作流”。

同一文章还强调了名为“沉思”（Contemplating）的模式，称其将“逐步上线”，并能“协调多个并行推理的代理”。Meta表示，通过最多16个代理同时协作思考，“沉思”模式可在延迟相近的情况下实现更优性能。这种“优越性能”包括据Meta报告，在使用外部工具的情况下，于《人类最后考试》（Humanity’s Last Exam）中达到58.4分的高分记录。

虽然之前的Llama模型因未充分利用强化学习而受到批评，但Meta称Muse Spark在预训练后增加强化学习步骤后展现出“平稳且可预测的提升”，“在不牺牲推理多样性的情况下提高模型可靠性”。该强化学习系统还采用“思考时间惩罚机制”，Meta称这能在“最大化正确性”与优化token使用之间取得平衡。在AIME 2025基准测试中，Meta表示观察到一种“相变”现象：模型开始将同样准确的推理压缩进“显著更少的token”；压缩之后，后续训练的模型逐渐增加token用量，从而在比之前未压缩版本更短的总时间内实现更高准确率。

Meta的超级智能实验室发布了其首个公开模型Muse Spark。

Muse Spark的发布伴随着Meta高级人工智能扩展框架的更新，该公司表示该框架现在涵盖了更广泛的潜在AI风险。公司称，该模型在所有前沿风险类别中均处于安全范围内，但更多细节将仅在即将发布的《安全与准备报告》中披露。

Muse Spark目前已可在Meta AI应用和meta.ai网站上使用，并为“选定合作伙伴”提供私有预览API。Meta表示，该模型将在未来几周内通过WhatsApp、Instagram、Facebook、Messenger以及AI眼镜提供。

来源与参考

收录于 2026-04-09