Meta发布Muse Spark,其超智能实验室的首个公开AI模型
Ars Technica AI··作者 Kyle Orland
关键信息
Muse Spark包含一种名为“沉思”的模式,最多可同时使用16个并行推理代理以提升性能,在使用外部工具的情况下于《人类最后的考试》中获得58.4分。它还引入了带有‘思考时间惩罚’的强化学习机制,以平衡准确性和效率。
资讯摘要
Meta宣布推出Muse Spark,这是其超智能实验室发布的首个公开模型,旨在通过整合Instagram、Facebook和Threads的内容打造个性化AI体验。尽管是专有模型,Meta承诺未来将推出Muse系列的新开源模型。该模型在AIME 2025和《人类最后的考试》等基准测试中表现优异,得益于多代理推理和强化学习等创新技术,提升了准确率并优化了token使用效率。
Meta还更新了高级AI扩展框架,声称该模型在所有前沿风险类别中均处于安全范围内。目前Muse Spark已在Meta AI应用、meta.ai上线,并通过私有API提供给部分合作伙伴;未来几周将逐步推广至WhatsApp、Reels及AI眼镜。

资讯正文
Meta周三宣布推出Spark,这是其Muse系列中的首个AI模型,该公司称这标志着“对AI工作的全面重构”。
Muse Spark是Meta超级智能实验室的首款产品,该实验室约一年前成立,目标宏大,旨在“为每个人实现个人超级智能的承诺”。此次发布标志着与Meta此前在开源Llama模型系列上的工作彻底决裂,后者在用户和独立大型语言模型排行榜上反响平平。尽管Spark将是专有模型,但Meta创始人兼CEO马克·扎克伯格在Threads上发文表示,未来Muse系列将“包括新的开源模型”。
Meta表示,Muse Spark将利用Instagram、Facebook和Threads等平台上的内容,就像xAI的Grok集成X平台内容一样。目前这意味着,当你询问某个地点或热门话题时,Muse Spark可以链接到相关公共帖子。Meta称,未来这一功能将扩展至“引用他人分享的推荐和内容的新特性”,以及“将Reels、照片和帖子直接编织进你的回答中,并向内容创作者致谢”。
思考与压缩
在伴随Spark发布的技术博客文章中,Meta列出了如今已成为标配的AI基准测试结果:Muse Spark的标准思考模式在性能上可与OpenAI、Anthropic、Google和xAI的竞品模型相当甚至更优。但该文也坦率承认,“我们仍在投资当前存在性能差距的领域,比如长周期代理系统和编码工作流”。
同一文章还强调了名为“沉思”(Contemplating)的模式,称其将“逐步上线”,并能“协调多个并行推理的代理”。Meta表示,通过最多16个代理同时协作思考,“沉思”模式可在延迟相近的情况下实现更优性能。这种“优越性能”包括据Meta报告,在使用外部工具的情况下,于《人类最后考试》(Humanity’s Last Exam)中达到58.4分的高分记录。
虽然之前的Llama模型因未充分利用强化学习而受到批评,但Meta称Muse Spark在预训练后增加强化学习步骤后展现出“平稳且可预测的提升”,“在不牺牲推理多样性的情况下提高模型可靠性”。该强化学习系统还采用“思考时间惩罚机制”,Meta称这能在“最大化正确性”与优化token使用之间取得平衡。在AIME 2025基准测试中,Meta表示观察到一种“相变”现象:模型开始将同样准确的推理压缩进“显著更少的token”;压缩之后,后续训练的模型逐渐增加token用量,从而在比之前未压缩版本更短的总时间内实现更高准确率。
Meta的超级智能实验室发布了其首个公开模型Muse Spark。
Muse Spark的发布伴随着Meta高级人工智能扩展框架的更新,该公司表示该框架现在涵盖了更广泛的潜在AI风险。公司称,该模型在所有前沿风险类别中均处于安全范围内,但更多细节将仅在即将发布的《安全与准备报告》中披露。
Muse Spark目前已可在Meta AI应用和meta.ai网站上使用,并为“选定合作伙伴”提供私有预览API。Meta表示,该模型将在未来几周内通过WhatsApp、Instagram、Facebook、Messenger以及AI眼镜提供。
来源与参考
收录于 2026-04-09