Mistral发布Medium 3.5,将聊天、推理和代码整合进单一模型
The Decoder··作者 Jonathan Kemper
关键信息
该模型采用密集架构(每个token激活全部参数),支持256K令牌上下文窗口,并使用修改版MIT许可证,限制高收入公司使用;通过API调用价格为每百万输入token 1.5美元。
资讯摘要
Mistral的旗舰模型Medium 3.5是一个1280亿参数的密集型模型,将聊天、推理和代码生成整合为一个系统。它包含可切换的推理模式以应对复杂任务,并重新训练了视觉编码器以支持不同尺寸和比例的图像输入。公司还在其Vibe工具中引入异步云代理,实现自动化的编码任务(如创建拉取请求和修复错误),这些代理在隔离沙箱中运行并集成GitHub、Slack等平台。
Le Chat现在增加了“工作模式”,可执行多步骤操作(如邮件和日历交互),但敏感操作需用户授权。尽管相比MoE模型(如Mistral Large 3)成本更高,但这种密集设计简化了部署并在生产环境中更具可靠性。

资讯正文
Mistral的新旗舰模型Medium 3.5将聊天、推理和代码功能整合到一个模型中
关键要点
- Mistral发布了Medium 3.5,这是一个拥有1280亿参数的AI模型,采用密集架构,能够处理聊天、推理和编码任务,并提供可切换的推理功能,以应对更复杂的查询。
- 该公司开发者工具Vibe现在包含异步云代理,可以独立处理诸如修复漏洞等常规任务,这些代理在隔离沙箱中运行,并集成GitHub和Slack等服务。
- Mistral的AI助手Le Chat引入了“工作模式”,支持多步骤工作流,通过内置连接器直接接入邮件和日历,但在执行任何敏感操作前需要用户明确授权。
Mistral的新旗舰产品Medium 3.5将原本分别用于聊天、推理和代码的多个模型合并为单一产品。这家法国公司还为其编码工具Vibe增加了异步云代理,并为Le Chat新增了一个代理模式。
根据模型卡片信息,Mistral Medium 3.5是一个拥有1280亿参数的密集模型,上下文窗口长达256,000个token。“密集”意味着每次生成token时都会加载并激活全部1280亿参数。这使得推理成本较高,但运行起来更简单,且在生产环境中表现通常更稳定。
Mistral知道还有更便宜的方法。例如,Mistral Large 3使用专家混合(MoE)结构,总参数达6750亿,但每token仅激活410亿;而Mistral Small 4有1190亿参数,每token仅激活60亿。竞争对手如Deepseek和Qwen早已将其顶级模型转向MoE架构,因为这种方式能在保持相近质量的同时显著降低推理成本。
在此背景下,Mistral选择将新旗舰模型设计为纯密集模型,是一种保守的做法:虽然推理成本未被优化,但能作为一个统一模型同时服务于聊天、推理、代码和代理任务。
Mistral表示,该模型可在四张GPU上实现自托管,但在实际应用中,这对大多数用户而言仍难以企及,除非是在配备完善的大型数据中心内。
推理功能变为可切换选项,全新视觉编码器从零构建
该模型顺应行业趋势,不再依赖独立的推理模型,而是将推理能力作为每个查询的参数。一个名为reasoning_effort的设置可在快速回复与复杂代理任务所需的高负载模式之间切换。此外,Mistral还重新训练了视觉编码器,使其能够处理不同尺寸和长宽比的图像。
许可证由MIT修改版取代Apache 2.0
权重可在Hugging Face下载,但不再使用此前使用的Apache 2.0许可协议。公司改用“修改后的MIT许可证”,允许商业和非商业用途,但对高收入企业设置了例外条款。这一做法不同于Mistral Large 3和Small 4等先前版本所采用的Apache 2.0许可证。
通过API调用,Medium 3.5的输入token费用为每百万token 1.50美元,输出token费用为每百万token 7.50美元。
编码代理脱离笔记本环境
Mistral的新旗舰模型Medium 3.5将聊天、推理和代码功能整合到一个模型中。
第二个公告对开发者来说可能比模型本身更重要。Mistral的编码工具Vibe即将推出可在云端运行的远程代理,多个代理可以同时运行而无需开发者实时监控。本地会话可以连同其历史记录、任务状态和审批信息一起迁移到云端。
每个代理都在隔离的沙箱环境中运行,并在完成任务后自动创建拉取请求。Vibe支持连接GitHub、Linear、Jira、Sentry、Slack和Teams等平台。Mistral指出,模块重构、测试生成、依赖升级和错误修复等日常任务是主要应用场景。
云端版本基于Mistral Studio的工作流构建,该平台最初由公司内部开发并面向企业客户使用。这一思路并不新鲜,OpenAI、Anthropic和Cursor已经提供类似方案。
Le Chat中的工作模式默认开启连接器
Mistral还为运行在Medium 3.5上的Le Chat增加了“工作模式”,专为跨多个工具的多步骤任务设计,例如处理邮件、消息或日历条目,或执行结构化搜索。
在工作模式下,邮箱、日历、文档及其他系统的连接器默认处于开启状态。这使得复杂工作流更容易设置,但也意味着用户需承担更多关于数据流动的责任。Le Chat会在执行发送消息或写入外部系统等敏感操作前要求用户明确确认。该模式适用于Pro、团队和企业版计划。
来源与参考
收录于 2026-05-02