Mistral发布Medium 3.5，将聊天、推理和代码整合进单一模型

The Decoder·5月1日 16:21 UTC·作者 Jonathan Kemper

关键信息

该模型采用密集架构（每个token激活全部参数），支持256K令牌上下文窗口，并使用修改版MIT许可证，限制高收入公司使用；通过API调用价格为每百万输入token 1.5美元。

资讯摘要

Mistral的旗舰模型Medium 3.5是一个1280亿参数的密集型模型，将聊天、推理和代码生成整合为一个系统。它包含可切换的推理模式以应对复杂任务，并重新训练了视觉编码器以支持不同尺寸和比例的图像输入。公司还在其Vibe工具中引入异步云代理，实现自动化的编码任务（如创建拉取请求和修复错误），这些代理在隔离沙箱中运行并集成GitHub、Slack等平台。

Le Chat现在增加了“工作模式”，可执行多步骤操作（如邮件和日历交互），但敏感操作需用户授权。尽管相比MoE模型（如Mistral Large 3）成本更高，但这种密集设计简化了部署并在生产环境中更具可靠性。

资讯正文

Mistral的新旗舰模型Medium 3.5将聊天、推理和代码功能整合到一个模型中

关键要点

- Mistral发布了Medium 3.5，这是一个拥有1280亿参数的AI模型，采用密集架构，能够处理聊天、推理和编码任务，并提供可切换的推理功能，以应对更复杂的查询。

- 该公司开发者工具Vibe现在包含异步云代理，可以独立处理诸如修复漏洞等常规任务，这些代理在隔离沙箱中运行，并集成GitHub和Slack等服务。

- Mistral的AI助手Le Chat引入了“工作模式”，支持多步骤工作流，通过内置连接器直接接入邮件和日历，但在执行任何敏感操作前需要用户明确授权。

Mistral的新旗舰产品Medium 3.5将原本分别用于聊天、推理和代码的多个模型合并为单一产品。这家法国公司还为其编码工具Vibe增加了异步云代理，并为Le Chat新增了一个代理模式。

根据模型卡片信息，Mistral Medium 3.5是一个拥有1280亿参数的密集模型，上下文窗口长达256,000个token。“密集”意味着每次生成token时都会加载并激活全部1280亿参数。这使得推理成本较高，但运行起来更简单，且在生产环境中表现通常更稳定。

Mistral知道还有更便宜的方法。例如，Mistral Large 3使用专家混合（MoE）结构，总参数达6750亿，但每token仅激活410亿；而Mistral Small 4有1190亿参数，每token仅激活60亿。竞争对手如Deepseek和Qwen早已将其顶级模型转向MoE架构，因为这种方式能在保持相近质量的同时显著降低推理成本。

在此背景下，Mistral选择将新旗舰模型设计为纯密集模型，是一种保守的做法：虽然推理成本未被优化，但能作为一个统一模型同时服务于聊天、推理、代码和代理任务。

Mistral表示，该模型可在四张GPU上实现自托管，但在实际应用中，这对大多数用户而言仍难以企及，除非是在配备完善的大型数据中心内。

推理功能变为可切换选项，全新视觉编码器从零构建

该模型顺应行业趋势，不再依赖独立的推理模型，而是将推理能力作为每个查询的参数。一个名为reasoning_effort的设置可在快速回复与复杂代理任务所需的高负载模式之间切换。此外，Mistral还重新训练了视觉编码器，使其能够处理不同尺寸和长宽比的图像。

许可证由MIT修改版取代Apache 2.0

权重可在Hugging Face下载，但不再使用此前使用的Apache 2.0许可协议。公司改用“修改后的MIT许可证”，允许商业和非商业用途，但对高收入企业设置了例外条款。这一做法不同于Mistral Large 3和Small 4等先前版本所采用的Apache 2.0许可证。

通过API调用，Medium 3.5的输入token费用为每百万token 1.50美元，输出token费用为每百万token 7.50美元。

编码代理脱离笔记本环境

Mistral的新旗舰模型Medium 3.5将聊天、推理和代码功能整合到一个模型中。

第二个公告对开发者来说可能比模型本身更重要。Mistral的编码工具Vibe即将推出可在云端运行的远程代理，多个代理可以同时运行而无需开发者实时监控。本地会话可以连同其历史记录、任务状态和审批信息一起迁移到云端。

每个代理都在隔离的沙箱环境中运行，并在完成任务后自动创建拉取请求。Vibe支持连接GitHub、Linear、Jira、Sentry、Slack和Teams等平台。Mistral指出，模块重构、测试生成、依赖升级和错误修复等日常任务是主要应用场景。

云端版本基于Mistral Studio的工作流构建，该平台最初由公司内部开发并面向企业客户使用。这一思路并不新鲜，OpenAI、Anthropic和Cursor已经提供类似方案。

Le Chat中的工作模式默认开启连接器

Mistral还为运行在Medium 3.5上的Le Chat增加了“工作模式”，专为跨多个工具的多步骤任务设计，例如处理邮件、消息或日历条目，或执行结构化搜索。

在工作模式下，邮箱、日历、文档及其他系统的连接器默认处于开启状态。这使得复杂工作流更容易设置，但也意味着用户需承担更多关于数据流动的责任。Le Chat会在执行发送消息或写入外部系统等敏感操作前要求用户明确确认。该模式适用于Pro、团队和企业版计划。

来源与参考

收录于 2026-05-02