西蒙·威尔逊发布新LLM模型，包括Gemini-3.1和Gemma 4变体

Simon Willison·4月3日 02:25 UTC·作者 Simon Willison

关键信息

gemini-3.1-flash-lite-preview 模型针对速度和低延迟进行了优化，而两个Gemma 4变体分别提供260亿和310亿参数，用于在性能和资源消耗之间权衡。所有模型均可通过西蒙的笔记及相关资源获取。

资讯摘要

2026年4月2日，西蒙·威尔逊宣布发布了三种新的LLM：gemini-3.1-flash-lite-preview、gemma-4-26b-a4b-it 和 gemma-4-31b-it。这些模型体现了让大型语言模型更易获取且更专业化的发展趋势——例如，专为实时任务优化的轻量级flash版本，以及用于复杂推理的更大Gemma变体。他的配套笔记提供了关于训练、部署和基准测试的技术见解。

这些模型属于更广泛的模块化、可定制LLM生态系统的一部分，旨在满足特定应用场景。此次发布对构建基于代理的系统或在消费级硬件上本地运行模型的开发者尤其重要。

资讯正文

2026年4月2日

新模型：gemini-3.1-flash-lite-preview、gemma-4-26b-a4b-it 和 gemma-4-31b-it。详见我对Gemma 4的笔记。

近期文章

在Lenny的播客中关于代理工程（agentic engineering）的对话亮点 —— 2026年4月2日

Mr. Chatterbox 是一个可以在你自己的电脑上运行的（弱）维多利亚时代伦理训练模型 —— 2026年3月30日

用Vibe编码 SwiftUI 应用程序非常有趣 —— 2026年3月27日

这是Simon Willison创作的一首节拍作品，发布于2026年4月2日。

每月简报

每月赞助我10美元，即可获得当月最重要的大语言模型（LLM）发展动态精选邮件摘要。

付钱让我少发点信息！

来源与参考

收录于 2026-04-03