Ornith-1.0 开源权重智能编程模型

Simon Willison·6月30日 00:17 UTC·作者 Simon Willison

关键信息

Simon Willison 提到该模型提供了 GGUF 构建版本，尤其是 35B 的 Q4_K_M 文件，他将其在 LM Studio 中接入 Pi 进行运行。他还指出，底层的 Gemma 4 和 Qwen 3.5 看起来都采用兼容的 Apache 2.0 许可，并观察到该模型在多次工具调用中表现良好，在一次测试中输出速度达到每秒 103 个 token。

资讯摘要

Ornith-1.0 被介绍为 DeepReinforce 的首个模型发布，是一个面向智能编程的开源权重、MIT 许可模型家族。公告称，这个家族包含 9B Dense、31B Dense、35B MoE 和 397B MoE 等多个版本。DeepReinforce 表示，这些模型建立在预训练的 Gemma 4 和 Qwen 3.5 之上，并且在同等规模的开源模型中，编码基准成绩达到了最先进水平。Simon Willison 指出，底层模型的许可看起来适合这种用法，因为 Gemma 4 和 Qwen 3.5 都采用 Apache 2.0 许可。

Willison 还在本地用 LM Studio 运行了 35B 的 GGUF 构建版本，并通过 Pi 接入测试，认为它可以较为熟练地执行包含多次工具调用的代理任务。在一个针对 Datasette 的终端会话中，它成功找到了与解码 actor cookie 以及在按钮点击时打开插入对话框相关的代码路径。他另外让模型画了一只鹈鹕，结果虽然有些失真，但仍然清楚可辨，并且输出速度达到了每秒 103 个 token。Willison 还提到，他几乎没有找到 DeepReinforce 的更多背景信息，只能查到他们在 2025 年 6 月发表的一篇较早论文《CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning》。

资讯正文

<strong><a href="https://deep-reinforce.com/ornith_1_0.html">Ornith-1.0：用于 Agentic 编码的自我脚手架 LLM</a></strong>

这是一款有意思的新开源权重（MIT 许可）模型，也是 DeepReinforce 发布的首个模型。

[...] 其变体包括 9B Dense、31B Dense、35B MoE 和 397B MoE。它建立在预训练的 Gemma 4 和 Qwen 3.5 之上，并在同等规模的开源模型中，编码基准测试上达到了最先进的表现。

就我所能判断，这些底层模型的许可都允许这样使用——Gemma 4 采用 Apache 2.0 许可证，而且不再受此前 Gemma 模型所受的那种蹩脚的额外 <a href="https://ai.google.dev/gemma/terms">Gemma 使用条款</a>约束；Qwen 3.5 也同样采用 Apache 2.0 许可证。

我一直在用 LM Studio 和 <a href="https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B-GGUF">ornith-1.0-35b-Q4_K_M.gguf</a>（20GB）GGUF 版本，并接入 <a href="https://pi.dev/">Pi</a> 来运行这个模型。初步印象非常好——它似乎能够以很熟练的方式在 agent harness 中连续进行多次工具调用。

这里有一段 <a href="https://gisthost.github.io/?35da4d9ce7f0c27124c67655a0dc9e5d">终端会话</a>，我让它在一个 Datasette 检出版本上先“找到解码 actor cookie 的代码”，然后再“找到在按钮被点击时打开插入对话框的代码”，它都轻松处理了。

我还让它<a href="https://gist.github.com/simonw/1869e1bbcafe5bcad0f26351f6a978a6">画这只鹈鹕</a>，输出速度达到每秒 103 个 token：

它有一点变形，不过这只鹈鹕显然就是一只鹈鹕。

我没能找到关于 DeepReinforce 本身多少信息。我能找到的这家公司最早的一篇论文是 2025 年 6 月的 <a href="https://arxiv.org/abs/2507.14111">CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning</a>。

标签：<a href="https://simonwillison.net/tags/ai">ai</a>，<a href="https://simonwillison.net/tags/generative-ai">generative-ai</a>，<a href="https://simonwillison.net/tags/local-llms">local-llms</a>，<a href="https://simonwillison.net/tags/llms">llms</a>，<a href="https://simonwillison.net/tags/qwen">qwen</a>，<a href="https://simonwillison.net/tags/pelican-riding-a-bicycle">pelican-riding-a-bicycle</a>，<a href="https://simonwillison.net/tags/gemma">gemma</a>，<a href="https://simonwillison.net/tags/llm-release">llm-release</a>，<a href="https://simonwillison.net/tags/lm-studio">lm-studio</a>

来源与参考

收录于 2026-06-30