Ornith-1.0 开源权重智能编程模型

Simon Willison··作者 Simon Willison

关键信息

Simon Willison 提到该模型提供了 GGUF 构建版本,尤其是 35B 的 Q4_K_M 文件,他将其在 LM Studio 中接入 Pi 进行运行。他还指出,底层的 Gemma 4 和 Qwen 3.5 看起来都采用兼容的 Apache 2.0 许可,并观察到该模型在多次工具调用中表现良好,在一次测试中输出速度达到每秒 103 个 token。

资讯摘要

Ornith-1.0 被介绍为 DeepReinforce 的首个模型发布,是一个面向智能编程的开源权重、MIT 许可模型家族。公告称,这个家族包含 9B Dense、31B Dense、35B MoE 和 397B MoE 等多个版本。DeepReinforce 表示,这些模型建立在预训练的 Gemma 4 和 Qwen 3.5 之上,并且在同等规模的开源模型中,编码基准成绩达到了最先进水平。Simon Willison 指出,底层模型的许可看起来适合这种用法,因为 Gemma 4 和 Qwen 3.5 都采用 Apache 2.0 许可。

Willison 还在本地用 LM Studio 运行了 35B 的 GGUF 构建版本,并通过 Pi 接入测试,认为它可以较为熟练地执行包含多次工具调用的代理任务。在一个针对 Datasette 的终端会话中,它成功找到了与解码 actor cookie 以及在按钮点击时打开插入对话框相关的代码路径。他另外让模型画了一只鹈鹕,结果虽然有些失真,但仍然清楚可辨,并且输出速度达到了每秒 103 个 token。Willison 还提到,他几乎没有找到 DeepReinforce 的更多背景信息,只能查到他们在 2025 年 6 月发表的一篇较早论文《CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning》。

Ornith-1.0 开源权重智能编程模型

资讯正文

<strong><a href="https://deep-reinforce.com/ornith_1_0.html">Ornith-1.0:用于 Agentic 编码的自我脚手架 LLM</a></strong>

这是一款有意思的新开源权重(MIT 许可)模型,也是 DeepReinforce 发布的首个模型。

[...] 其变体包括 9B Dense、31B Dense、35B MoE 和 397B MoE。它建立在预训练的 Gemma 4 和 Qwen 3.5 之上,并在同等规模的开源模型中,编码基准测试上达到了最先进的表现。

就我所能判断,这些底层模型的许可都允许这样使用——Gemma 4 采用 Apache 2.0 许可证,而且不再受此前 Gemma 模型所受的那种蹩脚的额外 <a href="https://ai.google.dev/gemma/terms">Gemma 使用条款</a>约束;Qwen 3.5 也同样采用 Apache 2.0 许可证。

我一直在用 LM Studio 和 <a href="https://huggingface.co/deepreinforce-ai/Ornith-1.0-35B-GGUF">ornith-1.0-35b-Q4_K_M.gguf</a>(20GB)GGUF 版本,并接入 <a href="https://pi.dev/">Pi</a> 来运行这个模型。初步印象非常好——它似乎能够以很熟练的方式在 agent harness 中连续进行多次工具调用。

这里有一段 <a href="https://gisthost.github.io/?35da4d9ce7f0c27124c67655a0dc9e5d">终端会话</a>,我让它在一个 Datasette 检出版本上先“找到解码 actor cookie 的代码”,然后再“找到在按钮被点击时打开插入对话框的代码”,它都轻松处理了。

我还让它<a href="https://gist.github.com/simonw/1869e1bbcafe5bcad0f26351f6a978a6">画这只鹈鹕</a>,输出速度达到每秒 103 个 token:

<img alt="一幅卡通插图:一只白色鹈鹕(虽然有点变形),有着大大的橙色喙,骑着一辆红色自行车穿过绿色丘陵。画面中有蓝天、黄色太阳和三朵白云,前景点缀着几簇小草。" src="https://static.simonwillison.net/static/2024/ornith-1-pelican.png" />

它有一点变形,不过这只鹈鹕显然就是一只鹈鹕。

我没能找到关于 DeepReinforce 本身多少信息。我能找到的这家公司最早的一篇论文是 2025 年 6 月的 <a href="https://arxiv.org/abs/2507.14111">CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning</a>。

标签:<a href="https://simonwillison.net/tags/ai">ai</a>,<a href="https://simonwillison.net/tags/generative-ai">generative-ai</a>,<a href="https://simonwillison.net/tags/local-llms">local-llms</a>,<a href="https://simonwillison.net/tags/llms">llms</a>,<a href="https://simonwillison.net/tags/qwen">qwen</a>,<a href="https://simonwillison.net/tags/pelican-riding-a-bicycle">pelican-riding-a-bicycle</a>,<a href="https://simonwillison.net/tags/gemma">gemma</a>,<a href="https://simonwillison.net/tags/llm-release">llm-release</a>,<a href="https://simonwillison.net/tags/lm-studio">lm-studio</a>

来源与参考

  1. 原始链接
  2. Ornith-1.0: Self-Scaffolding LLMs for Agentic Coding

收录于 2026-06-30