2026-06-30 00:17 UTC+8站内改写1 分钟阅读更新: 2026-06-30 01:19 UTC+8

Ornith-1.0：用于自主编程的自支架LLM

DeepReinforce发布了首个开放权重模型Ornith-1.0，基于Gemma 4和Qwen 3.5，提供多种参数规模（9B到397B），在编程基准测试中达到开源模型最佳性能。作者使用LM Studio测试了35B MoE变体，发现其能熟练处理多个工具调用，并在代理编程任务中表现出色。该模型采用MIT许可，底层模型均为Apache 2.0许可，兼容性良好。

来源Simon Willison's Weblog

DeepReinforce公司近日发布了其首个开放权重模型系列Ornith-1.0，这是一个专门为自主编程设计的自支架大规模语言模型（LLM）。该模型采用MIT许可证，基于谷歌的Gemma 4和阿里巴巴的Qwen 3.5预训练模型构建，提供了四种不同规模的变体：9B稠密参数、31B稠密参数、35B混合专家（MoE）以及397B MoE。在多个编程基准测试中，Ornith-1.0达到了同类开源模型的最高水平，展现了其在代码生成、理解和代理任务上的强大能力。

作者使用LM Studio加载了35B MoE的GGUF量化版本（ornith-1.0-35b-Q4_K_M.gguf，约20GB），并将其连接至Pi平台进行测试。初步印象非常积极：模型能够熟练地运行代理框架，处理多次工具调用。在具体测试中，作者要求模型在Datasette代码库中“查找解码actor cookie的代码”和“查找点击按钮时打开插入对话框的代码”，模型均能轻松完成，显示了其对代码库的深度理解和精准定位能力。此外，作者还让模型绘制一只鹈鹕，模型以每秒103个令牌的速度生成了图像，虽然有些变形，但鹈鹕的主要特征清晰可辨。

关于DeepReinforce公司本身的信息目前还比较有限。作者能找到的最早论文是2025年6月发表的《CUDA-L1：通过对比强化学习改进CUDA优化》，这表明该公司在底层优化方面有一定的技术积累。许可方面，Gemma 4采用Apache 2.0许可，不再受之前Gemma模型繁琐的《Gemma使用条款》约束；Qwen 3.5同样为Apache 2.0许可。这些底层模型的许可证与Ornith-1.0的MIT许可证兼容，为开发者提供了良好的使用环境。总体而言，Ornith-1.0是一个有前景的开源编码代理模型，在本地部署条件下展现了出色的性能，值得AI和编程领域的开发者关注。