AI News HubLIVE
站内改写1 分钟阅读

Ornith-1.0:用于自主编程的自支架LLM

DeepReinforce发布了首个开放权重模型Ornith-1.0,基于Gemma 4和Qwen 3.5,提供多种参数规模(9B到397B),在编程基准测试中达到开源模型最佳性能。作者使用LM Studio测试了35B MoE变体,发现其能熟练处理多个工具调用,并在代理编程任务中表现出色。该模型采用MIT许可,底层模型均为Apache 2.0许可,兼容性良好。

DeepReinforce公司近日发布了其首个开放权重模型系列Ornith-1.0,这是一个专门为自主编程设计的自支架大规模语言模型(LLM)。该模型采用MIT许可证,基于谷歌的Gemma 4和阿里巴巴的Qwen 3.5预训练模型构建,提供了四种不同规模的变体:9B稠密参数、31B稠密参数、35B混合专家(MoE)以及397B MoE。在多个编程基准测试中,Ornith-1.0达到了同类开源模型的最高水平,展现了其在代码生成、理解和代理任务上的强大能力。

作者使用LM Studio加载了35B MoE的GGUF量化版本(ornith-1.0-35b-Q4_K_M.gguf,约20GB),并将其连接至Pi平台进行测试。初步印象非常积极:模型能够熟练地运行代理框架,处理多次工具调用。在具体测试中,作者要求模型在Datasette代码库中“查找解码actor cookie的代码”和“查找点击按钮时打开插入对话框的代码”,模型均能轻松完成,显示了其对代码库的深度理解和精准定位能力。此外,作者还让模型绘制一只鹈鹕,模型以每秒103个令牌的速度生成了图像,虽然有些变形,但鹈鹕的主要特征清晰可辨。

关于DeepReinforce公司本身的信息目前还比较有限。作者能找到的最早论文是2025年6月发表的《CUDA-L1:通过对比强化学习改进CUDA优化》,这表明该公司在底层优化方面有一定的技术积累。许可方面,Gemma 4采用Apache 2.0许可,不再受之前Gemma模型繁琐的《Gemma使用条款》约束;Qwen 3.5同样为Apache 2.0许可。这些底层模型的许可证与Ornith-1.0的MIT许可证兼容,为开发者提供了良好的使用环境。总体而言,Ornith-1.0是一个有前景的开源编码代理模型,在本地部署条件下展现了出色的性能,值得AI和编程领域的开发者关注。