Ornith-1.0:用於自主編程的自支架LLM
DeepReinforce發佈了首個開放權重模型Ornith-1.0,基於Gemma 4和Qwen 3.5,提供多種參數規模(9B到397B),在編程基準測試中達到開源模型最佳性能。作者使用LM Studio測試了35B MoE變體,發現其能熟練處理多個工具調用,並在代理編程任務中表現出色。該模型採用MIT許可,底層模型均為Apache 2.0許可,兼容性良好。
DeepReinforce公司近日發佈了其首個開放權重模型系列Ornith-1.0,這是一個專門為自主編程設計的自支架大規模語言模型(LLM)。該模型採用MIT許可證,基於谷歌的Gemma 4和阿里巴巴的Qwen 3.5預訓練模型構建,提供了四種不同規模的變體:9B稠密參數、31B稠密參數、35B混合專家(MoE)以及397B MoE。在多個編程基準測試中,Ornith-1.0達到了同類開源模型的最高水平,展現了其在代碼生成、理解和代理任務上的強大能力。
作者使用LM Studio加載了35B MoE的GGUF量化版本(ornith-1.0-35b-Q4_K_M.gguf,約20GB),並將其連接至Pi平台進行測試。初步印象非常積極:模型能夠熟練地運行代理框架,處理多次工具調用。在具體測試中,作者要求模型在Datasette代碼庫中“查找解碼actor cookie的代碼”和“查找點擊按鈕時打開插入對話框的代碼”,模型均能輕鬆完成,顯示了其對代碼庫的深度理解和精準定位能力。此外,作者還讓模型繪製一隻鵜鶘,模型以每秒103個令牌的速度生成了圖像,雖然有些變形,但鵜鶘的主要特徵清晰可辨。
關於DeepReinforce公司本身的信息目前還比較有限。作者能找到的最早論文是2025年6月發表的《CUDA-L1:通過對比強化學習改進CUDA優化》,這表明該公司在底層優化方面有一定的技術積累。許可方面,Gemma 4採用Apache 2.0許可,不再受之前Gemma模型繁瑣的《Gemma使用條款》約束;Qwen 3.5同樣為Apache 2.0許可。這些底層模型的許可證與Ornith-1.0的MIT許可證兼容,為開發者提供了良好的使用環境。總體而言,Ornith-1.0是一個有前景的開源編碼代理模型,在本地部署條件下展現了出色的性能,值得AI和編程領域的開發者關注。