2026-06-30 00:17 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 01:19 UTC+8

Ornith-1.0：用於自主編程的自支架LLM

DeepReinforce發佈了首個開放權重模型Ornith-1.0，基於Gemma 4和Qwen 3.5，提供多種參數規模（9B到397B），在編程基準測試中達到開源模型最佳性能。作者使用LM Studio測試了35B MoE變體，發現其能熟練處理多個工具調用，並在代理編程任務中表現出色。該模型採用MIT許可，底層模型均為Apache 2.0許可，兼容性良好。

來源Simon Willison's Weblog

DeepReinforce公司近日發佈了其首個開放權重模型系列Ornith-1.0，這是一個專門為自主編程設計的自支架大規模語言模型（LLM）。該模型採用MIT許可證，基於谷歌的Gemma 4和阿里巴巴的Qwen 3.5預訓練模型構建，提供了四種不同規模的變體：9B稠密參數、31B稠密參數、35B混合專家（MoE）以及397B MoE。在多個編程基準測試中，Ornith-1.0達到了同類開源模型的最高水平，展現了其在代碼生成、理解和代理任務上的強大能力。

作者使用LM Studio加載了35B MoE的GGUF量化版本（ornith-1.0-35b-Q4_K_M.gguf，約20GB），並將其連接至Pi平台進行測試。初步印象非常積極：模型能夠熟練地運行代理框架，處理多次工具調用。在具體測試中，作者要求模型在Datasette代碼庫中“查找解碼actor cookie的代碼”和“查找點擊按鈕時打開插入對話框的代碼”，模型均能輕鬆完成，顯示了其對代碼庫的深度理解和精準定位能力。此外，作者還讓模型繪製一隻鵜鶘，模型以每秒103個令牌的速度生成了圖像，雖然有些變形，但鵜鶘的主要特徵清晰可辨。

關於DeepReinforce公司本身的信息目前還比較有限。作者能找到的最早論文是2025年6月發表的《CUDA-L1：通過對比強化學習改進CUDA優化》，這表明該公司在底層優化方面有一定的技術積累。許可方面，Gemma 4採用Apache 2.0許可，不再受之前Gemma模型繁瑣的《Gemma使用條款》約束；Qwen 3.5同樣為Apache 2.0許可。這些底層模型的許可證與Ornith-1.0的MIT許可證兼容，為開發者提供了良好的使用環境。總體而言，Ornith-1.0是一個有前景的開源編碼代理模型，在本地部署條件下展現了出色的性能，值得AI和編程領域的開發者關注。