2026-06-30 00:17 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 01:19 UTC+8

Ornith-1.0：用於自主程式設計的自支架LLM

DeepReinforce釋出了首個開放權重模型Ornith-1.0，基於Gemma 4和Qwen 3.5，提供多種引數規模（9B到397B），在程式設計基準測試中達到開源模型最佳效能。作者使用LM Studio測試了35B MoE變體，發現其能熟練處理多個工具呼叫，並在代理程式設計任務中表現出色。該模型採用MIT許可，底層模型均為Apache 2.0許可，相容性良好。

來源Simon Willison's Weblog

DeepReinforce公司近日釋出了其首個開放權重模型系列Ornith-1.0，這是一個專門為自主程式設計設計的自支架大規模語言模型（LLM）。該模型採用MIT許可證，基於谷歌的Gemma 4和阿里巴巴的Qwen 3.5預訓練模型構建，提供了四種不同規模的變體：9B稠密引數、31B稠密引數、35B混合專家（MoE）以及397B MoE。在多個程式設計基準測試中，Ornith-1.0達到了同類開源模型的最高水平，展現了其在程式碼生成、理解和代理任務上的強大能力。

作者使用LM Studio載入了35B MoE的GGUF量化版本（ornith-1.0-35b-Q4_K_M.gguf，約20GB），並將其連線至Pi平臺進行測試。初步印象非常積極：模型能夠熟練地執行代理框架，處理多次工具呼叫。在具體測試中，作者要求模型在Datasette程式碼庫中“查詢解碼actor cookie的程式碼”和“查詢點選按鈕時開啟插入對話方塊的程式碼”，模型均能輕鬆完成，顯示了其對程式碼庫的深度理解和精準定位能力。此外，作者還讓模型繪製一隻鵜鶘，模型以每秒103個令牌的速度生成了影像，雖然有些變形，但鵜鶘的主要特徵清晰可辨。

關於DeepReinforce公司本身的資訊目前還比較有限。作者能找到的最早論文是2025年6月發表的《CUDA-L1：透過對比強化學習改進CUDA最佳化》，這表明該公司在底層最佳化方面有一定的技術積累。許可方面，Gemma 4採用Apache 2.0許可，不再受之前Gemma模型繁瑣的《Gemma使用條款》約束；Qwen 3.5同樣為Apache 2.0許可。這些底層模型的許可證與Ornith-1.0的MIT許可證相容，為開發者提供了良好的使用環境。總體而言，Ornith-1.0是一個有前景的開源編碼代理模型，在本地部署條件下展現了出色的效能，值得AI和程式設計領域的開發者關注。