AI News HubLIVE
站內改寫1 分鐘閱讀

Ornith-1.0:用於自主程式設計的自支架LLM

DeepReinforce釋出了首個開放權重模型Ornith-1.0,基於Gemma 4和Qwen 3.5,提供多種引數規模(9B到397B),在程式設計基準測試中達到開源模型最佳效能。作者使用LM Studio測試了35B MoE變體,發現其能熟練處理多個工具呼叫,並在代理程式設計任務中表現出色。該模型採用MIT許可,底層模型均為Apache 2.0許可,相容性良好。

DeepReinforce公司近日釋出了其首個開放權重模型系列Ornith-1.0,這是一個專門為自主程式設計設計的自支架大規模語言模型(LLM)。該模型採用MIT許可證,基於谷歌的Gemma 4和阿里巴巴的Qwen 3.5預訓練模型構建,提供了四種不同規模的變體:9B稠密引數、31B稠密引數、35B混合專家(MoE)以及397B MoE。在多個程式設計基準測試中,Ornith-1.0達到了同類開源模型的最高水平,展現了其在程式碼生成、理解和代理任務上的強大能力。

作者使用LM Studio載入了35B MoE的GGUF量化版本(ornith-1.0-35b-Q4_K_M.gguf,約20GB),並將其連線至Pi平臺進行測試。初步印象非常積極:模型能夠熟練地執行代理框架,處理多次工具呼叫。在具體測試中,作者要求模型在Datasette程式碼庫中“查詢解碼actor cookie的程式碼”和“查詢點選按鈕時開啟插入對話方塊的程式碼”,模型均能輕鬆完成,顯示了其對程式碼庫的深度理解和精準定位能力。此外,作者還讓模型繪製一隻鵜鶘,模型以每秒103個令牌的速度生成了影像,雖然有些變形,但鵜鶘的主要特徵清晰可辨。

關於DeepReinforce公司本身的資訊目前還比較有限。作者能找到的最早論文是2025年6月發表的《CUDA-L1:透過對比強化學習改進CUDA最佳化》,這表明該公司在底層最佳化方面有一定的技術積累。許可方面,Gemma 4採用Apache 2.0許可,不再受之前Gemma模型繁瑣的《Gemma使用條款》約束;Qwen 3.5同樣為Apache 2.0許可。這些底層模型的許可證與Ornith-1.0的MIT許可證相容,為開發者提供了良好的使用環境。總體而言,Ornith-1.0是一個有前景的開源編碼代理模型,在本地部署條件下展現了出色的效能,值得AI和程式設計領域的開發者關注。