Ornith-1.0: エージェンティックコーディングのための自己足場LLM
DeepReinforceが初のオープンウェイトモデルOrnith-1.0をリリース。Gemma 4とQwen 3.5をベースに、9Bから397Bまでのバリエーションがあり、コーディングベンチマークでオープンソースモデルとして最高性能を達成。著者はLM Studioで35B MoEバリアントをテストし、エージェントツール呼び出しを効率的に処理できることを確認した。
DeepReinforceは、エージェンティックコーディングに特化した自己足場LLMシリーズ「Ornith-1.0」をリリースしました。これは同社初のオープンウェイトモデルであり、MITライセンスの下で公開されています。ベースにはGoogleのGemma 4とAlibabaのQwen 3.5の事前学習モデルを採用し、9B Dense、31B Dense、35B MoE、397B MoEという4つのバリアントが用意されています。コーディングベンチマークにおいて、同規模のオープンソースモデルの中で最高のパフォーマンスを達成しており、コード生成や理解、エージェントタスクにおいて優れた能力を発揮します。
著者はLM Studioを用いて35B MoEのGGUF量子化バージョン(ornith-1.0-35b-Q4_K_M.gguf、約20GB)を実行し、Piに接続してテストを行いました。初期の印象は非常に良好で、エージェントフレームワークを複数回のツール呼び出しにわたって効率的に実行できることが確認されました。具体的には、Datasetteのコードベースに対して「actor cookieをデコードするコードを見つける」および「ボタンがクリックされたときに挿入ダイアログを開くコードを見つける」という2つのタスクを依頼し、モデルはこれらを容易に処理しました。また、モデルにペリカンの描画を依頼したところ、秒間103トークンの速度で画像を生成しました。多少歪みはあるものの、ペリカンであることは明確に識別できました。
DeepReinforce社自体に関する情報はまだ限られています。著者が見つけた最も古い論文は2025年6月の「CUDA-L1: 対比強化学習によるCUDA最適化の改善」であり、同社が低レベルの最適化に強みを持っていることを示唆しています。ライセンス面では、Gemma 4はApache 2.0ライセンス(以前のGemmaモデルを悩ませた煩雑な追加利用規約は適用されない)、Qwen 3.5もApache 2.0ライセンスであり、Ornith-1.0のMITライセンスとの互換性に問題はありません。全体として、Ornith-1.0はローカル環境で高いパフォーマンスを発揮する有望なオープンソースコーディングエージェントモデルであり、AIおよびプログラミング分野の開発者にとって注目すべきリリースです。