AI News HubLIVE
サイト内リライト3 分で読了

最新のオープンアーティファクト(#22):Zyphra、Cohere、Poolsideがエコシステムの幅を拡大

オープンモデルエコシステムの多様性の傾向を評価し、さまざまな組織(純粋なモデルメーカー、ビッグテック、プロダクト企業)がオープンソースモデルをリリースする動機を分析。NVIDIA、Cohere、Zyphra、Poolsideなどの最新モデルリリースを紹介。

ソースInterconnects (Nathan Lambert)著者: Florian Brand

オープンモデルのエコシステムはますます多様化しており、多くの組織がさまざまなモデルをリリースしている。1年前、オープンアーティファクトとオープンモデルの分野は少数の(中国の)プレーヤーによって支配されていた。現在では、その状況は変わり、世界中のニッチな企業が注目を集めている。

企業の正確な動機を把握するのは難しいが、おおまかに以下のカテゴリーが観察される。

「純粋な」モデルメーカー:これらの企業は、最先端またはそれに近いモデルを訓練することを目標としている。DeepSeek、Zhipu、Minimaxなどの中国企業に加え、Poolside、Arcee、Zyphraなどの欧米企業も含まれる。また、Cohere、Sovereign、Mistral、Trillion Labsなどの主権AIプレーヤーも増えている。最近のMythosのエピソードは政策立案者に認識を促し、主権モデル訓練への関心を高める可能性がある。

ビッグテック:アリババ(Qwen)、Google(Gemma)、NVIDIAなどのビッグテック企業では、動機はより多様である。アリババはモデルリリースを利用してクローズドモデルのアップセルを行い、NVIDIAはオープンモデルエコシステムの繁栄からGPUへの関心と使用が高まることで利益を得る。この利害関係は、Llama時代のオープンな西洋モデルとは異なり、当時はオープンリリースの動機が不明確だった。

プロダクト企業:JetBrains、Zed、Krea、Photoroomなどの企業は、AIを中核とする製品を販売している。クローズドモデルへのアクセスが遮断されることを避けたり、独自性を提供するために、製品ニーズに合った高度に専門化された小規模モデルを訓練する。そのため、モデルウェイトをオープンソース化しても収益に影響しない。

このメーカーとモデルの多様性は、より多くの企業がロングテールのモデルを開発し、絶対的なオープンフロンティアを追い求める企業の数が減少するという仮説を支持する。

すべてのモデルリリースがこれらのカテゴリーに当てはまるわけではないが、オープンモデル開発は単一のタイプのアクターや動機によって推進されているわけではない。この多様性はオープンエコシステムの強みの一つであり、モデルリリースのテクニカルレポートにも表れており、他のオープンモデルリリースの訓練手法、アーキテクチャ選択、データを再利用している。

このエコシステムを減速または禁止しようとする試みは、技術禁止の歴史が示すように無駄であるだけでなく、安全ではなく、自由に反する。そのような制限はAI開発と使用を一部の者に集中させ、最終的には外部者が現代で最も重要な技術の一つを自由に採用する能力を危険にさらす。

私たちのピック

  • NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16(nvidia):Nemotronシリーズの大型版。LatentMoEを使用し、同等のモデルよりも高速。他のNemotronモデルと同様、データの大部分はオープンソース。さらに、NVIDIAはモデルウェイトとデータに特化したOpenMDWライセンスを採用し、カスタムライセンスを廃止。
  • command-a-plus-05-2026-bf16(CohereLabs):Cohereは最近アーティファクトに定期的に登場しているが、フラッグシップモデルCommand A+をApache 2.0でリリース。以前のバージョンは非商用ライセンスだったため、この変更は歓迎される。Command A+はマルチモーダル、多言語、エージェント機能を組み合わせた218B-A25B MoEで、シングルB200(4ビット)で使用可能。
  • GLM-5.2(zai-org):今回のアーティファクトで最大のニュースはGLM-5.2で、別のブログでも取り上げた。このモデルは印象的であり、日常業務に実用的で、最高のクローズドモデルと比較しても大きな劣化はない。興味深いことに、リリース後のダウンロード数はGLM-5とおおむね同程度。
  • ZAYA1-74B-preview(Zyphra):AMD GPUで訓練を行い、興味深いアーキテクチャ選択のテクニカルレポートで研究コミュニティの内部情報として知られるZyphraが、新しいモデルをリリース。74B-A4B MoEと8B-A0.6B MoE(テクニカルレポート)が現在のフラッグシップ。
  • Laguna-M.1(poolside):前回のアーティファクトで取り上げたPoolsideも、Apache 2.0でフラッグシップモデルをリリース。今後もオープンリリースを継続することを表明。

モデル

汎用

  • Kimi-K2.7-Code(moonshotai):トークン効率に重点を置いたアップデート。
  • Step-3.7-Flash(stepfun-ai):特に数学で強いアップデート。
  • Nemotron-Labs-Diffusion-14B(nvidia):実験的モデルで、自己回帰、拡散、自己推測の3つのモードで使用可能。各モードは異なるユースケースに適している。
最新のオープンアーティファクト(#22):Zyphra、Cohere、Poolsideがエコシステムの幅を拡大 | AI News Hub