AI News HubLIVE
サイト内リライト2 分で読了

Empero-AI/Qwythos-9B-Claude-Mythos-5-1M:Qwen3.5ベースの100万コンテキスト推論モデル

Qwythos-9Bは、Empero AIが開発した全パラメータ推論モデルで、深い検閲解除済みのQwen3.5-9Bをベースに、5億以上のトークンからなる高品質なClaude MythosおよびFableトレースと社内ツールrethinkによる思考連鎖を用いてポストトレーニングされています。このモデルは1,048,576トークンのコンテキストウィンドウを備え、MMLUやGSM8Kでベースモデルを大幅に上回り(最大+34ポイント)、ネイティブな関数呼び出しとツール支援による自己修正をサポートします。意図的に検閲されておらず、サイバーセキュリティ、レッドチーミング、生物医学などの技術的要求の高い分野を対象としています。

ソースHacker News AI著者: vednig

Empero AIは、Qwen3.5-9Bをベースとした全パラメータ推論モデルQwythos-9Bをリリースしました。このモデルは、深い検閲解除済みのQwen3.5-9Bベースに、社内ツールrethinkで生成された思考連鎖と、5億以上のトークンからなる高品質なClaude MythosおよびClaude Fableトレースを用いてポストトレーニングされています。トレーニングデータはAnthropicのClaudeシリーズから慎重に選別・合成され、推論タスクでの優れた性能を実現しています。

Qwythos-9Bの特筆すべき特徴の一つは、その巨大なコンテキストウィンドウです。このモデルはYaRN ropeスケーリングをデフォルトで有効にしており、1,048,576トークンのフルコンテキストウィンドウを即座に利用可能です。これは9Bクラスのオープンウェイトモデルでは極めて稀であり、長文書、コードベース全体、またはマルチターン対話を処理するタスク、例えばコードベース全体の推論、マルチドキュメント研究、長期エージェント軌跡などに適しています。ベンチマークでは、Qwythos-9BはベースのQwen3.5-9Bと比較して顕著な改善を示しました:MMLUの正解率は0.232から0.575へ(+34.3%)、GSM8Kの厳密一致は0.51から0.81へ(+30%)、柔軟一致は0.67から0.86へ(+19%)向上しました。ARC-ChallengeやGPQA Diamondでも改善が見られました。

優れたベンチマーク性能に加えて、Qwythos-9BはQwen3.5仕様の関数呼び出しをネイティブにサポートしており、追加のラッパーやツール固有のファインチューニングは不要です。Python実行環境とウェブ検索ツールを付与したテストでは、数学、サイバーセキュリティ、臨床薬理学、生化学の7プロンプトすべてにおいて、出典付きで事実に基づく回答を生成し、優れたツール支援自己修正能力を示しました。この能力は、インテリジェントエージェントや自動化ワークフローの構築に大きな可能性をもたらします。

Qwythos-9Bは意図的に検閲されておらず、サイバーセキュリティ、レッドチーミング手法、生物学、薬理学、臨床医学といった技術的に要求の厳しい分野に真摯に対応するよう設計されています。これらの分野では、過度に調整されたモデルは回答を拒否したり、役に立たない曖昧な表現や定型の免責事項を出力する傾向がありますが、Qwythos-9Bは実質的な技術的応答を提供します。Empero AIは、このモデルが研究者や実務者によって管理された環境でセンシティブだが技術的な問題を探求するために適していると強調しています。

すべての評価結果はlm-evaluation-harnessを用いて同一条件下で得られています(同一のテストフレームワーク、同一のサンプリングパラメータ:temperature=0.6、top_p=0.95、top_k=20、制限100サンプル)。完全なタスク別・科目別(MMLU)の評価結果は、Hugging Faceモデルページのevals/lm_eval_results.mdで確認できます。生の結果JSONとサンプルごとのJSONLファイルもリクエストに応じて入手可能です。

Qwythos-9BはApache 2.0ライセンスで公開されており、TransformersおよびSafetensors形式に対応しています。2026年6月28日現在、Hugging Face上で5.2万以上のダウンロードと532のいいねを獲得し、コミュニティから高い関心を集めています。開発者はInference Endpointsの統合やローカルデプロイを通じてモデルを利用でき、そのマルチモーダル能力を活かして画像とテキストを処理することも可能です。