ロボットがあなたに向かって走ってくる:ClaudeとGrok、どちらを搭載しますか? 2026-06-05 08:51 UTC+9 OpenRouterのJacky Liangが11の大規模言語モデルを2Dバトルロイヤルゲームに投入する実験を行った。Grok 4.1 Fastが43%の勝率で優勝し、1勝あたり0.97ドルと最もコスト効率が良かった。一方、Claude Sonnet 4.6は5勝したものの、1勝あたり26.78ドルとGrokの27.7倍のコストがかかり、アライメントコストの影響が明らかになった。
Grok 4.1 Fastは30戦中13勝、1勝あたり0.97ドルで最もコスト効率が良かった。 Claude Sonnet 4.6は過度な協力行動を示し、5勝したがコストはGrokの27.7倍。 ロボットがあなたに向かって走ってくる:ClaudeとGrok、どちらで動かしたい? 2026-06-04 02:48 UTC+9 11のLLMを2Dバトルロワイヤルゲームで競わせた実験の結果、Grok 4.1 Fastが最も低コストで勝利を収め、Claude Sonnet 4.6は過度な協調行動によりパフォーマンスが低下した。この結果は、アライメント税がモデルの性能に与える影響と、従来のベンチマークが実際のタスク成功を予測できないことを示している。
Grok 4.1 Fastは30戦中13勝を達成し、1勝あたりのコストは0.97ドル。 Claude Sonnet 4.6は5勝したが、1勝あたり26.78ドルとGrokの27倍のコスト。 ガードレール:エージェント、データ、コストを保護する | OpenRouter 2026-05-30 08:37 UTC+9 OpenRouter はワークスペース向けのガードレールを発表しました。これは、予算執行、ゼロデータ保持、モデル/プロバイダー制限、プロンプトインジェクション防御、データ損失防止を備えた設定可能なセキュリティおよびガバナンスツールです。ガードレールは API キーやチームメンバーに割り当てることができ、コードを変更せずにきめ細かい制御が可能です。
予算執行:日次、週次、月次のリセット期間で支出制限を設定、エンティティごとに独立。 ゼロデータ保持とモデル/プロバイダー制限:データを保持/トレーニングするエンドポイントをブロック、または許可リストに制限。 OpenRouter、シリーズBで1億1300万ドルを調達 2026-05-28 14:31 UTC+9 OpenRouterは、CapitalG(Alphabetの独立成長ファンド)がリードする1億1300万ドルのシリーズBラウンドを発表した。NVentures(NVIDIAのベンチャーキャピタル部門)、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Venturesなどが参加。週間処理量は5兆トークンから25兆トークンに増加し、800万人以上の開発者が400以上のモデルを利用。資金はインフラの拡大、エンタープライズ機能の強化、インテリジェントルーティングの深化に充てられる。
OpenRouterがシリーズBで1億1300万ドルを調達、CapitalGがリード。NVIDIA、ServiceNow、MongoDB、Snowflake、Databricksなどの戦略的投資家が参加。 週間トークン処理量が6ヶ月で5兆から25兆に成長、年内に1兆トークンを超える見込み。 Agent SDK:OpenRouterでマルチターンエージェントワークフローを構築する 2026-05-15 12:42 UTC+9 OpenRouterは@openrouter/agent SDKをリリース。これはモデル非依存のTypeScriptツールキットで、ツール実行、マルチターンループ、停止条件、ストリーミング、コスト追跡、ツール承認をサポートし、エージェントワークフローの構築を簡素化します。
@openrouter/agent SDKはエージェントループロジックをcallModel関数にカプセル化し、300以上のモデルをサポート。 主な機能:ツール実行、マルチターンループ、構成可能な停止条件、ストリーミング。 Agent SDKを使って独自のハーネスを構築する | OpenRouter 2026-05-15 12:41 UTC+9 OpenRouterは、エージェントハーネスを構築するための2つのスキル(create-agent-tuiとcreate-headless-agent)を発表しました。どちらもAgent SDKを使用して完全なTypeScriptプロジェクトを生成し、カスタマイズ可能な機能とOpenRouterの任意のモデルとの統合を提供します。これらのスキルは、細かい制御、最小限のデプロイ、学習価値を提供します。主な機能には、インタラクティブなチェックリスト、カスタマイズ可能なUI、セッション永続化、安全なリトライ、構造化出力が含まれます。
OpenRouterがエージェントハーネス用の2つのスキル(create-agent-tuiとcreate-headless-agent)をリリース。 両スキルはAgent SDKを使用し、エージェントループ、ツール実行、ストリーミング、コスト追跡を処理。 Opus 4.7の新しいトークナイザー:実際のコスト影響 | OpenRouter 2026-05-15 12:40 UTC+9 AnthropicがClaude Opus 4.7に導入した新トークナイザーにより、同じ入力で消費トークン数が増加し、コストが12~27%上昇。ただし、短いプロンプトでは出力が短縮され、かえって安くなる。OpenRouterが100万件超のリクエストを分析。
トークナイザーの影響でトークン数が32~45%増加するが、キャッシュが長いプロンプトの大部分を吸収。 実際の100万トークンあたりのコストは、2Kトークン超のプロンプトで12~27%上昇、2K未満では1.6%低下。 4月リリース・スポットライト | OpenRouter 2026-05-15 12:39 UTC+9 OpenRouterの4月の主なアップデート:動画生成機能、マルチプロジェクト分離のためのワークスペース、任意のモデルをエージェント化するTypeScript SDK、リランカーモデル、モデルフュージョン、プロンプト履歴、ベンチマーク、知識カットオフ日付、そしてGPT-5.5やDeepSeek V4 Proなどの最先端モデル。
動画生成:Seedance 2.0、Veo 3.1、Wan 2.7、Sora 2 Proなどに対応、非同期ジョブ追跡と機能検出を備えた統一API。 ワークスペース:プロジェクトごとにAPIキー、ルーティング設定、ガードレール、観測可能性を分離可能。 応答キャッシュ:同一リクエストはゼロコスト | OpenRouter 2026-05-15 12:39 UTC+9 OpenRouter は同一の API リクエストをキャッシュできる応答キャッシュ機能を導入し、ミリ秒単位で応答を返し、トークン課金はゼロです。キャッシュはプロバイダの前に配置され、リクエスト詳細をハッシュ化します。ストリーミングおよび非ストリーミングをサポートし、複数のエンドポイントで動作し、TTL 制御やキャッシュクリアなどの機能があります。エージェントのリトライ、テストスイート、繰り返しプロンプトに最適です。
X-OpenRouter-Cache: true ヘッダーを追加して同一リクエストをキャッシュ。最初の呼び出しは通常課金、以降は無料。 キャッシュヒット時の応答時間は 80〜300 ミリ秒(キャッシュ検索は約 4 ミリ秒)、非キャッシュリクエストは数秒。 OpenRouterが音声認識とテキスト読み上げの新APIを発表 2026-05-15 12:38 UTC+9 OpenRouterは、テキスト読み上げと音声認識の専用エンドポイントを追加し、OpenAI、Google、Mistralなどのモデルをより高速かつ低コストで提供します。
新しいエンドポイント /api/v1/audio/speech と /api/v1/audio/transcriptions。 音声モデル:GPT-4o Mini TTS、Gemini Flash TTS、Voxtral Mini TTS。 Agent SDK のヒューマン・イン・ザ・ループツール | OpenRouter 2026-05-15 12:38 UTC+9 OpenRouter の Agent SDK が、第4のツールタイプとしてヒューマン・イン・ザ・ループ(HITL)ツールをサポートしました。単一のフックで、エージェントがルーティンコールを自動処理し、ハイリスクな場面では人間の介入を待つことができます。
HITL ツールは onToolCalled フックで入力を検査し、値を返せば続行、null を返せば人間の判断を待つために一時停止します。 オプションの onResponseReceived フックは、人間が応答を提供した後に変換を加え、メタデータの付与、フォーマットの正規化、ビジネスルールの検証などが可能です。