Kimi K2.7 Code モデルの紹介
Kimi K2.7 Code は、長期間コーディング、256K の超長コンテキスト、強力な推論機能を備えた最新のコーディングモデルです。マルチモーダルツール呼び出しをサポートし、使用例やベストプラクティスを詳しく紹介します。
Kimi K2.7 Code は、Kimi シリーズの最新コーディングモデルであり、長期間コーディングタスクにおいて重要なブレークスルーを達成しました。このモデルは、長いコンテキスト内での指示に確実に従い、Rust、Go、Python などの多様なプログラミング言語と、フロントエンド開発、DevOps、パフォーマンス最適化などのタスクシナリオにおいて、高い成功率でコーディングタスクを完了します。
コンテキストサポートに関しては、Kimi K2.7 Code は最大 256K の超長コンテキストウィンドウを提供し、超長テキストやコードを処理できます。また、モデルは強力な推論機能を保持しており、マルチステップのツール呼び出しと推論をサポートし、複雑な論理推論、数学問題、コード作成に適しています。注意すべき点として、このモデルは思考モードのみをサポートしており、無効化はできません。そのため、すべてのリクエストで思考機能を有効にする必要があります。
Kimi API は OpenAI の API 形式と完全互換であり、OpenAI SDK をインストールするだけで簡単に接続できます。公式では、ビデオ分析の完全な例が提供されており、モデルの視覚理解とツール呼び出し機能を示しています。ユーザーはマルチモーダルツール関数 watch_video_clip を使用してビデオクリップを分析し、モデルが自動的にツールを呼び出して結果を返します。この例には、SDK のインストール、インストールの確認、およびビデオクリップ抽出とマルチモーダル出力を処理する完全なエージェントループコードが含まれています。
ベストプラクティスとして、モデルは一般的な画像形式(png、jpeg、webp、gif)とビデオ形式(mp4、mpeg、mov、avi など)をサポートします。画像の解像度は 4K(4096×2160)以下、ビデオの解像度は 2K(2048×1080)以下が推奨され、それ以上の解像度は処理時間を増やすだけで理解度は向上しません。大きなビデオの場合は、リクエストボディのサイズ制限を避けるため、base64 エンコードではなくファイルアップロード方式を使用する必要があります。モデルは画像数に制限はありませんが、リクエストボディのサイズは 100MB を超えてはならず、URL 形式の画像はサポートされず、base64 エンコードのみがサポートされます。
パラメータに関して、Kimi K2.7 Code は固定値を使用します。温度は 1.0、top_p は 0.95、n は 1、存在ペナルティと頻度ペナルティは 0.0 で固定されており、他の値を指定するとエラーになります。ツール呼び出し時には、tool_choice は "auto" または "none"(デフォルトは "auto")のみ設定可能です。マルチステップのツール呼び出し中は、アシスタントメッセージの reasoning_content をコンテキスト内に保持する必要があり、そうしないとエラーが発生します。トークン課金は moonshot-v1 モデルシリーズと同様で、処理されたトークン総数に基づいて課金されます。画像とビデオのトークン消費は動的に計算され、解像度が高いほど消費が増加します。詳細(ベンチマークやモデル価格を含む)は公式ドキュメントを参照してください。