AI News HubLIVE
公開記事 7収集記事 7信頼度 88更新頻度 120 分
稼働状態 正常ソース種別 公式全文利用権限 公式全文最終取り込み 2026-05-05ID kimi-blog状態 有効

Official Kimi/Moonshot blog listing; verify terms before displaying full body.

最新公開記事

Kimi K2: オープンエージェントインテリジェンス

Kimi K2は、Excelフォーミュラ、ドキュメント処理、AIエージェント展開、コード支援、ブラウザ拡張などのツールと、Kimi K2.6、Agent Swarmなどの研究成果を含むオープンエージェントインテリジェンスプラットフォームです。

  • Excelの数式、ピボットテーブル、チャート作成をサポート
  • Kimi Clawで24時間AIエージェントをワンクリック展開
サイト内本文

Kimi K2 シンキング

Kimi K2 はオープンソースの思考モデルで、Excel、文書、コード、ブラウザ拡張などのツールを統合し、エージェントスウォームと深層研究をサポートします。

  • 様々なAIタスク向けのオープンソース思考モデル
  • Sheets、Docs、Code、WebBridgeツールを搭載
サイト内本文

Kimi ベンダーベリファイア

Kimiは、オープンソースモデルの推論実装の正確性を検証するためのベンダーベリファイア(KVV)をオープンソース化しました。このプロジェクトには、デプロイメントの一般的な問題を検出するための6つの重要なベンチマークが含まれており、インフラプロバイダーが根本的な原因を修正することを促進します。

  • KVVには、事前検証、OCRBench、MMMU Pro、AIME2025、ツール呼び出しテスト、SWE-Benchが含まれます。
  • ベンダー結果の公開リーダーボードを通じて透明性を高めます。
サイト内本文

Kimi K2.5 テクノロジーブログ:ビジュアルエージェントインテリジェンス

Kimi K2.5は、コーディングとビジョンタスクにおいて最先端の性能を発揮するオープンソースのマルチモーダルモデルです。最大100のサブエージェントを調整して並列実行する自己指示型エージェント群を備え、タスク完了時間を最大4.5倍短縮します。また、複雑なドキュメント、スプレッドシート、プレゼンテーションを処理するオフィス生産性にも優れています。Kimi.com、アプリ、API、Kimi Codeを通じて利用可能で、オープンソースコミュニティにとってAGIへの重要な一歩となります。

  • ビジョン機能を備えたコーディング向けの最先端オープンソースモデル。
  • 最大100のサブエージェントによる自己指示型エージェント群。
サイト内本文

WorldVQA:マルチモーダル大規模言語モデルにおける原子世界知識の測定

WorldVQAは、マルチモーダル大規模言語モデルの視覚的世界知識に関する事実的正確性を評価する新しいベンチマークです。3,500の高品質な画像-質問ペアから構成され、9カテゴリをカバーし、ヘッドとテールの知識分布に焦点を当てています。最先端モデルでも50%未満の精度にとどまり、過信と視覚知識のギャップが明らかになりました。

  • WorldVQAベンチマークは、3,500の高品質な画像-質問ペアを使用して、マルチモーダルLLMの原子的視覚世界知識をテストします。
  • モデルは著しく苦戦し、トップモデルでも50%未満の精度であり、特に長尾知識でパフォーマンスが低下します。
サイト内本文

Kimi Agent Swarm: 100のサブエージェントによるスケール

KimiはAgent Swarmを発表。最大100のサブエージェントを並行動作させ、水平スケーリングを実現するマルチエージェントアーキテクチャです。システムはCEO、研究者、アナリストなどの役割を自己組織化し、タスクの分解、エージェント割り当て、結果の統合を自律的に行います。逐次実行と比較して最大4.5倍高速で、大規模調査、バッチ処理、多視点分析に優れています。トップティア向けにプレビュー提供中。

  • Agent Swarmは水平スケーリングを実現し、最大100の並列サブエージェントと1,500回以上のツール呼び出しをサポート、逐次実行比4.5倍の高速化。
  • システムはCEO、研究者、アナリストなどの役割を自己組織化し、人間のマイクロマネジメント不要。
サイト内本文

Kimi K2.6 テックブログ:オープンソースコーディングの進化

Kimi K2.6 は、最先端のコーディング、長期間の実行、エージェントスウォーム機能を備えた新しいオープンソースモデルです。本記事では、その機能、ベンチマーク、コミュニティからのフィードバックを詳しく紹介します。

  • Kimi K2.6 はコーディングタスクで最先端の性能を達成し、長期間の自律実行をサポート
  • SWE-Bench、Terminal-Bench、BrowseComp などのベンチマークで優れた結果
サイト内本文

全ソース