Gemini OmniとGemini 3.5の動作デモ11選
Google I/O 2026で、GoogleはGemini OmniとGemini 3.5シリーズを発表しました。Gemini Omniは動画などの入力からコンテンツを生成し、会話を通じて動画を編集できます。Gemini 3.5 Flashは複雑なエージェントタスクに特化し、マルチステップワークフローやコード生成を可能にします。この記事では、これらのモデルの11のビデオデモを紹介します。
記事インテリジェンス
要点
- Gemini Omniは動画入力から新しいコンテンツを生成し、自然言語で動画編集が可能。
- Gemini 3.5 Flashは長期的なエージェントタスクに優れ、マルチステップワークフローをサポート。
- 3.5 FlashとAntigravityの組み合わせにより、大規模問題に対応する協調サブエージェントを展開。
- 情報エージェントと生成UI機能は今夏検索に搭載予定。
重要な理由
このニュースが重要なのは、Gemini Omniは動画入力から新しいコンテンツを生成し、自然言語で動画編集が可能ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
Google I/O 2026で、Googleは最新モデルであるGemini OmniとGemini 3.5ファミリーを発表しました。Gemini Omniは、動画をはじめとするあらゆる入力からコンテンツを生成できる新しいモデルです。画像、音声、動画、テキストを入力として組み合わせ、Geminiの現実世界の知識に基づいた高品質な動画を生成できます。また、会話を通じて簡単に動画を編集することもできます。
Gemini 3.5は、フロンティアインテリジェンスとアクションを組み合わせた最新モデルファミリーであり、より有能でインテリジェントなエージェントを構築するための大きな飛躍を表しています。このシリーズの最初のモデルとして、3.5 Flashがリリースされました。エージェントとコーディングにおいてフロンティアパフォーマンスを発揮し、実際のユーティリティを提供する複雑な長期タスクに優れています。
これらのモデルの能力をより明確に理解していただくために、ここではGemini OmniとGemini 3.5 Flashで可能になる11のデモを紹介します。
Gemini Omni
会話による動画編集:Omniを特別なものにしている機能の1つは、自然言語で動画を編集できることです。各指示は前の指示に基づいて構築され、キャラクターの一貫性が保たれ、物理法則が維持され、シーンは以前の内容を記憶します。つまり、周囲の世界を変革できます。特定のものを変更したり、すべてを変更したりできます。動画は、自分では絶対に撮影できなかったものの出発点になります。
アクションの再想像:撮影した動画に対して、Omniに何が起こっているかを変更するよう依頼するだけです。アクションを編集し、新しいキャラクターやオブジェクトを追加し、瞬間を予期しないものに変えることができます。
複数ターンでの動画の洗練:環境、アングル、スタイル、特定の詳細を変更しても、元のシーンのスレッドを失うことはありません。デモでは、連続した編集によって、バイオリン奏者が元の環境から画像環境に移動し、バイオリンが透明になり、カメラアングルが変更される様子が示されています。
Gemini 3.5 Flash
エージェントタスクの大規模処理:3.5 Flashは、Flashシリーズに期待される速度で、複数の次元において大型フラッグシップモデルに匹敵するインテリジェンスを提供します。この速度とパフォーマンスのバランスにより、3.5 Flashは長期のエージェントタスクに最適です。Antigravityを搭載した3.5 Flashは、動的基準に基づいて非構造化アセットを自動的に名前変更および分類するマルチステップワークフローを実行します。
更新されたAntigravityハーネスと組み合わせると、3.5 Flashは、最も要求の厳しいユースケースで大規模な問題に取り組むために協調サブエージェントを展開する強力なエンジンになります。監督下で、フロンティアパフォーマンスを維持しながら、マルチステップワークフローとコーディングタスクを確実に実行できます。
3.5 FlashでよりリッチでインタラクティブなWeb UIとグラフィックスを作成:3.5 Flashは、Gemini 3の強力なマルチモーダル基盤の上に構築されています。Antigravityを搭載した3.5 Flashは、サブエージェントを使用して数学的概念πの美しい可視化を作成します。
3.5 Flashを使用して複数のクリエイティブコンセプトを並行して開発可能:この例では、Antigravity内の3.5 Flashが高速で64のフラクタルバリエーションを作成します。
3.5 Flashを使用した反復ループによる高速コーディング:AI Studio上で、3.5 Flashが60秒でチェックアウトフローの異なるUXアプローチを生成する様子をご覧ください。
パーソナルAIエージェントと新しいインテリジェント体験
3.5 Flashは現在、GeminiアプリとSearchのAIモードのデフォルトモデルとなっており、そのエージェント機能は日常生活にフロンティアレベルのインテリジェンスをもたらしています。強化されたエージェントコーディング機能により、新しい情報エージェントなど、さらにインテリジェントなSearch体験が実現しています。これらのエージェントは24時間年中無休でバックグラウンドで動作し、情報をインテリジェントに推論して、必要なものを正確に適切なタイミングで見つけ出します。詳細を掘り下げるためのWebリンクとともに包括的なアップデートを送信するため、ユーザーは行動を起こすことができます。情報エージェントは今年夏、まずGoogle AI ProおよびUltraサブスクライバー向けに開始されます。
Google AntigravityとGemini 3.5 Flashのエージェントコーディング機能をSearchに直接導入することで、Searchはユーザーの質問に最適な形式で理想的な応答をその場で構築できます。これにより、ユーザーのニーズに合わせたカスタム生成UI(ビジュアルツールやシミュレーションを含む)を利用できるようになります。これらの生成UI機能は今年夏、Searchですべてのユーザーに無料で提供されます。
結婚式の計画や新しいフィットネスルーチンの確立などの継続的なタスクについては、Searchはダッシュボード、トラッカー、ミニアプリなどのカスタム体験を構築します。今後数か月以内に、米国のGoogle AI ProおよびUltraサブスクライバーを対象に、Search内でAntigravityを使用したカスタム体験を作成できるようになります。
さらに、新しいGemini Sparkは、Gemini 3.5とAntigravityハーネス上で動作するパーソナルAIエージェントです。24時間年中無休で動作し、デジタルライフのナビゲーションを支援し、ユーザーの指示の下で代理で行動します。Gmail、Docs、Slidesなど、日常的に使用するWorkspaceツールと深く統合されています。Gemini Sparkは信頼されたテスター向けに展開されており、米国のGoogle AI Ultraサブスクライバー向けにベータ版として展開される予定です。
Gemini Omni Flashは、GeminiアプリとGoogle Flowを通じて全世界のGoogle AI Plus、Pro、Ultraサブスクライバーに展開されています。また、YouTube ShortsおよびYouTube Create Appのユーザーには無料で提供されています。今後数週間で、APIを通じて開発者やエンタープライズ顧客にも展開される予定です。
Gemini 3.5 Flashは、Google Antigravity、Gemini API(Google AI StudioおよびAndroid Studio内)、Gemini Enterprise Agent Platform、Gemini Enterpriseを介して一般利用可能であり、SearchのAIモードですべてのユーザーが利用でき、Geminiアプリでも全世界のユーザーに展開されています。