Perplexity AI、パーソナルコンピュータ向けハイブリッドローカルサーバー推論オーケストレーターを発表:自動オンデバイス・クラウドタスクルーティング
Perplexity AIはComputex 2026で、ユーザーのローカルデバイスとクラウドモデル間でAIタスクを自動的にルーティングする初のハイブリッドローカルサーバー推論オーケストレーターを発表しました。この機能は2026年7月にPerplexity Computerに搭載される予定です。
Perplexity AIはComputex 2026で、同社初のハイブリッドローカルサーバー推論オーケストレーターを発表しました。このシステムは、ユーザーが事前に選択することなく、AIタスクをローカルデバイスとクラウドベースのフロンティアモデル間で自動的にルーティングするよう設計されています。この機能は2026年7月にPerplexity Computerに搭載される予定です。
ハイブリッドエージェント推論とは
Perplexityが構築したものを理解するには、AIシステムが直面する3つの相反する要求を理解すると役立ちます。正確性には最も高性能なモデルが必要ですが、実行コストが高い。プライバシーはデータがデバイスから出ないことを要求する。コストとエネルギー効率は、小さなモデルで処理できるタスクにフロンティアモデルの計算リソースを使わないことを求める。Perplexityはこのルーティング層をハイブリッドエージェント推論と呼んでいます。
コンパクトなAIモデルがユーザーのデバイス上でローカルに動作し、各タスクまたはサブタスクを評価します。機密データが含まれているか、重い計算が必要か、デバイス上で完全に処理できるかを判断します。評価に基づいて、タスクはローカルに保持されるか、クラウドのフロンティアモデルに送られます。Perplexityはこのローカルモデルが「機密データをいつローカルに保持すべきか」を決定すると説明しています。システムは機密タスクをクラウドに送信する前にユーザーの許可を求めるように設計されており、エンタープライズがエージェントAIに対して抱くデータガバナンスの懸念に対応しています。
システムがローカルに保持するデータの例には、財務記録、健康情報、個人ファイルが含まれます。フロンティアモデルのフル能力を必要とするタスクはサーバーで実行されます。実際のタスクはほとんどの場合混合であるため、システムはそれらを分割し、各部分を調整します。
Perplexity Computerへの統合
Perplexity Computerは、2026年2月にローンチされた同社のクラウドベースのマルチモデルエージェント製品です。Personal Computerは別の関連製品で、Computerの機能をローカルデバイスにもたらします。新しいハイブリッドオーケストレーターはPersonal Computerの次のステップであり、システムはタスクの各部分をどこで実行すべきかを推論します。Perplexity Computerは単一ワークフローで最大20のAIモデルを調整します。ハイブリッドオーケストレーターは、そのオーケストレーションを計算場所自体に拡張します。
主なポイント
Perplexity AIはComputex 2026で初のハイブリッドローカルサーバー推論オーケストレーターを発表、AIタスクを自動的にオンデバイスとクラウドモデル間でルーティングします。コンパクトなローカルモデルがルーターとして機能し、各サブタスクをデータ機密性と計算要件に基づいて分類してからディスパッチします。機密データはデバイス上に留まり、計算負荷の高いタスクはクラウドフロンティアモデルに送られます。手動設定は不要です。オーケストレーションフレームワークはモデル非依存およびチップ非依存であり、Intel Core Ultra Series 3とNVIDIA RTX Sparkハードウェアで動作確認済みです。この機能は2026年7月にPerplexity Computerで提供開始、当初はWindows対応。Personal ComputerはすでにMacで利用可能で、Windowsのウェイトリストが公開されています。