AI News HubLIVE
站内改写2 分鐘閱讀

Perplexity AI 推出面向個人電腦的混合本地-伺服器推理編排器:自動裝置端與雲端任務路由

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-伺服器推理編排器,能夠自動將 AI 任務在裝置端和雲端模型之間路由,無需使用者手動選擇。該功能將於2026年7月登陸 Perplexity Computer。

來源MarkTechPost作者: Michal Sutter

Perplexity AI 在 Computex 2026 上展示了其所謂的首款混合本地-伺服器推理編排器。該系統旨在自動在使用者本地裝置與雲端前沿模型之間路由 AI 任務,無需使用者預先決定。該功能預計將於 2026 年 7 月登陸 Perplexity Computer。

什麼是混合代理推理?

要理解 Perplexity 的構建,需先了解 AI 系統面臨的三個矛盾:準確性要求最強大的模型,但執行成本高昂;隱私要求某些資料絕不離開裝置;成本與能效要求避免在前沿模型上執行小模型可處理的任務。Perplexity 將這一路由層稱為混合代理推理。

一個緊湊的 AI 模型在使用者裝置上本地執行,評估每個傳入任務或子任務,判斷是否涉及敏感資料、是否需要大量計算,或能否完全在裝置端處理。基於評估,工作要麼保留在本地,要麼傳送到雲端前沿模型。Perplexity 描述該本地模型“決定何時敏感資料也應保留在本地”。系統設計為在將敏感任務傳送到雲端前徵求使用者許可,解決了企業對代理 AI 的資料治理擔憂。

系統意圖保留在本地資料的示例包括財務記錄、健康資訊和個人檔案。需要前沿模型完整能力的任務則在伺服器上執行。大多數實際任務是混合的,因此係統將其拆分並協調各部分。

如何融入 Perplexity Computer?

Perplexity Computer 是公司基於雲的多模型代理產品,於 2026 年 2 月推出。Personal Computer 是單獨的關聯產品,將 Computer 的能力帶到本地裝置。新的混合編排器是 Personal Computer 的下一步,現在系統會推理任務各部分應在何處執行。Perplexity Computer 協調多達 20 個 AI 模型在單個工作流中。混合編排器將編排擴充套件到計算位置本身。

關鍵資訊

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-伺服器推理編排器,自動在裝置端和雲端模型間路由 AI 任務。本地緊湊模型充當路由器,根據資料敏感性和計算需求分類每個子任務後分派。敏感資料保留在本地,計算密集型任務傳送到雲端前沿模型,無需手動配置。編排框架模型無關和晶片無關,確認可在 Intel Core Ultra Series 3 和 NVIDIA RTX Spark 硬體上執行。該功能將於 2026 年 7 月在 Perplexity Computer 中推出,最初支援 Windows;Personal Computer 已在 Mac 上可用,Windows 等待列表已開放。