2026-06-05 17:44 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Perplexity AI 推出面向個人電腦的混合本地-伺服器推理編排器：自動裝置端與雲端任務路由

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-伺服器推理編排器，能夠自動將 AI 任務在裝置端和雲端模型之間路由，無需使用者手動選擇。該功能將於2026年7月登陸 Perplexity Computer。

來源MarkTechPost作者: Michal Sutter

Perplexity AI 在 Computex 2026 上展示了其所謂的首款混合本地-伺服器推理編排器。該系統旨在自動在使用者本地裝置與雲端前沿模型之間路由 AI 任務，無需使用者預先決定。該功能預計將於 2026 年 7 月登陸 Perplexity Computer。

什麼是混合代理推理？

要理解 Perplexity 的構建，需先了解 AI 系統面臨的三個矛盾：準確性要求最強大的模型，但執行成本高昂；隱私要求某些資料絕不離開裝置；成本與能效要求避免在前沿模型上執行小模型可處理的任務。Perplexity 將這一路由層稱為混合代理推理。

一個緊湊的 AI 模型在使用者裝置上本地執行，評估每個傳入任務或子任務，判斷是否涉及敏感資料、是否需要大量計算，或能否完全在裝置端處理。基於評估，工作要麼保留在本地，要麼傳送到雲端前沿模型。Perplexity 描述該本地模型“決定何時敏感資料也應保留在本地”。系統設計為在將敏感任務傳送到雲端前徵求使用者許可，解決了企業對代理 AI 的資料治理擔憂。

系統意圖保留在本地資料的示例包括財務記錄、健康資訊和個人檔案。需要前沿模型完整能力的任務則在伺服器上執行。大多數實際任務是混合的，因此係統將其拆分並協調各部分。

如何融入 Perplexity Computer？

Perplexity Computer 是公司基於雲的多模型代理產品，於 2026 年 2 月推出。Personal Computer 是單獨的關聯產品，將 Computer 的能力帶到本地裝置。新的混合編排器是 Personal Computer 的下一步，現在系統會推理任務各部分應在何處執行。Perplexity Computer 協調多達 20 個 AI 模型在單個工作流中。混合編排器將編排擴充套件到計算位置本身。

關鍵資訊

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-伺服器推理編排器，自動在裝置端和雲端模型間路由 AI 任務。本地緊湊模型充當路由器，根據資料敏感性和計算需求分類每個子任務後分派。敏感資料保留在本地，計算密集型任務傳送到雲端前沿模型，無需手動配置。編排框架模型無關和晶片無關，確認可在 Intel Core Ultra Series 3 和 NVIDIA RTX Spark 硬體上執行。該功能將於 2026 年 7 月在 Perplexity Computer 中推出，最初支援 Windows；Personal Computer 已在 Mac 上可用，Windows 等待列表已開放。