2026-06-05 17:44 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

Perplexity AI 推出面向個人電腦的混合本地-服務器推理編排器：自動設備端與雲端任務路由

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-服務器推理編排器，能夠自動將 AI 任務在設備端和雲端模型之間路由，無需用户手動選擇。該功能將於2026年7月登陸 Perplexity Computer。

來源MarkTechPost作者: Michal Sutter

Perplexity AI 在 Computex 2026 上展示了其所謂的首款混合本地-服務器推理編排器。該系統旨在自動在用户本地設備與雲端前沿模型之間路由 AI 任務，無需用户預先決定。該功能預計將於 2026 年 7 月登陸 Perplexity Computer。

什麼是混合代理推理？

要理解 Perplexity 的構建，需先了解 AI 系統面臨的三個矛盾：準確性要求最強大的模型，但運行成本高昂；隱私要求某些數據絕不離開設備；成本與能效要求避免在前沿模型上運行小模型可處理的任務。Perplexity 將這一路由層稱為混合代理推理。

一個緊湊的 AI 模型在用户設備上本地運行，評估每個傳入任務或子任務，判斷是否涉及敏感數據、是否需要大量計算，或能否完全在設備端處理。基於評估，工作要麼保留在本地，要麼發送到雲端前沿模型。Perplexity 描述該本地模型“決定何時敏感數據也應保留在本地”。系統設計為在將敏感任務發送到雲端前徵求用户許可，解決了企業對代理 AI 的數據治理擔憂。

系統意圖保留在本地數據的示例包括財務記錄、健康信息和個人文件。需要前沿模型完整能力的任務則在服務器上運行。大多數實際任務是混合的，因此係統將其拆分並協調各部分。

如何融入 Perplexity Computer？

Perplexity Computer 是公司基於雲的多模型代理產品，於 2026 年 2 月推出。Personal Computer 是單獨的關聯產品，將 Computer 的能力帶到本地設備。新的混合編排器是 Personal Computer 的下一步，現在系統會推理任務各部分應在何處執行。Perplexity Computer 協調多達 20 個 AI 模型在單個工作流中。混合編排器將編排擴展到計算位置本身。

關鍵信息

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-服務器推理編排器，自動在設備端和雲端模型間路由 AI 任務。本地緊湊模型充當路由器，根據數據敏感性和計算需求分類每個子任務後分派。敏感數據保留在本地，計算密集型任務發送到雲端前沿模型，無需手動配置。編排框架模型無關和芯片無關，確認可在 Intel Core Ultra Series 3 和 NVIDIA RTX Spark 硬件上運行。該功能將於 2026 年 7 月在 Perplexity Computer 中推出，最初支持 Windows；Personal Computer 已在 Mac 上可用，Windows 等待列表已開放。