AI News HubLIVE
站内改写2 分鐘閱讀

Perplexity AI 推出面向個人電腦的混合本地-服務器推理編排器:自動設備端與雲端任務路由

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-服務器推理編排器,能夠自動將 AI 任務在設備端和雲端模型之間路由,無需用户手動選擇。該功能將於2026年7月登陸 Perplexity Computer。

來源MarkTechPost作者: Michal Sutter

Perplexity AI 在 Computex 2026 上展示了其所謂的首款混合本地-服務器推理編排器。該系統旨在自動在用户本地設備與雲端前沿模型之間路由 AI 任務,無需用户預先決定。該功能預計將於 2026 年 7 月登陸 Perplexity Computer。

什麼是混合代理推理?

要理解 Perplexity 的構建,需先了解 AI 系統面臨的三個矛盾:準確性要求最強大的模型,但運行成本高昂;隱私要求某些數據絕不離開設備;成本與能效要求避免在前沿模型上運行小模型可處理的任務。Perplexity 將這一路由層稱為混合代理推理。

一個緊湊的 AI 模型在用户設備上本地運行,評估每個傳入任務或子任務,判斷是否涉及敏感數據、是否需要大量計算,或能否完全在設備端處理。基於評估,工作要麼保留在本地,要麼發送到雲端前沿模型。Perplexity 描述該本地模型“決定何時敏感數據也應保留在本地”。系統設計為在將敏感任務發送到雲端前徵求用户許可,解決了企業對代理 AI 的數據治理擔憂。

系統意圖保留在本地數據的示例包括財務記錄、健康信息和個人文件。需要前沿模型完整能力的任務則在服務器上運行。大多數實際任務是混合的,因此係統將其拆分並協調各部分。

如何融入 Perplexity Computer?

Perplexity Computer 是公司基於雲的多模型代理產品,於 2026 年 2 月推出。Personal Computer 是單獨的關聯產品,將 Computer 的能力帶到本地設備。新的混合編排器是 Personal Computer 的下一步,現在系統會推理任務各部分應在何處執行。Perplexity Computer 協調多達 20 個 AI 模型在單個工作流中。混合編排器將編排擴展到計算位置本身。

關鍵信息

Perplexity AI 在 Computex 2026 上宣佈了首個混合本地-服務器推理編排器,自動在設備端和雲端模型間路由 AI 任務。本地緊湊模型充當路由器,根據數據敏感性和計算需求分類每個子任務後分派。敏感數據保留在本地,計算密集型任務發送到雲端前沿模型,無需手動配置。編排框架模型無關和芯片無關,確認可在 Intel Core Ultra Series 3 和 NVIDIA RTX Spark 硬件上運行。該功能將於 2026 年 7 月在 Perplexity Computer 中推出,最初支持 Windows;Personal Computer 已在 Mac 上可用,Windows 等待列表已開放。