2026-06-05 17:44 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

Perplexity AI 推出面向个人电脑的混合本地-服务器推理编排器：自动设备端与云端任务路由

Perplexity AI 在 Computex 2026 上宣布了首个混合本地-服务器推理编排器，能够自动将 AI 任务在设备端和云端模型之间路由，无需用户手动选择。该功能将于2026年7月登陆 Perplexity Computer。

来源MarkTechPost作者: Michal Sutter

Perplexity AI 在 Computex 2026 上展示了其所谓的首款混合本地-服务器推理编排器。该系统旨在自动在用户本地设备与云端前沿模型之间路由 AI 任务，无需用户预先决定。该功能预计将于 2026 年 7 月登陆 Perplexity Computer。

什么是混合代理推理？

要理解 Perplexity 的构建，需先了解 AI 系统面临的三个矛盾：准确性要求最强大的模型，但运行成本高昂；隐私要求某些数据绝不离开设备；成本与能效要求避免在前沿模型上运行小模型可处理的任务。Perplexity 将这一路由层称为混合代理推理。

一个紧凑的 AI 模型在用户设备上本地运行，评估每个传入任务或子任务，判断是否涉及敏感数据、是否需要大量计算，或能否完全在设备端处理。基于评估，工作要么保留在本地，要么发送到云端前沿模型。Perplexity 描述该本地模型“决定何时敏感数据也应保留在本地”。系统设计为在将敏感任务发送到云端前征求用户许可，解决了企业对代理 AI 的数据治理担忧。

系统意图保留在本地数据的示例包括财务记录、健康信息和个人文件。需要前沿模型完整能力的任务则在服务器上运行。大多数实际任务是混合的，因此系统将其拆分并协调各部分。

如何融入 Perplexity Computer？

Perplexity Computer 是公司基于云的多模型代理产品，于 2026 年 2 月推出。Personal Computer 是单独的关联产品，将 Computer 的能力带到本地设备。新的混合编排器是 Personal Computer 的下一步，现在系统会推理任务各部分应在何处执行。Perplexity Computer 协调多达 20 个 AI 模型在单个工作流中。混合编排器将编排扩展到计算位置本身。

关键信息

Perplexity AI 在 Computex 2026 上宣布了首个混合本地-服务器推理编排器，自动在设备端和云端模型间路由 AI 任务。本地紧凑模型充当路由器，根据数据敏感性和计算需求分类每个子任务后分派。敏感数据保留在本地，计算密集型任务发送到云端前沿模型，无需手动配置。编排框架模型无关和芯片无关，确认可在 Intel Core Ultra Series 3 和 NVIDIA RTX Spark 硬件上运行。该功能将于 2026 年 7 月在 Perplexity Computer 中推出，最初支持 Windows；Personal Computer 已在 Mac 上可用，Windows 等待列表已开放。