AI News HubLIVE
站内改写2 分钟阅读

Perplexity AI 推出面向个人电脑的混合本地-服务器推理编排器:自动设备端与云端任务路由

Perplexity AI 在 Computex 2026 上宣布了首个混合本地-服务器推理编排器,能够自动将 AI 任务在设备端和云端模型之间路由,无需用户手动选择。该功能将于2026年7月登陆 Perplexity Computer。

来源MarkTechPost作者: Michal Sutter

Perplexity AI 在 Computex 2026 上展示了其所谓的首款混合本地-服务器推理编排器。该系统旨在自动在用户本地设备与云端前沿模型之间路由 AI 任务,无需用户预先决定。该功能预计将于 2026 年 7 月登陆 Perplexity Computer。

什么是混合代理推理?

要理解 Perplexity 的构建,需先了解 AI 系统面临的三个矛盾:准确性要求最强大的模型,但运行成本高昂;隐私要求某些数据绝不离开设备;成本与能效要求避免在前沿模型上运行小模型可处理的任务。Perplexity 将这一路由层称为混合代理推理。

一个紧凑的 AI 模型在用户设备上本地运行,评估每个传入任务或子任务,判断是否涉及敏感数据、是否需要大量计算,或能否完全在设备端处理。基于评估,工作要么保留在本地,要么发送到云端前沿模型。Perplexity 描述该本地模型“决定何时敏感数据也应保留在本地”。系统设计为在将敏感任务发送到云端前征求用户许可,解决了企业对代理 AI 的数据治理担忧。

系统意图保留在本地数据的示例包括财务记录、健康信息和个人文件。需要前沿模型完整能力的任务则在服务器上运行。大多数实际任务是混合的,因此系统将其拆分并协调各部分。

如何融入 Perplexity Computer?

Perplexity Computer 是公司基于云的多模型代理产品,于 2026 年 2 月推出。Personal Computer 是单独的关联产品,将 Computer 的能力带到本地设备。新的混合编排器是 Personal Computer 的下一步,现在系统会推理任务各部分应在何处执行。Perplexity Computer 协调多达 20 个 AI 模型在单个工作流中。混合编排器将编排扩展到计算位置本身。

关键信息

Perplexity AI 在 Computex 2026 上宣布了首个混合本地-服务器推理编排器,自动在设备端和云端模型间路由 AI 任务。本地紧凑模型充当路由器,根据数据敏感性和计算需求分类每个子任务后分派。敏感数据保留在本地,计算密集型任务发送到云端前沿模型,无需手动配置。编排框架模型无关和芯片无关,确认可在 Intel Core Ultra Series 3 和 NVIDIA RTX Spark 硬件上运行。该功能将于 2026 年 7 月在 Perplexity Computer 中推出,最初支持 Windows;Personal Computer 已在 Mac 上可用,Windows 等待列表已开放。