AI News HubLIVE
站内改写3 分钟阅读

本周AI:下一代推荐体验

本期节目邀请到前微软首席研究员、RecoMind创始人Miguel Fierro,探讨推荐系统的现状及其在企业中的重要性。同时,AI布道师Christina Stathopoulos还总结了Anthropic的发展、负责任AI、Google I/O 2026公告等AI新闻。关键见解包括:推荐系统可为企业带来巨大收入增长,但大多数公司投资不足;真正的销售代理需要推荐系统,而非简单的对话代理;负责任AI的讨论已从研究圈扩展到社会各界。

来源O'Reilly AI & ML Radar作者: Michelle Smith

本周的AI节目中,前微软首席研究员、RecoMind创始人Miguel Fierro与数据和AI布道者Christina Stathopoulos深入探讨了推荐系统的现状。Christina还总结了她关注的AI新闻,包括Anthropic的持续崛起、负责任AI的发展、Google I/O 2026大会的公告,以及(延续上周话题)以“token最大化”作为生产力指标所引发的反弹。以下是对话的三个核心要点。

推荐系统的重要性远超多数公司的认知

Miguel在微软为企业客户构建推荐系统已有近十年经验,他认为大多数公司因未足够重视推荐而错失良机。亚马逊约35%的收入来自推荐,Netflix的75%内容消费归功于推荐,百思买24%的收入来自推荐,而TikTok的整个用户体验就是一套推荐引擎。然而,他在微软合作过的许多大型零售商并未在这方面认真投入,通常是因为他们未追踪推荐所创造的价值。

顶尖企业与其余企业之间的差距正在扩大。目前最先进的系统将用户行为视为序列预测问题,类似于大型语言模型预测下一个token。它们不仅编码点击行为,还将所有用户行为编码为嵌入向量,通过序列模型处理,并利用高达1.5万亿参数的庞大模型来预测用户下一步可能想要什么。中等规模的零售商目前无法复制这种做法,但这指明了该领域的发展方向。

即使您不在资源顶尖的公司工作,也应关注搜索与推荐融合为统一个性化检索层的趋势,以及基础模型在推荐问题上的早期应用。Netflix已构建了该领域唯一公开的基础模型;Meta据传也在开发类似模型。数据是主要障碍,尤其对于小型组织。与文本不同,行为交互数据并非公开可得,因此要达到这种规模需要专有数据集和大规模计算能力。

如果您想获取最先进的实现(包括基于知识图谱的方法),而不必从零开始,Miguel建议使用开源Recommenders库。该库最初由微软开发,现由Linux基金会托管,是实用的入门工具。

代理热潮中缺失的推荐组件

Miguel区分了真正的销售代理与大多数公司目前所提供的工具,后者通常只是对话代理。对话代理能响应您的言语,而真正的代理系统能理解客户、预测其需求,并在正确时机呈现合适产品或优惠——这需要内置推荐系统。

如果您的“代理”只是一个能访问知识库的聊天机器人,它并没有进行推荐。推荐系统需要训练数据、检索层和个性化模型,这些并非通过基础模型API就能免费获得。语言模型可以回答产品目录相关问题,但只有在具备客户偏好、历史记录和下一步可能行为模型时,才能提供个性化推荐。大多数公司目前尚未建立这样的基础设施。

负责任AI的讨论已脱离研究圈

当前负责任AI对话的一个显著特点是提出观点的机构种类多样。Anthropic在宣布融资轮(估值逼近1万亿美元)的同时,敦促全球暂停AI开发,以应对递归自我改进的风险——即系统能够设计和开发自己的后继者。未来生命研究所发布了《AI的更好路径》框架,主张能力开发应服务于人类福祉而非取代人类。教皇则发布了一封正式通谕,聚焦AI与共同福祉。

这些机构并未提出完全相同的论点,但它们关注点的融合意义重大。负责任AI过去主要在研究实验室和少数政策组织间讨论,而如今,主要AI公司、宗教机构和公民社会组织都在同一新闻周期中公开表明立场。

对技术社区而言,这既带来压力也创造了机遇。“我们在考虑安全性”已不再足够;来自不共享该领域假设或词汇的方面的外部审查正在加强。但更广泛的讨论也为实践者创造了真实需求:他们能将负责任AI在实际中的要求与政策制定者、高管和机构试图理解的内容翻译沟通。这种翻译工作正是该领域越来越需要的人才。

下期预告

周一早上我们将播出《本周AI》下一集,YK Sugi和John Lindquist将深入探讨重塑科技行业的巨大结构和财务变革(他们也将讨论近期发布的Claude Fable 5)。7月23日,Christina将主持AI超级专场“AI工具”,一场聚焦智能体AI及从业者从模型走向代理所需框架的四小时活动。两者均可免费参加,请立即注册预留席位。

关于本周话题的深入阅读,Christina推荐了O'Reilly学习平台上的三本书:《Hands-On LLM Serving and Optimization》、《Hands-On RAG for Production》和《Large Language Models: The Hard Parts》。非会员可注册免费10天试用。

我们将每周五在Radar发布要点总结,并在YouTube、Spotify、Apple及您获取播客的其他平台分享完整剧集。