前谷歌和苹果研究员创立初创公司,为AI打造缺失的“反馈流”
一群前谷歌DeepMind、苹果、OpenAI和Meta的研究员成立了新创公司Trajectory,旨在帮助企业通过真实用户交互持续改进AI产品。Trajectory旨在构建一个平台,让AI能够在部署后持续学习,而不是在训练完成后停滞不前。该公司已获得1500万美元种子轮融资,估值1.15亿美元,由Conviction领投。其CEO Ronak Malde表示,AI编程产品如Cursor已在实践早期版本的持续学习,Trajectory希望将类似技术扩展到更多领域。
文章情报
要点
- Trajectory由前谷歌DeepMind、苹果、OpenAI和Meta的研究员创立,旨在实现AI的持续学习。
- 公司已融资1500万美元,估值1.15亿美元,投资者包括Jeff Dean和Fei-Fei Li。
- Trajectory的平台通过记录AI在真实场景中的失败案例来定期更新模型,客户包括Clay和Harvey。
- 尽管目前模型每周更新一次,但目标是实现每天甚至更频繁的更新,使AI能够从每次交互中学习。
为什么重要
这条新闻值得关注,因为Trajectory由前谷歌DeepMind、苹果、OpenAI和Meta的研究员创立,旨在实现AI的持续学习。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
一群曾在谷歌DeepMind、苹果、OpenAI和Meta超级智能实验室工作的AI研究员周三宣布,他们成立了一家名为Trajectory的新公司,旨在帮助企业通过训练真实用户交互来定期改进其AI产品。
Trajectory希望为AI构建一个能够持续学习的平台,这一能力长期以来被视为AI进一步发展的主要障碍。OpenAI、谷歌和Anthropic在训练越来越强大的AI模型方面取得了成功,尤其是在编码、数学和科学等领域。然而,这些系统在训练完成后便停止进步。尽管持续学习方面近期取得了一些突破,但科技公司普遍难以制作出能够实时从错误中学习的AI产品。2025年12月,在图灵奖得主Richard Sutton参与的NeurIPS会议上,他认为持续学习对于构建超级智能体至关重要。
Trajectory已获得1500万美元种子轮融资,投后估值1.15亿美元,由风投公司Conviction领投,Bessemer Venture Partners、Radical VC和BoxGroup参投。个人投资者包括谷歌DeepMind首席科学家Jeff Dean以及被誉为“AI教母”的斯坦福教授、World Labs CEO李飞飞。
Trajectory的CEO兼联合创始人Ronak Malde此前是Windsurf的AI研究员,后来在谷歌DeepMind以24亿美元收购该编码初创公司的顶尖人才时,成为少数加入谷歌DeepMind的员工之一。其他联合创始人包括曾参与Vision Pro项目的苹果前AI研究员Arjun Karanam,以及曾在谷歌DeepMind机器人部门工作的Michael Elabd。
Malde告诉《连线》杂志,一些领先的AI编码产品(如Cursor)已经在实践早期版本的持续学习——利用用户与产品交互的真实数据进行后期训练,并定期发布模型改进。他认为这是AI编码产品迅速崛起的一个核心原因,也是主要AI实验室纷纷开发自己的“vibe coding”应用的部分原因。通过Trajectory,Malde及其11名研究员和工程师的团队希望将类似技术应用于编码领域之外的AI工具改进。
“即使是最强大的AI今天仍然是静态的。你昨天使用的AI模型今天会犯同样的错误,”Malde说。“少数公司开始迈向持续学习的世界。我们正在做的是为每家公司搭建通往持续学习的平台。”
将这一逻辑应用于其他领域的挑战在于,编码是容易验证的——代码要么运行要么不运行——但某些行业的成功定义较为模糊。Karanam表示,Trajectory平台的部分功能是帮助优化AI模型以满足企业的特定需求。
Trajectory并非从OpenAI或Anthropic的现成模型开始,而是让客户从一个针对其特定AI产品进行过后期训练的开源模型开始。对于构建AI客服代理的客户Decagon,Trajectory会记录其AI何时表现不佳——例如,试图退货的客户被转接给人工——并利用这些实例每周一次进行后期训练新模型。Trajectory声称,这些后期训练的模型在客户产品最重要的狭窄任务上超越了前沿实验室的模型。
企业高管渴望将AI用于各种任务,但如今他们往往需要雇佣“前向部署工程师”团队,即嵌入公司内部帮助构建AI产品的顾问和技术人员。OpenAI、Anthropic和Palantir等公司纷纷抢占这一需求。Elabd表示,Trajectory的目标是构建一个能够自我改进的产品,这样公司就不需要内部工程师持续排查AI系统的问题。该初创公司表示,已经在多个领域拥有客户,包括企业销售初创公司Clay和法律AI初创公司Harvey。虽然目前主要与AI原生公司合作,但Trajectory最终计划向财富500强企业推广其平台。
批评者可能会认为,Trajectory尚未构建真正的持续学习,至少不是传统意义上的。毕竟,该初创公司的模型目前每周只更新一次,在升级之间保持静态。
Elabd认为Trajectory刚刚起步。他声称AI行业正在走向一个新范式,即AI从经验中学习——就像AI编码领域已经发生的那样。Elabd表示,Trajectory的最终目标是构建一个平台,能够每天甚至更频繁地更新公司的AI模型。
“每天可能还不够。可能是每小时,可能是每次交互,”Elabd说。“也许每家公司不仅仅需要一个人工智能,你可以训练AI为每家公司的每个人学习。”