科技公司急切想要拍摄你做家务的画面
一家名为Shift的AI训练初创公司提供免费清洁服务,以换取拍摄清洁过程视频的权利。这些视频用于训练机器人执行家务任务。文章探讨了物理世界数据收集的挑战,以及多家公司通过不同方式获取训练数据,包括从消费者家中直接拍摄、雇佣工人重复特定动作、以及利用已部署的机器人收集数据。
文章情报
要点
- Shift公司免费清洁纽约家庭,换取清洁过程的视频数据
- 机器人训练需要大量物理世界数据,而这类数据难以从互联网大规模抓取
- 其他公司如Pronto和Human Archive也在通过不同方式收集家务训练数据
- 数据交换模式并非新事物,但针对身体活动的数据集是新的价值所在
为什么重要
这条新闻值得关注,因为Shift公司免费清洁纽约家庭,换取清洁过程的视频数据。
技术影响
可能影响 Agent 架构、工具调用、工作流自动化和产品集成。
本周,一家名为Shift的AI训练初创公司宣布将免费为纽约居民清洁房屋,并计划扩展到伦敦等城市。看着自己的公寓,我理解了这种服务的吸引力。但天下没有免费的午餐——作为交换,Shift要求录制清洁工的工作过程:擦洗盘子、擦拭台面、除尘、拖地等等。所有这些我们乐于外包的单调家务劳动视频,正是机器人公司争夺的珍贵数据,用以训练机器完成这些工作,最终向我们出售能替代我们劳动的机器人。
这比听起来难得多。与近年来爆发的聊天机器人、图像生成器等AI工具不同,机器人必须应对物理世界。这意味着理解空间、运动、力、摩擦、各种奇形怪状的材料、不寻常的光线,以及其他人类本能掌握的事物。这就是为什么对我们来说简单的事情,如叠衣服、捡苹果、倒水,对机器人专家而言却异常棘手。
教会机器这些需要大量数据。文本、图像和视频可以从互联网上以工业规模轻松抓取,而且往往不补偿创造者。但物理世界的数据更难收集,更难在不付费的情况下秘密获取。因此,高质量数据成为发展物理AI的公司面临的巨大瓶颈。这是一个利润丰厚的机遇,于是像Shift这样的公司开始创新。
他们并非孤例。在印度,近期报道揭示家政服务平台Pronto正在利用客户的家作为AI训练数据的来源,拍摄烹饪、清洁、洗衣等活动。Pronto表示只在客户明确同意的情况下录制,但此举引发了市场反弹,竞争对手坚称从未在家中进行AI训练录制。
其他初创公司专注于扩大数据收集规模。硅谷的Human Archive希望与Pronto等公司合作,让零工工人佩戴摄像头帽子记录活动。这些帽子收集佩戴者视角的“第一人称”数据,正是机器人公司所需的。Shift同时直接面向消费者,声称已通过其应用付费让15个国家的数万人录制活动。
有些公司干脆跳过有用的工作,而是付钱让工人重复完成相同的物理任务,同时用摄像头和传感器捕捉每一个动作。这种“数据农场”旨在将枯燥的体力活动转化为有价值的AI训练材料。
还有数据来自已部署的机器人。尽管炒作不断,真正的自动化仍遥遥无期——因此才需要这么多数据——但公司急于推出产品。它们会利用客户家中的数据改进产品,并在机器人遇到困难时依靠远程工作人员介入,这些数据同样会被利用。
当然,用数据换取价值并非新鲜事。多年来,公司通过忠诚卡、cookies、行车记录仪、保险应用监测驾驶行为等方式,以折扣、便利和免费服务换取用户数据。新的变化在于公司愿意付费购买的数据种类。现在,你或许会允许一名戴着奇特帽子的清洁工免费打扫房屋,以便将来有公司能向你出售替代它的机器人。