谷歌秘密向Play Store开发者购买代码以训练AI
谷歌正通过一项秘密试点计划,向Android应用开发者付费获取其代码库,用于改进AI编码工具。开发者保留知识产权,但谷歌希望借此弥补其在AI代码生成领域与Anthropic和微软的差距。此举也反映出AI公司可能面临公开训练数据枯竭的问题。
据404 Media报道,谷歌正在悄然向部分Android应用开发者提供一项名为“机密内容试点计划”的付费项目,以获取其代码库的访问权限,用于改进谷歌的开发者工具和产品,特别是AI编码工具。该媒体获得的一封发给拥有数百万下载量应用的开发者的邮件显示,谷歌邀请其“加入机密内容试点计划”,并称这将使开发者能够“从应用中创造额外收入”。邮件明确表示,谷歌希望购买代码访问权限“以帮助改进谷歌的开发者工具和产品”。由于担心谷歌的报复,该开发者要求匿名。
邮件中写道:“通过分享驱动应用的代码以及已归档的项目来获得报酬。”邮件强调,开发者将保留代码的知识产权,许可为非排他性。“无论是当前应用的活跃生产代码库,还是不再使用的原型或副项目存档,这些代码都可能具有未被发掘的价值。这是一个独特的机会,可以帮助改造工具和产品,支持开发者生态系统,并解锁新收入。”
尽管邮件未直接提及人工智能,但邮件中的链接指向一个关于“合作改进我们AI产品”的页面。该页面解释称,除了公开可获取的数据外,谷歌正在寻求“为提供非公开内容支付费用”,涵盖多种媒体格式。“我们正在了解不同类型内容的价值,以及如何在未来继续创造互利的合作。”该页面将AI工具的训练描绘成一项使命驱动的机会,称AI“为帮助个人、企业和整个社会提供了千载难逢的机会:帮助世界应对和管理自然灾害,帮助医生更早检测疾病。”
谷歌在AI代码生成领域已落后于竞争对手。Anthropic凭借Claude Code的成功获得比OpenAI更高的估值,微软的Copilot也被广泛采用。谷歌试图从开发者购买代码表明,该公司未能通过从网页抓取的内容构建出足够优秀的编码AI,这也凸显了AI公司可能正面临训练数据枯竭的问题。众所周知,谷歌曾向Reddit支付6000万美元以获取其网站数据用于AI训练,但效果参差不齐。
邮件全文如下:“我们代表谷歌合作伙伴团队联系您,邀请您加入一项针对Google Play应用开发者的机密内容试点计划。我们提供一个独特的机会,让您从应用中创造额外收入。您为构建应用和增长用户群付出了巨大努力。无论是当前应用的活跃生产代码库,还是不再使用的原型或副项目存档,这些代码都可能具有未被发掘的价值。这是一个独特的机会,可以帮助改造工具和产品,支持开发者生态系统,并解锁新收入。机会:我们正在寻找高质量、真实的代码库,以帮助改进谷歌的开发者工具和产品。本计划为您提供:额外收入机会:通过分享驱动应用的代码和已归档项目获得报酬。成为早期采用者:作为试点合作伙伴,您将塑造谷歌未来与开发者社区的合作方式。驱动影响:我们发现真实世界的代码对我们的产品和服务开发在各种用例中都有帮助,从理解复杂逻辑到开发编码评估和基准。您的经过生产测试的代码可以直接提供帮助。保留控制权:这是非排他性的。您保留100%的知识产权,您的应用完全属于您,并且您保留在任何其他地方变现数据的权利。您可以在我们的博客文章中了解更多关于谷歌合作伙伴关系的方法。”