AI News HubLIVE
站内改写

寻找开放性的成分:用大型视觉语言模型复制Picbreeder

该研究通过用前沿视觉语言模型(VLM)替代人类用户,复制了人类驱动开放式搜索的经典范例Picbreeder,比较了系统输出与历史人类基线的定性差异,并尝试通过系统发育复杂性、视觉和语义显著性及新颖性的指标来表征这些差异。研究还探索了在代理选择过程中添加探索性噪声、代理之间的行为多样性以及以过去行动记忆形式存在的叙事动量等因素的影响。

文章情报

工程师进阶

要点

  • 研究用VLM复制了Picbreeder,发现其输出与人类基线存在明显定性差异。
  • 引入了系统发育复杂度、视觉和语义显著性等指标来量化差异。
  • 探索了添加噪声、行为多样性和记忆机制对开放性的影响。
  • 代码已在GitHub上开源,论文将在GECCO 2026发表。

为什么重要

这条新闻值得关注,因为研究用VLM复制了Picbreeder,发现其输出与人类基线存在明显定性差异。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

在人工智能领域,开放性问题一直备受关注,即系统能否不断生成新颖且有意义的输出。近日,arXiv上发布了一篇题为《寻找开放性的成分:用大型视觉语言模型复制Picbreeder》的研究论文,该论文将于2026年的GECCO会议上发表。研究团队尝试使用前沿的视觉语言模型(VLM)来复制人类驱动的开放式搜索经典范例——Picbreeder。

Picbreeder是一个交互式进化平台,用户通过选择并进化小神经网络来协作生成多样化的图像库。在该研究中,研究人员用VLM替代了人类用户,构建了一个自动化系统。实验结果显示,VLM生成的图像与历史上的人类生成图像之间存在明显的定性差异。为了量化这些差异,研究团队采用了系统发育复杂性、视觉显著性、语义显著性和新颖性等多种指标。

进一步地,研究者们试图探究造成这些差异的因果因素。他们研究了在代理选择过程中添加探索性噪声、增加代理之间的行为多样性,以及引入基于过去行动记忆的叙事动量等三种机制。初步结果表明,这些因素对系统的开放性有不同的影响:噪声和多样性有助于提高输出变异性,而记忆则可能引导探索方向。

该研究的代码已在GitHub上公开(https://github.com/smearle/picbreeder-vlm),论文共有26页,包含21张图表。这项工作不仅为理解人工智能的开放性提供了新的视角,还为未来设计更具创造性的AI系统奠定了基础。随着AI助手在科学、技术和创意生产中扮演越来越重要的角色,像Picbreeder这样的研究对于揭示AI的自主发现能力至关重要。