AI News HubLIVE
站内改写

尋找開放性的成分:用大型視覺語言模型複製Picbreeder

該研究通過用前沿視覺語言模型(VLM)替代人類用户,複製了人類驅動開放式搜索的經典範例Picbreeder,比較了系統輸出與歷史人類基線的定性差異,並嘗試通過系統發育複雜性、視覺和語義顯著性及新穎性的指標來表徵這些差異。研究還探索了在代理選擇過程中添加探索性噪聲、代理之間的行為多樣性以及以過去行動記憶形式存在的敍事動量等因素的影響。

文章情報

工程師進階

要點

  • 研究用VLM複製了Picbreeder,發現其輸出與人類基線存在明顯定性差異。
  • 引入了系統發育複雜度、視覺和語義顯著性等指標來量化差異。
  • 探索了添加噪聲、行為多樣性和記憶機制對開放性的影響。
  • 代碼已在GitHub上開源,論文將在GECCO 2026發表。

為甚麼重要

這條新聞值得關注,因為研究用VLM複製了Picbreeder,發現其輸出與人類基線存在明顯定性差異。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

在人工智能領域,開放性問題一直備受關注,即系統能否不斷生成新穎且有意義的輸出。近日,arXiv上發佈了一篇題為《尋找開放性的成分:用大型視覺語言模型複製Picbreeder》的研究論文,該論文將於2026年的GECCO會議上發表。研究團隊嘗試使用前沿的視覺語言模型(VLM)來複制人類驅動的開放式搜索經典範例——Picbreeder。

Picbreeder是一個交互式進化平台,用户通過選擇並進化小神經網絡來協作生成多樣化的圖像庫。在該研究中,研究人員用VLM替代了人類用户,構建了一個自動化系統。實驗結果顯示,VLM生成的圖像與歷史上的人類生成圖像之間存在明顯的定性差異。為了量化這些差異,研究團隊採用了系統發育複雜性、視覺顯著性、語義顯著性和新穎性等多種指標。

進一步地,研究者們試圖探究造成這些差異的因果因素。他們研究了在代理選擇過程中添加探索性噪聲、增加代理之間的行為多樣性,以及引入基於過去行動記憶的敍事動量等三種機制。初步結果表明,這些因素對系統的開放性有不同的影響:噪聲和多樣性有助於提高輸出變異性,而記憶則可能引導探索方向。

該研究的代碼已在GitHub上公開(https://github.com/smearle/picbreeder-vlm),論文共有26頁,包含21張圖表。這項工作不僅為理解人工智能的開放性提供了新的視角,還為未來設計更具創造性的AI系統奠定了基礎。隨着AI助手在科學、技術和創意生產中扮演越來越重要的角色,像Picbreeder這樣的研究對於揭示AI的自主發現能力至關重要。