2026-05-28 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

面向光流控組裝的智能語言到目標合成

研究人員提出了Speak-to-Objective模塊化智能管線，利用條件大型語言模型將口頭或書面命令轉換為可微分的優化目標函數，用於在約束感知逆解算器和實驗光流控平台上組裝微粒。該方法採用“感知-組合-提議-執行-報告與學習”的循環，將目標作為意圖與驅動之間的接口，實現自然語言可編程的微觀組裝，推動自主光製造平台的發展。

來源arXiv Robotics作者: Ivan Saraev, Elena Erben, Weida Liao, Fan Nan, Gerhard Neumann, Eric Lauga, Moritz Kreysing

在先進製造領域，尤其是光基微納製造中，可編程、閉環工具的需求日益增長，這些工具需要將人類的設計意圖轉化為可在微小尺度上執行的操作。然而，一個關鍵瓶頸始終存在：如何將用户的意圖轉化為機器可讀且可靠執行的目標函數。儘管微機器人技術通過光學驅動流體提供了靈活的操作手段，但數學上可處理的目標規範仍然需要手動設置，且難以複用。

為此，研究人員提出了Speak-to-Objective——一個模塊化的智能管線，它利用經過條件化的大型語言模型（LLM）將口頭或書面命令轉化為完全可微分的優化目標函數，用於在約束感知逆解算器（SLSQP）以及實驗性光流控平台上進行微粒組裝。該方法採用一個緊湊的循環：感知（perceive）→ 組合（compose）→ 提議（propose）→ 執行（act）→ 報告與學習（report & learn），將目標函數作為意圖與驅動之間的接口，從而分離“組裝什麼”與“如何驅動”，同時從用户反饋中學習。

該管線能夠組合幾何、間距以及分配/拓撲項，生成魯棒的描述性目標函數，這些函數可以從部分軌跡中組裝並能在擾動後恢復，同時也能生成精確定位的顯式目標函數，且獨立於具體的驅動方式。研究人員以激光誘導的熱粘性流作為物理驅動模態，在微流體環境中展示了通過自然語言可編程的光基微粒圖案組裝。

除了對可編程微組裝產生的直接影響，這項工作還利用激光誘導光流控驅動作為簡化複雜度的實驗平台，指向了自驅動、AI輔助的光製造平台。在這樣的平台中，自然語言、可微分目標函數以及激光驅動將被耦合為一個可複用的數字工作流。該研究為未來實現更靈活的微觀製造提供了新的途徑，將人工智能與光學操控緊密結合，有望推動相關領域的快速發展。