AI News HubLIVE
站内改写2 分鐘閱讀

基於生物輸入而非視覺的物理人工智能:工業生物領域的自主化基準測試

本文探討了如何為工業生物過程的自主系統建立基準測試。作者指出,與機器人或自動駕駛不同,生物過程的核心挑戰在於感知(觀察),而非決策。由於生物指標(如活菌數量)不可見、測量緩慢且不可回溯,因此必須先對感知能力進行基準測試,然後才能評估決策。文章提出了三項感知測試:覆蓋整個系統、及時獲取數據、以及確保跨地點數據的一致性。作者認為,只有通過感知測試,才能進一步借用機器人領域的決策基準測試方法。

來源Hacker News AI作者: digvijay0401

在工業生物領域,將人工智能應用於物理過程的自主控制正引起廣泛關注。然而,我們如何評估這些系統的可靠性?本文作者Digvijay Singh,Drizzle Health的聯合創始人,提出一個基本問題:如果我們讓機器自主運行一個生物過程,我們如何知道它是否可靠?他認為,答案在於基準測試,但必須從最薄弱的環節開始。

任何在物理世界中行動的機器系統都可以被視為一個OODA循環:觀察、判斷、決策、行動。循環的整體性能取決於其最弱的環節。在機器人領域,攝像頭等傳感器已經足夠先進,但判斷物體的方位和做出正確決策仍是難點。因此,機器人基準測試側重於任務完成度,如摺疊毛巾。但在生物過程中,情況截然相反。

生物過程的弱點是觀察。要測量一個系統中活性病原體的數量,我們面臨三個挑戰:首先,這些生物指標是不可見的,無法像攝像頭讀取停止標誌那樣直接讀取;其次,測量它們需要時間,通常需要培養樣本數天才能獲得結果,這導致控制延遲如同一個延遲20秒的淋浴開關,讓你在冷熱之間搖擺不定;最後,你無法回溯過去時刻的生物狀態,因為一小時的蘋果批次已經發貨或被吃掉,無法重放或模擬。

因此,在生物過程中,決策相對容易(至少目前如此),而觀察是瓶頸。無論多少計算能力都無法從外部解決這個問題。所以,我們必須首先對“眼睛”進行基準測試。

作者提出了三項針對感知的測試:第一,看到整個系統而非單個點。例如,只用一隻手電筒檢查黑暗倉庫的一個過道,然後聲稱倉庫安全是無效的。第二,及時看到變化。衡量從事件發生到可操作數據的時間,包括生物學檢測所需的天數。第三,測量結果在不同地點間保持一致。兩個温度計都顯示70度,但一個在陽光下,一個在陰涼處,它們是否代表相同的物理現象?如果不能確保一致性,就無法合併來自不同設施的數據。

這三項測試構成了評估感知能力的基礎。只有感知通過後,評估決策能力才有意義,那時我們可以直接借鑑機器人領域的基準協議。

文章還指出,自主能力受限於感知能力,如同在霧天汽車必須減速。在工業生物領域,目前大多數應用處於L0到L2級(基於計時器或代理指標如餘氯或冷鏈温度)。要跨越L2到L3級的壁壘,必須從根本上重建生物傳感方式。

作者強調,工業生物需要建立一個可比性標準,以確保跨設施的數據具有一致含義。這是構建基礎模型的前提。最後,他介紹了其公司Drizzle的解決方案MagnaFlow,該方案旨在通過一次性採集整個批次水樣、在幾分鐘內獲得信號、並將結果與特定批次綁定,來同時滿足三項感知測試。