基于生物输入而非视觉的物理人工智能:工业生物领域的自主化基准测试
本文探讨了如何为工业生物过程的自主系统建立基准测试。作者指出,与机器人或自动驾驶不同,生物过程的核心挑战在于感知(观察),而非决策。由于生物指标(如活菌数量)不可见、测量缓慢且不可回溯,因此必须先对感知能力进行基准测试,然后才能评估决策。文章提出了三项感知测试:覆盖整个系统、及时获取数据、以及确保跨地点数据的一致性。作者认为,只有通过感知测试,才能进一步借用机器人领域的决策基准测试方法。
在工业生物领域,将人工智能应用于物理过程的自主控制正引起广泛关注。然而,我们如何评估这些系统的可靠性?本文作者Digvijay Singh,Drizzle Health的联合创始人,提出一个基本问题:如果我们让机器自主运行一个生物过程,我们如何知道它是否可靠?他认为,答案在于基准测试,但必须从最薄弱的环节开始。
任何在物理世界中行动的机器系统都可以被视为一个OODA循环:观察、判断、决策、行动。循环的整体性能取决于其最弱的环节。在机器人领域,摄像头等传感器已经足够先进,但判断物体的方位和做出正确决策仍是难点。因此,机器人基准测试侧重于任务完成度,如折叠毛巾。但在生物过程中,情况截然相反。
生物过程的弱点是观察。要测量一个系统中活性病原体的数量,我们面临三个挑战:首先,这些生物指标是不可见的,无法像摄像头读取停止标志那样直接读取;其次,测量它们需要时间,通常需要培养样本数天才能获得结果,这导致控制延迟如同一个延迟20秒的淋浴开关,让你在冷热之间摇摆不定;最后,你无法回溯过去时刻的生物状态,因为一小时的苹果批次已经发货或被吃掉,无法重放或模拟。
因此,在生物过程中,决策相对容易(至少目前如此),而观察是瓶颈。无论多少计算能力都无法从外部解决这个问题。所以,我们必须首先对“眼睛”进行基准测试。
作者提出了三项针对感知的测试:第一,看到整个系统而非单个点。例如,只用一只手电筒检查黑暗仓库的一个过道,然后声称仓库安全是无效的。第二,及时看到变化。衡量从事件发生到可操作数据的时间,包括生物学检测所需的天数。第三,测量结果在不同地点间保持一致。两个温度计都显示70度,但一个在阳光下,一个在阴凉处,它们是否代表相同的物理现象?如果不能确保一致性,就无法合并来自不同设施的数据。
这三项测试构成了评估感知能力的基础。只有感知通过后,评估决策能力才有意义,那时我们可以直接借鉴机器人领域的基准协议。
文章还指出,自主能力受限于感知能力,如同在雾天汽车必须减速。在工业生物领域,目前大多数应用处于L0到L2级(基于计时器或代理指标如余氯或冷链温度)。要跨越L2到L3级的壁垒,必须从根本上重建生物传感方式。
作者强调,工业生物需要建立一个可比性标准,以确保跨设施的数据具有一致含义。这是构建基础模型的前提。最后,他介绍了其公司Drizzle的解决方案MagnaFlow,该方案旨在通过一次性采集整个批次水样、在几分钟内获得信号、并将结果与特定批次绑定,来同时满足三项感知测试。