空中签名解锁:基于点体素交叉注意力网络的VR/AR身份认证接口
研究人员提出了一种名为“Sign in the Air to Unlock”的空中签名界面,利用点体素交叉注意力网络(PV-Net)在虚拟现实和增强现实环境中实现自然、安全且无缝的身份认证。该方法避免了传统密码、PIN及设备登录对沉浸体验的破坏,也无需专用传感器。在DeepAirSig数据集上等错误率为2.5%,在Meta Quest 2上收集的ImmAirSig数据集上分类准确率达76%。该工作展示了三维行为认证在沉浸式环境中的巨大潜力。
随着虚拟现实(VR)和增强现实(AR)技术的飞速发展,它们已深入融入医疗、教育、娱乐等众多领域,成为现代生活的重要组成部分。然而,在沉浸式环境中,用户身份认证却面临独特挑战:传统的密码、PIN码或设备登录会打断沉浸体验,且依赖外部硬件;而手势识别、眼动追踪或脑电图(EEG)等新方法往往需要专用传感器或限制自然动作,限制了在动态环境中的可用性。
针对这一问题,来自的研究团队在arXiv预印本(arXiv:2607.01435)中提出了一种名为“Sign in the Air to Unlock”的创新接口。该接口允许用户在空中像签名一样自然挥动手指或手,系统即可识别其独特的签名轨迹,完成身份验证。这一设计利用了人们熟悉的签名动作——既是个性化表达,又是稳定可重复的行为特征,从而在安全性和自然性之间取得平衡。
为了实现这一接口,团队开发了点体素交叉注意力网络(Point-Voxel Cross-Attention Network, PV-Net)。该网络巧妙融合了点云和体素两种表示的优势:通过点云建模签名轨迹的局部运动动态,如速度和加速度的变化,同时利用体素刻画三维空间的整体结构。这种联合建模方式使PV-Net能够精准捕捉每个签名独一无二的时空特征,从而实现高精度的身份识别。
为了验证该方法的实用性,研究团队在两种数据集上进行了测试:一是公开的DeepAirSig数据集,包含40位用户的1800个签名样本;二是他们自行收集的ImmAirSig数据集,使用Meta Quest 2头显在沉浸式VR环境中采集,涵盖22位用户的880个签名。实验结果显示,PV-Net在DeepAirSig上实现了2.5%的等错误率(Equal Error Rate, EER),在更为复杂的ImmAirSig上取得了76%的分类准确率。这些结果显著优于传统方法,证明了空中签名在VR/AR认证中的可行性。
该项研究证实,基于3D行为的认证方式可以兼具安全性与自然交互,为未来VR/AR场景下的无感、用户中心认证开辟了新路径。团队指出,尽管目前准确率仍有提升空间,但空中签名结合深度学习的方法已展现出替代传统方案的潜力。后续工作将聚焦于提高跨会话稳定性及应对攻击的鲁棒性,以推动该技术的实际部署。