多模式鐵路道口安全分析
本文提出了一種利用影像和事故報告等多模態資料進行鐵路道口安全評估的AI系統原型,透過視覺語言模型實現風險分類和安全評分,效能接近專家水平。
來源arXiv Machine Learning作者: Paimon Goulart, Chansong Lim, N\'icolas Roque dos Santos, Yue Dong, Sheldon Peterson, Jia Chen, Evangelos E. Papalexakis
研究人員開發了一種新型人工智慧系統,能夠透過分析鐵路道口的影像以及官方事故報告等多模態資料,評估其安全等級。該系統由論文《Multi-modal Rail Crossing Safety Analysis》提出,旨在提供與美國聯邦鐵路管理局(FRA)標準一致的全自動化安全評估。該研究構建了一個概念驗證流程,整合了視覺線索和結構化資料。系統使用經過路由微調的緊湊型視覺語言模型(VLM),能夠將道口分為高風險和低風險兩類,分類效能達到宏F1分數0.757。在FRA安全評分估計方面,模型的均方根誤差(RMSE)為0.078,相關性為0.492,且定性結果與領域專家判斷吻合。研究過程中,團隊探索了從資料準備到不同學習正規化的多個關鍵挑戰。例如,如何處理不同質量的鐵路道口影像,以及如何將非結構化的事故報告有效融入模型訓練。系統目前支援識別高風險和低風險道口,未來有望擴充套件至更精細的風險等級劃分。此外,研究還涉及瞭如何利用路由機制選擇最優模型,以確保在資源受限的環境下也能保持高效推理。儘管仍處於原型階段,該工作展示了AI在交通安全領域的巨大潛力。透過自動化分析,可輔助監管機構優先處理高風險道口,從而提升整體鐵路安全。研究程式碼和資料已在論文中公開,以促進後續研究和實際部署。該系統的提出為交通安全領域提供了一種創新思路,未來若能成功應用,將有望顯著減少鐵路道口事故的發生,保障人民生命財產安全。