強化YOLOフレームワークが360度小型物体検出の精度を90%に向上
芝浦工業大学の研究チームは、転移学習とカスタムデータセットを用いた強化YOLOフレームワークを開発し、全方位カメラでの小型移動物体検出を大幅に改善した。このモデルは90%の精度を達成し、50メートルまで性能を維持、標準的なYOLOモデルを上回る。
芝浦工業大学の研究チームは、転移学習とカスタムデータセットを活用した強化YOLOフレームワークを開発し、全方位カメラ映像における小型移動物体の検出精度を90%に向上させた。この成果は『IEEE Open Journal of Intelligent Transportation Systems』に掲載された。
全方位カメラは360度の視野を捉えるため、監視、交通分析、自動運転システムなどで広く利用されている。しかし、広角レンズによる歪みで遠方の物体が小さく変形し、コンピュータビジョンシステムによる正確な認識が困難になる。特に歩行者、自転車、オートバイ、自動車などの移動物体では深刻な課題となる。
YOLO(You Only Look Once)は高速で正確なリアルタイム物体検出アルゴリズムだが、全方位映像では画像をグリッドに分割するため、複数の小型物体が同じグリッドに含まれると情報が失われやすい。この弱点を克服するため、研究チームは独自のトレーニングデータセットと転移学習を組み合わせたフレームワークを設計した。
データセットは約4000枚の注釈付き画像で構成され、「人間」「自動車」「自転車」「オートバイ」の4カテゴリを対象とする。全方位カメラでは距離に応じて解像度が急激に低下するため、チームは各クラスに特徴的な定義を設けた。例えば、人間は少なくとも片方の腕または脚が見えること、自動車は2つ以上のタイヤが見えること、自転車とオートバイは前後の車輪が両方見えることなどである。さらに、画像を切り抜き、複数の角度から物体を含めることでデータセットを強化した。
実験の結果、提案モデルは8×8ピクセル以上の物体で全体精度90%を達成。YOLOv5の46%、YOLOv8の53%を大きく上回った。特に8×8~32×32ピクセルの小型移動物体では、提案モデルの精度が0.81であり、YOLOv5の0.39、YOLOv8の0.42を凌駕した。距離性能では、標準YOLOモデルが40メートルを超えると精度が急落するのに対し、提案モデルは50メートルまで有効性を維持した。
研究を率いたChinthaka Premachandra教授は、「日本を含む多くの国では、交差点は車両、歩行者、自転車が複数方向から進入するため事故が多発しています。この研究はその問題を解決するために始められました」と述べている。本技術は、インテリジェント交通システム、自動運転、ロボットナビゲーション、特に交差点監視や安全支援への応用が期待される。
研究チームは今後、8×8ピクセル未満の物体に対する検出精度の向上を目指し、さらなる事故リスク低減と道路安全性向上に貢献したいとしている。