2026-06-16站内改写1 分で読了更新: 2026-06-16

海上セキュリティのためのAI：CNNとVision Transformerアーキテクチャの海上物体検出における比較評価

本研究は、AIとコンピュータビジョンを用いて海上セキュリティを強化するもので、6,468枚の画像を用いて6つの深層学習アーキテクチャを比較。Vision Transformerは100%の精度、最低のエラー率、最速の処理速度を達成し、監視、国境保護、自律航法におけるAIの可能性を示した。

ソースarXiv Computer Vision著者: Ismet Gocer, Zakirul Bhuiayn, Shakeel Ahmad, Raza Hasan

2026年5月28日にarXivに提出された新しい研究論文は、高度な人工知能（AI）とコンピュータビジョン（CV）技術を用いて海上セキュリティを強化することを目的としています。著者はIsmet Gocer氏を含む4名で、論文は24ページ、コンピュータビジョンとパターン認識（cs.CV）の分野に属します。研究チームは、異なるリアルタイム環境下で海面上の船舶を検出できるインテリジェント物体検出システムを設計・評価しました。

目標達成のため、曇り、霧、雨、晴れなどの様々な気象条件をカバーする6,468枚の海洋画像データセットを使用し、モデルの汎化能力を確保しました。評価された6つの深層学習アーキテクチャは、ベースとなる畳み込みニューラルネットワーク（CNN）モデル、4つの転移学習モデル（Xception、VGG16、MobileNetV2、EfficientNetV2L）、およびVision Transformer（ViT）モデルです。モデルは、精度、第一種過誤（偽陽性）と第二種過誤（偽陰性）、モデルサイズ、動画処理時間などの複数の性能指標を用いて比較されました。

実験結果は、モデルの性能が計算制約や展開条件に応じて変化することを示しました。MobileNetV2のような軽量アーキテクチャはリソースが限られたデバイスに適していますが、Vision Transformerは全ての指標で最高の全体的性能を達成しました。ViTは100%の精度を実現し、最も低いエラー率と最速の動画処理時間を記録しました。この発見は、AI駆動のコンピュータビジョンシステムが海上監視、国境保護、自律航法などの応用において大きな可能性を持つことを強調しています。現在、論文のコードとデータは公開されていませんが、arXivを通じて入手可能です。