AI-Mimi、日本の聴覚障害者向けにインクルーシブなテレビ体験を構築
SI-comとその親会社ISCEC Japanは、マイクロソフトのAzure Cognitive Servicesを活用したハイブリッド字幕システム「AI-Mimi」を開発。ローカルテレビ局向けにコスト効率の高いリアルタイム字幕を提供し、聴覚障害者コミュニティを支援する。システムはテストで成功し、好評を得た。
近年、世界中で字幕の需要が高まっている。例えば英国BBCは、字幕は主に聴覚障害者向けだが、幅広い視聴者に利用されており、放送視聴者の約10%、オンラインコンテンツでは35%が定期的に字幕を使用し、その大半は聴覚障害者ではないと報告している。同様の傾向はテレビ、ソーシャルメディアなど世界中の動画チャンネルで見られる。
日本には約36万人の聴覚障害者がおり、そのうち7万人が手話を第一言語とし、残りは書き言葉の日本語を好む。さらに65歳以上の人口が約30%を占め、日本補聴器工業会によると約1420万人が聴覚障害を持っている。主要放送局の大半の番組に字幕が付いているが、専用スタッフと数千万円の特殊機器が必要だ。SI-comの市瀬宗也氏は「機器の高コストと人員不足のため、100以上の地方テレビ局が生放送字幕の提供に障壁を抱えている」と述べる。地方局は地域社会にとって重要で、地元ニュースはその地域と住民に関する重要な情報を伝えている。
このアクセシビリティニーズに対応するため、SI-comと親会社ISCEC Japanは2018年から地方テレビ局と協力し、生放送に字幕を導入する革新的で費用対効果の高い方法を試験してきた。その技術的解決策であるAI-Mimiは、人間の入力とマイクロソフトAzure Cognitive Servicesの力を組み合わせたハイブリッド形式で、より正確かつ迅速なソリューションを実現する。さらにISCECは自社の専門要員を活用して、地域の字幕入力者不足を補っている。AI-Mimiは沖縄大学でも導入され、マイクロソフトのAI for Accessibility助成金を受賞した。
広範なテストとユーザーフィードバック(大きなフォントや字幕表示改善のニーズ)に基づき、SI-comは画面右側に10行以上の字幕を表示するモデルを作成。従来の下部2行表示から脱却した。2021年12月、長崎の地方テレビ局と提携し、初めて生放送でデモを実施した。
聴覚障害者コミュニティはこのデモを高く評価し、アクセシビリティのニーズと希望が満たされたと確認した。地方テレビ局も、ISCECのモデルが専用機器不要で柔軟性を高める利点を強調した。市瀬氏は「多くの人からポジティブなフィードバックをいただき驚いている。字幕の普及とコミュニティのアクセシビリティ確保に重要な役割を果たす技術革新だと評価された」と語った。
AI-Mimiの成功は、AIと人間の協働により、低コストで効果的に現実世界のアクセシビリティ課題を解決できることを示している。