AI News HubLIVE
站内改写2 分钟阅读

AI-Mimi为日本聋哑及听力障碍用户打造包容性电视体验

日本公司SI-com及其母公司ISCEC Japan利用微软Azure认知服务开发了AI-Mimi,一种结合人工与AI的混合字幕系统,旨在为当地电视台提供经济高效的实时直播字幕,以服务聋哑及听力障碍群体。该系统经过测试并获得积极反馈。

来源Microsoft AI Blog作者: Ben Ryon

近年来,全球对字幕的需求日益增长。例如,英国广播公司(BBC)报告称,字幕主要服务于听力受损观众,但实际上被广泛人群使用——约10%的广播电视观众经常使用字幕,而某些在线内容的字幕使用比例高达35%,其中大多数用户并非听障人士。类似趋势在全球电视、社交媒体及其他视频内容平台中均有体现。

在日本,超过36万人为聋哑或听力障碍者,其中7万人以手语为主要沟通方式,其余则偏好书面日语。此外,日本65岁以上人口接近30%,据日本助听器工业协会估计,约有1420万人存在听力障碍。日本主要广播公司为大部分节目提供字幕,但这需要专用设备和专职人员,成本高达数千万日元。SI-com的Muneya Ichise表示:“由于设备昂贵和人员限制,日本超过100家地方电视台在提供直播字幕方面面临障碍。”地方电视台对其社区至关重要,当地新闻节目传递着地区的重要信息。

为应对这一无障碍需求,SI-com及其母公司ISCEC Japan自2018年起与地方电视台合作,探索创新且经济高效的方式为直播引入字幕。他们的技术解决方案“AI-Mimi”将人工输入与微软Azure认知服务相结合,通过混合格式创建了更准确、更快速的实时字幕系统。此外,ISCEC能够利用其专业人才弥补当地字幕输入人员的短缺。AI-Mimi还已在冲绳大学引入,并因其创新获得了微软AI无障碍资助。

基于大量测试和用户反馈(如对更大字体和更好字幕显示的需求),SI-com能够创建在屏幕右侧显示超过10行字幕的模型,取代了传统的底部两行字幕显示方式。2021年12月,他们与长崎的一家地方电视台合作,首次在直播中演示了该技术。

聋哑及听力障碍社区对此次直播演示给予了高度评价,确认其无障碍需求和愿望得到了满足。地方电视台也强调了使用ISCEC模型的好处:无需专用设备和成本,反而提供了更高的灵活性。Ichise先生表示:“我们非常惊讶收到如此多人的积极反馈,他们称赞这项技术革新在促进所有直播节目中字幕使用、确保社区无障碍体验方面发挥了重要作用。”

AI-Mimi的成功展示了人工智能如何与人类协作,以低成本、高效率的方式解决现实世界的无障碍挑战。