AI-Mimi為日本聾啞及聽力障礙用户打造包容性電視體驗
日本公司SI-com及其母公司ISCEC Japan利用微軟Azure認知服務開發了AI-Mimi,一種結合人工與AI的混合字幕系統,旨在為當地電視台提供經濟高效的實時直播字幕,以服務聾啞及聽力障礙羣體。該系統經過測試並獲得積極反饋。
近年來,全球對字幕的需求日益增長。例如,英國廣播公司(BBC)報告稱,字幕主要服務於聽力受損觀眾,但實際上被廣泛人羣使用——約10%的廣播電視觀眾經常使用字幕,而某些在線內容的字幕使用比例高達35%,其中大多數用户並非聽障人士。類似趨勢在全球電視、社交媒體及其他視頻內容平台中均有體現。
在日本,超過36萬人為聾啞或聽力障礙者,其中7萬人以手語為主要溝通方式,其餘則偏好書面日語。此外,日本65歲以上人口接近30%,據日本助聽器工業協會估計,約有1420萬人存在聽力障礙。日本主要廣播公司為大部分節目提供字幕,但這需要專用設備和專職人員,成本高達數千萬日元。SI-com的Muneya Ichise表示:“由於設備昂貴和人員限制,日本超過100家地方電視台在提供直播字幕方面面臨障礙。”地方電視台對其社區至關重要,當地新聞節目傳遞着地區的重要信息。
為應對這一無障礙需求,SI-com及其母公司ISCEC Japan自2018年起與地方電視台合作,探索創新且經濟高效的方式為直播引入字幕。他們的技術解決方案“AI-Mimi”將人工輸入與微軟Azure認知服務相結合,通過混合格式創建了更準確、更快速的實時字幕系統。此外,ISCEC能夠利用其專業人才彌補當地字幕輸入人員的短缺。AI-Mimi還已在沖繩大學引入,並因其創新獲得了微軟AI無障礙資助。
基於大量測試和用户反饋(如對更大字體和更好字幕顯示的需求),SI-com能夠創建在屏幕右側顯示超過10行字幕的模型,取代了傳統的底部兩行字幕顯示方式。2021年12月,他們與長崎的一家地方電視台合作,首次在直播中演示了該技術。
聾啞及聽力障礙社區對此次直播演示給予了高度評價,確認其無障礙需求和願望得到了滿足。地方電視台也強調了使用ISCEC模型的好處:無需專用設備和成本,反而提供了更高的靈活性。Ichise先生表示:“我們非常驚訝收到如此多人的積極反饋,他們稱讚這項技術革新在促進所有直播節目中字幕使用、確保社區無障礙體驗方面發揮了重要作用。”
AI-Mimi的成功展示了人工智能如何與人類協作,以低成本、高效率的方式解決現實世界的無障礙挑戰。