AI-Mimi為日本聾啞及聽力障礙使用者打造包容性電視體驗
日本公司SI-com及其母公司ISCEC Japan利用微軟Azure認知服務開發了AI-Mimi,一種結合人工與AI的混合字幕系統,旨在為當地電視臺提供經濟高效的即時直播字幕,以服務聾啞及聽力障礙群體。該系統經過測試並獲得積極反饋。
近年來,全球對字幕的需求日益增長。例如,英國廣播公司(BBC)報告稱,字幕主要服務於聽力受損觀眾,但實際上被廣泛人群使用——約10%的廣播電視觀眾經常使用字幕,而某些線上內容的字幕使用比例高達35%,其中大多數使用者並非聽障人士。類似趨勢在全球電視、社交媒體及其他影片內容平臺中均有體現。
在日本,超過36萬人為聾啞或聽力障礙者,其中7萬人以手語為主要溝通方式,其餘則偏好書面日語。此外,日本65歲以上人口接近30%,據日本助聽器工業協會估計,約有1420萬人存在聽力障礙。日本主要廣播公司為大部分節目提供字幕,但這需要專用裝置和專職人員,成本高達數千萬日元。SI-com的Muneya Ichise表示:“由於裝置昂貴和人員限制,日本超過100家地方電視臺在提供直播字幕方面面臨障礙。”地方電視臺對其社群至關重要,當地新聞節目傳遞著地區的重要資訊。
為應對這一無障礙需求,SI-com及其母公司ISCEC Japan自2018年起與地方電視臺合作,探索創新且經濟高效的方式為直播引入字幕。他們的技術解決方案“AI-Mimi”將人工輸入與微軟Azure認知服務相結合,透過混合格式建立了更準確、更快速的即時字幕系統。此外,ISCEC能夠利用其專業人才彌補當地字幕輸入人員的短缺。AI-Mimi還已在沖繩大學引入,並因其創新獲得了微軟AI無障礙資助。
基於大量測試和使用者反饋(如對更大字型和更好字幕顯示的需求),SI-com能夠建立在螢幕右側顯示超過10行字幕的模型,取代了傳統的底部兩行字幕顯示方式。2021年12月,他們與長崎的一家地方電視臺合作,首次在直播中演示了該技術。
聾啞及聽力障礙社群對此次直播演示給予了高度評價,確認其無障礙需求和願望得到了滿足。地方電視臺也強調了使用ISCEC模型的好處:無需專用裝置和成本,反而提供了更高的靈活性。Ichise先生表示:“我們非常驚訝收到如此多人的積極反饋,他們稱讚這項技術革新在促進所有直播節目中字幕使用、確保社群無障礙體驗方面發揮了重要作用。”
AI-Mimi的成功展示了人工智慧如何與人類協作,以低成本、高效率的方式解決現實世界的無障礙挑戰。