利用AI生成語音,讓失語者重獲新「聲」


對於無法說話的失語患者、氣切患者而言,用嘴巴說出自己的意見和想法,可說是困難重重;另外用文字和手語的表達方式,也不一定讓其他人能迅速理解失語者想表達何種訊息。

藉由AI生成式內容(AI-generative contents, AIGC)技術的輔助下,失語者能藉由AI嘴形辨識和語音合成技術,「說」出想表達的意見和想法,大大造福了失語者和想要與之溝通的人們,減少溝通上的難題與隔閡。

【案例服務說明】

來自英國北愛爾蘭的一家軟體公司推出嘴型判讀軟體「SRAVI」,利用AI嘴型判讀技術,來推斷失語者想要說出的單字。該軟體在北愛爾蘭一家醫院進行測試,協助一名氣切患者具備跟正常人一樣的語言對話能力,並減少氣切患者發聲不易的困難、增進醫護人員和病患之間的互動。

 

資料來源: (Liopa Ltd., 2023)

圖 1 嘴型判讀機制說明

另外,來自美國康乃爾大學的團隊開發了「聲納眼鏡」,利用安置在眼鏡下方的微型超音波感測器,偵測嘴部和周圍肌肉的活動,並依據嘴型與對應的單字加以反覆訓練,如此一來可不依賴攝影鏡頭就能實現讀唇功能;聲納眼鏡可跟行動裝置連動,藉由超音波嘴型判讀,使用者就可借助AI語音合成技術,以行動裝置發出聲音、與其他人溝通。

 

資料來源: (Shanklin, 2023)

圖 2 聲納眼鏡與底部感測器

【應用效益與成果】

SRAVI藉由在醫院內針對氣切患者的測試,已有獲得來自病患的正面回響,並能用比以往更方便、更健康的方式,直接跟醫護人員溝通;而SRAVI現在已經進入實用化階段,並開放蘋果、安卓雙平台下載;另外SRAVI也能依據不同醫療院所或其他領域的需求,訓練模型可進一步調校、增加嘴型判讀精確度。

另外,聲納眼鏡除了能藉由與行動裝置連動,來實現AI生成語音之外,也能進一步使用在圖書館等安靜環境中,以「動嘴皮、不出聲」的方式,間接實現「聲控」的效果,讓AI嘴型判讀的應用領域和情境比以往更廣泛。

【FIND觀點】

藉由嘴型判讀結合AI語音合成,是一種對失語者更為便利的發明,讓醫護人員和照護者能及時聆聽失語者的需求、為失語者解決無法說話所帶來的問題。未來可進一步結合AI自動翻譯,為失語者打破不同語言之間的隔閡和溝通障礙、建立與世界各地不同族群的溝通方式。


封面圖片來源: 123RF

 

參考來源:

 參考資料

  1. iPietro, L. (2023, April 6). AI-equipped eyeglasses can read silent speech . Retrieved from Cornell Chronicle: https://news.cornell.edu/stories/2023/04/ai-equipped-eyeglasses-can-read-silent-speech

  2. Liopa Ltd. (2023). About SRAVI. Retrieved from SRAVI: https://www.sravi.ai/about.html 

  3. Min, R. (2023, March 7). NHS hospitals are trialling an AI lip-reading app to help patients who struggle to speak. Retrieved from Euronews: https://www.euronews.com/next/2023/03/07/nhs-hospitals-are-trialling-an-ai-lip-reading-app-to-help-patients-who-struggle-to-speak 

  4. Shanklin, W. (2023, April 7). Researchers built sonar glasses that track facial movements for silent communication. Retrieved from Engadget: https://www.engadget.com/researchers-built-sonar-glasses-that-track-facial-movements-for-silent-communication-171508573.html 

 

 

 

延伸閱讀