利用AI生成語音，讓失語者重獲新「聲」

李啟榮
2024-01-11

人工智慧,智慧醫療
人工智慧；AI生成式內容
1394
分享

對於無法說話的失語患者、氣切患者而言，用嘴巴說出自己的意見和想法，可說是困難重重；另外用文字和手語的表達方式，也不一定讓其他人能迅速理解失語者想表達何種訊息。

藉由AI生成式內容（AI-generative contents, AIGC）技術的輔助下，失語者能藉由AI嘴形辨識和語音合成技術，「說」出想表達的意見和想法，大大造福了失語者和想要與之溝通的人們，減少溝通上的難題與隔閡。

【案例服務說明】

來自英國北愛爾蘭的一家軟體公司推出嘴型判讀軟體「SRAVI」，利用AI嘴型判讀技術，來推斷失語者想要說出的單字。該軟體在北愛爾蘭一家醫院進行測試，協助一名氣切患者具備跟正常人一樣的語言對話能力，並減少氣切患者發聲不易的困難、增進醫護人員和病患之間的互動。

資料來源： (Liopa Ltd., 2023)

圖 1 嘴型判讀機制說明

另外，來自美國康乃爾大學的團隊開發了「聲納眼鏡」，利用安置在眼鏡下方的微型超音波感測器，偵測嘴部和周圍肌肉的活動，並依據嘴型與對應的單字加以反覆訓練，如此一來可不依賴攝影鏡頭就能實現讀唇功能；聲納眼鏡可跟行動裝置連動，藉由超音波嘴型判讀，使用者就可借助AI語音合成技術，以行動裝置發出聲音、與其他人溝通。

資料來源： (Shanklin, 2023)

圖 2 聲納眼鏡與底部感測器

【應用效益與成果】

SRAVI藉由在醫院內針對氣切患者的測試，已有獲得來自病患的正面回響，並能用比以往更方便、更健康的方式，直接跟醫護人員溝通；而SRAVI現在已經進入實用化階段，並開放蘋果、安卓雙平台下載；另外SRAVI也能依據不同醫療院所或其他領域的需求，訓練模型可進一步調校、增加嘴型判讀精確度。

另外，聲納眼鏡除了能藉由與行動裝置連動，來實現AI生成語音之外，也能進一步使用在圖書館等安靜環境中，以「動嘴皮、不出聲」的方式，間接實現「聲控」的效果，讓AI嘴型判讀的應用領域和情境比以往更廣泛。

【FIND觀點】

藉由嘴型判讀結合AI語音合成，是一種對失語者更為便利的發明，讓醫護人員和照護者能及時聆聽失語者的需求、為失語者解決無法說話所帶來的問題。未來可進一步結合AI自動翻譯，為失語者打破不同語言之間的隔閡和溝通障礙、建立與世界各地不同族群的溝通方式。

封面圖片來源: 123RF

參考來源：

參考資料

iPietro, L. (2023, April 6). AI-equipped eyeglasses can read silent speech . Retrieved from Cornell Chronicle: https://news.cornell.edu/stories/2023/04/ai-equipped-eyeglasses-can-read-silent-speech
Liopa Ltd. (2023). About SRAVI. Retrieved from SRAVI: https://www.sravi.ai/about.html
Min, R. (2023, March 7). NHS hospitals are trialling an AI lip-reading app to help patients who struggle to speak. Retrieved from Euronews: https://www.euronews.com/next/2023/03/07/nhs-hospitals-are-trialling-an-ai-lip-reading-app-to-help-patients-who-struggle-to-speak
Shanklin, W. (2023, April 7). Researchers built sonar glasses that track facial movements for silent communication. Retrieved from Engadget: https://www.engadget.com/researchers-built-sonar-glasses-that-track-facial-movements-for-silent-communication-171508573.html

延伸閱讀

飛利浦以智慧醫療雲端服務平台，降低總體護理成本27%

Sydney Health讓醫療保健變得更easy

聲音探索高齡照護前線：日本創新科技助力吞嚥功能評估與預防

作者相關文章

人工智慧；AI生成式內容