對於無法說話的失語患者、氣切患者而言,用嘴巴說出自己的意見和想法,可說是困難重重;另外用文字和手語的表達方式,也不一定讓其他人能迅速理解失語者想表達何種訊息。
藉由AI生成式內容(AI-generative contents, AIGC)技術的輔助下,失語者能藉由AI嘴形辨識和語音合成技術,「說」出想表達的意見和想法,大大造福了失語者和想要與之溝通的人們,減少溝通上的難題與隔閡。
【案例服務說明】
來自英國北愛爾蘭的一家軟體公司推出嘴型判讀軟體「SRAVI」,利用AI嘴型判讀技術,來推斷失語者想要說出的單字。該軟體在北愛爾蘭一家醫院進行測試,協助一名氣切患者具備跟正常人一樣的語言對話能力,並減少氣切患者發聲不易的困難、增進醫護人員和病患之間的互動。
資料來源: (Liopa Ltd., 2023)
圖 1 嘴型判讀機制說明
另外,來自美國康乃爾大學的團隊開發了「聲納眼鏡」,利用安置在眼鏡下方的微型超音波感測器,偵測嘴部和周圍肌肉的活動,並依據嘴型與對應的單字加以反覆訓練,如此一來可不依賴攝影鏡頭就能實現讀唇功能;聲納眼鏡可跟行動裝置連動,藉由超音波嘴型判讀,使用者就可借助AI語音合成技術,以行動裝置發出聲音、與其他人溝通。
資料來源: (Shanklin, 2023)
圖 2 聲納眼鏡與底部感測器
【應用效益與成果】
SRAVI藉由在醫院內針對氣切患者的測試,已有獲得來自病患的正面回響,並能用比以往更方便、更健康的方式,直接跟醫護人員溝通;而SRAVI現在已經進入實用化階段,並開放蘋果、安卓雙平台下載;另外SRAVI也能依據不同醫療院所或其他領域的需求,訓練模型可進一步調校、增加嘴型判讀精確度。
另外,聲納眼鏡除了能藉由與行動裝置連動,來實現AI生成語音之外,也能進一步使用在圖書館等安靜環境中,以「動嘴皮、不出聲」的方式,間接實現「聲控」的效果,讓AI嘴型判讀的應用領域和情境比以往更廣泛。
【FIND觀點】
藉由嘴型判讀結合AI語音合成,是一種對失語者更為便利的發明,讓醫護人員和照護者能及時聆聽失語者的需求、為失語者解決無法說話所帶來的問題。未來可進一步結合AI自動翻譯,為失語者打破不同語言之間的隔閡和溝通障礙、建立與世界各地不同族群的溝通方式。
封面圖片來源: 123RF
參考資料