AI手語即時通:打造真正無障礙溝通管道

post image

隨著人工智慧(AI)技術的迅速發展,越來越多應用進入「無障礙溝通」領域,其中以手語翻譯技術最受矚目。近年來,AI手語翻譯技術逐步從研究階段走向實際應用,不僅在學術界取得突破,也由企業積極推動落地部署。以英國University of Surrey主導的SignGPT為例,此計畫獲得英國工程與物理科學研究委員會(EPSRC)845萬英鎊資助,旨在建立全球最大規模的手語資料庫,並開發一套能在「口語 ↔ 手語動畫影片」之間雙向自動翻譯的通用大型語言模型,促進語音與影像手語之間的高品質互通與生成。

另一方面,美國Sorenson推出的OmniBridge SDK,則是一套可嵌入第三方應用程式的即時雙向手語翻譯工具,支援本機端辨識美式手語與語音互轉,並兼顧使用者隱私。此外,Signapse的JavaScript插件也可將網站與影片平台的內容即時轉換為手語演示,顯著提升線上數位內容的可及性。

AI手語翻譯的多面向進展

1. 資料集規模與跨語言能力
SignGPT強調「專為聽障者設計」、以英國手語(BSL)為主、輔以更多語種,產出首個超大規模、多語手語資料庫,提升模型回覆品質與文化貼近性。並且把聽障者、聽力研究人員、手語專家與電腦視覺專家聚集在同一團隊,讓每個小組都能相互學習,並透過此模式提升聽障者研究人員的能力,使他們能夠在未來引領這一領域。

2. 雙向即時翻譯技術
OmniBridge結合電腦視覺、語音識別、離線運算等技術,達到「即時雙向翻譯」,不只辨識手語,也同步字幕化語音,保護隱私、無須雲端支援。專為網路不穩定或無法連線的場所而設計,確保溝通不中斷、互動快速順暢。


圖1:OmniBridge展示畫面
資料來源:How AI Can Bridge the Deaf and Hearing Worlds | Adam Munder | TED

3. 多平台整合應用
Signapse的目標是「嵌入即用」,可整合至網站、影片平台、公眾空間的數位標示與訊息系統。無論是品牌方、交通業、教育機構,皆可快速部署手語介面。同時,Signapse提供開放試用工具,如SignStream,可自由生成BSL手語短影片,有助推廣與技術驗證。

4. 倫理與共融設計
SignGPT與OmniBridge均強調「聽障者主導」設計,與聽障者團體、手語專家密切合作,避免單純從技術角度出發,導致工具無法真正貼近聽障者需求。藉由把聽障者融入每個環節,從資料蒐集、模型訓練,到決策制定,創造出真正可用的AI解決方案。

社會效益與挑戰

AI手語技術的發展,不只是科技上的突破,也正在推動一個更包容的社會。對聽障者來說,能夠在沒有翻譯員的情況下自由表達,不再受限於「有限的翻譯資源」,不但提升了溝通的自主性,也有助於爭取更多工作機會。對企業和公共單位而言,導入這類技術不僅能改善使用者體驗,也有助於強化品牌形象,符合現代對CSR和ESG的期待。

當然,挑戰也不少,手語有其獨特的語法、表情和空間結構,相比口語要困難許多,辨識難度自然更高,再加上各地手語有所不同,也需要針對不同語種做出調整。更重要的是,AI技術能否真正對聽障者有幫助,如果開發過程沒有讓聽障者參與,這些技術很可能只會變成表面功夫,看起來先進,卻沒真正解決問題。

結語

從SignGPT的大型研究、OmniBridge的本機SDK,到Signapse推出的網頁整合方案,AI手語技術正朝著多方向發展,用科技一步步實現「平等溝通」的理想。這些進展不只是把各種新技術疊加起來,而是結合了資料驅動、AI技術研發,還有對社會價值的關注,共同推動「由聽障者主導的溝通革新」。這項技術真正的意義,不只是提升效率,而是讓每一個人都能「被看見、被理解」。在人機共存的新時代,這將是邁向公平、無障礙溝通的一大步。

洪博文

2025-08-11

分享: 0 瀏覽量: 378