AI語音智慧獨角獸-ElevenLabs

總部位於美國紐約的ElevenLabs是近年快速竄起的獨角獸新創,專注於開發語音克隆(Voice Clone)及語音合成技術,用戶可運用多種語言和口音建立及設計AI聲音,並能模擬各種情感和語調,可應用於AI配音、新聞報導、有聲書朗讀等領域。ElevenLabs主要投資人包含a16z、紅杉資本、前GitHub執行長Nat Friedman等,並於今(2024)年1月完成8.000萬美元的B輪募資。
ElevenLabs由來自波蘭的Piotr Dabkowski和Mati Staniszewski共同創立,他們倆位過去分別任職Google機器學習工程師與Palantir部署策略師,創立的靈感是受到美國電影中搭配不協調的波蘭配音所啟發。
高品質語音生成AI平台,大幅降低內容製作成本
究竟是什麼原因造就這家2022年成立的新創,能在短時間內快速成長?ElevenLabs又具有哪些優勢與特色呢?
ElevenLabs創立的目的是希望突破語言及語音的障礙,讓語音創作與傳播能夠更加簡單且自然。ElevenLabs的核心產品是「高品質語音生成AI平台」,強調使用深度學習模型,能夠自然地模仿人類語音的語調和語氣,並根據上下文調整語音的表達情緒。
ElevenLabs在發展的過程中,不斷研發與精進各種AI語音技術,如透過語音克隆,用戶可提供語音檔複製自己的聲音,生成與真實語音幾乎無差別的AI聲音,並支援29種語言和多種口音;2023年10月所推出的AI Dubbing配音工具,能自動將語音內容翻譯成多種語言,同時保留原講者的聲音特徵,這項技術對於教育、遊戲與即時通訊等應用場景產生極大的功效,也能大幅降低內容創作成本。
配音時間有效縮短,提升使用者良好體驗
ElevenLabs同時也與許多產業建立合作網絡,包含新聞媒體、出版業、教育、遊戲、影片製作、甚至醫療等領域,如與出版商Lukeman Literary 在製作有聲書方面合作,讓過去需耗費數周時間進行配音的工作,縮短至數小時即可完成;與語言學習課程Praktika.ai合作,開發客製化互動式語言系統,能有效提升使用者體驗,並提高學習者使用時數。ElevenLabs藉由與多元領域產業合作以加速技術優化,同時提升在市場上的影響力。
然而,隨著全球AI人工智慧語音技術的創新發展,也成為新興犯罪工具之一,如美國發現不肖人士利用ElevenLabs工具進行深偽製作,企圖干擾選舉;ElevenLabs表示將致力於防止濫用AI人工智慧的語音複製工具,並且對任何濫用行為非常嚴肅看待。
ElevenLabs透過AI語音技術研發與持續創新進化,成立僅2年即在全球語音技術領域佔有一席之地。在快速成長的同時,ElevenLabs團隊需同時建立完善相應的合規與資安措施,並且避免技術遭濫用所延伸出的犯罪議題,以確保未來有望成為全球語音技術的領導者。
圖1:ElevenLabs重要發展歷程
資料來源:ElevenLabs,本文作者整理繪製
封面圖片來源:本文作者自行繪製(輔以Canva AI設計生成圖片)
參考資料來源:
錢怡婷
2024-08-02
