DolphinGemma、人類與海洋哺乳動物之間的互動

post image

    隨著人工智慧技術的快速發展,科學家們正將大型語言模型(LLM)的應用拓展至意想不到的領域。Google 近期與野生海豚計畫(Wild Dolphin Project, WDP)及跨學科研究團隊合作,推出名為 DolphinGemma 的新型 AI 系統,嘗試解碼海豚複雜的聲音訊號,開啟人類與海豚之間溝通的可能性。

    這項研究結合了來自過去 40 年對野生斑點海豚行為與聲音的觀察資料,搭配 Google 基於 Gemini 技術所訓練的語言模型,旨在理解海豚之間具有語意性的聲音模式。配合「鯨豚聽覺增強遙測系統」(CHAT),研究團隊更嘗試與海豚建立有限度的聲音互動,探索基本詞彙交換的可能。

        DolphinGemma 將於近期開源釋出,未來有望推廣至更多物種的語音研究中。此計畫不僅是人工智慧應用的創新實踐,也對動物認知與倫理議題引發深遠的討論,象徵著 AI 技術跨入生態與跨物種理解的新時代。

案例服務說明

        Google 與海洋生物研究機構合作開發之人工智慧應用專案,透過訓練大型語言模型(LLM)「DolphinGemma」,實現對野生海豚聲音的解碼與模擬,為人類與非人類物種間的語意溝通提供創新解決方案。

架構包含三大技術核心:

  • 資料收集與語料建置:

    整合野生海豚長期聲音與行為紀錄,包括求偶、攻擊、辨識哨聲等多類型音訊,並建立結構化標註語料庫。

  • 語言模型訓練與聲音預測:

    運用 Google Gemini 架構訓練約億參數之 DolphinGemma 模型,使其具備辨識、預測與重建海豚聲音序列的能力。

  • 人機互動裝置應用:

    結合水下裝置「CHATCetacean Hearing Augmentation Telemetry)」,實現海豚聲音的即時生成與觸發,建立與物品或行為連動的聲音輸出,作為跨物種互動的語言橋樑。

1DolphinGemma實現對野生海豚聲音的解碼與模擬,為人類與非人類物種間的語意溝通提供創新解決方案。

圖片來源:DolphinGemmahttps://blog.google/technology/ai/dolphingemma/

應用效益

    本案例展現出人工智慧在跨物種溝通領域的創新潛力,透過結合 DolphinGemma 語言模型與 CHAT 水下互動裝置,不僅加速了海洋生物聲音資料的解析效率,更為動物認知與語言學研究帶來突破性進展。AI 模型的導入使得海豚聲音與行為之間的關聯可被系統性分析,大幅減少過去仰賴人工聽辨與標註的繁複流程,提升研究精度與時效性。同時,本專案也驗證大型語言模型可應用於非人類語言資料的可行性,促進多模態 AI 訓練技術發展,並為其他高智能物種的語意解碼研究奠定基礎。除此之外,藉由模擬海豚溝通方式建立互動情境,有助於提升大眾對生物多樣性與動物行為的關注,可應用於科學教育、博物館展演與生態保育推廣。未來更可延伸至智慧養殖、動物照護與人道飼育等場域,提供人類與動物間更友善與有效的溝通介面。

FIND觀點從海豚對話看 AI 的跨域未來語言模型進軍生態科技的下一步

        在生成式 AI 技術百花齊放的當下,Google 所推出的「DolphinGemma」語言模型為我們揭示了人工智慧潛力的另一個應用-跨物種溝通。這不僅是科技上的突破,更可能重塑我們與自然世界的互動方式,從教育、科研到永續生態,全面帶動新型應用想像。

        從趨勢觀察,語言模型走出語言學,走入生物行為理解,DolphinGemma是一個專為海豚聲音模式所設計的語言模型,結合過去 40 年來的海豚聲音資料,與 Google 最新的 Gemini 技術,成功預測、模擬海豚的聲音邏輯結構。這不僅為動物語言學開創新局,也反映出語言模型正由人類語境轉向多元生態脈絡的可能。

        FIND 的角度來看,DolphinGemma 所展現的創新價值,將對以下三個面向產生深遠影響:

產業創新:未來語音 AI 不僅可應用於客服、醫療等場域,更可導入至智慧養殖、野生動物監控、生物溝通模擬等高專業領域,帶動「生態 AI 服務產業」萌芽。

學研轉譯:學術與產業的跨界合作明顯升溫,語音科學、動物行為學、AI 模型訓練三者整合,展現未來高值應用研究的實踐可能。

社會價值:透過 AI 模擬與動物溝通的想像,提升社會大眾對生物多樣性、永續發展的關注與教育推廣價值,有助於打造更具共感的科技倫理環境。

       臺灣具備強大 AI 技術人才與生技生態研究基礎,若能借鏡 DolphinGemma 案例,結合學研單位與新創企業,可開發屬於本土物種(如黑面琵鷺、台灣黑熊等)之聲音行為分析模型,建立智慧型野生監測系統,提供保育決策新工具,帶動具教育/觀光應用價值的沉浸式體驗平台(如動物語言博物館)。

        DolphinGemma 並非只是一次有趣的科技嘗試,而是 AI 產業價值走向多元、融合永續與人文思維的重要指標。未來若能從跨物種走向跨領域、跨產業連結,將成為下一波 AI 應用進化的強大引擎。

封面圖片來源:Google’s New AI Is Trying to Talk to Dolphins—Seriouslyhttps://gizmodo.com/googles-new-ai-is-trying-to-talk-to-dolphins-seriously-2000589467

參考資料來源:

  1. Google’s New AI Is Trying to Talk to Dolphins—Seriously

    https://gizmodo.com/googles-new-ai-is-trying-to-talk-to-dolphins-seriously-2000589467

  2. DolphinGemma: How Google AI is helping decode dolphin communication

    https://blog.google/technology/ai/dolphingemma

王仕凱

2025-06-09

分享: 0 瀏覽量: 309