AI資料標註量大幅成長,形成新興產業鏈

post image

在大數據(Big data、巨量資料)累積到足夠的數量和容量,且網路頻寬和電腦運算效能同步充分的條件下,就激起了生成式人工智慧(Generative AI)的火花,使得AI成為劃時代的新革命;而AI資料集(Dataset)的「資料標註(Data labeling)」成為了讓AI懂得挑選和鑑別正確資訊的基礎,並藉由密集不斷的重複訓練下,藉由標註正確的資料,讓AI每次挑選的答案愈來愈接近當初期望的正確結果;AI資料標註也因為AI發展的大趨勢而受惠,而成為有前景的AI新興產業鏈的一環。

【趨勢發展背景】

早期的資料標註是一個勞力密集的產業,需要動用大批人力來篩選並標註「正確資訊」,作為AI資料集的訓練素材;另外,隨著資料來源推陳出新、日新月異,AI資料集同樣得與時俱進、跟得上時代,仍需要借助人工篩選和訓練機制去蕪存菁,確保資料的新鮮度和正確性。

近期隨著生成式AI的蓬勃發展,AI資料及仍面臨著某種情況下會胡言亂語、答非所問的「幻覺(Hallucination)」現象,使得AI資料標註再次被重視,甚至發展成新興產業,藉由將資料重新分類整理、糾正錯誤和過時資訊,並藉由再次密集重複訓練,來減少AI誤判導致產生幻覺的機率,以免對使用者發出誤導性訊息。

【產業趨勢說明】

根據財星雜誌和路透社報導,以AI資料標註為主要業務的美國業者Scale AI,藉由輝達、亞馬遜、Meta控股、英特爾、AMD等科技巨頭挹注資本,於2024年5月累積達市值140億美元。Scale AI早期為ChatGPT提供資料標註服務,成為後來ChatGPT發揮關鍵效用的助力之一;Scale AI為政府和民間企業提供資料標註的服務,政府部門如白宮、美國國防部、聯邦政府其他機構,民間客戶則包含微軟、OpenAI、摩根士丹利等知名企業。

另根據富比世雜誌 引述市調機構Grand View Research 指出,AI資料標註和蒐集的全球市值,若以2024年的38億美元為基準,預估在2025年成長到48.9億美元、2023年成長到171億美元,複合年均成長率(CAGR)為28.4%。富比世雜誌在同樣報導接著指出,AI資料標註未來也能應用在自駕車所需要的光學雷達(LiDAR)技術中,讓自駕車的感測器能正確辨識標註過的物件,並提升測距精準度,讓自駕車比以往更聰明,為駕駛員分憂解勞、加強駕駛員專注力並減少事故機率。

圖1:資料標註暨蒐集在2025~2030成長率預測 (from Grand View Research)

資料來源:Grand View Research, 2024

 【未來展望/挑戰】

隨著AI學習能力的不斷進化,AI資料標註將從傳統人工作業改良為自動生成,就像Hashtag那樣;另外,AI資料集之間也會相互比較,例如「生成對抗網路(Generative adversarial network, GAN)」,藉由相互競爭、相互比較來找出對方的缺點,達成將資料集去蕪存菁的功效。

資料標註也能激起不同資料集和演算法之間的火花,藉由評斷資料標註後的結果正確性,來選擇最理想的資料集和演算法,並且能隨著資料量和運算能力的不斷成長,令資料標註的正確性能連帶提升,並運用在AI相關的日常生活運用情境(如自駕車、機器人、行動裝置、3C產品等)。

封面圖片來源:ChatGPT生成

參考資料來源:

  1. Goldman, S. (2024, May 21). Exclusive: Scale AI secures $1B funding at $14B valuation as its CEO predicts big revenue growth and profitability by year-end. Retrieved from Fortune: https://fortune.com/2024/05/21/scale-ai-funding-valuation-ceo-alexandr-wang-profitability/
  2. Grand View Research. (2024, November). Data Collection And Labeling Market To Reach $17.10 Billion By 2030. Retrieved from Grand View Research: https://www.grandviewresearch.com/press-release/global-data-collection-labeling-market
  3. Koverko, T. (2024, June 17). The Future Of Data Labeling: Bridging Gaps In AI's Supply Chain. Retrieved from Forbes: https://www.forbes.com/councils/forbestechcouncil/2024/06/17/the-future-of-data-labeling-bridging-gaps-in-ais-supply-chain/
  4. Saini, M. (2024, May 21). Scale AI valued at $14 bln in Nvidia, Amazon-backed funding round. (T. Zahid, Editor) Retrieved from Reuters: https://www.reuters.com/technology/ai-startup-scale-ai-raises-1-billion-fresh-funding-2024-05-21/

李啟榮

2025-02-12

分享: 0 瀏覽量: 144