人工智慧在醫學影像分析 (一):人工智慧簡史


自2016年3月AlphaGo以四勝一敗的戰績大勝韓國職業九段棋士李世乭,隔年5月又在中國烏鎮圍棋峰會的三局比賽中擊敗當時世界排名第一的中國棋手柯潔,從此人們對於人工智慧的關注近乎瘋狂。追溯人工智慧的發展史(如圖1),早在1956年8月由John McCarthy, Marvin Minsky, Claude Shannon和Nathan Rochester發起的達特矛斯會議(Dartmouth Summer Research Project on Artificial Intelligence),在該會議上討論「人工智慧」,並最終確認「人工智慧」一詞做為本領域的名稱[1]。若將1956年以前視為人工智慧的初生期,則1956年至1974年期間可以視為第一波發展期,當時的技術主要以二元邏輯為基礎,利用電腦來解決簡單的問題[2, 3]。然而,由於硬體發展受限,電腦硬體低處理速度且資料儲存容量等問題,使得人工智慧發展遇到瓶頸。加上,1973年起美國和英國政府開始停止人工智慧研究的撥款,1974年至1980年成了人工智慧第一次低潮期[4]。1980年後隨著專家系統的發展與投入產業應用,使得1980年至1987年成為人工智慧的第二波發展期。期間,日本政府在1981年投入第五代電腦的開發,而英國、美國企業也提供人工智慧和信息技術的資助。

然而,因為專家系統維護費用昂貴、升級困難、以及適用於特定情境等問題,加上1987年起人工智慧硬體市場需求下滑,以及80年末期美國戰略計算計畫(Strategic Computing Initiative)刪減人工智慧的計畫資助,使得在1987年至1993年再次進入低潮期[4]。隨著硬體效能的提升和企業資金的投入,90年代末期人工智慧開始展現另一番成績。1997年IBM的深藍電腦(Deep Blue)戰勝西洋棋世界冠軍Garry Kimovich Kasparov;AT&T實驗室Yann Lecun等人於1998年發表LeNet 5架構來辨識手寫英文字和符號,該架構已包含現有深度學習(deep learning)中卷積類神經網路(convolutional neural network, CNN)和池化法(pooling)兩種運算。雖然在90年代至2010年間有不少的成果發表,然而類神經網路在影像辨識的效能仍不敵傳統機器學習,如:支持向量機(support vector machine)。圖一人工智慧發展時間線

                                       資料來源:自行繪製                                        

圖1 人工智慧發展時間線

從2010年人工智慧開始在影像辨識領域上大放異彩,主要的原因是ImageNet數據集的整理和相關影像辨識競賽提升技術的效能。史丹佛大學的李飛飛教授曾提及[5],過去學術圈執著於人工智慧演算法的研究,卻對於數據的整理並未關心,因此他和團隊開始著手製作數據集,2009年她在CVPR發表論文所使用的數據集命名為ImageNet[6]。並且基於ImageNet的影像數據集,自2010年起每年舉辦The ImageNet Large Scale Visual Recognition Challenge (ILSVRC) [7, 8],針對參賽隊伍提出的方法進行效能評估(圖2所示),第一屆ILSVRC冠軍作品的Top-5錯誤率為28.2%,仍高於人類辨認ImageNet數據集內圖片的錯誤率5.1%。2012年出現深度卷積神經網絡(deep convolutional neural network, DCNN)結構,由加拿大多倫多大學的Geoffrey Hinton、Ilya Sutskever和Alex Krizhevsky提出的AlexNet奪得冠軍,該方法的錯誤率為16.4%,比當時亞軍的錯誤率26.4%相差達到10%,並且比前一屆降低36.4%的錯誤率。從此研究人員開始熱衷於卷積神經網絡架構的設計,並以降低辨識錯誤率為目標。2013年ZFnet的錯誤率為11.2%;2014年GoogLeNet的錯誤率為6.7%,比前一屆大幅減少42.7%的的錯誤率;2015年ResNet的錯誤率為3.57%,更大幅減少46.7%的的錯誤率;2017年SeNet的錯誤率為2.3%。從2015年開始,人工智慧在影像辨識效能已超越人類,因此2017年舉辨最後一屆的ILSVRC。因此2010年起已成人工智慧的黃金期,尤其卷積類神經網絡已成為基於深度學習的辨識模型之基本架構。

圖二ILSVRC各屆冠軍的辨識錯誤率和前一屆比較錯誤的減少率

資料來源:自行繪製

圖2 ILSVRC各屆冠軍的辨識錯誤率和前一屆比較錯誤的減少率

此外,在電腦科學領域令人振奮的事件就是電腦協會(Association for Computing Machinery, ACM)宣布2018年圖靈獎(Turing Award)的獲獎人是Yoshua Bengio、Geoffrey Hinton、和Yann LeCun,三位學者在深度類神經網路的卓越貢獻得以獲此殊榮[9]。2019年9月電機電子工程師學會(Institute of Electrical and Electronics Engineers)的影像處理國際研討會(International Conference on Image Processing, ICIP)於台北國際會議廳舉行,並且邀請LeCun教授進行專題演講,講題為「Self-Supervised Learning: the Future of Signal Understanding」,介紹深度學習相關技術與成果(如圖3所示)。

         (a)LeCun教授專題演講的封面(b)筆者(左)與LeCun教授(右)於IEEE ICIP 2019合影

資料來源:自行繪製

圖3 (a)LeCun教授專題演講的封面,(b)筆者(左)與LeCun教授(右)於IEEE ICIP 2019合影

參考文獻:

  1. Wikipedia: Dartmouth workshop, https://en.wikipedia.org/wiki/Dartmouth_workshop
  2. https://miro.medium.com/max/931/1*oAK2bgj9N_rrn_fhAe9Ouw.png
  3. https://medium.com/@suipichen/人工智慧大歷史-ffe46a350543
  4. Wikipedia: History of artificial intelligence, https://en.wikipedia.org/wiki/History_of_artificial_intelligence
  5. https://kknews.cc/tech/xr8rxjr.html
  6. Deng, W. Dong, R. Socher, L. J. Li, K. Li, Fei-Fei Li, “Imagenet: A large-scale hierarchical image database," 2009 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.248-255, 2009.
  7. http://www.image-net.org/challenges/LSVRC/
  8. https://chtseng.wordpress.com/2017/11/20/ilsvrc-歷屆的深度學習模型/
  9. https://awards.acm.org/about/2018-turing