人工智慧在醫學影像分析 (一)：人工智慧簡史

自2016年3月AlphaGo以四勝一敗的戰績大勝韓國職業九段棋士李世乭，隔年5月又在中國烏鎮圍棋峰會的三局比賽中擊敗當時世界排名第一的中國棋手柯潔，從此人們對於人工智慧的關注近乎瘋狂。追溯人工智慧的發展史(如圖1)，早在1956年8月由John McCarthy, Marvin Minsky, Claude Shannon和Nathan Rochester發起的達特矛斯會議(Dartmouth Summer Research Project on Artificial Intelligence)，在該會議上討論「人工智慧」，並最終確認「人工智慧」一詞做為本領域的名稱^[1]。若將1956年以前視為人工智慧的初生期，則1956年至1974年期間可以視為第一波發展期，當時的技術主要以二元邏輯為基礎，利用電腦來解決簡單的問題^{[2, 3]}。然而，由於硬體發展受限，電腦硬體低處理速度且資料儲存容量等問題，使得人工智慧發展遇到瓶頸。加上，1973年起美國和英國政府開始停止人工智慧研究的撥款，1974年至1980年成了人工智慧第一次低潮期^[4]。1980年後隨著專家系統的發展與投入產業應用，使得1980年至1987年成為人工智慧的第二波發展期。期間，日本政府在1981年投入第五代電腦的開發，而英國、美國企業也提供人工智慧和信息技術的資助。

然而，因為專家系統維護費用昂貴、升級困難、以及適用於特定情境等問題，加上1987年起人工智慧硬體市場需求下滑，以及80年末期美國戰略計算計畫(Strategic Computing Initiative)刪減人工智慧的計畫資助，使得在1987年至1993年再次進入低潮期^[4]。隨著硬體效能的提升和企業資金的投入，90年代末期人工智慧開始展現另一番成績。1997年IBM的深藍電腦(Deep Blue)戰勝西洋棋世界冠軍Garry Kimovich Kasparov；AT&T實驗室Yann Lecun等人於1998年發表LeNet 5架構來辨識手寫英文字和符號，該架構已包含現有深度學習(deep learning)中卷積類神經網路(convolutional neural network, CNN)和池化法(pooling)兩種運算。雖然在90年代至2010年間有不少的成果發表，然而類神經網路在影像辨識的效能仍不敵傳統機器學習，如：支持向量機(support vector machine)。圖一人工智慧發展時間線

資料來源：自行繪製

圖1　人工智慧發展時間線

從2010年人工智慧開始在影像辨識領域上大放異彩，主要的原因是ImageNet數據集的整理和相關影像辨識競賽提升技術的效能。史丹佛大學的李飛飛教授曾提及^[5]，過去學術圈執著於人工智慧演算法的研究，卻對於數據的整理並未關心，因此他和團隊開始著手製作數據集，2009年她在CVPR發表論文所使用的數據集命名為ImageNet^[6]。並且基於ImageNet的影像數據集，自2010年起每年舉辦The ImageNet Large Scale Visual Recognition Challenge (ILSVRC)^{[7, 8]}，針對參賽隊伍提出的方法進行效能評估(圖2所示)，第一屆ILSVRC冠軍作品的Top-5錯誤率為28.2%，仍高於人類辨認ImageNet數據集內圖片的錯誤率5.1%。2012年出現深度卷積神經網絡(deep convolutional neural network, DCNN)結構，由加拿大多倫多大學的Geoffrey Hinton、Ilya Sutskever和Alex Krizhevsky提出的AlexNet奪得冠軍，該方法的錯誤率為16.4%，比當時亞軍的錯誤率26.4%相差達到10%，並且比前一屆降低36.4%的錯誤率。從此研究人員開始熱衷於卷積神經網絡架構的設計，並以降低辨識錯誤率為目標。2013年ZFnet的錯誤率為11.2%；2014年GoogLeNet的錯誤率為6.7%，比前一屆大幅減少42.7%的的錯誤率；2015年ResNet的錯誤率為3.57%，更大幅減少46.7%的的錯誤率；2017年SeNet的錯誤率為2.3%。從2015年開始，人工智慧在影像辨識效能已超越人類，因此2017年舉辨最後一屆的ILSVRC。因此2010年起已成人工智慧的黃金期，尤其卷積類神經網絡已成為基於深度學習的辨識模型之基本架構。

圖二ILSVRC各屆冠軍的辨識錯誤率和前一屆比較錯誤的減少率

資料來源：自行繪製

圖2　ILSVRC各屆冠軍的辨識錯誤率和前一屆比較錯誤的減少率

此外，在電腦科學領域令人振奮的事件就是電腦協會(Association for Computing Machinery, ACM)宣布2018年圖靈獎(Turing Award)的獲獎人是Yoshua Bengio、Geoffrey Hinton、和Yann LeCun，三位學者在深度類神經網路的卓越貢獻得以獲此殊榮^[9]。2019年9月電機電子工程師學會(Institute of Electrical and Electronics Engineers)的影像處理國際研討會(International Conference on Image Processing, ICIP)於台北國際會議廳舉行，並且邀請LeCun教授進行專題演講，講題為「Self-Supervised Learning: the Future of Signal Understanding」，介紹深度學習相關技術與成果(如圖3所示)。

(a)LeCun教授專題演講的封面 (b)筆者(左)與LeCun教授(右)於IEEE ICIP 2019合影

資料來源：自行繪製

圖3　(a)LeCun教授專題演講的封面，(b)筆者(左)與LeCun教授(右)於IEEE ICIP 2019合影

參考文獻：

Wikipedia: Dartmouth workshop, https://en.wikipedia.org/wiki/Dartmouth_workshop
https://miro.medium.com/max/931/1*oAK2bgj9N_rrn_fhAe9Ouw.png
https://medium.com/@suipichen/人工智慧大歷史-ffe46a350543
Wikipedia: History of artificial intelligence, https://en.wikipedia.org/wiki/History_of_artificial_intelligence
https://kknews.cc/tech/xr8rxjr.html
Deng, W. Dong, R. Socher, L. J. Li, K. Li, Fei-Fei Li, “Imagenet: A large-scale hierarchical image database," 2009 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp.248-255, 2009.
http://www.image-net.org/challenges/LSVRC/
https://chtseng.wordpress.com/2017/11/20/ilsvrc-歷屆的深度學習模型/
https://awards.acm.org/about/2018-turing

#人工智慧#卷積神經網絡

財團法人資訊工業策進會_蒐集個人資料告知事項暨個人資料提供同意書

人工智慧在醫學影像分析 (一)：人工智慧簡史

專家群介紹

王志清

吳俊達

數位轉型

彭賢恩

消費市場行銷研究、產業分析、秘密客調查、問卷量表設計、數據分析

蔡政安

公司策略管理與執行力計畫輔導、創意管理與問題解決分析、企業導入設計思考、邏輯金三角系統化問題分析、新事業發展策略與商業模式設計、事業營運計劃書(BP)撰寫、淨零碳排ESG相關策略

鄭旭高

數位資產/虛擬資產/虛擬通貨等相關財務諮詢、稅務規劃、法務諮詢、風控諮詢、資安規劃、智能合約審計與投融資

財團法人資訊工業策進會_蒐集個人資料告知事項暨個人資料提供同意書

人工智慧在醫學影像分析 (一)：人工智慧簡史

專家群介紹

王志清

吳俊達

數位轉型

彭賢恩

消費市場行銷研究 、 產業分析 、 秘密客調查 、 問卷量表設計 、 數據分析

蔡政安

公司策略管理與執行力計畫輔導、創意管理與問題解決分析 、 企業導入設計思考 、 邏輯金三角系統化問題分析 、 新事業發展策略與商業模式設計 、 事業營運計劃書(BP)撰寫 、 淨零碳排ESG相關策略

鄭旭高

數位資產/虛擬資產/虛擬通貨等相關財務諮詢 、 稅務規劃 、 法務諮詢 、 風控諮詢 、 資安規劃 、 智能合約審計與投融資

消費市場行銷研究、產業分析、秘密客調查、問卷量表設計、數據分析

公司策略管理與執行力計畫輔導、創意管理與問題解決分析、企業導入設計思考、邏輯金三角系統化問題分析、新事業發展策略與商業模式設計、事業營運計劃書(BP)撰寫、淨零碳排ESG相關策略

數位資產/虛擬資產/虛擬通貨等相關財務諮詢、稅務規劃、法務諮詢、風控諮詢、資安規劃、智能合約審計與投融資