現今,乳房X光影像的電腦輔助偵測軟體(computer-aided detection, CADe)功能主要以偵測乳房病變,包括:腫塊(mass)和鈣化點(calcifications)。然而,由於軟體多為國外廠商開發,使用西方女性乳房影像訓練偵測模型,面對東方女性乳房緻密度高於西方女性乳房,使得軟體對於東方女性乳房影像容易發生判讀錯誤,尤其造成高假陽性(false positive)的誤判現象,因此,放射科醫師無意願使用軟體進行乳房影像閱片。另外,我國衛生福利部國民健康署(以下簡稱國健署)對於乳房X光攝影醫療機構資格審查有嚴格的規定[1],醫院和醫師對於篩檢出疑似陽性個案追蹤完成率需達到標準75%,若未達標準時國健署可以根據追蹤完成率進行當年度總補助篩檢金額酌予扣款。因此,放射科醫師進行閱片過程中除了找出乳房X光影像內病變,並且同時須評估該乳房病變嚴重程度,進而決定是否進行後續通報與追蹤。
醫師評估乳房病變嚴重程度是參考乳房成像報告與數據系統(Breast Imaging-Reporting and Data System,BI-RADS)內制定項目,該些項目包括:乳房病變的位置、種類、尺寸大小、距離、嚴重程度等。BI-RADS針對病變嚴重程度分成0至6級共有七種等級[2]:0級因拍攝問題造成影像無法判讀,需要請受檢者再次拍攝;1級是影像內無異常(negative)組織;2級是影像內出現良性(benign)異常組織;3級是影像內出現可能是良性(probably benign)異常組織;4級是影像內出現疑似(suspicious)惡性組織;5級是影像內出現高暗示性(highly suggestive)惡性組織;6級是經過切片檢驗(biopsy)確認為惡性組織。該評估方式除了對於乳房X光影像制定相關項目,亦對乳房超音波影像制定評估項目。醫師評估個案的BI-RADS程度時,主要是取決於最嚴重的病變。舉例來說,醫師檢測左側乳房組織中出現良性腫塊(屬於2級),同時亦偵測出右側乳房出現惡性鈣化(屬於4級),因此醫師最終判定該個案的嚴重程度為4級。BI-RADS分級具有困難性,醫師必須檢視單一個案的多張乳房影像,從影像中分析病變與周遭組織的變化,進而決定BI-RADS等級。
資策會數位所團隊參與經濟部「人工智慧產業關鍵技術拔尖計畫」,研發基於病變偵測模型產生的信賴分數建立BI-RADS二級分類技術,包括:綠燈級(原有BI-RADS 1、2)和紅燈級(原有BI-RADS 3、4、5),並且利用信賴分數對個案進行檢視順序的排列,以協助醫師加快乳房陽性個案的檢視。圖1為病變的BI-RADS二級分類之技術架構,首先輸入病變貼片通過DenseNet架構後產生特徵,經由全連結層(fully connected layer)、分類模型分析後輸出BI-RADS等級。從分類器內取得每張病變貼片的信賴分數(confidence score),使用閥值(threshold)來決定腫塊屬於紅燈級或綠燈級。當個案中偵測多個同類的病變時,估測每張病變貼片的信賴分數,並且以最大信賴分數當作最終信賴分數,同時也表示個案病變的嚴重程度。若個案未偵測出病變時,則信賴分數為0。
資料來源:本研究自行繪製
圖1病變的BI-RADS二級分類之技術架構
假設CSmass和CScal分別表示某個案的腫塊和鈣化的最終信賴分數,由於不同病變的信賴分數分布不同,因此透過下列公式計算調整信賴分數:
(1)
上式中CS’i和ωi分別表示第i種病變的調整信賴分數和權重,實驗中設定ωmass=1和ωcal=1.72。函數min(a, b)輸出a和b之間的最小數值。為了決定個案的BI-RADS二級分類,估測腫塊和鈣化的最佳閥值,分別為τ*mass和τ*cal,其公式定義如下:
(2)
(3)
(4)
上式中CS’ki表示第k個案的第i種病變的調整信賴分數,Gk為BI-RADS二級分類的實際類別,Gk=1代表紅燈級,Gk=0代表綠燈級。在公式(3)中,Φ(CS'mass, CS'cal)是由個案的兩種病變調整信賴分數判斷該個案的BI-RADS二級分類結果,函數Θ(X|Gk)則是判斷X是否與Gk相同,當X=Gk時輸出1值,否則輸出0值。另外,單一個案的腫塊和鈣化的最大信賴分數CS'max將用於乳房X光影像檢視順序的排列,即CS'max=max(CS’mass, CS’cal),以協助醫師加快檢測乳房陽性個案。
第一個實驗針對乳房X光影像進行BI-RADS二級分類。收集由K醫院提供的212個案的乳房X光影像做為模型訓練使用,利用公式(2)估測最佳閥值為τ*mass=0.504和τ*cal=0.465。然後,與M醫院合作取得531個案的乳房X光影像進行驗證,其中紅燈級有276個案(其中BI-RADS 3、4、5分別有84、103、和89個案),綠燈級有255個案(其中BI-RADS 1、2分別有135、和120個案)。為了比較本方法與現有方法的優劣,採用支持向量機(support vector machine,SVM)和自適應增強(Adaptive Boosting,AdaBoost)分別訓練BI-RADS二級分類模型,其效能如表1所列,本方法可達到準確度0.774,高於其他兩種方法。
表1 使用不同方法在個案BI-RADS二級分類的效能
資料來源:本研究自行繪製
第二個實驗針對個案兩種病變的最大信賴分數對個案進行排序,以評估可否加快乳房陽性個案篩檢的速率。圖2(a)為根據個案取得順序,使用紅、綠色表示個案的BI-RADS二級分類,其中276個紅燈級和255個綠燈級分布較為分散。圖2(b)為使用個案的最大信賴分數由大至小排序結果,很明顯地紅燈級個案(亦是陽性個案)優先排列在前。另外,圖3顯示分析檢視個案的紅燈級個案之累計數量對陽性個案總個數比率。在理想情況下,276個紅燈級個案優先出現於綠燈級個案,醫師檢視到第207個案達成75%陽性個案追蹤(圖3藍色線);在最差情況下,255個綠燈級個案優先出現於紅燈級個案,醫師必須檢視第462個案(圖3綠色線)。在未排序情況下需檢視至第395個案(圖3黑色線),而排序情況下僅需檢視262個案(圖3紅色線)。從表2中得知,利用最大信賴分數對個案排序,可以協助醫師提前33.67%個案總數量完成紅燈級個案的檢視。
本文內容部分節錄自『2020年國際醫學資訊聯合線上研討會』發表的論文「基於數位乳房X光影像運用深度學習實現乳房病變偵測與BI-RADS分類-應用於乳房陽性案例追蹤」[3]。
資料來源:本研究自行繪製
圖2使用紅、綠色表示個案的BI-RADS二級分類:(a)依據個案取得的順序排列,(b)依據個案的最大信賴分數由大至小排序結果,上方數字為個案的初始編號,下方數字為排序後編號
資料來源:本研究自行繪製
圖3不同情況下紅燈級個案檢視的總數量分布
表2 75%陽性個案追蹤條件,四種情況的個案檢視總數量與減少比率
資料來源:本研究自行繪製
參考文獻
王志清
區塊鏈應用落地 、 縱深防禦資安策略與管理(Build Security In 、 ISMS) 、 建置大型敏捷團隊(Scrum@Scale 、 Large-Scale Scrum) 、 企業數位賦能/轉型 、 先進研發架構規劃(DevOps 、 DevSecOps) 、 新事業發展策略與規劃(Lean Startup 、 Customer Development)
吳俊達
數位轉型
彭賢恩
消費市場行銷研究 、 產業分析 、 秘密客調查 、 問卷量表設計 、 數據分析
蔡政安
公司策略管理與執行力計畫輔導、創意管理與問題解決分析 、 企業導入設計思考 、 邏輯金三角系統化問題分析 、 新事業發展策略與商業模式設計 、 事業營運計劃書(BP)撰寫 、 淨零碳排ESG相關策略
鄭旭高
數位資產/虛擬資產/虛擬通貨等相關財務諮詢 、 稅務規劃 、 法務諮詢 、 風控諮詢 、 資安規劃 、 智能合約審計與投融資