寧麗潔 ,胡秋根(通訊作者)
(1.廣東醫(yī)科大學(xué),廣東 523808;2.廣東醫(yī)科大學(xué)順德婦女兒童醫(yī)院(佛山市順德區(qū)婦幼保健院)放射科,廣東 528300;3.南方醫(yī)科大學(xué)順德醫(yī)院 放射科,廣東 528300)
乳腺癌已成為全球最常見(jiàn)的惡性腫瘤[1],也是全球女性發(fā)病率和死亡率最高的惡性腫瘤,已嚴(yán)重危害女性的健康,在我國(guó)乳腺癌疾病發(fā)病率亦呈逐年上升趨勢(shì)[2]。乳腺癌可防可治,早期乳腺癌生存率極高,因此乳腺癌的早期診斷、早期治療,對(duì)患者的預(yù)后及生存時(shí)間有著重要影響。乳腺癌有多種影像學(xué)檢查方法,如乳腺超聲、乳腺X線攝影、乳腺磁共振等。乳腺X線攝影是目前女性乳腺癌篩查影像檢查中最常用的方法。隨著國(guó)家對(duì)乳腺癌篩查工作的大力推進(jìn)以及人們對(duì)乳腺健康意識(shí)的不斷提高,越來(lái)越多女性開(kāi)始關(guān)注乳腺X線攝影檢查。日常繁復(fù)的影像診斷和大量乳腺癌篩查人群,加重了影像醫(yī)生的工作負(fù)荷。因此,如何提高乳腺癌的檢出效率、準(zhǔn)確率,減少漏診率及誤診率,是目前影像醫(yī)學(xué)領(lǐng)域亟待解決的問(wèn)題之一。
隨著人工智能在醫(yī)學(xué)影像領(lǐng)域的快速發(fā)展,人工智能在乳腺X線攝影中也得到廣泛應(yīng)用?;诖斯P者就人工智能的發(fā)展及其在乳腺X線攝影方面的應(yīng)用進(jìn)行綜述。
人工智能(Artificial Intelligence,AI) 最先由 20世紀(jì) 50 年代 John McCarthy 等提出[4],是主要研究并開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué),主要包括機(jī)器學(xué)習(xí) (Machine Learning,ML)[6]和深度學(xué)習(xí)(Deep Learning,DL)[5]。 機(jī)器學(xué)習(xí)作為人工智能的一個(gè)核心分支,主要通過(guò)訓(xùn)練機(jī)器學(xué)習(xí)樣本數(shù)據(jù),并從中提取最佳特征,以對(duì)未知數(shù)據(jù)進(jìn)行模型的建立。最常用的算法包括人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、支持向量機(jī)(Support Vector Machine,SVM) 、隨機(jī)森林(Random Forest, RF) 、K-均值算法(K-Means)等。經(jīng)典ML按照訓(xùn)練方法分類,可以分為監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等3類[7]。深度學(xué)習(xí)作為ML的一個(gè)子集,也是目前最流行的研究方法,可自動(dòng)提取在大數(shù)據(jù)中有意義的特征[8],包括文本識(shí)別、數(shù)字圖像識(shí)別和目標(biāo)識(shí)別等3個(gè)階段的圖像識(shí)別發(fā)展。卷積神經(jīng)網(wǎng)絡(luò) (Convolutional Neural Network,CNN)作為深度學(xué)習(xí)中最成功的算法之一,其能在位于輸入信號(hào)中不同空間位置的相似特征里提取較高等級(jí)信息[9],使得CNN在處理視覺(jué)識(shí)別及語(yǔ)音識(shí)別等方面均獲得出巨大成功[10],尤其在視覺(jué)識(shí)別方面有較高的性能優(yōu)勢(shì),因此CNN在圖像處理方面的成就尤為突出。
20世紀(jì)60年代,計(jì)算機(jī)輔助診斷(Cumputer-Aided Diagnosis,CAD)系統(tǒng)已開(kāi)始在乳腺醫(yī)學(xué)影像領(lǐng)域應(yīng)用,也是AI技術(shù)在乳腺X線攝影中的最早應(yīng)用。CAD是一種通過(guò)使用計(jì)算機(jī)以及統(tǒng)計(jì)學(xué)等方法,對(duì)醫(yī)學(xué)影像圖像進(jìn)行處理與分析,提取其特征并對(duì)可疑病變位置進(jìn)行標(biāo)注、對(duì)檢出的病灶進(jìn)行分類的AI技術(shù)[11]。傳統(tǒng)的CAD系統(tǒng)機(jī)器學(xué)習(xí)算法使用的是監(jiān)督學(xué)習(xí)(supervised learning),即通過(guò)使用人工對(duì)目標(biāo)任務(wù)的特征進(jìn)行訓(xùn)練,使其達(dá)到所要求的性能[12]。隨著AI技術(shù)的不斷發(fā)展以及乳腺X線檢查人數(shù)的劇增,傳統(tǒng)CAD對(duì)病灶的評(píng)估時(shí)間長(zhǎng)、系統(tǒng)性能不穩(wěn)定、假陽(yáng)性率高、敏感性較低等缺點(diǎn)也愈發(fā)凸顯。深度學(xué)習(xí)使用非監(jiān)督學(xué)習(xí)(Unsupervised learning),能自動(dòng)提取有意義的特征,突破了手工設(shè)計(jì)特征的局限性[13]。與傳統(tǒng)CAD不同點(diǎn)在于,基于深度學(xué)習(xí)算法的CAD系統(tǒng)使用的方法是對(duì)模型的構(gòu)建以及對(duì)影像樣本數(shù)據(jù)的訓(xùn)練,從而使CAD模型具有更高的敏感度和準(zhǔn)確率[14]。
基于深度學(xué)習(xí)算法的乳腺CAD系統(tǒng)的各種性能指標(biāo)相較于傳統(tǒng)CAD均有明顯提高,使得AI技術(shù)在醫(yī)學(xué)影像方面的應(yīng)用尤其是在乳腺X線攝影中的應(yīng)用更加廣泛。
乳腺癌病因尚未明確,目前仍以二級(jí)預(yù)防為主。通過(guò)實(shí)施有效、便捷的影像學(xué)檢查,對(duì)乳腺癌進(jìn)行篩查,以期達(dá)到早發(fā)現(xiàn)、早診斷和早治療,降低乳腺癌死亡率的目的。乳腺X線攝影是乳腺癌篩查檢查中最常用的方法。由于影像醫(yī)生工作量大,且醫(yī)師的閱片狀態(tài)受經(jīng)驗(yàn)、水平等多方因素干擾,因此難以統(tǒng)一乳腺X線診斷的準(zhǔn)確性及診斷效率。
Rodriguez 等(2019)[15]研究顯示,AI 可以減少乳腺癌篩查放射科醫(yī)師的閱片工作量,當(dāng)使用5分作為閾值時(shí)(>5分為存在乳腺癌高可能性),可以將放射科醫(yī)師的閱片工作量減少約一半(-47%),同時(shí)排除了 7%的真陽(yáng)性病人。Martín 等(2022)[16]評(píng)估了15 998名女性 15 999次數(shù)字乳腺X線攝影檢查(DM),結(jié)果顯示,AI在 DM 中的 AUC 為 0.93(95%CI:0.89-0.96)。對(duì)于 DM,AI的非劣效敏感度與 1位影像醫(yī)生評(píng)估 (58.4%;66/113 例;95%CI:49.2-67.1)或 2位影像醫(yī)生評(píng)估(67.3%;76/113 例;95%CI:58.2-75.2)分別比較,其降低召回率高達(dá) 2%(95%CI:-2.4--1.6)(P<0.001),與人工評(píng)估相比,AI在DM中的召回率較低。此外,研究顯示,在乳腺X線攝影的乳腺篩查中,應(yīng)用AI可以減輕放射科醫(yī)生的工作量,AI可以替代放射科醫(yī)生在乳腺篩查中的評(píng)估,同時(shí)保障乳腺篩查質(zhì)量。 Larsen等(2022)[17]對(duì)乳腺X線篩查結(jié)果進(jìn)行人工智能評(píng)估。該研究為多中心研究,共納入2009年至2018年的47 877名女性患者,共完成122 969次乳腺篩查。結(jié)果顯示,在不同閾值條件下,AI系統(tǒng)在乳腺癌檢測(cè)中整體性能均較穩(wěn)定,其中AI系統(tǒng)未能檢出的篩查癌比例均低于20%。另有文獻(xiàn)[18]報(bào)道,在乳腺癌篩查中,通過(guò)使用AI系統(tǒng),可有效降低乳腺癌篩查中間期癌的發(fā)生率。此外,基于深度學(xué)習(xí)的AI系統(tǒng)在乳腺癌篩查中[18-19],結(jié)果顯示與經(jīng)驗(yàn)豐富的放射科醫(yī)師的診斷水平相當(dāng)。由此可見(jiàn),AI系統(tǒng)可以作為乳腺癌篩查的有效輔助診斷工具,提高放射醫(yī)師的工作效率。AI系統(tǒng)提供的診斷結(jié)論準(zhǔn)確率可靠,可供放射醫(yī)生參考,在保障篩查質(zhì)量的同時(shí),更讓廣大女性乳腺癌篩查人群獲益。
鈣化、腫塊、結(jié)構(gòu)扭曲以及不對(duì)稱致密影是乳腺疾病的四大主要征象[20]。在乳腺X線檢查中,乳腺CAD系統(tǒng)對(duì)腫塊和鈣化的特征識(shí)別能力較敏感,但是對(duì)結(jié)構(gòu)扭曲和不對(duì)稱致密影相對(duì)研究較少[21]。在乳腺X線攝影中,乳腺癌最常見(jiàn)的主要征象是腫塊,但是影像醫(yī)生對(duì)腫塊的判斷具有較強(qiáng)的主觀性。此外,由于中國(guó)女性的乳腺腺體普遍較致密,高密度腺體組織容易對(duì)部分微小病灶遮擋而顯示不清,容易造成漏診誤診等情況?;诖罅坑?xùn)練的乳腺CAD系統(tǒng),可以根據(jù)圖像中的信息特征識(shí)別出病灶中更細(xì)微且人眼難以識(shí)別的特征,更好地幫助影像醫(yī)師提高病灶的檢出率。因此,乳腺CAD系統(tǒng)相較于人工對(duì)腫塊的檢出及分類更加客觀且性能穩(wěn)定。張興梅等(2019)[22]研究結(jié)果顯示,基于 DL 的乳腺X線檢測(cè)系統(tǒng)對(duì)腫塊的檢出有較好的穩(wěn)定性,可以輔助影像醫(yī)師對(duì)BI-RADS3類和4類腫塊的檢出率提升10.07%(30/298)以上。同時(shí)AI有助于減少不同腺體分類對(duì)腫塊檢出的影響,尤其對(duì)于較為致密腺體腫塊的檢出,AI輔助診斷具有重要的臨床價(jià)值。
在乳腺X線攝影中,乳腺癌的早期表現(xiàn)可以是微小鈣化,它是乳腺癌的主要危險(xiǎn)征象,甚至常常是乳腺癌唯一征象。 王小琦等(2019)[23]通過(guò)使用DL系統(tǒng)與2名低年資醫(yī)師分別對(duì)274例可疑鈣化進(jìn)行對(duì)比分析,發(fā)現(xiàn)DL系統(tǒng)僅漏診1例密度較低的呈團(tuán)簇狀分布的無(wú)定形鈣化,DL系統(tǒng)對(duì)于可疑鈣化的檢出率顯著高于2名低年資醫(yī)師。由于影像醫(yī)師受視覺(jué)疲勞、注意力下降等主觀因素影響,以及對(duì)于密度較低的無(wú)定形鈣化和線樣分布、直徑較小的團(tuán)簇樣鈣化敏感度均較低,因而漏檢相對(duì)更多。相較而言,DL系統(tǒng)對(duì)可疑鈣化灶的檢出不受腺體類型以及鈣化形態(tài)及分布的影響,對(duì)可疑鈣化檢出的敏感度與穩(wěn)定性均較高。因此,DL系統(tǒng)可作為輔助,有效提升影像醫(yī)師對(duì)可疑鈣化的檢出率。
但是對(duì)于不同的乳腺病灶類型,AI的檢出率也有明顯的對(duì)比差異。 宋張駿等(2019)[24]研究結(jié)果顯示,基于深度學(xué)習(xí)技術(shù)的MammoWorks TM乳腺健康智能檢測(cè)系統(tǒng)對(duì)腫塊、鈣化灶、腫塊伴鈣化灶、腺體結(jié)構(gòu)扭曲等的檢出也有明顯差異。其中,腫塊命中 67.7%( 136/201),鈣化灶命中 80.5% (33/41);腫塊伴鈣化命中82.3%(153/186);腺體結(jié)構(gòu)扭曲命中55.0% (11/20)。對(duì)于不同腺體分類的乳腺病灶的檢出也不盡相同,脂肪型乳腺命中 65.5%(36/55);少量腺體型命中 69.1%(94/136);多量腺體型命中75.6% (68/90);致密型命中 80.8%(135/167)。 研究結(jié)果顯示,伴有鈣化灶的疾病更容易被AI檢測(cè)系統(tǒng)識(shí)別檢出。另外,乳腺腺體密度高的分組命中率高,表明AI檢測(cè)系統(tǒng)能有效輔助致密型腺體病灶的檢出,可以降低影像醫(yī)師對(duì)致密型腺體病灶的漏診率。
劉寶治和李東波(2019)[25]研究采用深度學(xué)習(xí)人工智能領(lǐng)域快速R-CNN算法,對(duì)腺體結(jié)構(gòu)進(jìn)行分型,對(duì)全病灶檢出,進(jìn)而對(duì)病灶的全屬性進(jìn)行分析,再參考ACR BI-RADS 5th Edition進(jìn)行評(píng)估分類,自動(dòng)生成結(jié)構(gòu)化報(bào)告,給出影像學(xué)建議。但是由于AI對(duì)異常密度的敏感性較高,導(dǎo)致其分級(jí)較人工標(biāo)注的分級(jí)結(jié)果偏高。盡管如此,AI對(duì)有效提高影像醫(yī)師的診斷效率仍有著重要臨床意義。
對(duì)于乳腺X線檢查而言,致密的乳腺已被認(rèn)定為乳腺癌的主要危險(xiǎn)因素,且是獨(dú)立的危險(xiǎn)因素,患乳腺癌的風(fēng)險(xiǎn)與腺體致密程度呈正比,即女性患乳腺癌的風(fēng)險(xiǎn)隨著乳腺密度的致密程度增加而升高。在乳腺X線攝影中,致密的腺體組織容易對(duì)可疑病灶造成遮擋,致使影像科醫(yī)師對(duì)腺體致密的患者給出假陰性的判定,因而容易造成對(duì)致密腺體病灶的漏診。
深度學(xué)習(xí)算法不但能根據(jù)乳腺X線檢查顯示的乳腺密度程度進(jìn)行風(fēng)險(xiǎn)預(yù)估,而且還能根據(jù)乳腺X線檢查中具有預(yù)測(cè)風(fēng)險(xiǎn)的成像特征及臨床風(fēng)險(xiǎn)因素,預(yù)測(cè)患者患乳腺癌的風(fēng)險(xiǎn)[21]。Qiu 等(2016)[26]研究顯示,使用深度學(xué)習(xí)的風(fēng)險(xiǎn)預(yù)測(cè)模型對(duì)乳腺癌進(jìn)行早期預(yù)測(cè),其準(zhǔn)確率達(dá)到 71.4%。Mohamed等(2018)[27]對(duì)1 427名女性乳腺X線攝影圖像進(jìn)行回顧性分析,利用構(gòu)建的CNN模型對(duì)纖維腺體型及不均勻致密型乳腺進(jìn)行自動(dòng)分類,其ROC曲線下面積( Area Under Curve,AUC)值為 0.942 1。由此可見(jiàn),使用預(yù)測(cè)風(fēng)險(xiǎn)模型不僅能提高篩查者警惕性,實(shí)現(xiàn)對(duì)乳腺癌早診斷早治療,同時(shí)還可避免影像醫(yī)師的主觀性,從而更好地預(yù)測(cè)患者患乳腺癌的風(fēng)險(xiǎn)。
乳腺癌在分子水平上具有高度的異質(zhì)性,不同分子分型的乳腺癌其治療方式及預(yù)后也不盡相同[28]。 馬夢(mèng)偉等(2020)[29]對(duì) 200 例浸潤(rùn)性乳癌,通過(guò)建立隨機(jī)森林(RF)、極端梯度提升(XGBoost)、邏輯回歸(kLR)及支持向量機(jī)(SVC)模型等4種機(jī)器學(xué)習(xí)模型,分別對(duì)不同分子分型乳腺癌的效能進(jìn)行預(yù)測(cè)。結(jié)果顯示,對(duì)于判斷Luminal型與非Luminal型的乳腺癌,RF模型的AUC值最大(AUC=0.70,P<0.O5),而且在4種機(jī)器學(xué)習(xí)模型中,RF模型對(duì)不同分子分型乳腺癌的預(yù)測(cè)效能較好。因此,術(shù)前通過(guò)影像學(xué)檢查并結(jié)合人工智能,可以對(duì)乳腺癌快速、無(wú)創(chuàng)精準(zhǔn)判斷分子分型,對(duì)臨床診斷及制定個(gè)性化的治療方案產(chǎn)生重要影響。
人工智能在乳腺X線攝影中的應(yīng)用有明顯的優(yōu)勢(shì),如可以減少乳腺癌篩查放射科醫(yī)師的閱片工作量,有效輔助致密型腺體病灶的檢出,對(duì)乳腺癌早期預(yù)測(cè)準(zhǔn)確率較高,術(shù)前可以對(duì)乳腺癌快速、無(wú)創(chuàng)判斷分子分型等等。雖然人工智能在乳腺X線攝影方面有諸多優(yōu)勢(shì),但是目前還存在很多挑戰(zhàn),如對(duì)于腺體結(jié)構(gòu)扭曲和不對(duì)稱致密影的檢出率較低,AI分級(jí)較人工標(biāo)注的分級(jí)結(jié)果偏高,判斷乳腺癌分子分型的準(zhǔn)確率有待提高等。
目前,如腺體結(jié)構(gòu)扭曲和不對(duì)稱致密影等樣本數(shù)據(jù)仍較小,且缺乏標(biāo)準(zhǔn)化。未來(lái),AI在乳腺X線攝影中應(yīng)建立標(biāo)準(zhǔn)化大數(shù)據(jù)集,同時(shí)注重其他信息(如患者既往檢查資料及病史資料)的整合,以不斷提高AI診斷性能。隨著人工智能技術(shù)不斷發(fā)展進(jìn)步,今后大樣本數(shù)據(jù)質(zhì)量的不斷提高以及多模態(tài)影像數(shù)據(jù)的整合,AI技術(shù)在乳腺X線攝影方面將發(fā)揮更大作用,創(chuàng)造更高的社會(huì)價(jià)值。