沈曉涵,杜祥
2019年8月29日,世界人工智能大會(huì)在上海開幕,人工智能(artificial intelligence,AI)再次成為關(guān)注焦點(diǎn),新一代AI正在深刻地改變各個(gè)領(lǐng)域,醫(yī)學(xué)是主要領(lǐng)域之一。醫(yī)學(xué)圖像包括X線圖像、CT圖像、眼底鏡圖像、病理圖像等,醫(yī)學(xué)成像作為常用的醫(yī)療輔助檢查手段,在疾病診療中起著重要作用[1]。病理診斷常被視為診斷的“金標(biāo)準(zhǔn)”或“最終診斷”,在臨床診斷中尤為關(guān)鍵[2]。然而,長時(shí)間的人工閱片常導(dǎo)致診斷準(zhǔn)確率下降,且病理醫(yī)師的診斷具有一定主觀性,由于疲勞閱片及主觀差異性等因素勢(shì)必會(huì)帶來一定的誤診率,從而導(dǎo)致誤治[3-4]。全切片數(shù)字化掃描技術(shù)(whole slide imaging,WSI)的出現(xiàn),掀起了一股用計(jì)算機(jī)進(jìn)行病理切片圖像自動(dòng)閱片的浪潮。然而,染色密度、切片平整度以及組織固定等問題均會(huì)對(duì)病理切片的質(zhì)量產(chǎn)生影響。此外,在圖像采集過程中,圖像壓縮時(shí)變形、噪聲的出現(xiàn)以及切片掃描儀自身的特性,都將影響圖像的質(zhì)量[2,5]。這些因素為AI算法的應(yīng)用帶來了挑戰(zhàn)和契機(jī),也是目前重點(diǎn)關(guān)注的問題和研究方向。
圖像識(shí)別有多種常用方法,如貝葉斯分類法、模板匹配法等,這些方法在處理圖像時(shí)均有一定局限性。而深度學(xué)習(xí)算法使復(fù)雜的特征提取簡(jiǎn)單化、抽象化,具有高速、省時(shí)及高識(shí)別率的優(yōu)點(diǎn),為準(zhǔn)確高效的圖像識(shí)別帶來了新契機(jī)[6-7]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)的研究及其在醫(yī)學(xué)診斷中的應(yīng)用,是將其應(yīng)用于醫(yī)學(xué)圖像識(shí)別中,通過深度學(xué)習(xí)的方式自動(dòng)識(shí)別圖像[8-9]。CNN具有較強(qiáng)的魯棒性(即系統(tǒng)的健壯性,是指控制系統(tǒng)在一定的參數(shù)攝動(dòng)下,維持某些性能的特性,反映了在異常和危險(xiǎn)情況下系統(tǒng)生存的能力)、記憶、自學(xué)習(xí)等能力,在圖像識(shí)別中準(zhǔn)確度較高,因此可為臨床醫(yī)生提供更為客觀的診斷結(jié)果,具有廣泛的應(yīng)用前景。目前CNN作為深度學(xué)習(xí)算法的代表之一,因其結(jié)構(gòu)較為簡(jiǎn)單且適用性較強(qiáng),廣泛應(yīng)用于醫(yī)學(xué)圖像處理和模式識(shí)別中,特別是影像學(xué)與病理學(xué)[1,10-11]。
CNN 是一種層次網(wǎng)絡(luò)結(jié)構(gòu),由輸入層、卷積層、激活函數(shù)層、池化層、全連接層及輸出等部 分組成[12-13]。原始數(shù)據(jù)經(jīng)卷積、激活函數(shù)及池化等層層操作,最終剝離出高層語義概念,即前饋運(yùn)算。通過誤差函數(shù)計(jì)算真實(shí)值和輸出 值之間的誤差值,反向逐層反饋并更新每層參數(shù),即反饋運(yùn)算。通過前饋與反饋運(yùn)算,最終實(shí)現(xiàn)訓(xùn)練目的。CNN在 圖像識(shí)別及準(zhǔn)確率方面均有較大優(yōu)勢(shì),但 仍有多方面不足,例如,減少參數(shù)量的同時(shí)如何提高運(yùn)算效率、在訓(xùn)練CNN模型的過程中如何選擇合適的卷積核大小以及如 何設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)等,都是 CNN 發(fā)展過程中亟需解決的問題[14]。
CNN是一種基于完全監(jiān)督的深度學(xué)習(xí)模型,要求樣本類標(biāo)完整。而在現(xiàn)實(shí)問題中,類標(biāo)信息往往是弱監(jiān)督的。弱監(jiān)督學(xué)習(xí)是一個(gè)總括性術(shù)語,包括了通過較弱的監(jiān)督來構(gòu)建預(yù)測(cè)模型的各種研究。弱監(jiān)督主要分為三種類型:不完全監(jiān)督,即只有訓(xùn)練數(shù)據(jù)集的一個(gè)子集有標(biāo)簽,其余數(shù)據(jù)無標(biāo)簽;不確切監(jiān)督,即只有粗粒度的標(biāo)簽;不準(zhǔn)確監(jiān)督,即給定的標(biāo)簽并非總是真值,通常由于標(biāo)注者主觀因素或圖像本身難以分類[15]。解決弱監(jiān)督樣本集的訓(xùn)練問題,一直都是深度學(xué)習(xí)的研究重點(diǎn),并形成了系統(tǒng)的理論架構(gòu),其一是多示例學(xué)習(xí)[16-18]。多示例學(xué)習(xí)是指將樣本集看作一個(gè)含若干包的集合,每個(gè)包中均含有若干數(shù)量的示例(即樣本特征)。當(dāng)且僅當(dāng)一個(gè)包中至少有一個(gè)示例為正時(shí)為正包,反之則為負(fù)包。訓(xùn)練集中包的標(biāo)記已知而示例的標(biāo)記未知,目的則是在示例標(biāo)記未知情況下預(yù)測(cè)包的標(biāo)記。多示例學(xué)習(xí)是從關(guān)注對(duì)示例類標(biāo)的預(yù)測(cè)轉(zhuǎn)為關(guān)注包類標(biāo)的預(yù)測(cè),而非直接對(duì)每個(gè)示例樣本進(jìn)行預(yù)測(cè)。如將學(xué)習(xí)得到的深度特征與多示例學(xué)習(xí)算法結(jié)合,可解決弱監(jiān)督學(xué)習(xí)下的圖像分類問題,從而提高算法性能[18]。目前的AI輔助病理診斷主要基于完全監(jiān)督學(xué)習(xí),需要大量的人工標(biāo)注,并由具備長期經(jīng)驗(yàn)的病理專家完成。染色濃度、成像模式及病理切片制作過程中人為操作等問題嚴(yán)重影響病理圖像的質(zhì)量,以及手動(dòng)標(biāo)注過程中病理圖像的數(shù)量限制,使AI輔助病理診斷成為當(dāng)前臨床診療AI研究領(lǐng)域的較大難題。因此,若能采用弱監(jiān)督學(xué)習(xí)的方式來構(gòu)建AI診斷模型,將極大提高病理專家的診斷效率,減少時(shí)間及人力成本。
人工智能輔助細(xì)胞學(xué)篩查最初應(yīng)用于宮頸癌細(xì)胞的辨認(rèn)和分割。Song等[19]提出了基于超像素和CNN的分割方法用于宮頸癌的細(xì)胞學(xué)篩查,結(jié)果顯示檢測(cè)其精度達(dá)94.5%,為宮頸癌細(xì)胞的辨認(rèn)奠定了AI應(yīng)用基礎(chǔ)。Al-batah等[20]提出一種多重適應(yīng)神經(jīng)模糊推理系統(tǒng)的模型,能將宮頸細(xì)胞圖像分為正常、低級(jí)別鱗狀上皮內(nèi)瘤變(low-grade squamous intraepithelial lesion,LSIL)和高級(jí)別鱗狀上皮內(nèi)瘤變(high-grade squamous intraepithelial lesion,HSIL)三組,結(jié)果顯示判讀LSIL的準(zhǔn)確度為92.6%,HSIL為93.7%,正常細(xì)胞為97.3%。目前,AI輔助宮頸癌細(xì)胞學(xué)篩查為臨床病理診斷中最有前景的應(yīng)用領(lǐng)域[21]。
近期,MSKCC計(jì)算機(jī)病理實(shí)驗(yàn)室THOMAS FUCHS團(tuán)隊(duì)公布了一項(xiàng)基于15 000例癌癥患者的4萬余張數(shù)字化病理切片的新AI系統(tǒng),結(jié)果顯示,前列腺癌、基底細(xì)胞癌和腋窩淋巴結(jié)轉(zhuǎn)移乳腺癌的測(cè)試曲線下面積(area under the receiver operating characteristic curve,AUC)分別為0.991、0.988和0.966[22]。該系統(tǒng)為首個(gè)臨床級(jí)別的AI系統(tǒng),訓(xùn)練過程中使用的數(shù)據(jù)均來自常規(guī)病理報(bào)告,以多示例學(xué)習(xí)結(jié)合遞歸神經(jīng)網(wǎng)絡(luò)的弱監(jiān)督學(xué)習(xí)方式在數(shù)據(jù)集中進(jìn)行訓(xùn)練。該研究納入了三個(gè)數(shù)據(jù)集,包括來自44個(gè)國家和地區(qū)的15 187例癌癥患者的44 732張病理切片圖像,其中24 859張前列腺癌、9 962張基底細(xì)胞癌、9 894張淋巴結(jié)轉(zhuǎn)移乳腺癌切片圖像,比以往研究中的數(shù)據(jù)集大一個(gè)數(shù)量級(jí)以上,因而對(duì)腫瘤病理多樣的組織學(xué)形態(tài)有更高的識(shí)別度。研究同時(shí)納入了具有常見技術(shù)問題的切片,如氣泡、固定不佳、組織不平整、數(shù)字圖像模糊等。據(jù)研究者估計(jì),若該系統(tǒng)投入臨床使用,在保證100%敏感度的條件下,能夠減少病理醫(yī)師65%~75%的讀片工作。該項(xiàng)研究還對(duì)來自MSKCC以外醫(yī)療機(jī)構(gòu)提供的12 000張切片數(shù)據(jù)進(jìn)行了驗(yàn)證,最終結(jié)果AUC下降5.84%,下降的誤差主要由于新數(shù)據(jù)的特異性、敏感度無顯著差異。此外,研究者還將該模型和基于完全監(jiān)督學(xué)習(xí)的AI模型進(jìn)行對(duì)比,對(duì)兩者的數(shù)據(jù)集進(jìn)行交叉訓(xùn)練后顯示,新AI模型具有較好的性能。由此可見,與精細(xì)的人工標(biāo)注相比,數(shù)據(jù)量大更具有意義。
目前關(guān)于針對(duì)不同腫瘤的AI競(jìng)賽中,乳腺癌幾乎成為競(jìng)賽熱點(diǎn),為AI在病理圖像識(shí)別領(lǐng)域的應(yīng)用做了很好的示范和推廣。例如,2016年由電氣和電子工程師協(xié)會(huì)(Institute of Electrical and Electronics Engineers,IEEE)下屬的國際生物醫(yī)學(xué)成像研討會(huì)(International Symposium on Biomedical Imaging,ISBI)舉辦了癌癥淋巴結(jié)轉(zhuǎn)移檢測(cè)競(jìng)賽(Cancer Metastases in Lymph Nodes Challenge 2016,CAMELYON16)[23],針對(duì)常規(guī)HE染色的數(shù)字掃描切片,在無時(shí)間限制條件下,部分計(jì)算機(jī)學(xué)習(xí)結(jié)果與病理學(xué)專家診斷結(jié)果無明顯差異,而在有時(shí)間限制條件下,部分計(jì)算機(jī)學(xué)習(xí)結(jié)果明顯優(yōu)于病理學(xué)專家的平均水平。此外,Cruz-Roa等[24]采用了CNN檢測(cè)整張病理切片圖像上浸潤性導(dǎo)管癌的存在,與手動(dòng)標(biāo)注的浸潤性導(dǎo)管癌區(qū)域相比,陽性預(yù)測(cè)值為71.62%,陰性預(yù)測(cè)值為96.77%?;贏I的圖像分析因其較高的準(zhǔn)確性和工作效率,引起了病理界的廣泛關(guān)注,進(jìn)一步推動(dòng)了AI在病理診斷領(lǐng)域的深入研究[25]。
免疫組織化學(xué)(immunohistochemistry,IHC)是利用抗原和抗體特異性結(jié)合的原理對(duì)病理標(biāo)本進(jìn)行切片、染色,使標(biāo)記抗體的顯色劑顯色,從而確定細(xì)胞內(nèi)的抗原,對(duì)其進(jìn)行定位、定性及定量研究。IHC雖為病理診斷中最常用的檢測(cè)手段之一,但該檢測(cè)耗時(shí)且昂貴,且依賴于病理醫(yī)師的主觀判讀。因此,如何用基于AI的圖像分析替代IHC檢測(cè)正成為研究者的關(guān)注熱點(diǎn)。Shamai等[26]利用CNN算法分析基于形態(tài)學(xué)的分子表達(dá)譜(morphological-based molecular profiling,MBMP),以此來預(yù)測(cè)乳腺癌免疫組織化學(xué)雌激素受體(estrogen receptor,ER)表達(dá)情況,并探索乳腺癌組織學(xué)形態(tài)特征與ER表達(dá)之間的關(guān)聯(lián),結(jié)果顯示MBMP在預(yù)測(cè)ER表達(dá)方面具有與IHC相當(dāng)?shù)臏?zhǔn)確度。該研究推斷,通過適當(dāng)?shù)腁I模型可識(shí)別肉眼無法觀察到的形態(tài)模式,并從HE染色圖像中預(yù)測(cè)分子表達(dá)。另一項(xiàng)研究則訓(xùn)練了一個(gè)AI模型,預(yù)測(cè)非小細(xì)胞肺癌HE圖像中PD-L1的狀態(tài),從而判斷患者受益于PD-1/PD-L1抑制劑的可能性[27]。在訓(xùn)練組中,研究者提供了超過145 000張病理圖像來學(xué)習(xí)PD-L1+和PD-L1-的HE圖像特征,測(cè)試組中預(yù)測(cè)PD-L1狀態(tài),其AUC達(dá)到0.80。該模型對(duì)肺腺癌中的PD-L1狀態(tài)預(yù)測(cè)優(yōu)于肺鱗狀細(xì)胞癌,且對(duì)預(yù)測(cè)不同病理學(xué)家之間診斷的差異也有較好的魯棒性,即使在對(duì)應(yīng)于最大病理學(xué)家間分歧(25%重組樣本)的情況下,該模型仍保留預(yù)測(cè)能力(AUC=0.66,P=0.01)。通過基于AI圖像分析來預(yù)測(cè)腫瘤特征性免疫表型的表達(dá)狀態(tài),從而替代IHC檢測(cè),不僅有助于患者的個(gè)性化診斷,還可為患者預(yù)后評(píng)估提供依據(jù)。
近期有研究表明,深度學(xué)習(xí)算法可通過組織學(xué)分級(jí)和基因分型對(duì)星形細(xì)胞瘤進(jìn)行預(yù)后預(yù)測(cè)[28]。研究者通過生存卷積神經(jīng)網(wǎng)絡(luò)(Survival Convolutional Neural Network,SCNN)算法構(gòu)建AI模型,有效識(shí)別了與星形細(xì)胞瘤中的異檸檬酸脫氫酶(isocitrate dehydrogenase,IDH)突變相關(guān)的組織學(xué)差異,并相應(yīng)預(yù)測(cè)了患者預(yù)后,其預(yù)測(cè)準(zhǔn)確性超過基于基因分型和組織學(xué)分級(jí)的最新版WHO標(biāo)準(zhǔn)。
隨著高通量測(cè)序(Next-Generation Throughput Sequencing,NGS)的到來,生物信息學(xué)面臨的主要挑戰(zhàn)是如何有效地將基因組學(xué)大數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的信息。NGS數(shù)據(jù)產(chǎn)生錯(cuò)誤的復(fù)雜性以及處理大數(shù)據(jù)的耗時(shí)性是現(xiàn)今NGS發(fā)展所面臨的主要問題。AI技術(shù)以其高效和精準(zhǔn)的數(shù)據(jù)處理能力,在生物信息學(xué)、基因組學(xué)等領(lǐng)域具有較好的潛在應(yīng)用價(jià)值。在一篇相關(guān)報(bào)道中,研究者構(gòu)建AI模型分析RNA測(cè)序數(shù)據(jù)集(RNASeq),從基因表達(dá)譜中識(shí)別生物標(biāo)志物以區(qū)分乳頭狀腎細(xì)胞癌的不同分期,根據(jù)不同的算法篩選了80個(gè)呈顯著相關(guān)性的基因,并通過細(xì)胞特征提取揭示了晚期染色體不穩(wěn)定性增加的潛在機(jī)制[29]。NGS技術(shù)產(chǎn)生的大量基因組學(xué)數(shù)據(jù)需要越來越多快速和復(fù)雜的算法,這為深度學(xué)習(xí)應(yīng)用于NGS各個(gè)領(lǐng)域并加速測(cè)序進(jìn)程提供了契機(jī)。有研究者歸納了基于不同NGS應(yīng)用領(lǐng)域可用的深度學(xué)習(xí)算法,其中應(yīng)用占比最高的是蛋白質(zhì)與調(diào)控序列領(lǐng)域,占50%;其余依次為單核苷酸多態(tài)性(Single Nucleotide Polymorphism,SNPs)(18.75%)、表觀遺傳學(xué)修飾(12.50%)、生物標(biāo)志物研究與監(jiān)測(cè)(6.25%)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)(6.25%)和mRNA剪接變異領(lǐng)域(6.25%)[30]。
綜上所述,深度學(xué)習(xí)算法大大推動(dòng)了AI輔助病理診斷的發(fā)展。近年來,從細(xì)胞學(xué)篩查到組織病理學(xué)的診斷分類、預(yù)后判斷,再到分子病理學(xué)的基因分型、NGS領(lǐng)域等多層面的科學(xué)研究顯示,AI在病理診斷中正體現(xiàn)越來越重要的價(jià)值。然而由于醫(yī)療數(shù)據(jù)的限制以及臨床高準(zhǔn)確率的要求,AI輔助病理診斷現(xiàn)階段大多尚未能真正走出實(shí)驗(yàn)室進(jìn)入臨床應(yīng)用,仍存在較多局限。但在大數(shù)據(jù)和云計(jì)算技術(shù)的協(xié)同作用下,病理AI技術(shù)將迎來快速發(fā)展期。近期,AI輔助病理診斷有望在多方面改變我們的業(yè)態(tài),給病理診斷帶來更多便利,從而提高病理醫(yī)師工作效率,降低漏診、誤診率[31]。計(jì)算機(jī)能發(fā)現(xiàn)人眼不易察覺的細(xì)節(jié),學(xué)習(xí)病理圖像分子層面上的特征,進(jìn)而不斷完善病理診斷的知識(shí)體系[32]。AI不僅能用于組織學(xué)形態(tài)判斷,還可整合免疫表型、基因分型和臨床相關(guān)信息,得出一個(gè)具有綜合信息的診斷報(bào)告,為患者提供預(yù)后預(yù)測(cè)和精準(zhǔn)的藥物治療指導(dǎo)。當(dāng)然,作為一種輔助診斷技術(shù),AI并不能替代病理學(xué)專家,而是為病理診斷帶來更多便利[31]。
從長遠(yuǎn)趨勢(shì)來看,AI技術(shù)在病理診斷中的應(yīng)用有可能為緩解病理領(lǐng)域諸多困境和挑戰(zhàn)、實(shí)現(xiàn)精準(zhǔn)醫(yī)療帶來更多契機(jī),從而改善中國目前病理醫(yī)師缺乏、診斷水平地區(qū)差異大的局面,為構(gòu)建方便快捷的新型診斷模式奠定堅(jiān)實(shí)基礎(chǔ)?;谏疃葘W(xué)習(xí)的AI在病理診斷中的深入研究,將為新型醫(yī)療模式帶來無限可能。