李飛,張白霖,王學(xué)濤(通信作者)
廣州中醫(yī)藥大學(xué)第二附屬醫(yī)院 (廣東廣州 510006)
醫(yī)學(xué)影像學(xué)是醫(yī)學(xué)科學(xué)的重要分支,在腫瘤診斷、治療及預(yù)后評估中發(fā)揮著重要作用。腫瘤具有空間和時間異質(zhì)性,且異質(zhì)性是預(yù)測腫瘤患者預(yù)后的重要因素,但即使采用活檢也難以準(zhǔn)確評估腫瘤異質(zhì)性。近年來,隨著醫(yī)學(xué)及信息技術(shù)的發(fā)展,醫(yī)學(xué)成像分析成為了新的研究方向。影像組學(xué)通過采用先進(jìn)的醫(yī)學(xué)圖像計算方法可定量描述腫瘤組織特征,從而進(jìn)行數(shù)據(jù)化分析,輔助醫(yī)師對整個腫瘤進(jìn)行評估,具有無創(chuàng)、可重復(fù)的優(yōu)點。
Aerts 等[1]于2014 年開創(chuàng)性地發(fā)表了影像組學(xué)相關(guān)研究成果,在肺癌和頭頸癌患者的獨立數(shù)據(jù)集中,大量影像組學(xué)特征具有預(yù)測腫瘤患者在接受常規(guī)治療后各項身體機(jī)能恢復(fù)和預(yù)后復(fù)發(fā)情況的作用,從而可鑒定預(yù)后表型。Liu 等[2]基于35 例鼻咽癌患者腮腺的CT 影像組學(xué)特征建立模型,該模型預(yù)測鼻咽癌放療期間急性口干癥的靈敏度、特異度分別為1.000、0.922。Zhuo 等[3]建立了基于658 例非轉(zhuǎn)移性鼻咽癌患者的多參數(shù)MRI 影像組學(xué)特征模型,結(jié)果表明,該模型可將患者分為不同的生存亞組,且預(yù)后分層效果優(yōu)于TNM 分期系統(tǒng)。但目前影像組學(xué)在推廣應(yīng)用方面存在一些問題,如特征穩(wěn)定性(可重復(fù)性)較差等。影像組學(xué)應(yīng)用時需進(jìn)行圖像采集、靶區(qū)勾畫、特征提取和臨床問題建模。由于各研究使用的數(shù)據(jù)及方法缺乏統(tǒng)一標(biāo)準(zhǔn),影像組學(xué)應(yīng)用過程中的每個步驟均可使結(jié)果產(chǎn)生差異。其中,非標(biāo)準(zhǔn)化的影像采集對樣本數(shù)據(jù)質(zhì)量影響較大,導(dǎo)致特征穩(wěn)定性較差,進(jìn)而影響影像組學(xué)的臨床研究效果。因此,影像組學(xué)研究的標(biāo)準(zhǔn)化成為一個重要的研究領(lǐng)域。2016 年,Kim 等[4]通過卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)低分辨率圖像和高分辨率圖像間的殘差,并利用殘差和低分辨率圖像之和將低分辨率圖像轉(zhuǎn)換為高分辨率圖像。Choe 等[5]在研究中將肺癌患者的CT 圖像進(jìn)行轉(zhuǎn)換,分析重建核和圖像轉(zhuǎn)換對肺部腫瘤影像組學(xué)特征穩(wěn)定性的影響。針對影像組學(xué)穩(wěn)定性差的問題,本研究通過將深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于圖像轉(zhuǎn)換,從而減小CT 重建核函數(shù)對影像組學(xué)特征穩(wěn)定性的影響。
選取29 例鼻咽癌患者的頭頸部CT 影像數(shù)據(jù),每例均選擇4 種核函數(shù)(B10、B30、B50、B70)進(jìn)行重建,并勾畫腫瘤靶區(qū)及腦干、眼球等14個感興趣區(qū)。
采用分割算法分割感興趣區(qū),然后利用Pyradiomics 庫以Python 語言提取影像組學(xué)特征,對每個樣本分別提取851 種特征,其中原始107 個,小波濾波744 個。
本研究使用的卷積神經(jīng)網(wǎng)絡(luò)具有6 個卷積層,核的大小為3×3,除最后一層外,每層均含64 個濾波器組,可提取64 個不同的特征圖。訓(xùn)練的迭代次數(shù)為300 次,訓(xùn)練1 次批量為5,以均方差為損失函數(shù),優(yōu)化方案為Adam(4),學(xué)習(xí)率為0.0001。以原始的512×512矩陣為輸入和輸出圖像的大小,并于訓(xùn)練中應(yīng)用殘差學(xué)習(xí)。圖像輸入網(wǎng)絡(luò)后,生成殘差圖像(輸入圖像和目標(biāo)圖像之差),最終輸出轉(zhuǎn)換后的圖像(輸入圖像與殘差圖像之和),見圖1。B10、B30、B50、B70 圖像經(jīng)轉(zhuǎn)換后分別變?yōu)閒B70、fB50、fb30、fB10 圖像。以29 例頭頸部CT 圖像(共計4 417 張DICOM 圖像)為訓(xùn)練集,以10 例頭頸部CT 圖像(共計1 333 張DICOM 圖像)為測試集。
圖1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
以核函數(shù)B10 重建的CT 圖像經(jīng)卷積神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換為fB70 的CT 圖像為例(圖2)。利用完成訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)及參數(shù),將以核函數(shù)B10 重建的CT 圖像作為輸入圖像,即可得到以核函數(shù)B10 重建的CT 圖像與以核函數(shù)B70 重建的CT 圖像之間的殘差,將殘差值與輸入值相加即可得到輸出值,即生成fB70 的CT 圖像,見圖2B。同理,將4 種不同重建核函數(shù)的圖像進(jìn)行轉(zhuǎn)換。
圖2 頭頸部CT 轉(zhuǎn)換圖
以B10-B70 組圖像為例,對轉(zhuǎn)換后的fB10、fB70 圖像進(jìn)行影像組學(xué)穩(wěn)定性評估。將fB70 的CT圖像與重建核為B70 的CT 圖像進(jìn)行配對,將fB10 的CT 圖像與重建核為B10 的CT 圖像進(jìn)行配對,與重建核B10、B70 的CT 圖像CCC 進(jìn)行比較。
以CCC 閾 值(0.60,0.65,0.70,0.75,0.80,0.85,0.90,0.95)為x軸,以達(dá)到各CCC 閾值的特征數(shù)量占比為y軸,繪制折線圖(圖3、圖4)。以CCC>0.85 為影像組學(xué)穩(wěn)定的標(biāo)準(zhǔn),符合標(biāo)準(zhǔn)的B70-fB70、B10-fB10 的CCC 的特征數(shù)量占比高于B10-B70。
圖3 CCC 閾值折線圖(B70-fB70 與B10-B70)
圖4 CCC 閾值折線圖(B10-fB10 與B10-B70)
利用Python 提取并計算圖像fB10、fB70 的CT值,并分別計算fB10 與B10、fB70 與B70、B10 與B70 的均方差、平均絕對值誤差、峰值信噪比、結(jié)構(gòu)相似性數(shù)值的平均值,見表1。由表1 可知,B10-fB10 與B70-fB70 的均方差、平均絕對值誤差均低于B10-B70,而B10-fB10 與B70-fB70 的峰值信噪比、結(jié)構(gòu)相似性高于B10-B70。
表1 轉(zhuǎn)換后圖像均方差、平均絕對值誤差、峰值信噪比、結(jié)構(gòu)相似性指標(biāo)
影像組學(xué)的概念最早由荷蘭學(xué)者Lambin 等[6]提出,即從醫(yī)學(xué)影像中提取高通量成像特征并創(chuàng)建高維數(shù)據(jù)集。近年來,影像組學(xué)研究在疾病診斷、治療及預(yù)后評估方面取得了一系列進(jìn)展。在疾病診斷和分類方面,Sun 等[7]對170 例患兒的腦部MRI圖像進(jìn)行了研究,基于影像組學(xué)特征診斷注意力缺陷多動障礙并預(yù)測分型,取得了較好的預(yù)測結(jié)果。Kirienko 等[8]通過評估CT 和PET 影像組學(xué)特征將肺部病變分為原發(fā)性與轉(zhuǎn)移性,從而得知影像組學(xué)具有區(qū)分原發(fā)性肺癌組織學(xué)亞型的作用。在治療方案決策方面,Teruel 等[9]通過動態(tài)對比增強(qiáng)MRI 紋理分析可預(yù)測局部晚期乳腺癌患者對新輔助化療的臨床和病理反應(yīng)的預(yù)處理,結(jié)果表明,紋理分析可輔助判斷治療方案的合理性,為臨床醫(yī)師提供參考信息。Shiradkar 等[10]基于影像組學(xué)的靶向放射治療計劃(Rad-TRaP)和MRI 前列腺癌治療計劃的計算框架可生成重點治療計劃,減少危及器官受照射劑量,并增加靶向癌性病變的劑量。
各項數(shù)據(jù)間差異較大是影像組學(xué)研究過程中需迫切解決的問題。CT 掃描為腫瘤診斷及治療的常用影像手段。研究表明,不同條件(掃描設(shè)備、掃描參數(shù)、重復(fù)掃描、感興趣區(qū)分割、特征提取)是影響CT 影像組學(xué)特征穩(wěn)定性的不利因素[11-14]。Hunter 等[11]研究了不同掃描機(jī)器和不同圖像類型對特征穩(wěn)定性造成的影響。有研究表明,過擬合和欠擬合均為影響統(tǒng)計學(xué)習(xí)或機(jī)器學(xué)習(xí)模型穩(wěn)定性的重要因素,模型的泛化能力差,無法正確分類或預(yù)測,通過對CT 圖像進(jìn)行重復(fù)掃描可提高模型穩(wěn)定性[12-13]。另有研究表明,相較于手工勾畫,自動(或半自動)分割方法同時兼顧減少人工干預(yù)、提高分割精度及穩(wěn)定性,因此能夠獲得更加穩(wěn)定的感興趣區(qū)[14]。此外,使用不同核函數(shù)重建得到的圖像提供的診斷信息側(cè)重點不同。因此,臨床通常使用不同核函數(shù)進(jìn)行圖像重建。卷積神經(jīng)網(wǎng)絡(luò)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),擅長處理圖像特別是大圖像的相關(guān)機(jī)器學(xué)習(xí)問題。卷積神經(jīng)網(wǎng)絡(luò)通過一系列方法,可成功將數(shù)據(jù)量龐大的圖像識別問題不斷降維,最終使其能夠被訓(xùn)練。本研究旨在分析基于卷積神經(jīng)網(wǎng)絡(luò)重建核函數(shù)對頭頸部CT 影像組學(xué)特征穩(wěn)定性的影響。與相關(guān)研究不同,本研究不僅評估腫瘤區(qū)的影像組學(xué)特征穩(wěn)定性,同時也對如腦干、脊髓、中耳等共13 個正常器官予以評估,共勾畫14 個感興趣區(qū),提取了851 種影像組學(xué)特征。結(jié)果顯示,符合標(biāo)準(zhǔn)(以CCC>0.85 為影像組學(xué)穩(wěn)定的標(biāo)準(zhǔn))的B70-fB70、B10-fB10 CCC 的特征數(shù)量占比高于B10-B70,B10-fB10 與B70-fB70 的均方差、平均絕對值誤差均低于B10-B70,而B10-fB10 與B70-fB70 的峰值信噪比、結(jié)構(gòu)相似性高于B10-B70,表明通過卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)圖像轉(zhuǎn)換可提高影像組學(xué)特征穩(wěn)定性,減小不同重建核函數(shù)產(chǎn)生的差異。