陳劍瓊,肖 榕,周瑋珺,吳芳芳,王 玲
乳腺癌在女性惡性腫瘤中的發(fā)病率最高, 2020年全世界已診斷的女性乳腺癌患者達到226萬人[1]。準確判斷乳腺病灶的良惡性將有助于盡早確定有效治療方案、延長乳腺癌患者生命以及避免不必要的過度治療。影像組學是一種新興的預測腫瘤良惡性的有效影像綜合分析方法。通過使用數(shù)據(jù)最小化算法及統(tǒng)計工具分析人類視覺可能無法感知到的影像特征,用精選特征構(gòu)建合適的影像組學模型診斷惡性腫瘤并幫助判斷預后[2],可以有效規(guī)避不同水平醫(yī)師診斷中的主觀性,提高了診斷的規(guī)范性和效率。該研究以乳腺結(jié)節(jié)的灰階超聲圖像為基礎,構(gòu)建乳腺良惡性病灶的影像組學診斷模型,探討灰階超聲影像組學在乳腺良惡性結(jié)節(jié)鑒別診斷中的應用價值。
1.1 病例資料回顧性分析2019年3月-2021年4月在本院超聲門診行乳腺超聲檢查并經(jīng)手術或組織穿刺活檢后病理學證實的258例女性患者的361例乳腺結(jié)節(jié)的灰階超聲圖像。乳腺囊性結(jié)節(jié),超聲檢查前進行過結(jié)節(jié)穿刺活檢以及乳腺癌曾接受過新輔助化療者均被排除。361例乳腺結(jié)節(jié)中包含228例良性結(jié)節(jié)及133例惡性結(jié)節(jié)。所有患者均于術前簽署了知情同意書。
1.2 實驗儀器本研究所用儀器為德國西門子公司S3000 彩色多普勒超聲診斷儀,采用頻率9~14 MHz的 L14-9線陣探頭。
1.3 方法① 所有患者乳腺灰階超聲圖像均由同一名從事乳腺超聲診斷10年的醫(yī)師采集。該醫(yī)師按固定程序?qū)θ橄龠M行細致掃查,發(fā)現(xiàn)結(jié)節(jié)后仔細觀察和記錄病灶方位、大小、形態(tài)、邊緣、內(nèi)部及后方回聲、有無鈣化及鈣化類型等,并將最清晰的乳腺結(jié)節(jié)灰階圖像以 DICOM格式存于超聲儀器中。② 從361例乳腺結(jié)節(jié)中隨機選擇2/3(乳腺良性結(jié)節(jié)152例,惡性結(jié)節(jié)87例)組成研究的訓練隊列,余下1/3(良性結(jié)節(jié)76例,惡性結(jié)節(jié)46例)作為研究的驗證隊列。③ 分別由工作4年和工作10年的超聲醫(yī)師在未知病理結(jié)果的前提下應用ITK-SNAP軟件沿腫塊邊緣輪廓獨立進行手動分割。
隨機抽取20個結(jié)節(jié),使用組內(nèi)相關系數(shù)(intraclass correlation coefficient,ICC)評估這兩位超聲醫(yī)師間結(jié)節(jié)分割和影像組學特征提取的可重復性。采用10年乳腺超聲檢查經(jīng)驗醫(yī)師的分割結(jié)果用于進一步的數(shù)據(jù)分析。
1.4 統(tǒng)計學處理采用R軟件(version3.6.1)進行所有影像組學數(shù)據(jù)的統(tǒng)計分析,采用 “glmnet”軟件包進行最小絕對收縮和選擇算子(the least absolute shrinkage and Selection operator,LASSO)回歸分析。以乳腺結(jié)節(jié)的組織病理結(jié)果為金標準,P<0.05為差異有統(tǒng)計學意義。ROC曲線、曲線下面積(area under the curve, AUC)、靈敏度、特異度等指標用于評估影像組學模型的區(qū)分能力。利用R軟件建立預測模型,使用“Calibration Curves”包繪制校準曲線。Hosmer-Lemeshow good of fit test用于檢測校準曲線的校準度。應用ICC進行重復性分析(觀察者間的變異性):① 利用Matlab平臺提取高維的影像組學特征,包括臨床認知特征(主要描述結(jié)節(jié)表型,比如邊緣、形狀、體積等)、密度特征(描述圖像中體積元素灰度直方圖及分布圖)、紋理特征(反映結(jié)節(jié)內(nèi)部結(jié)構(gòu)的同質(zhì)性及異質(zhì)性)和小波特征(通過小波分解進一步獲得高階的密度及質(zhì)地特征)。② 先采用最小冗余最大相關性特征選擇法(the minimum redundancy maximum relevance,mRMR)載入全部特征并從中篩選有意義的非冗余特征。再使用LASSO從已經(jīng)篩選的影像組學特征中選擇最優(yōu)特征子集構(gòu)建影像組學診斷模型。 ③ 評價影像組學模型的診斷性能采用了受試者工作特征曲線(receiver operating characteristic curve,ROC),計算影像組學模型的受試者工作特征曲線下面積、準確性、靈敏度、特異性及約登指數(shù)(youden’s index,YI)。在獨立的驗證隊列中進一步測試生成的診斷模型,同樣繪制驗證隊列影像組學模型ROC曲線、校準曲線,并計算相關性能指標,評估驗證隊列影像組學模型的性能。
2.1 影像組學特征每個乳腺結(jié)節(jié)通過Matlab平臺共提取所有乳腺結(jié)節(jié)超聲原始灰階圖像影像組學特征,其中9個形態(tài)特征、42個直方圖特征、11個灰度區(qū)域大小矩陣(gray-level size zone matrix,GLSZM)特征、10個haralick特征、144個灰度共生矩陣(gray-level co-occurrence matrix,GLCM)特征及180個灰度游程矩陣(gray-level run-length matrix,GLRLM)特征。
因圖像特征數(shù)量大而隊列規(guī)模相對較小,在訓練隊列中,先使用mRMR特征選擇法保留30個與目標變量最具有相關性并且特征間冗余度最小的特征,然后利用LASSO邏輯回歸方法從中精選出與病灶良惡性相關的15個系數(shù)非零的影像組學特征(2個直方圖特征、4個紋理特征、9個小波特征)作為診斷因子 (表1)。確定特征個數(shù)后,利用LASSO對特征數(shù)據(jù)進行10倍交叉驗證。通過所選特征加權(quán)系數(shù)的線性組合計算得出每個患者的Rad-score,然后利用LASSO回歸分析構(gòu)建基于Rad-score的最終診斷模型。根據(jù)工作4年和工作10年超聲醫(yī)師的分割圖像結(jié)果提取的影像組學特征所計算的觀察者間ICC介于0.765~0.889之間。因此,本組資料影像組學特征的提取在分割者間顯示出優(yōu)異的可重復性。
表1 精選的影像組學特征及其系數(shù)
2.2 ROC曲線基于影像組學評分繪制ROC曲線,訓練隊列影像組學模型AUC為0.84(95%CI,0.79~0.89)、驗證隊列影像組學模型AUC為0.84(95%CI,0.75~0.92)(圖1)。該模型的準確度、靈敏度、特異度、YI分別為0.761、0.840、0.715、0.603;0.716、0.823、0.654、0.536(表2)。兩隊列模型的校準曲線顯示模型診斷與理想狀態(tài)及實際結(jié)果之間具有良好的一致性(圖2)。圖中Y軸代表實際乳腺癌情況,X軸代表影像組學模型對惡性乳腺腫瘤診斷結(jié)果,對角線(Ideal)表示理想模型的診斷結(jié)果,Apparent為參考線,接近對角線的虛線(Bias-corrected)表示影像組學模型的診斷性能,顯示該模型二者擬合好即影像組學模型的診斷結(jié)果與理想狀態(tài)非常接近。Hosmer-Lemeshow good of fit test差異無統(tǒng)計學意義,也表明影像組學模型診斷結(jié)果與理想擬合程度較好。
表2 訓練隊列及驗證隊列影像組學模型性能參數(shù)
圖1 影像組學模型的ROC曲線
圖2 影像組學模型的校準曲線
受生活方式和生活環(huán)境的影響,各種乳腺疾病發(fā)病率逐年增高,乳腺癌的發(fā)病率也呈上升趨勢。目前乳腺疾病的首選檢查方法主要有超聲和乳腺鉬靶X線攝影,但是臨床常用的乳腺影像報告和數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system,BI-RADS)分類主要是基于醫(yī)師的主觀視覺判斷,其診斷結(jié)果往往在不同水平醫(yī)師中存在較大差異。隨著計算機技術及人工智能(AI)的迅猛發(fā)展,AI正廣泛應用于大數(shù)據(jù)及醫(yī)學圖像的處理,這也催生了影像組學的高速發(fā)展。影像組學借助計算機算法,從醫(yī)學影像中提取高通量定量特征,通過統(tǒng)計學分析和計算機算法構(gòu)建影像組學模型,并探索其與疾病的相關性,為臨床準確診斷和判斷預后提供較客觀的參考信息,成為近年發(fā)展起來的新興熱門方法學[3-6]。已有多項研究證明影像組學能夠有效判斷腫瘤的良惡性和預測預后。Qin et al[7]進行的一項總共納入254例診斷為轉(zhuǎn)移性肝癌患者的回顧性研究,根據(jù)原發(fā)腫瘤的來源將患者分為3組,提取了 5 936 個特征,用于分別建立3組的影像組學模型。其中1、2、3組的訓練隊列的AUC值分別為0.938、0.974和0.768,測試隊列的AUC值分別為0.767、0.768和0.750。提示超聲影像組學可能是鑒定肝轉(zhuǎn)移性病變來源的有效補充手段。Zha et al[8]的一項回顧性研究納入了452例在同一中心接受前哨淋巴結(jié)活檢的浸潤性乳腺癌患者,并將這些患者分為訓練組(n=318)和驗證組(n=134),以評估影像組學在預測前哨淋巴結(jié)轉(zhuǎn)移中的價值。研究者在患者此前接受的淋巴結(jié)常規(guī)超聲檢查中,從腫瘤的感興趣區(qū)域(ROI)提取了總共1 216個特征。使用mRMR和LASSO算法來構(gòu)建模型對診斷性能進行評估和驗證。結(jié)果顯示其訓練隊列和驗證隊列的ROC曲線下面積(AUC)分別為0.834和0.770,提示該模型對于判斷前哨淋巴結(jié)是否存在轉(zhuǎn)移有較好的預測作用。Li et al[9]對178例患者的181例腫瘤(67例惡性和114例良性)進行了回顧性研究。研究顯示多模態(tài)超聲影像組學診斷的準確性、敏感性、特異性及ROC曲線下面積分別為84.12%、92.86%、78.80%和0.919,認為影像組學在臨床乳腺腫瘤的診斷中具有較大潛力。本研究通過分析經(jīng)病理證實的258例患者361例乳腺結(jié)節(jié)灰階超聲圖像并從中提取大量定量影像特征,采用mRMR特征選擇法及LASSO算法篩選最優(yōu)特征子集構(gòu)建乳腺惡性腫瘤影像組學診斷模型,訓練隊列及驗證隊列ROC曲線下面積、準確度、靈敏度、特異度分別為0.84、0.761、0.840、0.715;0.84、0.716、0.823、0.654,與文獻報道的研究結(jié)果相近。由此認為影像組學可以通過評估大量肉眼無法獲取的聲學特征,產(chǎn)生更高效,更標準化的流程,極大程度減少對檢查者的依賴性,從而客觀、無創(chuàng)地判斷乳腺結(jié)節(jié)的良惡性,提高診斷的準確性,可能在臨床應用中獲益,具有良好的臨床應用價值。影像組學特征的穩(wěn)定性及影像組學預測模型的診斷性能很大程度上取決于對病灶的分割。分割的感興趣區(qū)域可以是整個腫瘤病灶,也可以對腫瘤周圍區(qū)域及對側(cè)正常乳腺組織區(qū)域進行分割[10],手動分割方法是當前大多數(shù)影像組學研究較常使用的方法,適合于樣本量較小的研究隊列,但是該分割方法的缺點是可能會漏掉乳腺腫塊周圍區(qū)域的部分重要信息。因此,后續(xù)可通過擴大樣本量,采用自動或半自動分割方法進行腫塊及其周圍區(qū)域的分割,比較不同分割方法對灰階超聲影像組學特征模型的穩(wěn)定性及對乳腺良惡性結(jié)節(jié)診斷性能的影響。