劉琢玉,黃小華,陳雨薇,胡云濤,唐玲玲,劉念
作者單位:川北醫(yī)學(xué)院附屬醫(yī)院放射科,南充 637000
胰腺導(dǎo)管腺癌(pancreatic ductal adenocarcinoma,PDAC)占胰腺惡性腫瘤的95%,5 年存活率僅為1%~5%[1-2]。接受根治性手術(shù)的PDAC 患者生存率有所提高,但伴有淋巴結(jié)轉(zhuǎn)移的患者預(yù)后差,且術(shù)后復(fù)發(fā)風(fēng)險高[3-5]。因此,術(shù)前準(zhǔn)確評估PDAC 淋巴結(jié)狀態(tài)對指導(dǎo)臨床醫(yī)師治療方案的選擇及預(yù)后預(yù)測的評估至關(guān)重要。計算機(jī)體層攝影(computed tomography, CT)和MRI 檢測PDAC 的敏感度分別為76%~96%、83%~93.5%[2],但在術(shù)前評估淋巴結(jié)狀態(tài)的準(zhǔn)確性方面仍存在很大挑戰(zhàn)[6-7]。影像組學(xué)通過量化定量特征來表征腫瘤的生物學(xué)特點[8-9],已用于胰腺腫瘤的鑒別診斷、療效評估與預(yù)后預(yù)測等方面[10-14]。目前已有少數(shù)基于影像組學(xué)預(yù)測PDAC 淋巴結(jié)轉(zhuǎn)移的研究,然而這些研究多基于增強(qiáng)CT圖像且研究多采用單一建模方法[15-18]。因此,本研究旨在利用三種機(jī)器學(xué)習(xí)模型探討T1WI 動脈期圖像預(yù)測PDAC 患者淋巴結(jié)轉(zhuǎn)移的價值,以期獲得一種無創(chuàng)、準(zhǔn)確且便利的術(shù)前預(yù)測淋巴結(jié)轉(zhuǎn)移的方法。
本研究經(jīng)川北醫(yī)學(xué)院附屬醫(yī)院倫理委員會批準(zhǔn),免除受試者知情同意,批準(zhǔn)文號:2022ER045-1?;仡櫺苑治霰驹?016 年3 月至2022 年3 月收治的121 例經(jīng)術(shù)后病理證實為PDAC 患者的MRI 圖像及臨床病理信息。男73 例,女48 例,年齡(61±10)歲。納入標(biāo)準(zhǔn):(1)術(shù)后病理證實為PDAC;(2)術(shù)中行淋巴結(jié)清掃且具有術(shù)后詳細(xì)淋巴結(jié)病理報告;(3)MRI 增強(qiáng)掃描在術(shù)前1 個月內(nèi)進(jìn)行。排除標(biāo)準(zhǔn):(1)圖像質(zhì)量不符合診斷標(biāo)準(zhǔn);(2)術(shù)前進(jìn)行抗癌治療;(3)有其他惡性腫瘤患者。根據(jù)術(shù)后淋巴結(jié)病理結(jié)果:淋巴結(jié)轉(zhuǎn)移陽性者44例,陰性者77例。
本研究患者納入過程:在本院圖片歸檔和通信系統(tǒng)(picture archiving and communication system,PACS)中查找疑似PDAC 且行MRI 掃描患者共307 例,排除未行T1WI 增強(qiáng)掃描患者21 例、非PDAC 患者20 例、圖像質(zhì)量不符合標(biāo)準(zhǔn)14 例,共獲得MRI 診斷為PDAC 患者252 例。而后排除術(shù)前進(jìn)行抗癌治療患者23 例、未進(jìn)行術(shù)后病理證實為PDAC 患者71 例、未進(jìn)行術(shù)后淋巴結(jié)病理檢查29 例、同時患有其他惡性腫瘤者8 例,最終納入患者121 例。將患者按7∶3 的比例隨機(jī)分為訓(xùn)練組(83例)與驗證組(38例)。
采用GE Discovery MR 750 3.0 T 及聯(lián)影UMR790 3.0 T 掃描儀和32 通道相控陣線圈行腹部常規(guī)序列掃描,GE Discovery MR 750 3.0 T 掃描序列及參數(shù):軸位LAVA 三期動態(tài)增強(qiáng)掃描序列,TR 4 ms,TE 1.9 ms,層厚5 mm,間距0 mm,矩陣224×190,視野36 cm×36 cm。聯(lián)影UMR790 3.0 T 掃描序列及參數(shù):軸位Quick 3D三期動態(tài)增強(qiáng)掃描序列,TR 3 ms,TE 1.5 ms,層厚5 mm,間距0 mm,矩陣256×224,視野40 cm×30 cm。以2.5 mL/s的流速靜脈注射釓貝葡胺注射液(0.1 mmol/kg;上海博萊科信誼藥業(yè)有限責(zé)任公司),然后用10 mL 生理鹽水沖洗。考慮到患者年齡、心功能等個體差異,動脈期時間約為注射對比劑后16 s~20 s。
使用3D slicer(version 4.11.20210226,美國,https://www.slicer.org/)進(jìn)行感興趣區(qū)(region of interest, ROI)勾畫及特征提取。一位具有5 年工作經(jīng)驗的影像科醫(yī)師在T1WI動脈期圖像上逐層勾勒胰腺腫塊輪廓,獲取胰腺腫塊的三維感興趣容積(圖1)。同時一位具有7年工作經(jīng)驗的影像科醫(yī)師隨機(jī)抽取一半圖像進(jìn)行ROI 勾畫?;?D slicer 軟件中Python包“PyRadiomics”提取特征,包括形狀特征、一階特征、灰度共生矩陣特征、灰度區(qū)域大小矩陣特征、灰度行程矩陣特征、灰度相關(guān)矩陣特征、鄰域灰度差矩陣特征及經(jīng)小波及拉普拉斯變換后的特征共1223個。由于本研究收集不同型號磁共振掃描儀的圖像,為保證模型的泛化能力和結(jié)果的可重復(fù)性,在特征提取之前進(jìn)行重采樣,并對提取的數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化處理。
圖1 胰腺腫塊三維感興趣區(qū)勾畫示意圖。1A、1B:男,64歲,淋巴結(jié)轉(zhuǎn)移陽性;1C、1D:男,53歲,淋巴結(jié)轉(zhuǎn)移陰性。1A、1C:腫瘤最大層面的橫斷面圖像,1A中紅箭所示為轉(zhuǎn)移性淋巴結(jié);1B、1D:3D-Slicer軟件靶區(qū)勾畫示意圖。Fig.1 Schematic diagram of the three-dimensional region of interest (ROI) of pancreatic masses. 1A and 1B: Male, 64 years old, positive for lymph node metastasis.1C and 1D:Male,53 years old,negative for lymph node metastasis.1A and 1C are the cross-sectional images of the largest level of the tumor,red arrow in 1A shows the metastatic lymph nodes.1B and 1D are the sketch diagrams of 3D-slicer software target area.
影像組學(xué)特征在觀察者間的一致性檢驗采用組間相關(guān)系數(shù)(interclass correlation coefficient,ICC)作為度量指標(biāo),對兩名醫(yī)師勾畫ROI后所提取的影像組學(xué)特征進(jìn)行ICC 檢驗,ICC≥0.75 認(rèn)為具有較好的一致性。
采用單因素分析(Student'st檢驗和曼—惠特尼U檢驗)選擇兩組間差異有統(tǒng)計學(xué)意義的特征,進(jìn)而使用最小絕對收縮與選擇算子(least absolute shrinkage and selection operator, LASSO)進(jìn)行特征選擇,將部分參數(shù)的回歸系數(shù)抑制為0,再通過LASSO 算法下十折交叉驗證完成參數(shù)篩選,選擇最優(yōu)影像組學(xué)特征。使用支持向量機(jī)、邏輯回歸及決策樹3種機(jī)器學(xué)習(xí)方法對最優(yōu)特征子集進(jìn)行模型構(gòu)建。將121 例患者按7∶3 隨機(jī)分為訓(xùn)練集(83 例)和驗證集(38 例)。在訓(xùn)練組中進(jìn)行模型的訓(xùn)練、并在驗證組中進(jìn)行模型性能驗證。
采用SPSS(25.0 版,IBM 公司,美國)完成臨床病理資料的統(tǒng)計分析,滿足正態(tài)分布的計量資料用平均值±標(biāo)準(zhǔn)差(±s)表示,組間比較采用獨立樣本t檢驗。不滿足正態(tài)分布的計量資料用中位數(shù)±四分位數(shù)間距(M±Q)表示,組間比較采用曼—惠特尼U檢驗。計數(shù)資料以例數(shù)表示,組間比較采用χ2檢驗。采用R(x64 4.1.1)和python(3.9.12)完成特征篩選及模型建立,繪制并計算受試者工作特征(receiver operating characteristic, ROC)曲線下面積(area under the curve, AUC)來評估各模型的預(yù)測效能,使用Hosmer-Lemesow 檢驗和校準(zhǔn)曲線進(jìn)行模型的擬合優(yōu)度檢驗。使用Delong檢驗實現(xiàn)三種機(jī)器學(xué)習(xí)模型之間的比較。P<0.05認(rèn)為差異有統(tǒng)計學(xué)意義。
兩組間患者在年齡、性別、腫瘤部位、組織學(xué)分級、CA199、T分期的差異均無統(tǒng)計學(xué)意義(P>0.05)(表1)。
表1 淋巴結(jié)轉(zhuǎn)移陽性組與陰性組患者的臨床病理資料比較Tab.1 Comparison of clinicopathological data between patients with positive and negative lymph node metastasis
兩組間患者年齡、淋巴結(jié)狀態(tài)、性別、腫瘤部位、組織學(xué)分級、CA199、T分期的差異均無統(tǒng)計學(xué)意義(P>0.05)(表2)。
表2 訓(xùn)練組與驗證組患者的臨床病理資料比較Tab.2 Comparison of clinicopathological data between training group and validation group
根據(jù)一致性檢驗分析結(jié)果,ICCmean=0.81,ICCmedian=0.86。為了選擇受觀察者影響較小的特征為后續(xù)模型特征,選擇ICC 值≥0.75 的影像組學(xué)特征,共895 個。單因素分析和LASSO 篩選出5 個預(yù)測PDAC 淋巴結(jié)轉(zhuǎn)移最優(yōu)的特征,分別為1個灰度共生矩陣特征[相關(guān)度(correlation)]、2個灰度行程矩陣特征[長行程灰度優(yōu)勢(long run ray level emphasis)、長行程優(yōu)勢(long run emphasis)]、2個灰度區(qū)域大小矩陣特征[小區(qū)域低灰度優(yōu)勢(small area low gray level emphasis)、灰度非均勻歸一化(gray level non uniformity normalized)]。
在訓(xùn)練組中,支持向量機(jī)模型、決策樹模型和邏輯回歸模型的AUC分別為0.882 [95%置信區(qū)間(confidence interval,CI):0.797~0.968]、0.842(95%CI:0.755~0.930)、0.813(95%CI:0.710~0.915)。在驗證組中,三種模型的AUC 分別為0.726(95%CI:0.546~0.906)、0.753(95%CI:0.606~0.899)、0.702(95%CI:0.522~0.883)(表3、圖2)。Delong 檢驗顯示三個模型兩兩比較差異均無統(tǒng)計學(xué)意義(P>0.05)。分別繪制三種機(jī)器學(xué)習(xí)模型在驗證組中的校準(zhǔn)曲線圖(圖3)。Hosmer-Lemeshow 檢驗(邏輯回歸模型P=0.42;支持向量機(jī)模型P=0.24;決策樹模型P=1.00)驗證了預(yù)測值和實際臨床觀察值之間存在一致性,其中決策樹模型擬合最佳。
圖2 訓(xùn)練組和驗證組三個模型的受試者工作特征曲線(ROC)及曲線下面積(AUC)。2A:訓(xùn)練組;2B:驗證組。 圖3 三種機(jī)器學(xué)習(xí)模型在驗證組中的校準(zhǔn)曲線圖。Fig. 2 Receiver operating characteristic (ROC) curve and area under the curve (AUC) of three models in training group and validation group. 2A: The training group;2B:The validation group.Fig.3 Calibration plots of the three machine learning models in the validation group.
表3 3種機(jī)器學(xué)習(xí)模型對胰腺導(dǎo)管腺癌淋巴結(jié)轉(zhuǎn)移的預(yù)測價值Tab.3 Predictive value of three machine learning models for lymph node metastasis in pancreatic ductal adenocarcinoma
本研究回顧性分析121例PDAC患者的T1WI動脈期圖像,旨在通過影像組學(xué)模型為術(shù)前預(yù)測PDAC 淋巴結(jié)轉(zhuǎn)移提供一個潛在無創(chuàng)的新方法。研究發(fā)現(xiàn)基于三種分類器的機(jī)器學(xué)習(xí)模型均具有較好的預(yù)測價值,Delong 檢驗顯示三個模型兩兩比較差異均無統(tǒng)計學(xué)意義。提示基于T1WI動脈期圖像的影像組學(xué)模型可以在術(shù)前進(jìn)行PDAC 患者淋巴結(jié)狀態(tài)的評估,可在傳統(tǒng)醫(yī)學(xué)圖像的基礎(chǔ)上提供額外有價值的信息,為臨床醫(yī)師治療方案的選擇提供參考。
淋巴結(jié)轉(zhuǎn)移是PDAC患者重要的生存預(yù)測因子,但術(shù)前檢測存在困難[19-22]。不利于臨床醫(yī)師進(jìn)行腫瘤的術(shù)前分期及治療方案的選擇。近年來,血清標(biāo)志物如MMP7、MUC1、MUC2和中性粒細(xì)胞數(shù)與淋巴細(xì)胞數(shù)的比值等被提出可用于術(shù)前檢測PDAC淋巴結(jié)狀態(tài),但由于技術(shù)和準(zhǔn)確性等問題,其臨床應(yīng)用受到限制[19-20]。超聲內(nèi)鏡引導(dǎo)下細(xì)針抽吸(endoscopic ultrasound-guided fine needle aspiration, EUS-FNA)對檢測淋巴結(jié)轉(zhuǎn)移非常敏感,但EUS-FNA是一種有創(chuàng)的診斷工具,很大程度會導(dǎo)致患者發(fā)生胰腺炎等并發(fā)癥[21]。影像組學(xué)可以從醫(yī)學(xué)圖像(CT、MRI 等)中提取大量的高維量化特征,揭示肉眼無法清楚觀察到的疾病的隱藏特征[23-24]。既往研究[15-17,25-26]多采用增強(qiáng)CT 影像組學(xué)預(yù)測PDAC 淋巴結(jié)轉(zhuǎn)移情況,Bian 等[15]研究發(fā)現(xiàn)CT 動脈期影像組學(xué)評分(RAD-score)越高,淋巴結(jié)轉(zhuǎn)移的風(fēng)險越高。Li等[17]結(jié)合臨床數(shù)據(jù)和CT靜脈期特征建立模型進(jìn)行研究,發(fā)現(xiàn)聯(lián)合影像組學(xué)特征與臨床特征的預(yù)測模型對術(shù)前淋巴結(jié)轉(zhuǎn)移的識別能力優(yōu)于臨床模型。證明了CT 影像組學(xué)在PDAC 淋巴結(jié)轉(zhuǎn)移中的預(yù)測價值。但CT檢查產(chǎn)生的電離輻射對人體有一定的損傷,且碘對比劑可能會使患者發(fā)生過敏反應(yīng)甚至腎功能損害。
目前,MRI 檢查以其無輻射、高軟組織對比及多參數(shù)成像被越來越多的患者所選擇,有學(xué)者研究[27-28]認(rèn)為增強(qiáng)T1WI影像組學(xué)模型對腫瘤組織淋巴結(jié)轉(zhuǎn)移及預(yù)后評估具有重要價值。由于在增強(qiáng)T1WI 序列中,動脈期的腫瘤與背景胰腺信號強(qiáng)度差異最大,因此本研究采用T1WI 動脈期影像組學(xué)預(yù)測PDAC 淋巴結(jié)轉(zhuǎn)移情況。降維處理后獲得5 個預(yù)測淋巴結(jié)轉(zhuǎn)移最優(yōu)的特征,分別為1個灰度共生矩陣特征、2個灰度行程矩陣特征、2 個灰度區(qū)域大小矩陣特征?;叶裙采仃嚳梢垣@得圖像中具有相似或特定強(qiáng)度的像素對的空間相關(guān)關(guān)系,灰度行程矩陣反映了圖像灰度關(guān)于方向、相鄰間隔和變化幅度等信息,灰度區(qū)域大小矩陣是在二維空間中記錄圖像區(qū)域內(nèi)有j個i元素相鄰的情況的出現(xiàn)次數(shù)或概率[29-30]。Shi 等[18]同樣基于T1WI 動脈期圖像進(jìn)行分析,該研究僅采用邏輯回歸分類器建立模型。而本研究除采用邏輯回歸模型外,還使用支持向量機(jī)和決策樹進(jìn)行建模。其中支持向量機(jī)模型的預(yù)測效能較邏輯回歸模型與決策樹模型好,AUC 在訓(xùn)練組與驗證組中分別為0.882 與0.726??傊瑯?gòu)建的3種機(jī)器學(xué)習(xí)模型在訓(xùn)練組均表現(xiàn)為較好的預(yù)測效能(AUC>0.8),雖在驗證組略有下降,但都維持在一個較理想的范圍內(nèi)(AUC>0.7)。
此外,由于胰腺不同部位的PDAC 淋巴結(jié)轉(zhuǎn)移途徑不同,本研究根據(jù)是否有淋巴結(jié)轉(zhuǎn)移將患者分為陽性組與陰性組。并進(jìn)行了淋巴結(jié)轉(zhuǎn)移陽性組與陰性組、訓(xùn)練組和驗證組間的臨床及病理資料的比較,結(jié)果顯示淋巴結(jié)轉(zhuǎn)移陽性組和陰性組間的年齡、性別、腫瘤部位、組織學(xué)分級、CA199 及T 分期等臨床及病理資料差異均無統(tǒng)計學(xué)意義。臨床病理資料在訓(xùn)練組與驗證組中差異無統(tǒng)計學(xué)意義提示臨床病理信息在組間分布具有均衡性,排除臨床和病理特征在影像組學(xué)模型中的潛在干擾因素。Bian 等[15]的研究同樣得出年齡、性別、腫瘤部位及組織學(xué)分級在淋巴結(jié)轉(zhuǎn)移陽性與陰性組間差異無統(tǒng)計學(xué)意義。Li 等[17]的研究發(fā)現(xiàn)年齡、性別及腫瘤部位在PDAC 患者淋巴結(jié)轉(zhuǎn)移陽性及陰性組間的差異無統(tǒng)計學(xué)意義,但組織學(xué)分級在兩組間差異有統(tǒng)計學(xué)意義。然而,通過組織學(xué)分級等臨床因素構(gòu)建的臨床模型在訓(xùn)練組及驗證組中預(yù)測效能欠佳。因此提示僅憑借臨床信息較難預(yù)測淋巴結(jié)轉(zhuǎn)移。在Shi 等[18]的最新研究中發(fā)現(xiàn)PDAC組織學(xué)分級在淋巴結(jié)轉(zhuǎn)移陽性與陰性組間差異有統(tǒng)計學(xué)意義,和本研究結(jié)果的差異可能與本研究樣本量較小有關(guān)。此外,Shi 等[18]的研究依據(jù)淋巴結(jié)轉(zhuǎn)移是否大于3例來進(jìn)行分組,與本研究的分組情況略有不同。因此后續(xù)研究將繼續(xù)擴(kuò)大樣本量,排除其他因素對實驗結(jié)果的影響。
本研究的局限性:(1)本研究是一項回顧性研究,外科醫(yī)師所清掃的淋巴結(jié)可能與影像上所觀察到的淋巴結(jié)不一致,較難獲得淋巴結(jié)病理和影像的精準(zhǔn)對應(yīng);(2)本研究僅采用TIWI 動脈期進(jìn)行建模,可能會丟失其他序列所提供的有用信息,后續(xù)將采用多期相、多序列聯(lián)合建模以期獲得一個最佳的預(yù)測模型;(3)由于是回顧性分析,部分臨床病理資料缺失的特征被排除在外,因而所納入臨床病理資料有限,可能忽略對預(yù)測淋巴結(jié)轉(zhuǎn)移有價值的臨床特征。因此,未來需要進(jìn)一步進(jìn)行多中心、大樣本研究,同時納入更全面的臨床特征以進(jìn)一步提高模型的魯棒性和預(yù)測效能。
綜上所述,基于T1WI 動脈期圖像提取影像組學(xué)特征構(gòu)建機(jī)器學(xué)習(xí)模型,能客觀反映PDAC 的空間形態(tài)學(xué)異質(zhì)性特征,在術(shù)前預(yù)測PDAC 淋巴結(jié)轉(zhuǎn)移方面具有較高的診斷效能,可幫助臨床獲得更準(zhǔn)確的診斷和分期。
作者利益沖突聲明:全體作者均聲明無利益沖突。