張瑞平,劉伯楊,羅延安,王志震,李 鵬*
(1.天津醫(yī)科大學(xué)腫瘤醫(yī)院,國家腫瘤臨床醫(yī)學(xué)研究中心,天津市腫瘤防治重點(diǎn)實(shí)驗(yàn)室,天津市惡性腫瘤臨床醫(yī)學(xué)研究中心,天津300060;2.南開大學(xué)物理科學(xué)學(xué)院,天津300071)
肺癌是常見的惡性腫瘤之一,并且預(yù)后較差,5 a的生存期僅為16%[1],其中小細(xì)胞肺癌(small cell lung cancer,SCLC)的比例占肺癌的15%~20%[2]。小細(xì)胞肺癌多與吸煙有關(guān),具有惡性程度高、病情進(jìn)展快、較早發(fā)生轉(zhuǎn)移、易復(fù)發(fā)和耐藥且長(zhǎng)期存活率低的特點(diǎn),臨床上常采用美國退伍軍人醫(yī)院兩期法分為局限期小細(xì)胞肺癌(limited stage-small cell lung cancer,LS-SCLC)和廣泛期小細(xì)胞肺癌(extensive stage-small cell lung cancer,ES-SCLC)以及采用國際抗癌聯(lián)盟(Union for International Cancer Control,UICC)肺癌TNM 方法進(jìn)行分期,多數(shù)患者確診時(shí)已處于廣泛期或無法切除的局限期。小細(xì)胞肺癌治療手段主要以化療和放療為主,尤其Ⅱ、Ⅲ期小細(xì)胞肺癌患者的預(yù)后更差,在臨床中多采取放化療聯(lián)合治療,即依托泊苷聯(lián)合鉑類藥物化療加同步放射治療的標(biāo)準(zhǔn)治療方案(總放療劑量為60~70 Gy[3],采用常規(guī)分割方式),如果患者身體狀況良好,可盡早開始同步放化療,有利于提高患者的預(yù)后效果。由于小細(xì)胞肺癌的特殊生理學(xué)特點(diǎn),即使一線治療對(duì)小細(xì)胞肺癌患者產(chǎn)生良好的反應(yīng),但小細(xì)胞肺癌的預(yù)后仍然令人沮喪,大多數(shù)患者在完成初始治療后6 個(gè)月內(nèi)復(fù)發(fā),導(dǎo)致局限期和廣泛期患者的中位生存期分別為15~20 個(gè)月和8~13 個(gè)月[3]。如果能夠提早預(yù)測(cè)患者的預(yù)后,根據(jù)患者的預(yù)后差異,提早干預(yù),制訂個(gè)性化的治療方案,將會(huì)有利于提高患者的治療效果。近年來,放療技術(shù)及影像技術(shù)的不斷提高以及分子影像PET-CT等檢查的普及使得肺癌的診斷和治療更加精準(zhǔn),但在早期階段預(yù)測(cè)預(yù)后療效方面依舊采用較為籠統(tǒng)的預(yù)測(cè)方式,而不能實(shí)現(xiàn)精準(zhǔn)的個(gè)性化治療,因此,亟須探索一種精準(zhǔn)的個(gè)體化的預(yù)測(cè)模式。在臨床的實(shí)際應(yīng)用中,CT 通常作為腫瘤的常規(guī)檢查和隨訪檢查方式,還可用于放療的三維治療計(jì)劃設(shè)計(jì)。目前基于CT 影像的放射組學(xué)[4]被廣泛應(yīng)用于預(yù)測(cè)預(yù)后和早期診斷,其是一種非侵入式、大通量、定量分析圖像的方法,并且能在不增加患者經(jīng)濟(jì)負(fù)擔(dān)的前提下從影像上挖掘腫瘤內(nèi)部結(jié)構(gòu)信息進(jìn)行定量分析。目前多維參數(shù)諾模圖[5-6]具有將多個(gè)預(yù)測(cè)參數(shù)進(jìn)行有機(jī)結(jié)合以及將復(fù)雜問題簡(jiǎn)單化的優(yōu)勢(shì),能夠直觀分析患者的預(yù)后,在醫(yī)學(xué)領(lǐng)域中得到了廣泛應(yīng)用,為腫瘤的多角度和多方位研究提供了強(qiáng)有力的手段。本研究基于放射組學(xué)特征和臨床參數(shù)構(gòu)建多參數(shù)諾模圖模型預(yù)測(cè)局限期小細(xì)胞肺癌的預(yù)后,為個(gè)性化治療實(shí)施奠定研究的基礎(chǔ)。
回顧性分析2011—2018 年就診于天津醫(yī)科大學(xué)腫瘤醫(yī)院放療科的局限期小細(xì)胞肺癌患者的病例資料。納入標(biāo)準(zhǔn):經(jīng)病理學(xué)或細(xì)胞學(xué)證實(shí)為小細(xì)胞肺癌或混合型小細(xì)胞肺癌(combined small cell lung cancer,CSCLC)的患者,并且按照2009 年版UICC肺癌TNM 分期重新進(jìn)行臨床分期。排除標(biāo)準(zhǔn):放療前接受過任何肺部手術(shù)的患者;因其他肺部疾病曾經(jīng)接受過放療的患者;CT 圖像缺失和沒有明確組織學(xué)病理的患者。最終納入122 例病例,記錄患者的基本臨床信息,包括年齡、性別、吸煙狀態(tài)、臨床分期和病理;收集用于治療計(jì)劃設(shè)計(jì)的CT 圖像并將其進(jìn)行標(biāo)準(zhǔn)化處理。
放療結(jié)束后的前2 a,每3 個(gè)月行強(qiáng)化CT 掃描,之后每6 個(gè)月行強(qiáng)化CT 掃描。生存期(overall survival,OS)定義為從診斷日期至死亡日期或最后一次隨訪日期。
由2 名具有5 a 以上工作經(jīng)驗(yàn)的診斷醫(yī)生和臨床醫(yī)生再一次確認(rèn)腫瘤靶區(qū)(gross tumor volume,GTV),將用于治療計(jì)劃制訂的CT 圖像(層厚為3 mm,像素為1.25 mm×1.25 mm)和GTV 以DICOM 格式傳輸?shù)椒派浣M學(xué)云平臺(tái)(Radcloud,version 2.1.2),同時(shí)將所有CT 圖像重新采樣為1 mm×1 mm×1 mm,然后利用平臺(tái)中的3 個(gè)組學(xué)模塊分別提取GTV 的組學(xué)特征:(1)First-order 特征;(2)形狀特征;(3)紋理特征。
將122 例病例按照8∶2 的比例分成訓(xùn)練集和驗(yàn)證集,先對(duì)訓(xùn)練集進(jìn)行特征標(biāo)準(zhǔn)化和特征選擇,然后根據(jù)選擇的組學(xué)特征進(jìn)行預(yù)測(cè)模型的構(gòu)建,同時(shí)利用訓(xùn)練集中獲得的相關(guān)統(tǒng)計(jì)參數(shù)對(duì)驗(yàn)證集的特征進(jìn)行標(biāo)準(zhǔn)化和特征選取,最后基于驗(yàn)證集對(duì)模型進(jìn)行評(píng)估。以上過程均基于Python3.6 語言,在Anaconda3平臺(tái)上完成。
為了避免在數(shù)據(jù)處理過程中出現(xiàn)過擬合現(xiàn)象,研究者對(duì)所有臨床參數(shù)和組學(xué)特征進(jìn)行標(biāo)準(zhǔn)化處理。在臨床參數(shù)方面,先對(duì)訓(xùn)練集進(jìn)行十折交叉驗(yàn)證,然后基于Akaike 信息標(biāo)準(zhǔn)(Akaike’s information creterion,AIC)[7],通過完全搜索所有可能的參數(shù)組合子集找到最佳的參數(shù)子集,再利用Cox 比例風(fēng)險(xiǎn)回歸構(gòu)建諾模圖預(yù)測(cè)模型。在放射組學(xué)方面,利用最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)-Cox 比例風(fēng)險(xiǎn)模型[8-10]并結(jié)合交叉驗(yàn)證方法對(duì)組學(xué)特征進(jìn)行降維處理[11-12]:先基于最小均方誤差對(duì)訓(xùn)練集進(jìn)行十折交叉驗(yàn)證并選擇出模型正則化參數(shù)值?,再根據(jù)最優(yōu)的?值構(gòu)建LASSOCox 模型。其中權(quán)重非零的組學(xué)特征被選擇出來,并按其各自權(quán)重進(jìn)行線性組合計(jì)算得到Rad_score 函數(shù)值,然后將Rad_score 函數(shù)值與選擇出的臨床參數(shù)相結(jié)合構(gòu)建聯(lián)合預(yù)測(cè)模型。
在本研究中利用Cox 比例風(fēng)險(xiǎn)回歸創(chuàng)建了2個(gè)小細(xì)胞肺癌的生存期諾模圖模型,其中一個(gè)基于組學(xué)特征和臨床參數(shù),另一個(gè)僅基于臨床參數(shù)。通過Harrell 一致性指數(shù)(concordance index,CI)[13]和Brier分?jǐn)?shù)對(duì)預(yù)測(cè)模型進(jìn)行評(píng)估。利用Rad_score 中位數(shù)值作為截?cái)嘀祵⒄麄€(gè)樣本分為高危組和低危組,并利用Kaplan-Meier(KM)方法預(yù)測(cè)2 組生存曲線,同時(shí)采用Log-rank 檢驗(yàn)[14]對(duì)高危組和低危組的中位生存期進(jìn)行比較分析,P<0.05 認(rèn)為具有統(tǒng)計(jì)學(xué)意義。
本研究共納入了122 例患者,其中男性84 例、女性38 例,≤60 歲78 例,61~69 歲35 例,≥70 歲9例。在臨床分期中,ⅡA 期4 例(占3.3%),ⅢA 期61例(占50.0%),ⅡB 期7 例(占5.7%),ⅢB 期為50例(占41.0%)。病理分析報(bào)告結(jié)果顯示,小細(xì)胞肺癌112例(占91.8%),混合型小細(xì)胞肺癌10 例(占8.2%)。82 例(占67.2%)患者處于吸煙狀態(tài),40 例(占32.8%)患者為不吸煙。本研究隨訪至2018 年3 月,中位隨訪時(shí)間為19 個(gè)月(范圍為5.0~40.2 個(gè)月),中位總生存期為14 個(gè)月。
在臨床參數(shù)方面,選擇了3 個(gè)有預(yù)測(cè)價(jià)值的參數(shù),分別為臨床分期、病理和吸煙狀態(tài);在放射組學(xué)特征方面,選擇了4 個(gè)有預(yù)測(cè)價(jià)值的特征,其中3個(gè)是紋理特征(Square_GLRLM_RunEntropy、Wavelet.HLL_GLCM_IDMN 和Wavelet.HLL_GLCM_IDN),1 個(gè)是First-order 特征(Wavelet.HLL_FirstOrder_InterquartileRange)。同時(shí)基于篩選組學(xué)特征創(chuàng)建的Rad_score函數(shù)如下所示:
Rad_score=Wavelet.HLL_GLCM_IDMN×0.09926913+Square_GLRLM_RunEntropy×0.04815856+Wavelet.HLL_GLCM_IDN×0.00382770+Wavelet.HLL_FirstOrder_InterquartileRange×0.08657353
圖1(a)、(b)分別為基于組學(xué)特征和臨床參數(shù)的聯(lián)合諾模圖,以及僅基于臨床參數(shù)的諾模圖,模型預(yù)測(cè)了Ⅱ、Ⅲ期小細(xì)胞肺癌1 a、15 個(gè)月和2 a 的生存期狀況;圖1(c)、(d)分別為圖1(a)、(b)的校準(zhǔn)圖。從諾模圖中可以看出,當(dāng)Rad_score 組學(xué)因素加入到模型計(jì)算中時(shí),臨床參數(shù)的影響變得相對(duì)薄弱。在圖1(b)中,有預(yù)測(cè)價(jià)值的吸煙狀態(tài)和臨床分期參數(shù)對(duì)預(yù)測(cè)模型存在統(tǒng)計(jì)學(xué)意義,其P<0.05。聯(lián)合組學(xué)特征和臨床參數(shù)的模型(CI:0.641;95%CI:0.610~0.672)預(yù)測(cè)能力優(yōu)于單純臨床參數(shù)模型(CI:0.596;95%CI:0.593~0.599)的預(yù)測(cè)能力(P=0.04),組學(xué)特征在預(yù)測(cè)局限期小細(xì)胞肺癌方面具有統(tǒng)計(jì)學(xué)意義。整個(gè)樣本的KM 生存曲線如圖2(a)所示,以Rad_score 的中位數(shù)作為截?cái)嘀祵颖痉譃楦呶=M和低危組,其KM曲線如圖2(b)所示。利用Log-rank 方法比較2 組的生存期,高危組和低危組的中位生存期分別為12 個(gè)月和17 個(gè)月,2 組之間存在顯著差異,P<0.000 1。
圖2 基于整個(gè)樣本和基于分層樣本的生存曲線圖
本研究聯(lián)合組學(xué)特征和臨床參數(shù),利用可視化諾模圖建立模型預(yù)測(cè)放療后局限期小細(xì)胞肺癌的總生存期。為了與傳統(tǒng)預(yù)測(cè)方法比較,本研究不僅構(gòu)建了單純基于臨床參數(shù)的預(yù)測(cè)模型,還構(gòu)建了基于組學(xué)特征和臨床參數(shù)的聯(lián)合預(yù)測(cè)模型,結(jié)果表明聯(lián)合預(yù)測(cè)模型優(yōu)于僅基于臨床參數(shù)的預(yù)測(cè)模型(P=0.04),但對(duì)2 個(gè)模型進(jìn)行驗(yàn)證時(shí),發(fā)現(xiàn)2 個(gè)模型的驗(yàn)證曲線不存在顯著統(tǒng)計(jì)學(xué)差異[如圖1(c)、(d)所示,P>0.05]。為此,本研究進(jìn)一步探討了2 類參數(shù)在預(yù)測(cè)預(yù)后方面的效能,并對(duì)篩選出來的臨床參數(shù)和組學(xué)特征進(jìn)行了預(yù)后價(jià)值的比較。在單純基于臨床參數(shù)的預(yù)測(cè)模型中,吸煙狀態(tài)(P<0.01)、ⅡB 期(P<0.01)、ⅢA期(P<0.01)及ⅢB 期(P<0.001)均存在統(tǒng)計(jì)學(xué)預(yù)測(cè)價(jià)值,其評(píng)價(jià)指標(biāo)P 值均<0.05。考慮臨床參數(shù)在預(yù)測(cè)小細(xì)胞肺癌的預(yù)后價(jià)值時(shí),有文獻(xiàn)[15]報(bào)道,腫瘤的臨床分期是其獨(dú)立的預(yù)后因素,如果在其模型中加入放射組學(xué)特征后,這些有預(yù)測(cè)價(jià)值的臨床參數(shù)的預(yù)測(cè)能力變得相對(duì)薄弱,其P 值均>0.05。出現(xiàn)此現(xiàn)象的最大原因可能是組學(xué)特征的預(yù)測(cè)效能遠(yuǎn)遠(yuǎn)優(yōu)于臨床參數(shù)的預(yù)測(cè)效能,在回歸模型的線性參數(shù)中,臨床參數(shù)的權(quán)重變得很小,以至于不能對(duì)線性函數(shù)產(chǎn)生實(shí)質(zhì)性影響;再者組學(xué)特征能更好地描述腫瘤內(nèi)部結(jié)構(gòu)的異質(zhì)性,有文獻(xiàn)報(bào)道腫瘤的異質(zhì)性與對(duì)治療產(chǎn)生抗拒性的基因異質(zhì)性表達(dá)有關(guān)聯(lián)性[4,16],很大可能是在治療過程中腫瘤內(nèi)部結(jié)構(gòu)發(fā)生了較大變化,使其臨床參數(shù)在某種程度上弱化了其預(yù)測(cè)能力。
圖1 聯(lián)合臨床參數(shù)和組學(xué)特征以及僅基于臨床參數(shù)的諾模圖模型和諾模圖預(yù)測(cè)模型的校準(zhǔn)圖
此外,為進(jìn)一步探索組學(xué)特征的預(yù)測(cè)能力,本研究根據(jù)Rad_score 的中位值將樣本分為高危組和低危組,結(jié)果發(fā)現(xiàn)2 組存在5 個(gè)月的生存期差異,如果在一開始制訂治療方案時(shí)未能進(jìn)行合理分組,高危組的患者很容易被納入到低危組,錯(cuò)過了必要的額外醫(yī)療服務(wù),反之,低危組的患者也可能被納入到高危組,使其接受了過度治療。因此,放射組學(xué)在預(yù)測(cè)小細(xì)胞肺癌的預(yù)后方面起到了至關(guān)重要的作用,能在治療前對(duì)患者進(jìn)行精準(zhǔn)分組(P<0.000 1),實(shí)現(xiàn)精準(zhǔn)個(gè)性化治療并優(yōu)化治療方案。
本研究存在一定的局限性,具體包括2 個(gè)方面:一是混合型的小細(xì)胞肺癌病例相對(duì)較少,導(dǎo)致樣本數(shù)據(jù)的不均衡,可能影響本研究結(jié)論的普適性;二是在掃描CT 圖像時(shí),患者處于自由呼吸狀態(tài),未考慮患者的呼吸運(yùn)動(dòng)對(duì)圖像的影響,可能會(huì)影響提取的放射組學(xué)特征的不穩(wěn)定性和重復(fù)性。有研究報(bào)道[17-18]呼吸運(yùn)動(dòng)會(huì)影響放射組學(xué)的提取,應(yīng)最大限度在掃描CT 圖像時(shí)訓(xùn)練患者達(dá)到均勻呼吸。
基于以上局限,我們?cè)趯淼难芯恐袝?huì)進(jìn)一步細(xì)化混合型小細(xì)胞肺癌的病理分類,比如腺癌成分或鱗狀細(xì)胞癌成分或大細(xì)胞癌成分等,使研究結(jié)果能更好地為臨床工作服務(wù),為精準(zhǔn)個(gè)性化治療奠定前期基礎(chǔ)。