舒 洋,王彥平,何瑞星,丁 聰,丁漣沭,蔣 健*
1南京醫(yī)科大學(xué)附屬淮安第一醫(yī)院神經(jīng)外科,2放射科,江蘇 淮安 223300
膠質(zhì)瘤是中樞神經(jīng)系統(tǒng)最常見腫瘤[1]。我國腦膠質(zhì)瘤年發(fā)病率為5~8/10 萬,5 年病死率在全身腫瘤中僅次于胰腺癌和肺癌[2]。臨床實踐中,膠質(zhì)瘤治療方案與預(yù)后常借助病理與免疫組化共同決定[3]。隨著膠質(zhì)瘤發(fā)生機制的深入研究,更多有助于臨床診療和判斷預(yù)后的分子標(biāo)志物被相繼發(fā)現(xiàn)。腫瘤細胞的增殖方式和增殖速度與膠質(zhì)瘤的惡性程度及預(yù)后有極大關(guān)聯(lián)[4-5]。Ki67 作為細胞增殖階段表達的一種核抗原,很大程度上反映細胞的增殖活性[6-7]。正常腦組織中Ki67 表達水平較低,膠質(zhì)瘤細胞中Ki67 表達水平明顯較正常腦組織高,同時隨著膠質(zhì)瘤病理等級提高,Ki67表達水平也顯著提高,低級別膠質(zhì)瘤Ki67 顯著低于高級別膠質(zhì)瘤[8]。Ki67 存在半衰期較短的特性,在評價腫瘤的增殖活性方面優(yōu)于半衰期較長的增殖細胞核抗原。相關(guān)報道也表明Ki67與突變的異檸檬酸脫氫酶1(IDH1)基因密切相關(guān),因此Ki67 可以作為膠質(zhì)瘤的預(yù)后指標(biāo)[9-10]。目前Ki67指數(shù)還是依靠病理和免疫組化獲得,必須通過活檢和手術(shù),缺乏一種術(shù)前無創(chuàng)預(yù)測Ki67指數(shù)的方法[11]。隨著影像組學(xué)、人工智能的發(fā)展,醫(yī)療診斷及治療方案已較前不斷更新進步[12-13]。基于臨床醫(yī)學(xué)影像特征的多維度研究,不僅可預(yù)測腫瘤基因突變類型,同時對臨床制定治療方案和評估預(yù)后具有重要幫助[14]。影像組學(xué)通過提取疾病影像數(shù)據(jù)中包含的定量特征,找出疾病的影像標(biāo)志物,具有預(yù)測疾病分類、分級、無創(chuàng)、經(jīng)濟、高效和可重復(fù)及有助于臨床決策等優(yōu)點[15-16]。本研究嘗試通過影像組學(xué)與人工智能結(jié)合[17],以無創(chuàng)、方便、經(jīng)濟方式預(yù)測膠質(zhì)瘤Ki67 表達水平,以期滿足臨床膠質(zhì)瘤術(shù)前增殖活性程度預(yù)測及個性化治療需求。
本研究回顧收集南京醫(yī)科大學(xué)附屬淮安第一醫(yī)院經(jīng)手術(shù)病理結(jié)果證實的膠質(zhì)瘤患者334 例,剔除沒有免疫組化結(jié)果者102 例,剔除沒有MRI 增強序列者113 例,剔除同一診斷時期患有其他腫瘤患者病5 例,最終獲取113 例作為本研究對象。本研究經(jīng)南京醫(yī)科大學(xué)附屬淮安第一醫(yī)院倫理委員會批準(zhǔn),免除受試者知情同意。
1.2.1 MRI掃描
采用SIEMENS Aera 1.5T 磁共振成像儀及20通道頭部相控陣線圈采集患者的顱腦MRI 增強數(shù)據(jù)。軸位增強T1加權(quán)成像(enhancement T1-weighted image,T1WI+C)序列參數(shù):重復(fù)時間(time of repetition,TR)350 ms,回波時間(time of echo,TE)89 ms,矩 陣320×224,層厚5 mm,層間距1.5 mm,層數(shù)20,視野(field of view,F(xiàn)OV)230 mm×230 mm。
1.2.2 圖像分析
圖像來自南京醫(yī)科大學(xué)附屬淮安第一醫(yī)院圖像歸檔和通訊系統(tǒng)(picture archiving and communication systems,PACS)??紤]原始圖像之間參數(shù)存在一定差異性,選擇在提取膠質(zhì)瘤感興趣區(qū)(region of interest,ROI)前優(yōu)先對原序列圖像素進預(yù)處理。預(yù)處理包含重采樣、偏置場校正:圖像重采統(tǒng)一使患者MRI圖像的灰度值分布在1 k~2 k,考慮圖像對比度或像素亮度不一致對后續(xù)圖像特征采集存在一定偏差,將不同設(shè)備或掃描參數(shù)差異進行最小化,以0.5×0.5×0.5體素進行重采樣。使用MRIcroGL 圖像軟件手繪ROI?;颊哂行У?D ROI主要由2名具有10 年以上工作經(jīng)驗的神經(jīng)外科醫(yī)師獨立手動繪制,然后提交給另一位具有20年工作經(jīng)驗的神經(jīng)外科高級醫(yī)師進行審核,若審核醫(yī)師評定結(jié)果存在較大偏倚,則對原3D ROI進行重新修改或剔除。最終使用的ROI 為2 名醫(yī)師各自勾畫ROI 最有效區(qū)。ROI 勾畫標(biāo)準(zhǔn)為腫瘤特異性導(dǎo)致的強化區(qū)域,排除腫瘤周邊水腫區(qū)。
1.2.3 特征提取
影像特征提取基于Python3.7 的pyradiomics 模塊實現(xiàn),最終通過First Order、Shape、Glcm、Glszm、Glrlm、Ngtdm、Glim 等獲得1 338 個影像相關(guān)特征,特征定義和計算機算法在pyradiomics:https//pyradiomics.readthedocs.io/en/latest/官網(wǎng)可獲得。
1.2.4 影像特征篩選與降維
通過pyradiomics 模塊獲取的影像特征并非都與患者病理結(jié)果Ki67具有相關(guān)性,同時考慮提取數(shù)據(jù)變量存在差異性,先將經(jīng)病理結(jié)果證實的Ki67≤10設(shè)立影像組學(xué)標(biāo)簽“0”,將病理證實的Ki67>10設(shè)立影像組學(xué)標(biāo)簽“1”,然后將所有數(shù)據(jù)集進行歸一化處理,再將標(biāo)準(zhǔn)化的數(shù)據(jù)進行t檢驗剔除兩組數(shù)據(jù)間無統(tǒng)計學(xué)意義特征,最后通過最小絕對收縮與選擇算子Lasso算法,同時進行10次交叉驗證,最終引入最優(yōu)懲罰系數(shù)λ,對沉余量進行懲罰,逐步將不重要參數(shù)壓縮至0,降低自變量維度,從而進一步篩選出具有顯著意義的影像特征。
1.2.5 影像組學(xué)模型訓(xùn)練與驗證
影像組學(xué)聯(lián)合機器學(xué)習(xí)模型的建立基于Python(3.7.0)和機器學(xué)習(xí)庫sklearn等導(dǎo)入實現(xiàn),通過將數(shù)據(jù)集以8∶2拆分為訓(xùn)練集與測試集。將篩選后的數(shù)據(jù)進行交叉驗證,網(wǎng)格搜索獲取最優(yōu)C 值與gamma值等優(yōu)化參數(shù),再通過支持向量機學(xué)習(xí)算法進行訓(xùn)練并建立相應(yīng)的影像組學(xué)模型,測試集數(shù)據(jù)用于對訓(xùn)練好的模型進行驗證,最后結(jié)果以準(zhǔn)確度、靈敏度、特異度和受試者操作特征(receiver operat characterist,ROC)曲線下面積(area under the curve,AUC)表示。
本研究采樣SPSS 軟件進行相關(guān)統(tǒng)計學(xué)分析。使用卡方檢驗和獨立樣本t檢驗分析膠質(zhì)瘤患者高表達Ki67 與低表達Ki67 組年齡、性別、是否合并高血壓和是否誘發(fā)癲癇組間差異是否具有統(tǒng)計學(xué)意義,P<0.05 為差異具有統(tǒng)計學(xué)意義。采樣組間相關(guān)系數(shù)(inter classcorrelation coefficient,ICC)評估2名神經(jīng)醫(yī)師各自獲取病灶ROL影像特征的一致性,ICC>0.75 被認為一致性良好[16]。用ROC 曲線與模型校準(zhǔn)曲線評估模型區(qū)分效能,評估指標(biāo)為AUC與布里爾得分(Brier score)[18-19],分數(shù)越高預(yù)測結(jié)果越差,分數(shù)越低模型預(yù)測能力越好。
本研究共納入的113 例膠質(zhì)瘤患者中Ki67≤10共50 例(男27 例,女23 例),平均年齡(50.7±13.7)歲,Ki67>10 共63 例(男36 例,女27 例),平均年齡(52.9±13.0)歲。結(jié)果發(fā)現(xiàn)膠質(zhì)瘤Ki67≤10 和Ki67>10之間的年齡、性別、高血壓史、癲癇史差異沒有統(tǒng)計學(xué)意義(P>0.05,表1)。
表1 患者基本臨床信息與Ki67指數(shù)的關(guān)系Table 1 Relation between patient basic clinical information and the Ki67 index
2 名神經(jīng)外科醫(yī)師提取的ROI 影像特征ICC>0.75,表明2 名醫(yī)師提取ROI 具有較高的組間一致性。將所有數(shù)據(jù)集通過t檢驗共篩選出608 個具有差異性影像特征,選擇Lasso回歸,利用10次交叉驗證中最優(yōu)的λ選擇系數(shù)非零的最佳影像組學(xué)特征(圖1A),根據(jù)影像組學(xué)特征的Lasso 系數(shù)分布(圖1B),繪制最佳特征與權(quán)重圖(圖1C),同時將Lasso回歸篩選出6個特征進行組間差異分析并繪制熱度圖(圖1D)。
圖1 Lasso回歸運用于特征篩選Figure 1 Feature selection using Lasso
通過交叉網(wǎng)格搜索得到C 為0.5、gamma 為0.062 5,將最佳影像組學(xué)特征通過SVM算法建立膠質(zhì)瘤Ki67級別預(yù)測模型,應(yīng)用ROC 曲線分析模型,在訓(xùn)練集中的AUC 值、靈敏度、特異度、準(zhǔn)確度分別為0.82、0.71、0.79、0.72,在測試集中AUC 值、靈敏度、特異度、準(zhǔn)確度分別為0.91、0.88、0.88、0.83(圖2)。
圖2 模型預(yù)測訓(xùn)練集(A)和測試集(B)在膠質(zhì)瘤Ki67指數(shù)水平的受試者操作特征曲線Figure 2 Receiver operating characteristic curve of training set(A)and test set(B)for predicting the level of Ki67 indexes of gliomas
為進一步驗證預(yù)測概率與實際概率之間是否較大偏倚,利用預(yù)測模型校準(zhǔn)曲線對結(jié)果進行分析[20-21]。圖3可示實線代表的校準(zhǔn)線與理想模型代表的對角虛線存在一定偏差,但較接近吻合,布里爾得分0.175。
圖3 預(yù)測模型校準(zhǔn)曲線Figure 3 Calibration plot for the predictive model
膠質(zhì)瘤是中樞神經(jīng)系統(tǒng)占比最多、惡性程度最高、預(yù)后最差的腫瘤[22-23],患者常存在明顯的異質(zhì)性,手術(shù)聯(lián)合術(shù)后放化療仍是主要治療策略。膠質(zhì)瘤組織中存在大量不同類型細胞,這些細胞共同組成膠質(zhì)瘤增殖侵襲的特殊微環(huán)境[24-25]。隨著腫瘤相關(guān)免疫組化的發(fā)展,越來越多的腫瘤相關(guān)標(biāo)志物被相繼發(fā)現(xiàn),如Ki67、IDH、ATRX、BRAT、TP53 等,為膠質(zhì)瘤的診療帶來新的突破。其中反映細胞增殖活性及腫瘤惡性程度的細胞增殖標(biāo)志物Ki67指數(shù)常作為腦膠質(zhì)瘤惡性程度和預(yù)后的評估指標(biāo)之一[26],但Ki67指數(shù)只能通過術(shù)后病理免疫組化獲得,亟待一種無創(chuàng)的方式在術(shù)前大致掌握腫瘤Ki67指數(shù)水平,評估膠質(zhì)瘤惡性程度,以制定更準(zhǔn)確的手術(shù)策略。近年來,影像組學(xué)越來越成為研究熱點[27]。影像組學(xué)是以影像特征為基礎(chǔ)的一種輔助臨床決策的新興研究策略[28]。目前廣泛應(yīng)用于腫瘤良惡性鑒別、術(shù)前腫瘤分期預(yù)測、基因突變及生存預(yù)后等領(lǐng)域[29-30]。相比于傳統(tǒng)醫(yī)學(xué)影像資料分析,基于人工智能下的圖像分析具有更大能力,運用于影像組學(xué)中也具有更大潛能[31]。大數(shù)據(jù)背景下醫(yī)學(xué)影像與人工智能的多學(xué)科交叉,可能為未來精準(zhǔn)醫(yī)療的發(fā)展帶來新的契機[32]。
本研究通過算法提取高通量特征,深入挖掘影像圖像中潛在的臨床價值,同時選擇對高維度數(shù)據(jù)分析算法Lasso 回歸模型進行最終特征提取,同時為避免特征出現(xiàn)過擬合現(xiàn)象,利用交叉驗證選擇最優(yōu)參數(shù),最后共篩選出6 項最有價值影像特征?;谛g(shù)前影像組學(xué)篩選的最優(yōu)特征與SVM 機器學(xué)習(xí)模型作為分類器,對膠質(zhì)瘤細胞增殖活性進行預(yù)測,該研究采用ROC曲線的AUC值等對模型訓(xùn)練集和測試集進行評估,同時采用校準(zhǔn)曲線的布爾里得分評估模型對膠質(zhì)瘤Ki67 指數(shù)分類的實際偏倚。AUC 越接近1,表明分類效能越好[33-34]。本研究構(gòu)建的模型在訓(xùn)練集、測試集AUC 分別為0.82、0.91,表明預(yù)測模型具有較好的區(qū)分能力;同時校準(zhǔn)曲線與理想曲線偏差小,吻合度較好(布爾里得分為0.175),表明該模型具有較好的預(yù)測效能,有望成為術(shù)前預(yù)測膠質(zhì)瘤細胞增殖活性的輔助方法。
本研究影像特征提取通過ROI 勾畫獲得,ROI勾畫方式很多,有手動勾畫、半自動勾畫、自動化勾畫等。大多認為計算機自動算法勾畫ROI 省時省力,同時避免源于主觀因素影響。也有學(xué)者認為影像科專業(yè)醫(yī)師基于專業(yè)背景更有助于繪制準(zhǔn)確的ROI。但本研究基于影像圖像及病理狀態(tài),圖像特征與腫瘤術(shù)中形態(tài)、質(zhì)地等具有很大差異性,由經(jīng)驗豐富的神經(jīng)外科醫(yī)師繪制可能更具有效性。
本研究的局限性在于:①研究樣本量相對不足,因此僅對訓(xùn)練模型進行了內(nèi)部測試,未進行外部驗證,后續(xù)會進一步引入多中心外部驗證;②本研究僅通過影像組學(xué)特征建立單一Ki67預(yù)測模型,在后續(xù)研究中會引入更多臨床資料及多種相關(guān)免疫組化預(yù)測模型進一步完善不足;③本研究采用支持向量機建模,而機器學(xué)習(xí)模型種類多,如邏輯分析、決策樹、隨機森林、梯度提升樹等,在后續(xù)的研究中我們會增加多中心研究進行多模型比較,同時進一步優(yōu)化模型,彌補不足,以期為臨床應(yīng)用提供更優(yōu)的模型。
綜上所述,基于T1WI+C 的支持向量機算法構(gòu)建的膠質(zhì)瘤細胞增殖活性預(yù)測模型,可能是術(shù)前預(yù)測細胞增殖活性程度的一種新途徑,有望為患者個性化治療提供參考依據(jù)。