何耀明, 李尚仁, 李曉平, 王成興, 譚群英, 梁偉俊, 周朝榮, 趙景林△
(江門市中心醫(yī)院 a.胃腸外科;b.乳腺外科,廣東 江門 529000)
結(jié)腸癌是常見惡性腫瘤,根據(jù)2014年中國惡性腫瘤發(fā)病和死亡分析報告[1],結(jié)腸癌發(fā)病率位于惡性腫瘤的第3位,每年新發(fā)病例數(shù)約37萬,每年因結(jié)直腸癌死亡患者18萬,位居第5位。隨著我國腸鏡檢查的逐漸普及,結(jié)直腸癌的病死率不但無顯著下降,而且高齡(≥65歲)患者病死率逐年上升,加上社會老齡化問題越來越嚴(yán)重,降低老年人結(jié)直腸癌病死率具有重要意義。腫瘤組織具有特殊的能量代謝特點,盡管在有氧環(huán)境下,腫瘤細(xì)胞始終以糖酵解這種快速產(chǎn)生ATP的糖代謝方式為細(xì)胞生長、增殖提供能量,即著名的Warburg效應(yīng)[2]。目前多認(rèn)為,糖酵解相關(guān)基因[如缺氧誘導(dǎo)因子1α(HIF-1α)[3]、葡萄糖轉(zhuǎn)運蛋白-1(GLUT-1)[4]、己糖激酶2(HK-2)[5]等]在結(jié)直腸癌組織中表達(dá)增加,基因[如GLUT-1、乳酸脫氫酶(LDH-A)、丙酮酸激酶同工酶2(PKM2)等]在結(jié)腸癌肝轉(zhuǎn)移瘤中比原發(fā)灶有更高表達(dá)[6],均提示糖酵解相關(guān)基因與結(jié)腸癌發(fā)生、進(jìn)展有重要作用。早發(fā)現(xiàn)、早治療、早干預(yù)可降低結(jié)腸癌病死率,若每個結(jié)直腸癌術(shù)后患者能縮短檢查周期,提早發(fā)現(xiàn)隱匿病灶并及時處理,對延長患者的生存率有重要意義,但過度檢查會造成醫(yī)療資源浪費,所以一個預(yù)測模型的應(yīng)用[7],可將高危結(jié)腸癌患者區(qū)分開,從而有針對性地提早干預(yù)時間,是降低結(jié)直腸癌患者死亡的有效途徑之一。然而,目前針對老年結(jié)直腸癌患者預(yù)后預(yù)測模型的報道較少,因此,本研究根據(jù)糖酵解相關(guān)基因結(jié)腸癌發(fā)生、進(jìn)展的重要作用,基于TCGA結(jié)直腸癌數(shù)據(jù)庫,確定與老年結(jié)直腸癌進(jìn)展的相關(guān)風(fēng)險基因及其相關(guān)系數(shù),聯(lián)合各項臨床指標(biāo),建立老年結(jié)直腸癌的預(yù)后預(yù)測模型,從而為高危老年結(jié)直腸癌患者提早干預(yù)提供依據(jù)。
1.1 資料 從TCGA數(shù)據(jù)庫獲得結(jié)直腸癌轉(zhuǎn)錄組數(shù)據(jù)和相關(guān)臨床資料(https://www.cancer.gov/) (Tomczak, Czerwinska & Wiznerowicz, 2015)。再進(jìn)一步從中篩選出年齡≥65歲的結(jié)直腸癌患者相關(guān)數(shù)據(jù)用作分析,其中包含癌旁或正常組織32例,腫瘤組織340例,用于生存分析包含完整隨訪信息的患者321例,糖酵解相關(guān)基因集通過MsigDB數(shù)據(jù)庫獲得(http://www.hmdb.ca)。包括BIOCARTA_GLYCOLYSIS_PATHWAY,GOBP_FRUCTOSE_1_6_BISPHOSPHATE_METABOLIC_PROCESS,HALLMARK_GLYCOLYSIS,GOMF_LACTATE_TRANSMEMBRANE_TRANSPORTER_ACTIVITY,GOBP_LACTATE_TRANSMEMBRANE_TRANSPORT,KEGG_GLYCOLYSIS_GLUCONEOGENESIS,MODULE_306,REACTOME_GLYCOLYSIS,WP_GLYCOLYSIS_AND_GLUCONEOGENESIS 9個基因集。
1.2 方法
1.2.1 基因功能富集分析和差異分析獲得糖酵解差異表達(dá)基因 上述糖酵解基因集通過GSEA 4.1.0分析軟件進(jìn)行結(jié)直腸癌腫瘤組織和正常組織的基因富集分析,分析結(jié)果以標(biāo)準(zhǔn)化富集分?jǐn)?shù)(NES)>1.5和P值(P<0.05)設(shè)定臨界值,獲得相關(guān)糖酵解基因集。 從相關(guān)糖酵解基因集中提取基因,在TCGA數(shù)據(jù)集提取患者糖酵解相關(guān)基因的表達(dá)矩陣,表達(dá)矩陣使用“edgeR”包歸一化處理,使用Log2FC>1和錯誤發(fā)現(xiàn)率(fales discovery rate,FDR)<0.05作為臨界值,對腫瘤組織和正常組織相關(guān)糖酵解基因的表達(dá)量進(jìn)行差異分析,獲得糖酵解差異表達(dá)基因。
1.2.3 風(fēng)險模型的效能驗證 由TCGA數(shù)據(jù)獲得的風(fēng)險模型,通過單因素COX回歸和多因素COX回歸明確獨立預(yù)后影響因子,包括:風(fēng)險分?jǐn)?shù)、性別、腫瘤分期、淋巴管浸潤、脈管浸潤。風(fēng)險模型的驗證分別在內(nèi)部臨床不同的亞組和外部GEO (https://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)集GSE17536兩方面進(jìn)行,高低風(fēng)險組結(jié)果對比使用Kaplan-Meier生存分析,ROC曲線計算AUCs值,評估風(fēng)險模型的預(yù)測效能。
1.2.4 繪制列線圖 根據(jù)多因素COX回歸分析的結(jié)果,繪制分期,腫瘤位置(右側(cè):升結(jié)腸、橫結(jié)腸;左側(cè):結(jié)腸脾曲、降結(jié)腸、乙狀結(jié)腸、直腸)、分?jǐn)?shù)的列線圖,預(yù)測1、3、5 a的生存率,列線圖通過C-index和校準(zhǔn)圖,臨床決策曲線分析法,ROC曲線進(jìn)行預(yù)測效能驗證效能。
2.1 老年結(jié)腸癌患者腫瘤組織和正常組織糖酵解相關(guān)基因集富集分析結(jié)果 通過GSEA富集分析9個糖酵解相關(guān)基因集發(fā)現(xiàn),HALLMARK_GLYCOLYSIS和REACTOME_GLYCOLYSIS兩個基因集在老年結(jié)腸癌患者的腫瘤組織對比正常組織,糖酵解相關(guān)基因富集差異顯著。從這兩個顯著基因集中獲得糖酵解相關(guān)基因254個,再與老年結(jié)直腸癌轉(zhuǎn)錄數(shù)據(jù)合并,得到老年結(jié)直腸癌糖酵解相關(guān)基因表達(dá)矩陣,進(jìn)行下一步基因差異表達(dá)分析。見表1,圖1。
表1 糖酵解基因集GSEA富集分析
注:A:HALLMARK_GLYCOLYSIS;B:REACTOME_GLYCOLYSIS圖1 腫瘤組織與正常組織GSEA富集分析結(jié)果
2.2 糖酵解差異表達(dá)基因結(jié)果 從老年結(jié)直腸癌腫瘤基因表達(dá)數(shù)據(jù)和臨床數(shù)據(jù)(340個腫瘤組織樣品和32個癌旁正常組織樣品),結(jié)合獲得的254個糖酵解相關(guān)基因,以Log2FC>1和FDR<0.05作為臨界值進(jìn)行差異分析,獲得糖酵解差異基因46個,其中上調(diào)基因37個,下調(diào)基因9個。見圖2。
注:A:熱圖展示254個糖酵解相關(guān)基因在腫瘤組織和正常組織中的表達(dá)情況;B:火山圖展示老年結(jié)直腸癌腫瘤組織對比正常組織,37個基因顯著上調(diào),9個基因顯著下調(diào)圖2 老年結(jié)直腸癌糖酵解相關(guān)基因在340個腫瘤組織和32個癌旁正常組織的表達(dá)差異分析
2.3 糖酵解基因風(fēng)險模型構(gòu)建
2.3.1 篩選預(yù)后相關(guān)糖酵解基因 結(jié)合老年結(jié)直腸癌患者生存資料及差異表達(dá)糖酵解基因的表達(dá)矩陣,使用COX單因素回歸方程,得到CAPN5、STC2、VEGFA、FKBP4、PKP2、NDC1、DEPDC1、COL5A1、TGFA、ANKZF1、GOT2 11個風(fēng)險相關(guān)基因,再根據(jù)LASSO回歸模型進(jìn)一步優(yōu)化,最終確認(rèn)模型風(fēng)險基因CAPN5、STC2、VEGFA、FKBP4、PKP2、NDC1、COL5A1、TGFA、ANKZF1、GOT2及其分子系數(shù)coefi。見圖3。
注:A:單因素COX回歸獲得11個預(yù)后風(fēng)險相關(guān)糖酵解基因;B-C:LASSO回歸進(jìn)一步優(yōu)化確定10個風(fēng)險相關(guān)基因及其分子系數(shù)圖3 構(gòu)建預(yù)后風(fēng)險模型
2.3.2 構(gòu)建風(fēng)險模型 根據(jù)糖酵解相關(guān)基因的表達(dá)量和對應(yīng)的分子系數(shù),計算得出各個患者的風(fēng)險分?jǐn)?shù),根據(jù)風(fēng)險分?jǐn)?shù)中位值將患者分為高風(fēng)險組及低風(fēng)險組,Kaplan-Meier生存分析提示高風(fēng)險組患者生存期顯著短于低風(fēng)險組,P=0.000 1,ROC曲線分析,1、3、5 a生存率的AUC值分別為0.705、0.730、0.674。見圖4。
注:A:根據(jù)患者風(fēng)險分?jǐn)?shù)由低到高排序分為高風(fēng)險組和低風(fēng)險組;B:高低風(fēng)險組患者生存狀態(tài);C:高低風(fēng)險組糖酵解預(yù)后基因的表達(dá);D:高低風(fēng)險組的Kaplan-Meier生存分析;E:ROC曲線圖4 預(yù)后風(fēng)險模型的構(gòu)建
進(jìn)行單因素和多因素COX回歸,評價老年結(jié)直腸癌的影響預(yù)后的獨立因素,結(jié)果發(fā)現(xiàn),在單因素COX回歸分析中,分期、脈管浸潤、淋巴管浸潤和風(fēng)險分?jǐn)?shù)是老年結(jié)直腸癌預(yù)后的獨立因素,而在多因素COX回歸分析中,只有分期和風(fēng)險分?jǐn)?shù)是影響老年結(jié)直腸癌預(yù)后的獨立因素。見圖5。
注:A:單因素COX回歸;B:多因素COX回歸圖5 影響老年結(jié)直腸癌預(yù)后的獨立因素
2.4 風(fēng)險分?jǐn)?shù)模型效能外驗證 GEO數(shù)據(jù)GSE17536中年齡≥65歲患者進(jìn)行風(fēng)險模型外驗證,外驗證數(shù)據(jù)集中包括老年結(jié)直腸癌患者99例,根據(jù)TCGA老年結(jié)直腸癌風(fēng)險分?jǐn)?shù)中位數(shù)0.148 9作為臨界值,將外驗證數(shù)據(jù)集分為高風(fēng)險組46例,低風(fēng)險組53例。進(jìn)行Kaplan-Meier生存分析提示高風(fēng)險組患者生存期短于低風(fēng)險組,差異有統(tǒng)計學(xué)意義(P=0.023)。見圖6。
圖6 外驗證數(shù)據(jù)集GSE17536老年結(jié)直腸癌患者Kaplan-Meier生存分析
2.5 老年結(jié)直腸癌預(yù)測模型的構(gòu)建 根據(jù)COX回歸分析結(jié)果,基于患者風(fēng)險得分,淋巴管浸潤、脈管浸潤、T分期、N分期、M分期構(gòu)建列陣圖,預(yù)測老年結(jié)直腸癌患者1、3、5 a生存率。使用C-index,校準(zhǔn)曲線,ROC曲線,臨床決策曲線(DCA)評估列陣圖對老年結(jié)直腸癌患者的預(yù)測效能。預(yù)測模型C-index=0.730 48,校準(zhǔn)曲線與理想曲線相近,ROC曲線評價提示模型預(yù)測1、3、5 a生存率的AUC值分別為0.766、0.742、0.783。均提示模型具有良好的預(yù)測效能。見圖7。
注:A:構(gòu)建列陣圖預(yù)測老年結(jié)直腸癌患者生存率;B:預(yù)測模型的ROC曲線,預(yù)測1、3、5 a生存的AUC值分別是0.766、0.742、0.783;C:預(yù)測1、3、5 a生存率的校準(zhǔn)曲線;D-F:1、3、5 a生存預(yù)測模型的臨床決策曲線圖7 老年結(jié)直腸癌預(yù)測模型的構(gòu)建
結(jié)直腸癌是我國常見惡性腫瘤,雖然其患者的病死率基本與以往相仿,但是老年(≥65歲)結(jié)直腸癌患者病死率卻逐年上升。腫瘤細(xì)胞具有特殊的代謝方式——Warburg效應(yīng),盡管在有氧條件下,腫瘤細(xì)胞的能量代謝仍以產(chǎn)生能量更快的糖酵解方式為主,糖酵解是腫瘤細(xì)胞侵襲轉(zhuǎn)移的重要能量來源,而且目前多認(rèn)為,糖酵解相關(guān)基因與結(jié)腸癌患者的預(yù)后有重要聯(lián)系。因此,基于腫瘤的糖酵解代謝特征,本研究建立了老年結(jié)直腸癌糖酵解相關(guān)基因預(yù)后模型,有利于高危老年結(jié)直腸癌患者臨床決策確立,及早干預(yù),延長老年結(jié)直腸癌患者生存期。
糖酵解相關(guān)基因的風(fēng)險分?jǐn)?shù)與腫瘤分期一樣,是老年結(jié)直腸癌預(yù)后不良的獨立影響因素,高風(fēng)險組患者,其生存率顯著低于低風(fēng)險組(P<0.001),ROC曲線分析1、3、5 a生存率的AUC值分別是0.705、0.730、0.674,提示風(fēng)險分?jǐn)?shù)對老年1、3 a生存率有較好的預(yù)測效能,而對5 a生存率的預(yù)測效能一般,但當(dāng)結(jié)合相關(guān)臨床信息時,5 a生存率的AUC值提升至0.783,提示模型具有良好的預(yù)測效能。
目前對結(jié)直腸癌預(yù)后模型的使用報道不多,糖酵解相關(guān)基因預(yù)后模型更少見,曾有糖酵解相關(guān)基因結(jié)直腸癌預(yù)后模型的報道[8],該模型主要建立在糖酵解預(yù)后不良上調(diào)基因的基礎(chǔ)上,前期利用相同方法建立老年人結(jié)直腸癌預(yù)后模型發(fā)現(xiàn),該方法無法在外數(shù)據(jù)集中得到驗證,其中一個重要原因是TCGA數(shù)據(jù)庫主要使用二代測序方法,與GEO探針檢測方法存在本質(zhì)區(qū)別,基因表達(dá)量差距較大,僅以TCGA數(shù)據(jù)庫計算得出的由上調(diào)基因構(gòu)成的高低風(fēng)險臨界值難以應(yīng)用于外驗證集中。本研究根據(jù)COX單因素回歸方程所得風(fēng)險基因再通過LASSO回歸模型優(yōu)化最終獲得10個風(fēng)險相關(guān)基因,包括提示不良預(yù)后的STC2、VEGFA、FKBP4、COL5A1、TGFA、ANKZF1和良好預(yù)后的CAPN5、PKP2、NDC1、GOT2,由預(yù)后良好基因和預(yù)后不良基因及其分子系數(shù)coefi共同計算得出風(fēng)險分?jǐn)?shù)可應(yīng)用于GEO數(shù)據(jù)集,具有良好的預(yù)測效能。
VEGFA編碼血管內(nèi)皮生長因子α,調(diào)節(jié)腫瘤微環(huán)境中血管生成[9],與結(jié)腸癌腫瘤進(jìn)展、轉(zhuǎn)移相關(guān)[10],而STC2編碼一種分泌型同型二聚體糖蛋白,參與調(diào)節(jié)多種蛋白活化相關(guān),目前認(rèn)為與結(jié)腸癌腫瘤大小、血管浸潤、淋巴轉(zhuǎn)移、腫瘤分化等多種病理臨床指標(biāo)具有相關(guān)性[11],也有研究[12]認(rèn)為,與轉(zhuǎn)移結(jié)直腸癌VEGFR靶向治療耐藥相關(guān)。FKBP4是熱休克蛋白90的共同伴侶分子, ANKZF1編碼為鋅指肽基TRNA水解酶,通常在細(xì)胞應(yīng)激的狀態(tài)下,F(xiàn)KBP4、ANKZF1均表達(dá)增加,維持線粒體的結(jié)構(gòu)穩(wěn)定性和完整性[13-14]。FKBP4在結(jié)腸癌腫瘤組織中表達(dá)增加[15],有研究[16-17]表明,F(xiàn)KBP4表達(dá)的增強與乳腺癌、肺癌進(jìn)展,預(yù)后不良相關(guān),ANKZF1高表達(dá)提示結(jié)直腸癌患者預(yù)后不良[18]。TGFA,編碼變形生長因子alpha,是EGFR的重要配體之一,能激活EGFR,調(diào)節(jié)上皮—間質(zhì)遷移,促進(jìn)結(jié)腸癌細(xì)胞轉(zhuǎn)移和侵襲[19]。COL5A膠原蛋白成員,參與細(xì)胞外基質(zhì)構(gòu)成,在乳腺癌、卵巢癌、肺癌及腎癌及中高表達(dá),COL5A表達(dá)增加與預(yù)后不良相關(guān)[20]。PKP2屬于斑菲素蛋白Plakophilins (PKPs)家族,能與蛋白激酶C結(jié)合相關(guān),PKP2是Wnt/β-catenin轉(zhuǎn)錄目標(biāo),可負(fù)反饋Wnt/β-catenin的轉(zhuǎn)錄活性,抑制腫瘤細(xì)胞中Wnt/β-catenin通路的過度激活[21]。而關(guān)于CAPN5、NDC1、GOT2在腫瘤中的作用報道很少,作用機制還有待進(jìn)一步闡明。
本研究也存在一定的局限性,首先,文中的預(yù)測模型缺少患者的化療、放療、免疫治療等治療信息,可能會對預(yù)測效能造成一定影響;其次,本研究是基于生物信息學(xué)的分析,風(fēng)險基因的相關(guān)功能與機制研究還有待于進(jìn)一步明確。總之,本研究基于糖酵解相關(guān)風(fēng)險基因建立的預(yù)測模型對老年結(jié)直腸癌患者預(yù)后有良好預(yù)測效能。
河南醫(yī)學(xué)高等??茖W(xué)校學(xué)報2022年3期