覃念群,劉 楷,米鏡霖,張 勇
(1.廣西醫(yī)科大學(xué)第一附屬醫(yī)院放療科,廣西 南寧 530021;2.廣西區(qū)域性高發(fā)腫瘤早期防治研究重點實驗室,廣西 南寧 530021)
宮頸癌(cervical cancer)在女性癌癥患者中的發(fā)病率和死亡率均位居第4 位[1,2]。據(jù)估計[2],2020 年全球新增宮頸癌病例604 127 例,死亡341 831 例,其中90%來自低收入和中等收入國家。人類乳頭瘤病毒(HPV)的持續(xù)感染是宮頸癌進(jìn)展的主要危險因素[3]。盡管接種HPV 疫苗、常規(guī)篩查和早期治療HPV相關(guān)癌前病變可以預(yù)防大多數(shù)宮頸癌[4],但宮頸癌患者每年的死亡率仍在上升,特別是在大多數(shù)低收入國家[2,5]。目前宮頸癌的治療方法包括放射治療、化療、手術(shù)和免疫治療,具體取決于癌癥的不同階段[5]。然而,上述治療都沒有給患者帶來非常顯著的生存優(yōu)勢。因此,迫切需要尋找新的、有效的用于預(yù)測預(yù)后和治療靶點的生物標(biāo)志物。生物信息學(xué)被廣泛用于從功能上注釋基因和識別與疾病相關(guān)的途徑,可用來確定疾病的關(guān)鍵驅(qū)動因素[6]。加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)是一種基因篩選技術(shù),它可以將與復(fù)雜生物過程相關(guān)的共表達(dá)基因分成幾個特征模塊,根據(jù)它們與臨床特征的關(guān)聯(lián)來識別關(guān)鍵模塊[7]。WGCNA 可以用來描述跨微陣列樣本基因之間的關(guān)聯(lián)模式,并找到在表達(dá)水平方面具有高度相關(guān)性的簇(模塊)和關(guān)鍵基因[7,8]。目前,基于網(wǎng)絡(luò)分析已經(jīng)篩選出多種疾病的潛在生物標(biāo)志物和新的治療靶點[9]。此外,篩選正常和病變樣本之間的差異表達(dá)基因也有助于發(fā)現(xiàn)潛在的疾病生物標(biāo)志物[10]。本研究使用上述方法分析與宮頸癌預(yù)后相關(guān)的關(guān)鍵基因,現(xiàn)報道如下。
1.1 差異表達(dá)基因識別 從癌癥基因組圖譜(TCGA)數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)中提取3 例正常宮頸組織和306 例宮頸癌組織的基因表達(dá)數(shù)據(jù)和臨床資料。通過edge R 軟件包篩選CAP>1 的基因進(jìn)行進(jìn)一步分析,并從基因表達(dá)總表(GEO)數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)下載GSE39001數(shù)據(jù)集,其中包括12 例正常宮頸和43 例宮頸癌標(biāo)本的基因表達(dá)和臨床資料。使用Limma 包進(jìn)行篩選,以|logFC|>1 和校正后P<0.05 為篩選標(biāo)準(zhǔn)。分別使用R 軟件包pheatmap 和ggplot2 以熱圖和火山圖的形式對差異表達(dá)基因進(jìn)行可視化,使用WGCNA鑒定與臨床相關(guān)的共表達(dá)模塊。
1.2 重疊基因的鑒定和功能注釋 使用R 軟件包中的Venn Diagram 將上述確定的感興趣的模塊基因與差異表達(dá)基因整合,并篩選重疊基因。用KEGG途徑和GO 富集分析對這些基因進(jìn)行功能注釋。
1.3 PPI 網(wǎng)絡(luò)構(gòu)建和關(guān)鍵基因篩選 使用STRING 在線網(wǎng)站(http://string-db.org)構(gòu)建重疊基因的PPI 網(wǎng)絡(luò),選擇得分為≥0.4 的基因。PPI 網(wǎng)絡(luò)的可視化由Cytoscape(v3.8.2)軟件實現(xiàn)。采用Cytoscape 軟件中的插件CytoHubba 計算MCC 值,選擇前10 個基因作為關(guān)鍵基因。
1.4 關(guān)鍵基因的表達(dá)及生存分析 用基因表達(dá)譜交互分析(GEPIA)在線工具(gepia.cancer-pku.cn)分析關(guān)鍵基因在宮頸癌組織中的表達(dá)水平[11]。用R 軟件中的生存軟件包對關(guān)鍵基因進(jìn)行Kaplan-Meier分析。以P<0.05 為閾值篩選與預(yù)后相關(guān)的關(guān)鍵基因,用Cox 比例風(fēng)險回歸建立生存預(yù)測模型。繪制受試者工作特征(ROC)曲線,并通過ROC 軟件包計算5 年預(yù)測生存率的曲線下面積(AUC)[12]。
1.5 關(guān)鍵基因在宮頸癌樣本中的表達(dá)驗證
1.5.1 數(shù)據(jù)庫驗證 從人類蛋白質(zhì)圖譜(HPA)數(shù)據(jù)庫(https://www.proteinatlas.org/)中驗證宮頸癌組織和正常宮頸組織中關(guān)鍵基因的蛋白表達(dá)水平。
1.5.2 臨床樣本收集 收集來自廣西醫(yī)科大學(xué)第一附屬醫(yī)院婦科的10 例宮頸癌組織和鄰近正常宮頸組織。樣本取回后立即液氮保存。
1.5.3 Western Blot 檢測 用RIPA 緩沖液(碧云天,中國)裂解組織,提取蛋白質(zhì),用BCA 試劑盒(碧云天,中國)檢測蛋白質(zhì)濃度。用SDS-PAGE 凝膠將相同量的蛋白質(zhì)轉(zhuǎn)移到PVDF 膜上,用5%脫脂牛奶封1 h,在4 ℃孵育一抗過夜,在室溫孵育二抗1 h,最后使用超敏ECL 化學(xué)發(fā)光溶液(Biosharp,中國)顯示目標(biāo)蛋白條帶??贵w的來源和濃度分別是兔抗KIF22(1∶1000,proteintech,中國)和小鼠抗GAPDH(1∶1000,Cell Signaling Technology)。
1.6 基因集富集分析(GSEA)對與預(yù)后相關(guān)的關(guān)鍵基因進(jìn)行GSEA 分析,探討其在宮頸癌中的生物學(xué)功能和豐富的途徑。|NES|>1.5 和FDRP<0.05 的基因集合被認(rèn)為是有統(tǒng)計學(xué)意義的富集。
1.7 統(tǒng)計學(xué)分析 用SPSS 25.0 軟件和GrapPad Prism 8.0 軟件進(jìn)行統(tǒng)計學(xué)分析,計量數(shù)據(jù)用()表示,關(guān)鍵基因在宮頸癌組織和癌旁正常宮頸組織的表達(dá)比較采用配對t檢驗。P<0.05 表示差異有統(tǒng)計學(xué)意義。
2.1 差異表達(dá)基因篩選 以|logFC|≥1.0 和校正后P<0.05 為臨界值,在TCGA-CESC 數(shù)據(jù)集和GSE39001數(shù)據(jù)集中分別識別出3851 和575 個差異表達(dá)基因。利用WGCNA 軟件包構(gòu)建TCGA-CESC 和GSE39001 數(shù)據(jù)集基因共表達(dá)網(wǎng)絡(luò),并鑒定了15 個TCGA-CESC 模塊和8 個與CC 相關(guān)的GSE39001模塊。熱圖顯示TCGA-CESC 中的pink 模塊(r=0.6,P=5e-31)和GSE39001 中的brown 模塊(r=0.94,P=2E-26)與宮頸癌的相關(guān)性最強(qiáng)。TCGA-CESC 數(shù)據(jù)集的pink 模塊中發(fā)現(xiàn)了253 個共表達(dá)基因,GSE39001 數(shù)據(jù)集的brown 模塊中發(fā)現(xiàn)了303 個基因,它們的交集顯示了69 個重疊基因,見圖1。
圖1 差異表達(dá)基因篩選
2.2 重疊基因生物學(xué)功能 對重疊基因進(jìn)行GO 富集分析,結(jié)果顯示,在細(xì)胞有絲分裂和DNA 復(fù)制中顯著的富集。KEGG 通路分析表明,重疊基因主要涉及細(xì)胞周期調(diào)控、p53 信號通路、DNA 復(fù)制、細(xì)胞衰老等途徑,見圖2。
圖2 重疊基因生物學(xué)功能
2.3 PPI 網(wǎng)絡(luò)構(gòu)建和關(guān)鍵基因篩選 使用STRING 數(shù)據(jù)庫對重疊基因進(jìn)行PPI 網(wǎng)絡(luò)構(gòu)建,包括69 個節(jié)點和232 條邊。采用Cytoscape 軟件中的CytoHubba 插件計算MCC 值,選擇MCC 值前10 的基因作為關(guān)鍵基因,分別為 KIF11、RACGAP1、KIF23、KIF20A、CENPE、KIF4A、KIF22、KIF15、KIF2C 和PRC1,見圖3。
圖3 PPI 網(wǎng)絡(luò)構(gòu)建及關(guān)鍵基因篩選
2.4 關(guān)鍵基因在宮頸癌中表達(dá)及生存分析 使用GEPIA2 在線工具分析關(guān)鍵基因在宮頸癌中表達(dá),結(jié)果提示,相比與正常組織,關(guān)鍵基因在宮頸癌中高表達(dá)。此外,使用R 軟件的Survival 包對關(guān)鍵基因進(jìn)行Kaplan-Meier 分析,結(jié)果顯示,KIF22 高表達(dá)與宮頸癌患者的總生存期相關(guān)(P=0.021),其余關(guān)鍵基因與總生存期無統(tǒng)計學(xué)意義?;贙IF22 構(gòu)建生存預(yù)測模型,5 年生存率的ROC 曲線的AUC 值為0.612,KIF22 在預(yù)測宮頸癌患者生存預(yù)后具有一定價值,見圖4。
圖4 關(guān)鍵基因在宮頸癌中表達(dá)及生存分析
2.5 KIF22 在HPA 數(shù)據(jù)庫及臨床樣本中的驗證結(jié)果HPA 數(shù)據(jù)庫提示,KIF22 在宮頸癌中高表達(dá)。采用Western Blot 檢測了10 例宮頸癌及癌旁正常宮頸組織中KIF22 表達(dá)水平,結(jié)果顯示:相比于正常宮頸組織,KIF22 表達(dá)水平在宮頸癌組織中升高(P<0.05),見圖5。
圖5 KIF22 在宮頸癌中的表達(dá)水平
2.6 KIF22 富集分析 GO 富集分析顯示,KIF22 的高表達(dá)與細(xì)胞周期、DNA 復(fù)制、有絲分裂和DNA 復(fù)制有關(guān);KEGG 通路分析顯示,KIF22 高表達(dá)與細(xì)胞周期、DNA 復(fù)制、核糖體和p53 信號通路顯著相關(guān)。此外,KIF22 的低表達(dá)還與ECM 受體相互作用、病灶粘連、腫瘤中的信號轉(zhuǎn)導(dǎo)途徑以及JAK-STAT 信號轉(zhuǎn)導(dǎo)途徑有關(guān),見圖6。
圖6 KIF22 功能分析
大多數(shù)宮頸癌患者被診斷時已處于腫瘤晚期。宮頸癌患者的預(yù)后較差,因為潛在的分子機(jī)制尚不清楚[13]。生物信息學(xué)可以幫助識別病理條件下異常表達(dá)的基因,并有助于發(fā)現(xiàn)新的和更準(zhǔn)確的診斷和預(yù)后生物標(biāo)志物。
本研究通過分析TCGA-CESC 和GSE39001 數(shù)據(jù)集的基因表達(dá)譜,鑒定了與宮頸癌相關(guān)的69 個差異共表達(dá)的基因。對這69 個基因進(jìn)行功能富集分析,發(fā)現(xiàn)這些基因在細(xì)胞有絲分裂和DNA 復(fù)制中顯著富集,主要涉及細(xì)胞周期調(diào)控、p53 信號通路、DNA 復(fù)制、細(xì)胞衰老等途徑,表明這些基因在腫瘤的發(fā)生和發(fā)展中起到一定作用。進(jìn)一步構(gòu)建69 個差異共表達(dá)基因的PPI 網(wǎng)絡(luò),通過Cytoscape 軟件中的CytoHubba 插件,篩選出10 個與宮頸癌相關(guān)的關(guān)鍵基因。進(jìn)一步分析這10 個關(guān)鍵基因在宮頸癌中的作用,GEPIA2 在線工具發(fā)現(xiàn)關(guān)鍵基因在宮頸癌中均表達(dá)上調(diào)。使用R 軟件中Survival 包預(yù)測關(guān)鍵基因表達(dá)與宮頸癌患者預(yù)后的關(guān)系,發(fā)現(xiàn)宮頸癌中KIF22 表達(dá)水平的上調(diào)與宮頸癌患者的預(yù)后良好有關(guān)(P=0.021)。
Kinesin 家族成員22(KIF22)又稱Kinesin 樣DNA 結(jié)合蛋白(Kid),是一種正末端導(dǎo)向的微管馬達(dá)蛋白,與微管和染色體結(jié)合[14],調(diào)節(jié)細(xì)胞器、蛋白質(zhì)和mRNA 的運輸、有絲分裂過程中的微管穩(wěn)定性、突觸發(fā)育和間期細(xì)胞的細(xì)胞骨架穩(wěn)定性[15,16]。研究發(fā)現(xiàn),KIF22 在乳腺癌[14]、結(jié)腸癌[17]、食管鱗癌[18]、胃癌[19]、前列腺癌[20]、膀胱癌[21]和舌鱗癌[22]中的表達(dá)均高于相應(yīng)的正常組織,且與預(yù)后不良相關(guān)。相反,本研究發(fā)現(xiàn),KIF22 的高表達(dá)與宮頸癌患者良好的預(yù)后相關(guān),表明KIF22 的生物學(xué)功能可能取決于腫瘤類型。
為進(jìn)一步驗證KIF22 在宮頸癌中的表達(dá)水平,本研究通過HPA 數(shù)據(jù)庫和Western Blot 實驗進(jìn)行驗證。結(jié)果顯示,KIF22 在宮頸癌中高表達(dá)。為進(jìn)一步證明KIF22 在宮頸癌中的作用,構(gòu)建KIF22 生存預(yù)測模型,結(jié)果顯示,5 年生存率的ROC 曲線的AUC 值為0.612,提示KIF22 對預(yù)測宮頸癌患者生存時間具有一定的價值。對KIF22 進(jìn)行富集分析,結(jié)果顯示KIF22 的高表達(dá)與細(xì)胞周期、DNA 復(fù)制、有絲分裂和DNA 復(fù)制有關(guān)。KEGG 通路分析顯示KIF22 高表達(dá)與細(xì)胞周期、DNA 復(fù)制、核糖體和p53信號通路顯著相關(guān)。其中p53 信號通路參與細(xì)胞增殖、遷移和凋亡等[23-25]。有研究發(fā)現(xiàn)[23],RECK 通過激活p53 信號通路,從而抑制宮頸癌細(xì)胞的遷移和侵襲。VERU-11 可激活p53 信號通路,抑制宮頸癌細(xì)胞移植瘤生長和轉(zhuǎn)移表型[24]。KIF22 高表達(dá)可能通過激活p53 信號通路,參與宮頸癌的發(fā)生和發(fā)展。此外,KIF22 的低表達(dá)還與ECM 受體相互作用、病灶粘連、腫瘤中的信號轉(zhuǎn)導(dǎo)途徑以及JAK-STAT 信號轉(zhuǎn)導(dǎo)途徑有關(guān)。JAK-STAT 信號通路是癌細(xì)胞中的致癌信號通路,JAK-STAT 信號異常與腫瘤的進(jìn)展和轉(zhuǎn)移有關(guān)[26]。在包括宮頸癌在內(nèi)的多種腫瘤中,JAK-STST 信號通路的過度激活與預(yù)后不良和總存活率低有關(guān)[27]。提示KIF22 低表達(dá)可能通過JAKSTAT 通路參與宮頸癌的發(fā)生和轉(zhuǎn)移。
Yu Y 等[14]發(fā)現(xiàn)KIF22 通過減少CDC25C 的表達(dá)和促進(jìn)有絲分裂退出來促進(jìn)乳腺癌的細(xì)胞增殖。Pake SM 等[15]發(fā)現(xiàn)KIF22 通過調(diào)節(jié)CAR 和EGFR促進(jìn)肺癌細(xì)胞的增殖。Li B 等[17]和Liu Y 等[22]發(fā)現(xiàn)抑制KIF22 可抑制結(jié)腸癌和舌鱗癌細(xì)胞的增殖,并減緩體內(nèi)異種移植瘤的生長。與之相反,本研究則發(fā)現(xiàn)KIF22 可能在宮頸癌中作為腫瘤抑制基因而不是癌基因發(fā)揮作用。
綜上所述,KIF22 高表達(dá)與宮頸癌患者預(yù)后密切相關(guān),可能是一個預(yù)測宮頸癌患者預(yù)后和治療靶點的生物標(biāo)志物。然而,本研究數(shù)據(jù)完全基于生物信息學(xué),必須通過功能研究來驗證。在后續(xù)研究中,將進(jìn)一步探討KIF22 在宮頸癌中的作用機(jī)制。