周濤,王笑天,劉東,孔斌,趙士彭
2020年全球癌癥統(tǒng)計(jì)數(shù)據(jù)指出,胃癌發(fā)生率位于所有癌癥中第五位,病死率排在第四位[1],對人類健康影響巨大,嚴(yán)重威脅患者生命健康。雖然目前胃癌的治療方法較多,但是總體生存率仍較低,有必要探索發(fā)現(xiàn)新的預(yù)后標(biāo)志物和治療靶點(diǎn),不僅有助于對患者預(yù)后進(jìn)行評估,而且可能提供更多的分子治療靶點(diǎn)。SERPINE1是SERPIN家族E成員1,又稱PAI、PLANH1、PAI1,其位置在7號染色體(7q22.1),被認(rèn)為在頭頸部腫瘤、乳腺癌、胃癌、胰腺癌、結(jié)直腸癌等癌癥中對腫瘤轉(zhuǎn)移及預(yù)后有影響[2-6]。本研究通過癌癥基因組圖譜(the cancer genome atlas ,TCGA)及基因綜合表達(dá)(the gene expression omnibus,GEO)公共數(shù)據(jù)庫,挖掘并分析SERPINE1對胃癌預(yù)后的影響,探討其作為預(yù)測胃癌預(yù)后的一種生物學(xué)標(biāo)志物及分子治療靶點(diǎn)的可能,為以后研究胃癌的發(fā)生發(fā)展機(jī)制提供一定的研究基礎(chǔ),報(bào)道如下。
1.1 數(shù)據(jù)檢索及下載 檢索TIMER數(shù)據(jù)庫(https://cistrome.shinyapps.io/timer/),了解SERPINE1在33種癌癥中的差異表達(dá)情況。檢索TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)并下載胃癌患者的STAR-Counts數(shù)據(jù)、臨床資料,獲得375例胃癌組織和32例癌旁組織的STAR-Counts數(shù)據(jù)。通過GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo)檢索GSE54129數(shù)據(jù)集,下載111例胃癌組織和21例癌旁組織基因表達(dá)芯片和臨床資料,調(diào)取以上111例胃癌組織SERPINE1 mRNA的表達(dá)數(shù)據(jù),以中位數(shù)為截?cái)嘀祵⑵浞譃楦弑磉_(dá)組和低表達(dá)組。
1.2 表達(dá)差異分析 將TCGA下載的375例胃癌組織和32例癌旁組織的SERPINE1 mRNA表達(dá)進(jìn)行差異分析,將GSE54129數(shù)據(jù)集中21例癌旁正常組織和111例胃癌組織的SERPINE1 mRNA表達(dá)進(jìn)行差異分析。
1.3 單/多因素COX分析及預(yù)后分析 收集TCGA數(shù)據(jù)集中375例胃癌患者臨床資料和SERPINE1 mRNA表達(dá)水平,刪去缺失預(yù)后資料樣本后剩余333例,然后刪去缺失性別、年齡、T分期、N分期、M分期、病理分期等資料的樣本,剩余300例患者資料,然后進(jìn)行單因素分析,單因素分析后P<0.05的因素可進(jìn)入多因素COX回歸分析。
1.4 Kaplan-Meier生存曲線、ROC曲線和生存列線圖繪制 收集TCGA數(shù)據(jù)集中具有完整預(yù)后資料患者共333例,并收集SERPINE1 mRNA表達(dá)數(shù)據(jù),以其中位數(shù)為截?cái)嘀?,分成高表達(dá)組和低表達(dá)組,進(jìn)行Kaplan-Meier生存曲線、受試者工作特征曲線(ROC)、生存列線圖的繪制。
1.5 基因富集分析(GSEA富集) 采用軟件GSEA_4.2.3進(jìn)行分析,TCGA數(shù)據(jù)集以SERPINE1 mRNA的表達(dá)量中位數(shù)為截?cái)嘀祵⑵浞譃楦摺⒌捅磉_(dá)組,以 Hall-mark 基因集作為參考基因集,分析SERPINE1在胃癌中的作用機(jī)制。
1.6 統(tǒng)計(jì)學(xué)方法 R 3.6.3 版本對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析及作圖,涉及的R包包括ggplot2包、survival包、survminer 包、timeROC包、rms包。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 泛癌分析 通過TIMER數(shù)據(jù)庫檢測SERPINE1在33種癌組織中的表達(dá)差異情況,發(fā)現(xiàn)SERPINE1在乳腺浸潤癌(BRCA)、結(jié)腸癌(COAD)、食管癌(ESCA)、頭頸部鱗狀細(xì)胞癌(HNSC)、腎透明細(xì)胞癌(KIRC)、直腸腺癌(READ)、胃癌(STAD)、甲狀腺癌(THCA)等8種癌組織中高表達(dá),在膽管癌(CHOL)、腎嫌色細(xì)胞癌(KICH)、腎乳頭狀細(xì)胞癌(KIRP)、肝細(xì)胞肝癌(LIHC)、皮膚黑色素瘤(SKCM)、子宮內(nèi)膜癌(UCEC)等6種癌組織中低表達(dá),其差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。
2.2 胃癌組織和癌旁組織中SERPINE1 mRNA的表達(dá)差異 TCGA數(shù)據(jù)集、GSE54129數(shù)據(jù)集中胃癌組織中SERPINE1 mRNA表達(dá)高于癌旁組織(P<0.001),見圖1。
圖1 SERPINE1 mRNA在胃癌組織和癌旁組織中的表達(dá)比較
2.3 影響胃癌患者預(yù)后的單/多因素COX回歸分析 將TCGA數(shù)據(jù)集中胃癌患者臨床資料進(jìn)行單因素COX分析表明,N分期、病理分期、SERPINE1表達(dá)水平均與預(yù)后生存時(shí)間有關(guān)(P<0.05);多因素COX回歸分析表明,病理分期4期、SERPINE1表達(dá)水平高是影響胃癌患者預(yù)后生存時(shí)間的獨(dú)立危險(xiǎn)因素(P<0.05),見表1。
表1 TCGA數(shù)據(jù)庫影響胃癌患者預(yù)后生存的單/多因素COX分析
2.4 Kaplan-Meier生存曲線和ROC曲線分析 收集TCGA胃癌患者生存信息和SERPINE1 mRNA表達(dá)水平,Kaplan-Meier生存曲線分析發(fā)現(xiàn),高表達(dá)組總生存期(OS)明顯低于低表達(dá)組(HR=1.86,95%CI1.32~2.62,P<0.001),見圖2。ROC曲線分析發(fā)現(xiàn),SERPINE1表達(dá)預(yù)測1、3、5年生存幾率的曲線下面積(AUC)分別為0.598、0.649、0.731,預(yù)測5年生存幾率效能最好,見圖3。
圖2 Kaplan-Meier生存曲線
圖3 SERPINE1表達(dá)預(yù)測1、3、5年生存幾率的ROC曲線
2.5 生存預(yù)測列線圖構(gòu)建 通過各臨床指標(biāo)(性別、年齡、T分期、N分期、M分期,病理分期,SERPINE1 mRNA)構(gòu)建列線圖,其得分可直觀地預(yù)測1年、2年、3年生存幾率,見圖4。
圖4 生存預(yù)測列線圖
2.6 GSEA富集分析 GSEA分析表明,SERPINE1 mRNA高表達(dá)組與SERPINE1 mRNA相關(guān)的基因富集在上皮間質(zhì)轉(zhuǎn)化、炎性反應(yīng)、細(xì)胞頂端連接復(fù)合物、KRAS通路、血管生成等基因集上,被富集到的通路在SERPINE1 mRNA高表達(dá)組表現(xiàn)為上調(diào)趨勢,可能SERPINE1的表達(dá)與以上通路及功能存在密切關(guān)系,見表2。
表2 GSEA富集分析與SERPINE1相關(guān)的通路
在所有已知癌癥中,胃癌的發(fā)生率及病死率仍名列前茅,雖然目前治療胃癌的方法比較多,如手術(shù)、化療、放療、靶向、免疫治療等方法[7],但是其對人類的生存威脅仍較大,為能夠造福胃癌患者并指導(dǎo)臨床治療,挖掘并研究參與胃癌發(fā)生及影響胃癌患者生存的生物學(xué)標(biāo)志物很有必要。有多項(xiàng)報(bào)道證實(shí),尿激酶纖溶酶原激活物(uPA)系統(tǒng)參與癌癥的血管生成、遷移、上皮間質(zhì)轉(zhuǎn)化(EMT)、免疫等生物學(xué)行為及過程,SERPINE1是尿激酶纖溶酶原激活物系統(tǒng)中的重要成員[8-12]。有研究發(fā)現(xiàn)其影響頭頸部腫瘤、乳腺癌、胃癌、胰腺癌、結(jié)直腸癌等多種腫瘤患者的預(yù)后,通過靶向uPA系統(tǒng)治療癌癥的方法已廣泛用于腫瘤治療的研究中[13]。有研究發(fā)現(xiàn),SERPINE1在荷瘤小鼠胃癌組織和胃癌細(xì)胞株中顯著高表達(dá),過表達(dá)SERPINE1后荷瘤小鼠體內(nèi)腫瘤生長明顯增快,敲低LINC00200后荷瘤小鼠體內(nèi)腫瘤生長減慢,LINC00200可正向調(diào)控SERPINE1影響胃癌細(xì)胞的生長及腫瘤的形成[14]。多項(xiàng)研究證實(shí),SERPINE1的表達(dá)與腫瘤發(fā)生、進(jìn)展存在密切關(guān)系。
本研究基于TCGA和GEO數(shù)據(jù)庫,主要分析TCGA數(shù)據(jù)庫333例具有預(yù)后資料的胃癌患者臨床信息和STAR-Counts數(shù)據(jù)。本研究發(fā)現(xiàn),SERPINE1在胃癌組織中高表達(dá),單/多因素COX分析發(fā)現(xiàn)SERPINE1 mRNA的表達(dá)與胃癌患者預(yù)后具有相關(guān)性,并且是一個(gè)影響胃癌患者預(yù)后的獨(dú)立危險(xiǎn)因素,Kaplan-Meier生存曲線和ROC曲線分析表明SERPINE1預(yù)測胃癌患者生存時(shí)間的可行性,通過GSEA富集分析,發(fā)現(xiàn)多個(gè)與癌癥相關(guān)的通路和生物學(xué)行為與SERPINE1高表達(dá)呈正相關(guān),EMT生物學(xué)過程已經(jīng)被多項(xiàng)研究證實(shí)參與腫瘤細(xì)胞的侵襲、轉(zhuǎn)移,炎性反應(yīng)同樣被證實(shí)與腫瘤的發(fā)生及進(jìn)展有關(guān),EMT和炎性因子之間相互誘導(dǎo),促進(jìn)腫瘤的發(fā)生及轉(zhuǎn)移[15]。KRAS突變與腫瘤的發(fā)生有著密切關(guān)系,SERPINE1水平可通過KRAS通路上調(diào)[16]。另外低氧環(huán)境、血管生成也與腫瘤的發(fā)生有關(guān),本研究通過富集分析發(fā)現(xiàn),SERPINE1與影響腫瘤發(fā)生、進(jìn)展的不良因素均有關(guān)。所以進(jìn)一步深入的通過基礎(chǔ)實(shí)驗(yàn)研究SERPINE1對腫瘤發(fā)生、進(jìn)展的影響有重大意義。為以后從多個(gè)方面研究SERPINE1在胃癌進(jìn)展中的生物學(xué)作用及影響患者預(yù)后的機(jī)制方面提供了理論依據(jù)和思路。
目前臨床中用于輔助診斷胃癌的生物學(xué)標(biāo)志物有CEA、CA199、CA125、AFP等,但仍較少,并且缺乏一定的特異度及敏感度,需要挖掘更多更準(zhǔn)確的生物學(xué)標(biāo)志物用于服務(wù)臨床。通過本研究發(fā)現(xiàn)并證實(shí)SERPINE1作為一種生物學(xué)標(biāo)志物用于胃癌輔助診斷及預(yù)測胃癌患者預(yù)后的可能性,并且可能成為一種新的治療靶點(diǎn),為胃癌患者的治療提供了新的思路及方向。本研究患者例數(shù)仍較少,臨床中需要收集更多胃癌患者的臨床資料及免疫組化或基因表達(dá)數(shù)據(jù)進(jìn)行更深入更有說服力的研究,致力于發(fā)現(xiàn)更好的治療方法來延長胃癌患者的生存時(shí)間。
利益沖突:所有作者聲明無利益沖突
作者貢獻(xiàn)聲明
周濤:提出研究方向、研究選題、設(shè)計(jì)研究方案,實(shí)施研究過程,論文撰寫;王笑天:設(shè)計(jì)研究方案,分析試驗(yàn)數(shù)據(jù),論文審核;劉東:實(shí)施研究過程,資料搜集整理,論文審核;孔斌:修改論文、論文審核;趙士彭:修訂論文、論文終審