国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

整合生物信息學(xué)分析篩選宮頸癌的關(guān)鍵預(yù)后生物標(biāo)志物

2022-02-28 06:30王小燕李虎玲林丹丹
關(guān)鍵詞:標(biāo)志物通路宮頸癌

王小燕,李虎玲,林丹丹,張 晶, 王 凱

(新疆醫(yī)科大學(xué)1公共衛(wèi)生學(xué)院,2醫(yī)學(xué)工程技術(shù)學(xué)院,烏魯木齊 830017)

根據(jù)全球癌癥監(jiān)測(cè)機(jī)構(gòu)(globalcan)2020 年的數(shù)據(jù),宮頸癌新發(fā)病例和死亡人數(shù)分別為60.4萬(wàn)和34.2萬(wàn),發(fā)病率和死亡率排在第四位[1]。宮頸癌最常見(jiàn)的組織學(xué)亞型為鱗狀細(xì)胞癌和腺癌,分別約占所有宮頸癌的70%和25%[2]。一旦發(fā)展到轉(zhuǎn)移或復(fù)發(fā)階段,無(wú)法治愈,總生存時(shí)間(overall survival,OS)約為12個(gè)月[3]。因此,尋找新的預(yù)后生物標(biāo)志物和治療靶點(diǎn)可能有助于提高宮頸癌患者的生存率。

在已發(fā)表的報(bào)道中,關(guān)于宮頸癌發(fā)生發(fā)展中的分子標(biāo)志物的研究也取得了顯著性進(jìn)展。例如,Wang 等[4]研究發(fā)現(xiàn)CDC7 基因的表達(dá)上調(diào)與宮頸癌的發(fā)生和發(fā)展相關(guān),靶向這種生物標(biāo)志物可能會(huì)改善宮頸癌的早期診斷和治療;DudeaSimon 等[5]認(rèn)為血管內(nèi)皮生長(zhǎng)因子(VEGF)參與ILK 信號(hào)傳導(dǎo),能夠預(yù)測(cè)總體存活率,可能是影響宮頸癌預(yù)后的重要基因;此外,Zhang 等[6]研究表明MiR-378a-3p 下調(diào)與預(yù)后相關(guān),可能是宮頸癌的潛在生物標(biāo)志物。然而,單一的標(biāo)志物在預(yù)測(cè)宮頸癌患者的預(yù)后時(shí)可能會(huì)存在一定的局限性。因此,整合預(yù)后生物標(biāo)志物在預(yù)測(cè)宮頸癌的不良預(yù)后方面具有重要意義。

隨著微陣列芯片技術(shù)和高通量測(cè)序技術(shù)的發(fā)展,新的預(yù)后生物標(biāo)志物和治療靶點(diǎn)不斷被研究發(fā)現(xiàn)。整合生物信息學(xué)方法[7]能夠高效的利用多方數(shù)據(jù)庫(kù),因而在癌癥組學(xué)領(lǐng)域被廣泛應(yīng)用。在本研究中,利用生物信息技術(shù)和方法整合分析基因表達(dá)數(shù)據(jù)庫(kù)(Gene Expression Omnibus,GEO)和癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫(kù)中宮頸癌的轉(zhuǎn)錄組數(shù)據(jù),以期識(shí)別出參與宮頸癌發(fā)生發(fā)展中的Hub 基因、生物學(xué)功能及信號(hào)通路;同時(shí)將多個(gè)Hub基因構(gòu)建一個(gè)標(biāo)識(shí),利用標(biāo)識(shí)的風(fēng)險(xiǎn)評(píng)分對(duì)患者的預(yù)后進(jìn)行預(yù)測(cè)及評(píng)價(jià),證實(shí)其可作為關(guān)鍵生物標(biāo)記物能夠更好地判斷宮頸癌的預(yù)后。

1 資料與方法

1.1 數(shù)據(jù)資料宮頸癌的mRNA 表達(dá)數(shù)據(jù)來(lái)源于GEO 和TCGA 數(shù)據(jù)庫(kù)。首先,從GEO 中選擇微陣列數(shù)據(jù)集GSE90738,包括10個(gè)宮頸腫瘤組織和10個(gè)匹配的宮頸癌患者的癌旁組織。根據(jù)補(bǔ)充文件GSE90738_ cervical_cancer_ mRNA_ processed.xlsx,提取20 個(gè)樣本對(duì)應(yīng)的mRNA 基因符號(hào)數(shù)據(jù),根據(jù)基因平均表達(dá)量值最大去除重復(fù)基因,平均表達(dá)量小于1過(guò)濾基因的原則,共獲得16 367個(gè)基因用于下一步分析。其次,通過(guò)TCGA 獲取宮頸癌的mRNA 表達(dá)數(shù)據(jù),共納入307 個(gè)宮頸癌樣本,包括304 個(gè)宮頸腫瘤組織和3 個(gè)正常宮頸組織,根據(jù)篩選原則,共獲得12 571 個(gè)基因的log2(FPKM+1)的基因表達(dá)數(shù)據(jù)用于后續(xù)分析。cBioPortal(http://www.cbioportal.org/)是一個(gè)開源資源平臺(tái),可下載多種癌癥基因組數(shù)據(jù)集及臨床數(shù)據(jù)。從cBioPortal 下載了TCGA 數(shù)據(jù)庫(kù)中對(duì)應(yīng)的宮頸癌患者相應(yīng)的臨床信息。

1.2 篩選差異基因采用R軟件“l(fā)imma”包標(biāo)準(zhǔn)化矩陣數(shù)據(jù)并分別鑒定GSE90738 和TCGA 數(shù)據(jù)中宮頸腫瘤組織與宮頸正常組織間的差異基因。以校正后的P<0.05和|logFC|>1為差異基因篩選條件,盡可能消除假陽(yáng)性結(jié)果。使用“ggplot2”和“ pheatmap”包分別繪制差異基因的火山圖和熱圖。為了消除不同數(shù)據(jù)平臺(tái)上不同表達(dá)量類型造成的背景誤差,本研究使用Venny 2.1.0(https://bioinfogp.cnb.csic.es/tools/ven?ny)映射篩選出共享的差異基因,并以GSE90738數(shù)據(jù)為參考繪制共享差異基因熱圖。

1.3 功能和通路富集分析及蛋白質(zhì)互作網(wǎng)絡(luò)構(gòu)建

利用R 軟件clusterProfiler 包中的enrichGO 和en?richKEGG 函數(shù)進(jìn)行共享差異基因的GO 富集分析和KEGG通路分析。以P<0.05為閾值鑒定顯著GO的生物學(xué)過(guò)程和KEGG 通路。STRING(search tool for theretrieval of interacting genes)是一個(gè)免費(fèi)在線生物分析數(shù)據(jù)庫(kù),提供已知和預(yù)測(cè)的蛋白質(zhì)-蛋白質(zhì)相互作 用 網(wǎng) 絡(luò)(protein-protein interaction,PPI)。應(yīng) 用STRING 數(shù)據(jù)庫(kù),構(gòu)建共享差異基因的PPI 網(wǎng)絡(luò)。然后,通過(guò)Cytoscape 軟件對(duì)PPI 網(wǎng)絡(luò)進(jìn)行可視化,并應(yīng)用其MCODE 插件對(duì)網(wǎng)絡(luò)進(jìn)行聚類,從網(wǎng)絡(luò)圖中找到Hub基因組塊和基因進(jìn)入下一步分析。

1.4 Hub 基因的篩選及驗(yàn)證使用R 軟件“survival”包進(jìn)行單因素Cox 比例風(fēng)險(xiǎn)回歸分析選擇與宮頸癌患者總體生存期相關(guān)的預(yù)后基因。使用R 語(yǔ)言“glm?net”包對(duì)單因素Cox 顯著性分析結(jié)果P<0.05 的預(yù)后基因進(jìn)行多元逐步Cox 回歸分析,將篩選出的預(yù)后基因作為Hub 基因。GEPIA2(http://gepia2.cancer-pku.cn/# analysis)是一個(gè)在線分析數(shù)據(jù)庫(kù),能夠?qū)CGA和GTEx 項(xiàng)目共9 736 個(gè)腫瘤樣本、8 587 個(gè)正常樣本的RNA-seq 表達(dá)數(shù)據(jù)進(jìn)行分析。利用GEPIA2 數(shù)據(jù)庫(kù)中的Boxplots 工具進(jìn)一步驗(yàn)證Hub 基因在宮頸腫瘤組織與正常組織之間的表達(dá)水平。

1.5 構(gòu)建預(yù)后Hub 基因風(fēng)險(xiǎn)標(biāo)識(shí)為進(jìn)一步評(píng)估Hub 基因的預(yù)后價(jià)值,對(duì)Hub 基因進(jìn)行多因素Cox 分析,并構(gòu)建Hub基因的風(fēng)險(xiǎn)評(píng)分模型。風(fēng)險(xiǎn)評(píng)分模型中的每個(gè)Hub 基因系數(shù)來(lái)自于多因素Cox 分析對(duì)應(yīng)的變量系數(shù)。Hub 基因風(fēng)險(xiǎn)標(biāo)識(shí)(Hub Genes Risk Signature,HGRS)計(jì)算如下:HGRS = (βHubgenei* EX?PHubgenei)。以HGRS 的中位數(shù)為cutoff 值,將患者分為高、低風(fēng)險(xiǎn)組,采用Kaplan-Meier曲線進(jìn)行生存分析,log-rank 檢驗(yàn)P<0.05 認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。SangerBox 是一個(gè)免費(fèi)的在線數(shù)據(jù)分析平臺(tái)(http://www.sangerbox.com/tool),使 用SangerBox 工 具 對(duì)HGRS 進(jìn)行可視化分析,并繪制ROC 曲線評(píng)價(jià)HGRS的預(yù)測(cè)能力。

2 結(jié)果

2.1 差異表達(dá)分析在GSE90738 數(shù)據(jù)集中,共鑒定出差異基因1 282個(gè),包括上調(diào)基因777個(gè),下調(diào)基因505 個(gè)(圖1A)。在TCGA 數(shù)據(jù)庫(kù)中下載的宮頸癌數(shù)據(jù)集中,共鑒定出差異基因2 203 個(gè),包括上調(diào)基因1 003 個(gè),下調(diào)基因1 200 個(gè)(圖1B)。GSE90738 數(shù)據(jù)集和TCGA 數(shù)據(jù)集中的差異基因取交集后,獲得486個(gè)共享差異基因,包括上調(diào)基因319個(gè),下調(diào)基因167個(gè)(圖2)。以GSE90738 數(shù)據(jù)為參考繪制486 個(gè)共享差異基因熱圖(圖1C)。

圖1 差異基因的鑒定

圖2 共享差異基因的韋恩圖

2.2 GO 富集分析和KEGG 信號(hào)通路分析通過(guò)“clusterProfiler”包對(duì)486 個(gè)共享差異基因進(jìn)行GO 富集分析和KEGG 信號(hào)通路分析。在生物過(guò)程(BP)、細(xì)胞組分(CC)、分子功能(MF)這三個(gè)生物學(xué)方面的GO 富集分析中,最顯著的前10 項(xiàng)進(jìn)行分析展示。結(jié)果顯示,在BP 中,共享差異基因主要富集在“染色體分離”,“核分裂”,“有絲分裂核分裂”,“細(xì)胞器裂變”,“核染色體分離”,“DNA 復(fù)制”,“姊妹染色單體分裂”,“細(xì)胞周期G1/S 期轉(zhuǎn)變”,“有絲分裂姐妹染色單體分離”,“有絲分裂細(xì)胞周期的G1/S 轉(zhuǎn)變”等生物過(guò)程。在宮頸癌中,共享差異基因主要富集在“染色體區(qū)域”,“染色體著絲粒區(qū)域”,“濃縮染色體”,“染色體濃縮,著絲粒區(qū)域”,“紡錘體”等細(xì)胞組分。在MF中,共享差異基因主要富集在“催化活性,作用于DNA”,“DNA 復(fù)制起始結(jié)合”,“DNA 解旋酶的活動(dòng)”,“微管結(jié)合”,“微管蛋白結(jié)合”,“解旋酶的活動(dòng)”等分子功能(圖3A)。根據(jù)KEGG信號(hào)通路分析,共享差異基因主要參與“細(xì)胞周期”,“癌癥中的微小RNA”,“PI3K-Akt信號(hào)通路”,“細(xì)胞衰老”,“人乳頭瘤病毒感染”,“Epstein-Barr病毒感染”等路徑過(guò)程(圖3B)。

圖3 共享差異基因的GO和KEGG富集分析

2.3 PPI 網(wǎng)絡(luò)構(gòu)建及Hub 基因模塊分析使用STRING 在線數(shù)據(jù)庫(kù)構(gòu)建由445 個(gè)節(jié)點(diǎn)9 605 個(gè)連接組成的共享差異基因的PPI 網(wǎng)絡(luò)圖(圖4A)。應(yīng)用MCODE 插件的默認(rèn)參數(shù)設(shè)置,共得到19 個(gè)模塊。本研究選擇MCODE1 作為Hub 基因模塊,因評(píng)分最高達(dá)到100.393 分,由118 個(gè)節(jié)點(diǎn)和5 873 個(gè)連接組成(圖4B),且均為上調(diào)共享差異基因。

圖4 共享差異基因的PPI網(wǎng)絡(luò)和Hub基因模塊分析

2.4 Hub 基因的篩選和驗(yàn)證通過(guò)單因素Cox 比例風(fēng)險(xiǎn)回歸模型分析Hub 基因模塊中的118 個(gè)基因,發(fā)現(xiàn)16 個(gè)基因(P<0.05)與患者總生存期顯著相關(guān)。將以上16 個(gè)基因進(jìn)行多元逐步Cox 回歸分析,最終得到4 個(gè)與預(yù)后相關(guān)的Hub 基因,為CENPM、ANLN、CHAF1A 和HELLS。利用GEPIA2 工具驗(yàn)證4 個(gè)Hub基因的表達(dá)水平。結(jié)果表明,4 個(gè)Hub 基因均在腫瘤組織中高表達(dá)(圖5),這與4 個(gè)Hub 基因均為上調(diào)基因的結(jié)果一致。

圖5 4個(gè)Hub基因在宮頸腫瘤組織和正常組織中的表達(dá)比較

2.5 預(yù)后Hub 基因風(fēng)險(xiǎn)標(biāo)識(shí)的構(gòu)建多元逐步Cox回歸分析結(jié)果如表1 所示,CENPM、CHAF1A、HELLS為保護(hù)性因素,ANLN 為危險(xiǎn)因素,其中CENPM、CHAF1A 和ANLN 為影響宮頸癌患者預(yù)后的獨(dú)立影響因素。根據(jù)4 個(gè)Hub 基因的回歸系數(shù)β 和基因表達(dá)量構(gòu)建HGRS,HGRS=(-0.458)* CENPM+(0.561)*ANLN+(-0.558)*CHAF1A +(-0.504)*HELLS。根據(jù)HGRS 值的中位數(shù)-3.083,患者被分為了136 人的高風(fēng)險(xiǎn)組和137人的低風(fēng)險(xiǎn)組。圖6A、6B、6C分別展示了在患者中風(fēng)險(xiǎn)值的分布、生存時(shí)間和生存結(jié)局的分布及4 個(gè)Hub 基因Z-score 值熱圖。ROC 曲線顯示,HGRS 的1、3、5 年曲線下面積(Area under the curve,AUC)分別為0.67(95%CI:0.53~0.81)、0.72(95%CI:0.64~0.81)、0.76(95%CI:0.66~0.85)(圖6D)。圖6E 表明低風(fēng)險(xiǎn)組的總體生存時(shí)間明顯高于高風(fēng)險(xiǎn)組(P<0.001)。圖7 展示了HGRS 預(yù)測(cè)患者的生存狀況具有一定的穩(wěn)健性。

圖6 預(yù)后Hub基因風(fēng)險(xiǎn)標(biāo)識(shí)HGRS的生存預(yù)測(cè)及效果評(píng)價(jià)

圖7 HGRS在5年內(nèi)各時(shí)間點(diǎn)上的AUC值及95%置信區(qū)間

表1 4個(gè)Hub基因的總體貢獻(xiàn)程度

3 討論

人乳頭瘤病毒(HPV)感染是宮頸癌的主要危險(xiǎn)因素,其高危亞型幾乎導(dǎo)致所有宮頸癌[8]。微陣列芯片技術(shù)和高通量測(cè)序技術(shù)已廣泛用于研究癌癥的基因改變和確定疾病特異性預(yù)后生物標(biāo)志物和治療靶點(diǎn)。因此,本研究進(jìn)行了基于微陣列和高通量測(cè)序的轉(zhuǎn)錄組分析,以確定宮頸癌的異常調(diào)節(jié)基因。

本研究中,結(jié)合GEO 數(shù)據(jù)庫(kù)中宮頸癌GSE90738數(shù)據(jù)集和TCGA 數(shù)據(jù)集的顯著差異基因,共得到486個(gè)共享差異基因,包括319 個(gè)上調(diào)基因和167 個(gè)下調(diào)基因。GO 功能富集分析表明,共享差異基因主要富集在“染色體分離”、“染色體區(qū)域”、“催化活性,作用于DNA”;KEGG 通路富集分析表明,共享差異基因主要參與“細(xì)胞周期”,“癌癥中的微小RNA”,“PI3KAkt 信號(hào)通路”,“細(xì)胞衰老”,“人乳頭瘤病毒感染”,“Epstein-Barr 病毒感染”等信號(hào)路徑過(guò)程。研究表明,細(xì)胞周期調(diào)控缺陷,是癌癥發(fā)病機(jī)制的基本特征[9]。此外,越來(lái)越多的證據(jù)表明,大量MicroRNAs在宮頸癌組織中異常表達(dá),在腫瘤發(fā)生、進(jìn)展和轉(zhuǎn)移中發(fā)揮著不可替代的作用[10]。研究表明PI3K-Akt 信號(hào)通路通過(guò)多條途徑介導(dǎo)化療耐藥過(guò)程,包括凋亡相關(guān)蛋白表達(dá)、ABC轉(zhuǎn)運(yùn)、NF-κB、mTOR信號(hào)等[11]。

本研究構(gòu)建了由4 個(gè)Hub 基因構(gòu)成的風(fēng)險(xiǎn)標(biāo)識(shí),能夠區(qū)分高風(fēng)險(xiǎn)組患者和低風(fēng)險(xiǎn)組患者,且兩組患者的總生存期存在明顯差異。4 個(gè)Hub 基因均已被證實(shí)與多種癌癥的預(yù)后密切相關(guān)。著絲粒蛋白M(centromere protein M,CENPM)是近年發(fā)現(xiàn)的促癌分子,它編碼一種動(dòng)力蛋白,在細(xì)胞分裂過(guò)程中與紡錘體微管結(jié)合,調(diào)節(jié)染色體的分離[12]。Xiao 等[13]的研究證實(shí),CENPM 與肝癌進(jìn)展密切相關(guān),CENPM 的上調(diào)通過(guò)多種機(jī)制促進(jìn)肝癌的發(fā)生,可作為肝癌的新的可能生物標(biāo)志物和治療靶點(diǎn)。染色體組裝因子1 單位A(chromatin assembly factor 1,subunit A,CHAF1A)是一種高度保守的組蛋白伴侶分子,可調(diào)控細(xì)胞生長(zhǎng)、胚胎發(fā)育以及DNA 修復(fù)[14]。Chen 等[15]通過(guò)GEO中的胃癌數(shù)據(jù)進(jìn)行外部驗(yàn)證,證實(shí)了一個(gè)由CHAF1A和RMI1 構(gòu)成的預(yù)后標(biāo)識(shí)可以有效預(yù)測(cè)胃癌患者的總體生存率。Han 等[16]的研究表明CHAF1A 可作為宮頸癌的潛在診斷和預(yù)后生物標(biāo)志物之一,與本研究結(jié)果類似。HELLS 是一種染色質(zhì)重塑因子,研究報(bào)道其在肝癌、胰腺癌、肺癌中高表達(dá),通過(guò)介導(dǎo)多個(gè)抑癌基因的沉默,增強(qiáng)癌細(xì)胞的增殖和遷移,從而導(dǎo)致更差的患者預(yù)后[17-19]。Liu 等[20]的研究結(jié)果表明ANLN 由SP2調(diào)控,通過(guò)PI3K/AKT 和MAPK 信號(hào)通路促進(jìn)結(jié)直腸癌細(xì)胞增殖。Xia 等[21]的研究與本研究ANLN 的結(jié)果吻合,再次說(shuō)明過(guò)表達(dá)ANLN 組的患者預(yù)后與低表達(dá)ANLN 組的患者預(yù)后存在顯著差異,提示ANLN 可能是一種潛在的腫瘤致癌基因,可以作為預(yù)測(cè)宮頸癌患者預(yù)后的生物標(biāo)志物。本研究中,采用Kaplan-Meier 曲線和ROC 曲線分析證明由4 個(gè)Hub 基因構(gòu)成的風(fēng)險(xiǎn)標(biāo)識(shí)能準(zhǔn)確的區(qū)分高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,并能較好地預(yù)測(cè)患者的生存情況。由此可見(jiàn),4 個(gè)Hub 基因作為宮頸癌的生物標(biāo)志物具有較高的診斷價(jià)值。

本研究存在的局限性如下:這是一項(xiàng)回顧性研究,后期還需進(jìn)行前瞻性實(shí)驗(yàn)驗(yàn)證。其次,本研究限于273 例宮頸癌患者,臨床資料不全面,可能導(dǎo)致分析結(jié)果出現(xiàn)偏差。再者,由這4 個(gè)Hub 基因組成的基因標(biāo)志物的預(yù)測(cè)能力需要更大的樣本量進(jìn)一步研究和驗(yàn)證標(biāo)志物的有效性。

綜上,本研究篩選出4個(gè)可能在宮頸癌發(fā)生發(fā)展中起到重要作用的Hub 基因。這些基因可能作為診斷宮頸癌的潛在分子生物標(biāo)志物。此外,由4 個(gè)Hub基因組成的新的標(biāo)志物可以進(jìn)一步更好地預(yù)測(cè)患者的生存結(jié)局,為宮頸癌患者的臨床治療決策提供有效的建議。

猜你喜歡
標(biāo)志物通路宮頸癌
DJ-1調(diào)控Nrf2信號(hào)通路在支氣管哮喘中的研究進(jìn)展
基于改進(jìn)TF-IDF算法的基因通路富集方法
AngⅡ激活P38MAPK信號(hào)通路在大鼠NSAID相關(guān)小腸損傷中的機(jī)制研究
炎性及心肌纖維化相關(guān)標(biāo)志物在心力衰竭中的研究進(jìn)展
多項(xiàng)腫瘤標(biāo)志物聯(lián)合檢測(cè)在健康體檢中的應(yīng)用價(jià)值
腫瘤標(biāo)志物的認(rèn)識(shí)誤區(qū)
中國(guó)首個(gè)宮頸癌疫苗廈門誕生
如何選擇不同效價(jià)的宮頸癌疫苗?
腫瘤標(biāo)志物正常不等于沒(méi)有腫瘤
宮頸癌術(shù)前介入治療22例近期療效分析
福清市| 南溪县| 阿克陶县| 将乐县| 罗江县| 江城| 宜章县| 合作市| 永泰县| 石河子市| 梧州市| 金阳县| 牟定县| 北京市| 茂名市| 中西区| 元江| 奎屯市| 乌拉特后旗| 临泽县| 当雄县| 邵东县| 治县。| 宣武区| 琼海市| 肇源县| 措美县| 荆州市| 顺平县| 县级市| 丰城市| 南澳县| 拉孜县| 大城县| 麻城市| 永济市| 綦江县| 华阴市| 阳原县| 景泰县| 墨竹工卡县|