石鳳,陳志鴻,李光景,陳升才,羅小瓊,王俊利
(右江民族醫(yī)學(xué)院 1.附屬醫(yī)院生殖醫(yī)學(xué)中心;2.基礎(chǔ)醫(yī)學(xué)院,廣西 百色 533000)
子宮頸癌是女性最常見的惡性腫瘤之一,世界衛(wèi)生組織報道子宮頸癌的發(fā)病率和死亡率有下降趨勢,但每年仍有750 000例新增患者及311 000例患者死于子宮頸癌[1]。子宮頸癌致病因素涉及高危型HPV感染、表觀遺傳改變和基因序列突變。研究[2]表明多種生物過程的基因變異參與了子宮頸癌的發(fā)生發(fā)展。基因遺傳變異使患者對疾病的易感性和患病后的嚴(yán)重程度各不相同,從分子生物學(xué)水平研究子宮頸癌診斷和預(yù)后對于患者的個體化和精確治療至關(guān)重要。
基于高通量測序的生物信息學(xué)研究癌癥的差異表達(dá)基因、初步篩選與癌癥相關(guān)的早期分子診斷和治療靶點是目前重要的手段之一。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)是多種癌癥的治療靶點,對于癌癥的早期診斷和治療具有重要意義,一些基因的SNP被矯正可能會逆轉(zhuǎn)癌癥的惡性生物學(xué)行為。隨著全基因組序列的研究進(jìn)展,越來越多與子宮頸癌易感性相關(guān)的SNP被發(fā)現(xiàn)[3-5]。癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫廣泛應(yīng)用于癌癥相關(guān)基因的高通量基因組分析,初步篩選與癌癥相關(guān)的基因。本研究通過對TCGA數(shù)據(jù)庫中與子宮頸癌相關(guān)的基因SNP數(shù)據(jù)進(jìn)行生物信息學(xué)分析,篩選與子宮頸癌相關(guān)的突變基因,旨在為闡明子宮頸癌發(fā)病機(jī)制提供參考。
TCGA數(shù)據(jù)庫SNP原始數(shù)據(jù)不對外開放,因此從TCGA數(shù)據(jù)庫(https:// portal.gdc.cancer.gov/)下載經(jīng)處理后的子宮頸癌SNP相關(guān)數(shù)據(jù),同時下載子宮頸癌mRNA原始數(shù)據(jù),共309個mRNA樣本,包括3個正常樣本和306個腫瘤樣本。從SNP相關(guān)數(shù)據(jù)得到子宮頸癌突變基因,利用R語言中的Edger包對mRNA數(shù)據(jù)進(jìn)行整合和標(biāo)準(zhǔn)化,得到差異表達(dá)基因以及表達(dá)水平。
通過DAVID軟件對子宮頸癌樣本突變>20例的突變基因進(jìn)行基因本體論(gene ontology,GO)和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,以P< 0.05為檢驗水準(zhǔn),獲得突變基因的分子功能(molecular function,MF)、生物過程(biological process,BP)、細(xì)胞組分(cellular component,CC)和KEGG通路信息。
對mRNA整理和標(biāo)準(zhǔn)化來獲得mRNA表達(dá)水平,對突變例數(shù)多的基因進(jìn)行分析,通過秩和檢驗得到基因突變與基因mRNA表達(dá)水平的相關(guān)性,對具有相關(guān)性的基因進(jìn)行生存曲線分析并繪制生存曲線。
子宮頸癌差異基因使用R軟件3.6.0“Edger”包進(jìn)行篩選,通過Wilcox秩和檢驗比較突變基因mRNA的表達(dá)水平,通過Kaplan-Meier繪制生存曲線。P< 0.05為差異有統(tǒng)計學(xué)意義。
結(jié)果顯示,有110個基因突變樣本超過20例(圖1)。共309個子宮頸癌mRNA樣本,癌癥樣本有306個,設(shè)定閾值為4,P< 0.01,對正常組織和子宮頸癌組織樣本進(jìn)行差異表達(dá)分析,共獲得803個差異表達(dá)基因(圖2)。
圖1 突變>15例的突變基因瀑布圖Fig.1 Waterfall map of mutated genes from more than 15 samples
圖2 差異表達(dá)mRNA的火山圖Fig.2 Volcanic map of differentially expressed mRNA
結(jié)果顯示,子宮頸癌突變基因參與多種通路途徑影響B(tài)P和MF。在BP方面,SNP主要影響轉(zhuǎn)錄過程,參與RNA聚合酶Ⅱ的負(fù)調(diào)節(jié)和細(xì)胞膜黏附分子的黏附能力;在CC中,SNP主要定位于細(xì)胞膜和細(xì)胞外泌體。在MF方面,SNP主要參與蛋白質(zhì)結(jié)合、Ca2+離子結(jié)合、ATP酶結(jié)合和激活,見表1。此外,對突變基因進(jìn)行KEGG富集分析結(jié)果顯示,SNP參與多條信號通路(甲狀腺激素信號通路和Notch信號通路等),見表2。
為了了解蛋白質(zhì)互作關(guān)系,通過String在線軟件對110個突變基因構(gòu)建PPI,包括107個節(jié)點和299個邊。通過Cytoscape軟件的cytoHubba包進(jìn)行可視化處理,見圖3。對突變基因和經(jīng)校正后的mRNA表達(dá)進(jìn)行相關(guān)性分析。結(jié)果顯示,DNAH17、FBXW7和SYNE23個與mRNA表達(dá)相關(guān)的突變基因,DNAH17和SYNE2突變后的mRNA表達(dá)水平降低,而FBXW7突變后mRNA表達(dá)水平升高(P分別為0.020、0.029、0.031),見圖4。對DNAH17、FBXW7和SYNE2突變基因繪制Kaplan-Meier生存曲線,發(fā)現(xiàn)SYNE2高表達(dá)顯著降低子宮頸癌患者的無病生存期(P=0.008),見圖5。
表1 子宮頸癌突變基因的功能富集分析Tab.1 Functional enrichment analysis of cervical cancer gene mutations
表2 子宮頸癌突變基因KEGG信號通路富集分析Tab.2 KEGG signaling pathway analysis of cervical cancer gene mutations
SNP指單堿基DNA序列發(fā)生突變、逆轉(zhuǎn)、插入和缺失,是人類最常見的遺傳變異方式,基因啟動子SNP變異可影響RNA聚合酶識別轉(zhuǎn)錄起始位置,使mRNA表達(dá)水平異常,基因內(nèi)含子區(qū)域SNP影響mRNA可變剪切過程[6]。研究表明,基因突變與子宮頸癌的發(fā)病風(fēng)險有關(guān)。DUAN等[7]發(fā)現(xiàn)IL-6 -174G>C降低子宮頸癌的發(fā)病風(fēng)險。HABBOUS等[8]發(fā)現(xiàn)P53Arg72Pro突變促進(jìn)HPV陽性患者的子宮頸病變,增加子宮頸癌患病風(fēng)險。
圖3 子宮頸癌突變基因的PPI網(wǎng)絡(luò)Fig.3 PPI networks of cervical cancer mutant genes
圖4 子宮頸癌突變基因與mRNA表達(dá)水平的相關(guān)性Fig.4 Correlation between cervical cancer gene mutations and mRNA expression levels
圖5 子宮頸癌突變基因的無病生存期(Kaplan-Meier)Fig.5 Disease-free survival in patients with cervical cancer gene mutations(Kaplan-Meier)
本研究從TCGA公共數(shù)據(jù)庫下載子宮頸癌相關(guān)SNP數(shù)據(jù)和表達(dá)譜數(shù)據(jù),通過表達(dá)譜數(shù)據(jù)獲取經(jīng)校正后的基因表達(dá)水平和差異表達(dá)基因,通過SNP數(shù)據(jù)篩選出突變基因。為了闡明這些突變基因在疾病中的分子機(jī)制,本研究通過GO和KEGG富集分析結(jié)果顯示,這些突變基因主要定位于細(xì)胞膜和細(xì)胞外泌體,參與蛋白質(zhì)結(jié)合和ATP酶激活,并參與轉(zhuǎn)錄調(diào)控作用,包括負(fù)調(diào)節(jié)RNA聚合酶Ⅱ啟動子轉(zhuǎn)錄。此外,通路分析表明這些突變基因參與Notch信號通路、甲狀腺激素信號通路、細(xì)胞周期、病毒致癌和多種癌癥致病過程。
對突變>20例的突變基因表達(dá)水平分析結(jié)果顯示,DNAH17和SYNE2突變后的mRNA表達(dá)水平降低,而FBXW7突變后的mRNA表達(dá)水平升高。進(jìn)一步對DNAH17、SYNE2、FBXW7基因進(jìn)行生存分析發(fā)現(xiàn),SYNE2高表達(dá)顯著降低子宮頸癌患者的無病生存期(P< 0.05),然而,未發(fā)現(xiàn)DNAH17和FBXW7基因與子宮頸癌生存期有關(guān),可能是在TCGA數(shù)據(jù)庫子宮頸癌相關(guān)SNP數(shù)據(jù)中,基因突變例數(shù)過少,導(dǎo)致生存時間差異不顯著。DNAH17是與軸突重鏈編碼的相關(guān)基因,F(xiàn)AN 等[9]發(fā)現(xiàn)DNAH17的異常甲基化水平與肝癌纖維膠囊、腫瘤壞死、肝硬化和腫瘤血栓等臨床特征有關(guān)。此外,ZHAN等[10]對乙型肝炎病毒相關(guān)的早期肝癌組織進(jìn)行整個外顯子進(jìn)行了測序,發(fā)現(xiàn)DNAH17在肝癌中存在高頻突變,與本研究通路富集結(jié)果一致。子宮頸癌的發(fā)生發(fā)展主要是HPV持續(xù)感染致癌的動態(tài)過程,本通路富集分析表明突變基因參與病毒致癌。目前,尚未發(fā)現(xiàn)突變基因與子宮頸癌相關(guān)性的研究報道,本研究為子宮頸癌的分子機(jī)制研究提供了新的理論依據(jù)。
FBXW7是包含F(xiàn)框和WD重復(fù)域蛋白,屬于F盒蛋白家族,是SCFE3泛素連接酶底物識別部位[11]。FBXW7參與細(xì)胞調(diào)控(細(xì)胞周期、細(xì)胞分化、細(xì)胞增殖和凋亡)。BEN等[12]發(fā)現(xiàn)miR-27a-3p通過下調(diào)FBXW7促進(jìn)子宮頸癌細(xì)胞增殖。XU等[13]研究發(fā)現(xiàn)FBXW7表達(dá)水平降低與淋巴血管間隙浸潤和淋巴結(jié)轉(zhuǎn)移有關(guān),提示患者無病生存期和總體生存期較短。本研究通路富集表明突變基因參與子宮頸癌致癌過程,F(xiàn)BXW7突變使mRNA表達(dá)水平升高。因此,突變型FBXW7可能降低子宮頸癌的惡行生物學(xué)行為。SYNE2屬于巨譜蛋白重復(fù)序列(Nesprins)家族,主要參與連接細(xì)胞核與細(xì)胞骨架。研究[14]表明SYNE2突變rs4027405與抑癌基因P21表達(dá)有關(guān),攜帶rs4027405 GA/AA基因型的肝癌患者生存期較短、預(yù)后較差。本研究中發(fā)現(xiàn)SYNE2突變后表達(dá)水平降低,且低表達(dá)SYNE2的子宮頸癌患者無病生存期較長。
綜上所述,通過GO和KEGG富集分析發(fā)現(xiàn)DNAH17、FBXW7和SYNE2參與多種致癌過程。子宮頸癌組織中DNAH17、FBXW7和SYNE2突變調(diào)控mRNA的表達(dá)水平,且SYNE2突變患者無病生存期較長,表明SYNE2突變是子宮頸癌的保護(hù)因素。本研究為臨床診斷和預(yù)后評估提供了新的思路,但仍需在今后的臨床研究中進(jìn)一步驗證。