郭世民,李紅梅?
(青島大學(xué)醫(yī)學(xué)院,山東 青島 266021)
中國卵巢癌的病死率較高,已經(jīng)嚴(yán)重威脅到我國婦女的生命質(zhì)量,應(yīng)該成為女性人群中重點防治的惡性腫瘤之一[1]。因此全面研究卵巢癌的發(fā)病機(jī)制,并建立起有效的預(yù)防和診療方案,是我們目前迫切應(yīng)該解決的問題。當(dāng)下,基于基因芯片技術(shù),利用生物信息學(xué)方法進(jìn)行系統(tǒng)分析,研究腫瘤相關(guān)的基因以及其調(diào)控機(jī)制,是功能基因組學(xué)的主要研究手段之一。在本研究中,我們利用公共基因芯片數(shù)據(jù)庫(Gene Expression Omnibus,GEO),整理了其中的卵巢癌基因相關(guān)的表達(dá)的芯片數(shù)據(jù),并通過生物信息學(xué)技術(shù)篩選出卵巢癌的相關(guān)基因。
從GEO(http://www.ncbi.nlm.nih.gov/geo)數(shù)據(jù)庫下載整理卵巢癌基因芯片數(shù)據(jù)。數(shù)據(jù)集篩選條件:(1)數(shù)據(jù)集屬于全基因組RNA含量表達(dá)芯片;(2)人類卵巢癌患者組織與正常卵巢組織進(jìn)行對照。
在GEO網(wǎng)站利用GEO2R 在線分析軟件進(jìn)行差異表達(dá)基因數(shù)據(jù)分析,獲得差異基因。利用Cluego[2]對所有差異表達(dá)基因進(jìn)行基因本體論(Gene Ontology,GO)富集分析和信號通路的富集分析(KyotoEncyclopedia of Genes and Genomes,KEGG)。最后利用Cytoscape[3]對所有差異基因的編碼蛋白構(gòu)建蛋白相互作用網(wǎng)絡(luò)(PPI)。
經(jīng)過檢索與整理,將卵巢癌基因芯片GSE105437數(shù)據(jù)納入研究。
利用在線工具GEO2R 進(jìn)行芯片表達(dá)量預(yù)處理,進(jìn)而篩選差異表達(dá)基因。篩選差異基因的限定條件為:p≤0.05,logFC≥2。卵巢癌基因芯片中共篩選出差異基因196 個,其中上調(diào)基因149個,下調(diào)基因47個。差異基因情況見圖1。生物信息學(xué)分析在這些差異基因中進(jìn)行。
對所有差異基因進(jìn)行基因本體論富集分析,結(jié)果顯示差異基因富集B細(xì)胞增殖調(diào)節(jié)、細(xì)胞生長因子調(diào)節(jié)、化學(xué)致癌作用等與卵巢癌的發(fā)病相關(guān)。對這些差異基因功能的關(guān)系構(gòu)建網(wǎng)絡(luò);見圖2。
用Cytoscape分析差異基因的蛋白之間的作用網(wǎng)絡(luò)。得分前五的基因有ALDH6A1、HADH、FYN、SRC和TNF,即與卵巢癌高度相關(guān)的關(guān)鍵基因。見圖3。
用在線工具Kaplan Meier Plotter對分析出的關(guān)鍵基因進(jìn)行生存預(yù)后分析。得到HADH,SRC兩個差異基因的生存預(yù)后有明顯差異。見圖4,圖5。
本研究基于生物信息學(xué)分析,從GEO數(shù)據(jù)庫中整理收集了卵巢癌基因表達(dá)的數(shù)據(jù),進(jìn)行卵巢癌相關(guān)差異基因篩選。共篩選出差異基因196個,其中上調(diào)基因149個, 下調(diào)基因47個,從中進(jìn)行GO富集分析,這些基因的功能富集在B細(xì)胞增殖調(diào)節(jié)、細(xì)胞生長因子調(diào)節(jié)、化學(xué)致癌作用。其中B細(xì)胞增殖調(diào)節(jié)與卵巢癌的發(fā)生有關(guān)[4]。
用Cytoscape構(gòu)建了差異基因蛋白相互作用網(wǎng)絡(luò),網(wǎng)絡(luò)中的關(guān)鍵基因有ALDH6A1、HADH、FYN、SRC和TNF。利用在線工具Kaplan Meier Plotter對分析出的關(guān)鍵基因進(jìn)行生存預(yù)后分析。得到HADH,SRC兩個差異基因的生存預(yù)后有明顯差異。羥酰-CoA脫氫酶(HADH)是3-羥酰輔酶A脫氫酶基因家族的成員。HADH編碼的蛋白質(zhì)在線粒體基質(zhì)中起作用以催化作為β-氧化途徑的一部分的直鏈3-羥基?;?CoA的氧化。其中中鏈脂肪酸的酶活性最高。這個基因的突變導(dǎo)致了一種家族性高胰島素血癥型低血糖癥。人類基因組在15號染色體上含有該基因的相關(guān)假基因[5]。與其他先天性脂肪酸氧化缺陷不同,短鏈L-3-羥基?;o酶A(HADH)缺乏癥的特征是在新生兒或嬰兒期具有低胰高血糖癥的低血糖癥。HADH與卵巢癌之間的分子機(jī)制還需要進(jìn)一步的研究。Src原癌基因(Src)該基因與勞斯肉瘤病毒的v-src基因高度相似。這種原癌基因可能在胚胎發(fā)育和細(xì)胞生長的調(diào)節(jié)中起作用。由該基因編碼的蛋白質(zhì)是酪氨酸蛋白激酶,其活性可以被c-SRC激酶磷酸化抑制。該基因的突變可能參與結(jié)腸癌的惡性進(jìn)展。已經(jīng)發(fā)現(xiàn)編碼相同蛋白的兩種轉(zhuǎn)錄本變體用于該基因。由于Src在細(xì)胞膜上被激活,Src易位到細(xì)胞膜被認(rèn)為是其募集粘著斑的關(guān)鍵所在。膜靶向缺陷Src突變SrcG2A本地化的焦點粘連,表明直接招募Src從胞漿到局灶性粘連。此外,直接募集的Src分子顯示增強(qiáng)焦點粘連處的樁蛋白動態(tài)。Src原癌基因與腫瘤的關(guān)系已經(jīng)有所進(jìn)展,與卵巢癌之間的潛在的分子機(jī)制有待進(jìn)一步的研究。
GEO是一種支持符合MIAME標(biāo)準(zhǔn)的數(shù)據(jù)提交的公共功能基因組數(shù)據(jù)庫。 它接受基于數(shù)組和序列的數(shù)據(jù),并提供工具來幫助用戶查詢和下載基因表達(dá)譜。本研究通過選擇GEO數(shù)據(jù)庫中卵巢癌的芯片,篩選出卵巢癌與正常組織有差異的相關(guān)關(guān)鍵基因。通過統(tǒng)計學(xué)計算與數(shù)據(jù)挖掘,卵巢癌發(fā)病可能與HADH,SRC等基因有關(guān),為卵巢癌病因研究提供了新的方向,也為我國女性卵巢癌危險因素的研究提供了依據(jù)。
[1] 張爽爽,夏慶民,鄭榮壽,陳萬青.中國2010年卵巢癌發(fā)病與死亡分析.中國腫瘤 2016(03)∶169-173.
[2] Bindea G,Mlecnik B,Hackl H,Charoentong P,Tosolini M,Kirilovsky A,Fridman WH,Pages F,Trajanoski Z,Galon J∶ClueGO∶a Cytoscape plug-in to decipher functionally grouped gene ontology and pathway annotation networks.Bioinformatics 2009,25(8)∶1091-1093.
[3] Franz M,Lopes CT,Huck G,Dong Y,Sumer O,Bader GD∶Cytoscape.js∶a graph theory library for visualisation and analysis.Bioinformatics 2016,32(2)∶309-311.
[4] Kim JY,Do SI,Bae GE,Kim HS∶B-cell translocation gene 1 is downregulated by promoter methylation in ovarian carcinoma.Journal of Cancer 2017,8(14)∶2669-2675.
[5] Martins E,Cardoso Ml Fau - Rodrigues E,Rodrigues E Fau - Barbot C,Barbot C Fau - Ramos A,Ramos A Fau- Bennett MJ,Bennett Mj Fau - Teles EL,Teles El Fau -Vilarinho L,Vilarinho L∶Short-chain 3-hydroxyacyl-CoA dehydrogenase deficiency∶the clinical relevance of an early diagnosis and report of four new cases.(1573-2665(Electronic)).