国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

共表達(dá)網(wǎng)絡(luò)分析篩選腎透明細(xì)胞癌進(jìn)展和預(yù)后相關(guān)基因

2019-10-17 02:05:34肖觀發(fā)石勝軍胡萬里
現(xiàn)代泌尿生殖腫瘤雜志 2019年4期
關(guān)鍵詞:共表達(dá)樞紐進(jìn)展

肖觀發(fā) 石勝軍 胡萬里

腎癌是西方國家10種最常見的癌癥之一,占所有癌癥的3%~5%[1]。2015年中國約有6.68萬腎癌新發(fā)病例和2.34萬死亡病例[2]。腎細(xì)胞癌(renal cell carcinoma, RCC)約占所有腎癌的90%,其中大部分(80%~90%)為腎透明細(xì)胞癌(clear cell renal cell carcinoma, ccRCC)[3]。RCC早期診斷和隨訪的生物標(biāo)志物尚缺乏。據(jù)統(tǒng)計(jì),超過50%的RCC是偶然發(fā)現(xiàn)的,約30%的患者診斷時(shí)已發(fā)生轉(zhuǎn)移;此外,30%~50%的RCC患者在隨訪過程中會(huì)發(fā)生轉(zhuǎn)移[4-5]。對于局限性RCC,手術(shù)是唯一有高質(zhì)量的治療方法,而對于轉(zhuǎn)移性RCC患者則需要全身治療[3]。然而,ccRCC通常對放、化療不敏感,靶向治療因其靶向特異性和低毒性可能是非手術(shù)治療的最佳選擇[3,6],但是ccRCC腫瘤內(nèi)的分子異質(zhì)性可能會(huì)影響靶向治療的應(yīng)答,對靶向治療的抵抗也是一個(gè)主要問題[7-8];盡管行全身治療,轉(zhuǎn)移性RCC患者的預(yù)后仍很差。因此,早期診斷、個(gè)體化治療和隨訪成為治療成功的關(guān)鍵,尋找與ccRCC診斷、治療和預(yù)后相關(guān)的生物靶點(diǎn)至關(guān)重要。

隨著全基因組測序技術(shù)的快速發(fā)展,越來越多的腫瘤相關(guān)基因被快速檢測出,腫瘤研究取得突破性進(jìn)展[9]。雖然具有相似表達(dá)模式的基因可能在功能上是相關(guān)的,但在許多研究中,基因之間的高度相關(guān)性往往被忽略。加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis, WGCNA)是一種系統(tǒng)生物學(xué)算法,用于描述基因芯片樣本中基因之間的相關(guān)模式,以及高共表達(dá)基因或模塊簇與樣本外部特征之間的關(guān)系[10]。簡而言之,WGCNA可以識(shí)別高共表達(dá)基因簇,也可以篩選與臨床特征相關(guān)的樞紐基因和模塊。相關(guān)網(wǎng)絡(luò)促進(jìn)了基于網(wǎng)絡(luò)的基因篩選方法,這些方法可用于識(shí)別候選生物標(biāo)志物或治療靶點(diǎn)。

蛋白相互作用(protein-protein interaction, PPI),通常被理解為發(fā)生在細(xì)胞或活體生物中的蛋白之間分子對接的物理接觸[11],是一種新型分子治療靶點(diǎn)[12]。預(yù)測PPI的生物數(shù)據(jù)庫STRING可以構(gòu)建PPI網(wǎng)絡(luò),以蛋白為節(jié)點(diǎn),相互作用為邊緣[13]。在PPI網(wǎng)絡(luò)中“高度連接”的基因更有可能是重要蛋白質(zhì)[14]。

本研究嘗試構(gòu)建加權(quán)共表達(dá)網(wǎng)絡(luò)和PPI網(wǎng)絡(luò),以識(shí)別與ccRCC進(jìn)展和預(yù)后顯著相關(guān)的生物標(biāo)志物。

對象與方法

一、數(shù)據(jù)采集與預(yù)處理

從基因表達(dá)譜(gene expression omnibus, GEO)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)下載所需基因芯片集。GSE68417作為訓(xùn)練集構(gòu)建共表達(dá)網(wǎng)絡(luò),包括14例正常腎臟組織樣本和29例ccRCC組織樣本。另外,GSE53757作為測試集來驗(yàn)證得到的結(jié)果,包括72例正常腎臟組織樣本和72例ccRCC組織樣本。此外,本研究還從癌癥基因組圖譜(cancer genome atlas, TCGA)數(shù)據(jù)庫(https://genome-cancer.ucsc.edu/)下載了RNA測序數(shù)據(jù)集和相關(guān)臨床數(shù)據(jù),并將其作為一個(gè)測試集來驗(yàn)證研究結(jié)果。

二、差異表達(dá)基因篩選

采用R軟件中的limma包[15]對正常腎組織標(biāo)本和ccRCC組織標(biāo)本之間的差異表達(dá)基因(differentially expressed genes, DEGs)進(jìn)行篩選。錯(cuò)誤發(fā)現(xiàn)率(false discovery rate, FDR)<0.05和│log2 FC│≥1.0為篩選條件,其中FC為兩組間差異表達(dá)倍數(shù)。

三、加權(quán)共表達(dá)網(wǎng)絡(luò)構(gòu)建與樞紐模塊篩選

利用R軟件中的WGCNA包構(gòu)建DEGs共表達(dá)網(wǎng)絡(luò)。首先檢測DEGs的表達(dá)數(shù)據(jù)圖譜,檢驗(yàn)其是否為良好的樣本和基因,并在后續(xù)分析中剔除離群樣本。步驟如下:①計(jì)算各基因間Pearson相關(guān)系數(shù)。②構(gòu)建加權(quán)鄰接矩陣aij=│sij│β(sij代表基因i和j的Pearson相關(guān)系數(shù);aij代表i基因與j基因的鄰接系數(shù);β是一個(gè)軟閾值)。③將鄰接矩陣轉(zhuǎn)化為拓?fù)渲丿B矩陣(TOM),并計(jì)算基因間相異度矩陣dissTOM=1-TOM,然后對dissTOM進(jìn)行層次聚類。④設(shè)置基因樹狀圖的最小模量為30,合并相似度高于0.8的模塊。

四、樞紐模塊和樞紐基因的篩選

將各模塊與臨床性狀關(guān)聯(lián)后,計(jì)算各模塊顯著性(module significance, MS)。MS值越高,模塊就越重要。通過比較各MS,與某一臨床特征高度相關(guān)的模塊被視為樞紐模塊。然后計(jì)算基因顯著性(gene significance, GS)和模塊身份(module membership, MM)。樞紐模塊中│MM│>0.8、│GS│>0.2的基因被視為備選樞紐基因。另外將該模塊中的基因上傳至STRING數(shù)據(jù)庫[13]構(gòu)建PPI網(wǎng)絡(luò),選取點(diǎn)度中心性≥14的基因作為備選樞紐基因。最終,篩選兩個(gè)網(wǎng)絡(luò)中共有的基因即為樞紐基因。

五、樞紐基因的驗(yàn)證

利用數(shù)據(jù)集GSE53757、RNA測序數(shù)據(jù)和人類蛋白質(zhì)圖譜數(shù)據(jù)庫[16](http://www.proteinatlas.org),探索正常腎組織和ccRCC組織中樞紐基因的mRNA和蛋白表達(dá)情況。在測試集GSE53757和RNA測序數(shù)據(jù)中進(jìn)行線性回歸分析,驗(yàn)證樞紐基因表達(dá)與ccRCC進(jìn)展的關(guān)系。繪制樞紐基因的受試者工作曲線圖,評價(jià)其對局限性(病理Ⅰ/Ⅱ期)和非局限性(病理Ⅲ/Ⅳ期)ccRCC的鑒別能力。利用RNA測序數(shù)據(jù)對樞紐基因進(jìn)行生存分析。

六、GO及KEGG富集分析

利用R軟件中的clusterProfiler包[17]對樞紐模塊中的基因進(jìn)行GO富集和KEGG通路分析。FDR<0.05被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。

七、基因集富集分析

數(shù)據(jù)集GSE53757用于樞紐基因的基因集富集分析(gene set enrichment analysis, GSEA)[18]。本數(shù)據(jù)中72例ccRCC樣本根據(jù)樞紐基因的中位表達(dá)(高、低)分為兩組。選擇c2.cp.kegg.v6.2.symbols.gmt作為參考基因集,F(xiàn)DR<0.05被認(rèn)為具有統(tǒng)計(jì)學(xué)意義。

結(jié) 果

一、DEGs篩選、共表達(dá)網(wǎng)絡(luò)構(gòu)建及樞紐模塊確定

經(jīng)過數(shù)據(jù)預(yù)處理,得到訓(xùn)練集GSE68417的表達(dá)式矩陣。選取共1 678個(gè)DEGs (634個(gè)上調(diào)基因,1 044個(gè)下調(diào)基因)構(gòu)建共表達(dá)網(wǎng)絡(luò)。選擇β=4(R2=0.89)為軟閾值(圖1A),確定7個(gè)模塊(圖1B)。各模塊與ccRCC的進(jìn)展(分級)相關(guān),通過比較各模塊間的MS,確定棕色模塊為樞紐模塊(圖1C)。

A:軟閾值;B:基因模塊;C:樞紐模塊篩選圖1 WGCNA軟閾值、臨床性狀相關(guān)模塊的確定

二、樞紐基因確定

在棕色模塊中,通過│MM│>0.8、│GS│>0.2篩選得到27個(gè)備選樞紐基因。在PPI網(wǎng)絡(luò)中,9個(gè)基因連接度≥14。取兩者交集得到VWF、TEK和FLT1這3個(gè)基因,其被認(rèn)為是與ccRCC進(jìn)展密切相關(guān)的樞紐基因。

三、樞紐基因驗(yàn)證

基于數(shù)據(jù)集GSE53757和RNA測序數(shù)據(jù),發(fā)現(xiàn)樞紐基因在正常腎組織和ccRCC組織中的表達(dá)差異(圖2)。此外,免疫組織化學(xué)染色從人類獲得蛋白質(zhì)圖譜數(shù)據(jù)庫也證明了樞紐基因的表達(dá)(圖3)。在檢測集GSE53757和RNA測序數(shù)據(jù)中,線性回歸分析證實(shí)所有樞紐基因與ccRCC進(jìn)展(病理分期)呈負(fù)相關(guān)(P<0.05)(圖4)。繪制受試者工作曲線評估樞紐基因?qū)窒扌?病理分期Ⅰ/Ⅱ)和非局限性(病理分期Ⅲ/Ⅳ) ccRCC的鑒別能力,曲線下面積值均>0.5(圖5)。此外,生存分析顯示,樞紐基因表達(dá)越低,整體生存狀況越差,說明樞紐基因可能是ccRCC預(yù)后的生物標(biāo)志物(圖6)。

A:基于GSE53757數(shù)據(jù)集(VWF、TEK、FLT1);B:基于RNA測序數(shù)據(jù)(VWF、TEK、FLT1)圖2 正常腎組織與ccRCC組織間樞紐基因轉(zhuǎn)錄水平的驗(yàn)證

A:VWF;B:TEK;C:FLT1圖3 基于人類蛋白質(zhì)圖譜數(shù)據(jù)庫正常腎組織和ccRCC組織間樞紐基因的翻譯水平

A:基于GSE53757數(shù)據(jù)集(VWF、TEK、FLT1);B:基于RNA測序數(shù)據(jù)(VWF、TEK、FLT1)圖4 各樞紐基因表達(dá)水平與ccRCC進(jìn)展(病理分期)的相關(guān)性

A:基于GSE53757數(shù)據(jù)集(VWF、TEK、FLT1); B:基于RNA測序數(shù)據(jù)(VWF、TEK、FLT1)圖5 各樞紐基因的受試者工作曲線

A:VWF;B:TEK;C:FLT1圖6 RNA測序數(shù)據(jù)庫中ccRCC各樞紐基因的總體生存分析

四、GO和KEGG富集分析

為進(jìn)一步了解DEGs在樞紐模塊中的作用,進(jìn)行GO和KEGG富集分析。GO分析結(jié)果顯示,樞紐模塊的DEGs主要富集于10個(gè)生物過程,包括血管發(fā)育調(diào)控、腎小球發(fā)育、腎小球血管發(fā)育、內(nèi)皮細(xì)胞遷移、腎臟系統(tǒng)血管發(fā)育、腎臟血管發(fā)育、上皮細(xì)胞遷移、上皮組織遷移、內(nèi)皮細(xì)胞遷移調(diào)控和組織遷移。此外,KEGG通路富集分析結(jié)果顯示,DEGs主要富集于HIF-1信號通路、Rap1信號通路、膽固醇代謝、碳代謝和類風(fēng)濕關(guān)節(jié)炎(圖7)。

A:GO分析;B:KEGG通路富集分析圖7 樞紐模塊中DEGs的GO和KEGG富集分析

為了解樞紐基因的潛在影響機(jī)制,進(jìn)行GSEA研究。FDR<0.05被認(rèn)為具有統(tǒng)計(jì)學(xué)意義,18個(gè)基因集普遍富集于樞紐基因低表達(dá)組,且大多數(shù)集中在與免疫相關(guān)的通路上。

討 論

RCC是世界范圍內(nèi)最常見的腫瘤之一。當(dāng)前迫切需要更有效的ccRCC診斷、治療和預(yù)后的生物標(biāo)志物。本研究通過構(gòu)建共表達(dá)網(wǎng)絡(luò)和PPI網(wǎng)絡(luò),以識(shí)別與ccRCC進(jìn)展高度相關(guān)的樞紐基因,最終確定3個(gè)樞紐基因(VWF、TEK和FLT1)?;跀?shù)據(jù)集GSE53757、RNA測序數(shù)據(jù)和人類蛋白質(zhì)圖譜數(shù)據(jù)庫的分析,這些基因被確認(rèn)為是與ccRCC進(jìn)展和預(yù)后高度相關(guān)的候選生物標(biāo)志物,可有效區(qū)分局限性和非局限性ccRCC。高共表達(dá)基因通過WGCNA連接并分組成模塊,不同的模塊包含不同的功能相關(guān)基因。為了挖掘與ccRCC進(jìn)展相關(guān)的潛在機(jī)制,本研究對樞紐模塊的基因進(jìn)行了GO富集和KEGG通路分析,結(jié)果顯示血管生成相關(guān)通路在ccRCC進(jìn)展中發(fā)揮了重要作用。

VWF編碼一種參與止血、免疫應(yīng)答、炎癥、血管生成和腫瘤轉(zhuǎn)移的糖蛋白[19]。關(guān)于VWF在腫瘤轉(zhuǎn)移中的作用說法大相徑庭[20]。一些研究發(fā)現(xiàn)VWF是腫瘤性疾病的一種消極預(yù)后標(biāo)志物,可促進(jìn)腫瘤的進(jìn)展和轉(zhuǎn)移[21-23];然而,另有研究表明VWF可以作為腫瘤細(xì)胞存活的抑制劑,減少轉(zhuǎn)移[24-25]。TEK編碼血管生成素1和2的受體,屬于酪氨酸激酶Tie2家族。近期研究表明,TEK高表達(dá)與乳腺癌生存率低相關(guān)[26-27]。Park等[28]發(fā)現(xiàn)TEK活化可誘導(dǎo)腫瘤血管正?;?,促進(jìn)血液灌注和化療藥物遞送,顯著減少乳酸酸中毒,降低腫瘤生長和轉(zhuǎn)移。Ha等[29]研究表明TEK是一種潛在的ccRCC預(yù)后基因。TEK在腫瘤中的作用仍在探索中,它可能是一個(gè)極具研究價(jià)值的癌癥治療靶點(diǎn)。FLT1編碼血管內(nèi)皮生長因子受體家族成員,在血管生成中發(fā)揮重要作用。Qian等[30]證明,F(xiàn)LT1調(diào)控一組炎癥反應(yīng)基因,影響乳腺腫瘤轉(zhuǎn)移。FLT1似乎與癌癥進(jìn)展相關(guān),可能作為一種預(yù)后指標(biāo)[31-33]。以上樞紐基因與腫瘤進(jìn)展及預(yù)后密切相關(guān),可能成為腎癌預(yù)后及治療靶點(diǎn)。

GSEA研究樞紐基因的潛在影響機(jī)制,結(jié)果顯示18個(gè)基因集普遍富集于樞紐基因低表達(dá)組,且大部分集中在與免疫相關(guān)的通路上。因此,我們可以假設(shè)這些樞紐基因可能通過調(diào)節(jié)免疫相關(guān)通路來影響ccRCC的預(yù)后。

目前已有關(guān)于ccRCC進(jìn)展相關(guān)基因的研究報(bào)道,但其可靠性有待進(jìn)一步驗(yàn)證。因此,本研究選取更多數(shù)據(jù)集來進(jìn)行驗(yàn)證,大大提升了研究結(jié)果的可信度;另外,通過對數(shù)據(jù)庫的分析,不僅驗(yàn)證樞紐基因的轉(zhuǎn)錄水平,更驗(yàn)證其翻譯水平。本研究最大的局限性是缺乏外部驗(yàn)證,需進(jìn)一步研究加以證實(shí)。

綜上所述,本研究確定并驗(yàn)證了與ccRCC的進(jìn)展和預(yù)后密切相關(guān)的3個(gè)樞紐基因(VWF、TEK和FLT1),其可能是ccRCC的候選生物標(biāo)志物。

猜你喜歡
共表達(dá)樞紐進(jìn)展
Micro-SPECT/CT應(yīng)用進(jìn)展
侵襲性垂體腺瘤中l(wèi)ncRNA-mRNA的共表達(dá)網(wǎng)絡(luò)
樞紐的力量
淮安的高鐵樞紐夢
商周刊(2019年18期)2019-10-12 08:50:56
樞紐經(jīng)濟(jì)的“三維構(gòu)建”
膀胱癌相關(guān)lncRNA及其共表達(dá)mRNA的初步篩選與功能預(yù)測
中國流行株HIV-1gag-gp120與IL-2/IL-6共表達(dá)核酸疫苗質(zhì)粒的構(gòu)建和實(shí)驗(yàn)免疫研究
胃癌患者癌組織HIF-1α、TGF-β共表達(dá)及其臨床意義
寄生胎的診治進(jìn)展
我國土壤污染防治進(jìn)展
河南科技(2014年22期)2014-02-27 14:18:22
平邑县| 肥城市| 广宁县| 松原市| 隆回县| 应城市| 垣曲县| 察雅县| 大埔县| 莆田市| 固镇县| 兴仁县| 嵊泗县| 探索| 盖州市| 县级市| 英德市| 邮箱| 左权县| 沁阳市| 林芝县| 博客| 喀喇沁旗| 肇州县| 五原县| 新营市| 崇信县| 嵊州市| 宁远县| 威海市| 大同县| 富平县| 莱芜市| 禄劝| 惠水县| 绥滨县| 城口县| 金坛市| 芜湖市| 仁化县| 红河县|