国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

非小細(xì)胞肺癌差異表達(dá)基因的生物信息學(xué)分析

2021-07-09 06:36鄭浩然蔣愛(ài)民阮之平
關(guān)鍵詞:差異基因樞紐肺癌

鄭浩然,蔣愛(ài)民,傅 瀟,田 濤,梁 璇,阮之平,姚 煜

(西安交通大學(xué)第一附屬醫(yī)院腫瘤內(nèi)科,陜西西安 710061)

肺癌已經(jīng)成為全世界癌癥死亡的主要原因,其發(fā)病率和死亡率近年來(lái)顯著升高[1]。一系列的研究表明,吸煙、空氣污染、職業(yè)暴露等因素均與肺癌發(fā)生有關(guān)[2]。所有肺癌患者中,非小細(xì)胞肺癌(non-small cell lung cancer, NSCLC)約占肺癌病理分型的85%[3]。早期NSCLC患者接受手術(shù)治療后預(yù)后尚可[4]。近年來(lái),盡管NSCLC的早期診斷和治療取得了較大進(jìn)展,但其預(yù)后仍不容樂(lè)觀。因此,尋找能夠準(zhǔn)確預(yù)測(cè)患者預(yù)后的生物標(biāo)志物至關(guān)重要。隨著科技的發(fā)展,大量基因芯片數(shù)據(jù)庫(kù)的建立為研究肺癌差異表達(dá)基因(differently expressed genes, DEGs)提供了重要基礎(chǔ)。本研究在GEO數(shù)據(jù)庫(kù)中選取了GSE19804和GSE33532兩個(gè)肺癌基因表達(dá)譜芯片作為研究數(shù)據(jù)集,篩選出DEGs并探討其在NSCLC發(fā)生發(fā)展過(guò)程中的功能及其與患者預(yù)后的關(guān)系,從而為NSCLC的靶向治療提供新策略。

1 資料與方法

1.1 芯片數(shù)據(jù)的選擇本研究使用的是來(lái)自美國(guó)國(guó)立生物技術(shù)信息中心的GEO數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/geo)中的基因芯片數(shù)據(jù),系列號(hào)分別是GSE19804和GSE33532。其中GSE19804數(shù)據(jù)集由LU等[5]于2011年發(fā)表,收集了60例NSCLC樣本和60例正常肺組織樣本。GSE33532數(shù)據(jù)集由MEISTER等于2014年發(fā)表,收集了80例NSCLC樣本和20例正常肺組織樣本。

1.2 方法

1.2.1NSCLC與正常肺組織差異基因的篩選 采用GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)對(duì)NSCLC組織與正常肺組織之間的DEGs進(jìn)行篩選。利用默認(rèn)的Benjamini和Hochberg錯(cuò)誤發(fā)現(xiàn)率方法,調(diào)整P值來(lái)降低假陽(yáng)性率。以調(diào)整后P<0.05、|log2FC|≥2作為截?cái)鄻?biāo)準(zhǔn),運(yùn)用FunRich3.1.3對(duì)兩個(gè)數(shù)據(jù)集中的DEGs取交集,最終篩選出共同的DEGs。

1.2.2差異基因的富集分析 采用生物信息注釋數(shù)據(jù)庫(kù)DAVID(https://david.ncifcrf.gov/)對(duì)DEGs進(jìn)行基因本體(gene ontology, GO)分析及京都基因和基因組百科全書(shū)(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析,并對(duì)共表達(dá)DEGs的功能分析(細(xì)胞組分、分子功能、生物學(xué)過(guò)程以及信號(hào)通路)進(jìn)行可視化,以P<0.05及錯(cuò)誤發(fā)現(xiàn)率(false discovery rate, FDR)<0.05為顯著性基因富集[6]。

1.2.3PPI網(wǎng)絡(luò)的構(gòu)建及樞紐基因的篩選 采用STRING(search tool for the retrieval of interacting genes/proteins)10.5(https://string-db.org/)在線工具對(duì)DEGs進(jìn)行蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)(protein-protein interaction, PPI)分析。以置信度得分≥0.4且最大相互作用數(shù)=0作為界值對(duì)DEGs進(jìn)行PPI分析。隨后,運(yùn)用Cytoscape3.8.0(http://www.cytoscape.org/)[7]中的cytohubba插件對(duì)PPI網(wǎng)絡(luò)進(jìn)行分析,篩選出與周圍基因有高度連通性(度值degree)的前20個(gè)基因作為樞紐基因。cytohubba通過(guò)幾種拓?fù)渌惴A(yù)測(cè)和探索給定網(wǎng)絡(luò)中重要節(jié)點(diǎn)和子網(wǎng)之間的相互關(guān)系。在網(wǎng)絡(luò)拓?fù)淅碚撝?,?connect degree, k)被定義為某節(jié)點(diǎn)與網(wǎng)絡(luò)中其他節(jié)點(diǎn)之間相互連接的數(shù)目,即相鄰蛋白質(zhì)的數(shù)量。

1.2.4樞紐基因的生存分析 運(yùn)用Kaplan-Meier plotter數(shù)據(jù)庫(kù)(http://www.kmplot.com/analysis/)對(duì)篩選出的20個(gè)樞紐基因進(jìn)行預(yù)后分析,選擇與NSCLC患者總生存期(overall survival, OS)呈相關(guān)性(P<0.05)的基因,并通過(guò)Kaplan-Meier法繪制生存曲線。

1.2.5通過(guò)多個(gè)外部數(shù)據(jù)庫(kù)對(duì)樞紐基因表達(dá)水平及其與預(yù)后關(guān)系進(jìn)一步驗(yàn)證

1.2.5.1GEPIA數(shù)據(jù)庫(kù) GEPIA基因表達(dá)譜數(shù)據(jù)動(dòng)態(tài)分析(http://gepia.cancer-pku.cn/)是由北京大學(xué)張澤民教授團(tuán)隊(duì)開(kāi)發(fā)的用于癌癥和正常組織基因表達(dá)以及交互式分析的網(wǎng)絡(luò)服務(wù)器,提供交互式和自定義功能,包括差異基因表達(dá)分析、生存分析等[8]。本研究運(yùn)用GEPIA分析樞紐基因在NSCLC和正常組織中的表達(dá)差異,同時(shí)進(jìn)行生存分析。

1.2.5.2HPA數(shù)據(jù)庫(kù) 運(yùn)用HPA數(shù)據(jù)庫(kù)(https://www.proteinatlas.org/)初步驗(yàn)證樞紐基因在NSCLC和正常組織中的蛋白質(zhì)表達(dá)情況。

1.2.5.3UALCAN數(shù)據(jù)庫(kù) UALCAN(http://ualcan.path.uab.edu/)是基于TCGA數(shù)據(jù)庫(kù)和CPTAC數(shù)據(jù)庫(kù)進(jìn)行癌癥數(shù)據(jù)在線分析和挖掘的網(wǎng)站。本研究通過(guò)UALCAN對(duì)樞紐基因及其蛋白在NSCLC和正常組織中的表達(dá)情況再次進(jìn)行驗(yàn)證。

1.2.6統(tǒng)計(jì)學(xué)分析 在線數(shù)據(jù)庫(kù)分析均應(yīng)用系統(tǒng)默認(rèn)的統(tǒng)計(jì)學(xué)方法。通過(guò)Kaplan-Meier法進(jìn)行生存分析,采用對(duì)數(shù)秩和檢驗(yàn),以P<0.05差異有統(tǒng)計(jì)學(xué)意義。

2 結(jié) 果

2.1 差異基因的篩選從GSE19804和GSE33532兩個(gè)數(shù)據(jù)集中分別篩選出264和795個(gè)DEGs,分別包括212、547個(gè)上調(diào)基因和52、248個(gè)下調(diào)基因。圖1A和圖1B為兩個(gè)數(shù)據(jù)集差異基因的火山圖,橫坐標(biāo)表示-Log10(P.value),縱坐標(biāo)表示log2(fold-change)(NSCLCvs.正常樣本),綠色表示下調(diào)的DEGs,紅色表示上調(diào)的DEGs。運(yùn)用FunRich3.1.3軟件對(duì)兩個(gè)數(shù)據(jù)集中的DEGs取交集并繪制韋恩圖(圖1C),最終篩選出共同的DEGs共159個(gè)。

圖1 差異基因的篩選

2.2 差異基因的富集分析

2.2.1GO分析 對(duì)159個(gè)共同DEGs進(jìn)行GO分析,發(fā)現(xiàn)它們?cè)诩?xì)胞組分上(圖2A)主要在膠原蛋白三聚體、細(xì)胞膜邊界的囊泡腔、細(xì)胞外基質(zhì)蛋白等處富集;在分子功能上(圖2B)主要在氧氣運(yùn)輸、CXCR趨化因子受體整合、氧氣整合、細(xì)胞外基質(zhì)整合等方面富集;在生物學(xué)過(guò)程中(圖2C)主要在細(xì)胞外基質(zhì)組裝、細(xì)胞外結(jié)構(gòu)組裝、血管形態(tài)發(fā)育等方面富集。

2.2.2KEGG分析 KEGG分析(圖2D)顯示共有6條通路呈顯著相關(guān),包括瘧疾、非洲錐蟲(chóng)病、細(xì)胞外基質(zhì)相互作用、過(guò)氧化物酶體增殖物激活受體(PPAR)信號(hào)通路、蛋白質(zhì)消化吸收及病灶黏附。

圖2 差異基因的GO和KEGG富集分析

2.3 PPI網(wǎng)絡(luò)的構(gòu)建及樞紐基因的篩選登錄STRING網(wǎng)站(https://string-db.org/),選擇Multiple Proteins,輸入經(jīng)初步篩選出的159個(gè)共同DEGs,物種選擇Homo sapiens,初步構(gòu)建PPI網(wǎng)絡(luò)圖。為發(fā)現(xiàn)NSCLC發(fā)展過(guò)程中的潛在調(diào)控基因,將STRING中的159個(gè)DEGs導(dǎo)入Cytoscape3.8.0以構(gòu)建PPI網(wǎng)絡(luò)(圖3)。運(yùn)用cytohubba插件對(duì)PPI網(wǎng)絡(luò)進(jìn)行運(yùn)算,按degree方法選擇前20個(gè)基因(圖4,表1),并將這20個(gè)基因作為樞紐基因。

表1 前20個(gè)樞紐基因(按degree排序)

圖3 PPI網(wǎng)絡(luò)

圖4 前20個(gè)樞紐基因

2.4 樞紐基因的生存分析運(yùn)用Kaplan-Meier plotter對(duì)篩選出的20個(gè)樞紐基因進(jìn)行生存分析,結(jié)果表明,20個(gè)樞紐基因中有15個(gè)基因與患者的OS呈相關(guān)性(P<0.05)。其中COL1A1和SPP1(HsT2645)基因高表達(dá)與患者更短的OS呈相關(guān)性(圖5),表明這兩個(gè)基因可能在NSCLC的發(fā)生發(fā)展中發(fā)揮潛在的促進(jìn)作用;其余的13個(gè)樞紐基因高表達(dá)則是患者OS的保護(hù)性因素。

圖5 樞紐基因的生存曲線(Kaplan-Meier plotter)

2.5 通過(guò)多個(gè)外部數(shù)據(jù)庫(kù)對(duì)樞紐基因表達(dá)水平及其與預(yù)后關(guān)系的進(jìn)一步驗(yàn)證運(yùn)用GEPIA數(shù)據(jù)庫(kù)分析NSCLC和正常肺組織中COL1A1和SPP1基因的表達(dá)水平(圖6)。結(jié)果顯示,COL1A1和SPP1在NSCLC組織中的表達(dá)水平是上調(diào)的(P<0.05)。生存分析(圖7)顯示,COL1A1和SPP1基因高表達(dá)與患者更短的OS呈相關(guān)性(兩組HR=1.3,P<0.05)。進(jìn)一步支持Kaplan-Meier plotter數(shù)據(jù)庫(kù)分析結(jié)果。

圖6 樞紐基因在NSCLC和正常組織的表達(dá)水平(GEPIA)

運(yùn)用HPA數(shù)據(jù)庫(kù)初步驗(yàn)證COL1A1和SPP1基因在NSCLC和正常組織中的蛋白質(zhì)表達(dá)情況,發(fā)現(xiàn)COL1A1蛋白在多種癌癥組織及正常組織中均有表達(dá),特異性較低,而且已被證實(shí)與肺癌不良預(yù)后相關(guān)(P<0.001)。為此,本研究只展示了SPP1蛋白在NSCLC和正常組織中的免疫組化結(jié)果(圖8)。

圖8 免疫組化:SPP1蛋白在NSCLC和正常組織中的表達(dá)(HPA)

通過(guò)UALCAN分別分析了TCGA數(shù)據(jù)庫(kù)中515例肺腺癌組織與59例正常組織(圖9A)、503例肺鱗癌組織與52例正常組織(圖9B)中SPP1基因的表達(dá)情況。結(jié)果顯示,SPP1基因在NSCLC組織中的表達(dá)水平是上調(diào)的(兩組P<0.01)。分析CPTAC數(shù)據(jù)庫(kù)中111例肺腺癌組織與111例正常組織中SPP1蛋白的表達(dá)情況(圖9C),結(jié)果顯示,SPP1蛋白在NSCLC組織中的表達(dá)高于正常組織(P<0.01)。亞組分析顯示,淋巴結(jié)N3組SPP1基因表達(dá)高于N1、N2組(P<0.05),說(shuō)明SPP1可能通過(guò)影響淋巴結(jié)轉(zhuǎn)移導(dǎo)致患者預(yù)后不良。

圖9 SPP1基因及蛋白在NSCLC和正常組織的表達(dá)水平(UALCAN)

3 討 論

目前,肺癌已經(jīng)成為全世界范圍內(nèi)癌癥相關(guān)死亡的首要原因。但是,由于多數(shù)NSCLC患者確診時(shí)已經(jīng)處于晚期,無(wú)手術(shù)機(jī)會(huì),5年生存率僅為16%[9-10]。肺癌組織復(fù)雜的生物學(xué)行為涉及多種基因及相關(guān)通路[11],目前對(duì)于其發(fā)生發(fā)展機(jī)制尚不十分清楚。隨著大數(shù)據(jù)時(shí)代的到來(lái),基因數(shù)據(jù)庫(kù)的共享使得從基因水平揭示肺癌的發(fā)生發(fā)展成為當(dāng)下研究者研究的熱點(diǎn)。本研究旨在運(yùn)用生物信息學(xué)分析的方法篩選出NSCLC與正常肺組織之間的差異基因,進(jìn)而探索與NSCLC預(yù)后相關(guān)的生物標(biāo)志物,從而為NSCLC的診療提供新思路。

本研究對(duì)GSE19804和GSE33532兩個(gè)基因芯片進(jìn)行挖掘,共篩選出NSCLC與正常肺組織之間的159個(gè)DEGs。通過(guò)STRING和Cytoscape3.8.0構(gòu)建DEGs的PPI網(wǎng)絡(luò)并進(jìn)行計(jì)算,最終確定20個(gè)樞紐基因。對(duì)20個(gè)樞紐基因運(yùn)用Kaplan-Meier plotter進(jìn)行生存分析發(fā)現(xiàn),COL1A1和SPP1(HsT2645)兩個(gè)基因的高表達(dá)與患者更短的OS顯著相關(guān)。經(jīng)GEPIA分析,二者在NSCLC與正常肺組織之間的表達(dá)差異有統(tǒng)計(jì)學(xué)意義,生存分析結(jié)果與Kaplan-Meier plotter一致。但HPA數(shù)據(jù)庫(kù)顯示,COL1A1蛋白在癌組織與正常組織中表達(dá)缺乏特異性,與基因表達(dá)水平不一致,臨床價(jià)值有限。為此,本研究最后通過(guò)UALCAN僅驗(yàn)證了SPP1基因及其蛋白的表達(dá)情況。結(jié)果顯示,SPP1基因及其蛋白在癌組織的表達(dá)高于正常組織。

SPP1(分泌磷蛋白1)主要位于細(xì)胞外基質(zhì),主要參與細(xì)胞基質(zhì)附著、骨化、抗細(xì)胞凋亡、細(xì)胞附著、免疫細(xì)胞趨化等生物學(xué)過(guò)程。據(jù)報(bào)道,SPP1可促進(jìn)腫瘤細(xì)胞存活,調(diào)節(jié)腫瘤相關(guān)的血管生成和炎癥反應(yīng)[12],與肺癌、卵巢癌、膠質(zhì)母細(xì)胞瘤、結(jié)腸癌的轉(zhuǎn)移和不良預(yù)后密切相關(guān)[13-17]。ZHANG等[18]的研究結(jié)果表明,SPP1通過(guò)對(duì)PD-L1的上調(diào)介導(dǎo)巨噬細(xì)胞極化,并促進(jìn)肺腺癌的免疫逃逸。以上研究表明,SPP1可能作為癌基因參與腫瘤的發(fā)生發(fā)展,本研究結(jié)果與上述研究保持一致。通過(guò)GO與KEGG分析,差異基因主要在細(xì)胞外基質(zhì)方面富集,這一結(jié)果更加支持了本研究結(jié)論的可靠性。生存分析顯示,SPP1基因高表達(dá)與NSCLC患者總生存(OS)存在明顯的相關(guān)性,高表達(dá)組OS均低于低表達(dá)組。因此,SPP1基因在NSCLC中表達(dá)水平上調(diào),高表達(dá)患者的總生存期更短。UALCAN亞組分析顯示,淋巴結(jié)N3組SPP1表達(dá)水平高于N1、N2組,說(shuō)明SPP1可能通過(guò)影響淋巴結(jié)轉(zhuǎn)移導(dǎo)致NSCLC患者預(yù)后不良。

綜上,SPP1基因可能成為評(píng)價(jià)NSCLC患者預(yù)后的生物學(xué)標(biāo)志物,為NSCLC的診斷及治療提供了新思路。

猜你喜歡
差異基因樞紐肺癌
氬氦刀冷凍治療肺癌80例的臨床觀察
長(zhǎng)鏈非編碼RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表達(dá)
“六度之城”:佛山西站樞紐新城——廣佛全新灣區(qū)能級(jí)樞紐藍(lán)圖綻放!
樞紐的力量
近親得肺癌自己早預(yù)防
樞紐經(jīng)濟(jì)連通發(fā)展動(dòng)脈
樞紐經(jīng)濟(jì)的“三維構(gòu)建”
基于高通量測(cè)序的藥用植物“鳳丹”根皮的轉(zhuǎn)錄組分析
基于高通量測(cè)序的藥用植物“鳳丹”根皮的轉(zhuǎn)錄組分析
紫檀芪處理對(duì)釀酒酵母基因組表達(dá)變化的影響
黄浦区| 盱眙县| 商洛市| 定州市| 普洱| 历史| 乐至县| 武冈市| 丽水市| 武定县| 容城县| 襄城县| 武穴市| 晋城| 睢宁县| 英山县| 镇平县| 高州市| 阜南县| 阿鲁科尔沁旗| 乾安县| 唐海县| 台东市| 乌苏市| 观塘区| 阳朔县| 鄄城县| 枣强县| 彭阳县| 扶风县| 德清县| 体育| 浦东新区| 什邡市| 扎兰屯市| 蓝山县| 伊吾县| 东阿县| 凯里市| 宜州市| 江西省|