国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘分析CLDN10基因在腎透明細胞癌的表達及臨床意義

2021-11-06 02:03徐爭光李燦楦李曉林晏廷陳潔
海南醫(yī)學 2021年20期
關鍵詞:甲基化生存率數(shù)據(jù)庫

徐爭光,李燦楦,李曉,林晏廷,陳潔

暨南大學附屬第一醫(yī)院泌尿外科,廣東 廣州 510630

腎細胞癌(renal cell carcinoma,RCC)是成人泌尿系統(tǒng)中發(fā)病率最高的惡性腫瘤之一,據(jù)統(tǒng)計約占成人腎臟腫瘤的90%[1]。其中腎透明細胞癌(clear cell renal cell carcinoma,ccRCC)是其最常見的組織學亞型,占據(jù)了RCC的70%~75%[2]。ccRCC對放療和化療均不敏感,盡管分子靶向治療與免疫治療已取得了一定的進展,但臨床上多達30%的患者因出現(xiàn)藥物副反應而不得不停止藥物治療[1],目前最佳的治療方式仍是早期診斷行手術切除病灶或腎移植[3]。然而,ccRCC的早期癥狀較為隱蔽,高達三分之一的患者確診時已發(fā)生遠處轉移,錯過最佳的手術治療時間[4]。因此,亟需更加深入地了解ccRCC 發(fā)生、發(fā)展的分子機制,識別新的分子生物標志物用于預測ccRCC 的病理分期和臨床預后,以便能在癌癥進展的早期介入干預,提供個性化的治療方案。

Claudin 蛋白家族(Claudins)是一種參與構成細胞間緊密連接的骨架蛋白,能起到維持細胞間動態(tài)平衡的作用[5]。多項研究提示Claudins 在多種癌癥中的表達水平或升高或下降,這表明它在腫瘤的進展過程中起到某種特定的作用,比如促進癌細胞的增殖[6]、轉移[7]、侵襲[8]等。目前,已有研究報道Claudins 中的CLDN1、16在ccRCC細胞中高表達,可能在ccRCC的進展中發(fā)揮著重要作用。以此為依據(jù),利用已有的各種公開的腫瘤生物信息數(shù)據(jù)庫,對Claudins 中的另一家族成員CLDN10 在ccRCC 中相關生物學信息進行挖掘分析,旨在探討其在ccRCC中的作用。

1 資料與方法

1.1 Oncomine 數(shù)據(jù)庫 Oncomine 數(shù)據(jù)庫是一個分析目的基因在正常組織和腫瘤組織中表達差異的癌癥基因芯片數(shù)據(jù)庫和數(shù)據(jù)挖掘平臺[9]。本研究設定的檢索條件如下:(1)Gene:CLDN10;(2)analysis type:Cancer vs.Normal Analysis;(3) Cancer Type:Clear Cell Renal Cell Carcinoma;(4) Data Type:mRNA;(5) Threshold By:P-value,0.05;Fold Change,2;Gene Rank,Top 10%。

1.2 Ualcan 數(shù)據(jù)庫 Ualcan 數(shù)據(jù)庫(http://ualcan.path.uab.edu)是一個癌癥基因芯片數(shù)據(jù)庫和集成數(shù)據(jù)挖掘平臺,其中包括癌癥基因組圖譜(TCGA)在內(nèi)的31 種癌癥類型的基因組數(shù)據(jù)。按照各個腫瘤群體在個體癌癥階段、腫瘤分期、性別、年齡及其他臨床病理特征分成不同的亞群。利用該平臺,可挖掘和分析正常組織和癌癥組織間的差異表達基因,找出單個癌癥類型中最高表達和最低表達(上調(diào)和下調(diào))的基因,并評估基因表達水平和臨床病理特征對腫瘤患者預后的影響,以助于發(fā)現(xiàn)新的腫瘤生物標記物或新的治療靶點,在此數(shù)據(jù)庫可以根據(jù)自己的要求設置篩選數(shù)據(jù)的條件[10]。

1.3 GEPIA 數(shù)據(jù)庫 GEPIA 數(shù)據(jù)庫(http://gepia.cancer-pku.cn/index.html)是由北京大學基于The Cancer Genome Atlas (TCGA)和GenotypeTissue Expression(GTEx)數(shù)據(jù)庫的9 736 個腫瘤和8 587 個正常組織的基因表達數(shù)據(jù)而研究開發(fā),用以進行基因表達分析的數(shù)據(jù)庫[11]。通過GEPIA 數(shù)據(jù)庫對Ualcan 數(shù)據(jù)庫的分析結果進行驗證,進一步探討了CLDN10 表達水平與病理分期及預后的關系。

1.4 人類蛋白質(zhì)表達圖譜 人類蛋白質(zhì)表達圖譜(The Human Protein Atlas,HPA)是一個基于免疫組織化學和RNA 測序的方法,從蛋白質(zhì)和RNA 水平分析人類蛋白質(zhì)在各種人體組織和器官中表達水平的數(shù)據(jù)庫。該數(shù)據(jù)庫涵蓋了人類86%的蛋白編碼基因,可以分析正常組織和腫瘤組織中相同基因編碼的蛋白質(zhì)的差異表達,并評價蛋白質(zhì)表達差異對腫瘤患者預后的影響[12]。

1.5 String-DB數(shù)據(jù)庫 String-DB數(shù)據(jù)庫(https://string-db.org)是研究生物學基因或蛋白質(zhì)間相互作用的數(shù)據(jù)庫,它把已知的和可預測的蛋白質(zhì)功能關聯(lián)組合,從而構成蛋白質(zhì)間相互作用的生物數(shù)據(jù)庫[13]。通過該數(shù)據(jù)庫可以分析CLDN10 與上下游蛋白質(zhì)之間的相互作用。檢索條件設置如下:①Protein Name:CLDN10;②Organism:Homo sapiens;③Minimum required interaction score:medium confidence(0.400);④Max number of Interactors:no more than 20 interactors。

1.6 統(tǒng)計學方法 采用SPSS13.0 軟件處理數(shù)據(jù),用t檢驗分析CLDN10在正常腎組織和ccRCC中的表達差異;采用配對t檢驗進行配對樣本的組間比較;采用One-way ANOVA 分析CLDN10 的表達與ccRCC臨床分期間的關系;采用Kaplan-Meier 法對ccRCC 患者進行生存分析,P<0.05為差異具有統(tǒng)計學意義。

2 結果

2.1 CLDN10 mRNA在正常腎組織與ccRCC中的表達差異 在Oncomine 數(shù)據(jù)庫的Beroukhim Renal、Yusenko Renal、Gumz Renal、Lenburg Renal、Higgins Renal 等5 個子數(shù)據(jù)庫中,根據(jù)設定的檢索條件獲得6 項研究結果(表1)分別對5個子數(shù)據(jù)庫的研究結果進行箱式圖分析,Beroukhim Renal 數(shù)據(jù)庫中有70 個樣本、12 624 個被檢基因,在遺傳性ccRCC 中,CLDN10 在低表達基因中排第356 位(top 3%),差異倍數(shù)為-3.441,P=1.91E-8 (圖1);在非遺傳性ccRCC中,CLDN10 在低表達基因中位于178 位(top 2%),差異倍數(shù)為-4.396,P=4.14E-9 (圖2)。Yusenko Renal數(shù)據(jù)庫中有67 個樣本,19 574 個被檢基因,CLDN10在低表達基因中排第1 004 位(top 6%),差異倍數(shù)為-3.731,P=9.44E-4 (圖3)。Gumz Renal 數(shù)據(jù)庫中有20 個樣本,12 624 個被檢基因,CLDN10 在低表達基因中排第291 位(top 3%),差異倍數(shù)為-3.792,P=6.81E-7 (圖4)。Lenburg Renal 數(shù)據(jù)庫中有18 個樣本,17 779個被檢基因,CLDN10在低表達基因中位于1 053 位(top 6%),差異倍數(shù)為-2.942,P=8.35E-4(圖5)。Higgins Renal 數(shù)據(jù)庫中有44 個樣本,5 900 個被檢基因,在低表達基因中位于559 位(top 10%),差異倍數(shù)為-6.255,P=0.006 (圖6)。通過對6 項研究結果的薈萃分析,發(fā)現(xiàn)CLDN10 在ccRCC 中的表達較正常腎組織低,中位數(shù)表達值為457.5 (P=0.003,圖7)。

圖1 Beroukhim Renal數(shù)據(jù)庫中CLDN10在正常腎組織與ccRCC中的表達差異

圖2 Beroukhim Renal 數(shù)據(jù)庫中CLDN10 在正常腎組織與ccRCC 中的表達差異

圖3 Yusenko Renal 數(shù)據(jù)庫中CLDN10 在正常腎組織與ccRCC 中的表達差異

圖4 Gumz Renal數(shù)據(jù)庫中CLDN10在正常腎組織與ccRCC中的表達差異

圖5 Lenburg Renal 數(shù)據(jù)庫中CLDN10 在正常腎組織與ccRCC 中的表達差異

圖6 Higgins Renal 數(shù)據(jù)庫中CLDN10 在正常腎組織與ccRCC 中的表達差異

圖7 Oncomine 數(shù)據(jù)庫中各子數(shù)據(jù)庫CLDN10 在正常腎組織與ccRCC中的表達差異

表1 Oncomine數(shù)據(jù)庫的各子數(shù)據(jù)庫中CLDN10在正常腎組織與ccRCC的表達情況

按照GEPIA 數(shù)據(jù)庫的操作流程,分析TCGA 數(shù)據(jù)庫中CLDN10 mRNA 在腎癌組織(n=523)與正常腎組織(n=100)中的表達差異,以此驗證Oncomine 數(shù)據(jù)庫中結論的正確性,結果顯示CLDN10 表達量的中位數(shù)在ccRCC 與正常腎組織相比,正常腎組織顯著高于ccRCC,且兩者差異有統(tǒng)計學意義(P<0.05),見圖8。

圖8 TCGA數(shù)據(jù)庫CLDN10在ccRCC組織與正常腎組織中的表達差異

2.2 CLDN10 mRNA在ccRCC中的表達水平與臨床特征的相關性 利用Ualcan數(shù)據(jù)庫分析CLDN10在ccRCC中的表達水平與臨床特征的相關性,結果發(fā)現(xiàn)CLDN10表達量的中位數(shù)在正常腎組織、stage1、stage2、stage3、stage4 分別為97.851、19.499、17.992、14.615、10.264,正常腎組織與不同腫瘤分期的表達差異均為P<1E-12 (圖9A);CLDN10 在正常腎組織與ccRCC 亞型(ccA 和ccB)的表達量中位數(shù)分別為99.437、23.311、9.957,正常腎組織與不同ccRCC亞型表達差異均為P<1E-12(圖9B);在TMN分期中,正常腎組織與N0、N1的CLDN10表達量的中位數(shù)分別為97.851、17.645、5.513,正常腎組織與N0、N1的表達差異均為P<1E-12(圖9C),且上述差異均有統(tǒng)計學意義(P<0.05)。CLDN10 的表達水平隨著腫瘤分期的升高與淋巴結轉移的發(fā)生呈下降趨勢,表明其與ccRCC 的發(fā)生具有相關性,而CLDN10的高表達則能抑制腫瘤的進展。

圖9 Ualcan數(shù)據(jù)庫CLDN10的表達水平與臨床特征的關系

2.3 CLDN10 在正常腎組織與ccRCC 的甲基化水平 利用Ualcan數(shù)據(jù)庫分析CLDN10在正常腎組織與不同臨床分期的ccRCC的甲基化水平差異(圖10),發(fā)現(xiàn)CLDN10在正常腎組織與stage1、stage2、stage3、stage4 中的甲基化表達差異分別為P=1.62E-12、P=3.11E-08、P=1.62E-12、P=1.62E-12,差異均有統(tǒng)計學意義(P<0.05),與ccRCC的甲基化水平相比較,正常腎組織的甲基化水平明顯較低。不同臨床分期的ccRCC甲基化水平間的比較差異無統(tǒng)計學意義(P>0.05)。

圖10 CLDN10在不同臨床分期的ccRCC的甲基化水平

2.4 CLDN10 在正常腎組織和ccRCC 中蛋白質(zhì)的表達差異 通過HPA 數(shù)據(jù)庫分析正常腎組織和ccRCC 中CLDN10 的蛋白質(zhì)表達差異,可見在正常腎組織的腎小管中呈現(xiàn)高表達,在腎小球中分布極少。而在典型的ccRCC 中,腎小管、腎小球的表達極低(圖11A)。此外,用Ualcan 數(shù)據(jù)庫檢測了CLDN10 在正常腎組織(n=84)和ccRCC (n=110)中的蛋白質(zhì)表達水平,結果顯示CLDN10 在正常腎組織中的蛋白質(zhì)表達較高,其表達量的中位數(shù)為2.65;而在ccRCC 中的表達量中位數(shù)為0,差異性比較P=7.04E-39,差異有顯著的統(tǒng)計學意義,從而在蛋白質(zhì)水平驗證了CLDN10在正常腎組織中的表達高于ccRCC(圖11B)。

圖11 CLDN10在正常腎組織和ccRCC中的蛋白質(zhì)表達水平

2.5 CLDN10的表達與ccRCC患者預后生存的關系 應用Ualcan數(shù)據(jù)庫對TCGA數(shù)據(jù)庫中CLDN10的表達水平與ccRCC患者生存率之間的關系進行單因素分析,發(fā)現(xiàn)CLDN10的表達水平對ccRCC患者的生存率有影響,CLDN10高表達組(n=133)相比,低或中表達組(n=398)的生存率明顯降低(P=0.000 14,圖12)。利用HPA數(shù)據(jù)庫對Ualcan數(shù)據(jù)庫的分析結果進行驗證。以數(shù)據(jù)庫中選定的CLDN10最佳表達截止FPKM值5.79,將患者分為高、低表達組,并對CLDN10表達水平與患者生存率之間的關系進行研究。研究發(fā)現(xiàn)高表達組和低表達組的5 年生存率分別為75%、46% (P=3.7e-10,圖13)。再次利用GEPIA數(shù)據(jù)庫對CLDN10的表達水平與患者無病生存率的關系進行了分析,得到CLDN10高表達患者258例和低表達患者258例的無病生存率曲線(圖14),并得出以下結論:在其他影響因素不變的情況下,CLDN10低表達患者組的無病生存率明顯低于高表達患者組。查閱其Kaplan-Meier生存分析圖(圖15),可以進一步證實上述數(shù)據(jù)庫生存分析的結果有統(tǒng)計學意義。由此可見,CLDN10 在ccRCC 的進展中起到一定的抑制作用。

圖12 Ualcan 數(shù)據(jù)庫CLDN10 的表達水平與ccRCC 患者生存率之間的關系

圖13 HPA 數(shù)據(jù)庫CLDN10的表達水平與ccRCC患者生存率之間的關系

圖14 GEPIA數(shù)據(jù)庫ccRCC患者的無病生存率

圖15 HPA 數(shù)據(jù)庫ccRCC患者的Kaplan-Meier 生存分析圖

2.6 CLDN10 與上下游蛋白的相互作用 利用String-DB 分析CLDN10 與上下游蛋白之間的相互作用關系,根據(jù)前述條件得出CLDN10 蛋白交互作用的網(wǎng)絡(圖16),PPI 富集P值(PPI enrichmentP-value)=1.0-16,且相互作用的節(jié)點數(shù)為21 個。在PPI 網(wǎng)絡中與CLDN10 相互作用(score>0.400)的有CLDN14、CLDN2、CLDN16、CLDN8、CLDN3、CLDN1、CLDN19等,它們主要參與了細胞增殖、分化、轉移、細胞屏障和細胞間的緊密連接等生物學過程。

圖16 CLDN10蛋白交互作用網(wǎng)絡圖

2.7 CLDN10 關聯(lián)基因的富集分析 利用Metascape對CLDN10的關聯(lián)基因進行富集分析,結果顯示主要參與了通過質(zhì)膜細胞黏附分子的鈣獨立細胞黏附、雙細胞緊密連接組裝、雙細胞緊密連接的正向調(diào)控、介導病毒融入細胞等信號通路(圖17)。

圖17 CLDN10關聯(lián)基因的富集通路

3 討論

腎細胞癌(RCC)是泌尿系統(tǒng)最常見的腫瘤之一,近幾年其發(fā)病率占據(jù)了成人惡性腫瘤的3%~5%[14],其中以ccRCC 最為常見[15]。ccRCC 患者在疾病早期的臨床癥狀較為隱匿,20%~30% 的患者在臨床上確診時已發(fā)生局部或全身性轉移,導致患者的疾病預后較差[4]。目前,臨床上針對ccRCC 的診斷方式主要還是CT、MR 及病理學檢查,根據(jù)2016 版WHO/ISUP 對ccRCC 進行臨床分級、治療指導以及預后評估,尚無適合運用于臨床診斷和預后評估的特定分子生物標志物[16]。在現(xiàn)有的條件下,ccRCC 的診治仍是泌尿外科較為棘手的問題之一。因此,探索與ccRCC發(fā)展相關的基因,發(fā)掘適用于臨床診斷、治療以及預后評估的新的分子標記物就顯得尤為重要。

Claudin蛋白是一種緊密連接蛋白,其家族成員是細胞緊密連接組成和功能的關鍵成分[17],負責密封相鄰細胞基底外側細胞膜的頂端部分,在控制細胞通透性和維持組織穩(wěn)態(tài)中起著重要作用[18]。細胞緊密連接的破壞被認為是癌癥發(fā)展過程中的一個關鍵節(jié)點,使癌細胞失去內(nèi)聚性、去分化、侵襲性生長[8]。有研究報道,CLDN3和4的表達增加有助于子宮內(nèi)膜漿液性乳頭狀癌、子宮內(nèi)膜透明細胞癌和卵巢漿液性腺癌的侵襲行為[19-20]。一項針對食管癌接受手術治療的患者進行的研究發(fā)現(xiàn),CLDN3和4表達的缺失與腫瘤遠處轉移相關[21],再次表明Claudin基因在癌變中具有高度的組織特異性作用。在腎腫瘤中,有研究表明CLDN1、3、4、7 和8 分別存在不同的表達模式,CLDN3 和4 在ccRCC的表達與總生存率呈顯著負相關;CLDN7的表達在腎嫌色細胞癌中明顯高于腎嗜酸性細胞瘤;CLDN8 在ccRCC、腎嗜酸性細胞瘤、腎乳頭狀瘤中表現(xiàn)為高表達[22]。目前,關于CLDN10 在ccRCC 中的表達水平及其生物學功能的研究甚少。已有研究證明CLDN10可通過磷酸化骨肉瘤細胞中的Janus激酶/信號轉導與轉錄激活因子(JAK-STAT)信號通路來抑制細胞轉移[23]。

本研究首先對Oncomine 數(shù)據(jù)庫中Yusenko Renal等5個子數(shù)據(jù)庫中的6項研究進行了分析,結果表明:在mRNA 層面,CLDN10 在ccRCC 中較正常腎組織低表達。再通過GEPIA 數(shù)據(jù)庫對Oncomine 數(shù)據(jù)庫結論的準確性進行驗證,結果顯示兩者的研究結論具有一致性。接著通過Ualcan數(shù)據(jù)庫分析CLDN10在ccRCC中的表達水平與臨床特征的相關性,發(fā)現(xiàn)CLDN10 在正常腎組織與不同腫瘤分期(stage1、stage2、stage3、stage4)、不同亞型(ccA和ccB)、不同淋巴結轉移(N0、N1)之間存在明顯的差異,且差異均具有統(tǒng)計學意義,隨著腫瘤的進展,CLDN10 的表達水平呈下降趨勢,說明其在腫瘤的發(fā)展中起著抑癌基因的作用。已有實驗證明CLDN10的低表達與卵巢癌[24]、肺腺癌[25]的不良預后相關,由此推測CLDN10的表達降低是影響ccRCC不良預后的因素。再利用Ualcan數(shù)據(jù)庫對CLDN10的甲基化程度進行分析,結果顯示CLDN10 的甲基化水平在ccRCC 中明顯較正常腎組織高,差異具有統(tǒng)計學意義。甲基化是修飾DNA,調(diào)控基因表達的主要表觀遺傳學形式,有研究表明異常甲基化將導致基因表達與轉錄的不穩(wěn)定,是腫瘤發(fā)生發(fā)展的重要原因之一[26]。相關研究表明DNA 高甲基化是CLDN10 在ccRCC 中表達降低的重要因素[27]。其次通過HPA、GEPIA數(shù)據(jù)庫從蛋白質(zhì)層面驗證CLDN10在ccRCC與正常腎組織的表達差異,發(fā)現(xiàn)與正常腎組織相比,CLDN10在ccRCC中的表達水平明顯降低。然后選用Ualcan、HPA、GEPIA數(shù)據(jù)庫分析CLDN10對ccRCC患者生存率的影響,結果提示CLDN10低表達患者較高表達患者的總體生存率與無病生存率均顯著降低。最后使用String-DB 數(shù)據(jù)庫挖掘分析發(fā)現(xiàn),CLDN10 與CLDN14、CLDN2、CLDN16、CLDN8、CLDN3、CLDN1、CLDN19 等蛋白之間相互作用,利用Metascape 數(shù)據(jù)庫對相互作用的蛋白進行通路富集分析表明,主要參與了通過質(zhì)膜細胞黏附分子的鈣獨立細胞黏附(GO:0016338)、雙細胞緊密連接組裝(GO:0070830)、雙細胞緊密連接的正向調(diào)控(GO:1903348)、介導病毒融入細胞(GO:0046718)等信號通路。

綜上所述,本研究通過可靠的生物信息學分析顯示,CLDN10 在ccRCC 組織中低表達,可能在腫瘤進展中起著抑癌基因的作用,并且其低表達與患者的不良預后相關,可成為ccRCC患者診斷和評估預后的潛在生物標記物,為ccRCC的后續(xù)研究提供了線索和理論依據(jù)。不足之處在于,相關分析結果均來自公開的基因芯片數(shù)據(jù)庫,對其如何影響ccRCC的進展缺乏實驗研究及臨床樣本的分析論證。

猜你喜歡
甲基化生存率數(shù)據(jù)庫
甲基苯丙胺改變成癮小鼠突觸可塑性基因的甲基化修飾
DNA甲基化與基因活性的調(diào)控
“五年生存率”不等于只能活五年
影響胃癌術后5 年生存率的因素分析
人工智能助力卵巢癌生存率預測
日本首次公布本國居民癌癥三年生存率
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫