韓 君 張澤鑫
(1. 北京康仁堂藥業(yè)有限公司,北京 101301; 2. 廣州中醫(yī)藥大學(xué)第一臨床醫(yī)學(xué)院,廣東 廣州 510405)
腎細(xì)胞癌最常見的亞型是透明細(xì)胞癌,約占腎細(xì)胞癌的70%~80%[1-3]。腎透明細(xì)胞癌(KIRC)通常對(duì)放化療和免疫治療不敏感,主要治療方法是手術(shù)治療[4]。60%的KIRC患者在診斷后1~2年死亡,30%的KIRC患者在診斷時(shí)就發(fā)生了遠(yuǎn)處轉(zhuǎn)移[5,6]。自精準(zhǔn)醫(yī)療計(jì)劃提出以來,個(gè)體化治療成為腎癌治療的研究熱點(diǎn)[7,8]。因此,尋找有效的治療靶點(diǎn)及預(yù)后的分子標(biāo)志物,對(duì)于幫助早期診斷腎透明細(xì)胞癌以及早期干預(yù)治療提供依據(jù)。二甲基甘氨酸脫氫酶(DMGDH) 是一種線粒體基質(zhì)黃素蛋白,負(fù)責(zé)二甲基甘氨酸的去甲基化,形成肌氨酸[9]。據(jù)報(bào)道,DMGDH在肝癌病人中顯著下調(diào),其通過影響Akt信號(hào)通路的活化,從而促進(jìn)肝癌細(xì)胞的轉(zhuǎn)移[10,11]。前期研究白扁豆總皂苷處理前列腺癌PC-3細(xì)胞系時(shí),DMGDH的水平顯著升高,提示DMGDH可能與腫瘤發(fā)生和發(fā)展密切相關(guān)。目前,DMGDH與KIRC患者的表達(dá)、生存時(shí)間及預(yù)后的分析鮮見報(bào)告。在此,本研究利用癌癥基因組圖譜(TCGA)數(shù)據(jù)庫中KIRC患者的信息,分析DMGDH與臨床病理特征、預(yù)后的相關(guān)性,并選擇幾條可能的信號(hào)通路進(jìn)行進(jìn)一步研究,為今后的臨床治療提供幫助。
從UCSC(https://xenabrowser.net/)數(shù)據(jù)庫中下載了經(jīng)統(tǒng)一標(biāo)準(zhǔn)化的泛癌數(shù)據(jù)集:TCGA泛癌(Pan-Cancer) (PANCAN,N=10 535,G=60 499),進(jìn)一步從中提取了ENSG00000132837(DMGDH)基因在各個(gè)樣本中的表達(dá)數(shù)據(jù),進(jìn)一步篩選了樣本來源為正常實(shí)體組織(Solid Tissue Normal)、血液相關(guān)癌(Primary Blood Derived Cancer-Peripheral Blood)、原發(fā)性腫瘤(Primary Tumor)的樣本。更進(jìn)一步地對(duì)每一個(gè)表達(dá)值進(jìn)行了log2(x+0.001)變換,最后剔除了單個(gè)癌種中樣本個(gè)數(shù)小于3個(gè)的癌種,最終獲得了26個(gè)癌種的表達(dá)數(shù)據(jù)。
從UCSC(https://xenabrowser.net/)數(shù)據(jù)庫中下載了經(jīng)統(tǒng)一標(biāo)準(zhǔn)化的泛癌數(shù)據(jù)集:TCGA Pan-Cancer (PANCAN,N=10 535,G=60 499),進(jìn)一步從中提取了ENSG00000132837(DMGDH)基因在各個(gè)樣本中的表達(dá)數(shù)據(jù),進(jìn)一步篩選了樣本來源為:Primary Blood Derived Cancer-Peripheral BloodTCGA-急性髓性白血病(LAML)、Primary Tumor和TCGA-皮膚黑色素瘤(SKCM)的轉(zhuǎn)移樣本,此外,還從先前發(fā)表在Cell上的TCGA預(yù)后研究中[12]獲得了高質(zhì)量的TCGA的預(yù)后數(shù)據(jù)集及隨訪時(shí)間短于30天的樣本,更進(jìn)一步的對(duì)每一個(gè)表達(dá)值進(jìn)行了log2(x+0.001)變換,最后還剔除了單個(gè)癌種中樣本個(gè)數(shù)小于10個(gè)的癌種,最終獲得了39個(gè)癌種(TCGA-GBM神經(jīng)膠質(zhì)瘤、TCGA-GBMLGG膠質(zhì)瘤、TCGA-LGG腦低級(jí)別膠質(zhì)瘤、TCGA-CESC宮頸鱗癌和腺癌、TCGA-LUAD肺腺癌、TCGA-LAML急性髓細(xì)胞樣白血病、TCGA-BRCA乳腺浸潤癌、TCGA-ESCA食管癌、TCGA-STES胃和食管癌、TCGA-SARC肉瘤、TCGA-KIRP腎乳頭狀細(xì)胞癌、TCGA-KIPAN混合腎癌、TCGA-PRAD前列腺癌、TCGA-STAD胃癌、TCGA-HNSC頭頸鱗狀細(xì)胞癌、TCGA-KIRC腎透明細(xì)胞癌、TCGA-COAD結(jié)腸癌、TCGA-COADREAD結(jié)直腸癌、TCGA-LUSC肺鱗癌、TCGA-THYM胸腺癌、TCGA-LIHC肝細(xì)胞肝癌、TCGA-THCA甲狀腺癌、TCGA-MESO間皮瘤、TCGA-READ直腸腺癌、TCGA-SKCM-M、TCGA-SKCM皮膚黑色素瘤、TCGA-OV卵巢漿液性囊腺癌、TCGA-TGCT睪丸癌、TCGA-PAAD胰腺癌、TCGA-UCEC子宮內(nèi)膜癌、TCGA-PCPG嗜鉻細(xì)胞瘤和副神經(jīng)節(jié)瘤、TCGA-SKCM-P、TCGA-UVM葡萄膜黑色素瘤、TCGA-UCS子宮肉瘤、TCGA-BLCA膀胱尿路上皮癌、TCGA-ACC腎上腺皮質(zhì)癌、TCGA-KICH腎嫌色細(xì)胞癌、TCGA-CHOL膽管癌、TCGA-DLBC彌漫性大B細(xì)胞淋巴瘤)的表達(dá)數(shù)據(jù)及對(duì)應(yīng)樣本的總生存期數(shù)據(jù)。
首先根據(jù)DMGDH表達(dá)量的百分位數(shù)(50%)將患者分成兩組,然后進(jìn)一步使用R軟件包生存分析的survfit函數(shù)分析兩組的預(yù)后差異,利用時(shí)序檢驗(yàn)(log-rank test)方法評(píng)估不同組樣本之間的預(yù)后差異顯著性。此外,還使用了受試者工作特征曲線(ROC)計(jì)算曲線下面積(AUC)用于評(píng)估DMGDH在1、3、5年的模型穩(wěn)定性。
根據(jù)DMGDH表達(dá)量、年齡、性別和TNM分期,首先使用單因素cox分析篩選出預(yù)后相關(guān)因素,然后進(jìn)一步使用多因素cox分析篩選出獨(dú)立的預(yù)后因素。在單因素cox分析和多因素cox分析中,具有顯著性水平的因素將被納入到列線圖的構(gòu)建中,用以評(píng)估患者的預(yù)后。
根據(jù)DMGDH的表達(dá)量,截取了中位數(shù)進(jìn)行差異分析,設(shè)置標(biāo)準(zhǔn)為:Log∣FC∣>1,P<0.05。然后對(duì)差異表達(dá)的基因進(jìn)行了基因功能注釋(GO)和基因組京都百科全書(KEGG)功能富集分析,以了解DMGDH在KIRC的發(fā)生發(fā)展中發(fā)揮的作用。
從uniprot(https://www.uniprot.org/)數(shù)據(jù)庫查詢蛋白序列及晶體結(jié)構(gòu)信息,然后從RCSB PDB (https://www.rcsb.org/)數(shù)據(jù)庫獲取蛋白晶體結(jié)構(gòu):DMGDH:3E00,PPAR γ:5L46,PPAR α:1K7L,CYP1B1:3PM0。所有對(duì)接計(jì)算均采用Rosetta蛋白-蛋白對(duì)接方法。首先使用ROSETTA蛋白準(zhǔn)備模塊docking_prepack_protocol.static.linuxgccrelease預(yù)處理四個(gè)蛋白結(jié)構(gòu),并作為蛋白對(duì)接初始結(jié)構(gòu)。對(duì)接過程中蛋白質(zhì)主鏈保持固定,采用global算法(docking_protocol.static.linuxgccrelease)進(jìn)行蛋白-蛋白對(duì)接。每個(gè)起點(diǎn)總共生成50個(gè)結(jié)構(gòu)。視覺檢查五個(gè)界面得分最低的結(jié)果,并使用pymol分析對(duì)接結(jié)果。
使用R軟件(version 3.6.4)計(jì)算了每個(gè)腫瘤中正常樣本和腫瘤樣本的表達(dá)差異(圖1A),使用非配對(duì)的進(jìn)行非參數(shù)檢驗(yàn)和符號(hào)秩檢驗(yàn)進(jìn)行差異顯著性分析,在1種腫瘤中觀察到了顯著上調(diào),在19種腫瘤中觀察到了顯著下調(diào)。
使用R軟件包survival(version 3.2-7)的coxph函數(shù)建立Cox風(fēng)險(xiǎn)比例回歸模型(Cox proportional hazards regression model)[13]以分析基因表達(dá)與每個(gè)腫瘤中的預(yù)后關(guān)系,使用Log-rank test進(jìn)行統(tǒng)計(jì)檢驗(yàn)獲得預(yù)后顯著性,最終觀察到在2個(gè)腫瘤類型TCGA-STAD[N=372,p=0.04,HR=1.14(1.01,1.29)]、TCGA-COADREAD[N=368,p=0.04,HR=1.19(1.01,1.40)]中高表達(dá)預(yù)后差,在4個(gè)腫瘤類型TCGA-KIPAN[N=855,p=0.02,HR=0.92(0.86,0.99)]、TCGA-KIRC[N=515,p=2.5e-11,HR=0.78(0.72,0.84)]、TCGA-LIHC[N=341,p=1.6e-3,HR=0.87(0.79,0.95)]、TCGA-ACC[N=77,p=0.04,HR=0.81(0.66,0.99)]中低表達(dá)預(yù)后差(圖1B)。
根據(jù)DMGDH基因表達(dá)的中位數(shù),劃分成為了高低兩組。根據(jù)患者的風(fēng)險(xiǎn)值和分組,繪制風(fēng)險(xiǎn)值熱圖(圖1C),Kaplan-Meier生存分析顯示,高低風(fēng)險(xiǎn)組之間具有顯著性差異,其P值為3.92e-07,HR值為0.443(圖1D),這說明了DMGDH在KIRC中是預(yù)后的保護(hù)因素。風(fēng)險(xiǎn)曲線顯示,隨著風(fēng)險(xiǎn)系數(shù)的增高,存活的病人越多,這與Kaplan-Meier生存分析抑制。此外,ROC曲線計(jì)算AUC面積評(píng)估了模型的可靠性,分別為1年0.688,3年0.675,5年0.659,這說明了使用DMGDH用于評(píng)估患者的總體生存情況具有可靠性(圖1E)。
(A) DMGDH基因在不同癌癥和癌旁組織中表達(dá)水平;(B) DMGDH在泛癌中的生存分析;(C) 風(fēng)險(xiǎn)值熱圖;(D) Kaplan-Meier生存曲線圖用于評(píng)估患者的預(yù)后;(E) 時(shí)間依賴的ROC曲線評(píng)估風(fēng)險(xiǎn)特征的準(zhǔn)確性圖1 DMGDH基因在泛癌中的表達(dá)與生存分析及預(yù)后模型構(gòu)建(A) Expression levels of DMGDH gene in different cancers and paracancerous tissues; (B) Survival analysis of DMGDH in pan-cancer; (C) Value-at-risk heat map; (D) Kaplan-Meier survival curve chart for assessing patient’s prognosis; (E) Accuracy of time-dependent ROC curves for assessing risk characteristicsFig. 1 Expression of DMGDH gene in pan-cancer and survival analysis and prognostic model construction
根據(jù)DMGDH表達(dá)量、年齡、性別和TNM分期,首先使用了單因素cox分析篩選出預(yù)后相關(guān)的因素。單因素cox分析結(jié)果顯示,DMGDH、年齡和TNM分期是預(yù)后相關(guān)的因素(圖2A)。多因素結(jié)果顯示DMGDH、年齡和TNM分期是獨(dú)立的預(yù)后因素(圖2B),因此構(gòu)建列線圖,其生存模型C指數(shù)(C-Index)為0.776(0.742~0.81) (圖2C),其1、3、5年的校正曲線位于對(duì)角線復(fù)線,說明了本模型具有可靠性(圖2D)。
根據(jù)DMGDH的表達(dá)量,截取了中位數(shù)進(jìn)行差異分析,設(shè)置標(biāo)準(zhǔn)為:Log∣FC∣>1,P<0.05。然后對(duì)差異表達(dá)的基因進(jìn)行了GO和KEGG功能富集分析,以了解DMGDH在KIRC的發(fā)生發(fā)展中發(fā)揮的作用。GO分析結(jié)果顯示,DMGDH可能通過羧酸轉(zhuǎn)運(yùn)發(fā)揮作用(圖3A);KEGG分析結(jié)果顯示,DMGDH可能通過藥物代謝-細(xì)胞色素P450發(fā)揮作用(圖3B)。
三對(duì)蛋白對(duì)接分?jǐn)?shù):PPAR γ/DMGDH為-1 209.853 kcal/mol;PPAR α/DMGDH為-1 086.638 kcal/mol;CYP1B1/DMGDH為-798.415 kcal/mol。PPAR γ/DMGDH相互作用分析氫鍵Gln273和Lys180, His466和Asn179,Gln294和Glu171,Glu298和Lys85(圖3C),PPAR α/DMGDH相互作用分析氫鍵lys399和Asp652,Asn303和Asn566,Asn577,Glu462和Lys764,Gln461和Ala765(圖3D),CYP1B1/DMGDH相互作用分析氫鍵 Asn312和Gln68;Asp310和Gln68,Arg76(圖3E)。
(A) 單因素cox分析篩選出了預(yù)后相關(guān)因素;(B) 多因素cox分析篩選出了預(yù)后相關(guān)因素;(C) 生存列線圖預(yù)測模型;(D) 預(yù)測肝細(xì)胞癌患者第1、3、5年生存期的校正曲線圖2 構(gòu)建列線圖用以評(píng)估患者的總體生存情況(A) Screening out prognostic correlates with one-way cox analysis; (B) screening out prognostic correlates multi-factor cox analysis; (C) Survival nomogram prediction model; (D) Calibration curves for predicting survivals of patients with hepatocellular carcinoma at the 1st, 3rd, 5th yearFig. 2 Construction of nomogram to assess overall survival conditions of patients
本研究對(duì)TCGA的39種腫瘤的相關(guān)臨床信息數(shù)據(jù)進(jìn)行了系統(tǒng)分析,發(fā)現(xiàn)DMGDH在TCGA-STAD、TCGA-COADREAD中高表達(dá)預(yù)后差,在4個(gè)腫瘤類型TCGA-KIPAN、TCGA-KIRC、TCGA-LIHC、TCGA-ACC中低表達(dá)預(yù)后差。DMGDH單基因預(yù)后模型構(gòu)建,說明了DMGDH在KIRC中是預(yù)后的保護(hù)因素。構(gòu)建的生存列線圖多因素結(jié)果顯示DMGDH、年齡和TNM分期是獨(dú)立的預(yù)后因素,提示與其它腫瘤類型相比,DMGDH可能在KIRC的發(fā)生、發(fā)展中發(fā)揮了重要的作用。
DMGDH如何參與KIRC的發(fā)生、發(fā)展目前仍知之甚少。為了進(jìn)一步探究DMGDH在KIRC中的生物學(xué)功能,根據(jù)DMGDH的表達(dá)量,對(duì)差異表達(dá)的基因進(jìn)行了GO和KEGG功能富集分析。結(jié)果顯示,主要富集過氧化物酶體增殖物激活受體(PPAR)信號(hào)通路和細(xì)胞色素P450代謝等有關(guān),這結(jié)果與文獻(xiàn)一致,Xu Y等[14]詳細(xì)分析KIRC中整個(gè) PPAR通路并成功建立患者預(yù)后風(fēng)險(xiǎn)模型的研究,過氧化物酶體增殖物激活受體(PPARs)屬于核激素受體超家族成員,包括過氧化物酶體增殖物激活受體γ(PPARγ)、過氧化物酶體增殖物激活受體α(PPARα)和過氧化物酶體增殖物激活受體β/δ(PPARβ/δ)3個(gè)亞型[15],PPARα等核受體是KIRC獨(dú)立的預(yù)后因素[16]可作為KIRC的臨床診斷和預(yù)后生物標(biāo)志物[17]。具有晶型結(jié)構(gòu)細(xì)胞色素P450(CYP450)亞型的受體蛋白為細(xì)胞色素P450家族1亞家族A成員2(CYP1A2)、細(xì)胞色素P450家族2亞家族C成員19(CYP2C19)、細(xì)胞色素P450家族1亞家族A成員1(CYP1A1)、細(xì)胞色素P450家族1亞家族B成員1(CYP1B1)、細(xì)胞色素P450家族2亞家族E成員2(CYP2E2)[18],CYP1B1是一種細(xì)胞色素P450酶,在多種惡性腫瘤中過度表達(dá)[19],CYP1B1的多態(tài)性與腎癌發(fā)生相關(guān)[20]。本研究利用DMGDH分別與PPARγ、 PPARα和CYP1B1三種蛋白進(jìn)行蛋白-蛋白對(duì)接,結(jié)果兩者之間結(jié)合較好分別為-1 209.853 kcal/mol、-1 086.638 kcal/mol和-798.415 kcal/mol。
綜上所述,本研究明確了DMGDH在多種腫瘤中的表達(dá)情況,其在KIRC中是預(yù)后的保護(hù)因素,DMGDH可能通過PPAR信號(hào)通路和P450代謝來影響肝癌的發(fā)生、發(fā)展。
(A) DMGDH差異表達(dá)GO富集分析;(B) DMGDH差異表達(dá)KEGG富集分析;(C) PPAR gamma/DMGDH對(duì)接;(D) PPAR alpha/DMGDH對(duì)接;(E) CYP1B1/DMGDH對(duì)接圖3 DMGDH差異表達(dá)的GO和KEGG富集分析及蛋白-蛋白對(duì)接(A) GO enrichment analysis of DMGDH differential expression; (B) KEGG enrichment analysis of DMGDH differential expression; (C) PPAR gamma/DMGDH docking; (D) PPAR alpha/DMGDH docking; (E) CYP1B1/DMGDH dockingFig. 3 GO and KEGG enrichment analysis and protein-protein docking of DMGDH differential expression