王慶哲,張恩崇,鞠培新,宋永勝
近年來(lái),前列腺癌的發(fā)病率在全世界范圍內(nèi)逐年增長(zhǎng)[1]。目前,前列腺癌的藥物治療以現(xiàn)代西藥治療為主,治療效果尚不理想,因此開(kāi)發(fā)前列腺癌的有效治療藥物是一項(xiàng)重要課題[2]。在之前的研究中,四君子湯已被證實(shí)具有抗癌的效果[3]。
本研究通過(guò)BATMAN-TCM(a Bioinformatics Analysis Tool for Molecular mechANism of Traditional Chinese Medicine)數(shù)據(jù)庫(kù)中預(yù)測(cè)四君子湯靶向蛋白基因,然后對(duì)靶向蛋白基因進(jìn)行功能富集分析,從而闡述四君子湯參與的生物學(xué)過(guò)程和機(jī)制。采用TCGA(The Cancer Genome Atlas Program)數(shù)據(jù)庫(kù)中前列腺癌患者的RNA-seq數(shù)據(jù),篩選前列腺癌和正常前列腺組織間差異表達(dá)的基因(Differentially expressed genes,DEGs)。然后通過(guò)STRING數(shù)據(jù)庫(kù)構(gòu)建PPI網(wǎng)絡(luò)(Protein protein interaction network,PPI network),確定候選關(guān)鍵基因。最后在Gene Expression Profiling Interactive Analysis(GEPIA)數(shù)據(jù)庫(kù)中再次驗(yàn)證候選關(guān)鍵基因的表達(dá)量在前列腺癌組織和正常前列腺組織之間是否有統(tǒng)計(jì)學(xué)差異。現(xiàn)報(bào)道如下。
1.1 預(yù)測(cè)四君子湯作用靶向蛋白基因 BATMAN-TCM數(shù)據(jù)庫(kù)是一個(gè)探究傳統(tǒng)中藥微觀分子機(jī)制的線上交互式網(wǎng)站,可以預(yù)測(cè)中藥方劑、單藥以及化合物的靶向蛋白位點(diǎn),并對(duì)這些位點(diǎn)基因進(jìn)行一系列功能富集分析[4]。本研究根據(jù)BATMAN-TCM數(shù)據(jù)庫(kù)的說(shuō)明文件,在該網(wǎng)頁(yè)中輸入四君子湯方劑,從而獲取四君子湯含有的藥材名稱及靶蛋白基因列表。
1.2 對(duì)靶蛋白基因進(jìn)行功能富集分析 GO(Gene Ontology)分析和KEGG通路富集分析通過(guò)大量的基因集合確定和該基因集相關(guān)的生物學(xué)過(guò)程[5]。GO分析包括細(xì)胞組件(Cellular component,CC)、生物過(guò)程(Biological process,BP)、分子功能(Molecular function,MF)。KEGG通路分析用來(lái)確定相關(guān)生物學(xué)事件的信號(hào)通路。本研究中,我們?cè)赗 3.5.2中使用clusterProfiler 軟件包實(shí)現(xiàn)上述分析[6]。本研究選擇GO分析以及KEGG分析結(jié)果中排名前十的項(xiàng)目,解釋四君子湯的生物學(xué)行為。
1.3 篩選在前列腺癌組織與正常前列腺組織之間差異表達(dá)的靶蛋白基因 本研究對(duì)BATMAN-TCM數(shù)據(jù)庫(kù)中獲取的靶蛋白基因進(jìn)行了篩選:篩選出在前列腺癌組織與正常前列腺組織之間差異表達(dá)的靶蛋白基因。TCGA數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/)是一個(gè)癌癥基因組學(xué)項(xiàng)目,從基因分子水平展示了33種癌癥的2萬(wàn)多例原發(fā)性腫瘤及其配對(duì)癌旁組織樣本[7-8]。本研究在TCGA數(shù)據(jù)庫(kù)中下載了前列腺癌患者的臨床信息以及RNA-seq數(shù)據(jù)。然后在R3.5.2中使用DESeq2 R軟件包對(duì)RNA-seq數(shù)據(jù)進(jìn)行處理并計(jì)算得出前列腺癌和正常前列腺組織間的DEGs[9]。然后選取靶蛋白基因和DEGs的交集,作為后續(xù)研究的對(duì)象。
1.4 構(gòu)建蛋白互作網(wǎng)絡(luò)篩選候選關(guān)鍵基因 STRING(https://string-db.org/cgi/about.pl)數(shù)據(jù)庫(kù)是一個(gè)預(yù)測(cè)蛋白質(zhì)之間相互作用關(guān)系的在線交互式網(wǎng)站,預(yù)測(cè)出來(lái)的相互作用關(guān)系包括直接作用關(guān)系(生物作用)及間接作用關(guān)系(功能相關(guān)性)[10]。PPI網(wǎng)絡(luò)由一些蛋白質(zhì)構(gòu)成,每個(gè)節(jié)點(diǎn)代表一個(gè)蛋白質(zhì),連接蛋白質(zhì)的連線代表蛋白質(zhì)之間的相互作用關(guān)系。經(jīng)過(guò)“2.3”項(xiàng)的篩選,將篩選的基因輸入到STRING 數(shù)據(jù)庫(kù)中,從而構(gòu)建PPI網(wǎng)絡(luò),通過(guò)每個(gè)蛋白質(zhì)在網(wǎng)絡(luò)中的點(diǎn)度中心性(Degree)篩選候選核心基因。在構(gòu)建PPI網(wǎng)絡(luò)時(shí),設(shè)定作用評(píng)分閾值為0.6。網(wǎng)絡(luò)中每個(gè)蛋白的Degree通過(guò)Cytoscape 3.7.1中的CentiScaPe 2.2 插件計(jì)算得到[11]。Cytoscape是用于可視化分子相互作用網(wǎng)絡(luò)和生物通路的開(kāi)源軟件平臺(tái)。本研究選擇Degree排前3位的蛋白質(zhì)編碼基因作為候選關(guān)鍵基因。
1.5 在GEPIA數(shù)據(jù)庫(kù)中驗(yàn)證候選關(guān)鍵基因的表達(dá)模式 GEPIA(http://gepia.cancer-pku.cn/)數(shù)據(jù)庫(kù)收集了TCGA項(xiàng)目和GTEx(Genotype-Tissue Expression)項(xiàng)目的基因組數(shù)據(jù)。GTEx項(xiàng)目從175位死者身上得到了1 641個(gè)尸檢樣本,這些樣本來(lái)自54個(gè)身體部位,對(duì)幾乎所有的轉(zhuǎn)錄基因的基因表達(dá)模式進(jìn)行了觀察,從而確定基因組中影響基因表達(dá)的特定區(qū)域[12]。本研究將候選關(guān)鍵基因輸入到GEPIA數(shù)據(jù)庫(kù)中,篩選出那些在前列腺癌組織和正常組織之間有統(tǒng)計(jì)學(xué)差異的基因作為關(guān)鍵基因。
1.6 探究核心基因的生物學(xué)意義 經(jīng)過(guò)上述分析后,本研究獲得了一個(gè)關(guān)鍵基因,為了證明該基因是四君子湯對(duì)前列腺癌的有效治療靶點(diǎn),通過(guò)生存分析,時(shí)間依賴性接受者操作特征曲線(Time-dependent receiver operating characteristic curve,tdROC)探索了該關(guān)鍵基因在前列腺癌患者中的生物學(xué)意義。在生存分析中,設(shè)定無(wú)病生存時(shí)間(Disease-free survival,DFS)代表患者預(yù)后,使用COX回歸分析以及l(fā)og-rank檢驗(yàn)進(jìn)行生存分析。選取該關(guān)鍵基因表達(dá)量的中位數(shù)為分割點(diǎn),從而劃分患者風(fēng)險(xiǎn)為高?;蛘叩臀!dROC曲線選擇3年、5年、7年為時(shí)間節(jié)點(diǎn),通過(guò)曲線下面積(Area Under Curve,AUC)評(píng)估關(guān)鍵基因?qū)颊哳A(yù)后的預(yù)測(cè)能力。生存分析和tdROC曲線分析均在R3.5.2中進(jìn)行,其中生存分析計(jì)算通過(guò)survival軟件包進(jìn)行,繪圖通過(guò)survminer軟件包進(jìn)行。TdROC的計(jì)算及繪圖均通過(guò)timeROC軟件包實(shí)現(xiàn)。
1.7 數(shù)據(jù)統(tǒng)計(jì)分析 本研究使用多種統(tǒng)計(jì)學(xué)分析方法,并在R3.5.2 中實(shí)現(xiàn),在功能富集分析過(guò)程中,設(shè)定校正后P<0.05時(shí)具有統(tǒng)計(jì)學(xué)意義。在篩選DEGs過(guò)程中,設(shè)定校正后P<0.05,|LFC|>2為篩選標(biāo)準(zhǔn)。生存分析和tdROC曲線分析過(guò)程中,選擇P<0.05具有統(tǒng)計(jì)學(xué)意義。
2.1 BATMAN-TCM數(shù)據(jù)庫(kù)對(duì)四君子湯的分析結(jié)果 四君子湯由陳皮、白茯苓、甘草、白芍、人參、澤瀉、車(chē)前子、滑石、白術(shù)9種藥材組成,包括618種化合物,根據(jù)化合物的結(jié)構(gòu),預(yù)測(cè)出1 622個(gè)靶蛋白。
2.2 靶蛋白基因功能富集分析 對(duì)1 622個(gè)靶蛋白基因進(jìn)行了功能富集分析,見(jiàn)圖1。結(jié)果顯示,在生物過(guò)程中,四君子湯與膜結(jié)構(gòu)的調(diào)節(jié)、循環(huán)系統(tǒng)的調(diào)節(jié)、細(xì)胞對(duì)藥物的反應(yīng)、對(duì)營(yíng)養(yǎng)水平的反應(yīng)、神經(jīng)遞質(zhì)水平的調(diào)節(jié)、鈣離子轉(zhuǎn)運(yùn)、肌肉系統(tǒng)發(fā)育等相關(guān)。在細(xì)胞組件中,四君子湯主要作用部位在跨膜轉(zhuǎn)運(yùn)復(fù)合體、離子通道、神經(jīng)突觸膜表面、神經(jīng)細(xì)胞、突觸后膜、受體以及突觸膜固有成分上。在分子功能方面,四君子湯主要參與離子通道的門(mén)控活動(dòng)、跨膜被動(dòng)轉(zhuǎn)運(yùn)體活動(dòng)、輔酶因子的結(jié)合以及配體和離子通道結(jié)合等方面。在KEGG通路分析中,四君子湯主要參與神經(jīng)激活的配體受體相互作用、鈣離子信號(hào)通路、cAMP信號(hào)通路、嗎啡成癮、cGMP-PKG信號(hào)通路、尼古丁成癮、類(lèi)膽堿突觸、催產(chǎn)素信號(hào)通路、嘌呤代謝等信號(hào)通路。
圖1 功能富集分析結(jié)果
2.3 篩選在前列腺癌組織與正常前列腺組織之間差異表達(dá)的靶蛋白基因 本研究在TCGA數(shù)據(jù)庫(kù)中獲得了540個(gè)前列腺癌樣本,其中正常組織樣本51個(gè),前列腺癌組織樣本489個(gè),在R3.5.2中通過(guò)DESeq2軟件包對(duì)上述樣本進(jìn)行基因差異表達(dá)分析。根據(jù)校正后P<0.05,|LFC|>2的篩選標(biāo)準(zhǔn),得到了652個(gè)DEGs(圖2A),然后對(duì)這652個(gè)DEGs和1 622個(gè)靶蛋白基因取交集,最終獲得69個(gè)基因(圖2B)。根據(jù)這540個(gè)樣本的基因表達(dá)量,對(duì)這69個(gè)基因的表達(dá)情況通過(guò)熱圖展示(圖2C),根據(jù)熱圖顯示,69個(gè)基因在腫瘤樣本和正常組織之間的表達(dá)情況分界清晰,表明數(shù)據(jù)質(zhì)量良好。然后將這69個(gè)基因用于后續(xù)構(gòu)建PPI網(wǎng)絡(luò)。
2.4 構(gòu)建蛋白互作網(wǎng)絡(luò)篩選候選關(guān)鍵基因 將上一步驟中獲得的69個(gè)基因輸入到STRING數(shù)據(jù)庫(kù)中構(gòu)建PPI網(wǎng)絡(luò),在分析之前,設(shè)定相互作用評(píng)分閾值為0.6,即只有一個(gè)蛋白質(zhì)和其他蛋白質(zhì)之間的相互作用評(píng)分大于0.6時(shí)才會(huì)在網(wǎng)絡(luò)中出現(xiàn),對(duì)于相互作用評(píng)分小于0.6的蛋白質(zhì)不做進(jìn)一步分析。然后將數(shù)據(jù)從STRING數(shù)據(jù)庫(kù)中下載,導(dǎo)入到Cytoscape 3.7.1中,對(duì)PPI網(wǎng)絡(luò)進(jìn)行可視化,結(jié)果見(jiàn)圖3。然后再使用Cytoscape 3.7.1中的CentiScaPe 2.2 插件計(jì)算PPI網(wǎng)絡(luò)中每一個(gè)蛋白質(zhì)的Degree,選擇排前3位的蛋白質(zhì)編碼基因作為候選關(guān)鍵基因:UGT1A1(Degree為8)、ALB(Degree為7)、PTGS2(Degree為6)、CYP19A1(Degree為6)和ADCY8(Degree為6)。
2.5 在GEPIA數(shù)據(jù)庫(kù)中驗(yàn)證候選關(guān)鍵基因的表達(dá)模式 為了驗(yàn)證候選關(guān)鍵基因的表達(dá)量在前列腺癌組織和正常前列腺組織之間具有差異,使用GEPIA數(shù)據(jù)庫(kù)查看了5個(gè)候選關(guān)鍵基因的表達(dá)量。結(jié)果顯示,只有PTGS2在前列腺癌組織和正常前列腺組織之間的表達(dá)量具有差異,并在圖4中展示了結(jié)果。PTGS2的表達(dá)量在前列腺癌組織中顯著高于正常前列腺組織,可以推測(cè)PTGS2對(duì)前列腺癌的發(fā)生發(fā)展過(guò)程具有促進(jìn)作用,PTGS2是一個(gè)危險(xiǎn)因素。推測(cè)四君子湯對(duì)于前列腺癌的治療作用可能通過(guò)抑制PTGS2的表達(dá)而實(shí)現(xiàn)。
圖2 篩選在腫瘤和正常組織之間差異表達(dá)的四君子湯靶蛋白基因
注:A:TCGA數(shù)據(jù)庫(kù)前列腺癌與正常組織間差異表達(dá)基因結(jié)果,圖中每個(gè)點(diǎn)代表一個(gè)基因,紅色代表腫瘤中顯著高表達(dá)基因,綠色代表腫瘤中顯著低表達(dá)基因,灰色代表腫瘤與正常樣本組織之間表達(dá)無(wú)差異的基因。B:652個(gè)差異表達(dá)基因和1 622個(gè)四君子湯靶蛋白基因交集后共69個(gè)基因。C:對(duì)B中產(chǎn)生的69個(gè)基因在TCGA樣本中的表達(dá)分布進(jìn)行展示
圖3 PPI網(wǎng)絡(luò)
2.6 探究核心基因的生物學(xué)意義 從TCGA數(shù)據(jù)庫(kù)中獲取了前列腺癌患者的生存數(shù)據(jù),選擇前列腺癌根治術(shù)術(shù)后,并且未接受過(guò)任何其他治療的患者。對(duì)患者進(jìn)行生存分析和tdROC曲線分析,結(jié)果見(jiàn)圖5。結(jié)果顯示,PTGS2高表達(dá)的患者預(yù)后顯著低于低表達(dá)組(Log-rankP=0.001,COX回歸P<0.001,HR=0.6,95%CI:0.46~0.78),提示PTGS2對(duì)于前列腺癌患者是一種危險(xiǎn)因素。TdROC曲線顯示,3年時(shí)的AUC=0.700,5年時(shí)的AUC=0.671,7年時(shí)的AUC=0.792,表明PTGS2對(duì)患者預(yù)后具有良好的提示作用。上述兩項(xiàng)結(jié)果,證明PTGS2是前列腺癌患者的危險(xiǎn)因素,并且對(duì)于該疾病具有重要的生物學(xué)意義,也在生物機(jī)制上進(jìn)一步解釋了四君子湯對(duì)前列腺癌治療的有效性。
圖4 候選關(guān)鍵基因在GEPIA數(shù)據(jù)庫(kù)中表達(dá)量情況
圖5 PTGS2基因在前列腺癌中的生物意義
已有相關(guān)研究發(fā)現(xiàn),四君子湯在胃癌、直腸癌等腫瘤中具有一定的治療作用[13-14],而中藥在腫瘤的治療中也越來(lái)越被公眾所重視,前列腺癌的治療手段包括:保守治療、前列腺癌根治術(shù)、放射治療、內(nèi)分泌治療、化療、免疫治療以及前列腺癌晚期患者的姑息療法。前列腺癌目前的藥物治療手段是以現(xiàn)代西藥治療為主,但是對(duì)于以腫瘤為主的包含多種病因的復(fù)雜性疾病,這些藥物尚未達(dá)到理想治療效果,基于這樣的研究背景我們開(kāi)展了本項(xiàng)研究。
在生物過(guò)程中,四君子湯與膜結(jié)構(gòu)的調(diào)節(jié)、循環(huán)系統(tǒng)的調(diào)節(jié)、細(xì)胞對(duì)藥物的反應(yīng)、對(duì)營(yíng)養(yǎng)水平的反應(yīng)、神經(jīng)遞質(zhì)水平的調(diào)節(jié)、鈣離子轉(zhuǎn)運(yùn)、肌肉系統(tǒng)發(fā)育等相關(guān)。在細(xì)胞組件中,四君子湯主要作用部位在跨膜轉(zhuǎn)運(yùn)復(fù)合體、離子通道、神經(jīng)突觸膜表面、神經(jīng)細(xì)胞、突觸后膜、受體以及突觸膜固有成分上。在分子功能方面,四君子湯主要參與離子通道的門(mén)控活動(dòng)、跨膜被動(dòng)轉(zhuǎn)運(yùn)體活動(dòng)、輔酶因子的結(jié)合以及配體和離子通道結(jié)合等方面。在KEGG通路分析中,四君子湯主要參與神經(jīng)激活的配體受體相互作用、鈣離子信號(hào)通路、cAMP信號(hào)通路、嗎啡成癮、cGMP-PKG信號(hào)通路、尼古丁成癮、類(lèi)膽堿突觸、催產(chǎn)素信號(hào)通路、嘌呤代謝等信號(hào)通路。
通過(guò)本文的生物信息學(xué)分析,確定PTGS2為四君子湯在前列腺癌治療中的關(guān)鍵基因。該基因的表達(dá)量在前列腺癌組織中顯著高于正常前列腺組織,推測(cè)PTGS2可能在前列腺癌中是一種危險(xiǎn)因素。隨后的生存分析和tdROC分析表明,PTGS2對(duì)前列腺癌的預(yù)后及診斷具有顯著的作用,說(shuō)明該基因在前列腺癌的生物學(xué)過(guò)程中具有重要地位。PTGS2又稱作COX2基因,該基因參與前列腺素合成的關(guān)鍵步驟[將花生四烯酸轉(zhuǎn)化為前列腺素H2(PGH2)][15]。PTGS2的上調(diào)還與細(xì)胞黏附增加、表型改變、抗凋亡和腫瘤血管生成有關(guān)[16]。在癌細(xì)胞中,PTGS2是產(chǎn)生前列腺素E2(PGE2)的關(guān)鍵步驟,在調(diào)節(jié)細(xì)胞活力、增殖和抵抗細(xì)胞凋亡方面發(fā)揮重要作用[17]。有報(bào)道,前列腺癌中PTGS2基因在促癌激酶(PKCε)的作用下高表達(dá),使用PTGS2抑制劑后,小鼠模型中腺癌的發(fā)生以及血管生成減少[18]。還有研究表明,PTGS2促進(jìn)前列腺癌的進(jìn)展,并且可作為塞來(lái)昔布和染料木黃酮的作用靶點(diǎn),可能在前列腺癌的化療中發(fā)揮作用[19]。
本研究認(rèn)為,四君子湯可通過(guò)靶向PTGS2基因抑制其表達(dá),從而抑制前列腺癌的發(fā)生發(fā)展。本研究通過(guò)生物信息學(xué)方法預(yù)測(cè)出PTGS2為四君子湯的靶蛋白基因,然后又證明了PTGS2基因在前列腺癌組織中高表達(dá),降低該基因的表達(dá)量可顯著改善該患者的生存預(yù)后。最后通過(guò)查閱文獻(xiàn),發(fā)現(xiàn)PTGS2基因可以促進(jìn)前列腺癌的發(fā)生發(fā)展。因此,本研究得出四君子湯可通過(guò)靶向PTGS2來(lái)發(fā)揮對(duì)前列腺癌的治療作用的結(jié)論。然而本研究所有結(jié)論來(lái)自于生物信息學(xué)方法,需要在此基礎(chǔ)上進(jìn)行相應(yīng)的功能學(xué)實(shí)驗(yàn)來(lái)驗(yàn)證并拓展上述結(jié)論。