卓勝華,羊良旺,陳申波,張金本,張召騰,李爭爭,楊 堃
(海南醫(yī)學院第一附屬醫(yī)院神經(jīng)外科,海南 海口 570102)
腦膠質瘤作為最常見的原發(fā)性中樞神經(jīng)系統(tǒng)(central nerve system,CNS)腫瘤,特別是膠質母細胞瘤(glioblastoma multiforme,GBM),其治療效果不盡人意,預后極差,且部分低級別腦膠質瘤(lowgrade glioma,LGG)雖經(jīng)治療,但仍易復發(fā)。因此,針對腦膠質瘤探索更有價值的治療靶點具有重要的臨床意義。microRNAs(miRNAs,miR)是一類單鏈小分子RNA,長度約為22 個核苷酸,作用于靶基因3′-非翻譯區(qū),在轉錄后水平負向調(diào)節(jié)基因表達,它們從癌癥的發(fā)生到轉移的各個階段都扮演著至關重要的角色[1]。作為一種腫瘤抑制因子,miR-29b-3p 在多種腫瘤中均有異常表達,與腫瘤的發(fā)生發(fā)展密切相關[2]。miR-29b-3p 有多個靶基因,在不同腫瘤中的靶基因并不完全相同。在腦膠質瘤中miR-29b-3p 低表達,恢復其表達可對腦膠質瘤發(fā)揮抗癌作用[3,4]。
但miR-29b-3p 的靶基因在腦膠質瘤中是否高表達、能否影響到患者的預后和作為獨立的預后因素并未完全闡明。鑒于此,本研究結合臨床數(shù)據(jù)庫、miRNA 靶基因預測數(shù)據(jù)庫,構建靶基因的蛋白-蛋白互作(protein-protein interaction,PPI)網(wǎng)絡,并進一步綜合分析靶基因在LGG 和GBM 中不同情況下的表達差異及其對生存預后的影響,通過單因素、多因素Cox 比例風險回歸模型分析確定獨立預后因素,進而篩選出在腦膠質瘤中miR-29b-3p 的核心靶基因。
LinkedOmics 數(shù)據(jù)庫(http://www.linkedomics.org/)包含來自癌癥基因組圖譜(the cancer genome atlas,TCGA)項目的32 種癌癥和和跨腫瘤類型的癌癥的多組學數(shù)據(jù)和臨床數(shù)據(jù),它也是第一個集成了臨床蛋白質腫瘤分析聯(lián)盟對選定的TCGA 腫瘤樣本生成的基于質譜的蛋白質組學數(shù)據(jù)的多組學數(shù) 據(jù) 庫[5]。筆 者 使 用LinkedOmics 數(shù) 據(jù) 庫,通 過LGGGBM 數(shù)據(jù)集,分析表達量與miR-29b-3p 負相關基因及與臨床預后負相關的基因(高表達、預后差),并下載數(shù)據(jù)用于后續(xù)分析。
通過4 個miRNA 靶基因預測數(shù)據(jù)庫miRDB(http://mirdb. org/index. html) 、 miRTarBase(http://mirtarbase. mbc. nctu. edu. tw/php/index.php)、TargetScan(http://www.targetscan.org/vert_72/)、starbase(starbase.sysu.edu.cn/),下載并整理miR-29b-3p 靶基因數(shù)據(jù);于在線韋恩圖制作網(wǎng)站(http://bioinformatics. psb. ugent. be/webtools/Venn/)制作韋恩圖,獲取交集基因;將交集后的基因再與miR-29b-3p 負相關的基因、臨床預后正相關基因取交集。 將交集后的基因于STRING(https://string-db.org/)分析靶基因的PPI 網(wǎng)絡,下載相關數(shù)據(jù),用Cytoscape 軟件((https://www.cytoscape.org))構建PPI 網(wǎng)絡圖,去除未參與網(wǎng)絡關系的基因,篩出余下基因用于后續(xù)分析。
基因表達譜交互分析(gene expression profiling interactive analysis,GEPIA)網(wǎng)絡服務器是基于TCGA 和GTEx 數(shù)據(jù)庫中的腫瘤和正常樣本進行基因表達分析的數(shù)據(jù)庫。GEPIA2 是一個更新和增強的版本,將基因表達定量從基因水平擴展到轉錄本水平,并支持對特定癌癥亞型的分析,以及亞型之 間 的 比 較[6]。 在GEPIA2 數(shù) 據(jù) 庫 中,設 置|Log2FC|>1,P<0.01,分 析 靶 基 因 集 在LGG 和GBM 較正常組織的表達差異;同時選擇LGG 和GBM,以中位數(shù)進行分組,分別用總生存期和無復發(fā)生存期進行生存分析。進一步在中國腦膠質瘤基因組圖譜計劃(CGGA:http://cgga.org.cn/)中選擇mRNAseq_693 數(shù)據(jù),比較Ⅱ、Ⅲ與Ⅳ級、IDH 突變型與IDH 野生型及1p/19q 共缺失與1p/19q 非共缺失之間的表達,同時進行原發(fā)性和復發(fā)性膠質瘤的生存分析。
使用CGGA 中的mRNAseq_693 數(shù)據(jù)集,剔除無生存時間和狀態(tài)的病例,最終納入655 例患者,將WHO 級別、性別、年齡、放療狀態(tài)、化療狀態(tài)、IDH突變狀態(tài)、1p/19q 共缺失狀態(tài)、MGMT 啟動子甲基化狀態(tài)納入分析,各基因表達量按中位數(shù)分高低表達組,使用SPSS 25.0 對所有的變量進行單因素Cox 回歸分析;按P<0.01 水準,納入變量進一步作多因素Cox 回歸分析,多因素Cox 回歸模型采用基于偏最大似然估計的前向逐步回歸方法。
LinkedOmics 數(shù)據(jù)庫的LGGGBM 數(shù)據(jù)集中篩選出表達量與miR-29b-3p 負相關的基因共有6 404個;此外,8 507 個基因的表達與膠質瘤患者的生存預后呈負相關。
從miRDB、miRTarBase、TargetScan、starbase預測miR-29b-3p 的靶基因,共交集到71 個基因(圖1A);再與miR-29b-3p 表達及生存預后負相關的基因取交集后得到22 個基因,分別為BMF、CD276、ELN、COL3A1、NASP、DNMT3A、COL4A2、C1QTNF6、NKIRAS2、CDK6、SERPINH1、LOXL2、COL2A1、VEGFA、ABCE1、MCL1、TDG、DNMT3B、COL4A1、DYNLT1、ISG20L2、LAMC1(圖1B)。通過STRING 分析靶基因的蛋白互作,剔除其中未參與網(wǎng)絡關系的基因:NASP、C1QTNF6、NKIRAS2、ABCE1、DYNLT1 與ISG20L2,并 在Cytoscape 軟件中進行可視化(圖1C)。
圖1 miR-29b-3p 靶基因的多數(shù)據(jù)庫交集和蛋白-蛋白互作網(wǎng)絡Fig 1 Target genes of miR-29b-3p predicted using LinkedOmics,miRDB,miRTarBase,TargetScan,and starbase databas as well as the PPI network
在GEPIA 中分別分析各基因在LGG、GBM 中與正常組織之間的差異表達;分析其在膠質瘤中對總生存期預后和無復發(fā)生存期預后的影響,見表1。在CGGA 中各基因在不同等級、IDH 突變狀態(tài)及1p/19q 共缺失狀態(tài)的表達差異及對原發(fā)、復發(fā)型膠質瘤預后的影響,見表2。綜合表1 和表2 分析,GEPIA 中 顯 示COL2A1、DNMT3A 和DNMT3B在 正常腦組織與LGG、GBM 中的表達量均無差異,COL2A1對無復發(fā)生存期預后無影響;CGGA 中顯示COL2A1在Ⅲ級與Ⅳ級、不同IDH 突變狀態(tài)、不同1p/19q 共缺失狀態(tài)的表達無差異,在原發(fā)型和復發(fā)型腦膠質瘤中對預后無影響,DNMT3A和DNMT3B在Ⅱ級與Ⅲ級中的表達無差異,DNMT3B 在不同IDH 突變狀態(tài)下表達無差異,因此不納入下一步分析,納入下一步分析的基因包括:SERPINH1、VEGFA、MCL1、COL4A2、CD276、COL4A1、ELN、COL3A1、LAMC1、LOXL2、TDG、CDK6和BMF共13 個 基 因。
表1 靶基因集在GEPIA 中的差異表達分析和生存分析Tabl 1 Differential expression analysis and survival analysis of target genes in GEPIA
表2 靶基因集在CGGA 中的差異表達分析和生存分析Tab 2 Differential expression analysis and survival analysis of target gene set in CGGA
通過單因素Cox 風險回歸分析,剔除性別、放療狀態(tài)、化療狀態(tài)、MGMT 啟動子甲基化狀態(tài);將WHO 級別、年齡、IDH 突變狀態(tài)、1p/19q 共缺失狀態(tài)和各基因進行多因素Cox 比例風險回歸模型分析后,最終WHO 級別、IDH 突變狀態(tài)、1p/19q 共缺失狀態(tài)、SERPINH1、LOXL2、CDK6為獨立的預后因素,見表3。
表3 CGGA 中655 例患者預后的單因素、多因素Cox 比例風險回歸模型分析Tab 3 Univariate and multivariate Cox regression analysis of prognosis in 655 patients with CGGA
本研究通過多數(shù)據(jù)庫篩選了miR-29b-3p 在腦膠質瘤中的核心靶基因,分析了靶基因的表達量在正常與腫瘤組織間、不同級別、IDH 突變狀態(tài)和1p/19q 共缺失狀態(tài)下的表達差異,以及其對總生存期預后、無復發(fā)生存期預后的影響及其作為生存預后的獨立影響因素。既往有研究報道,Serpin 家族H成員1(SERPINH1)是一種膠原結合蛋白和膠原特異性伴侶,其在乳腺癌的發(fā)生和發(fā)展過程中受到miR-29 的 調(diào) 控[7]。SERPINH1 與 腦 膠 質 瘤 的 內(nèi) 皮細胞遷移和基質重塑有關,可促進血管生成[8]。此外,miR-29a 調(diào)控的SERPINH1 可促進腦膠質瘤生長和侵襲[9]。賴氨酰氧化酶樣蛋白2(LOXL2)的高表達與腦膠質瘤體積較大、分級較高有關,LOXL2過表達促進腦膠質瘤細胞增殖和侵襲[10]。在肝癌中,miR-26 和miR-29 靶 向LOXL2 協(xié) 同 抑 制 其 表達[11]。在套細胞淋巴瘤中,miR-29 通過直接結合到周期蛋白依賴性激酶6(CDK6)的3'UTR 抑制其表達[12];miR-29b 靶向CDK6 抑制骨肉瘤細胞增殖和遷移[13]。在腦膠質瘤中,神經(jīng)降壓素可通過c-Myc/miR-29b-1 調(diào)節(jié)CDK6 的表達,從而促進腫瘤的發(fā)生發(fā)展[3]。本研究基于生物信息學方法,篩選出腫瘤抑制分子miR-29b-3p 在腦膠質瘤中的核心靶基因。雖然部分基因在腦膠質瘤中尚未驗證被miR-29b-3p 靶向,但既往的研究表明,這些基因與腦膠質瘤發(fā)生發(fā)展密切相關[3,8,10],這為miR-29b-3p 成為關鍵的治療靶點提供了重要的依據(jù)。
目前膠質瘤的主要治療方法包括最大限度安全的手術切除和同步放、化療,但患者的預后仍然很差。且由于血腦腫瘤屏障及腫瘤的異質性等因素的存在,給抗腫瘤藥物的開發(fā)和應用增加了難度。近年來,有關基于納米載體的膠質母細胞瘤藥物聯(lián)合治療的研究大幅增多,這有利于開發(fā)新的納米藥物組合和納米熱化學療法來對抗腦膠質瘤[14,15]。納米醫(yī)學為單獨或與腦內(nèi)其他治療藥物組合以實現(xiàn)最佳治療反應的miRNA 或抗miRNA 的位點特異性遞送提供了新途徑,基于納米遞送系統(tǒng)不僅可以保護miRNA 免受核酸酶降解,還可以延長其在血液中的半衰期,更易于透過血腦腫瘤屏障發(fā)揮作用[16]。這為腦膠質瘤的治療提供了新的思路。有研究在建立的人源GBM 組織切片培養(yǎng)系統(tǒng)中證實了miR-29b 偶聯(lián)納米顆粒的抗癌作用[17],miR-29b 有望成為GBM 治療的新靶標。
綜上所述,本研究通過利用LinkedOmics、miRDB、miRTarBase、TargetScan、starbase、GEPIA和CGGA 等多個數(shù)據(jù)庫,分析了miR-29b-3p 的靶基因與臨床特征的關系及對臨床預后的影響。通過單因素、多因素Cox 比例風險回歸模型分析確定獨立預后因素,最終確定SERPINH1、LOXL2和CDK6共3 個基因為miR-29b-3p 的核心靶基因。各基因的表達量在正常與腫瘤組織間、不同級別、IDH突變狀態(tài)和1p/19q 共缺失狀態(tài)下存在差異。且其高表達對總生存期預后、無復發(fā)生存期預后存在不良影響,均可作為膠質瘤的獨立預后因素。