李志學(xué),梁子涵,賈承霖,漆宇騁,岳俊杰,郭志云
1.西南交通大學(xué) 生命科學(xué)與工程學(xué)院,四川 成都610031;2.軍事科學(xué)院 軍事醫(yī)學(xué)研究院 生物工程研究所,北京100071
肺癌在世界范圍的發(fā)病率和致死率都高居各類癌癥之首,分別達(dá)11.6%和18.4%[1]。肺癌分為小細(xì)胞癌和非小細(xì)胞癌,非小細(xì)胞癌又分為鱗狀細(xì)胞癌、腺細(xì)胞癌等亞型,其中肺腺癌最為常見(jiàn)。肺腺癌治療方法主要包括手術(shù)、放療、化療和靶向治療,但僅靠這些療法還無(wú)法保證徹底治愈[2]。因此,關(guān)于肺腺癌發(fā)生發(fā)展分子機(jī)制及調(diào)控機(jī)理的研究,仍是學(xué)術(shù)界關(guān)注的熱點(diǎn)。
在人類進(jìn)化演變的過(guò)程中,形成了紛繁復(fù)雜又高度有序的基因網(wǎng)絡(luò)調(diào)控結(jié)構(gòu),它們由一定的模序(motif)元件所構(gòu)成,在生物體內(nèi)發(fā)揮著重要的基因調(diào)節(jié)作用[3]。其中,前饋環(huán)路(feed-for?ward loops,F(xiàn)FLs)是一種重要的循環(huán)線性模序,它由2個(gè)輸入調(diào)節(jié)因子P1和P2,以及1個(gè)輸出因子P3 構(gòu)成。P1 可以調(diào)節(jié)P2,也可以與P2 共同調(diào)節(jié)P3,即P3 所受到的網(wǎng)絡(luò)調(diào)節(jié)的影響是P1、P2 元件綜合作用的結(jié)果。
增強(qiáng)子是真核細(xì)胞中普遍存在的順式調(diào)控元件,可以通過(guò)招募轉(zhuǎn)錄因子(transcription fac?tor,TF),進(jìn)而結(jié)合多種激活因子,形成多蛋白復(fù)合物,使染色質(zhì)成環(huán),遠(yuǎn)端調(diào)控啟動(dòng)子。通過(guò)對(duì)增強(qiáng)子染色質(zhì)的修飾和重塑等作用,促進(jìn)基因的轉(zhuǎn)錄[4]。此外,較多證據(jù)表明,增強(qiáng)子與microRNA(miRNA)間同樣存在復(fù)雜的調(diào)控關(guān)系。Xiao 等[5]通過(guò)刪除HEK293T細(xì)胞系中的miR-24-1 增強(qiáng)子基因座,發(fā)現(xiàn)miR-24-1的表達(dá)量下降,其鄰近基因不能再被激活,表明miR-24-1 鄰近基因的轉(zhuǎn)錄激活依賴于完整增強(qiáng)子的存在。此外,miR-24-1可激活增強(qiáng)子RNA(eRNA)表達(dá),改變組蛋白修飾,增加增強(qiáng)子位點(diǎn)p300和RNA PolⅡ的富集,從而激活轉(zhuǎn)錄。Suzuki 等證明增強(qiáng)子可以通過(guò)募集Drosha和DGCR8 這2個(gè)在miRNA初始轉(zhuǎn)錄本(primary miRNA,pri-miRNA)剪接過(guò)程中發(fā)揮重要作用的蛋白,調(diào)控成熟的miRNA在細(xì)胞中的水平,進(jìn)而影響基因的表達(dá)[6]。目前,關(guān)于肺腺癌前饋環(huán)路的研究,多集中于miRNA-TF-基因所形成的調(diào)控網(wǎng)絡(luò),而增強(qiáng)子在該調(diào)控網(wǎng)絡(luò)中發(fā)揮什么樣的作用、如何發(fā)揮作用,還不夠清晰。
考慮到前饋環(huán)路模型的多樣性和靈活性,我們?cè)诖藢⑵湟敕蜗侔┓肿訖C(jī)制的研究,通過(guò)數(shù)據(jù)篩選和處理,期望進(jìn)一步了解在肺癌腺產(chǎn)生過(guò)程中,增強(qiáng)子、轉(zhuǎn)錄因子、miRNA、基因之間存在的調(diào)控關(guān)系。綜合多組學(xué)數(shù)據(jù),本研究構(gòu)建了TF-增強(qiáng)子-miRNA的前饋環(huán)路,并探討該前饋環(huán)路的功能,為探究肺腺癌發(fā)生的分子機(jī)制及其調(diào)控機(jī)理提供新的思路,也為以網(wǎng)絡(luò)標(biāo)志物為主的肺腺癌診斷提供理論依據(jù)。
增強(qiáng)子數(shù)據(jù)下載自HACER[7]數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)通過(guò)GRO_seq和PRO_seq 整合FANTOM與其他轉(zhuǎn)錄非穩(wěn)定RNA的增強(qiáng)子,是目前最為全面的增強(qiáng)子數(shù)據(jù)庫(kù)。我們從HACER 數(shù)據(jù)庫(kù)下載肺腺癌A549細(xì)胞增強(qiáng)子3870個(gè)。
從Cistrome DB[8]和Unibind[9]數(shù)據(jù)庫(kù)下載獲取A549細(xì)胞系中的97個(gè)轉(zhuǎn)錄因子的Chip-Seq 數(shù)據(jù)集(.bed 文件),作為轉(zhuǎn)錄因子與DNA的結(jié)合位點(diǎn)信息。當(dāng)轉(zhuǎn)錄因子的結(jié)合位點(diǎn)包含于同一染色體的增強(qiáng)子區(qū)域時(shí),認(rèn)為該轉(zhuǎn)錄因子對(duì)該增強(qiáng)子具有調(diào)控關(guān)系。
miRNA位置信息下載自miRBase 數(shù)據(jù)庫(kù)[10],miRNA轉(zhuǎn)錄起始位點(diǎn)數(shù)據(jù)下載自FANTOM 數(shù)據(jù)庫(kù),人類蛋白質(zhì)編碼基因注釋數(shù)據(jù)下載自GEN?CODE 數(shù)據(jù)庫(kù)。根據(jù)先前的增強(qiáng)子調(diào)控miRNA研究[11],對(duì)每個(gè)增強(qiáng)子的上游或下游,分別找到距增強(qiáng)子中心最近的miRNA轉(zhuǎn)錄起始位點(diǎn)和同側(cè)的所有蛋白質(zhì)編碼基因轉(zhuǎn)錄起始位點(diǎn)。將增強(qiáng)子中心與miRNA轉(zhuǎn)錄起始位點(diǎn)間的距離定為M,增強(qiáng)子中心與同方向蛋白質(zhì)編碼基因轉(zhuǎn)錄起始位點(diǎn)間的距離定為G。以調(diào)控評(píng)分公式計(jì)算score值,設(shè)定score值為0~0.2的增強(qiáng)子與miRNA之間存在調(diào)控關(guān)系。
利用上述獲取的轉(zhuǎn)錄因子、miRNA數(shù)據(jù),如轉(zhuǎn)錄因子的結(jié)合位點(diǎn)包含于miRNA轉(zhuǎn)錄起始位點(diǎn)上游10 kb 及下游1 kb,認(rèn)為該轉(zhuǎn)錄因子對(duì)該miRNA具有調(diào)控作用[12]。
將上述3 類調(diào)控關(guān)系進(jìn)行組合篩選,采用超幾何檢驗(yàn)獲取非隨機(jī)性的前饋環(huán)路。公式如下:
其中,M為miRNA總數(shù),N為某一轉(zhuǎn)錄因子所調(diào)控的miRNA總數(shù),k為某一增強(qiáng)子所調(diào)控的miRNA總數(shù),x為該轉(zhuǎn)錄因子所調(diào)控的miRNA與該增強(qiáng)子所調(diào)控的miRNA的交集。依據(jù)Benjamini-Ho?chberge[13]方法,利用FDR值對(duì)該超幾何檢驗(yàn)的概率值進(jìn)行修正,并計(jì)算q值,將q≤0.05的前饋環(huán)路作為有生物學(xué)意義的前饋環(huán)路。
miRNA都能夠?qū)虮磉_(dá)起調(diào)控作用,從構(gòu)建的TF-增強(qiáng)子-miRNA前饋環(huán)路中選擇參與多個(gè)前饋環(huán)路的miRNA,獲取參與前饋環(huán)路的每個(gè)miRNA的表達(dá)量,將miRNA高于平均miRNA表達(dá)的作為前饋環(huán)路關(guān)鍵性的miRNA。前饋環(huán)路關(guān)鍵性miRNA表達(dá)量下載自FANTOM5 數(shù)據(jù)庫(kù)[14]。
從mirTarBase[15]數(shù)據(jù)庫(kù)下載經(jīng)實(shí)驗(yàn)證實(shí)的miRNA靶基因,采用R軟件包c(diǎn)lusterProfiler 對(duì)miRNA靶基因進(jìn)行Gene Ontology(GO)與KEGG Pathway 功能富集分析。
利用KMplot[16]生存分析在線工具,選擇TF-增強(qiáng)子-miRNA前饋環(huán)路關(guān)鍵靶基因進(jìn)行臨床樣本的生存分析。
通過(guò)上述數(shù)據(jù)庫(kù)搜索,獲取了97個(gè)轉(zhuǎn)錄因子的DNA 結(jié)合位點(diǎn)信息、3870個(gè)肺腺癌組織特異性活性增強(qiáng)子區(qū)域信息、4801個(gè)miRNA的轉(zhuǎn)錄起始位點(diǎn)信息和80 455個(gè)蛋白質(zhì)編碼基因的轉(zhuǎn)錄起始位點(diǎn)信息。最終,我們識(shí)別了227個(gè)TF-增強(qiáng)子作用關(guān)系,涉及61個(gè)轉(zhuǎn)錄因子和66個(gè)增強(qiáng)子;6973個(gè)增強(qiáng)子-miRNA作用關(guān)系,涉及3767個(gè) 增強(qiáng)子和1262個(gè)miRNA;10 715個(gè)TF-miRNA作用關(guān)系,涉及89個(gè)轉(zhuǎn)錄因子和1367個(gè)miRNA。
通過(guò)對(duì)上述作用關(guān)系進(jìn)行整合,最終共獲得36個(gè)肺腺癌TF-增強(qiáng)子-miRNA前饋環(huán)路(表1),其中增強(qiáng)子(chr11:355877~356724)參與的前饋環(huán)路數(shù)目最多,為7個(gè)。本研究構(gòu)建的前饋環(huán)路涉及增強(qiáng)子,增強(qiáng)子對(duì)miRNA的調(diào)控全為正調(diào)控,由此構(gòu)建的前饋環(huán)路均為連貫前饋環(huán)路[3]。
在這些前饋環(huán)路中,平均每個(gè)miRNA涉及2.769個(gè)轉(zhuǎn)錄因子,其中大于等于3個(gè)轉(zhuǎn)錄因子的miRNA有hsa-miR-6734、hsa-miR-4677、hsa-miR-6743、hsa-let-7i、hsa-miR-210、hsa-miR-4492、hsa-miR-6760。hsa-miR-210 已被證實(shí)與肺癌相關(guān)[17]。這些miRNA在肺癌發(fā)生發(fā)展的過(guò)程中可能起關(guān)鍵作用,例如調(diào)控肺癌相關(guān)基因的表達(dá),提高肺癌細(xì)胞的轉(zhuǎn)移性、浸潤(rùn)性或異質(zhì)性等。
從mirTarBase 數(shù)據(jù)庫(kù)獲取了36個(gè)TF-增強(qiáng)子-miRNA前饋環(huán)路中miRNA的所有靶基因,共計(jì)2404個(gè),利用R 軟件包c(diǎn)lusterProfiler 對(duì)所有靶基因進(jìn)行了GO 功能富集。我們發(fā)現(xiàn)肺腺癌前饋環(huán)路在細(xì)胞周期正調(diào)控、細(xì)胞分化、蛋白質(zhì)穩(wěn)定性調(diào)控、能量代謝和糖代謝等方面具有重要功能(圖1),這與文獻(xiàn)報(bào)道的癌細(xì)胞基因功能一致。通過(guò)功能富集分析,我們發(fā)現(xiàn)了在肺癌細(xì)胞中起關(guān)鍵作用的多效基因TP53、IGF1、TPR、CREB、CASP3、STAT5B、APP、USP19 等,其中TP53、IGF1、TPR、CREB、CASP3、STAT5B、APP、USP19 已被證實(shí)與腫瘤密切相關(guān),如TP53[18]和CREB基因已被證實(shí)可顯著影響肺腺癌的增殖。Illiano 等采用脂聯(lián)素干預(yù)A549 肺腺癌細(xì)胞,發(fā)現(xiàn)脂聯(lián)素可抑制CREB基因表達(dá),顯著降低肺腺癌細(xì)胞的增殖[19]。
圖1 肺腺癌全前饋環(huán)路靶基因GO 功能富集結(jié)果
對(duì)靶基因進(jìn)行KEGG 通路富集分析(圖2),發(fā)現(xiàn)與肺腺癌前饋環(huán)路miRNA靶基因廣泛參與糖代謝、甘氨酸/絲氨酸/蘇氨酸代謝、丙氨酸/天冬氨酸/谷氨酸代謝、半胱氨酸/甲硫氨酸代謝等通路。該結(jié)果說(shuō)明肺腺癌前饋環(huán)路在大分子化合物代謝通路中起關(guān)鍵作用,該結(jié)果與癌細(xì)胞生理特征一致,其中涉及的關(guān)鍵基因有PGAM1、PGAM4、LDH4、LDHB、AGXT2 等。
為探究上述肺腺癌TF-增強(qiáng)子-miRNA前饋環(huán)路關(guān)鍵靶基因?qū)Ψ蜗侔┗颊叩挠绊懀覀儗?duì)其中參與富集功能(≥2個(gè))的多效基因進(jìn)行生存分析。選擇具有表達(dá)活性差異的基因發(fā)現(xiàn),TP53和CREB1在高表達(dá)時(shí)會(huì)使肺腺癌患者的生存率降低,而STAT5B和TPR在低表達(dá)時(shí)會(huì)使肺腺癌患者的生存率降低(圖3)。因此與多效基因TP53、CREB1、STAT5B、TPR 有關(guān)的前饋環(huán)路可能對(duì)肺腺癌的發(fā)展、轉(zhuǎn)移有重要影響。
依據(jù)FAMTOM5 提供的miRNA表達(dá)量數(shù)據(jù),發(fā)現(xiàn)上述6個(gè)miRNA中,hsa-let-7i-3p、hsa-miR-210-5p、hsa-miR-6734-5p與hsa-miR-4677-5p在體內(nèi)的表達(dá)量顯著高于前饋環(huán)路涉及到的13個(gè)miRNA表達(dá)量的平均值,暗示這4個(gè)miRNA可能是肺腺癌的關(guān)鍵性miRNA。其中hsa-miR-6734參與了7個(gè)前饋環(huán)路,顯著高于表達(dá)量平均值2.769,共涉及7個(gè)重要的轉(zhuǎn)錄因子ETS1、GABPA、PBX3、TEAD4、YY1、ZBTB33、DNase。其中的YY1已有文獻(xiàn)報(bào)道與腫瘤發(fā)生有關(guān)[20]。
表1 36個(gè)肺腺癌TF-增強(qiáng)子-miRNA前饋環(huán)路
圖2 肺腺癌全前饋環(huán)路靶基因KEGG 通路富集結(jié)果
圖3 多效基因TP53(A)、CREB1(B)、
分別對(duì)上述4個(gè)關(guān)鍵miRNA靶基因進(jìn)行GO功能分析和KEGG 通路分析。一方面我們獲取了這4個(gè)關(guān)鍵miRNA的功 能活性,hsa-miR-6734 具有強(qiáng)的核酸轉(zhuǎn)錄抑制活性,hsa-miR-210 具有強(qiáng)的分解代謝活性,hsa-let-7i 具有強(qiáng)的絲氨酸/蘇氨酸激酶活性,而hsa-miR-4677 無(wú)明確的富集功能。另一方面,構(gòu)建4個(gè)關(guān)鍵miRNA的基因調(diào)控網(wǎng)絡(luò),發(fā)現(xiàn)hsa-miR-210 調(diào)控細(xì)胞分解代謝和應(yīng)激反應(yīng)功能的關(guān)鍵靶基因PLK1、APC、BNIP3、ATG7、SIN3A,hsa-miR-6734 調(diào) 控 各 類 復(fù) 合 物(NuRD、CHD 類等)功能的關(guān)鍵靶基因MTA1、CSNK2A1、RBBP4、ZBTB7A,hsa-let-7i細(xì)胞周期正調(diào)節(jié)功能的關(guān)鍵靶基因IGF1、PDGFB、CDKN1A、CCND1、EDN1和CCNT2。
我們探討了TF-增強(qiáng)子、增強(qiáng)子-miRNA、TFmiRNA作用關(guān)系,并識(shí)別了肺腺癌細(xì)胞系相關(guān)的36 條TF-增強(qiáng)子-miRNA前饋環(huán)路,涉及22個(gè)轉(zhuǎn)錄因子、13個(gè)增強(qiáng)子、13個(gè)miRNA。在功能富集和通路富集方面,我們發(fā)現(xiàn)肺腺癌細(xì)胞TF-增強(qiáng)子-miRNA前饋環(huán)路靶基因顯著富集于與癌癥密切相關(guān)的生物功能上,如細(xì)胞周期正調(diào)控、細(xì)胞分化、蛋白質(zhì)穩(wěn)定性調(diào)控、能量代謝和糖代謝等,其中涉及的關(guān)鍵基因已被很多研究證實(shí)在癌癥細(xì)胞中特異表達(dá)。KEGG 通路富集結(jié)果顯示前饋環(huán)路靶基因富集于肺癌代謝相關(guān)信號(hào)通路。結(jié)合miRNA的參與環(huán)路數(shù)和表達(dá)量,我們篩選了前饋環(huán)路關(guān)鍵miRNAhsa-miR-6734、hsa-miR-210、hsa-miR-4677和hsa-let-7i,探討了它們與基因的調(diào)控關(guān)系網(wǎng)絡(luò)。另外,我們對(duì)參與富集功能多的多效基因進(jìn)行肺腺癌生存分析,發(fā)現(xiàn)前饋環(huán)路的多效靶基因TP53、CREB1、STAT5B、TPR的表達(dá)差異對(duì)患者肺癌的生存發(fā)展有重要影響。本研究揭示了肺腺癌相關(guān)前饋環(huán)路的特點(diǎn),為以后肺腺癌前饋環(huán)路研究提供理論與方法參考。