阮文慧,唐玉蓮,倪安妮,李根亮,李曙波,陸瑞群,黃海玲
(右江民族醫(yī)學(xué)院生物化學(xué)與分子生物學(xué)教研室,廣西 百色533000)
腫瘤微環(huán)境(tumor microenvironment,TM)是腫瘤的內(nèi)部生存環(huán)境,腫瘤前微環(huán)境(pretumor microenvironment,PTM)是健康生理微環(huán)境(physiological microenvironment,PM)到TM之間的過渡階段[1]。與健康組織相比,TM中出現(xiàn)了大量的異常表達(dá)基因[1-2]。外泌體能通過其攜帶的基因參與多種生理、病理過程,TM中的外泌體與癌癥的發(fā)生發(fā)展密切相關(guān)[3-4]。然而,外泌體來源的RNA剪接基因(exosome-derived RNA-splicing genes,ERGs)在模型小鼠的肝細(xì)胞癌微環(huán)境中發(fā)生發(fā)展的具體生理途徑仍少有報(bào)道。
RNA剪接調(diào)控著細(xì)胞周期的進(jìn)展,并在癌癥和多種疾病中起著重要作用[5]。mRNA前體的選擇性剪接是一種基本的調(diào)控機(jī)制。經(jīng)過選擇性剪接可產(chǎn)生多個(gè)不同的mRNA轉(zhuǎn)錄本,生成不同甚至相反功能的蛋白質(zhì)異構(gòu)體[6]。真核細(xì)胞中最豐富的核糖體RNA與mRNA剪接位點(diǎn)上的序列互補(bǔ),經(jīng)RNA剪接酶的識(shí)別,切割和剪接RNA。剪接體的磷酸化可能通過調(diào)節(jié)RNA剪接參與HCC(hepatocellular carcinoma,HCC)的轉(zhuǎn)移[7]。RNA聚合酶相關(guān)蛋白則能參與mRNA前體的選擇性剪接并誘導(dǎo)人肝癌細(xì)胞凋亡[8]??梢奟NA剪接與癌癥息息相關(guān)。
為探究這一問題,本研究以PM作為對(duì)照,通過構(gòu)建肝癌模型小鼠,分別提取PM、PTM和TM三組樣本中的總RNA進(jìn)行RNA測(cè)序(RNA-seq)和生物信息學(xué)分析,并構(gòu)建外泌體來源RNA剪接基因作為比對(duì)數(shù)據(jù)庫(kù)與測(cè)序數(shù)據(jù)比對(duì),篩選差異表達(dá)的外泌體來源RNA剪接基因(ERDs)和分析ERDs的功能及異常表達(dá)的可能原因。研究結(jié)果從分子機(jī)制的角度,為HCC發(fā)生發(fā)展過程中外泌體來源RNA剪接基因參與HCC的病理機(jī)制提供基礎(chǔ)資料。
1.1 細(xì)胞培養(yǎng)H22肝癌細(xì)胞系(購(gòu)自南京凱基生物技術(shù)有限公司)經(jīng)體外細(xì)胞培養(yǎng)至指數(shù)增長(zhǎng)期,3 000 r·min-1離心、洗滌、稀釋至終濃度105個(gè)·mL-1時(shí)用于構(gòu)建肝癌模型小鼠。
1.2 肝癌模型小鼠的構(gòu)建及樣本獲取100只健康昆明小鼠(鼠齡7周左右,體重22~25 g)隨機(jī)分成兩組,即實(shí)驗(yàn)組小鼠和陰性對(duì)照組小鼠(PM組)。實(shí)驗(yàn)組小鼠(n=60)給予每只雙前腋下注射指數(shù)生長(zhǎng)期時(shí)的H22肝癌細(xì)胞系0.2 mL(隔天注射一次,重復(fù)3次),其余的小鼠(n=40)注射不含H22的生理鹽水同法注射作為對(duì)照,分別正常飼養(yǎng)4周后分三組樣品進(jìn)行收集,實(shí)驗(yàn)組小鼠中成瘤小鼠分別取瘤體和肝未癌變部分為肝癌模型小鼠的TM和PTM,對(duì)照組小鼠中取健康肝組織細(xì)胞作為健康小鼠的肝組織(PM)[1-2]。實(shí)驗(yàn)動(dòng)物的使用符合國(guó)家及右江民族醫(yī)學(xué)院實(shí)驗(yàn)動(dòng)物倫理有關(guān)章程,在實(shí)驗(yàn)實(shí)施時(shí)嚴(yán)格執(zhí)行實(shí)驗(yàn)動(dòng)物安全制度及相關(guān)規(guī)章。
1.3 RNA提取和測(cè)序各樣本內(nèi)提取總RNA(n=20),同組內(nèi)等量取各樣本總RNA混合成混合總RNA樣本[1-2],提取方法按照本實(shí)驗(yàn)室之前的實(shí)驗(yàn)方法進(jìn)行,并送公司測(cè)序。RNA質(zhì)量檢測(cè)、逆轉(zhuǎn)錄、文庫(kù)構(gòu)建、RNA-seq等按常規(guī)程序完成[1]。
1.4 測(cè)序數(shù)據(jù)差異表達(dá)基因分析以小鼠RNA基因組為背景對(duì)測(cè)序結(jié)果進(jìn)行比對(duì)、注釋和較正,統(tǒng)計(jì)分析各基因RPKF(Reads Per Kilo bases per Million reads)值的差異,同一基因不同樣本間的RPKF比值≥2或≤0.5,且錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)≤0.05的 基 因 作 為 差 異 表 達(dá) 基 因(differentially expressed genes,DEGs)。
1.5 ERDs的篩選使用NCBI數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/)以("exosome"or"exosomal")and("splicing"or"spliceosome"or"spliceosomal")為檢索詞,在NCBI中的Nucleotide數(shù)據(jù)庫(kù)中進(jìn)行檢索。將檢索結(jié)果通過DAVID在線轉(zhuǎn)換成Ensembl gene ID和Official gene symbol后,將轉(zhuǎn)換結(jié)果與測(cè)序數(shù)據(jù)中的DEGs進(jìn)行比較,篩選出樣本間差異表達(dá)的外泌體源RNA剪切基因(exosome-derived RNA-splicing related DEGs,ERDs)。
1.6 ERDs的功能分析利用DAVID 6.8在線軟件(https://david.ncifcrf.gov)對(duì)21個(gè)高表達(dá)的ERDs進(jìn)行GO(Gene Ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)分析,并對(duì)富集到的生物學(xué)程序(biological process,BP)、細(xì)胞組分(cellular component,CC)、分 子 功 能(molecular function,MF)和信號(hào)通路(KEGG pathway)等進(jìn)行功能注釋聚類(functional annotation clustering),其中以FDR≤0.05為差異有統(tǒng)計(jì)學(xué)意義。
1.7 ERDs編碼蛋白的互作分析通過STRING 11.0版本數(shù)據(jù)庫(kù)(https://string-db.org/)在線對(duì)ERDs編碼蛋白進(jìn)行Co-expression互作分析,以評(píng)價(jià)其在表達(dá)上的相關(guān)性及其中發(fā)揮功能的關(guān)鍵分子。
1.8 ERDs的AS和SNV/INDEl與基因表達(dá)的相關(guān)性分析用Excel 2010和SPSS統(tǒng)計(jì)分析,對(duì)外泌體相關(guān)的ERDs中出現(xiàn)的AS(alternative splicing,AS)和單核苷酸位點(diǎn)變異(single nucleotide variants,SNV)及插入缺失標(biāo)記(insertion/deletion,INDEL)進(jìn)行卡方檢驗(yàn),其中P<0.05且兩樣本間發(fā)生頻率的倍數(shù)不小于2的為差異有統(tǒng)計(jì)學(xué)意義上。
1.9 RT-qPCR驗(yàn)證ERDs隨機(jī)選擇3個(gè)在三組樣本都表達(dá)的ERDs進(jìn)行RT-qPCR分析,以驗(yàn)證基因表達(dá)量和RNA-seq測(cè)序結(jié)果準(zhǔn)確性,同一樣本間和同一組不同樣本間的實(shí)驗(yàn)重復(fù)3次。PCR條件參照文獻(xiàn),引物采用在線引物設(shè)計(jì)軟件(https://www.ncbi.nlm.nih.gov/tools/primer-blast/)進(jìn)行設(shè)計(jì),并由上海生工進(jìn)行合成[1-2]。RT-qPCR實(shí)驗(yàn)內(nèi)參基因?yàn)?8sRNA。
2.1 測(cè)序數(shù)據(jù)TM組、PTM組及PM組通過RNAseq分別獲得了5.01 G base(35.28 M clean reads)、5.06 G base(35.36 M clean reads)和5.02 G base(35.32 M clean reads)的數(shù)據(jù)。三組樣本所得clean reads對(duì)基因組的匹配率分別為92.65%、90.10%和89.20%,且三樣本測(cè)序數(shù)據(jù)的Q20皆大于99%。
2.2 ERDs NCBI的nucleotide數(shù)據(jù)庫(kù)中共檢索到28 275個(gè)與小鼠外泌體RNA以及RNA剪接相關(guān)的核苷酸序列。經(jīng)DAVID 6.8軟件共成功注釋到12 273個(gè)ERGs作為研究背景。在TM和PM之間總共有4 533個(gè)測(cè)序數(shù)據(jù)組差異表達(dá)基因(DEGs),與DEGs匹配的ERDs有151個(gè),其中10個(gè)下調(diào)、141個(gè)上調(diào)。在TM和PTM之間總共有4 042個(gè)DEGs,篩選出的ERDs有169個(gè),其中11下調(diào)、158個(gè)上調(diào)。兩組對(duì)比樣本中共有21個(gè)相同的ERDs都在TM中高表達(dá)。
2.3 ERDs的功能以上篩選出的21個(gè)相同的ERDs功能富集分析結(jié)果顯示,它們主要富集到4個(gè)BP、5個(gè)CC、2個(gè)MF和1個(gè)KEGG pathway(圖1)。它們主要參與剪接體的功能執(zhí)行,尤其是在剪接體執(zhí)行剪接過程中ploy(A)RNA結(jié)合、核來源的第二步剪接小體的催化作用以及mRNA前體的剪接和剪接體snRNP組裝。結(jié)果表明,它們可能通過剪接體調(diào)控的信號(hào)通路(圖2)促進(jìn)HCC發(fā)生發(fā)展。
圖1 ERDs的功能
圖2 ERDs參與剪接體的過程(紅星表示該基因在TM中表達(dá)上調(diào))
2.4 ERDs編碼蛋白的相互作用21個(gè)上調(diào)的ERDs編碼蛋白的相互作用見圖3。
圖3 ERDs編碼蛋白的互作關(guān)系
2.5 ERDs的AS和SNV/INDEL 21個(gè)在TM中高表達(dá)的ERDs的AS分析結(jié)果顯示,Hnrnpa1和Lsm3兩個(gè)基因發(fā)生了AS,且其與這兩個(gè)基因一樣,在TM中都上調(diào)表達(dá),而在PTM和PM中都下調(diào)表達(dá)??梢?,AS的發(fā)生可能與相應(yīng)基因的表達(dá)呈正相關(guān)。
SNV和INDEL分析顯示,TM與PM對(duì)比,差異基因發(fā)生了110個(gè)SNV和3個(gè)INDEL位點(diǎn)的改變;TM與PTM對(duì)比,差異基因發(fā)生了112個(gè)SNV和4個(gè)INDEL位點(diǎn)的改變。且兩組對(duì)比樣本的基因位點(diǎn)的改變都主要發(fā)生在基因的6個(gè)部位,即外顯子區(qū)(exonic)、內(nèi)含子區(qū)(intronic)、基因間區(qū)(intergenic)、基因下游區(qū)(downstream)、基因上游區(qū)(upstream)和剪接區(qū)(splicing)(圖4)。在這些核苷酸位點(diǎn)發(fā)生改變的基因中,TM與PM對(duì)比中有16個(gè)RNA剪接相關(guān)的差異基因的SNV改變具有統(tǒng)計(jì)學(xué)意義,其中有12個(gè)ERDs的SNV改變與其基因的表達(dá)呈正相關(guān)(表1)。TM與PTM中有16個(gè)差異基因SNV改變有統(tǒng)計(jì)學(xué)意義,其中11個(gè)SNV改變與其基因的表達(dá)也呈正相關(guān)(表2)。
在TM與PM對(duì)比中,11個(gè)ERDs在TM中出現(xiàn)了50個(gè)SNV現(xiàn)象,但在PM無此位點(diǎn)改變(表3)。在TM與PTM對(duì)比中,12個(gè)ERDs在TM中出現(xiàn)了40個(gè)SNV現(xiàn)象,但PTM中沒有出現(xiàn)這些位點(diǎn)改變(表4)。
圖4兩組對(duì)比樣本中ERDs的SNV和INDEL在基因不同部位上發(fā)生的頻率
表1 TM/PM中ERDs的SNV發(fā)生頻率與基因表達(dá)的相關(guān)性
表2 TM/PTM中ERDs的SNV發(fā)生頻率與基因表達(dá)的相關(guān)性
2.6 RT-qPCR結(jié)果RT-qPCR結(jié)果顯示(n=3),隨機(jī)選擇的3個(gè)ERDs的表達(dá)結(jié)果與RNA-seq結(jié)果一致(圖5)。引物序列見表5。
表3 TM/PM中ERDs的SNV發(fā)生情況
表4 TM/PTM中ERDs的SNV發(fā)生情況
圖5 ERDs在TM/PTM以及TM/PM中的相對(duì)表達(dá)情況(與對(duì)照組相比)
表5 RT-qPCR引物
在本研究中,我們通過從NCBI上找到RNA剪接有關(guān)基因和小鼠外泌體RNA基因構(gòu)建背景基因,利用背景基因與高通量測(cè)序結(jié)果進(jìn)行比對(duì),篩選得到了21個(gè)在TM中高表達(dá)的外泌體源RNA剪接相關(guān)基因(ERGs)。這些差異基因包括:Fancd2、Ctnna1、Tnfrsf1b、DNAJB1、dis3、KIF23等,它們主要參與了催化作用的步驟2剪接小體、剪接體snRNP組裝等生物學(xué)過程,這些生物學(xué)過程可能通過poly(A)RNA結(jié)合的方式以剪接體通路來促進(jìn)HCC的發(fā)生發(fā)展。
真核細(xì)胞中剪接體執(zhí)行的過程是基因表達(dá)的重要環(huán)節(jié),一些疾病的起因可由剪接體蛋白的突變而影響轉(zhuǎn)錄本的剪接,甚至一些癌癥也與剪接因子的錯(cuò)誤調(diào)控有關(guān)[9]。例如:婦科惡性疾病如宮頸癌,剪接因子對(duì)常見Fancd2基因結(jié)構(gòu)異常起重要作用,引起了復(fù)發(fā)患者中Fancd2基因突變率高,F(xiàn)ancd2基因突變形式通常為基因組的缺失,最終導(dǎo)致了Fancd2基因的低表達(dá)或功能缺失,導(dǎo)致宮頸癌預(yù)后不良易復(fù)發(fā)[10];Hdm2剪接體與結(jié)腸癌細(xì)胞的增殖相關(guān),其通過下調(diào)抑癌基因表達(dá),促進(jìn)結(jié)直腸癌的發(fā)生和發(fā)展[11];在t(8,21)急性髓系白血病中,選擇性剪切體AML1-ETO9a與細(xì)胞的惡性程度息息相關(guān)[12];LSM剪接體蛋白過度表達(dá)導(dǎo)致肺癌細(xì)胞選擇性剪接增多[13]。在本研究結(jié)果中,LSM剪接體蛋白基因中的Lsm2和Lsm3,在HCC發(fā)生發(fā)展過程中出現(xiàn)上調(diào)表達(dá)。Lsm2和Lsm3編碼蛋白位于細(xì)胞核中起催化作用的第二步剪接小體中,通過poly(A)RNA結(jié)合,導(dǎo)致mRNA前體剪接異常,不能成為成熟的mRNA。并且Lsm2和Lsm3編碼蛋白又與細(xì)胞內(nèi)的核糖核蛋白復(fù)合體密切相關(guān),核糖體的異常導(dǎo)致mRNA無法通過核糖體的作用轉(zhuǎn)變成蛋白質(zhì)行使生命活動(dòng)的各種功能。
另外,RNA-結(jié)構(gòu)元件在mRNA前體的剪接催化中起著關(guān)鍵作用,然而RNA催化結(jié)構(gòu)的形成需要剪接體蛋白的協(xié)助。Rbm22作為一種剪接體蛋白在促進(jìn)剪接體催化RNA元件活性構(gòu)象中的具有潛在作用[14]。而Snrpd1參與催化mRNA前體剪接、調(diào)節(jié)多功能特異性剪接體組裝及獲得和維持多潛能剪接,與許多免疫性疾病有關(guān),如:系統(tǒng)性紅斑狼瘡[15]。本研究中,催化作用的第二步剪接小體中的Rbm22和Snrpd1上調(diào)表達(dá),使剪接體snRNP組裝異常,從而影響poly(A)RNA結(jié)合,并導(dǎo)致mRNA在細(xì)胞質(zhì)中的穩(wěn)定性降低,mRNA被過早降解。這些基因都來源細(xì)胞核,且相互關(guān)聯(lián)而影響剪接體通路。我們的研究中的通路圖和蛋白互作圖表明了這一點(diǎn)。
已知mRNA表達(dá)過程中的AS事件會(huì)產(chǎn)生不同的蛋白質(zhì),并且這種情況也發(fā)生在肝癌的發(fā)展過程中[16]。我們的AS分析結(jié)果發(fā)現(xiàn),TM樣本中Hnrnpa1和Lsm3內(nèi)AS和基因表達(dá)均上調(diào)表達(dá),也同樣證明了這一點(diǎn)??梢?,引起基因多態(tài)性的遺傳因素AS與基因表達(dá)呈正相關(guān)。另外,SNV分析顯示SNV改變與RNA剪接基因表達(dá)量具有很強(qiáng)的相關(guān)性,TM中上調(diào)表達(dá)RNA剪接基因多具有SNV現(xiàn)象,但在PTM和PM中無此SNV現(xiàn)象;基因位點(diǎn)突變和選擇性剪接在健康組織和癌旁健康組織中并無發(fā)生,但在癌癥發(fā)生后,由于RNA剪接基因上的這些基因位點(diǎn)的突變導(dǎo)致剪接體出現(xiàn)變異。因此,RNA剪接基因中的AS以及SNV突變可能導(dǎo)致異常剪接和poly(A)RNA異常結(jié)合,在HCC發(fā)生發(fā)展中起著重要作用。
綜上所述,在肝癌細(xì)胞的發(fā)生發(fā)展過程中,在TM樣本中上調(diào)表達(dá)21個(gè)ERGs影響了參與poly(A)RNA結(jié)合的Lsm2、Magoh、Eftud2、Rbm22等因子,導(dǎo)致剪接體通路出現(xiàn)異常,進(jìn)而導(dǎo)致mRNA轉(zhuǎn)錄本的穩(wěn)定性和mRNA的翻譯效率受到影響。其中Pabpc1、Ppil1、Lsm2等還出現(xiàn)異常上調(diào)表達(dá),使核中步驟2剪接小體異常催化;Snrpd1、Smn1、Gemin5和Rbm22等異常上調(diào)表達(dá)導(dǎo)致剪接體snRNP組裝出現(xiàn)異常,這造成附加因子和剪接裝置的錯(cuò)誤剪接而參與HCC的發(fā)生發(fā)展,且這種異常剪接與ERDs自身的基因多態(tài)性改變有關(guān)。