關(guān)鍵詞: 奶山羊; 乳腺; 可變剪接; RNA測(cè)序
中圖法分類號(hào): S827 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1000-2324(2024)01-0108-08
可變剪接(Alternative splicing,AS)是指轉(zhuǎn)錄后形成的前體RNA經(jīng)過(guò)剪接體和剪接因子的相互作用,最終形成多種成熟的mRNA 的過(guò)程[1],是一種廣泛提高轉(zhuǎn)錄組和蛋白質(zhì)組復(fù)雜性的分子機(jī)制,控制發(fā)育程序以及高等真核生物對(duì)環(huán)境的反應(yīng)[2-5]。隨著RNA測(cè)序技術(shù)和分析工具的最新發(fā)展,RNA-seq 數(shù)據(jù)提供了豐富的研究資源,可用于揭示不同生物體在許多生物過(guò)程中的新穎可變剪接事件和可變剪接調(diào)控機(jī)制[6-8]。目前,山羊可變剪接機(jī)制的研究報(bào)道較少,有關(guān)可變剪接事件在奶山羊乳腺發(fā)育與泌乳生理活性中的機(jī)理尚不清楚。因此,研究可變剪接調(diào)控奶山羊乳腺生理的機(jī)制,可為更好地理解乳腺發(fā)育和泌乳調(diào)控提供必要的理論基礎(chǔ)[9]。
當(dāng)前,在畜禽體內(nèi)可變剪接機(jī)制的功能探索研究表明,可變剪接在動(dòng)物體的生長(zhǎng)發(fā)育過(guò)程中起到重要的調(diào)控作用。例如:對(duì)4個(gè)不同發(fā)育時(shí)期豬睪丸組織進(jìn)行可變剪接鑒定和分析,發(fā)現(xiàn)第1 個(gè)外顯子可變剪接和最后1 個(gè)外顯子可變剪接事件類型與睪丸素合成和分泌密切相關(guān)[10]。通過(guò)對(duì)不同發(fā)育時(shí)期北京鴨胸肌和皮脂RNA-seq數(shù)據(jù)進(jìn)行可變剪接分析,發(fā)現(xiàn)胸肌特有可變剪接基因顯著富集到骨骼肌發(fā)育相關(guān)的GO條目中,而皮脂特有的可變剪接基因顯著富集到油脂合成的GO條目中[11]。研究人員對(duì)山羊五種組織類型(心臟,腎臟,腿部肌肉,肝臟和脾臟)不同發(fā)育階段差異可變剪接基因進(jìn)行分析,結(jié)果顯示鑒定得到的差異可變剪接基因主要參與器官的功能和發(fā)育[12]。
本實(shí)驗(yàn)室以嶗山奶山羊乳腺組織為研究模型,基于RNA-Seq 數(shù)據(jù)分析了可變剪接事件對(duì)不同泌乳時(shí)期乳腺生理的功能,揭示了其在乳腺生理學(xué)和發(fā)育過(guò)程中基因表達(dá)的復(fù)雜調(diào)控網(wǎng)絡(luò)[13-18],探索可變剪接調(diào)控奶山羊泌乳生理的分子機(jī)制,為奶山羊的乳腺發(fā)育和泌乳機(jī)理研究提供科學(xué)理論基礎(chǔ),同時(shí)也為奶山羊育種改良工作提供理論支持。
1 材料與方法
1.1 試驗(yàn)樣本及轉(zhuǎn)錄組數(shù)據(jù)
本研究RNA-Seq 數(shù)據(jù)為本實(shí)驗(yàn)室先前課題研究數(shù)據(jù),已上傳NCBI SRA 數(shù)據(jù)庫(kù)(SRA 號(hào):SRA218662)。試驗(yàn)樣本均來(lái)自于青島奧特種羊場(chǎng),四歲齡、第三胎次的5 只嶗山奶山羊,分別在泌乳初期(產(chǎn)后20 d),泌乳高峰期(產(chǎn)后90 d),和泌乳末期(產(chǎn)后210 d),采集不同泌乳時(shí)期乳腺組織。試驗(yàn)羊只自由獲取食物,無(wú)任何疾病,并在相同條件下飼養(yǎng)和管理。經(jīng)全身麻醉后通過(guò)外科手術(shù)分別采集三個(gè)泌乳時(shí)期乳腺組織,并迅速放入無(wú)RNase 冷凍管,然后立即浸入液氮罐中保存。RNA提取、混池測(cè)序質(zhì)量檢測(cè)和序列比對(duì)質(zhì)量較好[14]。
1.2 可變剪接特征分析
本研究中使用ASprofile 軟件根據(jù)轉(zhuǎn)錄本的剪接位點(diǎn)對(duì)三個(gè)文庫(kù)分別進(jìn)行可變剪接事件和基因的鑒定[11]。分析結(jié)果存在7 種可變剪接事件類型(圖1):可變5′或3′端剪接、單內(nèi)含子滯留、多內(nèi)含子滯留、單外顯子跳躍、多外顯子跳躍、第1 個(gè)外顯子可變剪接、最后1 個(gè)外顯子可變剪接。
1.3 差異可變剪接基因檢測(cè)及注釋分析
使用rMATS 軟件檢測(cè)三個(gè)文庫(kù)之間差異可變剪接基因[20]。FDR≤0.05 為差異顯著性判斷標(biāo)準(zhǔn),小于該閾值的差異可變剪接基因定義為顯著性差異基因。
通過(guò)GO 數(shù)據(jù)庫(kù)和KEGG 數(shù)據(jù)庫(kù)進(jìn)行生物學(xué)功能分析[21-22],篩選滿足P≤0.05 的GO條目與KEGG 通路進(jìn)行下游分析。
1.4 可變剪接調(diào)節(jié)蛋白和目的基因調(diào)控網(wǎng)絡(luò)的構(gòu)建
基于GO和KEGG注釋結(jié)果,篩選與乳腺發(fā)育及泌乳相關(guān)的可變剪接基因,在STRING數(shù)據(jù)庫(kù)[23]中進(jìn)行蛋白互作分析。然后使用Cytoscape軟件[24]構(gòu)建基因間的調(diào)控網(wǎng)絡(luò)。
2 結(jié)果與分析
2.1 測(cè)序數(shù)據(jù)質(zhì)量評(píng)價(jià)與分析
對(duì)測(cè)序數(shù)據(jù)經(jīng)統(tǒng)計(jì)與質(zhì)控分析后,泌乳初期、高峰期和末期文庫(kù)中獲得原始序列分別為36 336 892 條、35759380條和36469596條。與山羊參考基因組比對(duì)結(jié)果表明,泌乳初期比對(duì)到基因組上的序列數(shù)為34864794條,高峰期33888773條,末期34963722條,比對(duì)率分別為96.79%、95.60%和96.64%(表1)。
2.2 可變剪接的鑒定
泌乳初期、高峰期和末期三個(gè)文庫(kù)共鑒定到151 503 個(gè)可變剪接事件,對(duì)應(yīng)17 627 個(gè)可變剪接基因,占山羊總注釋基因的64.92%。其中,泌乳高峰期鑒定到基因數(shù)目最多,共計(jì)16 943個(gè),泌乳初期和末期分別為16 085、11 509 個(gè)(圖2-A);可變剪接頻率分析表明:泌乳高峰期鑒定到可變剪接頻率為3.24,低于泌乳末期的4.04,泌乳初期最低,為3.11,三個(gè)泌乳期平均可變剪接頻率為3.46??勺兗艚宇愋头治霰砻鳎喝齻€(gè)泌乳期均以第1 個(gè)外顯子可變剪接、最后1 個(gè)外顯子可變剪接、多外顯子跳躍和可變5′或3′端剪接為主要可變剪接事件,四種事件類型分別占到泌乳期可變剪接事件總數(shù)目的94.16%、93.79% 和94.52%;多內(nèi)含子滯留事件數(shù)目在三個(gè)泌乳期中最低,為稀有事件類型,分別占比0.04%、0.02%和0.03%(圖2-B)。三個(gè)泌乳期可變剪接基因在1-29 號(hào)染色體中均在18 號(hào)染色體分布最多,在27號(hào)染色體分布最少(圖2-C)。
2.3 差異可變剪接基因分析
三個(gè)泌乳期共有可變剪接基因14783個(gè),占剪接基因總數(shù)目83.87%。泌乳初期與高峰期共有可變剪接基因數(shù)目最多,泌乳初期與末期數(shù)目最少,分別為816 和168。特有可變剪接基因數(shù)目在泌乳高峰期最多、泌乳初期次之、泌乳末期最少,分別為983、317 和198(圖3-A)。初期與高峰期、初期與末期和高峰期與末期三組分別鑒定到5 848、4870 和5365 個(gè)差異可變剪接基因,不同泌乳期間共鑒定到差異可變剪接基因6323個(gè),其中共有差異可變剪接基因4 018個(gè),占總數(shù)目63.55%(圖3-B)。在初期與高峰期間檢測(cè)到1173個(gè)顯著性差異可變剪接基因,初期與末期間檢測(cè)到884個(gè),高峰期與末期檢測(cè)到1 107 個(gè),外顯子跳躍類型基因數(shù)目在三組中均占比最高,其次為3′端可變剪接位點(diǎn)和5′端可變剪接位點(diǎn),三種類型基因數(shù)目分別占每組顯著性差異可變剪接基因總數(shù)的91.56%、86.06%和90.87%(圖3-C)。
2.4 可變剪接基因GO注釋分析
為了進(jìn)一步探究差異可變剪接基因的功能,對(duì)初期與高峰期、初期與末期和高峰期與末期三組5 848、4870和5365個(gè)差異可變剪接基因進(jìn)行分析。在細(xì)胞組分中,主要有438 個(gè)基因與胞質(zhì)相關(guān),397 個(gè)基因與細(xì)胞核相關(guān),263個(gè)基因與核質(zhì)相關(guān),92個(gè)基因與高爾基體相關(guān)。在生物學(xué)過(guò)程中,主要有130 個(gè)基因與以DNA為模板的轉(zhuǎn)錄調(diào)控相關(guān),84個(gè)基因與RNA聚合酶II 啟動(dòng)子轉(zhuǎn)錄的負(fù)調(diào)控相關(guān),78 個(gè)基因與GTPase 活性的正調(diào)控相關(guān),61個(gè)基因與蛋白質(zhì)磷酸化相關(guān);在分子功能中,主要有188個(gè)基因與金屬離子結(jié)合相關(guān),183 個(gè)基因與蛋白質(zhì)結(jié)合相關(guān),176 個(gè)基因與ATP 結(jié)合相關(guān),131個(gè)基因與poly(A)RNA結(jié)合相關(guān)(圖4)。
此外根據(jù)注釋結(jié)果,在差異可變剪接基因注釋結(jié)果中篩選到了一些可變剪接調(diào)節(jié)蛋白和乳腺發(fā)育及泌乳相關(guān)的可變剪接調(diào)節(jié)蛋白48 個(gè),篩選到與乳腺發(fā)育及泌乳相關(guān)的基因共計(jì)65個(gè),其中23個(gè)基因注釋到乳腺上皮細(xì)胞增殖,15個(gè)基因注釋到乳腺導(dǎo)管形態(tài)發(fā)生中分支的調(diào)控,9個(gè)基因注釋到乳腺腺泡發(fā)育,5個(gè)基因注釋到乳腺脂肪發(fā)育,10個(gè)基因注釋到乳腺導(dǎo)管末梢乳芽生長(zhǎng)(表2)。
2.5 可變剪接基因KEGG通路分析
KEGG通路分析結(jié)果表明,泌乳初期與高峰期、泌乳初期與末期、泌乳高峰期與末期差異可變剪接基因富集結(jié)果具有非常高的重合性,主要涉及泛素介導(dǎo)的蛋白水解、胞吞作用、甘油磷脂代謝、催產(chǎn)素信號(hào)通路、鈣信號(hào)通路、類固醇生物合成、氨基糖和核苷酸糖代謝、內(nèi)質(zhì)網(wǎng)中的蛋白質(zhì)加工、半乳糖代謝等乳腺組織生理活性密切相關(guān)的通路(圖5)。
2.5 可變剪接基因調(diào)控網(wǎng)絡(luò)
根據(jù)差異可變剪接基因的GO 和KEGG 的注釋結(jié)果,我們篩選出65 個(gè)和乳腺發(fā)育及泌乳相關(guān)的目的基因,同時(shí)根據(jù)GO注釋結(jié)果篩選的48 個(gè)可變剪接調(diào)節(jié)蛋白,通過(guò)STRING 分析,得到46 個(gè)節(jié)點(diǎn),64 對(duì)調(diào)控關(guān)系,利用Cytoscape 構(gòu)建可變剪接調(diào)節(jié)蛋白和目的基因調(diào)控網(wǎng)絡(luò);基因PTEN 有14 個(gè)關(guān)系對(duì),為本網(wǎng)絡(luò)核心基因(圖6)。
3討論
眾多研究證明,可變剪接在所有高等真核生物基因表達(dá)過(guò)程中廣泛存在,鑒定分析可變剪接已成為真核基因調(diào)控領(lǐng)域的研究重點(diǎn)[25-26]。研究人員發(fā)現(xiàn)人類大約有95% 的基因發(fā)生可變剪接[27],鴨約有46.12%的基因發(fā)生可變剪接[11],牛約有21%的基因發(fā)生可變剪接[28];本項(xiàng)研究共鑒定到151 503 個(gè)可變剪接事件,對(duì)應(yīng)17 627 個(gè)可變剪接的基因,可變剪接基因數(shù)目占山羊總注釋基因的64.92%,通過(guò)對(duì)比分析可以發(fā)現(xiàn)在不同物種之間,可變剪接基因占總注釋基因數(shù)目存在巨大差異,推測(cè)可能和可變剪接事件的時(shí)序性表達(dá)、物種特異性有關(guān)[29]??勺兗艚硬粌H在真核生物體基因表達(dá)過(guò)程中廣泛存在,同時(shí)在生物體生長(zhǎng)發(fā)育過(guò)程中存在特異性表達(dá)等特點(diǎn)[30]。在本研究中,泌乳高峰期鑒定到剪接事件和基因數(shù)目均明顯高于泌乳初期和泌乳末期,結(jié)合已有研究報(bào)道乳腺組織在不同泌乳時(shí)期生理結(jié)構(gòu)和功能會(huì)發(fā)生顯著性變化[31-32],我們推測(cè)可變剪接事件的變化可能和乳腺組織不同泌乳期的生理活性密切相關(guān)。
可變剪接基因的生物學(xué)功能分析在可變剪接研究中具有重要作用。本研究中,我們篩選到和乳腺細(xì)胞增殖、分化與凋亡等密切相關(guān)的GO條目,以及一些影響乳腺上皮細(xì)胞內(nèi)物質(zhì)轉(zhuǎn)運(yùn)和組織代謝等密切相關(guān)的GO條目,不同泌乳期特有剪接基因的功能具有明顯特征,這與研究人員之前報(bào)道一致[11],這些研究表明特有剪接基因功能具有高度的適應(yīng)性。差異可變剪接基因GO注釋和KEGG通路分析中,篩選出一些如:催產(chǎn)素信號(hào)通路、鈣信號(hào)通路、糖代謝和磷脂代謝等與乳腺上皮細(xì)胞泌乳能力密切相關(guān)的通路。通過(guò)構(gòu)建調(diào)控網(wǎng)絡(luò),篩選PTEN為參與乳腺發(fā)育與泌乳調(diào)控網(wǎng)絡(luò)的核心基因。前期研究表明,干擾PTEN 基因,可影響奶山羊乳腺上皮細(xì)胞脂質(zhì)合成相關(guān)基因的轉(zhuǎn)錄及脂肪酸組成的影響,顯著影響乳脂合成[33]。在奶牛乳腺上皮細(xì)胞中,PTEN基因可靶向調(diào)節(jié)PI3K-AKT信號(hào)轉(zhuǎn)導(dǎo)通路,影響乳腺上皮細(xì)胞β-酪蛋白,甘油三酸酯和乳糖的分泌,從而參與奶牛乳腺組織的發(fā)育和泌乳[34-35]。
4結(jié)論
在奶山羊乳腺不同泌乳期,可變剪接的發(fā)生具有階段特異性,可變剪接基因與乳腺組織生理活性特點(diǎn)密切相關(guān),參與了奶山羊乳腺組織發(fā)育及泌乳功能的調(diào)控作用。PTEN可參通過(guò)構(gòu)建的核心調(diào)控網(wǎng)絡(luò)參與乳腺發(fā)育與泌乳調(diào)控。