史佩華,陶晨雨
(河北農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,河北保定 071000)
性別鑒定在畜禽動(dòng)物生產(chǎn)中有著重要的意義,因此對(duì)于性染色體及特異基因的分析十分必要。性染色體由一對(duì)獲得性別決定基因的祖先常染色體進(jìn)化而來,在結(jié)構(gòu)和基因含量上存在差異[1]。人類Y 染色體上男性特有序列MSY 占Y 染色體序列的95%,全長(zhǎng)23 Mb,包含短臂(Yp)的8Mb 和長(zhǎng)臂(Yq)的14.50 Mb。在MSY 中存在1 個(gè)著絲粒異染色質(zhì)區(qū)域(約1Mb)和一個(gè)跨度約400 kb 的異染色質(zhì)區(qū)[2]。人類的PAR1 和PAR2 位于性染色體長(zhǎng)臂的頂端[3]。像人類一樣,PAR和性別決定基因(SRY)位于黑猩猩的長(zhǎng)臂末端,但是在大猩猩Y 染色體中卻位于短臂末端[4-6]。在雌性哺乳動(dòng)物中,X 染色體全長(zhǎng)大約155 Mb,共有1 098 個(gè)基因(7.10 Mb),在X 染色體上基因密度較低,同時(shí)基因長(zhǎng)度也較短[7]。但是X 染色體上包含人類基因組中已知的一個(gè)特異性基因PLP1與性連鎖遺傳相關(guān)。PLP1是位于X 染色體的高度保守的編碼髓鞘蛋白脂蛋白(PLP)基因,構(gòu)成中樞神經(jīng)系統(tǒng)髓鞘的主要蛋白質(zhì)[8]。Y 染色體較短但卻攜帶著較多的功能基因,其中SRY[9-10]是研究最多的基因之一。SRY基因位于Y 染色體短臂(Yp)上,是目前公認(rèn)的睪丸決定因子,在哺乳動(dòng)物的性別決定中至關(guān)重要。
牛肉產(chǎn)業(yè)從雄性動(dòng)物的生產(chǎn)中受益,而乳制品產(chǎn)業(yè)從雌性動(dòng)物的牛奶生產(chǎn)中受益。因此需要具有理想性別的動(dòng)物促進(jìn)生產(chǎn)。雖然目前有對(duì)牛的Y 染色體基因進(jìn)行定位和功能分析的相關(guān)研究[11],但是由于測(cè)序技術(shù)的限制,測(cè)得的片段很難區(qū)分X 與Y 染色體,無法從短序列讀取復(fù)雜且高度重復(fù)的Y 擴(kuò)增子區(qū)域,Y 染色體相關(guān)數(shù)據(jù)有限。因此,對(duì)牛性染色體的了解仍然不夠全面。本實(shí)驗(yàn)根據(jù)已有的牛參考基因組對(duì)牛的性染色體序列做了系統(tǒng)的基因組生物信息學(xué)分析,選擇特異性基因PLP1和SRY進(jìn)行精準(zhǔn)定位,為研究牛性染色體提供理論支撐,有助于推進(jìn)后續(xù)的性別鑒定工作。
1.1 參考基因組下載和XY 染色體序列比對(duì)分析 本文中牛的最新參考基因組(assembly ARS-USD 1.2)下載于NCBI 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov)。在下載的參考基因組文件中,保留了完整的XY 染色體序列信息。通過序列相似性BLAST 比對(duì),對(duì)牛X 染色體和Y 染色體比對(duì)分析,找到牛X 染色體和Y 染色體的基因富集區(qū)域。
1.2 XY 染色體特有基因GO 分析 在Ensembl 數(shù)據(jù)庫(http://www.ensembl.org/biomart/martview)下載牛的XY 染色體特有基因ID 及GO 功能注釋信息(LU_Bosgru_v3.0),在Omicshare 云平臺(tái)(https://www.omicshare.com/tools)進(jìn)行GO 二級(jí)分類。分析X 染色體特有基因PLP1和Y 染色體特有基因SRY的GO 二級(jí)功能注釋結(jié)果。
1.3PLP1、SRY基因結(jié)構(gòu)分析 將X 染色體上基因密度最高的前15 個(gè)區(qū)域和Y 染色體上基因密度最高的前10 個(gè)區(qū)域定義為熱點(diǎn)區(qū)域。R 語言包“Rideogram”繪制染色體基因密度圖[12]。R 語言包“Sushi”顯示靶基因PLP1和SRY的結(jié)構(gòu)[13]。
2.1 XY 染色體基因組特征 基于牛XY 染色體基因密度分析,本研究獲得了XY 染色體上的基因富集區(qū)域,整個(gè)X 和Y 染色體分別在圖的左側(cè)和右側(cè)使用相同的比例顯示。圖譜上的基因密度信息映射為熱圖中的重疊特征,并在圖譜旁邊添加軌道標(biāo)簽,三角形標(biāo)記為熱點(diǎn)區(qū)域(圖1)。但是在X 染色體上存在部分區(qū)域基因缺失,尤其在末端有大量空白區(qū)域,Y 染色體只有末端區(qū)域存在部分基因缺失。Y 染色體基因密度整體較高,X染色體基因密度比較低。說明XY 染色體上基因分布不均勻,X 染色體區(qū)域上基因含量較少,Y 染色體上基因含量豐富。其中X 染色體上包含130 個(gè)特有基因區(qū)域,而Y 染色體上包含42 個(gè)特有基因區(qū)域,XY 染色體上前10 個(gè)高密度基因區(qū)域如表1 所示。
表1 XY 染色體基因富集的前10 位熱點(diǎn)區(qū)域
圖1 XY 染色體的長(zhǎng)度和基因密度
2.2 XY 染色體特異基因GO 分析 把XY 染色體特有基因進(jìn)行GO 二級(jí)分類,注釋繪制成圖表并進(jìn)行結(jié)果篩選(圖2、表2)。雖然XY 染色體整體功能組差異不大,但是仍然存在一些功能特異性差異,比如在多細(xì)胞生物進(jìn)程、應(yīng)激反應(yīng)、發(fā)育過程、分子功能調(diào)節(jié)、免疫過程中X 染色體比Y 染色體比例更高。甚至有關(guān)定位、運(yùn)動(dòng)方式、生殖過程、繁殖、生長(zhǎng)、行為、規(guī)律性進(jìn)程、細(xì)胞連接、超分子復(fù)合物、結(jié)構(gòu)分子活性和轉(zhuǎn)錄因子活性以及蛋白質(zhì)結(jié)合只注釋到X 染色體,但是電子載體活性只注釋到Y(jié) 染色體。另外X 染色體保守基因PLP1注釋到生物調(diào)節(jié)、單一生物體過程、新陳代謝過程、應(yīng)激反應(yīng)、細(xì)胞成分組織或生物生成、多細(xì)胞生物體過程、發(fā)育過程相關(guān)二級(jí)功能。Y 染色體保守基因SRY注釋到生物調(diào)節(jié)、單一生物體過程、多細(xì)胞生物體過程、發(fā)育過程、繁殖、生殖過程、細(xì)胞、細(xì)胞器、凝集、核酸結(jié)合轉(zhuǎn)錄因子活性相關(guān)二級(jí)功能,可見PLP1與SRY存在部分相同功能例如生物調(diào)節(jié)、單一生物體過程、多細(xì)胞生物體過程、發(fā)育過程。
圖2 性染色體GO 注釋的統(tǒng)計(jì)分類
XY 染色體特有基因被分成3 個(gè)功能組,包括生物過程、細(xì)胞組分、分子功能,X 染色體包括PLP1、MECP2、AR、ATRX、FOXO4、CASK、GATA1、HDAC6、FOXP3等特異基因共1 062 個(gè)(表3),多數(shù)基因的GO 二級(jí)功能主要富集在生物調(diào)節(jié)、代謝過程、應(yīng)激反應(yīng)、細(xì)胞器部分、大分子復(fù)合物、催化活性等(表2)。Y 染色體包括TLR7、ADGRG2、MSL3、PRPS2、GLRA2、PRKX、GPR143、ANOS1、SRY等特有基因共197 個(gè)(表3),多數(shù)基因的GO 二級(jí)功能主要富集在生物調(diào)節(jié)、單一生物過程、代謝過程、應(yīng)激反應(yīng)、組織或生物發(fā)生、細(xì)胞結(jié)合、催化活性、信號(hào)部分等(表2)。
表2 XY 染色體GO 注釋條目及基因數(shù)目
表3 XY 染色體部分特異性基因
2.3PLP1、SRY定位分析PLP1與SRY基因是廣泛研究的XY 染色體特異基因,在性別鑒定等領(lǐng)域有著廣泛應(yīng)用,又因基因保守性較好,因此本研究挑選了PLP1與SRY2 個(gè)基因進(jìn)行分析。分析得出PLP1基因定位在X 染色體上52.00~53.00 Mb 區(qū)域,基因含量比較高,具體介于52.40~52.60 Mb 之間,包含7 個(gè)外顯子,6 個(gè)內(nèi)含子(圖3)。對(duì)SRY基因定位發(fā)現(xiàn),SRY基因位于Y 染色體上42.00~43.00 Mb 極高密度區(qū)域,在42.20~42.40 Mb 之間有6 個(gè)外顯子、5 個(gè)內(nèi)含子(圖4)?;虻膹?fù)制總是在特定位置開始,許多基因疾病的發(fā)生由某個(gè)基因的突變與復(fù)制錯(cuò)誤造成,進(jìn)行基因定位將有助于為疾病的治療發(fā)現(xiàn)重要的靶點(diǎn)。PLP1與SRY是性別鑒定中的常見基因,可以為性別鑒定與疾病治療等技術(shù)提供理論基礎(chǔ)。
圖3 PLP1 在X 染色體上的定位分析
圖4 SRY 在Y 染色體上的定位
3.1 XY 染色體基因組特征分析 關(guān)于XY 染色體進(jìn)化差異的學(xué)說經(jīng)歷了多個(gè)時(shí)代,近幾十年來的基因組研究認(rèn)為哺乳動(dòng)物X 染色體在種間大小和結(jié)構(gòu)上與常染色體相似,并保留了大部分祖先X 基因[2]。進(jìn)化過程中XY 染色體片段增加擴(kuò)展了PAR 區(qū),因此X 染色體基因高度保守,基因豐富。哺乳動(dòng)物的Y 染色體卻發(fā)生了實(shí)質(zhì)性的進(jìn)化差異,積累了雄性特有的基因和參與性別決定的基因,丟失了95% 的祖?zhèn)骰?,Y 染色體與基因組的其他部分不同,它是雄性特有的并表現(xiàn)出獨(dú)特的結(jié)構(gòu)和功能特征[14]。本研究通過對(duì)XY 染色體部分的個(gè)體基因研究表明X 染色體基因密度較Y 染色體來說要低得多,X 染色體中基因含量較高,但是基因密度不均勻,分布比較分散,部分末端明顯沒有基因分布,Y 染色體退化導(dǎo)致雖然基因含量不多卻分布比較集中。這與Y 染色體進(jìn)化過程中具有基因譜系特異性而導(dǎo)致的基因含量比較保守的情況是一致的[15-17]。Y 染色體比X染色體小得多,是基因組中最小的染色體,主要由假常染色體(PAR)、X-簡(jiǎn)并(X-D)和擴(kuò)增子區(qū)域組成[2]。XY 染色體只在假常染色體區(qū)域PAR1 和PAR2 的末端發(fā)生重組,基因的大量重組導(dǎo)致序列測(cè)定很難進(jìn)行[18],單倍體對(duì)Y 染色體重復(fù)序列的影響最大。Y 染色體的大部分長(zhǎng)度不受染色體配對(duì)要求的限制,這些重復(fù)序列通過染色體內(nèi)重組促進(jìn)頻繁的染色體重排,導(dǎo)致高度的結(jié)構(gòu)變異[19-21]。基因密度信息可應(yīng)用于多種不同情況,如單核苷酸多態(tài)性(SNP)和候選標(biāo)記、DNA 甲基化動(dòng)力學(xué)、轉(zhuǎn)錄因子(TF)結(jié)合位點(diǎn)和候選靶基因[12]。除了在染色體水平上可視化整個(gè)基因組的一些特定基因組特征,Rideogram 還可以用于比較2 個(gè)相關(guān)的基因組特征,這將為更好地理解這2 個(gè)特征的染色體分布之間的相關(guān)性提供一些重要的啟示。本研究利用生物信息學(xué)分析技術(shù)對(duì)XY 染色體進(jìn)行差異分析,結(jié)果獲得了可視化的性染色體上相關(guān)基因組特征。
3.2PLP1、SRY基因特征分析 XY 染色體不同于常染色體,它含有許多與性發(fā)育和生殖有關(guān)的偏向基因,特定的性染色體基因可以通過偏向性別的表達(dá)和在大腦中的功能導(dǎo)致發(fā)育中的性別差異,例如PLP1基因等[22]。本實(shí)驗(yàn)結(jié)果顯示PLP1基因定位到牛的X 染色體內(nèi)一個(gè)基因密度較高的區(qū)域,位置在52.4~52.6 Mb,具有7個(gè)外顯子。Chanchani 等[23]報(bào)道了人類的PLP1基因位于X 染色體長(zhǎng)臂Xq22.2 q23 一個(gè)復(fù)雜的基因組區(qū)域,表明靈長(zhǎng)類和牛的X 染色體的基因結(jié)構(gòu)在進(jìn)化過程中存在物種特異性。SRY定位到Y(jié) 染色體末端的假常染色體區(qū)域,具有6 個(gè)外顯子。但是在人的Y 染色體上SRY標(biāo)記為單外顯子基因[24],說明在進(jìn)化的過程中Y染色體可能依賴基因譜系。最近的研究發(fā)現(xiàn)小鼠SRY的第2 外顯子和其相對(duì)應(yīng)的SRY轉(zhuǎn)錄本(SRY-T)才是真正的睪丸決定因素[25]。有研究表明雖然SRY基因作為單拷貝基因存在于幾乎所有哺乳動(dòng)物中,但大鼠攜帶6 個(gè)拷貝,而小鼠SRY基因由于存在長(zhǎng)倒置重復(fù)序列而具有與其他哺乳動(dòng)物SRY基因不同的結(jié)構(gòu)[26]。類似的研究結(jié)果顯示SRY基因定位到Y(jié) 染色體的Yp 非常接近PAR1,Yp 上的PAR1 和Yq 上的PAR2 是Y 染色體中唯一在男性精子發(fā)生過程中與X 染色體同源序列進(jìn)行減數(shù)分裂重組的區(qū)域,SRY與PAR1 的接近性使其容易在異常重組后易位到X 染色體[27]。當(dāng)有XY 個(gè)體發(fā)生性別反轉(zhuǎn)時(shí),SRY基因在DNA 結(jié)合域有嚴(yán)重的突變[28]。有研究用FISH 法將SRY定位到牛Y 染色體正常編碼區(qū),但是表型特征卻顯示這頭母牛沒有發(fā)育睪丸,而是發(fā)育了有缺陷的卵巢[29]。事實(shí)上,SRY基因座的突變和缺失僅占 XY 的15%[30-31]。
3.3PLP1、SRY基因功能及應(yīng)用分析 性別分化涉及一系列事件,其性腺和生殖器逐漸獲得男性或女性特征依賴于一個(gè)復(fù)雜的功能基因網(wǎng)絡(luò),性染色體基因的正常功能保證了生物體發(fā)育的動(dòng)態(tài)平衡。GO 分析結(jié)果顯示XY 染色體候選基因在發(fā)育與性別差異等功能中有性別偏向表達(dá),許多X 連鎖基因在分子功能上與Y 連鎖基因有較大差異的表達(dá)。與本研究一致的基因表達(dá)分析也說明X 連鎖基因在大腦和其他組織中有很強(qiáng)的性別偏向性,往往偏向于女性[32]。
PLP1具有調(diào)節(jié)細(xì)胞成熟、炎癥反應(yīng)、中樞神經(jīng)系統(tǒng)髓鞘形成、基因上調(diào)等方面的功能,PLP1中的點(diǎn)突變和重復(fù)會(huì)導(dǎo)致X 連鎖的髓鞘障礙疾病,例如Pelizaeus-Merzbacher(PMD)病或2 型痙攣性截癱,PMD 病是一種罕見的X~連鎖腦白質(zhì)營(yíng)養(yǎng)不良癥,患者的臨床特征可能受到PLP1重復(fù)序列的影響[23]。該基因特異性表達(dá)于少突膠質(zhì)細(xì)胞的髓鞘[33]。有研究表明PLP1基因在胚胎中樞神經(jīng)系統(tǒng)中表達(dá)較早,早于少突膠質(zhì)細(xì)胞的產(chǎn)生,采用遺傳學(xué)方法顯示胚胎表達(dá)PLP1的膠質(zhì)祖細(xì)胞生成的出生后星形膠質(zhì)細(xì)胞僅存在于脊髓腹側(cè),在胚胎神經(jīng)發(fā)育過程中PLP1的表達(dá)展現(xiàn)了細(xì)胞的動(dòng)態(tài)特性[34]。女性常見的染色體疾病很可能與XY染色體特有的基因單倍體不足有關(guān),例如特納綜合征(Turner syndrome)是具有SRY基因?qū)е碌幕旌闲托韵侔l(fā)育不全和外部性別分化的疾病[35]。SRY基因的表達(dá)在不同的物種間有差異。在人體內(nèi)SRY基因在生殖嵴中的一小部分細(xì)胞中表達(dá)并啟動(dòng)睪丸的形成,人類SRY基因在性腺表達(dá)開始于妊娠后期,到成年仍有表達(dá)并見于其他組織[36]。與人類相似,在小鼠體內(nèi)SRY基因僅在生殖嵴的中心區(qū)域低表達(dá),但隨著性腺的發(fā)育,一旦生殖嵴發(fā)生性別分化,SRY基因表達(dá)量就開始減少。SRY基因在睪丸開始形成之前到結(jié)束的瞬時(shí)表達(dá)驗(yàn)證了SRY基因啟動(dòng)睪丸的發(fā)育但卻不維持睪丸的發(fā)育這一結(jié)論[37]。PLP1與SRY的定位與功能對(duì)于胚胎的生長(zhǎng)及基因疾病有很大的指導(dǎo)意義。對(duì)牛早期胚胎進(jìn)行性別鑒定和選擇可以極大提高養(yǎng)牛行業(yè)生產(chǎn)效益和經(jīng)濟(jì)效益。通過檢測(cè)性染色體Y 上是否含有SRY基因來確定胚胎的性別是一種精確度高且靈敏的方法,準(zhǔn)確率可達(dá)90% 以上,應(yīng)用前景可觀[38]。Sherry[39]等人對(duì)來自妊娠3~6 周的82 個(gè)樣品的cfDNA 進(jìn)行Y 染色體特異性序列SRY的實(shí)時(shí)熒光定量PCR 成功檢測(cè)出SRY 陰性為女胎,陽性為男胎。另有研究通過在患有X 連鎖隱性疾病的母體中檢測(cè)母體血漿中無細(xì)胞胎兒DNA 的Y染色體序列,在產(chǎn)前確定胎兒性別[40]。通過對(duì)植入前胚胎的性別預(yù)測(cè)來控制性別比,不僅有利于牲畜的管理、生產(chǎn)和育種計(jì)劃,而且有利于診斷產(chǎn)前階段的遺傳疾病。性別鑒定技術(shù)是有價(jià)值的生物技術(shù),有可能徹底改變養(yǎng)牛業(yè)。隨著分子生物學(xué)和細(xì)胞生物學(xué)的發(fā)展,性別檢測(cè)策略將有助于改善臨床遺傳疾病。哺乳動(dòng)物性染色體系統(tǒng)是高度保守的,性別決定是一個(gè)復(fù)雜的過程,受到各種內(nèi)部和外部因素的影響[41]。進(jìn)一步探索性別決定機(jī)制可以為畜牧業(yè)生產(chǎn)提供動(dòng)力。
本研究通過對(duì)牛的性染色體進(jìn)行生物信息學(xué)分析發(fā)現(xiàn)X 染色體特有基因高密度區(qū)域共15 個(gè),Y 染色體上10 個(gè)特有基因高密度區(qū)域,并且對(duì)XY 染色體上較保守的基因PLP1和SRY進(jìn)行了精準(zhǔn)定位,結(jié)合GO 分析為解釋性別調(diào)控機(jī)制及候選基因的研究提供了基礎(chǔ)資料。
致謝:感謝所有作者對(duì)本研究的貢獻(xiàn),感謝學(xué)校提供的平臺(tái)支持。