唐可欣 伍茜 付文龍 程建國 吳杰 周磊 王翔 趙位 任梓薇 李依濛 劉潔 羅燕
摘 要 林麝(Moschus berezovskii)是一種具有較高經(jīng)濟價值和藥用價值的保護(hù)野生動物。為深入研究林麝線粒體基因組的結(jié)構(gòu)特征及遺傳變異,基于Illumina NovaSeq平臺對林麝肺成纖維細(xì)胞FMD-C1線粒體進(jìn)行全基因組測序,并進(jìn)行特征注釋、結(jié)構(gòu)預(yù)測、序列分析和系統(tǒng)發(fā)育重建。結(jié)果顯示,F(xiàn)MD-C1線粒體基因組序列全長為16 351 bp,共有13個蛋白編碼基因(protein coding gene,PCG),22個tRNA,2個rRNA和兩段非編碼區(qū),具有明顯的AT偏好性。將序列上傳至GenBank,登錄號為MW879208。與NCBI上林麝的其余序列比對,F(xiàn)MD-C1的4個PCGs中檢測出5個單氨基酸突變和3個插入氨基酸;D-loop區(qū)檢測出19個差異堿基和2個堿基缺失。系統(tǒng)進(jìn)化分析發(fā)現(xiàn)與林麝親緣關(guān)系最近的是安徽麝。研究結(jié)果可為林麝的選育和遺傳多樣性保護(hù)提供參考依據(jù),也為進(jìn)一步探討林麝肺部疾病線粒體水平的致病機制奠定基礎(chǔ)。
關(guān)鍵詞 林麝;線粒體基因組;蛋白編碼基因;非編碼區(qū);系統(tǒng)進(jìn)化
林麝(Moschus berezovskii)是麝屬中體型最小的一種。雄麝香腺中分泌的麝香是一種高級動物香料,也是一味名貴中藥材,具有較高的經(jīng)濟價值和藥用價值[1]。由于近幾十年棲息地破壞和人為捕殺,種群數(shù)量大幅減少,麝現(xiàn)已被列為中國一級重點保護(hù)動物[2]。為解決麝數(shù)量驟降以及推廣麝香的可持續(xù)利用,中國現(xiàn)大力發(fā)展人工養(yǎng)麝產(chǎn)業(yè),但麝養(yǎng)殖種群發(fā)病率高、死亡率高,導(dǎo)致人工養(yǎng)麝產(chǎn)業(yè)發(fā)展緩慢。其中,肺部疾病是林麝主要死因之一,對其背后的病理機制探究目前多集中在病原菌分離鑒定等方面[3-4]。
線粒體是廣泛存在真核生物細(xì)胞內(nèi)的重要細(xì)胞器,參與細(xì)胞供能、信息傳遞和細(xì)胞凋亡等過程,與多種疾病、衰老過程、發(fā)育及生物的性狀密切相關(guān)[5]。線粒體基因組(mitochondrial DNA,mtDNA)獨立于核基因組之外,具有分子質(zhì)量小、獨立復(fù)制、母系遺傳、突變速率快等可成為理想遺傳標(biāo)記的特點,是研究物種起源和遺傳進(jìn)化的重要分子工具[6-7]。除此之外,線粒體產(chǎn)生的活性氧(reactive oxygen species,ROS)在以肺部為代表的多種疾病發(fā)病機制中發(fā)揮廣泛的作用,過量的ROS還可以反作用在mtDNA上引起堿基突變[8-9]。由于林麝馴化期短,其警覺、易應(yīng)激的特點使其疾病難以在病危前被察覺,并且麝的分類至今仍在探討階段[10-12]。因此本研究對林麝肺成纖維細(xì)胞mtDNA進(jìn)行測序和分析,進(jìn)一步豐富林麝mtDNA的信息,鞏固林麝的系統(tǒng)分類,為林麝選育和遺傳資源保護(hù)奠定基礎(chǔ)。通過比較林麝mtDNA的差異,以期為林麝的肺部疾病前期發(fā)現(xiàn)和多樣性保護(hù)等研究提供科學(xué)依據(jù)。
1 材料與方法
1.1 試驗材料
林麝肺成纖維細(xì)胞系FMD-C1由四川農(nóng)業(yè)大學(xué)動物檢疫實驗室建立并保存。線粒體基因組提取試劑盒購于北京索萊寶科技有限公司。
1.2 方? 法
1.2.1 線粒體提取 將5×107個林麝肺成纖維細(xì)胞FMD-C1消化洗滌后離心,將收集到的細(xì)胞用1.0 mL預(yù)冷的Lysis Buffer重懸,冰浴研磨后轉(zhuǎn)移至離心管,1 000×g離心5 min后收集上清并轉(zhuǎn)移至新的離心管中重復(fù)離心,然后將收集到的上清再次轉(zhuǎn)移至新的離心管中,12 000×g離心10 min,收集沉淀,經(jīng)洗滌后將最終得到的高純度線粒體沉淀用100 μL的Store Buffer重懸。全程4 ℃低溫操作。濃度及純度經(jīng)NanoDrop 2000檢測合格后,送至南京派森諾基因科技有限公司進(jìn)行全基因組測序。
1.2.2 全基因組測序與組裝 采用全基因組鳥槍法策略構(gòu)建文庫。然后利用第二代測序技術(shù),基于Illumina NovaSeq平臺對文庫進(jìn)行雙末端測序。將平均質(zhì)量值小于20和長度小于50 bp的序列過濾后,采用A5-miseq 2015和SPAdes 3.9.0對其余高質(zhì)量數(shù)據(jù)從頭拼裝,構(gòu)建contig和scaffold序列。根據(jù)拼接序列的測序深度提取序列,將高測序深度的序列同 NCBI 上的 nt 庫進(jìn)行 blastn比對,挑出各拼接結(jié)果的線粒體序列。將拼接結(jié)果整合,確定contig間的位置關(guān)系,填補gap。使用pilon 1.18軟件對結(jié)果進(jìn)行校正后,得到最終的林麝線粒體序列。
1.2.3 序列分析 采用 cgview(http://cgview.ca/)可視化軟件繪制線粒體全基因組圈圖。將拼接得到的完整線粒體基因組序列上傳至在線服務(wù)器MITOS(http://mitos2.bioinf.uni-leipzig.de/index.py)進(jìn)行功能注釋和tRNA二級結(jié)構(gòu)預(yù)測。再分別計算線粒體全基因組和各特征的堿基組成并分析。從NCBI下載已發(fā)布的林麝線粒體序列,將蛋白編碼基因(protein coding gene,PCG)翻譯后進(jìn)行氨基酸差異比對,并比對兩段非編碼區(qū)的堿基位點突變情況。
1.2.4 系統(tǒng)發(fā)育分析 從NCBI上下載28個哺乳動物的mtDNA作為參考序列,包括麝科、???、鹿科、叉角羚科和其他哺乳動物。運用軟件MEGA 7.0以鄰接法構(gòu)建系統(tǒng)進(jìn)化樹,bootstrap重復(fù)次數(shù)設(shè)置為1 000。
2 結(jié)果與分析
2.1 線粒體基因組結(jié)構(gòu)與組成
林麝肺成纖維細(xì)胞FMD-C1線粒體基因組序列經(jīng)注釋后提交GenBank(登錄號:MW879208)。如圖1所示,林麝線粒體基因組序列全長為16 351 bp,共有13個PCGs,22個tRNA,2個rRNA和兩段非編碼區(qū)。林麝FMD-C1線粒體的堿基組成為A(33.96%)、G(12.92%)、C(25.03%)和T(28.10%)。林麝線粒體各特征的分布和堿基組成情況如表1所示,線粒體基因排列緊湊,部分基因間存在重疊現(xiàn)象,除trnY之外,各基因的GC含量均小于50%,表明林麝線粒體基因組具有AT偏好性。
2.2 rRNA與tRNA編碼基因結(jié)構(gòu)特征
林麝肺成纖維細(xì)胞FMD-C1線粒體包含兩個rRNA,分別為12S rRNA和16S rRNA,兩者均位于正義鏈上,之間夾著1個trnV基因。與大多數(shù)麝類似,林麝線粒體中也包含22個tRNA基因,其序列長度為66~75 bp,tRNA的總序列長度達(dá)1 511 bp。22個tRNA基因中,有2個絲氨酸轉(zhuǎn)運RNA和2個亮氨酸轉(zhuǎn)運RNA;8個tRNA(trnQ、trnA、trnN、trnC、trnY、trnS2、trnE和trnP)在反義鏈上,其余14個tRNA均位于正義鏈。tRNA預(yù)測顯示(圖2),F(xiàn)MD-C1的 21個tRNA均可形成三葉草型二級結(jié)構(gòu),而 trnS1(AGY)由于缺失二氫尿嘧啶臂(D臂)而不能形成典型的三葉草結(jié)構(gòu)。
2.3 蛋白編碼基因
林麝線粒體包含13個PCGs,基因長度為201~1 830 bp,占基因組總長度的69.84%,除nad6外,其他12個蛋白基因均編碼于正義鏈上。將林麝線粒體13個PCGs進(jìn)行編碼氨基酸差異比對,結(jié)果如圖3所示,除cox2外的其余12個PCGs均有差異氨基酸出現(xiàn)。大部分差異氨基酸出現(xiàn)在登錄號為KY792714的林麝上。對于FMD-C1,僅在4個PCGs中檢測出差異氨基酸,分別是位于nad1的I102V、nad2的M217T、nad5的T41M、I580V和2~4位3個插入氨基酸KVI以及cob的I232V。
2.4 非編碼區(qū)
林麝肺成纖維細(xì)胞FMD-C1線粒體的非編碼區(qū)包含2 段,分別是D-loop (displacement-loop region) 區(qū)和OL (origin of L-strandreplicationregion)區(qū)。其中D-loop區(qū)位于trnP和trnF之間,共922 bp。統(tǒng)計兩段非編碼區(qū)的突變位點發(fā)現(xiàn),OL區(qū)在林麝線粒體中無突變發(fā)生。D-loop區(qū)的堿基位點突變情況如圖4所示,出現(xiàn)差異的90個堿基中,大部分突變發(fā)生在登錄號為KY792714的林麝上,且同源樹顯示6條D-loop序列形成以KY792714和其余序列的兩個分支。在其余5條序列中,則僅有30個位點出現(xiàn)堿基不一致的情況,其中FMD-C1的單一突變占19個,并在149~150 bp出現(xiàn)2個堿基缺失。
2.5 線粒體基因組系統(tǒng)進(jìn)化分析
系統(tǒng)發(fā)育重建結(jié)果如圖5所示,該進(jìn)化樹由兩個大分支構(gòu)成,蘇門答臘猩猩單獨形成一個分支,在進(jìn)化樹上與林麝的親緣關(guān)系最遠(yuǎn)。同科物種在進(jìn)化樹上聚類。5條林麝mtDNA序列于進(jìn)化樹頂部聚類,與安徽麝共同組成一個分支,而登錄號為KY792714的林麝與喜馬拉雅麝等處于同一分支,置信度均為100。根據(jù)聚類情況可知與FMD-C1親緣關(guān)系最近的物種是安徽麝。
3 討? 論
mtDNA常常被作為遺傳多樣性分析的工具和相關(guān)疾病的分子標(biāo)記。隨著高通量測序技術(shù)的快速發(fā)展,其應(yīng)用范圍在林麝基因組學(xué)的研究中也越來越廣。本研究通過高通量測序獲得林麝肺成纖維細(xì)胞線粒體FMD-C1的全基因組序列。該序列為雙鏈環(huán)狀閉合分子,包含37個基因,基因排列順序與其余林麝完全一致,總體堿基含量呈現(xiàn)出AT偏好,這可能與自然突變和選擇壓力等原因有關(guān)[6,13]。22個tRNA中,除trnS1外均能形成典型的三葉草結(jié)構(gòu)。兩個rRNA(rrnS和rrnL)均為單拷貝,基因內(nèi)部無間隔區(qū),也符合后生動物的特征[6]。
研究證實,線粒體損傷與炎癥性疾病和自身免疫性疾病的發(fā)生有關(guān),異常線粒體特征如mtDNA突變的發(fā)生率增加等也是導(dǎo)致多種肺部疾病的重要原因[8,14-15]。mtDNA的改變不僅可以作為獨立的病理過程,而且還可以與現(xiàn)有的病理機制協(xié)同作用,從而誘發(fā)、促進(jìn)或加劇肺部疾病[8]。Gazdhar等[16]的研究證明,mtDNA突變在肺纖維化過程中累積,成為ROS和隨后纖維化的重要驅(qū)動因素,而ROS釋放增加反過來繼續(xù)損害mtDNA。且由于其不包含內(nèi)含子或組蛋白,靠近ROS的產(chǎn)生位點和復(fù)制遵循不對稱分裂等特點,mtDNA比核DNA更容易受到損傷,突變率高出10~20倍[15,17]。低效的氧化磷酸化(oxidative phosphorylation,OXPHOS)易引起ROS的產(chǎn)生,mtDNA編碼的13種蛋白質(zhì)均與OXPHO有關(guān),因此本研究對13個PCGs進(jìn)行單氨基酸突變分析[18]。從結(jié)果來看,不同功能的PCGs的堿基組成和選擇壓力不同。登錄號為KY792714的林麝氨基酸差異率高,與其余林麝呈現(xiàn)顯著異常,因此應(yīng)除去該條序列進(jìn)行討論。與其余林麝P(guān)CGs編碼蛋白對比,F(xiàn)MD-C1在nad1、nad2、nad5和cob中檢測出單氨基酸突變,內(nèi)容均為I與V、M與T之間的替換,經(jīng)預(yù)測對蛋白質(zhì)結(jié)構(gòu)無明顯影響,跨膜蛋白的分布也與其余序列一致,因此在FMD-C1的mtDNA中未檢出引起PCGs明顯功能障礙的突變位點。
目前,麝的分類仍在探討中,早期麝科動物的分類主要依據(jù)外形、地理分布和解剖學(xué)特征,此后一些學(xué)者結(jié)合單基因序列比較來對麝科動物的系統(tǒng)分類進(jìn)行研究,但研究結(jié)果仍存在差異,如彭紅元等[10]提出,麝科動物的分類還存在著喜馬拉雅麝和安徽麝等是不是有效種的爭議。隨著分子生物學(xué)技術(shù)的發(fā)展,借助于mtDNA可以提高線粒體遺傳樹和物種樹之間的一致性概率。線粒體中的非編碼區(qū)在調(diào)節(jié)線粒體DNA 復(fù)制和轉(zhuǎn)錄中起到非常重要的作用,該區(qū)域由于不編碼基因,可以容納和積累堿基突變[19-20]。非編碼區(qū)一般包括兩段,其中D-loop 區(qū)突變速率快且多態(tài)性豐富,因此在生物的遺傳多樣性和起源進(jìn)化研究中具有重要意義。從D-loop區(qū)的堿基突變情況來看,與PCGs相同,大部分突變發(fā)生在登錄號為KY792714的林麝上。除去該條序列,F(xiàn)MD-C1的該區(qū)域也存在著較為豐富的變異,有一定的遺傳多樣性。而登錄號為EU043465和NC_012694的林麝D-loop區(qū)序列完全一致,可見兩個種群間基因交流較多。
但實際上,單基因系統(tǒng)發(fā)育通常與涉及多個數(shù)據(jù)集的研究有很大不同,因此,完整的mtDNA逐漸被用于構(gòu)建可靠的系統(tǒng)發(fā)育,以確定具有準(zhǔn)確時間尺度的物種或更高分類群之間的進(jìn)化關(guān)系[21]。本研究的系統(tǒng)進(jìn)化樹展示了明確的分類關(guān)系,鼷鹿相對于其他反芻動物依然占據(jù)基礎(chǔ)位置,這與Hassanin等[22]的研究相同,不同的是麝科更靠近鹿科而不是???。本研究中,林麝與安徽麝的親緣關(guān)系相近,這與Pan等[12]的研究一致。而對于登錄號為KY792714的林麝線粒體mtDNA與喜馬拉雅麝等聚類更近的情況,結(jié)合與其余林麝P(guān)CGs的氨基酸差異比較和D-loop區(qū)堿基突變位點分析結(jié)果,推測是該麝在分類時方法選擇不同或是未鑒定的雜交個體,建議根據(jù)核基因組分析重新判斷其作為林麝mtDNA的可靠性[23]。
結(jié)合線粒體基因組研究的意義,本研究結(jié)果為林麝的遺傳多樣性保護(hù)與育種提供了參考依據(jù)。同時也為進(jìn)一步探討林麝肺部疾病線粒體水平的致病機制奠定基礎(chǔ)。
參考文獻(xiàn) Reference:
[1] 楊 威,伍 茜,程建國,等. 林麝干擾素α基因克隆、表達(dá)及轉(zhuǎn)錄調(diào)控分析[J]. 生物技術(shù)通報,2022,38(1):21-31.
YANG W,WU X,CHENG J G,et al. Cloning,expression and transcriptional regulation of interferon-α in forest musk deer[J].Biotechnology Bulletin,2021,38(1):1-11.
[2] 王 霞,袁旭東,周洪艷,等. 重慶金佛山國家級自然保護(hù)區(qū)林麝(Moschus berezovskii)種群數(shù)量初步調(diào)查及地理分布[J]. 中國農(nóng)學(xué)通報,2022,38(1):21-31.
WANG X,YUAN X D,ZHOU H Y,et al. Moschus berezovskii in Chongqing Jinfo Mountain national nature reserve:population size and geographical distribution[J]. Chinese Agricultural Science Bulletin,2020,36(19):44-47.
[3] 伍 茜,李雄婕,喻 東,等. 林麝源支氣管敗血波氏桿菌FMDBb1株的分離鑒定及全基因組序列分析[J]. 微生物學(xué)通報,2021,48(12):4731-4741.
WU X,LI X J,YU D,et al. Isolation,identification and whole-genome analysis of? Bordetella bronchiseptica FMDBb1 from forest musk deer (Moschus berezovskii)[J].Microbiology China,2021,48(12):4731-4741.
[4] 劉春燕. 林麝Moschus berezovskii養(yǎng)殖種群死亡原因及其生命生理特征研究[D]. 上海:華東師范大學(xué),2008.
LIU CH Y. A study on reasons of death and physiological features for breeding forest musk deer(Moschus berezovskii)[D]. Shanghai:East China Normal University,2008.
[5] 侯俊秀. 冬蟲夏草菌的線粒體基因組測序及比較線粒體基因組學(xué)研究[D]. 太原:山西大學(xué),2016.
HOU J X. Asssembly of the mitochondrial genome of Ophiocordyceps sinensis and its comparative genomic analysis[D]. Taiyuan:Shanxi University,2016.
[6] 劉 凱,馮曉宇,馬恒甲,等. 錢塘江三角魴線粒體基因組測序及其結(jié)構(gòu)特征分析[J]. 浙江農(nóng)業(yè)學(xué)報,2020,32(9):1591-1608.
LIU K,F(xiàn)ENG X Y,MA H J,et al. Complete sequence and gene organization of mitochondrial genome of Megalobrama terminalis from Qiantang River[J]. Acta Agriculturae Zhejiangensis,2020,32(9):1591-1608.
[7] KRAMER P,BRESSAN P. Our(mothers) mitochondria and our mind[J]. Perspectives on Psychological Science,2018,13(1):88-100.
[8] CLOONAN S M,CHOI A M. Mitochondria in lung disease[J]. The Journal of Clinical Investigation,2016,126(3):809-820.
[9] ARAVAMUDAN B,THOMPSON M A,PABELICK C M,et al. Mitochondria in lung diseases[J]. Expert Review of Respiratory Medicine,2013,7(6):631-646.
[10] 彭紅元,陳偉才,張修月. 麝的分類研究概述[J]. 玉林師范學(xué)院學(xué)報,2010,31(02):66-72.
PENG H Y,CHEN W C,ZHANG X Y. A review on the classification of musk deer[J]. Journal of Yulin Normal University (Natural Science),2010,31(2):66-72.
[11] 竭 航,鄭程莉,王建明,等. 林麝分子遺傳學(xué)研究進(jìn)展[J]. 中國中藥雜志,2015,40(22):4319-4323.
JIE H,ZHENG CH L,WANG J M,et al. Research progress on molecular genetics of forest musk deer[J]. China Journal of Chinese Materia Medica,2015,40(22):4319-4323.
[12] PAN T,WANG H,HU C,et al. Species delimitation in the genus moschus (ruminantia:Moschidae) and its high-plateau origin[J]. Plos One,2015,10(8):e134183.
[13] 夏立萍,徐 鳴,郭寶英,等. 等邊淺蛤線粒體全基因組測序和系統(tǒng)發(fā)育研究[J]. 浙江海洋大學(xué)學(xué)報(自然科學(xué)版),2021,40(2):93-100.
XIA L P,XU M,GUO B Y,et al. Complete mitochondrial genome sequencing and phylogeny analysis of macridiscus multifarius[J].Journal of Zhejiang Ocean University (Natural Science),2021,40(2):93-100.
[14] RILEY J S,TAIT S W. Mitochondrial DNA in inflammation and immunity[J].EMBO Reports,2020,21(4):e49799.
[15] ANNESLEY S J,F(xiàn)ISHER P R. Mitochondria in health and disease[J].Cells,2019,8(7):680.
[16] GAZDHAR A,LEBRECHT D,ROTH M,et al. Time-dependent and somatically acquired mitochondrial DNA mutagenesis and respiratory chain dysfunction in a scleroderma model of lung fibrosis[J].Science Report,2014,4:5336.
[17] SON J M,LEE C. Mitochondria:multifaceted regulators of aging[J].BMB Reports,2019,52(1):13-23.
[18] SINGH A,KUKRETI R,SASO L,et al. Oxidative stress:a key modulator in neurodegenerative diseases[J].Molecules,2019,24(8):1583.
[19] 張惠鋒,王華偉,謝振榮,等. 結(jié)直腸癌患者瘤內(nèi)線粒體DNA非編碼區(qū)突變異質(zhì)性研究[J]. 中華腫瘤防治雜志,2019,26(7):473-478.
ZHANG H F,WANG H W,XIE ZH R,et al. Intratumoralheterogeneity of non coding region of mitochondria DNA in patients with colorectal cancer[J]. Chinese Journal of Cancer Prevention and Treatment,2019,26(7):473-478.
[20] 于 萍,曹 婷,趙春萍,等. 五指山豬線粒體基因組全序列測定與分析[J]. 西北農(nóng)業(yè)學(xué)報,2015,24(7):16-22.
YU P,CAO T,ZHAO CH? P,et al. Complete mitochondrial genome sequence and analysis of wuzhishan pig[J]. Acta Agriculturae Boreali-occidentalis Sinica,2015,24(7):16-22.
[21] 肖 帆,張利平,朗 俠,等. 不同品種綿羊D-loop區(qū)遺傳多樣性研究[J]. 西北農(nóng)業(yè)學(xué)報,2021,30(8):1122-1129.
XIAO F,ZHANG L P,LANG X,et al. Genetic diversity of mitochondrial DNA D-loop region in different breeds of sheep[J]. Acta Agriculturae Boreali-occidentalis Sinica,2021,30(8):1122-1129.
[22] HASSANIN A,DOUZERY E J. Molecular and morphological phylogenies of ruminantia and the alternative position of the moschidae[J].Systematic Biology,2003,52(2):206-228.
[23] YANG C,WANG W F,DU X J,et al. Mitochondrial genome of captive Alpine musk deer,Moschus chrysogaster (Moschidae),and phylogenetic analyses with its coordinal species[J]. Mitochondrial DNA. Part B,Resources,2021,6(2):598-600.
Abstract Moschus berezovskii(FMD) is a kind of nationally protected species with high value. In order to further study the structural characteristics and genetic variation of mitochondrial genome of FMD,the whole-genome of FMD-C1 mitochondria from FMD fibroblasts was sequenced based on Illumina novaseq platform. Then its? features were annotated. Structure prediction,sequence analysis and systematic development reconstruction were carried out. The results showed the length of whole-genome sequence was 16 351 bp. With obvious AT preference,there were 13 protein coding genes (PCGs),22 tRNAs,2 rRNAs and two non-coding regions. The sequence was submitted to GenBank and the accession number MW879208 was obtained. Compared with other FMD mitochondrial whole-genome sequences of NCBI,5 single amino acid mutations and 3 inserted amino acids were detected in 4 PCGs of FMD-C1; 19 differential bases and 2 bases deletion were detected in D-loop region. Phylogenetic analysis showed that moschus anhuiensis was the closest relative to FMD.The results provided a reference for the breeding and genetic diversity protection of FMD,and also laid a foundation for further exploring the pathogenic mechanism of mitochondrial level of lung diseases in FMD.
Key words Moschus berezovskii; Mitochondrial DNA; Protein coding gene; Non-coding region; Phylogeny