国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

球花石斛(Dendrobium thyrsiflorum)葉綠體基因組特征及親緣關(guān)系解析

2021-06-23 07:55:30朱斌甘晨晨王洪程
生物技術(shù)通報(bào) 2021年5期
關(guān)鍵詞:球花密碼子葉綠體

朱斌 甘晨晨 王洪程

(貴州師范大學(xué)生命科學(xué)學(xué)院,貴陽(yáng) 550001)

球花石斛(Dendrobium thyrsiflorum)為蘭科(Orchidaceae)石斛屬(Dendrobium)植物,主要分布在我國(guó)云南地區(qū),以及亞洲中南半島的部分國(guó)家[1],因其花序呈“松果狀”而得名。研究證實(shí)球花石斛藥用價(jià)值很高,具有抗凝血、降血壓、緩解多種慢性疾病等功效[2-3],其藥用成分主要為香豆素、黃酮、聯(lián)芐類(lèi)等化合物[2]。此外,球花石斛花型優(yōu)美,花期較長(zhǎng),色彩艷麗,也被用作庭院、室內(nèi)造景。近年來(lái),由于石斛市場(chǎng)的需求膨脹,導(dǎo)致野生球花石斛資源急劇減少,其遺傳多樣性的保護(hù)亟需加強(qiáng),而且,球花石斛在石斛屬內(nèi)的分類(lèi)地位亦不明晰。目前,關(guān)于球花石斛的研究多為藥理成分的發(fā)掘,提取工藝的優(yōu)化,鮮有涉及球花石斛基因組或者細(xì)胞質(zhì)基因組的研究。

高等植物中,葉綠體(chloroplast,CP)擁有獨(dú)立遺傳的遺傳物質(zhì),即葉綠體基因組。與核基因組相比,葉綠體基因組(chloroplast genome)依賴(lài)于母系遺傳,在基因組成及基因排列方面較為保守[5]。大多數(shù)植物的葉綠體基因組呈現(xiàn)典型的四分結(jié)構(gòu),大小在120 kb-160 kb之間,包含110-130個(gè)基因[6]。此外,葉綠體基因組的堿基替代率、基因組結(jié)構(gòu)重排事件要遠(yuǎn)低于核基因組,使得葉綠體基因組成為探究物種遺傳進(jìn)化、譜系關(guān)系的理想工具[7-9]。特別是近些年,隨著測(cè)序技術(shù)的發(fā)展,測(cè)序成本大幅度降低,越來(lái)越多的植物細(xì)胞質(zhì)基因組被解析出來(lái)。目前在公共數(shù)據(jù)庫(kù)National Center for Biotechnology Information(https://www.ncbi.nlm.nih.gov/,NCBI)中,可查詢(xún)到的石斛葉綠體基因組已達(dá)數(shù)十個(gè),但相關(guān)研究多數(shù)以短報(bào)道為主,有關(guān)石斛葉綠體基因組特征的系統(tǒng)研究較少。

本研究整合二代、三代測(cè)序數(shù)據(jù),從頭組裝(de novo)了球花石斛的完整葉綠體基因組,并詳細(xì)解析了該葉綠體基因組的特征,隨后基于共有編碼基因序列(CDs)對(duì)石斛進(jìn)行系統(tǒng)進(jìn)化分析,將所選石斛種類(lèi)分為9大類(lèi)群,并證實(shí)球花石斛與霍山石斛親緣關(guān)系最為密切。本研究結(jié)果闡明了球花石斛的葉綠體基因組特征,有望為其資源篩選、鑒定以及遺傳多樣性分析提供分子依據(jù)。

1 材料與方法

1.1 材料

球花石斛采自于云南省普洱市景東彝族自治縣(100°22′12′′ E,23°56′26′′ N),隨后種植于貴州師范大學(xué)生命科學(xué)學(xué)院溫光培養(yǎng)室。

1.2 方法

1.2.1 葉綠體DNA提取 大約5 g的幼嫩葉片用于DNA的提取。為減少核DNA的污染,采用柱式葉綠體提取試劑盒(北京百奧萊博)進(jìn)行葉綠體DNA的提取。所提DNA經(jīng)瓊脂糖凝膠檢測(cè)合格后,用干冰寄送于上海林恩生物有限公司進(jìn)行建庫(kù)及測(cè)序分析。

1.2.2 文庫(kù)的構(gòu)建及基因組組裝 二代測(cè)序主要采用Illumina TruSeqTMNano DNA Sample Prep Kit方法構(gòu)建文庫(kù),文庫(kù)的DNA插入片段大約為450 bp,采用Illumina HiSeq X Ten平臺(tái)進(jìn)行測(cè)序;三代測(cè)序采用PacBio RS II DNA Template Preparation Kit方法構(gòu)建文庫(kù),文庫(kù)的DNA插入片段大約為20 kb,采用PacBio Sequel測(cè)序平臺(tái)進(jìn)行測(cè)序。

Illumina平臺(tái)產(chǎn)生的是150 bp的雙端reads,隨后過(guò)濾測(cè)序質(zhì)量值低的reads,并去除接頭,獲得高質(zhì)量的clean data。隨后clean data比對(duì)到近緣物種齒瓣石斛(D.devonianum)的葉綠體基因組(NC_035325),篩選出葉綠體基因組相關(guān)reads。隨后以軟件SOAP denovo v2.04(http://soap.genomics.org.cn/soapdenovo.html)將上述reads拼接成scaffolds,K-mer值為51。篩選長(zhǎng)度不低于500 bp及質(zhì)量不低于0.8的三代reads(PacBio subreads),隨后通過(guò)PacBioToCA軟件基于二代clean reads對(duì)過(guò)濾后的三代reads進(jìn)行修正,去除單堿基的插入及缺失,軟件參數(shù)為默認(rèn)參數(shù)[10]。最后通過(guò)修正后的三代 reads以軟件 PBjelly[11](https://sourceforge.net/projects/pb-jelly/)完成scaffolds的間隔序列拼接。此外,采用人工比對(duì)近緣物種更正組裝出現(xiàn)的移碼突變錯(cuò)誤。

1.2.3 葉綠體基因組注釋 球花石斛的葉綠體基因組編碼基因及非編碼基因通過(guò)軟件Dual Organellar GenoMe Annotator[12](DOGMA,http ://dogma.ccbb.utexas.edu/)完成注釋?zhuān)瑓?shù)設(shè)置為默認(rèn)。其中編碼基因的內(nèi)含子與外顯子的邊界序列通過(guò)人工進(jìn)行修正,而tRNA 通過(guò)軟件tRNAscan-SE 1.23(http://lowelab.ucsc.edu/tRNAscan-SE/)進(jìn)行檢驗(yàn)。最終通過(guò)軟件OGDraw v1.2繪制完整的葉綠體基因組。球花石斛的完整葉綠體基因組數(shù)據(jù)上傳GenBank數(shù)據(jù)庫(kù),訪問(wèn)號(hào)為MN413199。

1.2.4 SSR位點(diǎn)及密碼子偏好性檢測(cè) 采用MISA軟 件(https://webblast.ipk-gatersleben.de/misa/)檢測(cè)球花石斛葉綠體基因組的SSR(simple sequence repeat)位點(diǎn),參數(shù)設(shè)置為單堿基重復(fù)10以上,二堿基重復(fù)5以上,三堿基重復(fù)4以上,四堿基、五堿基、六堿基的重復(fù)3以上。球花石斛葉綠體基因組編碼基因密碼子偏好性分析,使用軟件CodonW1.4.2(https://www.softpedia.com/get/Science-CAD/CodonW.shtml),參數(shù)設(shè)置為默認(rèn)。

1.2.5 葉綠體基因組比較 為了深入比較石斛屬植物葉綠體組的差異,基于系統(tǒng)發(fā)育結(jié)果,從不同類(lèi)群中選取5個(gè)有代表性的石斛葉綠體基因組與球花石斛基因組進(jìn)行比較,主要比較所含基因的增減,邊界序列的差異,其中邊界序列的差異通過(guò)軟件IRscope(https://irscope.shinyapps.io/irapp/)進(jìn)行可視化,數(shù)據(jù)來(lái)源為GenBank。

1.2.6 基于葉綠體基因組的系統(tǒng)發(fā)育分析 為探究球花石斛與其它石斛屬植物的親緣關(guān)系,從NCBI數(shù)據(jù)庫(kù)中下載了26種石斛(表1)的葉綠體基因組,提取共有基因的CDS序列,以MEGA7軟件構(gòu)建進(jìn)化樹(shù),使用的建樹(shù)方法為最大似然法(maximum likelihood),基于Tamura-Nei 模型建樹(shù),同時(shí)設(shè)置1000次重復(fù)保證進(jìn)化樹(shù)的穩(wěn)定性。

2 結(jié)果

2.1 球花石斛的葉綠體基因組特征

通過(guò)高通量測(cè)序,我們共獲得了31 967 786個(gè)二代測(cè)序reads,以及12 144個(gè)平均讀長(zhǎng)為4 874 bp的三代reads。質(zhì)控之后,有效的二代、三代reads數(shù)分別為25 713 108、12 144。隨后基于這些數(shù)據(jù)從頭組裝了球花石斛的葉綠體基因組。球花石斛的葉綠體基因組全長(zhǎng)為151 686 bp,呈典型的四分結(jié)構(gòu),其長(zhǎng)編碼區(qū)(LSC)長(zhǎng)84 749 bp,短編碼區(qū)(SSC)長(zhǎng)14 351 bp,反向重復(fù)區(qū)(IR)長(zhǎng)26 293 bp。其中IR區(qū)序列的GC含量最高(43.43%),SSC區(qū)的GC含量最低(30.44%),全基因組的平均GC含量為37.55%。該葉綠體基因組一共組裝了106個(gè)unigenes,其中編碼基因?yàn)?1個(gè),tRNA為31個(gè),rRNA為4個(gè)。所組裝的基因中位于LSC區(qū)的基因有78個(gè),SSC區(qū)的基因有8個(gè),IR區(qū)的基因有18個(gè)(圖1)。共有19個(gè)基因?yàn)殡p拷貝基因,包含6個(gè)蛋白編碼基因、9個(gè)tRNA及4個(gè)rRNA(表1)。

在所組裝的基因中含有一個(gè)內(nèi)含子序列的基因有14個(gè),含有兩個(gè)內(nèi)含子序列的基因3個(gè),其余基因均不含內(nèi)含子序列。隨后對(duì)組裝的基因進(jìn)行注釋?zhuān)谢蚓⑨尩交蚬δ埽ū?),其中37個(gè)基因參與了光合作用的各個(gè)途徑,所有的非編碼基因,以及大多數(shù)的rpl、rps基因參與了葉綠體的自我復(fù)制,此外,ycf類(lèi)基因并未注釋到具體功能,通常認(rèn)為該類(lèi)基因具有較快的進(jìn)化速率,推動(dòng)了基因組的分化[13]。

表1 球花石斛葉綠體基因組的詳細(xì)特征Table 1 Detail chracteristics of the complete cp genome of D.thyrsiflorum

2.2 球花石斛葉綠體基因組SSR位點(diǎn)

通過(guò)MISA軟件,在球花石斛葉綠體基因組中檢測(cè)到17種類(lèi)型的共58個(gè)SSR位點(diǎn),其中包含復(fù)合4個(gè)SSR(兩個(gè)SSR序列間距小于100 bp)位點(diǎn)(表3)。在這些SSR位點(diǎn)中,最為豐富的是單堿基重復(fù),有4種類(lèi)型共35(60.34%)個(gè)SSR位點(diǎn),以A/T類(lèi)型為主;其次兩堿基重復(fù)有3種類(lèi)型(AT/TA/GA)12(20.69%)個(gè);三堿基重復(fù)為兩種類(lèi)型(TAT/ATA)2個(gè);而四堿基重復(fù)含5種類(lèi)型(AGAA/AGAT/ATTA/TTCT/GTCT)6個(gè);五堿基(ATATG)、六堿基(CCATCT)各1個(gè)。最長(zhǎng)的SSR序列為六堿基重復(fù),大小為18 bp。

圖1 球花石斛葉綠體基因組基因分布圖Fig.1 Genes distribution of D.thyrsiflorum cp genome

2.3 球花石斛葉綠體基因組密碼子偏好性分析

通過(guò)密碼子偏好性分析發(fā)現(xiàn),球花石斛的葉綠體基因組編碼序列共編碼23 747個(gè)氨基酸(含終止密碼子)(表4),其中使用比例最高的是亮氨酸(Leu),共檢測(cè)到2 410(10.15%)個(gè),其次為異亮氨酸(Ile),共檢測(cè)到1 959(8.25%)個(gè);使用頻率最低的為半胱氨酸(Cys),數(shù)目?jī)H為279(1.17%)個(gè)。隨后我們檢測(cè)了編碼各氨基酸的密碼子相對(duì)使用頻率(relative synonymous codon usage,RSCU),在64種密碼子種,偏好性密碼子(RSCU>1)有31(48.44%)個(gè)。偏好使用的密碼子中,除編碼亮氨酸的密碼子UUG外,其余均以A/U結(jié)尾。偏好性最強(qiáng)的密碼子為編碼精氨酸(Arg)的AGA,RSCU值為1.94。

2.4 六種石斛葉綠體基因組比較分析

為了深入比較不同種石斛的葉綠體基因組差異,基于聚類(lèi)結(jié)果選取了來(lái)自不同類(lèi)群的5個(gè)葉綠體基因組與球花石斛葉綠體基因組進(jìn)行比較(圖3,表5)。這5個(gè)石斛物種分別為矮石斛(D.bellatulum)、玫瑰石斛(D.crepidatum)、齒瓣石斛(D.devonianum)、反瓣石斛(D.ellipsophyllum)以及霍山石斛(D.huoshanense)。如表5所示,所選6種石斛的葉綠體基因組大小相似,差異范圍僅在1.5 kb以?xún)?nèi)(151 686-153 188 bp),但在部分基因組在四分結(jié)構(gòu)上差異明顯。例如,玫瑰石斛的LSC區(qū)要超出其它基因組近30 kb,而IR區(qū)僅有其它基因組的一半大小。此外,6種石斛的基因含量也不盡相同,相較于其它5個(gè)基因組,球花石斛葉綠體基因組沒(méi)有注釋到基因ndhD、ndhE、ndhF、ndhG、ndhH、及psbN,但球花石斛所注釋基因增加bpf1。相較于玫瑰石斛、齒瓣石斛、及反瓣石斛,其它3個(gè)石斛葉綠體基因組減少了一個(gè)ycf1的拷貝。

表2 球花石斛葉綠體基因組基因功能總結(jié)Table 2 Summary of assembled gene functions of D.thyrsiflorum cp genome

表3 球花石斛葉綠體基因組SSR位點(diǎn)類(lèi)型及數(shù)目Table 3 Summary of simple sequence repeats in D.thyrsiflorum cp genome

為進(jìn)一步解析所選石斛的葉綠體基因組結(jié)構(gòu)差異,比較了這6個(gè)種的邊界區(qū)域(圖2)。整體而言,所選6種石斛葉綠體基因組的邊界序列均不保守,出現(xiàn)了不同程度的變異,其中以IRb/SSC、IRa/LSC區(qū)域變異幅度較大。例如,對(duì)于IRb/SSC區(qū),玫瑰石斛、齒瓣石斛、反瓣石斛的IRb/SSC區(qū)均位于基因ycf1和ndhF之間,而矮石斛及霍山石斛的IRb/SSC區(qū)僅存在其中一個(gè)基因,球花石斛的IRb/SSC區(qū)兩個(gè)基因均消失。6種石斛葉綠體基因組中SSC/IRa區(qū)最為保守,除霍山石斛外(ndhF橫跨區(qū)間),均為基因ycf1橫跨區(qū)間兩側(cè),且僅有數(shù)個(gè)堿基的差異。

2.5 基于葉綠體基因組的石斛親緣關(guān)系分析

在所選的27個(gè)石斛葉綠體中,提取了60個(gè)共有CDs序列,用以構(gòu)建石斛的親緣關(guān)系。如圖3所示,27個(gè)石斛材料共形成了24個(gè)分支,支持率超過(guò)50%的有23個(gè)分支,其中球花石斛與霍山石斛聚為一類(lèi)(100%),證實(shí)兩者親緣關(guān)系最為緊密。根據(jù)聚類(lèi)結(jié)果,可以將所選石斛種類(lèi)歸為9個(gè)大類(lèi),其中球花石斛、霍山石斛、梵凈山石斛(D.fanjingshanense)、細(xì)莖石斛(D.moniliforme)、金釵石斛(D.nobile)及重唇石斛(D.hercoglossum)構(gòu)成了第一大類(lèi)(I)。此外疊鞘石斛(D.denneanum)及流蘇石斛(D.fimbriatum)與其它石斛親緣關(guān)系較遠(yuǎn),形成了外類(lèi)群體(IX)。

3 討論

不論是核基因組還是葉綠體基因組均富含SSR位點(diǎn)[4],而SSR位點(diǎn)可被用于遺傳多樣性分析,物種鑒別,連鎖作圖,及分子標(biāo)記輔助選擇育種等方面[14-15]。我們?cè)谇蚧ㄊ~綠體基因組中共檢測(cè)到58個(gè)SSR位點(diǎn),與細(xì)莖石斛[16]檢測(cè)到的SSR位點(diǎn)(53個(gè)SSR位點(diǎn))數(shù)目相當(dāng),且A/T單堿基均占優(yōu);然而,除單堿基、二堿基重復(fù)外,兩者在其余堿基重復(fù)的類(lèi)型及數(shù)目上均有較大差異,例如在細(xì)莖石斛中檢測(cè)到的三堿基重復(fù)類(lèi)型為AAT/ATT,而在球花石斛中為T(mén)AT/ATA,且細(xì)莖石斛中并未有六堿基重復(fù)的SSR類(lèi)型,證實(shí)石斛種間葉綠體基因組的SSR多態(tài)性廣泛,基于葉綠體SSR位點(diǎn)開(kāi)發(fā)的標(biāo)記可用作種類(lèi)的鑒別。

通常來(lái)講,同屬(科)植物的葉綠體基因組高度保守[9,17]。然而,我們通過(guò)對(duì)選取的6種石斛葉綠體基因組進(jìn)行比較,發(fā)現(xiàn)這6種石斛葉綠體基因組除基因組全長(zhǎng)外,在四分結(jié)構(gòu)、基因構(gòu)成、及邊界序列上均存在明顯的差異。例如,玫瑰石斛具有一個(gè)較長(zhǎng)的LSC區(qū)及縮小版的IR區(qū);球花石斛相較于其他5種石斛,缺失了基因ndhD、ndhE、ndhF、ndhG、ndhH、及psbN,增加了基因bpf1。研究認(rèn)為葉綠體基因組邊界區(qū)域的變異是導(dǎo)致葉綠體基因組結(jié)構(gòu)變異的主要驅(qū)動(dòng)力[18]。在所選的6種石斛中,其邊界區(qū)域存在明顯的差異,即使是通常認(rèn)為比較保守的SSC/IRa區(qū)域,在所選石斛中也出現(xiàn)明顯的差異。種種跡象表明,石斛植物可能并非是單一起源。

表4 球花石斛葉綠體基因組密碼子使用及氨基酸類(lèi)型統(tǒng)計(jì)Table.4 Summary of codon usage and amino acids patterns of D.thyrsiflorum cp genome

續(xù)表 Continued

表5 六種石斛葉綠體基因組特征比較Table 5 Comparison of six chloroplast genomes of Dendrobium species

石斛屬植物分布約1 500種,我國(guó)分布近80種[19],部分石斛在種間表型相似,生境相同,同時(shí)可發(fā)生種間雜交[20],使得其親緣關(guān)系復(fù)雜,難以鑒別。由于葉綠體基因組為母系傳遞,堿基替代率,基因組結(jié)構(gòu)重排事件要遠(yuǎn)低于核基因組,使得葉綠體基因組成為了探究物種遺傳進(jìn)化、譜系關(guān)系的理想工具[7-9]。隨著測(cè)序成本的降低,越來(lái)越多的石斛葉綠體基因組被獲得,這也使得基于葉綠體基因組探究石斛親緣關(guān)系成為可能。本研究基于27種石斛葉綠體基因組的共有CDs序列將所選石斛分為9大類(lèi),其中球花石斛與霍山石斛、梵凈山石斛、細(xì)莖石斛、金釵石斛及重唇石斛聚為一大類(lèi)。該結(jié)果與武立偉等[18]在細(xì)莖石斛中的研究結(jié)果一致,證實(shí)了葉綠體基因組在解析石斛親緣關(guān)系上的可靠性。

圖2 六個(gè)石斛葉綠體基因組邊界序列及接頭附近基因的分析Fig.2 Analysis of the boundaries of LSC/SSC/IR and adjacent genes among six Dendrobium cp genomes

圖3 基于葉綠體基因組共有CDs序列的27個(gè)石斛親緣關(guān)系聚類(lèi)圖Fig.3 Phylogenetic analysis of 27 Dendrobium species based on the common CDs of selected cp genomes

4 結(jié)論

球花石斛葉綠體基因組全長(zhǎng)151 686 bp,包含106個(gè)unigenes,共檢測(cè)到58個(gè)SSR位點(diǎn),以單堿基重復(fù)A/T類(lèi)型為主。密碼子偏好性分析顯示,亮氨酸為使用頻率最高的氨基酸(10.15%),具有偏好性的密碼子有31個(gè),且絕大多數(shù)偏好性密碼子均以A/U結(jié)尾。系統(tǒng)進(jìn)化分析結(jié)果顯示,將所選石斛分為9大類(lèi)群,其中球花石斛與霍山石斛親緣關(guān)系密切。本研究的結(jié)果為今后石斛資源篩選、鑒定、保存,及遺傳多樣性分析提供了分子依據(jù)。

猜你喜歡
球花密碼子葉綠體
花光卉影
花卉(2021年21期)2021-11-11 02:57:46
外源處理對(duì)馬尾松雌雄球花量及抽梢的影響
密碼子與反密碼子的本質(zhì)與拓展
10種藏藥材ccmFN基因片段密碼子偏好性分析
中成藥(2018年7期)2018-08-04 06:04:10
南方紅豆杉葉綠體非編碼序列PCR體系優(yōu)化及引物篩選
馬尾松二代種子園無(wú)性系花量分析
嗜酸熱古菌病毒STSV2密碼子偏嗜性及其對(duì)dUTPase外源表達(dá)的影響
青海云杉無(wú)性系種子園雌雄球花空間分布與管理
茶樹(shù)葉綠體DNA的PCR-RFLP反應(yīng)體系優(yōu)化
煙草葉綠體密碼子的偏好性及聚類(lèi)分析
松潘县| 蕲春县| 德江县| 石屏县| 芦山县| 章丘市| 甘谷县| 台东县| 泗阳县| 荆州市| 宜川县| 双城市| 怀宁县| 应城市| 芒康县| 安多县| 沾益县| 镇原县| 边坝县| 中方县| 广德县| 鄂托克旗| 祁连县| 龙陵县| 白玉县| 兴城市| 连江县| 巴里| 雷山县| 上犹县| 库伦旗| 邵阳县| 类乌齐县| 泗阳县| 鹤壁市| 三穗县| 岫岩| 民丰县| 前郭尔| 广河县| 丹棱县|