范繼征 李秀玲 李明智 卜朝陽(yáng) 何荊洲 曾艷華
關(guān)鍵詞:秀麗兜蘭;葉綠體基因組;特征分析;系統(tǒng)發(fā)育分析
中圖分類(lèi)號(hào):S 682.31 文獻(xiàn)標(biāo)識(shí)碼:A
秀麗兜蘭[Paphiopedilum venustum (Wall. exSims) Pfitzer]隸屬于蘭科杓蘭亞科兜蘭屬,是第一個(gè)被人工栽培的兜蘭屬植物[1],主要分布于我國(guó)西藏東南部至南部,以及孟加拉國(guó)、不丹、印度東北部、尼泊爾等國(guó)家和地區(qū),野外花期1—3月[2]。秀麗兜蘭植株直立、叢生,株高7.0~9.0 cm,葉片數(shù)2~3 片,長(zhǎng)7.5~12.0 cm,寬2.5~3.5 cm,呈狹矩圓狀橢圓形,表面有網(wǎng)格斑,背面有密集的紫色斑點(diǎn), 花葶長(zhǎng)9.2~15.4 cm, 花朵橫徑5.4~8.6 cm,縱徑2.9~3.4 cm,花朵色澤艷麗,花期長(zhǎng),花和葉均極具觀賞價(jià)值。但由于人類(lèi)活動(dòng)以及自身生長(zhǎng)要求和生長(zhǎng)特點(diǎn)等原因,秀麗兜蘭已成為瀕危物種(EN),受到國(guó)際社會(huì)的嚴(yán)格保護(hù)[3-4]。
葉綠體是植物光合作用發(fā)生的細(xì)胞器,具有一套完整的基因組[5],與核基因組等其他基因組相比,葉綠體基因組具有高度的保守性以及自我復(fù)制機(jī)制、進(jìn)化相對(duì)獨(dú)立、基因組小、結(jié)構(gòu)穩(wěn)定、突變率低等特點(diǎn)[6-8]。隨著二代測(cè)序技術(shù)的飛速發(fā)展,通過(guò)測(cè)序組裝和注釋獲得的完整的葉綠體基因組序列成本降低、速度加快[9],葉綠體基因組也越來(lái)越多的為進(jìn)化分析、系統(tǒng)發(fā)育及分類(lèi)鑒定等提供信息[10]。目前有關(guān)葉綠體基因組特征分析已被廣泛應(yīng)用于多種兜蘭屬植物,有對(duì)單獨(dú)一個(gè)種進(jìn)行葉綠體基因組分析,例如白旗兜蘭(P. spicerianum)[11]、白花兜蘭(P. emersonii)[12]、格麗兜蘭(P. gratrixianum)[13]、麻栗坡兜蘭(P. malipoense)[14]、紫紋兜蘭(P. purpuratum)[15]、飄帶兜蘭(P.parishii)[16]、陳蓮兜蘭(P. tranlimianum)[17]等,也有對(duì)多個(gè)種進(jìn)行比較分析[18-19]?,F(xiàn)有研究結(jié)果表明兜蘭屬植物葉綠體基因組大小為154689~162 590 bp,其結(jié)構(gòu)與大多數(shù)陸生植物葉綠體結(jié)構(gòu)相似,為典型的四分結(jié)構(gòu),包括大單拷貝區(qū)(large single copy, LSC)、小單拷貝區(qū)(small singlecopy, SSC)和2 個(gè)反向重復(fù)區(qū)(inverted repeat,IR),各區(qū)GC 含量差異較大,其中IR 的GC 含量較高,不同的蛋白質(zhì)編碼在同義密碼子的使用上有所不同,偏好A 或U(T)結(jié)尾的密碼子。此外,系統(tǒng)發(fā)育分析打破了形態(tài)學(xué)和細(xì)胞學(xué)等的局限性,能夠更好地反映物種之間的親緣關(guān)系[11-19]。
有關(guān)秀麗兜蘭的研究多集中在非共生萌發(fā)和繁殖技術(shù)[20]、細(xì)胞學(xué)研究[21-23]、病害鑒定[24]、分布地區(qū)和生長(zhǎng)環(huán)境[25]等,尚無(wú)秀麗兜蘭葉綠體基因組的報(bào)道。本研究通過(guò)高通量測(cè)序方法獲得秀麗兜蘭完整的葉綠體基因組信息,對(duì)其進(jìn)行注釋?zhuān)?duì)基因組中序列重復(fù)、SSR 位點(diǎn)及蛋白編碼基因的密碼子使用偏好性進(jìn)行分析,同時(shí)分析了系統(tǒng)發(fā)育關(guān)系。本研究結(jié)果可為秀麗兜蘭及其他兜蘭屬植物種質(zhì)資源鑒定、系統(tǒng)發(fā)育、遺傳育種、種群恢復(fù)以及生物多樣性保護(hù)等提供理論依據(jù)。
1 材料與方法
1.1 材料
供試材料為遷地保存在廣西農(nóng)業(yè)科學(xué)院花卉研究所蘭科植物種質(zhì)資源圃(22°48′N(xiāo),108°22′E)的秀麗兜蘭,取長(zhǎng)勢(shì)良好、無(wú)病蟲(chóng)害的新鮮幼嫩葉片擦拭干凈,用液氮速凍后于?80 ℃保存?zhèn)溆谩?/p>
1.2 方法
1.2.1 DNA 提取、文庫(kù)構(gòu)建及測(cè)序 取葉片100 mg,采用改良CTAB 法[26]提取總DNA,樣品基因組DNA 質(zhì)量檢測(cè)合格后,用超聲波將合格的DNA 片段化,然后對(duì)片段化的DNA 進(jìn)行片段純化、末端修復(fù)、3′端加A、連接測(cè)序接頭,再用瓊脂糖凝膠電泳進(jìn)行片段大小選擇,進(jìn)行PCR擴(kuò)增形成測(cè)序文庫(kù),并進(jìn)行文庫(kù)質(zhì)檢,質(zhì)檢合格的文庫(kù)用BGISEQ-500 平臺(tái)進(jìn)行測(cè)序(廣州佰德生物科技有限公司)。
1.2.2 葉綠體基因組的組裝與注釋 對(duì)測(cè)序得到的原始數(shù)據(jù)(raw data)進(jìn)行數(shù)據(jù)過(guò)濾,去除其中的接頭序列及低質(zhì)量reads 獲得高質(zhì)量的cleandata。使用Bowtie2 v.2.3.4.3 軟件[27]比對(duì)近緣物種葉綠體基因組數(shù)據(jù)庫(kù),將比對(duì)上的reads 數(shù)量最多的3 個(gè)CDS 序列作為項(xiàng)目樣品的葉綠體基因組起始組裝序列,采用NOVOPlasty v4.2.1 軟件[28]組裝葉綠體基因組。利用GeSeq 和blast 軟件對(duì)葉綠體基因組CDS 序列進(jìn)行注釋?zhuān)⒗肎eSeq 和hmmer 軟件對(duì)葉綠體基因組rRNA序列進(jìn)行注釋?zhuān)褂胻RNAscan-SE 和ARAGORN軟件對(duì)葉綠體基因組tRNA 序列進(jìn)行注釋?zhuān)⑦M(jìn)行手動(dòng)調(diào)整和確認(rèn)獲得最終注釋結(jié)果,最后采用OrganellarGenomeDRAW軟件制作葉綠體基因組圖譜[29-35]。將組裝注釋好的秀麗兜蘭基因組序列上傳至Gen-Bank 數(shù)據(jù)庫(kù),獲得登錄號(hào):MZ150831。
1.2.3 葉綠體基因組SSR 分析 利用MISAv1.01(MIcroSAtellite identification tool)軟件對(duì)秀麗兜蘭進(jìn)行cpSSR 的分析[36]。參數(shù)設(shè)置為單核苷酸(mononucleotide)、二核苷酸(dinucleotide)、三核苷酸( trinucleotide)、四核苷酸(tetranucleotide)、五核苷酸(pentanucleotide)和六核苷酸(hexanucleotide)的重復(fù)數(shù)閾值分別為10、6、5、5、5 和5。
1.2.4 密碼子使用分析 計(jì)算秀麗兜蘭cpDNA 密碼子的使用情況和相對(duì)密碼子的偏好性(relativesynonymous codon usage, RSCU),RSCU 值則以1為限,若RSCU>1,該密碼子使用頻率較高;若RSCU<1,該密碼子使用頻率較低。
1.2.5 系統(tǒng)發(fā)育關(guān)系分析 從NCBI 數(shù)據(jù)庫(kù)中下載16 個(gè)兜蘭屬和2 個(gè)杓蘭屬植物,利用mafft 7.0軟件進(jìn)行cpDNA 序列比對(duì),使用fasttree2.1.10軟件建立系統(tǒng)發(fā)育樹(shù),選擇GTR+Gamma 模型,Shimodaira-Hasegawa 檢測(cè)[37-38]。
2 結(jié)果與分析
2.1 秀麗兜蘭葉綠體基因組的基本特征
秀麗兜蘭葉綠體基因組具有典型的環(huán)狀四分體結(jié)構(gòu),包括1 個(gè)大單拷貝區(qū)(large single-copyregion, LSC)、1 個(gè)小單拷貝區(qū)(small single-copyregion, SSC)和2 個(gè)反向重復(fù)區(qū)(IR),總長(zhǎng)度為158 298 bp,其中LSC、SSC 和2 個(gè)IR 長(zhǎng)度分別為87 775、949、34 787 bp,LSC、SSC 和IR 區(qū)域的GC 含量分別為32.6%、25.1%和39.1%。秀麗兜蘭葉綠體基因組共含129 個(gè)基因,包括79 個(gè)蛋白編碼基因,38 個(gè)tRNA 基因、8 個(gè)rRNA 基因和4 個(gè)假基因(2 個(gè)ndhD、1 個(gè)ndhJ、1 個(gè)ndhK),其中22 個(gè)完整的基因位于IR 重復(fù)區(qū),包括10個(gè)蛋白編碼基因,8 個(gè)tRNA 和4 個(gè)rRNA,1 個(gè)基因rpl22 位于LSC-IRB 連接處。IR 重復(fù)區(qū)域還含有1 個(gè)假基因ndhD 以及rps12 基因的第2 和第3 個(gè)外顯子,nps12 的第1 個(gè)外顯子位于LSC 區(qū)域(圖1)。秀麗兜蘭葉綠體基因組注釋基因信息見(jiàn)表1。
2.2 秀麗兜蘭葉綠體基因組簡(jiǎn)單序列重復(fù)
秀麗兜蘭葉綠體基因組簡(jiǎn)單序列重復(fù)(SSR)信息見(jiàn)表2,從中共鑒定出78 個(gè)SSR 位點(diǎn),未發(fā)現(xiàn)五核苷酸重復(fù),最豐富的是單核苷酸重復(fù),有66 個(gè),占總SSRs 的84.62%,其次是二核苷酸重復(fù)8 個(gè),占總SSRs 的10.26%,三核苷酸重復(fù)和四核苷酸重復(fù)均為1 個(gè),六核苷酸重復(fù)2 個(gè)。其中63 個(gè)單堿基重復(fù)都是由A 或T 構(gòu)成,因此,SSRs 的堿基組成偏向使用A/T 堿基。
2.3 秀麗兜蘭葉綠體基因組密碼子偏好性
秀麗兜蘭葉綠體基因組中各氨基酸的相對(duì)同義密碼子使用頻率(relative synonymous codeusage, RSCU)分析結(jié)果見(jiàn)圖2 和表3。從中可以看出,高頻密碼子(RSCU>1)共有32 個(gè),其中,16 個(gè)以U 結(jié)尾,13 個(gè)以A 結(jié)尾,以G 結(jié)尾的有2 個(gè),以C 結(jié)尾的密碼子有1 個(gè),說(shuō)明秀麗兜蘭葉綠體基因密碼子偏好性以U 和A 結(jié)尾,與較低的基因組和蛋白編碼基因GC 含量一致。
2.4 系統(tǒng)進(jìn)化分析
基于葉綠體基因組序列對(duì)18 個(gè)蘭科植物(含兜蘭屬物種16 個(gè)、近緣屬杓蘭屬物種2 個(gè))進(jìn)行系統(tǒng)發(fā)育分析,并構(gòu)建系統(tǒng)發(fā)育樹(shù)(圖3)。從圖中可以看出,18 個(gè)物種分為3 大類(lèi),其中,紫花杓蘭和西藏杓蘭與其他物種遺傳距離較遠(yuǎn),被單獨(dú)聚成一類(lèi);麻栗坡兜蘭、硬葉兜蘭等5 個(gè)物種均歸為一類(lèi),即寬瓣亞屬;秀麗兜蘭和帶葉兜蘭、紫紋兜蘭等11 個(gè)物種歸為一類(lèi),屬于兜蘭亞屬,且秀麗兜蘭與紫紋兜蘭關(guān)系最近。
3 討論
兜蘭是蘭科(Orchidaceae)兜蘭屬(PaphiopedilumPfitzer)植物的統(tǒng)稱(chēng),因具有拖鞋狀的唇瓣又被稱(chēng)為“拖鞋蘭”或“仙履蘭”,具有極高的觀賞價(jià)值和商業(yè)價(jià)值[1, 39-40]。本研究采用第二代高通量測(cè)序技術(shù)對(duì)秀麗兜蘭葉綠體基因組進(jìn)行測(cè)序、組裝和注釋?zhuān)@得了秀麗兜蘭完整的葉綠體基因組。研究發(fā)現(xiàn)秀麗兜蘭葉綠體基因組與前人[11-19]研究的兜蘭屬其他植物相似,具有典型的四分體環(huán)狀結(jié)構(gòu),GC 含量遠(yuǎn)小于AT 含量,其中IR 區(qū)域GC 含量最高,這與rRNA 的GC 含量較高,且全部定位在這些區(qū)域密切相關(guān)[41]。
簡(jiǎn)單序列重復(fù)(SSR)多存在于真核生物的細(xì)胞器基因組中,具有豐富的多態(tài)性,高度的重復(fù)性以及良好的可靠性和共顯性,常被用于對(duì)種質(zhì)資源進(jìn)行遺傳結(jié)構(gòu)分析、物種鑒定和群體遺傳學(xué)研究[19, 42]。本研究從秀麗兜蘭葉綠體基因組中鑒定出78 個(gè)SSR 位點(diǎn),單核苷酸有66 個(gè),占總SSRs 的94.62%,表明單核苷酸重復(fù)可能提供了更多的系統(tǒng)發(fā)育信息,63 個(gè)單堿基重復(fù)和其他堿基重復(fù)都是由A 或T 構(gòu)成,A/T 重復(fù)類(lèi)型占據(jù)主要地位,這與前人[18-19]對(duì)其他幾種兜蘭屬植物研究結(jié)果一致,得到的這些SSR 序列可為兜蘭屬植物篩選SSR 標(biāo)記和指紋圖譜研究提供依據(jù)。
在植物進(jìn)化過(guò)程中,密碼子的使用普遍表現(xiàn)出偏好性,自然選擇、物種突變和遺傳漂變是影響密碼子偏好性的主要原因,密碼子偏好性用相對(duì)同義密碼子使用頻率(RSCU)表示,若密碼子無(wú)偏好性,則RSCU 值為1,如果該密碼子比其他同義密碼子來(lái)說(shuō)出現(xiàn)更頻繁,RSCU 值大于1,反之亦然[43-45]。本研究秀麗兜蘭葉綠體基因組RSCU>1 的密碼子共有32 個(gè),其中以A 和U 結(jié)尾的有29 個(gè),超過(guò)90.6%,而RSCU<1 的密碼子則多以C 或G 結(jié)尾,表明秀麗兜蘭葉綠體基因組偏向于使用以A 或U 結(jié)尾的同義密碼子,與丁銳等[46]對(duì)杓蘭屬的研究結(jié)果一致,這可能與葉綠體基因組較低的GC 含量有關(guān),進(jìn)一步表明密碼子偏好性可能受基因組GC 含量的影響[47]。根據(jù)秀麗兜蘭葉綠體基因組的密碼子偏好性可對(duì)目的基因進(jìn)行優(yōu)化,進(jìn)一步提高基因轉(zhuǎn)化和表達(dá)效率,這一研究結(jié)果可為秀麗兜蘭遺傳育種及葉綠體基因工程的外源基因高效、穩(wěn)定表達(dá)提供科學(xué)依據(jù)。
從18 種蘭科植物葉綠體基因組系統(tǒng)發(fā)育分析發(fā)現(xiàn),兜蘭屬和杓蘭屬是明顯分開(kāi)的兩大類(lèi),兜蘭屬又分兩大類(lèi),一類(lèi)包含白花兜蘭、硬葉兜蘭、麻栗坡兜蘭、德氏兜蘭和杏黃兜蘭;另一類(lèi)包括小葉兜蘭、陳蓮兜蘭、格麗兜蘭、白旗兜蘭、紫紋兜蘭、秀麗兜蘭、帶葉兜蘭、長(zhǎng)瓣兜蘭、飄帶兜蘭、同色兜蘭和雪白兜蘭,其中秀麗兜蘭與紫紋兜蘭親緣關(guān)系密切。這一分類(lèi)與其他學(xué)者利用形態(tài)學(xué)、細(xì)胞學(xué)等方法得到的分類(lèi)結(jié)果相似[48-49],與SUN 等[18]和胡國(guó)家[19]通過(guò)葉綠體基因組序列建立的系統(tǒng)發(fā)育樹(shù)基本一致,顯示出葉綠體基因組序列在物種分類(lèi)和進(jìn)化研究中具有更高的分辨率和可靠性[50],證明了植物葉綠體基因組系統(tǒng)發(fā)育樹(shù)的構(gòu)建在物種鑒定方面的準(zhǔn)確性,同時(shí)還需要更加全面密集的取樣,才能更準(zhǔn)確地反映發(fā)育關(guān)系。
4 結(jié)論
秀麗兜蘭葉綠體基因組為典型的四分結(jié)構(gòu),總基因組大小為158 298 bp,總GC 含量為35.4%,含129 個(gè)基因,共鑒定出78 個(gè)SSR 位點(diǎn),堿基組成偏向使用A/T 堿基,密碼子偏好性以U 和A結(jié)尾,系統(tǒng)發(fā)育分析顯示秀麗兜蘭與紫紋兜蘭為姐妹種關(guān)系。研究結(jié)果可為兜蘭屬植物物種鑒定、生物進(jìn)化、系統(tǒng)發(fā)育、資源保護(hù)及分子生物學(xué)等研究提供理論參考。