孫志軒, 敖平星, 畢玉芬, 趙雁*
(1.云南農(nóng)業(yè)大學(xué)園林園藝學(xué)院, 云南 昆明 650201; 2.云南農(nóng)業(yè)大學(xué)動物科學(xué)技術(shù)學(xué)院, 云南 昆明 650201)
葉綠體是植物進(jìn)行光合作用的關(guān)鍵場所,是細(xì)胞內(nèi)具有自主遺傳信息的重要細(xì)胞器,普遍存在于陸地植物、藻類和部分原生生物中[1-2]。葉綠體基因組的大小、結(jié)構(gòu)和基因種類、數(shù)目、排列順序以及密碼子的組成都具有高度保守的特性[3],與核基因相比其進(jìn)化速率相對較慢、核苷酸替換頻率較低、易于分析,因此,葉綠體基因組已廣泛應(yīng)用于物種的起源、系統(tǒng)發(fā)育關(guān)系以及新物種的鑒定[4-5]。近年來測序技術(shù)不斷發(fā)展和進(jìn)步,NCBI(https://www.ncbi.nlm.nih.gov/) 數(shù)據(jù)庫中已有上千個物種的葉綠體基因組序列。典型的被子植物葉綠體基因組為一個環(huán)狀四分體結(jié)構(gòu)[6],其大小通常為120~180 kb,由兩個序列相同方向相反的重復(fù)區(qū)(Inverted repeat,IR),一個大單拷貝區(qū)(Large single-copy,LSC)和一個小單拷貝區(qū)(Small single-copy,SSC)組成[7],有的物種(如松柏類(conifers)[8]、牻牛兒苗屬(Erodium)[9]、豆科(Legumes)[10]和列當(dāng)科(Orobanchaceae)[11]中的一些物種)會出現(xiàn)IR區(qū)部分或全部缺失的現(xiàn)象[12-13]。
苜蓿屬(MedicagoL.)共有87個種[14],其中最重要的是被譽為“牧草之王”的紫花苜蓿,紫花苜蓿在全球種植面積最廣,在畜牧業(yè)中具有重要商業(yè)價值。云南省德欽地區(qū)分布的野生紫花苜蓿,是省內(nèi)唯一成群落分布的苜蓿屬資源,研究表明,‘德欽’苜蓿是由我國青海和甘肅傳入西藏,并沿金沙江和瀾滄江流域逐漸向下游傳播[15]。2010年通過全國草品種委員會審定,允許在適宜的區(qū)域推廣使用,命名為‘德欽’紫花苜蓿[16]?!職J’苜蓿為異花授粉的同源四倍體,2n=4x=32,秋眠級為1.2[17],適應(yīng)迪慶州海拔2 000~3 000 m,年降雨量303.9~660.0 mm的區(qū)域[18]。前期研究表明,‘德欽’苜蓿具有耐熱性[19-21]、耐旱性[22]和耐酸鋁性[23-25]等特異耐受性,是在干熱地區(qū)生存的特異性種質(zhì)。目前,‘德欽’苜蓿在分子水平上與已公布的紫花苜蓿及品種的關(guān)系還不清楚,本研究通過高通量測序獲得‘德欽’苜蓿葉綠體基因組全序列,分析其葉綠體基因組特點,探明其在苜蓿屬中的地位,對特異基因挖掘以及加快云南苜蓿品種的改良和育種進(jìn)程具有重要意義。
供試材料為‘德欽’紫花苜蓿(登記號:415,野生栽培品種),2018年采自云南省德欽縣的野外保種基地,父母本均為‘德欽’紫花苜蓿。選用顆粒飽滿的種子消毒后放入培養(yǎng)皿中萌發(fā),挑選萌發(fā)較好的種子播種于無菌土中,每3天澆一次改良霍格蘭溶液,一個月后選取長勢較好無病害‘德欽’苜蓿新鮮葉片,提取DNA[26]。
1.2.1葉綠體基因組測序及質(zhì)控 利用瓊脂糖凝膠電泳檢測DNA完整性,Nanodrop 2000檢測DNA的濃度和純度,DNA樣品檢測合格后,使用Covaris超聲波破碎儀隨機(jī)打斷,再經(jīng)末端修復(fù)、3′端加A尾、加測序接頭、純化、PCR擴(kuò)增等步驟構(gòu)建測序文庫,使用Agilent 2100對文庫的插入片段進(jìn)行檢測,質(zhì)檢合格的文庫用Illumina NovaSeq 6000(北京諾禾致源科技股份有限公司)高通量測序平臺測序。對獲得的原始數(shù)據(jù)進(jìn)行過濾,去除帶接頭的、低質(zhì)量的Reads用于后續(xù)組裝。
1.2.2葉綠體基因組序列拼接和注釋 用CLC Genomic Workbench v10(CLC Bio.,Aarhus,Denmark)對處理后的Reads進(jìn)行從頭組裝成contigs,參考NCBI已發(fā)表的紫花苜蓿(MK460489)使用BLAST(https://blast.ncbi.nlm.nih.gov/)確定拼接順序,然后使用Geneious v8.0.2(Biomatters Ltd.,Auckland,New Zealand)軟件進(jìn)行手動拼接,最后將Reads重新映射(map)到組裝好的葉綠體基因組上,檢查、校對和修補(bǔ)有缺口的位點,獲得最終的環(huán)狀葉綠體基因組。利用在線注釋軟件Annotation of Organellar Genomes[27]對拼接好的葉綠體基因組進(jìn)行注釋,然后結(jié)合已發(fā)表的親緣種注釋結(jié)果在Geneious中對起始密碼子、終止密碼子、內(nèi)含子及外顯子進(jìn)行修正。將注釋好的序列導(dǎo)出GenBank格式,提交至NCBI數(shù)據(jù)庫得到序列號。利用在線繪圖軟件Organellar Genome DRAW[28]將GenBank文件生成葉綠體基因組物理圖譜。
1.2.3相對同義密碼子分析 利用CodonW腳本對‘德欽’苜蓿76條蛋白編碼序列的密碼子使用度(Relative synonymous codon usage,RSCU)進(jìn)行計算,RSCU>1的密碼子認(rèn)為具有偏好性[29]。
1.2.4重復(fù)序列分析 用SSR Hunter v1.3[30]和MISA-web v2.1[31]對‘德欽’苜蓿葉綠體基因組簡單重復(fù)序列(Simple sequence repeats,SSRs)位點進(jìn)行分析鑒定。參數(shù)設(shè)置:單核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸最小重復(fù)次數(shù)分別為10,5,4,3,3,3;2個SSRs之間的最小距離設(shè)置為100 bp,若距離為零,組成復(fù)合SSR;若距離小于100 bp,則組成間隔SSR。
1.2.5苜蓿屬植物聚類分析 從NCBI數(shù)據(jù)庫下載同屬已發(fā)表的35個葉綠體序列數(shù)據(jù),基于在線程序MAFFT (https://mafft.cbrc.jp/alignment/server/index.html) 進(jìn)行多重比對。利用MEGA v7.0[32]軟件用最大似然法(Maximum likelihood,ML)構(gòu)建‘德欽’苜蓿和同屬植物種系統(tǒng)發(fā)育樹。
‘德欽’苜蓿(NCBI登錄號:MN218692)葉綠體DNA序列全長125 470 bp,與其他被子植物葉綠體基因組結(jié)構(gòu)相似,是一個典型的環(huán)狀結(jié)構(gòu)(圖1),具有1個小單拷貝區(qū)(SSC)、1個大的單拷貝區(qū)(LSC)和1個反向重復(fù)區(qū)(IR)。葉綠體基因組注釋結(jié)果顯示(表1),‘德欽’苜蓿葉綠體基因組含有110個編碼基因,其中蛋白質(zhì)編碼基因76個,轉(zhuǎn)運RNA(tRNA) 30個和核糖體RNA(rRNA) 4個,GC含量33.9%;其中16個基因包含1個內(nèi)含子,1個基因包含2個內(nèi)含子;rps12是反式剪切基因;clpP基因缺失一個內(nèi)含子;ycf3是唯一的具有兩個內(nèi)含子的基因;trnK-UUU具有最大的內(nèi)含子,內(nèi)含子長為2 481 bp,matK基因位于其中。同時,‘德欽’苜蓿葉綠體基因組中缺失rps16,rpl22和infA基因。
圖1 ‘德欽’葉綠體基因組示意圖Fig.1 Chloroplast genome map of M.sativa ‘Deqin’注:外層環(huán)外圈箭頭表示外層環(huán)圈外基因逆時針方向表達(dá),內(nèi)圈箭頭表示外層環(huán)圈內(nèi)基因順時針方向表達(dá),不同顏色方塊表示不同功能的基因;內(nèi)環(huán)深灰色陰影表示GC含量,淺灰色陰影表示AT含量Note:Genes shown on the outside of the circle are transcribed in the counterclockwise direction,while those inside are transcribed in the clockwise direction. The colored bars indicate genes belonging to different functional groups. The darker gray dashed area denotes the GC content while the lighter gray corresponds to the AT content of the plastomes
表1 ‘德欽’苜蓿葉綠體基因注釋信息Table 1 Genes present in the chloroplast genome of M.sativa ‘Deqin’
對‘德欽’苜蓿密碼子偏好性分析可為其葉綠體基因工程的開展和目標(biāo)性狀的遺傳改良奠定基礎(chǔ)。‘德欽’苜蓿76條蛋白編碼序列總長為66 540 bp,GC含量為36.5%,共有22 080個密碼子參與,其中亮氨酸(Leu)使用最為頻繁,其次是異亮氨酸(Ile),半胱氨酸(Cys)使用次數(shù)最少,其數(shù)量分別為2 345(10.62%),1 979(8.96%),238(1.08%)。相對同義密碼子使用度顯示‘德欽’苜蓿有70.74%密碼子的RSCU>1,表現(xiàn)出偏好以A和T結(jié)尾的特性(表2)。
表2 ‘德欽’苜蓿密碼子信息Table 2 Codon usage in M.sativa ‘Deqin’
在‘德欽’苜蓿葉綠體基因組中鑒定出單核苷酸、二核苷酸、三核苷酸、四核苷酸和五核苷酸SSRs位點共115個(79,21,8,5,2),沒有發(fā)現(xiàn)六核苷酸(表3)。從SSRs類型上來看,除了普通的SSR外還存在12個間隔SSR,最大的是(TA)6有290 bp;對其組成及位置分析發(fā)現(xiàn)絕大多數(shù)的SSRs由A和T組成,有27個SSRs位點在編碼區(qū),其余均在非編碼區(qū);在‘德欽’苜蓿clpP基因編碼區(qū)中出現(xiàn)(A)12位點,而紫花苜蓿為(A)13位點;‘德欽’苜蓿中出現(xiàn)四核苷酸(TTAT)3位點,紫花苜蓿中不存在。
表3 ‘德欽’紫花苜蓿與紫花苜蓿簡單重復(fù)序列位點對比Table 3 Comparison of simple sequence repeats (SSR) sites in M. sativa ‘Deqin’ and M. sativa
續(xù)表3
以豆科車軸草族(Trib. Trifolieae)已公布的胡盧巴屬(TrigonellaL.) 1個種、草木樨屬(Melilotus(L.) Mill.) 1個種、紫雀花屬(ParochetusBuch.-Ham. ex D. Don) 1個種和車軸草屬(TrifoliumL.)的5個種作為外類群,對‘德欽’苜蓿和已發(fā)表的35個苜蓿屬(Medicago)植物葉綠體全基因組構(gòu)建ML系統(tǒng)發(fā)育樹(圖2)。結(jié)果顯示,36個苜蓿屬植物聚為一支,并具有較高的支持率,‘德欽’苜蓿與紫花苜蓿聚為一支(支持率為75%),‘德欽’苜蓿與紫花苜蓿親緣關(guān)系最近。
圖2 基于葉綠體全基因組的苜蓿屬36個物種及其近緣種的最大似然法聚類結(jié)果Fig.2 Cluster analysis of 36 species of Medicago using complete chloroplast genome sequence by the maximum likelihood method
本研究采用第二代高通量測序技術(shù)對‘德欽’苜蓿葉綠體基因組進(jìn)行了測序,以‘德欽’苜蓿親緣關(guān)系最近的紫花苜蓿葉綠體基因組為參考組,成功組裝出完整的‘德欽’苜蓿葉綠體基因組,其大小為125 470 bp,符合被子植物葉綠體基因組大小[7],屬于IR缺失型,GC含量為33.9%,3個基因rps16,rpl22和infA缺失,與前人對蝶形花亞科(Papilionoideae)植物研究結(jié)果類似,可能是基因組重排的結(jié)果[33-34]。
外源基因的表達(dá)水平會受到物種密碼子偏好性的影響[35-36],雙子葉植物偏好以A/T結(jié)尾的密碼子,而單子葉植物偏向于以G/C結(jié)尾的密碼子[37],本研究中‘德欽’苜蓿葉綠體密碼子分析顯示70.74%的蛋白密碼子RSCU>1,具有偏好A/T的特性,與雙子葉植物偏好使用A/T結(jié)尾的密碼子結(jié)果一致。
SSRs分析可對種質(zhì)資源進(jìn)行遺傳結(jié)構(gòu)分析和品種鑒定[38-39]。在‘德欽’苜蓿葉綠體基因組中共鑒定出115個SSRs位點,其中clpP編碼區(qū)發(fā)現(xiàn)一個與紫花苜蓿有差異的位點,研究表明,clp蛋白酶在生物體內(nèi)可通過水解作用清除干擾正常代謝的蛋白或多肽,參與多種抗逆活動[40-42],如在擬南芥(Arabidopsisthaliana(L.) Heynh)[43]和番茄(LycopersiconesculentumMill)[44]中發(fā)現(xiàn)clpB基因可有效增加其耐熱性,花生(ArachishypogaeaL.)中發(fā)現(xiàn)clpP家族個別成員可受鹽脅迫誘導(dǎo)表達(dá)[45]。本研究中‘德欽’苜蓿在clpP編碼區(qū)與紫花苜蓿出現(xiàn)差異,可能與‘德欽’苜蓿特異性耐受有關(guān),其具體作用有待進(jìn)一步研究。本試驗對‘德欽’苜蓿葉綠體基因組進(jìn)行測序,并對其進(jìn)行基因特征分析,揭示了其葉綠體基因組水平特點,補(bǔ)充了苜蓿屬植物葉綠體基因組信息,為加快苜蓿屬植物分子生物學(xué)研究以及‘德欽’苜蓿特異基因的挖掘及利用提供參考。