任延靖, 邵登魁
(1.青海大學(xué)農(nóng)林科學(xué)院,青海省蔬菜遺傳與生理重點實驗室, 西寧 810016;2.青海大學(xué),三江源生態(tài)和高原農(nóng)牧業(yè)國家重點實驗室, 西寧 810016)
蕪菁(Brassicarapassp.rapaL. 2 n=2 x=20),又稱為蔓菁、盤菜等,是我國及東亞廣泛種植的一種重要的十字花科葉用和根用蔬菜,也是我國最早人工種植的蔬菜之一,同時也作為重要的藥用和飼料用作物,能夠廣泛生長于海拔3 500 m以上的高原地區(qū)[1],其富含芥子油苷[2-4]、膳食酚類[4]、膳食纖維、維生素C以及生物活性物質(zhì)[5],是一類營養(yǎng)豐富且全面的作物,其研究方向主要集中在抗缺氧等相關(guān)的藥用價值、以花青素為代表的色素調(diào)控、重金屬富集以及單倍體再生體系的構(gòu)建等。
在蕪菁的藥用價值方面,Tang等[6]比較了蕪菁的功能活性物質(zhì)以及抗疲勞的作用,結(jié)果表明,在小鼠負(fù)重游泳模型中,蕪菁多糖具有良好的抗疲勞作用;Chu等[7]在人體試食實驗結(jié)合低氧耐受測試中,進一步驗證了西藏蕪菁提高健康人群低氧耐受的功效,同時篩選出其抗氧化活性優(yōu)良的化合物:反式/順式-對香豆酸葡萄糖苷,發(fā)現(xiàn)該化合物能夠增強物理缺氧條件下的細(xì)胞的活力并減少細(xì)胞凋亡;Li等[8]進一步研究了對香豆酸葡萄糖苷在預(yù)防缺氧性肺水腫和缺氧性腦水腫的功效,證實了其在預(yù)防缺氧性肺水腫和缺氧性腦水腫中的重要作用并闡明其調(diào)控機制;王文寧[9]分析了蕪菁營養(yǎng)成分及其對改善小鼠腸道菌群的作用,發(fā)現(xiàn)蕪菁可以促進小鼠腸道內(nèi)雙歧桿菌、乳酸桿菌、腸桿菌的增殖,抑制腸球菌、產(chǎn)氣莢膜梭菌的增殖,對腸道菌群具有調(diào)節(jié)作用,這些研究結(jié)果顯示蕪菁資源具有良好的應(yīng)用前景,但是目前對于蕪菁基因組的探究還鮮見報道。
基因組包括細(xì)胞核基因組和細(xì)胞質(zhì)基因組,細(xì)胞質(zhì)基因組又包含葉綠體、線粒體等小細(xì)胞器中分離出的DNA,被子植物完整的葉綠體基因組通常包含4個部分:一個大的單拷貝區(qū)域(LSC)、一個小的單拷貝區(qū)域(SSC)和兩個位于LSC和SSC之間的倒置重復(fù)區(qū)(IR)、IRa和IRb,最終形成一個典型的四方圓環(huán)[10],與核基因組相比,從母本遺傳的葉綠體基因組在基因含量和基因組結(jié)構(gòu)上高度保守,通常葉綠體基因組的長度在120~160 kb之間,特異基因的數(shù)量在110~130個之間[11]。在光合作用中,葉綠體基因組基因在淀粉、氨基酸、脂肪酸和色素的生物合成中起著至關(guān)重要的作用[12]。近年來,高通量技術(shù)的快速發(fā)展,解析了越來越多的植物的葉綠體基因組[11,13]。
本研究中,針對蕪菁葉綠體基因組進行了組裝,結(jié)果顯示蕪菁葉綠體呈環(huán)狀雙鏈,共有132個基因,進一步分析了蕪菁葉綠體的結(jié)構(gòu)特征及親緣關(guān)系,本研究結(jié)果為分析蕪菁細(xì)胞質(zhì)基因組、了解蕪菁親緣關(guān)系奠定良好的基礎(chǔ)。
試驗所用蕪菁材料W 21于2020年3月播種于青海大學(xué)農(nóng)林科學(xué)院試驗溫室中,待生長至65 d時,收集新鮮健康的葉片,用蒸餾水沖洗干凈,然后迅速在液氮中冷凍,存于-80 ℃?zhèn)溆谩?/p>
采用改良CTAB法[14]提取基因組DNA,DNA質(zhì)檢合格后,用機械打斷的方法(超聲波)將DNA片段化,然后對片段化的DNA進行純化、末端修復(fù)、3′端加A以及連接測序接頭[13],再用瓊脂糖凝膠電泳進行片段大小選擇,進行PCR擴增形成測序文庫,建好的文庫先進行文庫質(zhì)檢,質(zhì)檢合格的文庫用Illumina Hi Seq 2500進行測序。
對測序得到的原始數(shù)據(jù)進行數(shù)據(jù)過濾,去除其中的接頭序列及低質(zhì)量的片段,獲得高質(zhì)量的數(shù)據(jù),將高質(zhì)量的數(shù)據(jù)進行序列組裝,利用MITObim軟件[15]參考十字花科蕓薹屬芥菜的葉綠體基因組(NC_030450,https://www.ncbi.nlm.nih.gov/nuccore/NC_030450.1)的保守序列對蕪菁的葉綠體基因組進行組裝,得到局部的組裝結(jié)果,以局部的組裝序列進行延伸,最終獲取完整的蕪菁葉綠體基因組。得到的葉綠體組基因用DOGMA[16]和Mitofy[17]進行基因注釋,注釋結(jié)果通過CpGAVAS pipeline[18]進行驗證,最終利用在線軟件GDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)[19]進行作圖。完整的葉綠體基因組序列提交至NCBI數(shù)據(jù)庫,登錄號MT 409177。
利用PHOBOS軟件v 3.3.12[20]搜索蕪菁葉綠體單核苷酸重復(fù)以上的Simple sequence repeat(SSR)位點,設(shè)置參數(shù)為:單核苷酸重復(fù)≥6,二核苷酸重復(fù)≥5,三核苷酸重復(fù)≥4,四核苷酸重復(fù)≥3,五核苷酸及六核苷酸重復(fù)≥1,所有的搜索結(jié)果最終通過人工驗證[21]。
為了鑒定蕪菁與其他十字花科蔬菜的親緣關(guān)系,從NCBI數(shù)據(jù)庫下載白菜(Brassicarapasubsp.pekinensis,NC_015139;Brassicarapa(field mustard,NC_040849);甘藍(lán)(Brassicaoleraceavar.italicacultivar Maratython,MH 388765;Brassicaoleraceavar.italicacultivar Green Sprout,MH 388764;Brassicaoleraceavar.italicacultivar 2001 B,MN 649876)以及擬南芥(Arabidopsisthalianathale cress,NC_000932)的葉綠體基因組,采用MEGA軟件對上述葉綠體基因組構(gòu)建系統(tǒng)發(fā)育樹,結(jié)合Du等[11]對82份十字花科作物的進化關(guān)系分析,鑒定蕪菁與其他十字花科蔬菜之間的關(guān)系。
通過Illumina Hi Seq 2500測序平臺,共獲得8.38 Gb的高質(zhì)量數(shù)據(jù),其中Q 30為91.65%(表1),通過組裝及可視化作圖,發(fā)現(xiàn)蕪菁葉綠體基因組呈雙鏈環(huán)狀,與姜黃[22]、紫薇[23]、木蘭花[24]等高等植物相似,包含典型的4個部分:83 512 bp的大單拷貝區(qū)域(LSC)、17 683 bp的小單拷貝區(qū)域(SSC)及26 213 bp的兩個反向重復(fù)序列(IRa和IRb)(圖1,表2),組成一個序列全長為153 621 bp的完整的蕪菁葉綠體基因組。
注:內(nèi)側(cè)基因順時針轉(zhuǎn)錄,外側(cè)基因逆時針轉(zhuǎn)錄,深灰色區(qū)域表示圈內(nèi)對應(yīng)的GC含量,淺色區(qū)域表示相對應(yīng)的AT含量。
表1 蕪菁基因組測序的數(shù)據(jù)評估統(tǒng)計
在蕪菁葉綠體基因組中,共檢測到132個基因,包括87個編碼蛋白質(zhì)的基因、37個轉(zhuǎn)運RNA基因和8個核糖體RNA基因,在這132個基因中,有15個基因在IR區(qū)域呈現(xiàn)雙拷貝,分別是ndhB、rrn4.5、rrn5、rrn16、rrn23、rps7、rps12、rpl2、rpl23、trnI-CAU、trnV-GAC、trnN-GUU、ycf1、ycf2和ycf15(表2和表3)。
表2 蕪菁葉綠體基因組結(jié)構(gòu)特征
表3 蕪菁葉綠體基因組結(jié)構(gòu)特征
對蕪菁葉綠體基因組的堿基組成進行分析,發(fā)現(xiàn)CG含量占總堿基數(shù)的36.3%,G和C的含量分別為18.6%和17.8%,其中IR區(qū)域中的GC含量(43.2%)高于LSC區(qū)域(34.1%)和SSC區(qū)域(29.3%),相反,總的AT含量在SSC區(qū)域(71.9%)高于IR區(qū)域(57.7%),A和T的含量分別為31.4%和32.3%,該結(jié)果與其他十字花科蔬菜,如蘿卜[25]、豆瓣菜[26]以及野白菜[11]等的葉綠體基因組GC含量相似(表4)。
表4 蕪菁葉綠體基因組的堿基組成
重復(fù)序列又稱為簡單序列重復(fù)(SSR)或微衛(wèi)星序列,廣泛存在于基因組中,通常包含隨機的1~6個核苷酸[25-28],一般用于分析群體遺傳學(xué)[29-30]、進化關(guān)系[31]以及物種鑒別等。通過對蕪菁葉綠體基因組的SSR分析,共發(fā)現(xiàn)13種類型的SSR,包括2種單核苷酸、2種二核苷酸、3種三核苷酸和6種四核苷酸類型重復(fù)(表5),A/T單核苷酸重復(fù)是最多的一類,占總SSR的96.90%,AT/TA二核苷酸重復(fù)占總SSR的2.02%,A/T單核苷酸重復(fù)在其他物種中也較為多見[11,32],說明短的A/T重復(fù)是葉綠體基因組的普遍特征[33],在蕪菁葉綠體基因組中沒有發(fā)現(xiàn)五核苷酸和六核苷酸重復(fù)的SSR,但在野白菜葉綠體基因組中檢測到兩個六核苷酸重復(fù)的SSR,這些結(jié)果表明,SSR參與了不同物種葉綠體基因組遺傳多樣性的鑒定。
表5 蕪菁葉綠體基因組中SSR類型及數(shù)量
利用MEGA軟件對NCBI數(shù)據(jù)庫中發(fā)表的6個十字花科作物的與蕪菁共同構(gòu)建葉綠體基因組系統(tǒng)進化樹,進化樹顯示將7類作物分為兩大類,一類是擬南芥,另一類是不同白菜類變種和甘藍(lán)類變種,其中蕪菁與白菜類聚為一類,親緣關(guān)系與白菜較近,與甘藍(lán)類的親緣關(guān)系較遠(yuǎn)(圖2)。
注:所有的葉綠體基因組均下載于NCBI,登錄號如下:白菜,NC_015139;野白菜,NC_040849;甘藍(lán),MH 388765;MH 388764;MN 649876;擬南芥NC_000932.
根據(jù)進化樹的結(jié)果,比較蕪菁和白菜的葉綠體基因組特征,發(fā)現(xiàn)兩個基因組在4個區(qū)域處的連接序列(圖3),結(jié)果表明連接處共有4個基因(rps19,ycf1,ndhF和trnH),其中rps19和trnH的長度相同,但是基因所在的位置略有差異,ycf1的兩個拷貝在蕪菁和白菜之間均有差異,位于IRb區(qū)域和SSC區(qū)域連接處的ycf1在蕪菁和白菜中分別為1 029 bp和1 032 bp,蕪菁中3 bp的缺失發(fā)生在IRb區(qū)域,位于IRa區(qū)域和SSC區(qū)域的ycf1在蕪菁和白菜中分別為5 310 bp和5 313 bp。trnH基因在蕪菁和白菜中分別位于LSC區(qū)域距離IRa區(qū)域2 bp和3 bp遠(yuǎn)的位置,Du等[11]分析了8個十字花科物種的區(qū)域連接處,也發(fā)現(xiàn)了4個基因,rps19,ycf1,ndhF和trnH,其中rps19基因在8個物種的長度相同,均為279 bp,說明rps19基因在十字花科物種中高度保守,ycf1和ndhF基因在長度和位置上均不同,說明ycf1和ndhF基因比較容易突變,本研究結(jié)果與這些結(jié)果類似,這些區(qū)域鏈接處序列的分析結(jié)果說明構(gòu)建的蕪菁葉綠體基因組是可靠的。
圖3 蕪菁和白菜葉綠體基因組的比對
本研究首次對蕪菁葉綠體及基因組的序列結(jié)構(gòu)進行了詳細(xì)分析,構(gòu)建了蕪菁葉綠體基因組信息,同時分析序列的堿基組成、SSR以及區(qū)域連接處的基因,同時構(gòu)建了系統(tǒng)發(fā)育進化樹,為進一步深入了解細(xì)胞質(zhì)基因組及蕪菁研究奠定了良好的基礎(chǔ)。