李佳,趙夢(mèng)瑤,張朝霞,相世英,鄭宏春,賀游利
(陜西學(xué)前師范學(xué)院 生命科學(xué)與食品工程學(xué)院,陜西西安 710100)
冷杉屬(Abies Mill)是松科中僅次于松屬的第二大屬,包含約50 個(gè)物種,在全球廣泛分布,多分布于亞洲、歐洲等高山地帶。目前,我國(guó)冷杉屬植物種類最多,有19 種3 變種,其中百山祖冷杉(Abies beshanzuensis)、秦嶺冷杉(Abies chensiensis)由于分布范圍小且物種數(shù)量較少已被列入國(guó)家保護(hù)名錄[1],冷杉屬各物種均可提取冷杉樹(shù)脂,其葉片含有干性油,從中提取的精油可用作化妝品的配料,少數(shù)精油中的某些成分可以抑制癌細(xì)胞生長(zhǎng),具有抗腫瘤活性[2-4],因此冷杉屬植物具有重要的應(yīng)用價(jià)值。
葉綠體是植物光合作用的重要場(chǎng)所,普遍存在于陸地植物、藻類和部分原生生物中,是細(xì)胞內(nèi)具有自主遺傳信息的重要細(xì)胞器[5-6]。葉綠體在裸子植物中大多數(shù)為母系遺傳,少數(shù)如落葉松屬(Larix)為父系遺傳[7],雙親遺傳很罕見(jiàn)[8]。葉綠體基因組DNA 一般為雙鏈環(huán)狀結(jié)構(gòu),極少數(shù)為線型或多聚體,如粗刺藻(Acetabularia caliculus Lamouroux)[9]。葉綠體基因組由大單拷貝區(qū)、小單拷貝區(qū)、反向重復(fù)區(qū)A 和反向重復(fù)區(qū)B 組成[10-12]。
葉綠體基因組主要有與自我復(fù)制有關(guān)的基因、與光合作用有關(guān)的基因以及開(kāi)放閱讀等其他基因,而這些基因都是功能基因[13-14]。葉綠體基因組的基因數(shù)目一般為120~150,在基因的組成及排列順序和方式上往往具有高度保守性[15]。在進(jìn)化過(guò)程中,葉綠體基因會(huì)出現(xiàn)不同程度的丟失。不同種類的植物葉綠體基因組大小、基因數(shù)量會(huì)存在差異[10],分析物種的葉綠體基因數(shù)量、基因組結(jié)構(gòu)等可以為生物的遺傳規(guī)律、親緣關(guān)系及進(jìn)化方式、方向等提供一定的數(shù)據(jù)資料。
松科(Pinaceae)是現(xiàn)存裸子植物中最大的一個(gè)類群,也是研究松柏類植物系統(tǒng)發(fā)育的一個(gè)關(guān)鍵類群,而冷杉屬作為松科的第二大屬,對(duì)于冷杉屬的葉綠體基因組以及系統(tǒng)發(fā)育分析的研究有助于確定松科的屬間以及種間關(guān)系。姜雪蓮[16]在2016 年結(jié)合了葉綠體基因的系統(tǒng)發(fā)育分析結(jié)果將峨眉冷杉(Abies fabri)劃分為一個(gè)獨(dú)立的物種。而汪小全等[17]基于葉綠體基因組數(shù)據(jù)的分析結(jié)果,使得松科系統(tǒng)發(fā)育關(guān)系基本得到解決,但得到的支持率較低;因此有必要開(kāi)展對(duì)于冷杉屬的系統(tǒng)發(fā)育研究。
本研究分析了冷杉屬葉綠體基因組的GC 含量、長(zhǎng)度、重復(fù)序列,并重建了冷杉屬植物的系統(tǒng)發(fā)育關(guān)系,為冷杉屬系統(tǒng)進(jìn)化、親緣關(guān)系研究提供理論和數(shù)據(jù)方面的支持,從而為松科以及裸子植物的系統(tǒng)進(jìn)化關(guān)系等研究提供進(jìn)一步的數(shù)據(jù)支持。
如表1 所示,選取美國(guó)國(guó)立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)已經(jīng)公布的冷杉屬植物10 個(gè)物種以及4 個(gè)外類群為材料,下載這14 個(gè)物種的葉綠體全基因組序列和注釋信息。
表1 冷杉屬10 個(gè)物種及4 個(gè)外類群的GenBank 登錄號(hào)
1.2.1 冷杉屬葉綠體基因組基本特征分析
依據(jù)NCBI 公布的冷杉屬植物的葉綠體全基因組序列及其注釋信息,整理其包含的基因含量、基因組大小、蛋白編碼基因個(gè)數(shù)及其長(zhǎng)度等信息,采用Bioedit 軟件計(jì)算其GC 含量。
1.2.2 冷杉屬葉綠體基因重復(fù)序列分析
采用MISA(https://webblast.ipk-gatersleben.de/misa/)軟件分析冷杉屬10 個(gè)物種葉綠體全基因組序列包含的簡(jiǎn)單重復(fù)序列,參數(shù)設(shè)置為單堿基大于10 次,二堿基大于5 次,三堿基大于4 次,四、五、六堿基均大于3 次。
1.2.3 冷杉屬植物的系統(tǒng)發(fā)育分析
選取南方紅豆杉(Taxus chinensis)、西藏紅豆杉(Taxus wallichiana)、巴西南洋杉(Araucaria angustifolia)和日本柳杉(Cryptomeria japonica)作為外類群,并結(jié)合冷杉屬10 個(gè)物種葉綠體基因組序列的注釋結(jié)果,得出這14 個(gè)物種共有的葉綠體基因?yàn)?0 個(gè)(表2)。對(duì)14 個(gè)物種的60 個(gè)蛋白編碼基因分別利用Bioedit 進(jìn)行序列比對(duì),并將比對(duì)結(jié)果串聯(lián)在一起。利用MEGA 軟件進(jìn)行系統(tǒng)發(fā)育分析,主要選用最大似然法(Maximum Likelihood,ML)和鄰接法(Neighbor-Joining method,NJ)進(jìn)行,并利用自展分析(Bootstrap,重復(fù)100 次)檢驗(yàn)各分支的置信度。
表2 冷杉屬10 個(gè)物種共有的60 個(gè)葉綠體蛋白編碼基因列表
如表3 所示,冷杉屬植物10 個(gè)物種的葉綠體基因組大小在120 057~121 799 bp。葉綠體基因組長(zhǎng)度最大的是巴山冷杉(Abies fargesii),其長(zhǎng)度為121 799 bp;最小的是梵凈山冷杉(Abies fanjingshanensis),基因組大小為120 057 bp。巴山冷杉和梵凈山冷杉之間相差1 742 bp,表明基因組長(zhǎng)度變化較小。冷杉屬葉綠體基因組總共包含的基因數(shù)目多為113 個(gè),僅白冷杉(Abies concolor)為110 個(gè)。大多數(shù)冷杉屬的蛋白編碼基因個(gè)數(shù)為74 個(gè),白冷杉的蛋白編碼基因數(shù)目為71 個(gè),其中只包含一個(gè)ycf12基因,而冷杉屬其余物種均包含2個(gè)ycf12基因。此外,白冷杉的psaA 和ycf1 基因均為假基因,其是否還具有功能有待進(jìn)一步研究。冷杉屬10 個(gè)物種的tRNA的基因個(gè)數(shù)均為35 個(gè),rRNA 個(gè)數(shù)穩(wěn)定在4 個(gè),分別為rrn16、rrn23、rrn4.5、rrn5。冷杉屬葉綠體基因組的GC 含量變化較小,均為38%左右。
如表4 所示,冷杉屬植物葉綠體基因組包含的重復(fù)序列總數(shù)在55~71 個(gè),其中最多的是百山祖冷杉,有71 個(gè);最少的是白冷杉,有55 個(gè)。每個(gè)物種預(yù)測(cè)到的簡(jiǎn)單重復(fù)序列(Simple sequence repeat,SSR)個(gè)數(shù)不等:歐洲冷杉(Abies alba)、香脂冷杉(Abies balsamea)和朝鮮冷杉(Abies koreana)均含有64 個(gè)SSR,秦嶺冷杉和新疆冷杉(Abies sibirica)均含有68個(gè)SSR,巴山冷杉和臺(tái)灣冷杉(Abies kawakamii)均含有69 個(gè)SSR,其余3 個(gè)物種預(yù)測(cè)到的SSR 個(gè)數(shù)均不相同。冷杉屬葉綠體基因組中出現(xiàn)的SSR 位點(diǎn)共有655 個(gè),單核苷酸最多為419 個(gè),約占全部SSR 位點(diǎn)的64%;其次是二核苷酸,總共137 個(gè),其中135個(gè)為AT/AT,僅有兩個(gè)為AG/CT 組成。三核苷酸一共21 個(gè),約占3.21%;四核苷酸62 個(gè),占全部SSR位點(diǎn)的9.4%;五核苷酸出現(xiàn)的次數(shù)較少,共16 個(gè),占2.44%;冷杉屬10 個(gè)物種均不包含六核苷酸SSR。單堿基、二堿基、三堿基、四堿基、五堿基的個(gè)數(shù)在不同物種中也不相同。本研究中冷杉屬10 個(gè)物種的SSR個(gè)數(shù)和分布情況存在差異,其原因可能是冷杉屬植物在進(jìn)化過(guò)程中不同物種的基因序列缺失、突變等。
表3 冷杉屬10 個(gè)物種葉綠體全基因組序列信息統(tǒng)計(jì)表
表4 冷杉屬10 個(gè)物種包含的重復(fù)序列統(tǒng)計(jì)表
以紅豆杉科的南方紅豆杉和西藏紅豆杉,南洋杉科的巴西南洋杉以及柳杉科的日本柳杉為外類群,采用鄰接法和最大似然法進(jìn)行系統(tǒng)發(fā)育樹(shù)重建,結(jié)果如圖1 和2 所示。兩種方法構(gòu)建的系統(tǒng)發(fā)育樹(shù)都顯示所有冷杉屬植物構(gòu)成一個(gè)單系群。最大似然法的構(gòu)樹(shù)結(jié)果顯示,歐洲冷杉與梵凈山冷杉聚為一類,組成冷杉屬的基部,朝鮮冷杉、香脂冷杉、臺(tái)灣冷杉、百山祖冷杉、巴山冷杉聚為一類,秦嶺冷杉、白冷杉、新疆冷杉聚為一類;鄰接法中梵凈山冷杉單獨(dú)分為一支,其余9 個(gè)物種分為一支,并且在這個(gè)分支內(nèi)部歐洲冷杉與其他8 個(gè)物種為姐妹類群;而其余8 個(gè)物種的聚類結(jié)果與最大似然法一致。
圖1 基于60 個(gè)蛋白編碼基因構(gòu)建的冷杉屬系統(tǒng)發(fā)育樹(shù)(ML 法)
圖2 基于60 個(gè)蛋白編碼基因構(gòu)建的冷杉屬系統(tǒng)發(fā)育樹(shù)(NJ 法)
冷杉屬10個(gè)物種的葉綠體基因組大小差異較小,包含的葉綠體基因也比較保守。冷杉屬10 個(gè)物種的基因個(gè)數(shù)在110~113,編碼蛋白基因在71~74 個(gè),共有基因110 個(gè)。冷杉屬10 個(gè)物種包含的SSR 個(gè)數(shù)不盡相同,并且都是單堿基重復(fù)類型最大,沒(méi)有六堿基重復(fù)。系統(tǒng)發(fā)育樹(shù)分析結(jié)果顯示,所有冷杉屬植物構(gòu)成一個(gè)單系群,但最大似然法與鄰接法的結(jié)果對(duì)歐洲冷杉的分類位置存在爭(zhēng)議,未來(lái)還需要結(jié)合更多松科植物的葉綠體基因組序列對(duì)其進(jìn)行深入研究。