張妍彤 黃 劍 宋 菊 林麗梅 馮若宣 邢朝斌*
(1.華北理工大學(xué)生命科學(xué)學(xué)院,唐山 063210; 2.百色學(xué)院農(nóng)業(yè)與食品工程學(xué)院,百色 533000)
葉綠體是植物細(xì)胞內(nèi)進(jìn)行光合作用的重要細(xì)胞器,其擁有自身完整的一套基因組,可進(jìn)行自主遺傳[1]。在被子植物中,葉綠體基因組大多為雙鏈環(huán)狀DNA分子結(jié)構(gòu),包含大單拷貝區(qū)(large single copy,LSC)、小單拷貝區(qū)(small single copy,SSC)、反向重復(fù)區(qū)A(inverted repeats A,IRA)、反向重復(fù)區(qū)B(IRB)4個(gè)部分,其中兩個(gè)IR區(qū)序列相同,方向相反[2]。基因組大小一般為120~180 kB,共編碼100~130種基因,其中包括70~80種蛋白編碼基因,30~32種tRNA,4種rRNA[3]。
通常情況下,葉綠體基因組的基因數(shù)量、基因順序及結(jié)構(gòu)組成相對(duì)穩(wěn)定[4],但由于成長(zhǎng)歷程和遺傳背景等方面的差異,不同類(lèi)群間基因組有時(shí)會(huì)發(fā)生插入/缺失、重復(fù)、倒位、重排等不同形式的結(jié)構(gòu)變異和基因丟失現(xiàn)象[5]。同時(shí),相比于核基因,葉綠體基因組具有相對(duì)穩(wěn)定、長(zhǎng)度較短、易獲取、包含信息量大、變異速率適中[6]等特點(diǎn)。這些基因組的結(jié)構(gòu)變異和基因丟失現(xiàn)象對(duì)研究植物系統(tǒng)進(jìn)化具有重要參考意義,基因組自身特點(diǎn)使其成為植物系統(tǒng)發(fā)育分析的優(yōu)勢(shì)選擇。
殼斗科(Fagaceae)為雙子葉植物,亦名山毛櫸科,共8個(gè)屬,900多個(gè)物種,其中多為重要的藥用植物,如黃櫟(Cyclobalanopsisdelavayi)、柯樹(shù)(Lithocarpusglaber)等用作藥材,具有解毒、止咳、安神、健胃等功效[7];栗子不僅可食用,且具有健脾補(bǔ)腎、活血止血的療效;栗花可用于治療瀉痢、便血,栗樹(shù)皮可用于治療丹毒、口瘡等。同時(shí),關(guān)于殼斗科植物化學(xué)成分的研究報(bào)道顯示,殼斗科植物內(nèi)含有單寧類(lèi)化合物、三萜、黃酮、蛋白、色素、有機(jī)酸、生物堿等成分,這些成分具有抗菌、抗炎、抗氧化等生物活性[8]。
本研究利用殼斗科已測(cè)序發(fā)表的葉綠體基因組進(jìn)行比較分析,初步揭示殼斗科葉綠體基因組的結(jié)構(gòu)特征和變異,闡明IR區(qū)邊界的擴(kuò)張與收縮問(wèn)題,展示殼斗科物種間進(jìn)化關(guān)系,為進(jìn)一步研究殼斗科基因組進(jìn)化奠下基礎(chǔ)。
在GenBank中檢索殼斗科已發(fā)表葉綠體基因組序列的物種信息,下載其基因組序列,獲取注釋信息。檢索所得用于分析的物種名稱(chēng)、基因組序列GenBank登錄號(hào)列于表1,共計(jì)14個(gè)物種。
表1所選取的殼斗科物種及其葉綠體基因組GenBank登錄號(hào)
Table1TheselectedFagaceaespeciesandtheirchloroplastGenBankaccessionnumber
科Family屬Genus種SpeciesGenBank登錄號(hào)GenBank No.殼斗科Fagaceae櫟屬Q(mào)uercus L.栗屬Castanea Mill.錐屬Castanopsis(D. Don) Spach青岡屬Cyclobalanopsis Oerst.柯屬Lithocarpus Bl.三棱櫟屬Trigonobalanus Forman橿子櫟Quercus baroniiKT963087.1栓皮櫟Quercus variabilisKU240009.1匙葉櫟Quercus dolicholepisKU240010.1北美紅櫟Quercus rubraJX970937.1槲櫟Quercus alienaKU240007.1川滇高山櫟Quercus aquifolioidesNC_026913.1刺葉高山櫟Quercus spinosaNC_026907.1錐栗Castanea henryiNC_033881.1Castanea pumilaKM360048.1華南錐Castanopsis concinnaNC_033409.1短刺錐Castanopsis echidnocarpaNC_023801.1華南青岡Cyclobalanopsis edithiaeKU382355.1猴面柯Lithocarpus balansaeKP299291.1三棱櫟Trigonobalanus doichangensisNC_023959.1
通過(guò)注釋信息獲得14個(gè)物種的基因組大小、GC量、各部分(LSC、SSC、IR)長(zhǎng)度、基因類(lèi)型及長(zhǎng)度等基本信息,利用Excel進(jìn)行統(tǒng)計(jì),分析各物種基因組間差異。對(duì)于未知LSC/SSC/IRs長(zhǎng)度的葉綠體基因組(如猴面柯、短刺錐、華南青岡等)首先使用Blast進(jìn)行自身序列比對(duì),獲取IR區(qū)長(zhǎng)度信息,然后確定IR區(qū)邊界,進(jìn)而得出LSC和SSC的長(zhǎng)度信息。
使用14個(gè)物種的葉綠體全基因組序列進(jìn)行系統(tǒng)發(fā)育分析。采用ClustalX 2.0做多重序列比對(duì),選擇默認(rèn)參數(shù),Jukes-Canter進(jìn)行序列間的差異度校正。應(yīng)用MEGA 7.0的NJ(neighbor-joining)法中的p-distance模型構(gòu)制系統(tǒng)進(jìn)化樹(shù),進(jìn)行1 000次重復(fù),選取近緣種樺木科榛(Corylusheterophylla,GenBank登錄號(hào)KX822769.2)作為外類(lèi)群。
殼斗科葉綠體基因組相對(duì)保守,均為包含1個(gè)LSC、1個(gè)SSC、2個(gè)IR的四分體結(jié)構(gòu),未檢測(cè)到區(qū)域堿基大片段的缺失。全基因組大小在159 938~161 304 bp,其中北美紅櫟最大,三棱櫟最小,僅相差1 366 bp。LSC長(zhǎng)度在89~90 kB,差異1 222 bp,SSC為18~19 kB,相差557 bp,IR大小均為25 kB,不同物種間僅有數(shù)百個(gè)堿基差異。大多數(shù)物種的2個(gè)IR區(qū)長(zhǎng)度一致,但川滇高山櫟、刺葉高山櫟、三棱櫟的IRa與IRb區(qū)域相差1~3 bp,華南錐差異19 bp。葉綠體基因組GC含量全部為36%,不同物種間最大差異僅0.28%,栗屬的2個(gè)物種則完全一致(表2)。
表2 殼斗科葉綠體基因組的結(jié)構(gòu)比較
基因數(shù)量在殼斗科各物種間有所變化,總基因數(shù)在115~137個(gè)(表2),川滇高山櫟數(shù)量最少,僅有115個(gè),北美紅櫟最多,有137個(gè)。在所有基因中,rRNA的數(shù)量最為保守,均為8個(gè)。tRNA數(shù)目在29~46個(gè),其中大多數(shù)物種約為40個(gè),但川滇高山櫟、刺葉高山櫟、華南青岡等3個(gè)物種的tRNA數(shù)目約為30個(gè),引起差異的主要原因是缺少trnK、trnM、trnL、trnV、trnT、trnI、trnA等基因;華南錐為46個(gè),因其基因組中trnG、trnF、trnP、trnC、trnN等基因的數(shù)量較多。蛋白編碼基因?yàn)?8~89個(gè),檢測(cè)到infA、petG、rpl22、ψycf1(ycf1假基因)、ycf15等多個(gè)基因發(fā)生缺失,infA基因在川滇高山櫟、錐栗、C.pumila、三棱櫟等4個(gè)物種的葉綠體基因組中發(fā)生丟失,petG基因在華南錐、短刺錐中丟失,rpl22基因在錐栗、C.pumila、華南青岡、三棱櫟中丟失,ycf1假基因在川滇高山櫟、刺葉高山櫟、錐栗的葉綠體基因組中丟失,ycf15基因在除北美紅櫟、刺葉高山櫟、華南青岡以外的11個(gè)物種中丟失。此外,川滇高山櫟還丟失psbI、psaI、petL、psaJ、rps16、rpl32等6個(gè)基因,華南錐丟失rps12基因和petD基因,三棱櫟丟失了ycf1基因。
北美紅櫟、華南錐、短刺錐、猴面柯、三棱櫟等5個(gè)物種在進(jìn)化過(guò)程中發(fā)生了基因替換事件,由lhbA基因替換了原有的psbZ基因。華南青岡的rps7基因和ycf15基因位置發(fā)生了顛倒。猴面柯物種的葉綠體基因組插入了1個(gè)orf188蛋白編碼基因。
對(duì)殼斗科14個(gè)物種的葉綠體基因組蛋白編碼基因長(zhǎng)度進(jìn)行分析,發(fā)現(xiàn)主要有32個(gè)蛋白編碼基因長(zhǎng)度發(fā)生變異,其中包括12個(gè)含內(nèi)含子基因和20個(gè)無(wú)內(nèi)含子基因。華南錐物種的變異程度較高,有55個(gè)蛋白編碼基因長(zhǎng)度發(fā)生了變化。
在12個(gè)含內(nèi)含子的蛋白編碼基因中,基因長(zhǎng)度變異的主要類(lèi)型是內(nèi)含子的丟失、編碼區(qū)或內(nèi)含子長(zhǎng)度的改變(表3)。華南錐的葉綠體基因組缺失了petB、rpl16、ndhA基因的內(nèi)含子,短刺錐物種缺失了rps12、petD、rpl16、ndhA基因的內(nèi)含子,華南青岡的葉綠體基因組缺失了rps16、rps12、petD、petB和rpl16基因的內(nèi)含子,猴面柯、三棱櫟、川滇高山櫟等3個(gè)物種丟失了rps12基因內(nèi)含子。ndhA基因在大多數(shù)物種中基因長(zhǎng)度和編碼區(qū)長(zhǎng)度為2 140 bp和1 100 bp左右,而在刺葉高山櫟中基因長(zhǎng)度和編碼區(qū)長(zhǎng)度均發(fā)生了變化,在華南錐和短刺錐2個(gè)物種中編碼區(qū)長(zhǎng)度為597和567 bp,缺失了約500 bp。rpl16、ycf3、petB等基因的編碼區(qū)在大部分物種中具有一致長(zhǎng)度,但其內(nèi)含子區(qū)長(zhǎng)度的改變導(dǎo)致了基因總長(zhǎng)的變化。
表3殼斗科葉綠體基因組中含內(nèi)含子蛋白編碼基因的全長(zhǎng)和編碼區(qū)長(zhǎng)度
Table3ThechloroplastgenomeofFagaceaecontainsthefull-lengthcodingregionofintronproteinandthelengthofcoding
物種SpeciesndhAndhBatpFrpoC1ycf3clpPpetBrpl2rpl16petDrps12rps16橿子櫟Q.baronii2135/10922213/15331334/5552892/20581996/5072082/5911480/6481509/8611509/4081123/483798/2611133/276栓皮櫟Q.variabilis2130/10922213/15331335/5552885/20582006/5072086/5911480/6481489/8611510/4081123/483798/2611141/237匙葉櫟Q.dolicholepis2132/10922213/15331336/5552893/20581997/5072082/5911483/6481509/8611510/4081123/483798/2611174/270北美紅櫟Q.rubra2139/10922213/15331350/5552887/20581984/5072088/5911481/6481529/8611516/4081145/504798/2611173/270槲櫟Q.aliena2132/10922213/15331336/5552893/20581997/5072082/5911483/6481509/8611510/4081123/483798/2611174/270川滇高山櫟Q.aquifolioides2129/10952213/15361335/5582878/20521995/5102076/5911490/6481529/8281515/4081143/504231/231刺葉高山櫟Q.spinosa1881/10112214/15331339/5582888/20521995/5102087/5911480/6481529/8281511/4081123/483798/2611173/258錐栗C.henryi2143/10922213/15331359/5552887/20581996/5072082/5911481/6481509/8251516/4081101/483794/2581181/270C.pumila2136/10922213/15331331/5552881/20581986/5072080/5911479/6481509/8251512/4081101/483797/2611154/270華南錐C.concinna597/5972213/15751356/5612909/20971995/5252119/642531/5311527/948411/4111147/330短刺錐C.echidnocarpa567/5672213/15331342/5552885/20611986/5072087/5911496/6481509/861360/360525/525243/2431172/270華南青岡C.edithiae2149/10952213/15481328/5552886/20611986/5072083/588687/6871529/864411/411525/525240/240222/222猴面柯L.balansae2133/10892213/15331347/5552884/20581989/5072092/5911490/6481509/8611511/4081128/483243/2431173/276三棱櫟T.doichangensis2166/10922213/15331383/5702881/20581981/5072090/5911489/6481509/8641525/4081123/483243/2431177/276
表4 殼斗科葉綠體基因組中部分不含內(nèi)含子的蛋白編碼基因長(zhǎng)度
圖1 殼斗科物種葉綠體基因組的4部分IR區(qū)邊界比較 灰色方框代表基因,紫色方框代表基因重疊區(qū)域,藍(lán)色方框代表LSC區(qū),綠色方框代表SSC區(qū),橙色方框代表IR區(qū);圖形大小與實(shí)際長(zhǎng)度不成比例,且基因與LSC、SSC和IR區(qū)長(zhǎng)度不成比例。Fig.1 Comparisons of 4 regions IR region boundary of chloroplast genomes in Fagaceae Gray boxes represent genes,purple boxes represent overlapping regions of genes,blue boxes represent LSC regions,green boxes represent SSC regions,orange boxes represent IR regions; size of the profile is not proportional to actual length,and gene length is not proportional to the lengths of LSC,SSC and IR regions.
20個(gè)無(wú)內(nèi)含子的蛋白編碼基因長(zhǎng)度在各個(gè)物種間均發(fā)生不同程度的變異(表4)。同屬之間,變異程度相近,錐栗和C.pumila2個(gè)同屬間物種的matK、atpI、psbC、ndhK、rbcL、ycf1等基因在變異后長(zhǎng)度一致。ndhF基因長(zhǎng)度在三棱櫟中為1 506 bp,而在其他13個(gè)物種中均為2 250 bp左右,缺失了約750 bp的片段。ndhH基因在刺葉高山櫟中為972 bp,在華南錐中1 197 bp,而在其他12個(gè)物種中均為1 182 bp,則刺葉高山櫟的ndhH基因長(zhǎng)度缺失210 bp。ycf1假基因長(zhǎng)度約1 100 bp,而在三棱櫟中為795 bp,推測(cè)其是在復(fù)制過(guò)程中發(fā)生了丟失。rpl22基因在部分物種中完全缺失,在未缺失物種中具有不同的長(zhǎng)度,說(shuō)明基因序列是在進(jìn)化過(guò)程中逐漸退化的。
葉綠體基因組的環(huán)狀結(jié)構(gòu)特征使2個(gè)反向復(fù)制的IR區(qū)與LSC及SSC間存在4個(gè)邊界,既IRb-LSC、IRb-SSC、IRa-SSC和IRa-LSC。在基因組進(jìn)化過(guò)程中,4個(gè)邊界會(huì)發(fā)生擴(kuò)張或收縮,使得有些基因進(jìn)入到IR區(qū)域,或者使有些基因進(jìn)入到單拷貝區(qū),每個(gè)物種邊界處序列復(fù)制的程度不同。通過(guò)比較發(fā)現(xiàn),殼斗科葉綠體基因組的絕大多數(shù)邊界較為保守,但極少數(shù)邊界存在擴(kuò)張或收縮現(xiàn)象(圖1)。IRb-LSC邊界在大部分物種中與rps19基因存在8~32 bp的間隔,而在錐栗、C.pumila和華南錐3個(gè)物種中則位于rps19基因內(nèi),且三棱櫟物種的該邊界與rps19基因距離423 bp。大多數(shù)物種的IRb-SSC邊界處于ycf1假基因上,但C.pumila的該邊界位于ycf1假基因和ndhF基因的重疊區(qū)內(nèi),錐栗的位于ndhF基因內(nèi);IRb-SSC邊界和ndhF基因間的間隔一般為1~25 bp,而在三棱櫟物種中間隔為1 023 bp。IRa-SSC邊界在除三棱櫟外的其他所有物種中均位于ycf1基因內(nèi),ycf1基因存在于IRa區(qū)中的序列長(zhǎng)度在828~1 107 bp,差異較小。IRa-LSC邊界與LSC上的trnH基因間具有較短間隔,長(zhǎng)度分別為1、8、12、15和16 bp,其中16 bp為主要類(lèi)型。
以殼斗科14個(gè)物種的葉綠體全基因組序列為研究基底,以榛為外類(lèi)群,構(gòu)建了系統(tǒng)發(fā)育樹(shù)。如圖2所示,在所構(gòu)建的系統(tǒng)發(fā)育樹(shù)中,絕大部分的節(jié)點(diǎn)都具有較高的支持率,殼斗科的14個(gè)物種間展示出了明確的系統(tǒng)關(guān)系。三棱櫟物種位于系統(tǒng)發(fā)育樹(shù)的基部,是殼斗科植物中最早分離出來(lái)的物種,其余的13個(gè)殼斗科植物共同聚到1個(gè)大分支中,該分支又可分為2個(gè)亞分支,亞分支Ⅰ和亞分支Ⅱ。亞分支Ⅱ僅包括猴面柯,作為1個(gè)基部分支,說(shuō)明猴面柯是殼斗科物種中較早分化出來(lái)的類(lèi)群。亞分支Ⅰ則由櫟屬、栗屬、錐屬、青岡屬等4個(gè)屬的12個(gè)物種聚成,其中栗屬和錐屬的2個(gè)分支呈姐妹關(guān)系,不同屬的刺葉高山櫟與華南青岡物種聚為一支,且該支較早分離出來(lái)并獲得100%的高支持率。
圖2 基于殼斗科葉綠體全基因組序列構(gòu)建的系統(tǒng)發(fā)育樹(shù)Fig.2 Phylogenetic tree based on chloroplast genome sequence of Fagaceae
被子植物葉綠體基因組多以典型的環(huán)式雙鏈結(jié)構(gòu)形式存在,2個(gè)反向復(fù)制區(qū)將基因組分隔成大單拷貝區(qū)和小單拷貝區(qū),基因組大小在120~180 kB,其結(jié)構(gòu)和序列相對(duì)保守,極少發(fā)生大程度變異[9]。14個(gè)殼斗科物種的葉綠體基因組結(jié)構(gòu)均包含1個(gè)LSC區(qū)、1個(gè)SSC區(qū)、2個(gè)IR區(qū),大小為159~161 kB,與上述被子植物葉綠體基因組基本結(jié)構(gòu)特征相吻合,與雙子葉原始類(lèi)群煙草相比較,基因組有所增大。同時(shí)發(fā)現(xiàn),殼斗科14個(gè)物種間基因組大小差異1 366 bp,LSC長(zhǎng)度差異1 222 bp,則LSC區(qū)域變異占全基因組變異的絕大部分,因此認(rèn)為整個(gè)基因組長(zhǎng)度的差異主要是由LSC長(zhǎng)度的差異引起的[10~11]。
葉綠體基因組具有較高的基因轉(zhuǎn)換能力,以確保2個(gè)IR反向復(fù)制區(qū)序列的一致與穩(wěn)定,從而增強(qiáng)其自身的穩(wěn)定性和保守性[12],但在物種不斷進(jìn)化過(guò)程中,仍有一些類(lèi)群的IR區(qū)發(fā)生較大程度變異。如被子植物葉綠體基因組IR區(qū)大小多為20~30 kB,而天竺葵屬的IR區(qū)長(zhǎng)達(dá)75 kB[13],老鸛草屬的短至11 kB,牻牛兒苗屬和一些豆科植物的則完全丟失[14]。殼斗科葉綠體基因組的IR區(qū)相對(duì)穩(wěn)定和保守,大小均為25 kB,沒(méi)有出現(xiàn)區(qū)域過(guò)長(zhǎng)、過(guò)短或者丟失的現(xiàn)象,且大部分物種中2個(gè)IR區(qū)長(zhǎng)度一致,但川滇高山櫟、刺葉高山櫟、三棱櫟和華南錐4個(gè)物種由于IRa區(qū)或者IRb區(qū)內(nèi)若干堿基的插入/缺失而導(dǎo)致長(zhǎng)度不一致。
殼斗科葉綠體基因組基因總數(shù)在115~137個(gè),各物種間數(shù)量有所差異,其中rRNA基因均為8個(gè),因此差異主要來(lái)自tRNA基因和蛋白編碼基因,trnK、trnM、trnF、trnP等多個(gè)tRNA基因在葉綠體基因組中缺失或增多,infA、petG、rpl22、ycf1、ycf15等多個(gè)蛋白編碼基因在部分物種中丟失。在葉綠體基因組中,基因丟失現(xiàn)象較為常見(jiàn),如rpl22、rpl23、accD、ycf1、rps16、infA等基因在豆科植物的葉綠體基因組中發(fā)生部分或全部丟失[15],ycf1、ycf2、accD基因在整個(gè)禾本科植物中全部丟失[16]。ycf1基因是一個(gè)較大的開(kāi)放閱讀框,在大部分被子植物中具有2個(gè)拷貝,一個(gè)拷貝為完整基因,另一個(gè)拷貝則由于被IRb-SSC邊界所截?cái)?,為一個(gè)假基因[10],而在殼斗科的川滇高山櫟、刺葉高山櫟、錐栗和三棱櫟4個(gè)物種的葉綠體基因組中則完全丟失了ycf1的一個(gè)拷貝,結(jié)合殼斗科植物特征推斷,其可能是與IRs的擴(kuò)張或收縮有關(guān)。rpl22基因在殼斗科部分類(lèi)群的葉綠體基因組中丟失,但在部分類(lèi)群的核基因組中出現(xiàn),研究推測(cè)是從葉綠體基因組中轉(zhuǎn)移而來(lái),在細(xì)胞核中進(jìn)行轉(zhuǎn)錄,然后再將編碼的蛋白轉(zhuǎn)運(yùn)回葉綠體參與生命活動(dòng)[17]。
殼斗科植物的80多個(gè)蛋白質(zhì)編碼基因中,主要有32個(gè)基因的長(zhǎng)度發(fā)生變異,其變異的主要原因是內(nèi)含子的丟失、編碼區(qū)或內(nèi)含子長(zhǎng)度的改變。如rps16、ndhA、rps12、petD等基因在不同物種的葉綠體基因組中發(fā)生內(nèi)含子的丟失,rpl16、ycf3、petB等基因的編碼區(qū)在大部分物種中具有一致的長(zhǎng)度,但因其內(nèi)含子區(qū)長(zhǎng)度的改變而導(dǎo)致了基因長(zhǎng)度的變化,ndhA基因在殼斗科植物中內(nèi)含子的丟失、編碼區(qū)和內(nèi)含子長(zhǎng)度改變等均有發(fā)生。同時(shí),殼斗科植物的一些基因長(zhǎng)度變化表現(xiàn)出了一定的系統(tǒng)進(jìn)化關(guān)系,如matK、atpI、psbC、ndhK、rbcL等基因的長(zhǎng)度在大部分物種中較為穩(wěn)定,只在少數(shù)物種中發(fā)生變化,而這些物種多具有很近的親緣關(guān)系。
在葉綠體基因組進(jìn)化過(guò)程中,IR區(qū)為延展或者收縮的區(qū)域,即4個(gè)IR邊界在同屬或不同屬物種間產(chǎn)生滑動(dòng)的現(xiàn)象時(shí)有發(fā)生,使得葉綠體基因組大小出現(xiàn)較大差異。在十字花科[10]和五加科[11]中,IRb-LSC邊界均位于rps19基因內(nèi)部,而在殼斗科中,IRb-LSC邊界在大多數(shù)植物中與LSC上的rps19基因存在8~32 bp的較小間隔,但在錐栗、C.pumila、華南錐中則由于邊界的擴(kuò)張而位于rps19基因內(nèi)部,在三棱櫟中由于邊界的收縮而與rps19基因具有較大間隔。與五加科[11]相同,大多數(shù)殼斗科植物的IRb-SSC邊界位于ycf1假基因內(nèi)部,而C.pumila、錐栗2個(gè)物種的邊界由于擴(kuò)張而分別位于ycf1假基因與ndhF基因重疊區(qū)內(nèi)和ndhF基因內(nèi)。IRa-SSC邊界均位于ycf1基因上,但邊界的收縮或擴(kuò)張使得ycf1基因存在于IRa中的長(zhǎng)度具有一定差異。殼斗科的IRa-LSC邊界與LSC上的trnH基因間具有穩(wěn)定間隔,且trnH基因僅有1個(gè)拷貝,而剪股穎、大麥、高粱等單子葉植物的trnH基因雖同樣在LSC上,卻具有2個(gè)拷貝,這是由于邊界擴(kuò)張使得trnH基因首先進(jìn)入到IR區(qū),從1個(gè)拷貝變成2個(gè)拷貝,之后邊界又發(fā)生收縮,使2個(gè)拷貝的trnH基因回歸到LSC區(qū)內(nèi)[18],這表明雙子葉植物與單子葉植物邊界變化存在較大差異。
前人通過(guò)現(xiàn)有化石資料、地理信息系統(tǒng)技術(shù)等對(duì)殼斗科及其各屬的起源時(shí)間、地理分布進(jìn)行了大量研究,結(jié)果顯示,三棱櫟屬的物種化石最早出現(xiàn),青岡屬較櫟屬更接近祖先類(lèi)群[19];柯屬、錐屬、青岡屬、櫟屬、栗屬間的空間分布區(qū)較相似,三棱櫟屬與其他屬的空間分布區(qū)相似性較低[20]。本研究利用殼斗科植物6個(gè)屬14個(gè)物種的葉綠體全基因組序列構(gòu)建了系統(tǒng)發(fā)育樹(shù),該發(fā)育樹(shù)具有良好的分辨率,各個(gè)進(jìn)化支獲得較高的支持率,各個(gè)屬間表現(xiàn)較明確的發(fā)育關(guān)系,各屬歸類(lèi)與傳統(tǒng)分類(lèi)學(xué)基本一致。三棱櫟位于發(fā)育樹(shù)的基部進(jìn)化支,說(shuō)明三棱櫟是14個(gè)殼斗科物種中較早分化的一個(gè)類(lèi)群,與前人研究結(jié)果相同。不同屬的刺葉高山櫟與華南青岡物種聚為一支,并位于所在小分化支的基部,說(shuō)明刺葉高山櫟較其他櫟屬物種更早分化出來(lái),且與華南青岡物種有很近的親緣關(guān)系,與傳統(tǒng)分類(lèi)學(xué)中兩者原為一屬[21]的說(shuō)法相一致。
本研究以殼斗科14個(gè)已測(cè)序物種的葉綠體基因組為基礎(chǔ)來(lái)進(jìn)行比較研究,揭示了殼斗科葉綠體基因的一般結(jié)構(gòu)及變異特征,并基于葉綠體全基因組序列構(gòu)建系統(tǒng)發(fā)育樹(shù),闡明了物種間的發(fā)育關(guān)系。但目前已測(cè)序的物種僅僅占整個(gè)殼斗科物種的極小部分,未來(lái)還將需要獲得更多殼斗科物種的葉綠體基因序列,從而進(jìn)一步了解殼斗科葉綠體基因組基本特征和進(jìn)化規(guī)律。