鐘浩天 ,蔣莉萍 ,江宇慧 ,胡志剛 ,余 坤 ,2,劉義飛 ,森 林 ,2**
(1. 湖北中醫(yī)藥大學(xué)藥學(xué)院 武漢 430065;2. 湖北中醫(yī)藥大學(xué)教育部重點(diǎn)實(shí)驗(yàn)室 武漢 430065)
菝葜(Smilax chinaL.)又名金剛藤,為百合科菝葜屬藥用植物[1]。菝葜主要自然分布于海拔2000 m 以下的林下、灌叢中或山坡上,以湖北、湖南、江蘇、四川等省野生資源居多[2]。目前湖北為菝葜栽培種植的主產(chǎn)區(qū),相應(yīng)的菝葜藥材品質(zhì)也具有優(yōu)勢(shì)[3-5]。2019年菝葜(金剛藤)被納入了湖北省首批道地藥材“一縣一品”優(yōu)勢(shì)單品在通城縣進(jìn)行重點(diǎn)培育。通城縣菝葜藥材大規(guī)模種植處于國(guó)內(nèi)領(lǐng)先地位,其種子質(zhì)量標(biāo)準(zhǔn)、肥料的使用和基地生態(tài)環(huán)境等方面的技術(shù)也有重大突破[6-7]。迄今為止,全國(guó)范圍內(nèi)菝葜藥材已產(chǎn)生了可觀的社會(huì)、經(jīng)濟(jì)與生態(tài)效益,并在藥材產(chǎn)業(yè)化發(fā)展中積累了寶貴的經(jīng)驗(yàn)。
菝葜具有抗炎、抗腫瘤及抗菌等藥理作用,可用于治療痛風(fēng)和痢疾水腫等疾病[8-10]。傳統(tǒng)中醫(yī)理論認(rèn)為菝葜具有利濕去濁、祛風(fēng)除痹、解毒散瘀等功效,也被運(yùn)用于各種中成藥當(dāng)中,如金剛藤膠囊和疏風(fēng)活絡(luò)丸等?!吨袊?guó)藥典》規(guī)定菝葜主要以根莖入藥,為不規(guī)則塊狀或彎曲扁柱形,有結(jié)節(jié)狀隆起,表面黃棕色或紫棕色,具圓錐狀突起的莖基痕,并殘留堅(jiān)硬的刺狀須根殘基或細(xì)根[1]。另外,其同屬物種光葉菝葜(俗稱(chēng)土茯苓)同樣屬于藥典品種,在湖北有部分分布,作為商品時(shí)也有混淆的現(xiàn)象出現(xiàn)。
葉綠體基因組變異序列廣泛用于植物的分子標(biāo)記開(kāi)發(fā)、分子鑒定和系統(tǒng)發(fā)育關(guān)系分析等研究工作。國(guó)內(nèi)科研團(tuán)隊(duì)主要利用葉綠體基因序列,建立了適用于中草藥分子鑒定的“DNA 條形碼技術(shù)”[11-13]。在中藥骨碎補(bǔ)的研究中,通過(guò)高通量測(cè)序和精細(xì)組裝獲得了7 種槲蕨近緣物種的葉綠體基因組全序列,進(jìn)一步提出利用葉綠體基因組高變區(qū)建立超級(jí)DNA 條形碼的建議[14]。高通量測(cè)序的技術(shù)進(jìn)步,包括讀長(zhǎng)較短的二代技術(shù)和讀長(zhǎng)較長(zhǎng)的三代技術(shù)[15]進(jìn)一步促進(jìn)了植物葉綠體基因組的組裝和研究。在葉綠體基因組的組裝中,短讀長(zhǎng)測(cè)序因建庫(kù)缺陷所缺失的信息會(huì)降低組裝精度;而長(zhǎng)讀長(zhǎng)測(cè)序卻存在相對(duì)較高的每堿基錯(cuò)誤率(10%-15%)[16],同樣限制了組裝精度。而新出現(xiàn)的以Unicycler 軟件為代表的算法[17],它針對(duì)細(xì)菌基因組[18]和植物葉綠體基因[20]的環(huán)狀結(jié)構(gòu),將短讀長(zhǎng)與長(zhǎng)讀長(zhǎng)數(shù)據(jù)結(jié)合起來(lái)組裝環(huán)形基因組,可獲得更加準(zhǔn)確的結(jié)果。
目前對(duì)菝葜屬植物系統(tǒng)發(fā)育關(guān)系相關(guān)的研究較少。Kim 等利用葉綠體基因組中rbcL等4 個(gè)基因?qū)Π俸峡葡到y(tǒng)發(fā)育關(guān)系進(jìn)行確定,其中菝葜屬與油點(diǎn)草屬關(guān)系最近,郁金香屬、豬牙花屬和老鴉瓣屬聚為一支,百合屬與貝母屬聚為一支且離菝葜屬最遠(yuǎn)[19]。此外,百合科祖先物種分化時(shí)間主要位于在99.9Mya 到125.1Mya 之間[20-21],而對(duì)菝葜屬的報(bào)道出現(xiàn)了不同的記錄,其中包括古新世晚期-始新世早期(48.6-55.8 Mya)以及始新世中期(37.2-48.6 Mya)[22-23]。
本研究的材料來(lái)自湖北通城的菝葜幼嫩葉片,擬借助Nova-seq6000 及PromethlON 高通量測(cè)序平臺(tái)獲得充足的序列信息并探索最佳組裝方案。隨后對(duì)菝葜在百合科中的系統(tǒng)發(fā)育地位以及與分化時(shí)間進(jìn)行分析,探明菝葜的正確進(jìn)化分類(lèi)學(xué)地位。此外與近緣物種葉綠體基因組結(jié)構(gòu)進(jìn)行比較分析,對(duì)其蛋白質(zhì)編碼基因區(qū)的不同基因所受的選擇壓力進(jìn)行分析,進(jìn)而篩選適宜的SSR 引物,為菝葜中藥材資源鑒定和品質(zhì)評(píng)價(jià)分析提供理論基礎(chǔ)和方法保證。
本研究中所用的菝葜植物材料來(lái)源見(jiàn)表1,由湖北中醫(yī)藥大學(xué)汪樂(lè)原教授鑒定為百合科菝葜屬菝葜(S.china)。采用改良后的CTAB(十六烷基三甲基溴化銨)法對(duì)菝葜幼嫩葉片基因組DNA 進(jìn)行提取,將液氮速凍后的葉片進(jìn)行打粉,對(duì)粉末進(jìn)行預(yù)處理,抑制脫氧核糖核酸酶活性并去除糖類(lèi)及酚類(lèi)等雜質(zhì),利用CTAB 溶液溶解細(xì)胞膜使核酸沉淀,通過(guò)氯仿:異戊醇(24:1)去除蛋白質(zhì)雜質(zhì),吸取其上清液使其中的核酸于異丙醇中沉淀,最后利用70%乙醇和無(wú)水乙醇進(jìn)行脫 色 ,得 到 DNA 母 液 。 使 用 Nova-seq6000 及PromethlON 高通量測(cè)序平臺(tái)開(kāi)展測(cè)序,采用fastp 軟件[24]對(duì)短讀長(zhǎng)數(shù)據(jù)(short reads)進(jìn)行質(zhì)量控制,利用NanoFilt軟件[25]對(duì)長(zhǎng)讀長(zhǎng)數(shù)據(jù)(long reads)開(kāi)展預(yù)處理。將NCBI 公開(kāi)數(shù)據(jù)庫(kù)中的菝葜葉綠體基因組(NC_049022.1)作為組裝引導(dǎo)序列[26],采用 Canu 軟件[27]組裝長(zhǎng)讀長(zhǎng)數(shù)據(jù)結(jié)果,并用Unicycler 軟件[17]開(kāi)展短讀長(zhǎng)數(shù)據(jù)獨(dú)立組裝和長(zhǎng)短讀長(zhǎng)數(shù)據(jù)混合組裝,將結(jié)果與NCBI參考序列進(jìn)行比對(duì),并利用Sanger 測(cè)序進(jìn)行驗(yàn)證。所得結(jié)果提交NCBI 的 GenBank 庫(kù),獲得登錄號(hào)No:OL372240。
表1 本實(shí)驗(yàn)所用的菝葜植物材料信息
基于組裝后的目標(biāo)序列,使用GeSeq(https://chlorobox.mpimp-golm.mpg.de/geseq.html)軟件[28]對(duì)菝葜葉綠體基因組進(jìn)行注釋?zhuān)h(huán)形圖使用Circos 軟件[29]進(jìn)行繪制(圖1)。
本文所引用數(shù)據(jù)集來(lái)自NCBI 公開(kāi)數(shù)據(jù)庫(kù),參考百合科[19,30-31]和菝葜屬[26]的相關(guān)研究選取來(lái)自于百合科中16 個(gè)族內(nèi)的23 個(gè)屬共79 個(gè)物種,并以寬葉香蒲(Typha latifoliaL.,NC_013823)、黑三棱(Sparganium stoloniferum(Graebn.) Buch. -Ham. ex Juz., NC_044634)、美人蕉(Canna indicaL.,MN832865)、粉鳥(niǎo)蝎尾蕉(Heliconia collinsianaGriggs,NC_020362)及穴芭蕉(Musa troglodytarumL.,NC_056833)作為外類(lèi)群。以84 個(gè)物種葉綠體基因組全部完整的編碼基因所編碼蛋白質(zhì)的氨基酸序列信息作為數(shù)據(jù)集,通過(guò)OrthoFinder(v2.5.2)軟件[32]利用 MAFFT(v7.486)[33]進(jìn)行多序列比對(duì),后利用ProtTest(v3.4.2)軟件[34]進(jìn)行檢驗(yàn),AIC 與BIC 檢測(cè)結(jié)果均指示HIVb+I+G 為最適替換模型,隨后通過(guò)RAxML(v8.2.10)軟件[35-37]構(gòu)建系統(tǒng)發(fā)育樹(shù)。并以最佳合議樹(shù)作為時(shí)間尺度系統(tǒng)發(fā)育關(guān)系構(gòu)建的起始樹(shù)。
隨后,基于84個(gè)物種中9個(gè)共有基因(psaA、psaB、psbA、psbB、psbC、psbD、rbcL、petA、petB)作為數(shù)據(jù)集,將RAxML 推測(cè)的最佳合議樹(shù)作為起始樹(shù),利用BEAST(v2.6.4)[38]對(duì)百合科各物種的分歧時(shí)間進(jìn)行考察。在分子鐘假設(shè)下,為將遺傳距離轉(zhuǎn)化為分歧時(shí)間,至少需要一個(gè)可以提供時(shí)間信息的校正點(diǎn),本實(shí)驗(yàn)中使用美人蕉屬(Canna)、芭蕉屬(Musa)和蝎尾蕉屬(Heliconia)(tMRCA為 83Mya)[39]以 及 黑 三 棱 屬(Sparganium)和香蒲屬(Typha)(tMRCA為70Mya)[40-41]的最近共同祖先時(shí)間作為時(shí)間尺度下的系統(tǒng)發(fā)育樹(shù)的校正點(diǎn)。在BEAUti中設(shè)置貝葉斯迭代模型,分子鐘類(lèi)型設(shè)置為Relaxed Clock Log Normal(放松對(duì)數(shù)分子鐘),在BEAST 中對(duì)共84 個(gè)物種葉綠體基因組中的蛋白質(zhì)編碼區(qū)數(shù)據(jù)集進(jìn)行迭代計(jì)算4 × 107代,其中每1000 代保留一代樣本,為對(duì)數(shù)據(jù)的各項(xiàng)參數(shù)收斂程度進(jìn)行考察,把經(jīng)計(jì)算所得的結(jié)果導(dǎo)入Tracer(v1.7.1)軟件中進(jìn)行檢測(cè),確認(rèn)所有參數(shù)的ESS 值均大于200,認(rèn)為之前的運(yùn)算已經(jīng)到達(dá)收斂終點(diǎn)。將BEAST 計(jì)算所得的40000 棵樹(shù)導(dǎo)入TreeAnnotator 中刪去最初的10%樣本,并以后驗(yàn)概率大于95%的部分得到合議樹(shù)。
為了探索百合科中及菝葜屬內(nèi)葉綠體基因組之中的差異,本實(shí)驗(yàn)對(duì)菝葜屬五個(gè)物種菝葜(S.china)、白背牛尾菜(S. nipponicaMiq.)、土茯苓(S.glabraRoxb.)、小葉菝葜(S. microphyllaC. H. Wright)、S.glyciphyllaJ.White、郁金香屬的阿爾泰郁金香(Tulipa altaicaPall. ex Spreng)和萱草屬的萱草(Hemerocallis fulva(L.)L.)等物種進(jìn)行考察,其中S. glyciphylla雖然并無(wú)中文命名,但與菝葜和土茯苓親緣關(guān)系較近,為菝葜屬重要物種,故列入研究對(duì)象。通過(guò)IRscope[42]研究IR區(qū)域邊界的收縮與擴(kuò)張現(xiàn)象,并對(duì)上述物種葉綠體基因組的保守性進(jìn)行分析,使用軟件為mVISTA(https://genome.lbl.gov/vista/mvista/submit.shtml),設(shè)置的模式為Shuffle-LAGAN,使用的參考為NCBI 上的參考葉綠體基因組NC_049022。而對(duì)菝葜屬三物種(S.china、S.glabra、S. glyciphylla)的突變熱點(diǎn)區(qū)域的分析則使用DNAsp(v5.10)[43],窗口長(zhǎng)度600bp,步長(zhǎng)100bp。
通過(guò)對(duì) 3 個(gè)菝葜屬物種(S. china、S.glabra、S.glyciphylla)所共有的76 個(gè)基因兩兩之間Ka/Ks 的計(jì)算[44],以衡量不同基因上所受的選擇壓力。隨后對(duì)84個(gè)物種中rbcL基因進(jìn)行兩兩比對(duì),尋找受正選擇壓力的物種。
使用MISA 軟件[45-46]對(duì)菝葜的全葉綠體基因組序列中所包含的SSR 位點(diǎn)進(jìn)行開(kāi)發(fā),使用的參數(shù)為單核苷酸至少重復(fù)8 次,二核苷酸與三核苷酸至少重復(fù)4次,四、五以及六核苷酸至少重復(fù)3次。
SSR 引物的設(shè)計(jì)在 NCBI 完成(https://www.ncbi.nlm.nih.gov/tools/primer-blast),前后引物長(zhǎng)度為18-22bp,GC含量40%-60%,前后引物距離SSR位點(diǎn)30bp以上,最終產(chǎn)物長(zhǎng)度在100 到500bp。PCR 體系總量25μl ,其中 DNA 1μl,前引物 1μl,后引物 1μl ,ddH2O 9.5μl,2×EsTaqMaster Mix 12.5μl。PCR 程序設(shè)置為95 °C 前處理 3min,后在 95°C 處 30s、50°C 處 30s、72°C處 30s 進(jìn)行擴(kuò)增并循環(huán) 35 次,最后在 72°C 處 10 min 進(jìn)行延伸。本實(shí)驗(yàn)選取表1中的3個(gè)菝葜樣品DNA作為所有引物擴(kuò)增的模板,在擴(kuò)增完成后取6μl 最終的PCR 產(chǎn)物進(jìn)行瓊脂糖凝膠電泳,檢測(cè)是否為單一的清晰條帶且片段長(zhǎng)度是否與預(yù)測(cè)結(jié)果相符,最后通過(guò)Sanger法測(cè)序進(jìn)行評(píng)估。
如表1 所示,采用不同策略開(kāi)展組裝所得葉綠體基因組結(jié)果存在明顯差異。其中下載自NCBI 的參考序列 NC_049022 中的ycf3、ycf4及psbN基因分別被注釋為pafI、pafII及pbf1,Nanopore 測(cè)序數(shù)據(jù)獨(dú)立組裝結(jié)果中基因順序發(fā)生了整體顛倒,且其中IR區(qū)域有部分基因出現(xiàn)3 次復(fù)制。而Illumina 測(cè)序數(shù)據(jù)獨(dú)立組裝結(jié)果的LSC 區(qū)域中trnL-UAA和trnF-GAA基因未出現(xiàn)。結(jié)果表明基于Illumina 與Nanopore 數(shù)據(jù)整合組裝得到的菝葜葉綠體基因組結(jié)果則最為準(zhǔn)確,比NCBI 參考序列短584bp,但能精確注釋86 個(gè)編碼基因。如圖1所示,菝葜葉綠體基因組組裝結(jié)果最終呈現(xiàn)典型的四分結(jié)構(gòu)。如圖2所示,混合組裝具有明顯優(yōu)勢(shì),更能體現(xiàn)現(xiàn)實(shí)中菝葜葉綠體基因組序列的真實(shí)情況。
圖1 基于Unicycler混合組裝的菝葜葉綠體基因組
圖2 差異較大區(qū)域的序列比對(duì)驗(yàn)證
表2 不同測(cè)序技術(shù)所得菝葜葉綠體基因組特征
注:定位在trnT-UGU-trnL-UAA之間的 A(71 bp)、B(8 bp)和C(20 bp)與trnL-UAA中的D(44 bp)和E(15 bp)與petA-psbJ之間的F(32 bp)以及rpl33-rps18之間的H(9 bp),均顯示Sanger 測(cè)序結(jié)果與OL372240更加一致;定位在rpl33-rps18之間的 G(34 bp)和 I(5 bp),顯示Sanger測(cè)序結(jié)果與NC_049022更加一致。
如圖3 所示,百合科被分為兩個(gè)大支,菝葜族的3個(gè)物種聚為一支,并與百合族與油點(diǎn)草族共同為聚為一個(gè)較大的支,最終與重樓族、藜蘆族與嘉蘭族得到百合科主要的兩大支之一,而另外一個(gè)大支由黃精族、沿階草族、鈴蘭族、龍血樹(shù)族、天門(mén)冬族、萱草族、絲蘭族、吊蘭族、蔥族以及蘆薈族組成;其中菝葜屬中約26.5Mya開(kāi)始分化,百合族約83.7Mya出現(xiàn)分化。
本研究表明菝葜及其近緣物種的IR 區(qū)域?yàn)樽畋J氐膮^(qū)域,但I(xiàn)R 區(qū)域的收縮與舒展仍應(yīng)為常見(jiàn),最終可導(dǎo)致葉綠體基因組大小的改變。將菝葜屬的5個(gè)物種IR 邊界與其近緣物種進(jìn)行比較(圖3A),用以考察IR 區(qū)域的收縮與擴(kuò)張。IRb 區(qū)域與LSC 區(qū)域的分界線在T.altaica里位于rps19基因中,而在除S.glabra的菝葜屬物種則出現(xiàn)了一定的擴(kuò)張,到達(dá)了rpl22基因內(nèi);與此同時(shí),菝葜與萱草中的SSC 區(qū)域的序列順序與其他物種的方向完全相反。
如圖3B 所示,基于mVISTA 對(duì)七個(gè)葉綠體基因組的分析表明,其中五個(gè)菝葜屬物種序列相似度較高,與同科不同屬物種差異主要集中在SSC 區(qū)域的ndhF到ndhD之間,而在LSC 區(qū)域則較為普遍,主要位于非編碼區(qū)域之中。
圖3 菝葜與其近緣物種的比較分析
另外,利用DNAsp 鑒別菝葜屬3 物種(S.china、S.glabra、S.glyciphylla)全葉綠體基因組的突變熱點(diǎn)區(qū)域(圖1 第八環(huán))。核苷酸多態(tài)性值范圍為0 到0.05278,其中ndhH區(qū)域的核苷酸多態(tài)性最高,為0.05278,隨后是ndhE-psaC區(qū)域、rps15-ndhH區(qū)域以及pafII-cemA區(qū)域,其中除pafII-cemA區(qū)域處于LSC 區(qū)域外另三個(gè)均位于SSC區(qū)域中。
本研究使用同義置換率(Ks)與非同義置換率(Ka)來(lái)決定特定基因上可能存在的選擇壓力。如圖1第五、六、七環(huán)所示,通過(guò)計(jì)算S. china、S. glabra、S.glyciphylla等三個(gè)物種所共有的76個(gè)蛋白質(zhì)編碼基因的Ka/Ks值以確定這些基因上所受的選擇壓力。通常認(rèn)為Ka/Ks 大于1 則認(rèn)為該基因受到了正選擇,小于1則受到純化選擇,等于1 時(shí)則可能出現(xiàn)中性進(jìn)化[47]。計(jì)算表明,在S. china和S. glyciphylla之間有accD與rbcL的Ka/Ks分別為1.304和1.597,S.china與S.glabra之間有ndhE為 1.721,而S.glabra與S.glyciphylla之間同樣為ndhE其Ka/Ks 為1.724。認(rèn)為上述幾個(gè)基因可能受到環(huán)境的正選擇壓力。對(duì)84 個(gè)物種間rbcL基因的比對(duì)分析認(rèn)為,有部分物種間存在正選擇信號(hào)(圖4)。
圖4 基于9個(gè)基因聯(lián)合數(shù)據(jù)集構(gòu)建的百合科植物系統(tǒng)發(fā)育樹(shù)及84物種間rbcL基因的正選擇情況
通過(guò)對(duì)菝葜葉綠體基因組中的SSR 位點(diǎn)的統(tǒng)計(jì),總共得到了247 個(gè)SSR(單核苷酸152 個(gè),二核苷酸70個(gè),三核苷酸12 個(gè),四、五核苷酸各6 個(gè)、六核苷酸1個(gè))。菝葜葉綠體基因組中有102 個(gè)SSR 位點(diǎn)處于基因之中,另外145 個(gè)則位于基因間區(qū)之中(圖1 第二,三環(huán))。如圖5所示,利用瓊脂糖凝膠電泳法對(duì)設(shè)計(jì)的5 對(duì)引物進(jìn)行篩選,選取上述的3 個(gè)菝葜樣本作為模板。其中LSC-1、SSC-1、IRb-1 位點(diǎn)來(lái)自葉綠體基因組的不同區(qū)域,均有明亮的擴(kuò)增結(jié)果,同時(shí)Sanger 測(cè)序結(jié)果表明它們的引物擴(kuò)增得到的產(chǎn)物長(zhǎng)度為298bp、242bp 及268bp,存在序列長(zhǎng)度差異,具備作為分子標(biāo)記的潛力。
圖5 驗(yàn)證5對(duì)SSR引物的瓊脂糖凝膠電泳圖
隨著技術(shù)的進(jìn)步與成本的降低葉綠體基因組的研究已十分普遍,但受手段限制NCBI 上原有的葉綠體基因組序列在準(zhǔn)確性上可能存在一定的問(wèn)題,對(duì)于下載自NCBI 的數(shù)據(jù)可以通過(guò)葉綠體基因組所存在的DNA 條形碼,如rbcL、matK以及psbA-trnH等片段來(lái)對(duì)其正確性進(jìn)行考察,是一種快速準(zhǔn)確的鑒別手段[48-49],可以通過(guò)中藥材DNA條形碼鑒定系統(tǒng)進(jìn)行驗(yàn)證(www.tcmbarcode.cn)。
本文共運(yùn)用三種策略對(duì)菝葜葉綠體基因組進(jìn)行了有參組裝(reference-based assemble),聯(lián)立Sanger 法測(cè)序的驗(yàn)證結(jié)果,表明利用混合組裝技術(shù)獲得的序列信息(OL372240)具有明顯優(yōu)勢(shì),更能體現(xiàn)現(xiàn)實(shí)中菝葜葉綠體基因組的真實(shí)情況。如表1 所示,長(zhǎng)短讀長(zhǎng)混合組裝菝葜葉綠體基因組能夠進(jìn)行更加精確的注釋?zhuān)c其相比短讀長(zhǎng)數(shù)據(jù)獨(dú)立組裝結(jié)果中出現(xiàn)了1452 bp的空隙;長(zhǎng)讀長(zhǎng)數(shù)據(jù)獨(dú)立組裝結(jié)果中存在部分基因錯(cuò)誤復(fù)制的現(xiàn)象。如圖2 所示,在trnT-UGU-trnL-UAA(A、B 與 C)、trnL-UAA(D 和 E)、petA-psbJ(F)以 及rpl33-rps18(H)的區(qū)間,OL372240 與 Sanger 測(cè)序結(jié)果高 度 一 致 ;在rpl33-rps18(G 和 I)的 區(qū) 間 ,原 NC_049022 測(cè)序結(jié)果可能更準(zhǔn)確。短讀長(zhǎng)組裝葉綠體基因組雖然具有很高的準(zhǔn)確性,但采用限制性?xún)?nèi)切酶構(gòu)建短片段測(cè)序庫(kù)時(shí),可能遺留部分缺乏酶切位點(diǎn)的序列使得測(cè)序結(jié)果存在缺失[50]。然而,新近研究則認(rèn)為獨(dú)立的長(zhǎng)讀長(zhǎng)Nanopore 測(cè)序結(jié)果足以擁有極高的精度[51],不過(guò)更多研究則傾向于利用短讀長(zhǎng)和長(zhǎng)讀長(zhǎng)混合組裝葉綠體基因組[16,52]。
表3 本實(shí)驗(yàn)設(shè)計(jì)的5對(duì)SSR引物
關(guān)于對(duì)菝葜及其近緣物種系統(tǒng)發(fā)育關(guān)系確認(rèn)的研究中通常使用不同物種所共有基因或全葉綠體基因組作為數(shù)據(jù)集[26,53-54],這里依據(jù)OrthoFinder軟件得到全部物種的葉綠體基因組編碼基因序列中的直系同源基因建立了數(shù)據(jù)集。此外,在中國(guó)植物志分類(lèi)中同屬于百合科萱草族的玉簪屬(Hosta)和萱草屬(Hemerocallis)在本文中所得到的系統(tǒng)發(fā)育樹(shù)中處于兩個(gè)不同的分支之中,但在與其他文獻(xiàn)系統(tǒng)發(fā)育樹(shù)的比對(duì)中并未發(fā)現(xiàn)明顯的拓?fù)浣Y(jié)構(gòu)差異。在對(duì)分化時(shí)間的研究中,菝葜屬的5 個(gè)物種以較高的后驗(yàn)概率(P= 100%)聚為一支,其中白背牛尾菜首先分化出來(lái),其分歧時(shí)間為26.52Mya,處于漸新世夏特期,隨后菝葜與另一物種于17.17 Mya 分化,位于中新世布爾迪加爾期,認(rèn)為上述兩個(gè)時(shí)期的環(huán)境存在使菝葜屬物種出現(xiàn)分化的因素存在,有待其他菝葜屬物種的進(jìn)一步驗(yàn)證。
目前葉綠體基因組DNA 條形碼研究表明,全葉綠體基因組或多位點(diǎn)作為超級(jí)條形碼可以彌補(bǔ)單位點(diǎn)DNA 條形碼在近緣物種鑒別上的固有限制[11]。在本研究中核苷酸多態(tài)性分析認(rèn)為菝葜葉綠體基因組突變熱點(diǎn)部位主要包括ndhH、ndhE-psaC、rps15-ndhH以及pafII-cemA等區(qū)域,而選擇壓力分析表明rbcL、ndhE及accD基因在菝葜屬3 物種中受到正選擇壓力,此外菝葜屬的SSC區(qū)域在與同科其他物種的比對(duì)中也展現(xiàn)了較大的整體差異性,它們均有作為物種鑒別DNA條形碼的潛力。同時(shí),在本研究中出現(xiàn)正選擇的3 個(gè)基因中rbcL基因主要與光合作用與光呼吸作用相關(guān),accD基因主要與脂肪酸的合成有關(guān)[55],而ndhE基因則與NADH 脫氫酶相關(guān),其中rbcL基因在很多科植物中受到普遍的正選擇壓力[56],認(rèn)為可能是環(huán)境的變化導(dǎo)致菝葜屬物種光合作用的改變。此外,在菝葜屬內(nèi)葉綠體基因組結(jié)構(gòu)近似,但與其他近緣屬物種相比明顯的IR區(qū)域的擴(kuò)張現(xiàn)象可以顯示其進(jìn)化事件的存在,另外,土茯苓(S. glabra)出現(xiàn)了與其他菝葜屬不同的現(xiàn)象,且在其IR 與SSC 區(qū)域存在ycf1作為假基因的情況,值得進(jìn)一步考察。關(guān)于pafI、pafII以及pbf1基因的注釋一直存在一定的爭(zhēng)議,在過(guò)往的其他葉綠體基因組中也存在同樣的情況[57-58],而其實(shí)際注釋方式有待深入研究。
本研究最后開(kāi)發(fā)了 LSC-1、SSC-1、IRb-1 等來(lái)自于葉綠體基因組的不同區(qū)域的SSR 標(biāo)記位點(diǎn),未來(lái)可以作為分子標(biāo)記的補(bǔ)充,用于菝葜及其近緣屬種中藥材資源的分類(lèi)鑒定,而如圖5 中的LSC-2 和LSC-3 條帶較為暗淡可能是由于菝葜葉綠體基因組中目標(biāo)SSR序列出現(xiàn)了變異導(dǎo)致。LSC-3測(cè)序結(jié)果表明其序列中存在明顯的差異,表明該位點(diǎn)在不同地區(qū)的菝葜中存在一定的差異,有進(jìn)一步開(kāi)發(fā)潛力。
世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化2022年4期