嚴福林,任得強,魏升華,何順志
(貴州中醫(yī)藥大學,貴陽 550025)
粗毛淫羊藿(Epimediumacuminatum)為小檗科(Beiberdaceae)淫羊藿屬,廣泛分布于我國西南地區(qū),是淫羊藿屬分布較廣泛的種類,亦是貴州藥用歷史較為悠久的民族藥之一[1-2]?!顿F州省中藥材、民族藥材質量標準》2003年版收載其根入藥,具有補腎壯陽,祛風除濕等功效,用于治療腎虛陽痿、小便淋漓、咳喘、風濕痹痛等疾病。淫羊藿為貴州著名民族成藥“仙靈骨葆膠囊”的主要原料藥材,據調查,“仙靈骨葆”的開發(fā)初期,其入方調劑藥材為貴州地產資源粗毛淫羊藿和黔嶺淫羊藿全草,亦稱銅絲草、仙靈脾等[3]。據考證,除貴州將其作為常用民族藥使用外,粗毛淫羊藿在其各產區(qū)均入藥使用,藥用部位多為全草[4-5]。
徐文芬等[6]、周濤等[7]研究表明,粗毛淫羊藿含有豐富的黃酮類、酚苷類、多糖、色酮類等、淫羊藿次苷類、木脂素類、有機酸類、生物堿等化學成分,具有治療糖尿病、抗腫瘤、骨骼重塑、抗衰老等藥理活性,近年來對淫羊藿屬的研究逐漸成為熱點。然而,淫羊藿屬因其獨特的地理分布、雜交可育、種內變異等特點,其種間界定仍模糊不清,被認為是分類和系統(tǒng)發(fā)育上最具挑戰(zhàn)和困難的類群[8]。國內外諸多學者依據核基因組(ITS序列)、葉綠體基因組和線粒體基因組信息,結合形態(tài)學及化學分類方法對淫羊藿屬部分類群進行系統(tǒng)關系研究,但該屬植物進化關系和屬內分類較為模糊,種間序列趨異值低,基因組信息變異位點不足,仍需要大樣本數據進一步的研究[9-12]。
葉綠體是綠色植物進行光合作用的細胞器,普遍存在于陸地植物中,可自主遺傳,且大多被子植物的葉綠體基因組為母系遺傳(80%),其結構較核基因組保守,大多數為雙鏈環(huán)狀的四分體結構,包括1個大的單拷貝區(qū)(large single copy, LSC)、2個反向重復區(qū)(inverted repeatssequence, IRa/IRb)和1個小的單拷貝區(qū)(small single copy, SSC)。此外,葉綠體基因組還具有堿基變異速率較慢、易于測序等優(yōu)點。隨著測序技術的發(fā)展,葉綠體基因組的研究取得了長足發(fā)展[13-15],被測序的植物種類與葉綠體基因組數據量迅速增加,對葉綠體基因組的結構和變異有了更深入的了解,這為處理困難植物類群的分類與系統(tǒng)學、植物地理學、功能基因的開發(fā)等研究提供了新的方向。
本研究采用Illumina二代測序技術對中國貴州道地特色藥材粗毛淫羊藿葉綠體基因組測序,并進行序列分析,以豐富粗毛淫羊藿的葉綠體基因組數據,為其種質資源的保護、系統(tǒng)學研究、功能基因的開發(fā)與可持續(xù)利用提供參考。
粗毛淫羊藿實驗樣品于2017年4月采集于貴陽市烏當區(qū)、黔南州龍里縣、黔西南州安龍縣等地,憑證標本經貴州中醫(yī)藥大學何順志教授鑒定,保存于貴州中醫(yī)藥大學標本館(GZYGH),活體材料保存于貴州中醫(yī)藥大學藥用植物種質資源圃。本研究從NCBI(https://www.ncbi.nlm.nih.gov/GenBank)下載了前人發(fā)表的小檗科淫羊藿屬(Epimedium)和南天竹屬(Nandina)植物葉綠體基因組共7種8條數據,用于系統(tǒng)發(fā)育分析,詳見表1。
表1 NCBI下載的葉綠體基因組Table 1 Chloroplast genome downloaded with NCBI
1.2.1DNA提取、測序、序列組裝、拼接、注釋以及物理圖譜繪制
取約200 mg粗毛淫羊藿分子樣品,使用CTAB法提取總DNA樣品。所得的DNA樣品用Qbit V 2.0核酸檢測儀及1%的瓊脂糖凝膠電泳進行DNA質量檢測。DNA樣品采用超聲法隨機打斷成較小片段,根據Illuminate建庫方法構建成350 bp的DNA文庫;委托華大基因(BGI)(中國,武漢)在Illumina HiSeq X-Ten平臺進行雙端測序,測序深度為3 Gb數據量。將測序獲得的過濾數據,根據GetOrganelle V 1.6.2 d軟件(https://github.com/Kinggerm/GetOrganelle/releases),在中國西南野生生物種質資源庫數據平臺服務器進行組裝與拼接。將拼接結果導入Bandage V 0.8.1軟件進行葉綠體結構可視化,去除覆蓋度低的低質量片段,獲得單倍體葉綠體全基因組環(huán)狀結構。以時針淫羊藿(E.lishihchenii)葉綠體基因組(NC_029944)作為參考,在軟件Geneious R 11.0.2中與應用Clustal Walignment進行校對,選取相似性較高的序列作為最終獲取的葉綠體基因組,并定位到相應序列,驗證獲得序列的可靠性,并進行手動校對和補充。應用DOGMA(http://dogma.ccbb.utexas.edu/)對拼接好的序列進行在線自動注釋,以E.lishihchenii葉綠體全基因組序列(NC_029944)作為參考,在Geneious R V 11.0.2軟件中進行校對調整。應用在線繪圖軟件Organellar Genome DRAW tool(OGDRAW, https://chlorobox. mpimp-golm. mpg. De/OGDraw.html)進行可視化,繪制葉綠體全基因組物理圖譜,tRNAscan-SE V 2.0(http://lowelab.ucsc.edu/cgi-bin/tRNAscan-SE 2.cgi)鑒定tRNA。應用Sequin軟件完成粗毛淫羊藿葉綠體基因組的規(guī)范化處理,并在線提交。
表2 粗毛淫羊藿葉綠體基因組注釋基因分類Table 2 Annotated genome classification of E. acuminatum chloroplast
1.2.2葉綠體基因組結構分析
使用Condon W(https://galaxy.pasteur.fr/?form=codonw)軟件對粗毛淫羊藿葉綠體基因組密碼子偏好進行分析;應用MISA軟件(Beier,2017#330)預測微衛(wèi)星重復序列(SSR),基序大小和最小重復數分別設置為:1-10,2-6,3-5,4-5,5-5,6-5;復合型SSR中2個SSR之間的最大堿基數設置為100 bp。應用TRF(Tandem Repeats Finder)(http://tandem.bu.edu/trf/trf.html)搜尋DNA序列中的串聯(lián)重復序列,參數:2,7,7,80,10,50,500。
1.2.3系統(tǒng)發(fā)育分析
在Geneious R 11.0.2中應用MAFFT V 1.3.7軟件對從GenBank下載的淫羊藿屬和南天竹屬植物7種15條葉綠體基因組與本研究中粗毛淫羊藿葉綠體基因組進行序列比對,在MEGA V 7.0軟件中應用最大似然法(ML)構建系統(tǒng)發(fā)育樹,Boostrap value為1 000次重復。
經測序,得到粗毛淫羊藿Raw data為2.23 Gb,經過濾、組裝及拼接后,得到粗毛淫羊藿的葉綠體全基因組序列長度為156 894 bp。該序列具有典型的四分體環(huán)狀結構,大單拷貝區(qū)(LSC)長88 496 bp,小單拷貝區(qū)(SSC)長16 685 bp,兩者被長度為25 809 bp的反向重復區(qū)IRa和IRb分隔,GC含量為38.8%(見圖1)。
粗毛淫羊藿葉綠體基因組有133個基因,包括85個蛋白編碼基因、10個rRNA基因和38個tRNA基因,44個外顯子,23個內含子。其中,2個基因(rrn23、trnM-CAU)有4個拷貝,2個基因(rrn16、trnE-UUC)有3個拷貝,12個基因(rrn5、rrn4.5、trnA-UGC、trnK-UUU、trnL-CAA、trnN-GUU、trnQ-UUG、rps12、rps7、rpl23、ycf2、ndhB)有2個拷貝。CDS全長78 567 bp,占葉綠體基因總長的50.1%,具有52 298個密碼子,編碼23種氨基酸;在粗毛淫羊藿葉綠體基因組中有15個基因含有內含子,3個基因含有2個內含子,12個基因含有1個內含子。最大內含子存在于trnK-UUU基因,長2 548 bp,最小內含子為trnL-UAA基因,長425 bp(詳見表2)。
圖1 粗毛淫羊藿葉綠體基因組Fig.1 Chloroplast genome of E. acuminatum
圖2 黔產粗毛淫羊藿與NCBI下載7種植物的葉綠體基因組最大似然法(ML)系統(tǒng)進化樹Fig.2 Phylogenetic tree of chloroplast genome maximum likelihood method (ML) of E. acuminatum from Guizhou and 7 species downloaded from NCBI
經預測,粗毛淫羊藿葉綠體基因組中存在串聯(lián)重復序列35個,長3 339 bp,占總長度的2.13%。其中,長度最小為5 bp,最大為70 bp。在粗毛淫羊藿葉綠體基因組中,共預測出簡單重復序列(SSR)66個,其中有58個單核苷酸的SSR(87.9%),2個二核苷酸的SSR(3.0%),6個復合型SSR(9.1%)。在SSR中出現的頻率最高的堿基為A/T,共68次,C/G為2次,AT/AT為2次。從表3中看出,粗毛淫羊藿SSR在葉綠體基因組中分布不均勻,這為研究粗毛淫羊藿及淫羊藿屬植物的種群遺傳多樣性、種質資源選育、遺傳結構等研究提供參考。
分析粗毛淫羊藿葉綠體基因組密碼子偏好發(fā)現,在粗毛淫羊藿葉綠體基因組中共有52 298個密碼子。其中,有7種密碼子編碼的氨基酸有3個,分別為:甘氨酸(Gly)、精氨酸(Arg)、絲氨酸(Ser),數量分別為:5 438、4 193、3 459個,分別占總數的10.4%、8.0%、6.6%;有6種密碼子編碼的氨基酸有2個,分別為谷氨酰胺(Gln)、谷氨酸(Glu),數量分別為3 554、4 177個,分別占總數的6.8%、8.0%;編碼蛋氨酸(Met)的數量最少,有371個,占0.7%;相對同義密碼子使用最高的為AGA/UUA,最低的是CGC,詳見表4。
表3 粗毛淫羊藿葉綠體基因組SSR預測Table 3 Prediction of chloroplast genome SSR of E. acuminatum
表4 粗毛淫羊藿葉綠體基因組鑒定與使用分析Table 4 Genome identification and application analysis of E. acuminatum
系統(tǒng)發(fā)育樹結果表明,淫羊藿屬與外類群南天竹屬及屬種間分歧較好,各為一支,但粗毛淫羊藿貴州居群與NCBI下載的其他居群粗毛淫羊藿不能聚類,單列一支;朝鮮淫羊藿兩個居群樣品關系較近,聚為一支。
本研究采用高通量測序技術對貴州粗毛淫羊藿葉綠體基因組進行測序、組裝與注釋,獲得貴州粗毛淫羊藿的葉綠體基因組,經結構分析,貴州產粗毛淫羊藿與前人研究的大部分被子植物葉綠體基因組結構一致,具有較為保守的環(huán)狀四分體結構,長度為156 894 bp,其中大單拷貝區(qū)(LSC)長88 496 bp,小單拷貝區(qū)(SSC)長16 685 bp,兩者被長度為25 809 bp的反向重復區(qū)IRa和IRb分隔。
本研究發(fā)現,貴州產粗毛淫羊藿葉綠體基因組中含有133個基因,其中包括85個蛋白編碼基因、10個rRNA基因和38個tRNA基因,44個外顯子,23個內含子。所有基因中,2個基因有4個拷貝,2個基因有3個拷貝,12個基因有2個拷貝,這些結構與張燕君等[12]報道的淫羊藿屬植物葉綠體基因組研究結果具有一定差異,表明不同種類和產地的淫羊藿屬植物基因結構不盡一致。
SSR是葉綠體基因組多態(tài)性以及物種群體遺傳學研究的有效工具。經預測,粗毛淫羊藿葉綠體基因組中存在串聯(lián)重復序列35個,簡單重復序列(SSR)66個,SSR在粗毛淫羊藿葉綠體基因組數量較多、多樣性豐富、且分布較不均勻,這為黔產粗毛淫羊藿及淫羊藿屬植物的種群遺傳多樣性、種質資源選育、遺傳結構、分子標記等研究奠定了良好基礎。
密碼子偏好性分析是預測葉綠體未知蛋白位置,判斷最優(yōu)密碼子與基因表達水平高低、發(fā)現新基因的手段。經密碼子偏好性分析發(fā)現,黔產粗毛淫羊藿葉綠體基因組共有52 298個密碼子,共編碼23種氨基酸。其中,有3個氨基酸具有7種密碼子編碼,有2個氨基酸具有6種密碼子編碼。其密碼子類型較為豐富,這為淫羊藿屬植物屬內、種間鑒定、群體和個體水平的遺傳表達差異分析奠定了依據。
與核基因組相比,葉綠體基因組具有相對小的尺寸、單親遺傳、基因含量和順序的保守性以及高拷貝數等特征。葉綠體基因組序列數據有助于推斷與其他被子植物家族的骨架關系,以及解決物種的系統(tǒng)發(fā)育關系,是測試譜系特異性分子進化的良好模型。從本研究中的系統(tǒng)發(fā)育樹分析結果看,淫羊藿屬與外類群南天竹屬具有很好的分歧,顯示出淫羊藿屬與外類群南天竹屬親緣關系較遠,分類學中易于區(qū)分。
朝鮮淫羊藿主要分布于中國東北省區(qū)與朝鮮半島,其余種類主要分布于中國南部,淫羊藿屬內的朝鮮淫羊藿與其余種類在100%的支持率下分為2大支,顯示了淫羊藿屬內種間較遠的地理屬性。粗毛淫羊藿2個居群樣品也呈現出同樣的結果,NCBI下載的粗毛淫羊藿樣品不能與貴州居群聚類,而是在100%的支持率下單列一支,粗毛淫羊藿貴州居群與其余種類聚為一支,這也顯示了淫羊藿屬種內因地理分布差異而導致的性狀和遺傳變化,表明淫羊藿屬性狀較不穩(wěn)定,種內性狀受環(huán)境影響較大,種間變異復雜,基因序列較為保守,存在過渡類型,可能存在大量的生態(tài)宗或地理宗,與嚴福林[22]、劉少雄等[23]的研究結果一致。本研究結果為淫羊藿屬植物的地理學、物種形成、群體遺傳學等研究提供了新的方向。