摘 要: 為探究西南牡蒿(Artemisia parviflora)的葉綠體基因組結構特征及其系統(tǒng)位置,該研究利用高通量測序技術對其進行測序,并借助生物信息學工具進行分析。結果表明:(1)西南牡蒿葉綠體基因組長151 047 bp,呈現(xiàn)為由4部分組成的環(huán)狀雙鏈結構,GC含量為37.5%。(2)共注釋115個基因,包括81個蛋白編碼基因、4個rRNA基因及30個tRNA基因。(3)檢測到68個簡單重復序列(SSRs)和37個長重復序列。(4)西南牡蒿葉綠體基因組的密碼子使用偏性較弱,其主要受自然選擇的影響,高頻密碼子偏向以A/U結尾。(5)西南牡蒿葉綠體基因組的IR區(qū)未出現(xiàn)明顯的擴張或收縮;篩選出了trnH-psbA、rpl16-rps3、ycf15-trnL-UAG、ndhA和ycf1 5個高變異區(qū)域,可作為鑒定龍蒿亞屬植物的潛在分子標記。(6)系統(tǒng)發(fā)育分析揭示了西南牡蒿在龍蒿亞屬中的系統(tǒng)位置及蒿屬內(nèi)各亞屬的系統(tǒng)發(fā)育關系。該研究為蒿屬植物后續(xù)的分子標記開發(fā)和系統(tǒng)發(fā)育研究提供了參考。
關鍵詞: 西南牡蒿, 葉綠體基因組, 密碼子使用偏性, 分子標記, 系統(tǒng)發(fā)育分析
中圖分類號: Q943; Q949
文獻標識碼: A
文章編號: 1000-3142(2024)09-1732-14
Chloroplast genome features and phylogenetic
analysis of Artemisia parviflora
Abstract: To explore the structural features of Artemisia parviflora chloroplast genome and its systematic position, high-throughput sequencing technology were employed for genome sequencing and bioinformatics tools for analyzing. The results were as follows: (1) The chloroplast genome of A. parviflora was 151 047 bp, with a typical circular double-stranded tetrad structure, and the GC content was 37.5%. (2) Total 115 unique genes were annotated, including 81 protein-coding genes, 4 rRNA genes, and 30 tRNA genes. (3) Sixty-eight simple sequence repeats (SSRs) and 37 long repeat sequences were detected. (4) The codon usage bias was weak in the A. parviflora chloroplast genome, and natural selection mainly contributed to the codon usage bias. High-frequency codons tend to ended with A/U. (5) There was no obvious expansion or contraction of the inverted repeat (IR) regions. Five high variation regions (trnH-psbA, rpl16-rps3, ycf15-trnL-UAG, ndhA, and ycf1) were identified which could be used as potential molecular markers for identifying subgen. Dracunculus species. (6) Phylogenetic analysis revealed the systematic position of A. parviflora within subgen. Dracunculus and elucidated the phylogenetic relationships among the various subgenera of Artemisia. This study provides the reference for future molecular marker development and phylogenetic research of Artemisia species.
Key words: Artemisia parviflora, chloroplast genome, codon usage bias, molecular markers, phylogenetic analysis
葉綠體是植物進行光合作用的主要場所,是擁有相對獨立遺傳物質的半自主性細胞器。植物的葉綠體基因組大小一般在140~160 kb之間,呈現(xiàn)為由4部分組成的環(huán)狀雙鏈結構,編碼了110~130個基因,按照基因功能可以分為4類(朱婷婷等,2017;林楚航等,2023)。與核基因組相比,葉綠體基因組具有基因組較小、拷貝數(shù)高及進化速率適中等優(yōu)點,常被用于不同分類等級的系統(tǒng)發(fā)育研究(樊守金和郭秀秀,2022)。另外,葉綠體基因組的簡單重復序列(simple sequence repeats,SSRs)、序列差異性、核苷酸多態(tài)性及密碼子使用偏性等特征可為物種鑒定和進化生物學研究提供關鍵信息。近年來,隨著高通量測序技術的快速發(fā)展,更多的植物葉綠體基因組序列被測序,并廣泛應用于系統(tǒng)發(fā)育研究。Song等(2022)利用木姜子屬(Litsea)物種的葉綠體基因組數(shù)據(jù)明確了該屬內(nèi)的系統(tǒng)發(fā)育關系。Qian等(2022)基于唐菖蒲(Gladiolus gandavensis)葉綠體基因組的分析,證實了唐菖蒲可能起源于南非且唐菖蒲屬(Gladiolus)與番紅花屬(Crocus)的同源性更高,而與鳶尾屬(Iris)的同源性較低??梢姡~綠體基因組序列可以促進高等植物的系統(tǒng)發(fā)育研究。
蒿屬(Artemisia)是菊科中物種最豐富且分布最廣泛的屬之一,世界約有500種,主要分布在歐洲、亞洲和北美的溫帶地區(qū),中國約分布186種和44變種(Bora & Sharma, 2011;冉然,2022)。蒿屬植物中富含的糖類、萜類及黃酮類等多種化學成分在抗寄生蟲、抗瘧疾和抗COVID-19等方面具有顯著的藥用價值(Bisht et al., 2021)。然而,由于缺乏明顯的分類特征和頻繁的自然雜交,蒿屬內(nèi)的系統(tǒng)發(fā)育關系一直存在爭議(Kim et al., 2020)。林有潤(1995)根據(jù)形態(tài)和地理分布等特征,將蒿屬劃分為3個亞屬和9個組。蒿亞屬(Subgen. Artiemisia)、龍蒿亞屬(Subgen. Dracunculus)、蒔蘿蒿亞屬(Subgen. Absinthium)和絹蒿亞屬(Subgen. Seriphidium)是最早的4個亞屬類群。隨著不同分類學家的深入研究,Subgen. Tridentatae和Subgen. Pacifica也被提出(Mcarthur et al., 1981;Hobbs & Baldwin, 2013)。Jiao等(2023)基于核基因組單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)數(shù)據(jù)將蒿屬劃分為8個亞屬,發(fā)現(xiàn)大多數(shù)先前被認可的亞屬并非單系類群,并且傳統(tǒng)上用于亞屬分類的形態(tài)特征與新的系統(tǒng)發(fā)育樹不相符。此外,基于葉綠體基因組數(shù)據(jù)的研究結果表明龍蒿亞屬為單系類群,但該亞屬內(nèi)的龍蒿組(Sect. Dracunculus)和牡蒿組(Sect. Latilobus)均為多系類群,這與傳統(tǒng)的形態(tài)分類結果存在一定的分歧(Kim et al., 2020;Yu et al., 2022)。由此可見,蒿屬內(nèi)各亞屬的劃分一直不明確,分子分類結果與形態(tài)分類結果之間存在明顯分歧。
西南牡蒿(Artemisia parviflora)是一種多年生草本植物,主要分布在海拔2 200~3 100 m的草叢、坡地、林緣和路旁地帶(林镕和林有潤,1991)。目前,對于西南牡蒿的研究主要集中在其化學成分和藥用價值方面(Ahameethunisa & Hopper, 2012;周利娟等,2012;Irum et al., 2017),而關于其系統(tǒng)發(fā)育關系的研究相對較少。Masuda等(2009)利用核糖體DNA的ITS區(qū)域和ETS區(qū)域構建系統(tǒng)發(fā)育樹,發(fā)現(xiàn)西南牡蒿與蒿亞屬的魁蒿(A. princeps)和亞洲大花蒿(A. macrantha)聚為一支;而Jiao等(2023)基于核基因組SNPs數(shù)據(jù)構建系統(tǒng)發(fā)育樹,則發(fā)現(xiàn)西南牡蒿與龍蒿亞屬的小亮苞蒿(A. mairei)親緣關系最近。據(jù)《中國植物志》記載,目前西南牡蒿被劃分在龍蒿亞屬的牡蒿組內(nèi),由于西南牡蒿的形態(tài)特征與其近緣種牡蒿(A. japonica)十分相似,還曾被認為是牡蒿的變種(林镕和林有潤,1991)。因此,有必要利用葉綠體基因組數(shù)據(jù)來研究西南牡蒿的系統(tǒng)位置及蒿屬內(nèi)各亞屬的系統(tǒng)發(fā)育關系。
本研究利用高通量測序技術獲取西南牡蒿的葉綠體基因組序列,并運用生物信息學軟件進行分析,擬探究以下科學問題:(1)西南牡蒿葉綠體基因組的結構特征;(2)西南牡蒿葉綠體基因組的密碼子使用偏性特征及影響因素;(3)開發(fā)鑒定龍蒿亞屬植物的潛在分子標記;(4)西南牡蒿的系統(tǒng)位置及蒿屬內(nèi)各亞屬的系統(tǒng)發(fā)育關系。以期為蒿屬植物后續(xù)的分子標記開發(fā)和系統(tǒng)發(fā)育研究奠定基礎。
1 材料與方法
1.1 材料
西南牡蒿的新鮮葉片采自云南省麗江市麗江高山植物園(100°20′05″ E、26°99′68″ N),海拔3 223 m,保存于-80 ℃的液氮中冷藏以備用。
1.2 測序及組裝注釋分析
對樣品進行DNA提取并質檢,構建測序文庫后采用Illumina HiSeqTM平臺測序。DNA提取和測序工作由上海元莘生物醫(yī)藥科技有限公司完成。對測序數(shù)據(jù)進行質控和評估后,運用GetOrganelle軟件(Jin et al., 2020)進行組裝,組裝結果使用Bandage軟件(Wick et al., 2015)進行查看和校正。使用Plattid Genome Annotator(PGA)軟件(Qu et al., 2019)進行注釋后用Geneious軟件(Kearse et al., 2012)手動檢查。組裝注釋的fasta文件和GenBank文件已提交至NCBI GenBank數(shù)據(jù)庫,GenBank登錄號為OP837546.1。利用OGDRAW在線軟件(Greiner et al., 2019)繪制葉綠體基因組圖譜。
1.3 重復序列分析
使用MISA在線軟件(Beier et al., 2017)檢測簡單重復序列,設置最小重復次數(shù):單核苷酸為10,二核苷酸為5,三核苷酸為4,四核苷酸、五核苷酸和六核苷酸均為3。使用REPuter在線軟件(Kurtz et al., 2001)檢測長重復序列,設置最小重復長度為30 bp,Hamming距離為3。
1.4 密碼子使用偏性分析
去除重復和小于300 bp的蛋白編碼序列,運用CodonW(http://codonw.sourceforge.net)軟件統(tǒng)計54條蛋白編碼序列的有效密碼子數(shù)(effective number of codons,ENC)和相對同義密碼子使用度(relative synonymous codon usage,RSCU)。RSCU值是指密碼子的實際使用頻率與理論使用頻率之比,用于衡量密碼子的使用偏性(毛立彥等,2022)。RSCU值>1表明該密碼子使用偏性強,稱為高頻密碼子;RSCU值<1表示該密碼子使用偏性較弱,稱為低頻密碼子。ENC值用于反映密碼子使用偏性程度,理論取值范圍為20~61,ENC值越小表明密碼子使用偏性越強(Mcinerney, 1998;王飛等,2022)。根據(jù)陸奇豐和駱文華(2023)的方法計算ENC期望值和ENC比值。使用EMBOSS網(wǎng)站(Rice et al., 2000)的cusp程序計算第1/2/3位密碼子的GC含量(GC1/GC2/GC3)。GC12表示GC1與GC2的平均值。
1.5 序列差異分析及IR邊界分析
利用mVISTA在線軟件(Mayor et al., 2000),在Shuffle-LAGAN模型下進行序列差異分析。使用DnaSP 6軟件(Rozas et al., 2017)計算核苷酸多態(tài)性,滑動窗口長度設為600 bp,步長設為200 bp。利用IRscope在線軟件(Amiryousefi et al., 2018)進行反向重復(invered repeat,IR)區(qū)邊界收縮與擴張分析。
1.6 系統(tǒng)發(fā)育分析
從NCBI數(shù)據(jù)庫中下載已報道的52種近緣蒿屬植物葉綠體基因組序列。利用MAFFT軟件(Katoh et al., 2002)進行多序列比對。利用MEGA軟件(Kumar et al., 2008)(基于GTR + G + I模型)構建最大似然樹,Bootstrap值設置為1 000。利用MrModeltest 2軟件(Nylander, 2004)篩選最優(yōu)核苷酸替代模型為GTR + G + I,使用MrBayes 3.2軟件(Ronquist et al., 2012)構建貝葉斯樹,參數(shù)設置:馬爾可夫鏈運算10 000 000代,每1 000代取樣1次。
2 結果與分析
2.1 西南牡蒿葉綠體基因組的基本特性
西南牡蒿的葉綠體基因組長151 047 bp,呈現(xiàn)為由4部分組成的環(huán)狀雙鏈結構,由2個反向重復區(qū)(IRa和IRb)、1個大單拷貝區(qū)(large single copy,LSC)及1個小單拷貝區(qū)(small single copy,SSC)組成(圖1)。GC含量和AT含量分別為37.5%和62.5%,IR區(qū)、LSC區(qū)、SSC區(qū)的GC含量分別為43.1%、35.6%、30.7%(表1)。共注釋出115個基因, 包括81個蛋白編碼基因、4個rRNA基因和30個tRNA基因(表2)。其中,有19個基因具有內(nèi)含子,ycf3基因和clpP1基因具有2個內(nèi)含子,其余基因只有1個內(nèi)含子。
2.2 重復序列分析
西南牡蒿的葉綠體基因組中共檢測到68個SSRs位點,其中大部分位于LSC區(qū)。單核苷酸重復數(shù)量最多(42個),其中有97.6%的單核苷酸重復為A/T型,其次是四核苷酸重復和二核苷酸重復(表3)。值得注意的是,A/T、AT/AT、AAT/ATT、AAAT/ATTT、AATT/AATT及AATAT/ATATT的重復單元占比達到了88.2%,表明SSRs偏向使用A/T堿基。共檢測到37個長重復序列,其中包括19個正向重復(forward repeat)和18個回文重復(palindromic repeat),沒有檢測到互補重復(complementary repeat)和反向重復(reverse repeat)(圖2)。長重復序列的長度主要集中在30~40 bp之間。
2.3 密子使用偏性特征及影響因素分析
西南牡蒿的ENC值為52.21,表明其密碼子使用偏性較弱。在西南牡蒿葉綠體基因組中共檢測到28個高頻密碼子(不包括終止密碼子),其中15個以U結尾,11個以A結尾,2個以G結尾;31個低頻密碼子,其中16個以C結尾,11個以G結尾,1個以U結尾,3個以結尾A(圖3)。這表明其高頻密碼子偏向以A/U結尾,而低頻密碼子偏向以G/C結尾。
密碼子使用偏性受多種因素影響,其中自然選擇和突變壓力是主要因素。中性繪圖分析發(fā)現(xiàn)GC12值的范圍為0.306~0.550,GC3值的范圍為0.178~0.425,大多數(shù)基因都位于中線上方(圖4:A)?;貧w曲線斜率為-0.239 5,R2為0.044 4表明GC12值與GC3值相關性不顯著,密碼子使用偏性主要受自然選擇的影響。ENC-plot分析發(fā)現(xiàn)大部分基因位于標準曲線下方,即ENC實際值與ENC期望值之間存在較大差異,進一步說明自然選擇發(fā)揮了主要作用(圖4:B)。此外,ENC比值頻數(shù)分布分析發(fā)現(xiàn)有21個基因(占比38.9%)位于組距為-0.05~0.05的范圍內(nèi),表明這些基因的密碼子使用偏性受突變壓力的影響(表4)。其余的33個基因(占比61.1%)位于此區(qū)間之外,表明這些基因的密碼子使用偏性受自然選擇的影響。綜上所述,自然選擇和突變壓力共同影響西南牡蒿的葉綠體基因組密碼子使用偏性,其中自然選擇發(fā)揮了主要作用。
2.4 序列差異性分析
使用mVISTA葉綠體基因組比對工具,以雷瓊牡蒿(Artemisia hancei)的葉綠體基因組作為參考,對9種龍蒿亞屬植物的葉綠體基因組進行序列比對分析。結果表明,這些葉綠體基因組的結構和基因順序基本相同,非編碼區(qū)的差異性大于編碼區(qū),IR區(qū)的差異性明顯小于LSC區(qū)和SSC區(qū)(圖5)。核苷酸多態(tài)性分析顯示,總共檢測到498個多態(tài)性位點,核苷酸多態(tài)性值(Pi)的范圍變化為0~0.009 72,平均值為0.001 10。檢測出5個Pi>0.005的高變異區(qū)域,分別為trnH-psbA、rpl16-rps3、ycf15-trnL-UAG、ndhA和ycf1(圖6)。
2.5 IR區(qū)邊界分析
9種龍蒿亞屬物種葉綠體基因組的IR區(qū)長度在24 953~24 972 bp之間,IR區(qū)邊界的基因差異相對較?。▓D7)。除黑沙蒿(Artemisia ordosica)外,其余物種的LSC區(qū)與IRb區(qū)邊界(LSC/IRb junction,JLB)均位于rps19基因內(nèi)。所有物種的LSC區(qū)與IRa區(qū)邊界(LSC/IRa junction,JLA)均位于rpl2基因和trnH基因之間。所有物種的SSC區(qū)與IRa區(qū)邊界(SSC/IRa junction,JSA)均位于ycf1基因內(nèi)。所有物種的SSC區(qū)與IRb區(qū)邊界(SSC/IRb junction,JSB)均距離ndhF基因41~72 bp不等。這表明西南牡蒿葉綠體基因組IR區(qū)的長度和邊界基因與其他龍蒿亞屬植物基本相似,未發(fā)現(xiàn)明顯的擴張或收縮現(xiàn)象。然而,黑沙蒿的IR邊界與其他物種相比存在明顯的收縮現(xiàn)象。
2.6 系統(tǒng)發(fā)育分析
基于53種蒿屬植物葉綠體基因組的蛋白編碼序列,以亞菊屬(Ajania)的細葉亞菊(A. tenuifolia)和絲裂亞菊(A. nematoloba)作為外類群,利用貝葉斯法(Bayesian inference,BI)和最大似然法(maximum likelihood,ML)構建系統(tǒng)發(fā)育樹。結果表明,2種建樹方法產(chǎn)生相同的拓撲結構且多數(shù)節(jié)點都具有較高的支持率(圖8)。根據(jù)Jiao等(2023)對蒿屬內(nèi)各亞屬的最新劃分,本研究中的蒿屬物種主要分為5個分支,包括蒿亞屬、龍蒿亞屬、蒔蘿蒿亞屬、絹蒿亞屬及Subgen. Ponticae分支。其中,蒿亞屬和蒔蘿蒿亞屬聚為一支,蒔蘿蒿亞屬嵌套在蒿亞屬內(nèi),龍蒿亞屬為這一支的姊妹類群。而絹蒿亞屬則單獨聚為一個分支,位于進化樹的基部。Subgen. Ponticae的兩個物種則分別嵌套在蒔蘿蒿亞屬和絹蒿亞屬內(nèi)。龍蒿亞屬的所有物種聚集一個單系分支,其中牡蒿、黑沙蒿、茵陳蒿(Artemisia capillaris)、沙蒿(A. desertorum)及豬毛蒿(A. scoparia)聚為一支,西南牡蒿與雷瓊牡蒿聚為另一支,這兩支互為姊妹類群。此外,華北米蒿(A. giraldii)與龍蒿(A. dracunculus)聚為一支,位于該亞屬分支的基部。
3 討論與結論
通過比較分析發(fā)現(xiàn),西南牡蒿葉綠體基因組在長度、結構及基因數(shù)量方面與之前報道的蒿屬植物相似(劉潮等,2023),并且在IR區(qū)邊界未發(fā)現(xiàn)明顯的擴張或收縮,表明西南牡蒿葉綠體基因組相對保守。此外,與LSC區(qū)和SSC區(qū)相比,IR區(qū)的GC含量最高且序列差異性最小。這可能與IR區(qū)域內(nèi)包含高GC含量的RNA基因(GC含量為55.1%)有關。在其他植物中也發(fā)現(xiàn)了類似的現(xiàn)象(Wu et al., 2020;Zhang et al., 2023),表明IR區(qū)在維持葉綠體基因組結構穩(wěn)定方面起著關鍵作用。
密碼子使用偏性是指編碼同一種氨基酸的多個同義密碼子的使用頻率不同,這是物種長期進化的結果, 與基因的功能與表達密切相關 (Najafabadi et al., 2009;Zhang et al., 2018;Wang et al., 2023)。本研究發(fā)現(xiàn)西南牡蒿葉綠體基因組的密碼子使用偏性較弱且偏向使用A/U結尾。這與黑沙蒿和華北米蒿等龍蒿亞屬植物的密碼子使用偏性特征相似(冉然,2022)。該物種38.9%的基因密碼子使用偏性受突變壓力影響,有61.1%的基因密碼子使用偏性受自然選擇影響。Nie等(2014)對菊科植物葉綠體基因組密碼子使用偏性的影響因素分析也表明自然選擇是主導因素。然而,沈宗芳等(2021)研究發(fā)現(xiàn)槲蕨屬(Drynaria)植物葉綠體基因組的密碼子使用偏性主要受到突變壓力的影響。這表明親緣關系相近的物種可能會具有相似的密碼子使用模式。
葉綠體基因組的SSRs具有共顯性遺傳、高重復性和高變異性等特點,常被用作物種鑒定、遺傳關系研究及分子標記輔助育種等方面的高效分子標記(Kaur et al., 2015)。本研究在西南牡蒿葉綠體基因組中發(fā)現(xiàn)了68個SSRs位點,然而不同蒿屬物種中SSRs的數(shù)量存在較大差異。在五月艾(Artemisia indica)、甘青蒿(A. tangutica)、華北米蒿及黑沙蒿中分別檢測到191個、201個、39個及47個SSRs位點,這說明不同蒿屬物種的SSRs突變頻率存在一定差異(蘭朝輝等,2022;Yu et al., 2022;冉然,2022)。這一現(xiàn)象在梧桐屬(Firmiana)和絲蘭屬(Yucca)植物葉綠體基因組中同樣存在(陸奇豐等,2021;王飛等,2023)。此外,本研究還發(fā)現(xiàn)西南牡蒿葉綠體基因組中單核苷酸重復的SSRs最為豐富,其次是四核苷酸重復和二核苷酸重復且傾向于使用A/T堿基,這與其他蒿屬植物的研究結果相似(劉潮等,2023)。然而,與扁核木屬(Prinsepia)和柴胡屬(Bupleurum)的研究不同的是,在蒿屬中并未觀察到隨著拷貝數(shù)目增加而SSRs數(shù)量明顯減少的情況(王飛等,2022;張明英等,2021)??傊狙芯拷Y果有助于未來蒿屬植物的SSRs分子標記開發(fā)和遺傳多樣性研究。
葉綠體基因組的編碼區(qū)與非編碼區(qū)的分子進化速率存在差異,適用于不同分類水平的系統(tǒng)發(fā)育研究(樊守金和郭秀秀,2022)。編碼區(qū)的進化速度相對較慢,適用于高級分類水平的系統(tǒng)發(fā)育研究,例如目和科的分類(Li et al., 2019)。相反,非編碼區(qū)的進化速度相對較快,包含大量變異位點,適用于低級分類水平的系統(tǒng)發(fā)育研究,如屬、種及種下等級的分類(Shaw et al., 2007;劉靜等,2012)。本研究發(fā)現(xiàn),9種龍蒿亞屬植物葉綠體基因序列的非編碼區(qū)差異性明顯高于編碼區(qū),這與先前在大多數(shù)蒿屬植物中觀察到的序列差異性規(guī)律一致(Liu et al., 2013;Shen et al., 2017)。值得一提的是,本研究還鑒定出5個高變異區(qū)域,分別為trnH-psbA、rpl16-rps3、ycf15-trnL-UAG、ndhA和ycf1。劉濤和紀遠恒(2009)利用trnH-psbA區(qū)域成功鑒別了黃花蒿(A. annua)、茵陳蒿和青蒿(A. caruifolia)。此外,trnH-psbA和ycf1區(qū)域在其他蒿屬植物中也觀察到了類似的高度變異性(Shahzadi et al., 2020)。Kim等(2020)研究表明,accD基因和ycf1基因不但在蒿屬中表現(xiàn)出高度多態(tài)性,而且具有成為菊科植物核心分子標記的潛力。因此,本研究篩選出的高變異區(qū)域可作為識別龍蒿亞屬物種的潛在分子標記。
本研究發(fā)現(xiàn)蒿亞屬和蒔蘿蒿亞屬聚為一支,蒔蘿蒿亞屬嵌套在蒿亞屬內(nèi),表明這兩個亞屬的親緣關系較近,蒔蘿蒿亞屬曾被認為是蒿亞屬內(nèi)的一個組。Hobbs和Baldwin(2013)的研究也發(fā)現(xiàn),蒿屬亞屬和蒔蘿蒿亞屬均為多系群。這結果與Jiao等(2023)基于核基因組SNPs數(shù)據(jù)的研究結果一致。而龍蒿亞屬則為這一大分支的姊妹類群,絹蒿亞屬則位于進化樹的基部,與Jin等(2023)基于葉綠體基因組數(shù)據(jù)的研究結果相一致,而與Jiao等(2023)基于核基因組SNPs數(shù)據(jù)的研究結果存在差異。可見,核基因組數(shù)據(jù)和葉綠體基因組數(shù)據(jù)在物種系統(tǒng)發(fā)育研究中既表現(xiàn)出一致性又存在差異性。雖然核基因組具有雙親遺傳特性,能夠揭示雙親譜系的進化關系,在系統(tǒng)發(fā)育研究中有較大的潛力(王杰等,2023),但是葉綠體基因組數(shù)據(jù)豐富,目前仍然是植物系統(tǒng)發(fā)育研究的主要方法。此外,還發(fā)現(xiàn)原為絹蒿亞屬的三裂葉絹蒿(Seriphidium junceum)則與蒔蘿蒿亞屬物種聚為一支。這結果支持Malik等(2017)將三裂葉絹蒿從絹蒿亞屬中移除的結論。本研究基于所有已經(jīng)公布的蒿屬植物葉綠體基因組數(shù)據(jù)對蒿屬內(nèi)各亞屬進行重新劃分,盡可能保證各亞屬的單系性,可為蒿屬內(nèi)各亞屬的分類修訂提供基礎。
本研究還發(fā)現(xiàn)西南牡蒿與雷瓊牡蒿親緣關系最近,兩者同屬于牡蒿組。然而,西南牡蒿曾被認為是牡蒿的變種,后來以西南牡蒿的莖下部葉一至二回羽狀深裂或全裂,中部葉3~5深裂;莖、枝、葉背面初時被黃色或褐黃色柔毛等特征,將其與牡蒿區(qū)分開來(林镕和林有潤,1991)。本研究的分子系統(tǒng)發(fā)育分析表明西南牡蒿與牡蒿親緣關系較遠,并不是牡蒿的變種。此外,本研究還發(fā)現(xiàn)龍蒿亞屬內(nèi)的龍蒿組和牡蒿組均呈現(xiàn)多系性,這與最新的分子系統(tǒng)發(fā)育研究結果一致(Kim et al., 2020;Yu et al., 2022;Jin et al., 2023),但與傳統(tǒng)的形態(tài)學分類結果存在一定的分歧。因此,對于蒿屬系統(tǒng)發(fā)育的研究需要結合形態(tài)特征和更多的分子數(shù)據(jù)以提供全面的支持。
綜上所述,本研究首次報道了西南牡蒿葉綠體基因組序列,并分析了其結構特征和蒿屬的系統(tǒng)發(fā)育關系。結果表明,西南牡蒿葉綠體基因組的大小、結構及IR區(qū)邊界相對保守。密碼子使用偏性較弱,主要受自然選擇的影響。此外,篩選得到的重復序列和高變異區(qū)域可作為鑒別蒿屬植物的潛在分子標記。系統(tǒng)發(fā)育分析揭示了西南牡蒿的系統(tǒng)位置及蒿屬內(nèi)各亞屬的系統(tǒng)發(fā)育關系。這些結果為深入研究蒿屬植物的進化特征和系統(tǒng)發(fā)育關系提供了重要參考。
參考文獻:
AHAMEETHUNISA AR, HOPPER W, 2012. In vitro antimicrobial activity on clinical microbial strains and antioxidant properties of Artemisia parviflora [J]. Ann Clin Microbiol Antimicrob, 11(1): 30-36.
AMIRYOUSEFI A, HYVONEN J, POCZAI P, 2018. IRscope: an online program to visualize the junction sites of chloroplast genomes [J]. Bioinformatics, 34(17): 3030-3031.
BEIER S, THIEL T, MUNCH T, et al., 2017. MISA-web: a web server for microsatellite prediction [J]. Bioinformatics, 33(16): 2583-2585.
BISHT D, KUMAR D, KUMAR D, et al., 2021. Phytochemistry and pharmacological activity of the genus artemisia [J]. Arch Pharm Res, 44(5): 439-474.
BORA KS, SHARMA A, 2011. The genus Artemisia: a comprehensive review [J]. Pharm Biol, 49(1): 101-109.
FAN SJ, GUO XX, 2022. Advances in research and application of plant chloroplast genome [J]. J Shandong Norm Univ (Nat Sci Ed), 37(1): 22-31. [樊守金, 郭秀秀, 2022. 植物葉綠體基因組研究及應用進展 [J]. 山東師范大學學報(自然科學版), 37(1): 22-31.]
GREINER S, LEHWARK P, BOCK R, 2019. OrganellarGenomeDRAW (OGDRAW) version 1.3.1: expanded toolkit for the graphical visualization of organellar genomes [J]. Nucl Acid Res, 47(W1): 59-64.
HOBBS CR, BALDWIN BG, 2013. Asian origin and upslope migration of Hawaiian Artemisia (Compositae-Anthemideae) [J]. J Biogeogr, 40: 442-454.
IRUM S, AHMED H, MIRZA B, et al., 2017. In vitro and in vivo anthelmintic activity of extracts from Artemisia parviflora and A. sieversiana [J]. Helminthologia, 54(3): 218-224.
JIAO BH, CHEN C, WEI M, et al., 2023. Phylogenomics and morphological evolution of the mega-diverse genus Artemisia (Asteraceae: Anthemideae): implications for its circumscription and infrageneric taxonomy [J]. Ann Bot, 131(5): 867-883.
JIN GZ, LI WJ, SONG F, et al., 2023. Comparative analysis of complete Artemisia subgenus Seriphidium (Asteraceae: Anthemideae) chloroplast genomes: insights into structural divergence and phylogenetic relationships [J]. BMC Plant Biol, 23(1): 136.
JIN JJ, YU WB, YANG JB, et al., 2020. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes [J]. Genome Biol, 21(1): 241.
KATOH K, MISAWA K, KUMA K, et al., 2002. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform [J]. Nucl Acid Res, 30(14): 3059-3066.
KAUR S, PANESAR PS, BERA MB, et al., 2015. Simple sequence repeat markers in genetic divergence and marker-assisted selection of rice cultivars: a review [J]. Crit Rev Food Sci Nutr, 55(1): 41-49.
KEARSE M, MOIR R, WILSON A, et al., 2012. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data [J]. Bioinformatics, 28(12): 1647-1649.
KIM GB, LIM CE, KIM JS, et al., 2020. Comparative chloroplast genome analysis of Artemisia (Asteraceae) in East Asia: insights into evolutionary divergence and phylogenomic implications [J]. BMC Genomics, 21(1): 415-431.
KUMAR S, NEI M, DUDLEY J, et al., 2008. MEGA: a biologist-centric software for evolutionary analysis of DNA and protein sequences [J]. Brief Bioinform, 9(4): 299-306.
KURTZ S, CHOUDHURI JV, OHLEBUSCH E, et al., 2001. REPuter: the manifold applications of repeat analysis on a genomic scale [J]. Nucl Acid Res, 29(22): 4633-4642.
LAN ZH, TIAN XF, SHI YH, et al., 2022. Chloroplast genome structure characteristics and phylogenetic analysis of Artemisia indica [J]. Chin J Chin Mat Med, 47(22): 6058-6065. [蘭朝輝, 田徐芳, 師玉華, 等, 2022. 五月艾Artemisia indica葉綠體基因組結構及系統(tǒng)發(fā)育分析 [J]. 中國中藥雜志, 47(22): 6058-6065.]
LI HT, YI TS, GAO LM, et al., 2019. Origin of angiosperms and the puzzle of the Jurassic gap [J]. Nat Plants, 5(5): 461-470.
LIN CH, HAN JY, YAN XL, 2023. Application and prospect of chloroplast genome [J/OL]. Mol Plant Breed: 1-7 [2023-07-03].https://kns.cnki.net/kcms2/detail/46.1068.S.20230703.1048.002. html. [林楚航, 韓俊艷, 閆小玲, 2023. 葉綠體基因組的應用及前景展望 [J/OL] . 分子植物育種: 1-7 [2023-07-03]. https://kns.cnki.net/kcms2/detail/46.1068.S.20230703.1048.002. html. ]
LIN R, LIN YR, 1991. Flora Reipublicae Popularis Sinicae: Vol. 76 [M]. Beijing: Science Press: 243. [林镕, 林有潤, 1991. 中國植物志: 第七十六卷 [M]. 北京: 科學出版社: 243.]
LIN YR, 1995. On the floristics of Artemisia L. in the world [J]. Bull Bot Res, 15(1): 1-37. [林有潤, 1995. 論世界蒿屬植物區(qū)系 [J]. 植物研究, 15(1): 1-37.]
LIU C, LYQ, SHI ZL, et al., 2023. Characteristics of chloroplast genomes and phylogenetic analysis of Artemisia species [J]. J NW For Univ, 38(3): 78-86. [劉潮, 呂雁秋, 施枝麗, 等, 2023. 蒿屬植物葉綠體基因組特征及進化 [J]. 西北林學院學報, 38(3): 78-86.]
LIU J, ZHANG HQ, FAN X, et al., 2012. Phylogenetic relationships and maternal donor of Hystrix and Leymus species as revealed by chloroplast atpB-rbcL sequences [J]. Acta Pratac Sin, 21(5): 77-85. [劉靜, 張海琴, 凡星, 等, 2012. 基于葉綠體atpB-rbcL序列探討猬草屬和賴草屬植物的系統(tǒng)發(fā)育和母系起源 [J]. 草業(yè)學報, 21(5): 77-85.]
LIU T, JI YH, 2009. psbA-trnH sequence analysis from chloroplast on medicinal plants of Artemisia [J]. Chin Agric Sci Bull, 25(12): 46-49. [劉濤, 紀運恒, 2009. 蒿屬藥用植物葉綠體上的psbA-trnH序列分析 [J]. 中國農(nóng)學通報, 25(12): 46-49.]
LIU Y, HUO NX, DONG LL, et al., 2013. Complete chloroplast genome sequences of Mongolia medicine Artemisia frigida and phylogenetic relationships with other plants [J]. PLoS ONE, 8(2): e57533.
LU QF, HUANG ZH, LUO WH, 2021. Characterization of complete chloroplast genome in Firmiana kwangsiensis and F. danxiaensis with extremely small populations [J]. Biodivers Sci, 29(5): 586-595. [陸奇豐, 黃至歡, 駱文華, 2021. 極小種群瀕危植物廣西火桐、丹霞梧桐的葉綠體基因組特征 [J]. 生物多樣性, 29(5): 586-595.]
LU QF, LUO WH, 2023. Analysis of codon usage bias in chloroplast genome of Begonia guangxiensis [J/OL]. Mol Plant Breed: 1-20 [2023-09-05]. https://link.cnki.net/urlid/46.1068.S. 20230905.0920.002. [陸奇豐, 駱文華, 2023. 廣西秋海棠葉綠體基因組密碼子偏好性分析 [J/OL]. 分子植物育種: 1-20 [2023-09-05]. https://link.cnki.net/urlid/46.1068.S.20230905. 0920. 002.]
MALIK S, VITALES D, HAYAT MQ, et al., 2017. Phylogeny and biogeography of Artemisia subgenus Seriphidium (Asteraceae: Anthemideae) [J]. Taxon, 66(4): 934-952.
MAO LY, HUANG QW, LONG LY, et al., 2022. Comparative analysis of codon usage bias in chloroplast genomes of seven Nymphaea species [J]. J NW For Univ, 37(2): 98-107. [毛立彥, 黃秋偉, 龍凌云, 等, 2022. 7種睡蓮屬植物葉綠體基因組密碼子偏好性分析 [J]. 西北林學院學報, 37(2): 98-107.]
MASUDA Y, YUKAWA T, KONDO K, 2009. Molecular phylogenetic analysis of members of Chrysanthemum and its related genera in the tribe Anthemideae, the Asteraceae in East Asia on the basis of the internal transcribed spacer (ITS) region and the external transcribed spacer (ETS) region of nrDNA [J]. Chromosome Bot, 4(2): 25-36.
MAYOR C, BRUDNO M, SCHWARTZ JR, et al., 2000. VISTA: visualizing global DNA sequence alignments of arbitrary length [J]. Bioinformatics, 16 (11): 1046-1047.
MCARTHUR ED, POPE CL, FREEMAN DC, 1981. Chromosomal studies of subgenus Tridentatae of Artemisia: evidence for autopolyploidy [J]. Am J Bot, 68(5): 589-605.
MCINERNEY JO, 1998. Replicational and transcriptional selection on codon usage in Borrelia burgdorferi [J]. Proc Natl Acad Sci USA, 95(18): 10698-10703.
NAJAFABADI HS, GOODARZI H, SALAVATI R, 2009. Universal function-specificity of codon usage [J]. Nucl Acid Res, 37(21): 7014-7023.
NIE XJ, DENG PC, FENG KW, et al., 2014. Comparative analysis of codon usage patterns in chloroplast genomes of the Asteraceae family [J]. Plant Mol Biol Rep, 32(4): 828-840.
NYLANDER J, 2004. MrModeltest v2. Program distributed by the author [J]. Bioinformatics, 24: 581-583.
QIAN RJ, YE YJ, HU QD, et al., 2022. Complete chloroplast genome of Gladiolus gandavensis (Gladiolus) and genetic evolutionary analysis [J]. Genes, 13(9): 1599.
QU XJ, MOORE MJ, LI DZ, et al., 2019. PGA: a software package for rapid, accurate, and flexible batch annotation of plastomes [J]. Plant Meth, 15(1): 50.
RAN R, 2022. Comparison of chloroplast genomes and phylogenetic analysis of 5 Artemisia in north China [D]. Hohhot: Inner Mongolia Agricultural University: 1-48. [冉然, 2022. 北方5種蒿屬植物葉綠體基因組比較與系統(tǒng)進化分析 [D]. 呼和浩特: 內(nèi)蒙古農(nóng)業(yè)大學: 1-48.]
RICE P, LONGDEN I, BLEASBY A, 2000. EMBOSS: the european molecular biology open software suite [J]. Trends Genet, 16(6): 276-277.
RONQUIST F, TESLENKO M, MARK PVD, et al., 2012. MrBayes 3.2: efficient Bayesian phylogenetic inference and model choice across a large model space [J]. Syst Biol, 61(3): 539-542.
ROZAS J, FERRER-MATA A, SANCHEZ-DELBARRIO JC, et al., 2017. DnaSP 6: DNA sequence polymorphism analysis of large data sets [J]. Mol Biol Evol, 34(12): 3299-3302.
SHAHZADI I, ADBULLAH, MEHMOOD F, et al., 2020. Chloroplast genome sequences of Artemisia maritima and Artemisia absinthium: comparative analyses, mutational hotspots in genus Artemisia and phylogeny in family Asteraceae [J]. Genomics, 112(2): 1454-1463.
SHAW J, LICKEY EB, SCHILLING EE,et al., 2007. Comparison of whole chloroplast genome sequences to choose noncoding regions for phylogenetic studies in angiosperms: the tortoise and the hare Ⅲ [J]. Amer J Bot Mar, 94(3): 275-288.
SHEN XF, WU ML, LIAO BS, et al., 2017. Complete chloroplast genome sequence and phylogenetic analysis of the medicinal plant Artemisia annua [J]. Molecules, 22(8): 1330.
SHEN ZF, LU TQ, ZHANG ZR, et al., 2021. Condon preference chloroplast genomes of Drynaria [J]. Guihaia, 41(2): 266-273. [沈宗芳, 陸添權, 張志榮, 等, 2021. 槲蕨屬葉綠體基因組密碼子偏好性分析 [J]. 廣西植物, 41(2): 266-273.]
SONG WC, CHEN ZM, SHI WB, et al., 2022. Comparative analysis of complete chloroplast genomes of nine species of Litsea (Lauraceae): hypervariable regions, positive selection, and phylogenetic relationships [J]. Genes, 13(9): 1550.
WANG F, ZHAO WZ, DONG ZH, et al., 2022. Analysis of chloroplast genome characteristics of Prinsepia [J]. Chin J Trop Crop, 43(9): 1759-1770. [王飛, 趙文植, 董章宏, 等, 2022. 扁核木屬植物葉綠體基因組特征分析 [J]. 熱帶作物學報, 43(9): 1759-1770.]
WANG F, ZHAO WZ, DONG ZH, et al., 2023. Analysis of the chloroplast genome characteristics of 6 species of Yucca [J]. Bull Bot Res, 43(1): 109-119. [王飛, 趙文植, 董章宏, 等, 2023. 絲蘭屬6種植物葉綠體基因組特征分析 [J]. 植物研究, 43(1): 109-119.]
WANG J, HE WC, XIANG KL, et al., 2023. Advances in plant phylogeny in the genome era [J]. J Zhejiang A & F Univ, 40(1): 227-236. [王杰, 賀文闖, 向坤莉, 等, 2023. 基因組時代的植物系統(tǒng)發(fā)育研究進展 [J]. 浙江農(nóng)林大學學報, 40(1): 227-236.]
WANG ZK, LIU Y, ZHENG HY, et al., 2023. Comparative analysis of codon usage patterns in nuclear and chloroplast genome of Dalbergia (Fabaceae) [J]. Genes, 14(5): 1110.
WICK RR, SCHULTZ MB, ZOBEL J, et al., 2015. Bandage: interactive visualization of de novo genome assemblies [J]. Bioinformatics, 31(20): 3350-3352.
WU LW, NIE LP, XU ZC, et al., 2020. Comparative and phylogenetic analysis of the complete chloroplast genomes of three Paeonia Section Moutan species (Paeoniaceae) [J]. Front Genet, 11: 980.
YU JY, XIA MZ, WANG YC, et al., 2022. Short and long reads chloroplast genome assemblies and phylogenomics of Artemisia tangutica (Asteraceae) [J]. Biologia, 77(4): 915-930.
ZHANG DJ, REN J, JIANG H, et al., 2023. Comparative and phylogenetic analysis of the complete chloroplast genomes of six Polygonatum species (Asparagaceae) [J]. Sci Rep, 13(1): 7237.
ZHANG MY, ZHANG YQ, LI YM, et al., 2021.Complete plastid genomes of Bupleurum chinense DC. and B. boissieuanum H. Wolff, with comparative and phylogenetic analyses of medicinal Bupleurum species [J]. Acta Pharm Sin, 56(2): 618-629. [張明英, 張雨曲, 李依民, 等, 2021. 北柴胡、紫花闊葉柴胡葉綠體全基因組解析及柴胡屬藥用植物葉綠體基因組比較與系統(tǒng)發(fā)育分析 [J]. 藥學學報, 56(2): 618-629.]
ZHANG RZ, ZHANG L, WANG W, et al., 2018. Differences in codon usage bias between photosynthesis-related genes and genetic system-related genes of chloroplast genomes in cultivated and wild solanum species [J]. Int J Mol Sci, 19(10): 3142.
ZHOU LJ, SANG XQ, SUN YY, et al., 2012. Pesticidal activities and active ingredients of Artemisia [J]. Acta Agric Univ Jiangxi, 34(4): 699-705. [周利娟, 桑曉清, 孫永艷, 等, 2012. 蒿屬植物的農(nóng)藥活性及其有效成分 [J]. 江西農(nóng)業(yè)大學學報, 34(4): 699-705.]
ZHU TT, ZHANG L, CHEN WS, et al., 2017. Analysis of chloroplast genomes in 1342 plants [J]. Genomics Appl Biol, 36(10): 4323-4333. [朱婷婷, 張磊, 陳萬生, 等, 2017. 1342個植物葉綠體基因組分析 [J]. 基因組學與應用生物學, 36(10): 4323-4333.]