蘭進(jìn)茂,覃瑞,夏婧
(中南民族大學(xué) 生命科學(xué)學(xué)院 & 武陵山區(qū)特色資源植物種質(zhì)保護(hù)與利用湖北省重點(diǎn)實(shí)驗(yàn)室,武漢430074)
菊科華蟹甲屬(Sinacalia)是中國(guó)特有屬,與蟹甲草屬(Parasenecio)的顯著區(qū)別是頭狀花序具有舌狀花以及具有肥大的塊莖. 該屬于1973年從蟹甲草屬分出成立,僅包括4個(gè)種:華蟹甲、雙花華蟹甲、革葉華蟹甲和大頭華蟹甲[1-3]. 不過(guò)最近的分子系統(tǒng)發(fā)育分析揭示出華蟹甲屬和蟹甲草屬都是多系的,但華蟹甲(S.tangutica)和雙花華蟹甲(S.davidii)兩個(gè)物種在一起可以保留華蟹甲草屬[4-5]. 其中華蟹甲是分布相對(duì)較廣的高大草本植物,常見于我國(guó)中西部地區(qū)的1250~3500 m的山坡草地、懸崖、溝邊、草甸或林緣和路邊. 近年的研究表明華蟹甲是一種在抗氧化和抗II型糖尿病等方面具有潛在應(yīng)用價(jià)值的重要植物[6-9]. 目前從生物學(xué)角度對(duì)華蟹甲的研究工作非常少,除了劉建全等對(duì)華蟹甲的染色體核型進(jìn)行了研究以及近年來(lái)構(gòu)建菊科千里光族的譜系發(fā)育樹包括了華蟹甲之外[4-5,10],從遺傳多樣性角度以分子生物學(xué)角度分析的研究工作幾乎是空白.
SSR(Simple Sequence Repeats)是第二代分子標(biāo)記,具有共顯性、多態(tài)性高等特點(diǎn),其數(shù)量豐富,分布廣可以覆蓋整個(gè)基因組. 鑒于華蟹甲屬目前沒(méi)有公布的基因組或轉(zhuǎn)錄組數(shù)據(jù),本研究采用簡(jiǎn)化基因組測(cè)序(Reduced Representation Genome Sequencing)的研究技術(shù)[11-13],對(duì)華蟹甲的SSR信息進(jìn)行全面的分析,并據(jù)此開發(fā)其SSR分子標(biāo)記,為華蟹甲的遺傳多樣性和遺傳結(jié)構(gòu)研究奠定基礎(chǔ). 同時(shí),華蟹甲作為一種具有潛在入侵性的大型草本植物[14],開發(fā)其SSR的分析標(biāo)記有助于為外來(lái)物種管理提供依據(jù).
本研究所用華蟹甲采自湖北省七姊妹山國(guó)家級(jí)自然保護(hù)區(qū)(109.7737° E,30.0418° N). 沿著保護(hù)區(qū)到椿木營(yíng)的小路,于2019年8月采集華蟹甲葉片材料,每株取植株上的幼嫩葉片,用變色硅膠裝入自封袋干燥. 共采集153株,用其中16株的材料進(jìn)行SSR引物的篩選. 使用植物DNA提取試劑盒(TSINGKE通用性)進(jìn)行基因組DNA提取,
將檢驗(yàn)合格的DNA樣品交由北京擎科進(jìn)行簡(jiǎn)化基因組建庫(kù)與測(cè)序. 使用酶切法將DNA隨機(jī)打斷之后,再經(jīng)末端修復(fù)、加A尾、加測(cè)序接頭、純化、PCR擴(kuò)增進(jìn)行文庫(kù)構(gòu)建,然后進(jìn)行高通量測(cè)序(DNBSEQ-T7測(cè)序儀,華大智造). 原始圖像數(shù)據(jù)文件經(jīng)CASAVA 堿基識(shí)別(Base Calling)分析轉(zhuǎn)化為以FASTQ 格式保存的測(cè)序序列(Sequenced Reads),即原始序列數(shù)據(jù)(raw reads),包含每條測(cè)序序列(Read)的名稱、堿基序列以及其對(duì)應(yīng)的測(cè)序質(zhì)量信息. 每個(gè)堿基所對(duì)應(yīng)的質(zhì)量字符ASCII 碼值減去33得到測(cè)序質(zhì)量得分(Phred Quality Score),代表不同的堿基測(cè)序錯(cuò)誤率. 然后,原始序列數(shù)據(jù)用Cd-hit進(jìn)行聚類并從中選取reads支持?jǐn)?shù)為10~400的類,根據(jù)聚類結(jié)果用 Velvetopt(Velvet優(yōu)化程序)對(duì)基因組進(jìn)行組裝,得到最后的組裝序列[15].
1.3.1 引物設(shè)計(jì)、合成與篩選
利用MISA軟件(https://webblast.ipk-gatersleben.de/misa/)對(duì)二至六堿基核苷酸重復(fù)的SSR進(jìn)行搜索,利用Primer 3軟件進(jìn)行引物設(shè)計(jì)[16-18]. 從設(shè)計(jì)的引物中選出200對(duì)SSR引物進(jìn)行合成作為引物初篩. 多態(tài)性引物的合成與篩選由北京擎科完成.
進(jìn)行第一輪擴(kuò)增時(shí),在正向引物F的5′端加上通用16個(gè)堿基的Tag修飾序列. 從中篩選擴(kuò)增條帶理想的PCR產(chǎn)物,然后用Tag修飾引物和對(duì)應(yīng)的反向R引物進(jìn)行第二輪熒光引物PCR. 這樣,3條引物兩次擴(kuò)增的方式可以達(dá)到多重?cái)U(kuò)增的目的. 對(duì)于篩選時(shí)有多態(tài)性,但是擴(kuò)增效果不理想的引物,通過(guò)設(shè)計(jì)內(nèi)引物進(jìn)行巢式擴(kuò)增來(lái)提高PCR的敏感性和擴(kuò)增的特異性. 第一輪擴(kuò)增用外引物擴(kuò)增,第二輪擴(kuò)增用帶Tag 修飾接頭的內(nèi)引物進(jìn)行擴(kuò)增,第三輪篩選擴(kuò)增條帶理想的PCR產(chǎn)物再用Tag修飾引物內(nèi)引物和對(duì)應(yīng)的反向R引物進(jìn)行熒光引物PCR.
1.3.2 SSR-PCR擴(kuò)增與檢測(cè)
用合成的200對(duì)SSR引物對(duì)16個(gè)華蟹甲樣品DNA進(jìn)行擴(kuò)增,以擎科2×TSINGKE Master Mix(blue)進(jìn)行擴(kuò)增. 第一輪擴(kuò)增體系各組分如下: PCR反應(yīng)體系20 μL,其中包括2×TSINGKE Master Mix(blue) 10 μL,正向引物(加接頭,10 μM)1 μL,反向引物(10 μM) 1 μL,DNA模板1 μL,ddH2O 7 μL. PCR反應(yīng)程序?yàn)椋?4 ℃預(yù)變性5 min,94 ℃變性30 s、56~63 ℃退火30 s、72 ℃延伸30 s、35個(gè)循環(huán),72 ℃延伸階段5 min,4 ℃保存. 第二輪擴(kuò)增體系各組分如下: PCR反應(yīng)體系20 μL,其中包括2×TSINGKE Master Mix(blue) 10 μL,Tag修飾引物1 μL,反向引物(10 μM) 1 μL,DNA模板1 μL,ddH2O 7 μL. PCR反應(yīng)程序?yàn)椋?4 ℃預(yù)變性5 min,94 ℃變性30 s、54~62 ℃退火30 s、72 ℃延伸30 s、35個(gè)循環(huán),72 ℃延伸階段5 min,4 ℃保存. 巢式引物第三輪擴(kuò)增體系各組分如下:PCR反應(yīng)體系20 μL,其中包括2×TSINGKE Master Mix(blue) 10 μL,Tag修飾引物1 μL,反向引物(10 μM)1 μL,DNA模板1 μL,ddH2O 7 μL. PCR反應(yīng)程序?yàn)椋?4 ℃預(yù)變性5 min,94 ℃變性30 s、54 ℃退火30 s、72 ℃延伸30 s、35個(gè)循環(huán),72 ℃延伸階段5 min,4 ℃保存.
將擴(kuò)增好的PCR產(chǎn)物進(jìn)行瓊脂糖凝膠電泳(2 μL樣品+6 μL溴酚藍(lán)),300 V電壓下12 min,獲取鑒定膠圖并確定模板濃度. 擴(kuò)增良好的熒光PCR產(chǎn)物利用3730xl測(cè)序儀(美國(guó)ABI)毛細(xì)管電泳檢測(cè).
1.3.3 位點(diǎn)分析與篩選
用軟件Gene mapper 4.1進(jìn)行數(shù)據(jù)準(zhǔn)確位點(diǎn)的分析,分析數(shù)據(jù)按照引物對(duì)應(yīng)關(guān)系的核心堿基重復(fù)數(shù)來(lái)確定位點(diǎn)準(zhǔn)確大小. 例如(AG)6片段大小263, 應(yīng)加了Tag的16個(gè)堿基,所以大小實(shí)際為279. 根據(jù)分析出來(lái)的位點(diǎn)信息,選取特異性高,多態(tài)性好的位點(diǎn)做為后續(xù)研究的重點(diǎn). 如圖1所示XJSSR119位點(diǎn)即為篩選出的一個(gè)多態(tài)性和特異性都很好的SSR引物.
圖1 XJSSR119位點(diǎn)在3個(gè)樣品中的基因型Fig.1 Genotypes of 3 samples at No. XJSSR119 SSR locus
華蟹甲DNA的RAD測(cè)序共產(chǎn)生Raw reads 1.910 G. 如果測(cè)序錯(cuò)誤率用e表示, DNASEQ T7平臺(tái)測(cè)得數(shù)據(jù)的堿基質(zhì)量值用Qphred表示,則有:Qphred =-10log10(e). 華蟹甲簡(jiǎn)化基因組原始數(shù)據(jù)中Phred數(shù)值大于20的堿基數(shù)量占總堿基數(shù)量的百分比(Q20)為96.7%;GC含量為36.8%. 質(zhì)量評(píng)估結(jié)果表明測(cè)序質(zhì)量合格,GC分布正常.
對(duì)華蟹甲簡(jiǎn)化基因組進(jìn)行組裝,總長(zhǎng)度為357574425 bp,組裝總個(gè)數(shù)為2085798,組裝的平均長(zhǎng)度為171 bp. 序列從大到小排列,當(dāng)長(zhǎng)度達(dá)到組裝總長(zhǎng)度一半時(shí),contig的長(zhǎng)度為200 bp.
對(duì)樣本組裝 contig 進(jìn)行過(guò)濾,共得到雙端含有100 bp(用于之后設(shè)計(jì)引物)的精確型SSR 位點(diǎn)46674個(gè),復(fù)合型SSR位點(diǎn)3062個(gè). 其中,包含均有引物片段的SSR數(shù)目為43235,片段引物設(shè)計(jì)率為92%. 華蟹甲簡(jiǎn)化基因組SSR位點(diǎn)類型豐富,單核苷酸至六核苷酸重復(fù)類型均存在(表1). 各組分?jǐn)?shù)量分析結(jié)果表明,華蟹甲的核基因組SSR主要以單、二和三堿基重復(fù)單元為主,單核苷酸重復(fù)、二核苷酸重復(fù)和三核苷酸重復(fù)類型的數(shù)量較多,占主導(dǎo)地位(圖2). 其中,單堿基重復(fù)基序數(shù)量最多(21529條,占總數(shù)46.13%),其次為二核苷酸重復(fù)序列(18426條,占比39.48%),再次為三核苷酸的重復(fù)序列(5861條,占12.55%),其他類型的SSR序列很少(858條,只占1.84%). 重復(fù)單元數(shù)量分析結(jié)果表明:華蟹甲簡(jiǎn)化基因組的精確型SSR位點(diǎn)總共含有321種重復(fù)單元;如圖2所示,重復(fù)單元最多的是單核苷酸重復(fù)(A/T)n,其次為二核苷酸重復(fù)(AC/GT)n和(AG/CT)n. 最常見的重復(fù)次數(shù)是重復(fù)10次,其次是6次(表2).
表1 華蟹甲簡(jiǎn)化基因組SSR引物檢測(cè)結(jié)果Tab.1 The abundance of SSRs in S. tangutica
圖2 分布最豐富的SSR序列類型Fig.2 Numbers of the most abundance SSRs classified based on their motifs.
表2 華蟹甲簡(jiǎn)化基因組不同類型SSR重復(fù)單元類型分布Tab.2 Frequencies of different SSR repeat motif types in S. tangutica
利用已合成的200對(duì)引物對(duì)16個(gè)華蟹甲樣品進(jìn)行熒光SSR擴(kuò)增,共篩選出特異性和多態(tài)性較高的引物共20對(duì),其中5對(duì)引物另外設(shè)計(jì)了半巢氏引物(表3).
表3 華蟹甲SSR引物序列信息Tab.3 The information of SSR primer sequences of S. tangutica
隨著新一代測(cè)序技術(shù)的快速發(fā)展,高通量測(cè)序技術(shù)被廣泛應(yīng)用于SSR標(biāo)記的開發(fā). 目前開發(fā)SSR引物可以通過(guò)轉(zhuǎn)錄組測(cè)序、全基因組測(cè)序和簡(jiǎn)化基因組測(cè)序等多種方式進(jìn)行. 但與前兩者相比,簡(jiǎn)化基因組測(cè)序只對(duì)全基因組中限制性內(nèi)切酶酶切位點(diǎn)附近的片段進(jìn)行高通量測(cè)序,從而降低了基因組的復(fù)雜性和測(cè)序量,因此獲得目標(biāo)物種的序列遺傳信息經(jīng)濟(jì)快速. 此外,標(biāo)記尋找采用不受參考基因組限制的tag 同源聚類的方法. 對(duì)于沒(méi)有足夠核算序列參考的物種而言,利用簡(jiǎn)化基因組測(cè)序來(lái)開發(fā)SSR引物是一種比較理想可行的技術(shù)[11-13]. 本研究通過(guò)簡(jiǎn)化基因組測(cè)序和組裝過(guò)濾,共得到雙端含有100 bp(用于之后設(shè)計(jì)引物)的精確型SSR 位點(diǎn)46674個(gè),說(shuō)明華蟹甲的SSR位點(diǎn)非常豐富. 雖然目前從200對(duì)合成引物中只篩選出了20對(duì)多態(tài)性高特異性強(qiáng)的引物,但是本研究將為后續(xù)基于SSR標(biāo)記上的華蟹甲居群遺傳結(jié)構(gòu)和指紋圖譜等研究提供SSR標(biāo)記數(shù)據(jù)庫(kù).
菊科植物化學(xué)成分的復(fù)雜性和多樣性均居植物界之首,幾乎包括了所有的天然化合物類型,是非常重要的天然藥庫(kù).近年來(lái)對(duì)華蟹甲化學(xué)成分和藥理活性的研究都表明其有效成分具有抗腫瘤、消炎、抗菌和殺蟲等生物活性,可能會(huì)成為新型抗腫瘤、抗氧化、抗菌等特效藥物的重要來(lái)源[6-9,19-21]. 目前對(duì)華蟹甲的生物學(xué)研究非常少,尤其華蟹甲的遺傳多樣性和遺傳結(jié)構(gòu)還一無(wú)所知,而這些恰恰是今后物種可持續(xù)利用和保護(hù)的基礎(chǔ). 要開展遺傳多樣性的研究以及分子標(biāo)記輔助育種(marker- assisted selection)等研究,分子標(biāo)記的開發(fā)是第一步[11]. 雖然利用近緣種開發(fā)的SSR引物篩選目標(biāo)物種所需標(biāo)記也是一種相對(duì)快捷的手段,但是其通用性并不穩(wěn)定,存在較大的波動(dòng)[22]. 此外,目前橐吾—垂頭菊—蟹甲草復(fù)合群(Ligularia-Cremanthodium-Paraseneciocomplex)中,已開發(fā)出來(lái)的SSR引物只有鹿蹄橐吾中的14對(duì)SSR以及大吳風(fēng)草中的8對(duì)引物[23-24],在與之關(guān)系最近的蟹甲草屬中仍無(wú)相關(guān)報(bào)道. 因此,開發(fā)SSR 標(biāo)記將為今后進(jìn)行華蟹甲的遺傳多樣性和遺傳結(jié)構(gòu)研究奠定基礎(chǔ),也可作為其近緣屬種的遺傳多樣性研究提供參考,具有重要的實(shí)際意義.
與此同時(shí),菊科也是入侵植物中最多的一個(gè)科[25]. 外來(lái)物種入侵是導(dǎo)致正在進(jìn)行的第六次物種大滅絕中的一個(gè)重要原因,最近的一項(xiàng)研究表明自1500年以來(lái)全球超過(guò)25%的植物物種滅絕和33%的動(dòng)物物種滅絕源于外來(lái)物種入侵. 目前,生物入侵已成為當(dāng)今世界的一個(gè)嚴(yán)重的環(huán)境問(wèn)題[26-27]. 華蟹甲雖是中國(guó)分布的特有物種,但是其具有的有效的種子傳播和擴(kuò)散機(jī)制、通過(guò)塊莖進(jìn)行繁殖的良好集群能力,這些特征使華蟹甲具有非常強(qiáng)的擴(kuò)散能力. 通過(guò)近幾年的野外調(diào)查,本課題組已經(jīng)發(fā)現(xiàn)華蟹甲在七姊妹山國(guó)家級(jí)自然保護(hù)區(qū)的擴(kuò)散趨勢(shì)逐年增強(qiáng)(未發(fā)表數(shù)據(jù)). 奧地利的研究者在近期的外來(lái)植物調(diào)查中也開始關(guān)注華蟹甲在當(dāng)?shù)氐臄U(kuò)張,華蟹甲作為一種觀賞植物在1970年被引入當(dāng)?shù)厣絽^(qū),基于華蟹甲在過(guò)去50年內(nèi)的擴(kuò)散情況及其繁殖特性,作者建議對(duì)其進(jìn)行監(jiān)控和管理[14]. 遺傳多樣性對(duì)外來(lái)物種的短期入侵成功和長(zhǎng)期進(jìn)化都具有重要的影響,弄清外來(lái)入侵物種的遺傳背景, 同時(shí)開展原產(chǎn)地和引入地之間的比較研究可以為物種管理提供科學(xué)的依據(jù)[26,28]. 因此成功篩選華蟹甲SSR引物也為該物種在引入地的管理提供科學(xué)參考依據(jù).