王 燦,黃玉玲,楊清松,彭翠仙,李 玲,趙大偉,陶永宏
(云南省文山州農(nóng)業(yè)科學(xué)院,云南 文山 663000)
文山三七[Panax notoginseng(Burk.) F. H.Chen](下簡(jiǎn)稱三七)是五加科人參屬藥用植物,具有悠久的栽培歷史,是珍貴的中藥材,同時(shí)也是保健品、特色食材等,具有消腫定痛、止血、滋補(bǔ)強(qiáng)壯、抗疲勞、耐缺氧、抗衰老、降血脂、降血糖、提高機(jī)體免疫力等功效[1-2]。據(jù)有關(guān)文獻(xiàn)記載,三七使用歷史近600 年,栽培歷史近500 年。三七主要分布在我國(guó)西南部海拔1 500 ~ 1 800 m,北緯23.5°的特殊地理氣候環(huán)境中[2],其中云南文山是三七的原產(chǎn)地和主產(chǎn)地,全國(guó)的三七大多來(lái)源于此。隨著市場(chǎng)對(duì)三七需求量的增加,三七病害、連作障礙的發(fā)生,三七耕作制度的影響,導(dǎo)致三七種植業(yè)存在不斷更換種植地點(diǎn),農(nóng)戶間相互售賣各地種苗,三七種質(zhì)混雜,極大增加了三七居群間的基因交流等問(wèn)題的出現(xiàn),影響了三七產(chǎn)業(yè)的正常發(fā)展[2-3]。
基因分型技術(shù)(Genotyping by sequencing,GBS)是一種基于二代測(cè)序的簡(jiǎn)化基因組測(cè)序技術(shù),可檢測(cè)物種SNP 的變異位點(diǎn),對(duì)了解種質(zhì)資源的遺傳背景、系統(tǒng)進(jìn)化、群體遺傳多樣性及遺傳結(jié)構(gòu)具有重要意義[4-5]。目前已應(yīng)用GBS 方法對(duì)石斛[6]、黃芪[7]等物種進(jìn)行了群體SNP 的檢測(cè)并用于群體關(guān)聯(lián)分析、遺傳圖譜的構(gòu)建和遺傳多樣性研究。郭燦等[8]根據(jù)地理來(lái)源和種質(zhì)類型將59 份不同茶樹(shù)品種(系)材料分為11個(gè)種群,發(fā)現(xiàn)不同種群間具有較低的基因交流,但種群內(nèi)部具有較高的基因交流,由此提出在育種實(shí)踐中應(yīng)盡量避免相同地理來(lái)源材料間的雜交應(yīng)用。
雖然育種工作者很早就開(kāi)始三七種質(zhì)資源的收集和利用,但由于三七選育周期長(zhǎng)良種少,種質(zhì)資源混雜、自身多樣性豐富等原因?qū)е氯叻N質(zhì)資源的評(píng)價(jià)、收集、利用相關(guān)基礎(chǔ)還很薄弱[1]。為此本研究以28份不同居群三七及其近緣種為材料,采用GBS技術(shù),初步進(jìn)行不同居群間遺傳結(jié)構(gòu)分析,為后續(xù)更加全面解析三七及其近緣種種質(zhì)資源多樣性評(píng)價(jià)、育種親本選擇、優(yōu)良種質(zhì)性狀遺傳標(biāo)記提供理論依據(jù)。
收集文山州地區(qū)栽培3年以上的人參屬植物葉片樣本共28 份(表1),其中包括25 份文山三七樣本,由文山州農(nóng)業(yè)科學(xué)院藥物生物研究所陶永宏研究員鑒定為文山三七[Panax notoginseng(Burk.)F.H.Chen]。此外還收集3 份近緣種材料:屏邊三七、姜狀三七、狹葉竹節(jié)參各一份由文山州農(nóng)業(yè)科學(xué)院藥物生物研究所黃玉玲高級(jí)農(nóng)藝師鑒定為屏邊三七(Panax stipuleanatus)、姜狀三七(Panax zingiberensis)和狹葉竹節(jié)參(Panax japonicasvar.angustifo-lius)。
表1 供試三七及其近緣種植物材料Tab.1 Panax notoginseng and its closely related species materials provided in the experiment
DNA 提取采用CTAB 法[9],分別取28 份三七及其近緣種幼嫩葉片材料約0.05 g 用組織研磨儀進(jìn)行研磨。DNA 產(chǎn)物經(jīng)0.8%瓊脂糖凝膠電泳檢測(cè),確認(rèn)目的條帶清晰明亮且完整后,利用 TIANGEN Purification Kit 柱式膠回收試劑盒進(jìn)行純化,純化后的產(chǎn)物經(jīng)過(guò)濃度及純度檢測(cè)達(dá)到測(cè)序要求后,送往廣州基迪奧生物科技有限公進(jìn)行測(cè)序。
使用比對(duì)軟件bwa(0.7.12)采用mem 算法將過(guò)濾后的reads 比對(duì)到五加科人參屬三七[Panax notoginseng( Burk.) F. H. Chen]參考基因組(NCBI:PRJNA632433)上[10],比對(duì)完之后結(jié)果使用picard(1.129)軟件進(jìn)行標(biāo)記。使用軟件 GATK (3.4-46)的UnifiedGenotyper 模塊將處理好的比對(duì)文件進(jìn)行多個(gè)樣本的Variant 檢測(cè),檢測(cè)到的變異使用Variant-Filtration 進(jìn)行過(guò)濾。使用ANNOVAR 對(duì)檢測(cè)出的Variant進(jìn)行功能注釋。通過(guò)得到的SNP信息計(jì)算樣品間遺傳距離,對(duì)樣品進(jìn)行聚類分析,并使用 treebest 軟件鄰接法構(gòu)建進(jìn)化樹(shù)。同時(shí)采用Plink 和Admixture軟件進(jìn)行群體結(jié)構(gòu)和雜合率分析。
將28 份三七及其近緣種幼嫩葉片材料DNA 提取后進(jìn)行凝膠電泳檢測(cè),電泳圖如下(圖1),條帶清晰可用于后續(xù)建庫(kù)測(cè)序。對(duì)28 份材料的測(cè)序數(shù)據(jù)進(jìn)行統(tǒng)計(jì)共獲得115.64 Gb 數(shù)據(jù),平均每個(gè)樣品為4.13 Gb。過(guò)濾后各樣本測(cè)序片段數(shù)和堿基數(shù)存在差異,其中最多的是PN-PB-2(測(cè)序片段數(shù)為42 350 070,堿基數(shù)為5 926 130 970 bp),最少的是PN-PL-4(測(cè)序片段數(shù)為15 681 198,堿基數(shù)為2 208 630 526 bp)。測(cè)序質(zhì)量里平均Q20 ≧ 98.63%、平均Q30 ≧ 95.05%、平均GC ≧ 38.47%,測(cè)序質(zhì)量較好,滿足分析要求。(表2)
圖1 瓊脂糖凝膠電泳圖Fig.1 Agarose gel electropherogram
表2 三七及其近緣種植物測(cè)序數(shù)據(jù)統(tǒng)計(jì)Tab.2 Statistics of plant sequencing data of panax notoginseng and closely related species
在三七及三七近緣種植物與參考基因組比對(duì)統(tǒng)計(jì)表中,單端比對(duì)上的reads 最高的是PZ(11 769 895),雙端比對(duì)上的reads 最高的是PNPB-2 (38 394 164)。未比對(duì)上的reads 最高的是PS達(dá) 8 229 975,最低的是PN-PA-3 僅106 684。比對(duì)率最高的是PN-PA-3 (99.45%),最低的是PS(70.03%)。在雜合率比較中,三七雜合率5.6% ~12.9%,平均值為10.02%,均高于屏邊三七1.3%、姜狀三七6.2%、狹葉竹節(jié)參5.1%(表3)。
表3 三七及其近緣種植物與參考基因組比對(duì)統(tǒng)計(jì)表Tab.3 Statistical table for comparison of panax notoginseng and closely related species with reference genome
對(duì)SNP 分型結(jié)果進(jìn)行突變統(tǒng)計(jì),獲得高質(zhì)量SNP 位點(diǎn)1 968 786,InDel 標(biāo)記90 954,All Variant 數(shù)2 059 740。Transition占比為68.49%(1 348 336個(gè)),其中C->T 轉(zhuǎn)換類型最多(420 919 個(gè)),占全部堿基突變類型的21.38%,G->A 轉(zhuǎn)換類型(418 681 個(gè))占21.27%,T->C 轉(zhuǎn)換類型(254 618 個(gè))占12.93 %,A->G 轉(zhuǎn)換類型(254 118 個(gè))占12.91%。Transversion占比為31.51%(620 450個(gè))。其中C->A顛換類型最多(110 447 個(gè))占5.61%,C->G 顛換類型最少(36 203個(gè))占1.84%。轉(zhuǎn)換與顛換比為2.17(圖2)。
圖2 SNP位點(diǎn)堿基突變類型及其數(shù)量Fig.2 Types and quantities of base mutations at SNP sites
對(duì)Variant 注釋發(fā)現(xiàn)功能分類中(表4),非同義突變最大為60 052 個(gè),約占54.979%,其次是同義突變44 160 個(gè),約占40.429%,終止子獲得為2 548 個(gè),約占2.333%。此外標(biāo)記最多的位于基因間區(qū),約占總量的77.83%,12.31%位于基因中內(nèi)含子區(qū)域,5.30%位于基因中外顯子區(qū)域。1.66%和1.62%分別位于基因下游和上游,位于基因下游區(qū)域同時(shí)又位于上游區(qū)域的占0.18%。UTR3 和UTR5 分別占0.63%、0.45%,位于UTR3 同時(shí)又位于UTR5 區(qū)域的占0.001%。位于剪切位點(diǎn)的占0.03%(表5)。
表4 SNP功能分類Tab.4 Functional classification of the SNP
表5 SNP標(biāo)記的功能性分布Tab.5 Functional distribution of the SNP markers
根據(jù)得到的SNP 信息,用treebest 軟件構(gòu)建NJ(Neighbor-joining methods)進(jìn)化樹(shù)(圖3a),可劃分3個(gè)大的類群。即屏邊三七單獨(dú)聚為一類,姜狀三七和狹葉竹節(jié)參聚為一類,文山三七單獨(dú)聚為一類。此外在文山三七中,不同地點(diǎn)采集的樣本分布較為混雜,相同地理來(lái)源的種質(zhì)并未完全歸并到一處。
圖3 群體遺傳結(jié)構(gòu)分析Fig.3 Population genetic structure analysis
通過(guò)Plink 和Admixture 進(jìn)行群體遺傳結(jié)構(gòu)分析。提取K= 1 ~ 9 時(shí)的交叉驗(yàn)證錯(cuò)誤率(Cross-valdaion error,CV error),K從2開(kāi)始CV error逐漸增大,因此K= 2 可作為最佳值(圖3b)。Structure 圖可以看出K= 2 時(shí),PS(屏邊三七)、PZ(姜狀三七)、PJA(狹葉竹節(jié)參)聚為一支;文山三七(PN)聚為一支與進(jìn)化樹(shù)結(jié)果一致,其中PN-ML-5、PN-PA-2、PNPL-3、PN-PL-4包含了2種遺傳背景(圖3c)。
種質(zhì)資源是培育優(yōu)良品種的基礎(chǔ),不同居群遺傳結(jié)構(gòu)分析對(duì)培育新品種和種質(zhì)資源收集、評(píng)價(jià)與利用具有重要的意義。本文對(duì)25 份文山三七樣本和3 份近緣種進(jìn)行GBS 測(cè)序,共獲得115.64 Gb 數(shù)據(jù),1 968 786 個(gè)SNP 位點(diǎn),其中5.30%(109 188)位于外顯子區(qū)域。外顯子作為真核生物基因的一部分,包含著合成蛋白質(zhì)所需要的核心信息并可在蛋白質(zhì)生物合成過(guò)程中被表達(dá)[11]。因此外顯子上的SNP 可應(yīng)用于功能基因標(biāo)記的開(kāi)發(fā),表明本研究中外顯子上的109 188 個(gè)SNP 具有開(kāi)發(fā)成功能標(biāo)記的潛力。此外SNP 功能分布中,終止子獲得是指堿基突變導(dǎo)致終止密碼子提前出現(xiàn),產(chǎn)生截短的蛋白質(zhì)從而使基因喪失原本的功能,并進(jìn)一步引發(fā)植物表型變異[11]。大豆中GmSG基因發(fā)生 A->G 轉(zhuǎn)換導(dǎo)致翻譯提前終止,使大豆種皮顏色由黃色轉(zhuǎn)變?yōu)辄S綠色[12]。水稻中OsCUL3a 蛋白翻譯提前終止導(dǎo)致水稻flg 22、幾丁質(zhì)誘導(dǎo)的活性氧和相關(guān)發(fā)病基因表達(dá)量顯著增加,進(jìn)而產(chǎn)生類病斑[13]。因此終止子獲得對(duì)基因功能研究具有重要意義,本試驗(yàn)中終止子獲得有2 548 個(gè),約占2.333%,僅次于非同義突變,(54.979%)和同義突變(40.429%)排名第3,此結(jié)果將為后續(xù)三七生長(zhǎng)特性、生物抗性及皂苷合成等基因功能研究提供新的見(jiàn)解。
本研究中根據(jù)NJ進(jìn)化樹(shù)顯示,三七不同居群間遺傳分化水平較低、距離較近;另外三七近緣種與三七遺傳距離較遠(yuǎn),尤其是屏邊三七與三七遺傳距離最遠(yuǎn),這與張金渝等[4]通過(guò)SSR標(biāo)記分析比較8個(gè)文山三七及近緣種居群遺傳結(jié)構(gòu)結(jié)果一致。遺傳結(jié)構(gòu)分析中當(dāng)K= 2時(shí)除個(gè)別材料外,三七居群間均僅包含1 種遺傳背景,暗示不同地區(qū)間遺傳差異不明顯,種源間交流頻繁、基因遺傳一致度較高,難以形成遺傳分化較大的品種和居群。試驗(yàn)通過(guò)雜合率分析可知,三七雜合率較高,其范圍在5.6% ~12.9%,平均值為10.02%,而在近緣種中屏邊三七是1.3%、姜狀三七6.2%、狹葉竹節(jié)參5.1%,其雜合度明顯低于三七,說(shuō)明三七遺傳多樣性和遺傳變異豐富。Fan 等[14]揭示了三七群體間存在頻繁基因流動(dòng),其原因可能是由于三七植株生長(zhǎng)過(guò)程中為了適應(yīng)復(fù)雜的地理氣候環(huán)境,形成了豐富多樣的生態(tài)類型,同時(shí)受三七連作障礙的影響頻繁更換種植區(qū)域,造成居群間基因頻繁交流,故增加了居群內(nèi)基因的雜合度,增加了基因交換、重組的幾率,從而使三七居群間的遺傳背景高度一致,群體遺傳差異較小。這意味著文山不同地區(qū)間群體混雜,整體遺傳背景差異較小,雜合度較高難以以此為基礎(chǔ)進(jìn)行雜交育種。雜交育種是將兩個(gè)或多個(gè)性狀優(yōu)良的品種通過(guò)雜交選育的方法,快速將多個(gè)優(yōu)良性狀集合到單一的品種上從而提高品種利用性。但應(yīng)注意親本間的遺傳差異,選用生態(tài)類型差異較大、親緣關(guān)系較遠(yuǎn)、基因純合的親本材料相互雜交[15]。因此今后的育種工作中,通過(guò)分子標(biāo)記準(zhǔn)確篩選鑒定優(yōu)異單株并開(kāi)展定向培育(如抗病、高產(chǎn)等)是開(kāi)展三七育種的有效途徑[16]。同時(shí)應(yīng)著重對(duì)三七居群個(gè)體間具有優(yōu)良性狀的變異個(gè)體(抗病、優(yōu)質(zhì))進(jìn)行種質(zhì)資源的收集、篩選、評(píng)價(jià)和保存。利用三七的高多態(tài)性加速三七重要功能基因的標(biāo)記、利用,針對(duì)特定性狀進(jìn)行小孢子單倍體育種快速培育是未來(lái)三七新品培育的重要研究?jī)?nèi)容之一。
綜上,本文運(yùn)用SNP 標(biāo)記對(duì)不同居群文山三七及其近緣種遺傳結(jié)構(gòu)進(jìn)行研究,發(fā)現(xiàn)文山三七及其近緣種遺傳距離較遠(yuǎn),尤其是屏邊三七與文山三七遺傳距離最遠(yuǎn)。不同地區(qū)三七居群間遺傳背景差異不顯著,遺傳分化程度較低,但個(gè)體間多樣性、雜合度較高。此外試驗(yàn)獲得1 968 786 個(gè)SNP 位點(diǎn),其中5.30%(109 188)位于外顯子區(qū)域,另外終止子獲得有2 548 個(gè)約占2.333%。這些結(jié)果進(jìn)一步豐富了三七分子標(biāo)記開(kāi)發(fā)數(shù)量,為后續(xù)重要基因功能的標(biāo)記和研究如生物抗性及皂苷合成等提供了巨大研究潛力,同時(shí)也為三七的種質(zhì)資源評(píng)價(jià)、資源保護(hù)、遺傳圖譜構(gòu)建、生物育種等研究提供科學(xué)參考。