,,,,
(1.浙江省林業(yè)科學(xué)研究院,浙江 杭州 310023;2.森林食品資源利用與質(zhì)量控制國家林業(yè)局重點實驗室,浙江 杭州 310023)
薄殼山核桃Carya illinoinensis(Wangenh.) K.Koch是胡桃科山核桃屬植物,因其性狀優(yōu)良和核仁營養(yǎng)價值高,在世界五大洲被廣泛引種栽培,是重要的世界性干果和油料作物[1-2]。薄殼山核桃是雌雄同株的風(fēng)媒花異交植物,按照雌雄花成熟期的先后,大致可分為雄先型和雌先型2 種類型[3]。不同品種在不同氣候條件下會存在花期不遇的問題,這是影響薄殼山核桃穩(wěn)產(chǎn)和高產(chǎn)的重要原因之一。美國是薄殼山核桃的原產(chǎn)地之一,目前也是薄殼山核桃的中心產(chǎn)區(qū),其產(chǎn)量占全球產(chǎn)量的85%以上。美國現(xiàn)有1 000 多品種,在建園時往往可以根據(jù)當(dāng)?shù)氐臍夂蛱攸c進(jìn)行有效的雜交配置,壯年林干果產(chǎn)量可達(dá)1 500 kg/hm2以上。雖然我國引種薄殼山核桃已有100 多年的歷史,但是目前生產(chǎn)上常用的品種僅幾十個。多年的生產(chǎn)實踐結(jié)果證明我國不少地區(qū)是薄殼山核桃的適生區(qū),但是較多薄殼山核桃產(chǎn)區(qū)面臨產(chǎn)量低下和產(chǎn)量不穩(wěn)定的問題,尤其是廣大亞熱帶地區(qū)。造成這一現(xiàn)象的原因有多個方面,比如實際使用的品種較為有限,再加上引種時存在錯誤以及一些雜交后代定名混亂,難以進(jìn)行有效的親本選擇和親緣關(guān)系分析,更難以根據(jù)當(dāng)?shù)氐臍夂蛱攸c進(jìn)行有效的雜交配置。
目前,用于薄殼山核桃品種鑒定的分子標(biāo)記方法主要有RAPD[4-5]、SSR[6-9]、SRAP[10]、ISSR[11-12]和SNP[13]等。一般來說,SSR 和SNP 等標(biāo)記須進(jìn)行大量基因組或轉(zhuǎn)錄組的測序和分析[13-14],得到穩(wěn)定性和多態(tài)性較好的標(biāo)記的成本較高。在利用SSR引物對薄殼山核桃進(jìn)行品種鑒定時,重復(fù)性檢測中也存在一些問題[7],這主要是因為:一方面薄殼山核桃高度雜合,基因組大且有較多重復(fù),導(dǎo)致SSR 引物存在一定的非特異性;另一方面,SSR 和SNP 這類標(biāo)記對檢測的要求較高,且檢測識別時存在一定的人為干擾。隨著測序技術(shù)的進(jìn)步以及越來越多的薄殼山核桃基因組數(shù)據(jù)的公布,利用品種間基因組數(shù)據(jù)的差異挖掘序列特異性標(biāo)記(sequence characterized amplified region,SCAR)是一個提高分子標(biāo)記的穩(wěn)定性和特異性的辦法。本研究中通過對不同薄殼山核桃品種葉片DNA 進(jìn)行簡單基因組測序,尋找品種特異性的SCAR 標(biāo)記,旨在針對生產(chǎn)上常用品種從分子水平上開發(fā)出穩(wěn)定、特異的DNA 指紋標(biāo)記,為輔助實現(xiàn)薄殼山核桃品種準(zhǔn)確快速鑒定和親緣關(guān)系分析提供參考。
薄殼山核桃樣品采集于建德薄殼山核桃基地,地理位置為119°32.86′E、29°33.76′N,海拔97.5 m。5月上旬,采摘植株新鮮嫩葉,冰浴運輸,當(dāng)天保存于-20 ℃冰箱中備用。所涉及的品種見表1。其中,Ind23 和Ind24 為不同來源的同一品種,Ind23 為20 世紀(jì)80年代從美國德克薩斯州美國山核桃試驗站引進(jìn),Ind24 為1999年從美國國家無性系種質(zhì)資源庫(National Clonal Germplasm Repository)引進(jìn)?!靶巯取焙汀按葡取钡呐袛嗍歉鶕?jù)不同性別花剛開始成熟的時間,雄花是指花粉開始散粉,雌花是指柱頭出現(xiàn)可授粉狀態(tài)[3]。
表1 薄殼山核桃試驗品種及其生理特點Table 1 Experimental varieties and physiological characteristics of C.illinoensis
1.2.1 DNA 提取
葉片DNA 的提取采用新型快速植物基因組DNA 提取試劑盒(BioTeke,北京)。取各品種葉片樣品0.02 ~0.03 g,剪碎后放入2.0 mL 離心管內(nèi),加入直徑3 mm 碳化鎢研磨珠2 顆,用液氮冰凍5 ~10 min,再用MM400 研磨儀(萊馳,德國)30 Hz 研磨2 min,然后按照試劑盒說明書操作。提取好的DNA 經(jīng)1.0%的瓊脂糖凝膠電泳檢測完整性,然后用NanoDrop2000 超微量分光光度計檢測其質(zhì)量濃度,置于-20 ℃冰箱備用,使用前將DNA 質(zhì)量濃度稀釋標(biāo)定至20 ng/μL。
1.2.2 簡化基因組測序和分析
簡化基因組測序是基于RAD(restriction-siteassociated DNA sequencing)方法進(jìn)行的。具體步驟:提取高質(zhì)量DNA,使用多種限制性內(nèi)切酶對DNA樣品分別進(jìn)行酶切,根據(jù)酶切試驗的結(jié)果選擇合適的酶,構(gòu)建長度為300 ~500 bp 的pair-end 文庫,用Illumina HiSeq PE150 測序文庫,獲得每種樣品的簡化基因組原始數(shù)據(jù)。
后續(xù)分析方法:1)對每種樣品中的Reads1(雙端PE 測序后前端的數(shù)據(jù),即含有EcoRI 酶切位點AATTC 的片段)進(jìn)行比對聚類;2)對每種樣品的序列聚類結(jié)果進(jìn)行內(nèi)部比對,得到樣品內(nèi)部各序列位點信息;3)將不同樣品的序列互相進(jìn)行比對,尋找個體之間堿基差異信息,并根據(jù)樣品信息尋找亞群特異的序列位點;4)根據(jù)特異序列信息獲得雙端數(shù)據(jù)進(jìn)行組裝,得到亞群特異的基因組片段。
具體組裝方法:1)使用cap3 軟件(http://seq.cs.iastate.edu/cap3.html)將Reads1 與Reads2 進(jìn) 行局部組裝;將特異Taq(unique Tag)與最長的組裝結(jié)果進(jìn)行連接(中間加入5 個“N”),獲得初步組裝結(jié)果;2)將某一樣品獲得的組裝Tag 與其他樣品的序列進(jìn)行blastn 比對,過濾掉相似序列,比對使用的軟件為blastn,參數(shù)e-value 為1×10-5。另外,在設(shè)計引物前,為了增加引物擴增的有效率,使 用MISA(http://pgrc.ipk-gatersleben.de/misa/)對組裝結(jié)果進(jìn)行SSR 預(yù)測,剔除含有SSR 的組裝結(jié)果。
使用Vector NTI 9.0 軟件設(shè)計引物,各樣品特異片段的引物設(shè)計原則:引物長度18 ~22 bp,解鏈溫度56 ~62 ℃,產(chǎn)物長度150 ~300 bp。
1.2.3 SCAR 標(biāo)記開發(fā)
對使用上述引物預(yù)測的片段進(jìn)一步開展blast分析,挑選出與核桃(Juglans regia,現(xiàn)有全基因組數(shù)據(jù)中與薄殼山核桃最近物種)同源性最高的DNA 序列片段,作為后續(xù)SCAR 標(biāo)記開發(fā)的候選序列。對這些序列進(jìn)行PCR 篩選,挑選出23 個品種中存在多態(tài)性的DNA 條帶,切膠回收純化這些條帶,并利用PCR 引物進(jìn)行兩端測序,測序結(jié)果經(jīng)Vector NTI 9.0 軟件中的ContigExpress 拼接,將重測序得到的序列與之前的基因組測序數(shù)據(jù)進(jìn)行比對,補充這些序列中間的未知堿基(這些堿基之前以“NNN”表示),將得到的完整序列作為新的SCAR 標(biāo)記。
1.2.4 PCR 篩選
常規(guī)PCR 試驗所用試劑為BioTeke PCR MasterMix(BioTeke,北京),整個反應(yīng)體系除引物和模板外,均按照試劑手冊要求操作。在15 μL體系中,引物用量為上游和下游引物(10 μmol/L)各0.6 μL,模板為2 μL。用于直接測序前,反應(yīng)體系擴大到60 μL,模板為前面15 μL 產(chǎn)物稀釋1 000 倍?;旌隙鄬σ镞M(jìn)行PCR 反應(yīng)時,適當(dāng)調(diào)整每對引物的量,至最佳擴增效果,其他條件不變。所有PCR 反應(yīng)在Genepro Thermal Cycle(Bioer,杭州)PCR 儀上進(jìn)行,程序:94 ℃ 300 s,95 ℃ 10 s,56 ℃ 50 s,72 ℃ 40 s,共35 輪循環(huán);72 ℃,300 s。擴增產(chǎn)物經(jīng)1.5%瓊脂糖凝膠電泳檢測,排槍上樣各5 μL,泳道順序?qū)?yīng)樣品分別是Ind01,Ind13,Ind02,Ind14……。Marker為DL2000(Takara),條帶大小依次為2 000、1 000、750、500、250、100 bp,上樣量3 μL。EB染色和ChemiDoc(Biorad,北京)拍照。
1.2.5 親緣關(guān)系分析
在各品種中,所篩選較為穩(wěn)定的SCAR 標(biāo)記的有無,分別以“1”“0”進(jìn)行記錄,然后使用NTSYS 2.2 軟件建立聚類分支樹狀圖。首先用similarity 程序組中的SimQual 計算形似系數(shù)矩陣,然后使用Clustering 程序組中的SHAN 進(jìn)行計算,聚類方法選用UPGMA,其他參數(shù)按默認(rèn)設(shè)置。
選取性狀差異較大的5 個品種的樣品進(jìn)行Illumina HiSeq PE150 測序,分別是Moore、Nacono、Van Deman、Davis 和Pawnee,測序結(jié)果見表2。一般情況下A 與T 數(shù)量相等,C 與G 數(shù)量相等,(A+T)/(C+G)的值則具有物種特異性。從表2可知,由于該簡化基因組文庫是對酶切片段附近的序列進(jìn)行測序,所以堿基并不平衡,且頭部5 個堿基為固定的“AATTC”序列,薄殼山核桃(A+T)/(C+G)的值約為1.63。從堿基長度質(zhì)量指標(biāo)Q20%和Q30%來看,該文庫堿基質(zhì)量良好,可用于后續(xù)分析。
表2 性狀差異較大的5 個薄殼山核桃品種樣品的高通量測序結(jié)果Table 2 Deep sequencing results of five C.illinoensis cultivars with different characteristics
測得的數(shù)據(jù)經(jīng)初步組裝、blast 分析、精確組裝和比較,得到各品種的特異序列。其中Ind23 特異序列數(shù)量最多,達(dá)1 080 條,而Ind03 最少,僅為553 條。分析這些片段的二級結(jié)構(gòu)、二聚體形成和堿基分布等,設(shè)計了1 133 對引物(表3)。再結(jié)合擴增產(chǎn)物與核桃基因組序列的同源性,挑選其中473 對作為最終候選引物。
表3 性狀差異較大的5 個薄殼山核桃品種特征序列和引物搜索Table 3 Searching for characteristic sequences and primers of five C.illinoensis cultivars with different characteristics
PCR 篩選結(jié)果表明,絕大部分條帶在各品種間無差異,僅86 對引物在23 個品種中產(chǎn)生多態(tài)性,約占引物數(shù)量的1/5,其中80 對單一條帶可用于后續(xù)分析(圖1)。
圖1 80 對SCAR 引物在23 個薄殼山核桃品種中的多態(tài)性分布Fig.1 The polymorphism distribution of 80 SCAR markers among 23 cultivars
所開發(fā)SCAR 標(biāo)記,大多數(shù)在多個品種中僅產(chǎn)生1 個條帶,其中有極少數(shù)可以特異性指示單一品種(圖2)。但是,也有少量引物在各品種中產(chǎn)生的條帶數(shù)量存在差異(圖3),這些較為復(fù)雜的多態(tài)性有待深入研究。將產(chǎn)生多態(tài)性的這些單一條帶進(jìn)行組合,獲得一系列可用于品種鑒定的引物組合(表4),這些引物的具體信息見表5。
圖2 薄殼山核桃品種特異性SCAR 標(biāo)記引物對及單一條帶Fig.2 Cultivar-specific primer pairs and their unique bands of SCAR markers
圖3 薄殼山核桃某些SCAR 標(biāo)記引物的多態(tài)性Fig.3 Polymorphism of some scar markers in C.illinoensis
利用80 對引物在各品種間的多態(tài)性,進(jìn)行24個薄殼山核桃品種的聚類分析,結(jié)果如圖4所示。由圖4可見,聚類結(jié)果與實際的親緣關(guān)系有部分一致性,但也存在不一致的地方。例如,來自不同產(chǎn)地的Ind23 和Ind24 同為Pawnee 品種,聚在一起;Ind07(Choctaw)是Success×Mahan 的后代,Ind13(Dependable)是Jewett×Success 的后代,二者聚在一起,可能與其有較近的親緣關(guān)系有關(guān);Ind10(Barton)是Moore×Success 的后代,與Ind01(Moore)聚在一起。但是,Ind04(Forkert)是Success×Schley 的雜交后代,Ind07(Choctaw)是Success×Mahan 的雜交后代,同為Success 的雜交后代,二者在聚類關(guān)系上卻相差較遠(yuǎn),這可能是其遺傳組合的不同造成的,也可能是因為所篩選SCAR 標(biāo)記較為有限,在分析親緣關(guān)系方面尚存在一定的局限性。
因為分子標(biāo)記能夠從DNA 水平反映品種遺傳的本質(zhì),成為品種鑒定最為重要的依據(jù)之一。然而,因為品種之間的遺傳差異較小,挖掘其多態(tài)性位點較為困難,特別是獲得穩(wěn)定的序列特異性標(biāo)記更為不易。利用簡單基因組測序可以獲得大量的差異位點。薄殼山核桃品種繁多,本研究中通過對大量基因組測序數(shù)據(jù)的分析,再加上PCR的反復(fù)驗證,獲得了一批可用于薄殼山核桃品種鑒定的SCAR 標(biāo)記。雖然后續(xù)PCR 篩選的工作量較大,但SCAR 標(biāo)記有其明顯的優(yōu)點,比如可以通過普通的PCR 檢測條帶的有無,使用成本較低。研究結(jié)果也表明,400 多對引物擴增率雖然較高,但多態(tài)性比例并不高,因為這種簡單基因組測序是通過酶切后進(jìn)行的,測序的信息主要來源于酶切位點附近,如果品種的差異點正好出現(xiàn)在酶切位點上,那么測序就會出現(xiàn)差異條帶,但事實上由此設(shè)計的引物能在所有品種中擴增出相似的條帶,這也是該方法的局限性造成的。同時,也可以利用簡單基因組測序獲得大量的SNP 位點,研究初期由于參考了核桃基因組數(shù)據(jù),未能得到可靠的SNP 數(shù)據(jù)。因此,現(xiàn)有這些測序數(shù)據(jù)有進(jìn)一步挖掘的潛力,比如利用薄殼山核桃品種87MX3-2.11 作為參考基因組[15],后續(xù)將進(jìn)一步分析SNP 位點。
表4 用于薄殼山核桃品種鑒定的特異SCAR 標(biāo)記組合舉例Table 4 The combination of specific SCAR markers for identification of pecan cultivars
表5 用于薄殼山核桃品種鑒定的特異SCAR 標(biāo)記引物的具體信息Table 5 Detailed information of primers with specific SCAR markers for identification of pecan cultivars
續(xù)表5Continuation of Table 5
但是,PCR 擴增有時會出現(xiàn)一定的假陽性,SCAR 引物也不例外,有時條帶較弱,經(jīng)多次重復(fù)才能擴增。其關(guān)鍵是提取DNA 的質(zhì)量以及DNA的分裝等問題。DNA 提取方式是影響DNA 質(zhì)量的重要因素,SSR 標(biāo)記的擴增也是如此[16]。DNA的分裝也會影響標(biāo)記擴增的穩(wěn)定性。通常情況下,較高濃度的DNA 須稀釋后用于后續(xù)的擴增,而稀釋后經(jīng)常會面臨分裝的問題,由于DNA 是大分子,分裝會帶來分配不均的問題,有時會影響到試驗的重復(fù)性。而這一問題經(jīng)常被研究人員忽視。通過定量PCR 試驗證實,如果未較好地進(jìn)行分裝,那么即使是同一初始模板和同一引物分裝在不同PCR 管中也會有一定的擴增差異。因此在分裝DNA 樣品時,應(yīng)進(jìn)行必要的均質(zhì)化,如超聲波震蕩等,對標(biāo)記擴增的一致性有重要的作用。另外,擴增片段的大小也有重要影響,小片段更容易獲得具有一致性的擴增結(jié)果。就鑒定的方便程度來說,可以通過大小片段的組合進(jìn)行混合引物PCR,但為了取得較為穩(wěn)定的檢測結(jié)果,應(yīng)測試各引物的不同濃度組合[17]。另外,在本研究中有些引物能產(chǎn)生多條特異性片段,其在品種鑒定中可能具有獨特的價值,但是鑒于其多態(tài)性較為復(fù)雜,本研究中暫未考慮,這些位點有待深入研究。
圖4 基于80 對引物的24 個薄殼山核桃樣品的聚類結(jié)果Fig.4 Cluster analysis of 24 C.illinoensis samples based on 80 pairs of primers
利用分子標(biāo)記進(jìn)行聚類分析,有助于分析品種間的親緣關(guān)系,對于后續(xù)的雜交親本選育具有重要意義。本研究中利用分離到的80 個SCAR 標(biāo)記對現(xiàn)有24 種樣品進(jìn)行分析,因為標(biāo)記數(shù)量不夠多等原因,其結(jié)果存在與現(xiàn)有親緣關(guān)系不一致的問題,而來自薄殼山核桃品種園的雜交品種較多,后續(xù)將采集更多的品種進(jìn)行類似的遺傳分析。