姚俊修,李善文,任 飛,李慶華,劉學良,吳德軍,燕麗萍
(1.山東省林業(yè)科學研究院,山東 濟南 250014;2.山東省林木遺傳改良重點實驗室,山東 濟南 250014;3.山東農業(yè)大學,山東 泰安 271018)
簡單序列重復(Simple sequence repeat,SSR)是一類由1~6 個堿基組成的簡單串聯(lián)重復序列,在真核、原核生物基因組中分布廣泛[1-2]。根據SSR 來源可分為EST-SSR 和基因組SSR[3],傳統(tǒng)的利用基因組數據開發(fā)SSR 標記具有成本高、試驗步驟繁瑣、位點較少等缺點[4],近年來,隨著測序成本降低,轉錄組測序已經成為研究分子生物學相關內容的短平快思路之一,不同植物的轉錄組數據相繼被開發(fā)利用,基于轉錄組測序開發(fā)不同植物SSR 標記的研究也越來越多[5-7]。
接骨木屬SambucusLinn系忍冬科Caprifoliaceae 植物,為落葉喬木或灌木,本屬約20 種,遍布于溫帶和亞熱帶地區(qū)[8-9]。我國約6 種,南北均產。接骨木是珍貴的藥用植物,不少種類果實含油量高(35%~44%)[10],是農業(yè)部公布的木本油料植物之一。我國接骨木資源十分豐富,其具有很強的適應性,抗寒、抗旱、抗病能力強[11],而對接骨木屬樹種的開發(fā)利用,我國仍處于起步階段,大多處于自然狀態(tài)且人為破壞嚴重,僅在藥用及種質資源概述較多,其它高值化利用等研究較少[12-13],也未見基于轉錄組測序的標記開發(fā)及分子標記輔助育種等相關報道,本研究基于前期對西洋接骨木果實轉錄組進行測序獲得的數據,開發(fā)大量微衛(wèi)星標記,為利用SSR 標記進行接骨木種質資源遺傳多樣性、連鎖圖譜構建及功能基因挖掘奠定基礎[14-16]。
轉錄組數據來源于本課題組2016年對一株成年西洋接骨木(1987年由美國引進,樹齡31 a,現定植于山東省濟南泉城公園)果實進行Illumina HiSeq 2000 高通量測序的結果。測序時采取3 個發(fā)育時期(青果、中熟、晚熟)的果實,每階段取樣3 次重復,分別提取RNA 后委托北京諾禾致源基因公司進行RNA-Seq 轉錄組測序,并通過De Novo 方法組裝獲得[17],組裝結果作為原始數據后續(xù)使用。
西洋接骨木轉錄組數據采用Trinity 軟件進行拼接,拼接得到的轉錄本序列信息以FASTA 格式儲存,拼接主要參數為SS_lib_type,min_kmer_cov,min_glue。通過拼接得到Unigenes 庫,并對混合的Unigenes 庫利用MISA 程序進行SSR 位點搜索[18],搜索標準為:二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸最少重復次數分別為6、5、5、5 和5 次。
采用Primer 3.0 引物設計程序(2.3.5 版,默認參數)對含有SSR 位點的序列進行引物設計,且SSR 位點側翼序列長度≥50 bp。引物設計的主要參數:1)退火溫度(Tm)在55~75 ℃之間,上、下游引物的Tm 值相差5 ℃;2)PCR 擴增產物大小在100~300 bp 之間,引物長度在15~30 bp之間;3)GC 含量在40%~60%之間,且上、下游引物之間無引物二聚體和二級結構的出現。對設計的SSR 引物在Unigenes 庫中進行SSR 引物的blast 驗證[18-19]。
選取8 株接骨木的成熟葉片(加拿大接骨木Sambucus canadensis3 株,金葉接骨木Sambucus canadensis‘Aurea' 1 株,花葉接骨木Sambucus nigra‘Variegata' 1 株,金羽接骨木Sambucus racemosa‘Plumosa Aurea' 1 株, 接骨木Sambucus williamsii2 株),DNA 采用英芮誠生化科技(上海)有限公司植物組織基因組DNA 提取試劑盒提?。ù胖榉ǎ20],-70 ℃保存?zhèn)溆谩?/p>
以上述8 個接骨木成熟葉片進行引物篩選。熒光引物PCR 擴增體系采取半巢式PCR,經降低退火溫度及進行梯度PCR 擴增等優(yōu)化過程獲得最佳熒光PCR 擴增體系及程序。
擴增產物利用毛細管電泳檢測:取PCR 產物0.3 μL、分子量內標0.5 μL 和去離子甲酰胺9.5 μL混合加入PCR 板,95 ℃變性5 min,4 ℃冷卻后離心,1×Buffer 緩沖液上機檢測[21]。
100 對熒光引物來源于Primer 3.0 軟件設計所得,由北京市睿博興科生物技術有限公司合成,純化方式PAGE。引物篩選原則為Tm 值范圍:55~62 ℃;引物重復堿基的個數:2 bp,如(AG),(AT)等;重復堿基的次數:8~11 次;PCR 擴增體系及程序選自實驗所得的最優(yōu)方案。
通過對西洋接骨木轉錄組的257 975 條Unigene序列進行搜索(序列總長254 175 kb),發(fā)現其中51 336 條Unigene 序列中含有64 148 個SSR 位點,SSR 位點出現頻率為24.87%(SSR 位點數與總的Unigene 數的比值),平均每3.96 kb 出現1 個SSR,SSR 的類型豐富,其中,單核苷酸重復是主要類型,占總SSR 的51.13%。其次是二、三核苷酸重復,分別占總SSR 的38.63%和9.11%。A/T和AG/CT 是單核酸和二核苷酸的優(yōu)勢重復基元。四核苷酸、五核苷酸和六核苷酸重復類型數量較少,分別占總數的0.86%、0.1%和0.17%(表1,圖1)。
表1 西洋接骨木轉錄組不同SSR 重復單元類型分布Table1 Distribution of different SSR repeat types of transcriptome in Sambucus nigra
圖1 SSR 位點分布Fig.1 SSR locus distribution
以西洋接骨木葉片DNA 為模板,根據SSRPCR 的基本條件和擴增程序優(yōu)化PCR 體系[18,22-23]。
熒光引物PCR 擴增體系及程序如下:
加M13接頭PCR 擴增體系:20 μL PCR 體系中含DNA 原液1 μL,2×Mix 10 μL,10 μM 的M13接頭及上下游引物各0.2、0.1、0.3 μL,H2O 8.4 μL;
熒光引物PCR 擴增程序:95 ℃預變性5 min;然后進行35 個循環(huán),每個循環(huán)包括95 ℃變性30 s,57 ℃退火30 s(退火溫度因不同引物而異),72 ℃延伸30 s;最后72 ℃延伸10 min。
以上述擴增體系及程序為基礎條件,經降低退火溫度及進行梯度PCR 擴增等優(yōu)化過程獲得最佳熒光PCR 擴增體系及程序如下:
兩步熒光引物PCR 擴增法:
1)加M13接頭PCR 擴增體系:10 μL PCR 體系中含DNA 原液1 μL,2×Mix 5 μL,10 μM 引物各0.1 μL,H2O 3.8 μL;PCR 擴增程序見表2。
表2 PCR 擴增程序Table2 Procedure of PCR amplification
由于第一步與熒光接頭引物結合擴增結果較差,而兩步法可提高與熒光引物結合度,可大大提高引物的擴增效率。
2)第二步熒光引物PCR 擴增體系:20 μL PCR 體系中含第一步擴增產物DNA 原液2 μL,2×Mix 10 μL,10 μM M13 接頭(加熒光標記)及反向引物各0.15 μL,H2O 7.7 μL;熒光引物PCR擴增程序見表3。
表3 熒光引物PCR 擴增程序Table3 Procedure of fluorescent PCR amplification
對含SSR 位點的51 336 條Unigene 序列進行引物設計,共設計了64 148 對SSR 引物。為了驗證其有效性,挑選合成了以二核苷酸重復基元為主的100 對熒光SSR 引物,利用已合成的100 對引物對8份不同種接骨木個體進行熒光SSR擴增,結果表明,80 對引物擴增有條帶,即擴增效率為80%。在擴增成功的80 對引物中有25 對引物多態(tài)性較好,即引物多態(tài)性效率為31.25%。圖2為5號引物在8 份不同種接骨木個體中的擴增情況。
從25 對擴增有多態(tài)性的引物中選取14 對多態(tài)性較好的引物(表4)對不同種接骨木進行遺傳多樣性分析并對熒光標記多態(tài)性進行評價。14對多態(tài)性引物共檢測出67 個等位基因(Na),每位點3~7 個,平均等位基因4.786 個;每位點有效等位基因數(Ne)1.684~6.095 個,平均有效等位基因數3.413 個,觀測雜合度(Ho)及期望雜合度(He)分別在0~0.875 和0.406~0.836之間,平均值分別為0.313、0.664;Shannon 多樣性指數(I)在0.736~1.862 之間,平均1.310 (表5),說明不同種接骨木具有較高的遺傳多樣性。
隨著高通量測序技術的快速發(fā)展及成本優(yōu)勢,轉錄組測序所得數據可包含某物種特定時期某一組織或器官的轉錄本[24-25],對于缺乏基因組信息的物種,其轉錄組測序對于該物種分子標記開發(fā)及標記輔助育種是一個的短平快的方法。
本研究中,對一株成熟西洋接骨木果實進行轉錄組測序所得cDNA 文庫中的257 975 條Unigene進行SSR 搜索,得到了64 148 個SSR 位點,出現頻率為 24.87%,此頻率高于蘿卜的23.79%[26]、皂莢的20.7%[27]、刺梨的20.37%[19]、南方紅豆杉的2.24%[18]、但低于芙蓉李的54.51%[28],厚樸的52.75%[29],出現這種差異可能是由轉錄組測序方法,不同物種間SSR 位點信息差異、SSR 位點查找軟件、不同數據庫中數據量大小等原因造成的[18,30]。隨著不同數據庫的不斷補充和完善,SSR 出現頻率在各數據庫中將有統(tǒng)一標準[19]。在大多數物種中二核苷酸和三核苷酸是最常見的SSR 重復類型[31],而從西洋接骨木SSR 位點結構來看,單核苷酸(51.13%)出現頻率最高,明顯高于二核苷酸(38.63%)和三核苷酸(9.11%),這與鄢秀芹等對刺梨的SSR 重復類型研究并不一致:三核苷酸出現頻率最高,高于四核苷酸及二核苷酸[19];西洋接骨木轉錄組中二核苷酸優(yōu)勢重復基元是 AG/CT,這與青稞[32]、刺梨[19]、藍靛果[33]、芝麻[34]中有一致的研究結論。
圖2 8 個樣本在5 號位點的基因型 Fig.2 Genotypes of 8 samples at No.5 SSR locus
根據257 975 條Unigene 序列進行引物設計,共設計了64 148 對SSR 特異引物。通過試驗優(yōu)化方案得到了西洋接骨木熒光SSR-PCR 最優(yōu)體系,在合成的100 對SSR 熒光標記中,80 對標記擴增有特異條帶出現,20 對未擴增出條帶,部分標記擴增失敗可能與引物及模板質量有關[35-36]。80 對有擴增條帶的引物中25 對引物具有較好多態(tài)性,多態(tài)性比率為31.25%,明顯低于鐵皮石斛的86%[37]、柿樹的45.2%[38]、低于紅豆杉的38.71%[18],但高于芝麻的10%[39],而對于西洋接骨木近緣種分子標記相關內容未見研究報道。綜上,不同物種間引物的多態(tài)性比率并不一致,這可能與標記類型、參試實驗材料及數量有關。從SSR 位點多態(tài)性潛能考慮[40],本研究從25 對有擴增產物的SSR 標記中篩選出的14 對引物具有較高的多態(tài)性,用于接骨木遺傳變異研究是可行的,本研究結果也表明利用西洋接骨木轉錄組數據開發(fā)的SSR 標記為接骨木種質資源遺傳多樣性分析、分子標記輔助育種、遺傳圖譜構建和功能基因的挖掘等奠定了基礎[14-16]。本研究用14 對標記評價8 個不同種接骨木遺傳多樣性具有一定局限性,下一步工作將擴大引物篩選范圍,增加檢測群體的數量,以期獲得更多多態(tài)性較高的標記來驗證本研究結論。轉錄組測序獲得的大量SSR 引物將會為接骨木和其它忍冬科植物的資源分類、基因定位及比較基因組學等研究提供更多、更有效的分子標記。
表4 14 對SSR 引物與最佳退火溫度Table4 14 pairs of SSR primers and optimal annealing temperature
表5 不同種接骨木遺傳多樣性分析Table5 Analysis of genetic diversity of Sambucus williamsil in different populations
本研究利用高通量測序對西洋接骨木進行轉錄組測序,對數據中SSR 位點分布、核苷酸重復類型進行概括總結;通過試驗優(yōu)化獲得最優(yōu)的兩步熒光引物PCR 擴增體系;根據引物設計原則在轉錄組數據中合成100 對熒光SSR 標記,利用8個不同種接骨木個體對100 對熒光標記進行引物篩選,80 對可擴增出條帶,25 對可成功擴增出多態(tài)性,選擇14 對多態(tài)性較好的引物對不同種接骨木進行遺傳多樣性預測。西洋接骨木熒光SSR 標記的開發(fā)為接骨木屬分子標記輔助育種、雜種優(yōu)勢預測等提供理論基礎。