李春娟,閆彩霞,石程仁,趙小波,王 娟,單世華
(山東省花生研究所,山東 青島 266100)
栽培種花生是大約3500年前由二倍體AA(A.duranensis)和BB(A.ipaensis)野生種基因組重組進(jìn)化形成的異源四倍體植物[1]。在植物分類系統(tǒng)上,栽培種花生(ArachishypogaeaL.)隸屬于豆科(Leguminosae),蝶形花亞科,花生屬(Arachis)。目前,花生屬已經(jīng)命名的有81個(gè)種,絕大部分是二倍體野生種(2n=20),少量四倍體種(2n=40)和非整倍體種(2n=18)。1994年,Krapovickas和Gregory根據(jù)近代分類學(xué)研究結(jié)果,將花生屬植物進(jìn)一步劃分為9個(gè)區(qū)組(花生區(qū)組、大根區(qū)組、直立區(qū)組、圍脈區(qū)組、異形花區(qū)組、匍匐?yún)^(qū)組、根莖區(qū)組、三葉區(qū)組和三子粒區(qū)組)。其中,花生區(qū)組(sect.Arachis)包含花生栽培種(A.hypogaeaL,2n= 40)、 25個(gè)二倍體野生種和一個(gè)四倍體野生種,研究表明它們之間雜交親和[2-3]。
栽培種花生是我國(guó)重要的經(jīng)濟(jì)作物和油料作物。我國(guó)是花生種植大國(guó),已有500多年的種植歷史。孫大容等發(fā)表的《中國(guó)栽培花生品種的分類》中指出,我國(guó)種植的花生品種主要由2個(gè)亞種組成,即密枝亞種ssp.hypogaea和疏枝亞種ssp.fastigiata[4]。栽培種花生種植面積廣泛,但是遺傳基礎(chǔ)相對(duì)狹窄,因此拓寬栽培種花生的種質(zhì)資源遺傳基礎(chǔ)顯得尤為重要[5]?;ㄉ鷮僖吧N質(zhì)資源豐富,基因型多樣,在熱帶亞熱帶氣候環(huán)境下有廣泛的適應(yīng)性。和栽培種花生相比,野生種質(zhì)具有葉斑病、銹病、青枯病等抗病蟲(chóng)害基因,是用于花生品種改良的重要基因源。盡管有些種質(zhì)資源并無(wú)栽培價(jià)值,但可根據(jù)不同的目的,通過(guò)雜交選育利用其有利基因,獲得新種或達(dá)到改良現(xiàn)有栽培種的目的。對(duì)花生屬種間親緣關(guān)系的準(zhǔn)確揭示將有助于實(shí)現(xiàn)這一目標(biāo)。
簡(jiǎn)化基因組測(cè)序(Genotyping-by Sequencing;GBS),是一種高通量、高性價(jià)比的二代測(cè)序技術(shù)。通過(guò)對(duì)花生屬的不同物種進(jìn)行測(cè)序,獲得酶切位點(diǎn)附近基因序列信息,能夠檢測(cè)出大量的遺傳變異位點(diǎn)[5-7]。本研究利用GBS測(cè)序結(jié)果獲取能夠比對(duì)到葉綠體全基因組的序列信息,由于葉綠體基因組具有單倍性、母系遺傳、結(jié)構(gòu)和功能高度保守等特點(diǎn),因此通過(guò)比較花生栽培種與其近緣野生種葉綠體基因組序列差異,能夠揭示系統(tǒng)演化關(guān)系。同時(shí),葉綠體基因組有一些高突變區(qū),在漫長(zhǎng)的進(jìn)化中會(huì)有差別,可以解決低階分類單元問(wèn)題。此外,Prabhudas等首先發(fā)表了一個(gè)花生栽培品種(A.hypogaeaL. Co7 variety)的葉綠體全基因組,指出基因組大小有156 391bp,注釋到110個(gè)基因,這為花生屬各物種葉綠體遺傳信息的獲得提供了參考信息[8]。因此,本研究能夠較好地揭示栽培種花生與花生屬花生區(qū)組其他野生種之間的親緣關(guān)系,對(duì)野生資源的引入和遺傳資源的保存有重要參考。
55份花生種質(zhì)材料包括11份花生區(qū)組的野生種質(zhì)(A.monticola,A.duranensis,A.stenosperma,A.paraguariensis,A.helodes,A.hoehnei,A.chacoensis,A.villosa,A.correntina,A.batizocoi,A.cardenasii),11份來(lái)自印度、美國(guó)及阿根廷等地的國(guó)外種質(zhì)以及33份(普通型10份,龍生型9份,珍珠豆型8份,多粒型6份)國(guó)內(nèi)不同產(chǎn)區(qū)的花生種質(zhì)材料。每份材料隨機(jī)選取3粒完整種子,培養(yǎng)皿中浸種1~2 d后,置入培養(yǎng)盒,28℃下培養(yǎng)10 d。使用植物基因組DNA提取試劑盒(天根,北京),依次取每個(gè)樣品的鮮葉進(jìn)行基因組DNA的提取并檢測(cè)DNA的完整性和純度(單位濃度不少于50 ng/μL,總質(zhì)量大于2μg;相關(guān)試劑來(lái)自US Everbright Inc.)。-80°C下保存?zhèn)溆谩?/p>
首先,選取EcoRI和NiaIII酶切組合對(duì)質(zhì)量合格的DNA進(jìn)行酶切[9]。其次,GBS建庫(kù),酶切好的每個(gè)樣本加不同的一級(jí)接頭(adapter),區(qū)分混合測(cè)序中不同樣本后,再通過(guò)PCR加入二級(jí)接頭(adapter),并且通過(guò)控制PCR的退火時(shí)間,控制擴(kuò)增片段大小(300~500 bp),實(shí)現(xiàn)片段選擇的目的。最后,確認(rèn)檢測(cè)建庫(kù)質(zhì)量后,在Illumina Hiseq 4000平臺(tái)上進(jìn)行PE150雙末端測(cè)序。
利用Q30標(biāo)準(zhǔn)對(duì)序列質(zhì)量進(jìn)行評(píng)估,采用FastQC軟件(http://www.bioinformatics.babraham. ac.uk/projects/fastqc/)對(duì)所測(cè)得的原始數(shù)據(jù)進(jìn)行過(guò)濾:①去掉接頭;②去掉N的含量超過(guò)該條read長(zhǎng)度比例 10%的reads;③去除單端序列低質(zhì)量堿基(Q≤5)比例超過(guò)read長(zhǎng)度 50%的reads。
以花生葉綠體基因組(Genbank號(hào)為:KX257487)為參考基因組,全長(zhǎng)為156391 bp。利用 BWA version 0.6.2[10]軟件進(jìn)行reads比對(duì)(mem-t4-k32-M)。輸出文件通過(guò)SAM tools 軟件和VCF tools軟件獲取葉綠體全基因組上的遺傳變異位點(diǎn)。其中,參數(shù)“view”轉(zhuǎn)化sam為bam文件;參數(shù)“sort”對(duì)bam文件進(jìn)行排序;參數(shù)“rmdup”去除重復(fù)比對(duì)的reads(reads比對(duì)到多個(gè)位置);參數(shù)“mpileup”檢測(cè)SNP。為了提高遺傳變異位點(diǎn)的準(zhǔn)確性,按照以下標(biāo)準(zhǔn)進(jìn)行過(guò)濾:①雙等位基因;②Q>20;③MAF(Minor Allele Frequency)≥0.05;④個(gè)體覆蓋度不低于80%;⑤reads深度≥3。
R軟件包中adegenet程序用于主成分判別分析(Discriminant Analysis of Principal Components,DAPC)[11]。在不設(shè)置種群的先驗(yàn)信息情況下,利用參數(shù)“find.clusters”在貝葉斯信息準(zhǔn)則基礎(chǔ)上(BIC)尋找最合理的簇?cái)?shù)目。利用MEGA最大似然法(Maximum Likelihood,ML)和鄰接法(Neighbor-Joining,NJ)兩種方法分別構(gòu)建系統(tǒng)進(jìn)化樹(shù),缺隙(Gap)設(shè)為缺失狀態(tài),同時(shí)以自展法(Bootstrap)進(jìn)行檢驗(yàn),重復(fù)5000次。其他均使用默認(rèn)參數(shù)。
GBS測(cè)序reads與葉綠體全基因組比對(duì),reads平均深度達(dá)到231x(113x ~922x),平均覆蓋度為69%(54%~88%)。從55份花生材料中獲得遺傳變異位點(diǎn)1102個(gè)。在此基礎(chǔ)上,經(jīng)過(guò)上述過(guò)濾標(biāo)準(zhǔn),剩余SNP位點(diǎn)約372個(gè)。此外,去除雜合SNP位點(diǎn),共保留121個(gè)變異位點(diǎn),其中包含10個(gè)InDel位點(diǎn),111個(gè)SNP位點(diǎn)。篩選得到的SNP變異位點(diǎn)將用于后續(xù)分析。
首先,PCA分析將55份花生區(qū)組的材料分成了5個(gè)組: ① 栽培種花生和A.monticola;②A.duranensis,A.batizocoi,A.paraguariensist,A.correntina和A.hoehnei;③A.villosa和A.stenosperma;④A.chacoensis;⑤A.helodes和A.cardenasii。
圖1 PCA分析顯示五個(gè)相似的遺傳組分 Fig. 1 PCA analysis revealed five genetic groups
其次,構(gòu)建了最大似然法(ML)和鄰接法(N-J)兩棵系統(tǒng)演化樹(shù)。與花生區(qū)組的其他物種相比,栽培種花生種內(nèi)遺傳變異較少,聚為平行枝。該枝還包括野生四倍體A.monticola。此外,野生種A.duranensis,A.batizocoi,A.paraguariensist和A.hoehnei聚為一枝,其余6個(gè)野生種聚為一枝。與NJ樹(shù)不同的是,ML樹(shù)的平行枝中還包含野生種A.correntina。
花生屬花生區(qū)組種間親緣關(guān)系的揭示對(duì)利用野生種優(yōu)良基因改良栽培種花生具有重要意義。研究提出,區(qū)組內(nèi)種間雜交具有一定親和性,區(qū)組間種間雜交不親和或雜種完全不育[2]。由于種間形態(tài)差異的復(fù)雜性,通過(guò)細(xì)胞水平和分子水平揭示它們之間的親緣關(guān)系更為準(zhǔn)確[12]。唐榮華對(duì)花生屬六個(gè)區(qū)組九個(gè)種進(jìn)行核型分析,根據(jù)著絲點(diǎn)位置區(qū)分花生遺傳距離。指出A.batizocoi與花生區(qū)組中其它二倍體核型差異較大,遺傳距離較大[13]。Singh從種子蛋白質(zhì)電泳譜帶分析中指出花生區(qū)組大多數(shù)二倍體種都有一個(gè)共同的A染色體組,而A.batizocoi則是B染色體組[14]。Moretzsohn等根據(jù)SSR聚類結(jié)果分析,認(rèn)為栽培種花生與花生區(qū)組的二倍體種A.duranensis、A.villosa和A.diogoi的關(guān)系較近[15]。唐榮華等用SSR和AFLP兩種分子標(biāo)記技術(shù)證明A.cardenasii、A.batizocoi與栽培種的親緣關(guān)系較遠(yuǎn),不大可能是花生栽培種的祖先,而認(rèn)為A.duranensis是花生栽培種的祖先之一[16]。楊森以花生栽培種四粒紅及其與野生種光葉花生的種間雜種為材料,根據(jù)ITS1-5.8S-ITS2序列擴(kuò)增獲得長(zhǎng)度約800bp的單一條帶,在對(duì) PCR 產(chǎn)物進(jìn)行克隆測(cè)序的基礎(chǔ)上構(gòu)建了花生屬進(jìn)化樹(shù),具備鑒定種間雜種的優(yōu)勢(shì)[17]。
由于葉綠體基因組具有單倍性、母性遺傳、結(jié)構(gòu)和功能高度保守等特點(diǎn),使得通過(guò)比較栽培種花生與其近緣野生種葉綠體基因組序列差異成為闡明種間親緣關(guān)系的理想研究方法。本研究聚類結(jié)果表明,44份栽培種花生材料盡管來(lái)自不同國(guó)家,屬于不同花生類型,但種內(nèi)遺傳變異程度較小,明顯聚在一起。不同的野生種間遺傳距離不同?;ㄉ鷮僦信c栽培種花生親緣關(guān)系最近的是A.monticola。A.monticola是花生區(qū)組中唯一的四倍體野生種,基因組類型AABB。Grabiele et al. 推測(cè)這個(gè)物種是通過(guò)自然雜交和自然加倍后,但未經(jīng)人工選擇的四倍體物種,即可能是栽培種花生祖先種[18]。親緣關(guān)系較近的有A.duranensis,A.batizocoi,A.paraguariensist和A.hoehnei。其中,A.duranensis被證實(shí)是栽培種花生的野生親本之一(A染色體組供體)[1]。通過(guò)上述文獻(xiàn)報(bào)道推測(cè)A.batizocoi與另一個(gè)親本(A.ipaensis)的親緣關(guān)系較近,因?yàn)樗鼈兌季邆銪染色體組。系統(tǒng)樹(shù)結(jié)果也支持以上聚類關(guān)系。
圖2 花生屬花生區(qū)組內(nèi)種間親緣關(guān)系樹(shù) Fig. 2 Phylogenetic tree among the species of sec. Arachis 注:(A)N-J樹(shù);(B)ML樹(shù)。 Note: (A) N-J tree; (B) ML tree
由于花生區(qū)組存在雜交親和性,根據(jù)栽培種花生與野生種親緣關(guān)系遠(yuǎn)近,通過(guò)雜交、選育利用其有利基因,能夠獲得新種或改良現(xiàn)有栽培種,從而實(shí)現(xiàn)對(duì)野生資源的引入和遺傳資源保存的目標(biāo)。