胡倩梅 楊會會 朱華玉 胡建斌 楊路明
摘? ? 要: 為尋找調(diào)控果面茸毛、果面溝以及果面瘤表型變異的位點,調(diào)查200份甜瓜種質(zhì)在2017年和2018年的表型,并對這200份種質(zhì)進行全基因組重測序,利用全基因組關(guān)聯(lián)分析的方法對其進行關(guān)聯(lián)。結(jié)果在3號染色體上找到了一個與果面茸毛顯著相關(guān)的SNP;在11號染色體上找到了2個與果面溝顯著相關(guān)的SNP,在5號、7號和11號染色體上各找到了一個與果面溝深顯著相關(guān)的SNP;在12條染色體上均找到了與果面瘤顯著相關(guān)的SNP,所有與果面瘤顯著相關(guān)的SNP標(biāo)記中有8個標(biāo)記顯著性遠(yuǎn)遠(yuǎn)高于其他標(biāo)記。進一步對果面茸毛的1個顯著SNP,果面溝的5個顯著SNP和果面瘤的8個SNP進行了基因注釋,共計找到了146個基因。研究結(jié)果有助于甜瓜果面茸毛、果面瘤以及果面溝性狀的快速精細(xì)定位,也將為甜瓜果實遺傳改良提供重要參考依據(jù)。
關(guān)鍵詞: 甜瓜;果面茸毛;果面溝;果面瘤;全基因組關(guān)聯(lián)分析
Genome-wide association analysis of fruit fluff, fruit surface tumor and fruit surface ditch in melon
HU Qianmei1, YANG Huihui1, ZHU Huayu1,2, HU Jianbin1,2, YANG Luming1,2
(1.College of Horticulture, Henan Agricultural University, Zhengzhou 450002, Henan, China; 2. Henan Key Laboratory of Fruit and Cucurbit Biology, Zhengzhou 450002, Henan, China)
Abstract: Based on the phenotyping and re-sequencing of 200 melon germplasms, the genome-wide association analysis was used to identify loci associated with fruit villi, fruit sulcus, and fruit surface tumors in melon. These traits were investigated of 200 melon germplasms in 2017 and 2018, and genome-wide resequencing of these 200 germplasms was conducted for SNP detection. As a result, 1 SNP was found on chromosome 3 that was significantly associated with fruit fluff. 2 SNPs were found on chromosome 11 that were significantly associated with the fruit surface ditch. There was only 1 SNP was found significantly associated with the fruit surface ditch on the chromosome 5, 7 and 11, respectively. SNPs that were significantly associated with fruit surface tumors were found on all 12 chromosomes. Among of them, 8 SNPs had much higher significantly associated than the other SNPs, therefore those SNPs were used in further study. Totally 14 SNPs were detected associated for fruit villi, fruit sulcus, and fruit surface tumors, and 146 genes flanking these SNP were annotated. The SNPs significantly associated withthese traits will be helpful to quickly and finely locate candidate genes, and will also provide an important reference for the genetic improvement of melon fruit.
Key words: Melon; Fruit fluff; Fruit groove; Fruit surface tumor; Genome-wide association analysis
甜瓜(Cucumis melo L.)為葫蘆科(Cucurbitaceae)作物,染色體數(shù)為2n=2x=24。甜瓜屬于喜溫、喜光植物,在28~32 ℃范圍內(nèi)可以正常生長,低于13 ℃即停止生長[1]。甜瓜營養(yǎng)物質(zhì)含量豐富,是世界十大水果之一。甜瓜自身的表型多樣性極其豐富,不同類型的甜瓜在果面茸毛、果面瘤、果面溝、果皮顏色、果肉顏色、瓜瓤顏色、種子顏色、果面網(wǎng)紋、可溶性固形物含量、葉片形狀等諸多方面有很大的差異,其多樣性在葫蘆科植物中僅次于南瓜。2012年甜瓜全基因組測序結(jié)果公布,基因組大小為454 Mb,預(yù)測共有27 427個基因[2],為開展甜瓜分子育種研究提供了極大的便利。在過去的十幾年間大量的研究工作者對甜瓜的果皮顏色、果面覆紋、果肉顏色、果肉含糖量、果實質(zhì)量、果實長度、果實寬度、果肉厚度、葉面積、葉片缺刻、種子寬度、種子長度以及種子質(zhì)量[3-14]等農(nóng)藝性狀做了深入研究,然而對成熟果實的茸毛自然脫落、果面瘤和果面溝所做的研究還相對較少。
果面茸毛是指果實成熟后果皮表面的茸毛,與先前Palomares-Rius等[15]所研究的TypeⅠ型茸毛以及Zhu等[16]所研究的無毛突變體均不同。果面瘤是指成熟果實表面的瘤狀物凸起,先前研究中多認(rèn)為該性狀是由環(huán)境引起的,但筆者在研究中發(fā)現(xiàn)部分材料較易產(chǎn)生果面瘤,而部分材料則不易產(chǎn)生果面瘤;果面溝指成熟果實表面的凹陷,我們一般將果面溝分為果面溝有無、果面溝淺和果面溝深這3個性狀,果面溝影響甜瓜的果皮結(jié)構(gòu)、果實受力以及裂果,王學(xué)征等[17]通過構(gòu)建6世代定位到1個與果面溝形成相關(guān)的基因。
全基因組關(guān)聯(lián)分析( GWAS)是指在全基因組范圍內(nèi),通過高密度的SNP標(biāo)記挖掘控制表型性狀變異基因座的統(tǒng)計分析方法。關(guān)聯(lián)分析的方法最早應(yīng)用于人類相關(guān)疾病case-control研究中[18],受人類疾病遺傳學(xué)研究的啟示,GWAS也被運用到作物遺傳和育種研究中并取得重要進展[19-20],本研究通過對200份甜瓜種質(zhì)進行重測序,利用 GWAS的方法對成熟果實果面茸毛的脫落、果面瘤、果面溝有無、果面溝淺以及果面溝深這5個性狀進行研究,以期能夠找到真正造成表型變異的突變位點。
1 材料與方法
1.1 材料
供試材料來自于從世界各地收集的200份甜瓜種質(zhì),包括88份厚皮種質(zhì),91份薄皮種質(zhì)和21份野生種質(zhì),其中11份種質(zhì)由胡建斌收集,77份種質(zhì)來源于美國農(nóng)業(yè)部,112份種質(zhì)來自于中國農(nóng)業(yè)科學(xué)院鄭州果樹所。
1.2 方法
1.2.1 田間試驗 本研究田間試驗于2017年、2018年在河南農(nóng)業(yè)大學(xué)科教園區(qū)毛莊試驗基地的塑料大棚進行。2月中旬進行溫湯浸種催芽,材料播種于72孔穴盤,在日光溫室中進行育苗。所有材料3葉1心時進行定植,每年設(shè)置2個重復(fù),每個重復(fù)內(nèi)每份材料定植4個單株。田間水、肥以及整枝按照常規(guī)管理。所有材料于果實成熟時期進行性狀調(diào)查和統(tǒng)計,調(diào)查標(biāo)準(zhǔn)參考《甜瓜種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)》[21]的標(biāo)準(zhǔn)與方法進行統(tǒng)計、分級和賦值。
1.2.2 測序樣品制備 植株定植30 d后,采用混合采樣法,每個材料混合采取4個單株的幼嫩葉片3~5 g,采用真空冷凍干燥器將葉片抽干,并用高通量組織粉碎機將葉片打磨成粉末狀備用。提取總DNA,-80 ℃?zhèn)溆谩?/p>
1.2.3 全基因組重測序 200份甜瓜種質(zhì)的測序工作由北京百邁客生物科技有限公司完成,采用Illumina測序技術(shù)。測序完成后過濾掉帶接頭的reads、N含量超過10%的reads以及質(zhì)量值低于10的堿基超過50%的reads。
1.2.4 SNP標(biāo)記的檢測與篩選 采用GATK(V4.0.9.0)call SNP[22],將雙端read和單端read都作為 call SNP的初始reads數(shù)據(jù)。
1.2.5 群體遺傳學(xué)分析 應(yīng)用利用GCTA (V1.91.2)進行主成分分析,保留前3個特征向量,以其作為協(xié)變量放入全基因組關(guān)聯(lián)分析模型中[23];利用GAPIT進行親緣關(guān)系分析親緣關(guān)系矩陣(K)[24]作為隨機效應(yīng)加入到全基因組關(guān)聯(lián)分析模型中;LD值由PopLDdecay(V3.40)進行計算,用r?值來確定LD衰減距離。
1.2.6 全基因組關(guān)聯(lián)分析 為減弱性狀的復(fù)雜性對關(guān)聯(lián)結(jié)果的影響,除去果面茸毛和果面瘤外,我們將果面溝分為果面溝有無、果面溝淺和果面溝深進行關(guān)聯(lián)分析。本研究利用GAPIT中的一般線性模型(GLM)、混合線性模型(MLM)、壓縮混合線性模型(CMLM)和多位點混合線性模型(MLMM)4個模型同時對5個性狀進行關(guān)聯(lián),利用BH矯正進行篩選顯著SNP,將同時在 5個模型中關(guān)聯(lián)到的SNP標(biāo)記進行后續(xù)分析。
1.2.7 SNP注釋 根據(jù)公布的甜瓜基因組CM3.6.1_pseudomol.fa (V3.6.1)和注釋文件CM4.0.gff3(V4.0)對獲得的全基因組SNP進行注釋。
2 結(jié)果與分析
2.1 全基因組重測序與SNP標(biāo)記過濾
200份甜瓜種質(zhì)的全基因組重測序共計獲得1 849 Gb的clean測序數(shù)據(jù),平均測序深度為22 X。通過GATK對SNP的過濾,共計獲得2 989 591個SNP標(biāo)記。
2.2 連鎖不平衡分析
通過對200份種質(zhì)材料進行LD衰減分析(圖1),結(jié)果表明群體衰減距離為60 kb,將在檢測到的顯著SNP前后30 kb分析候選基因[25]。
2.3 全基因組關(guān)聯(lián)分析
關(guān)聯(lián)分析能夠通過計算每個SNP位點與目標(biāo)性狀關(guān)聯(lián)的可信值,從而對調(diào)控目標(biāo)性狀的位點進行預(yù)測,筆者通過對果面茸毛、果面瘤、果面溝有無、果面溝淺和果面溝深這5個農(nóng)藝性狀進行GLM、MLM、CMLM和MLMM等4種關(guān)聯(lián)模型全基因組關(guān)聯(lián)分析,發(fā)現(xiàn)果面茸毛有1個SNP(圖2-A),位于3號染色體;果面瘤檢測到了105個SNP(圖2-B)在12條染色體均有分布;果面溝有無檢測到了2個SNP(圖2-C),位于11號染色體;果面溝淺沒有檢測到SNP(圖2-D),果面溝深檢測到3個SNP(圖2-E),分別位于5號、7號和11號染色體。其中果面溝有無和果面溝深均檢測到了標(biāo)記chr11_24130439,果面瘤檢測到的顯著SNP中chr7_8087384、chr8_10804573、chr12_19247259、chr7_21474816、chr4_32540139、chr4_3278835、chr9_23361283和chr2_9400335這8個SNP的顯著性最高,其P值分別為1.16E-53、1.80E-53、2.23E-47、1.96E-45、1.12E-37、6.33E-29、5.69E-24和1.16E-20,基于此對SNPs的注釋中針對果面瘤我們著重研究這8個顯著性最高的SNP(表1)。
2.4 SNP的注釋
基于甜瓜基因組注釋在14個SNP上下游區(qū)域30 kb測到146個基因,果面茸毛獲得10個相關(guān)基因,果面溝有無獲得14個基因,果面溝深獲得33個基因,果面瘤獲得89個基因。經(jīng)比對分析我們發(fā)現(xiàn)在果面瘤茸毛顯著SNP標(biāo)記chr3_256240260附近檢測到的基因MELO3C011492.2和纖維素的分解、膜的組成以及纖維素酶的活性均有關(guān)聯(lián);與果面溝顯著相關(guān)的SNP標(biāo)記chr11_24130439附近檢測到基因MELO3C019697.2和細(xì)胞的組成部分以及伸長相關(guān),標(biāo)記chr05_24592367附近檢測到基因MELO3C004136.2能夠調(diào)控細(xì)胞的單方向生長,標(biāo)記chr07_2180656附近的基因MELO3C016777.2對分生組織的生長和纖維素微纖維組織均有調(diào)控作用;與果面瘤相關(guān)的SNP標(biāo)記chr4_3278835附近的基因MELO3C003679.2和細(xì)胞質(zhì)的組成成分相關(guān)。
3 討 論
3.1 甜瓜全基因組關(guān)聯(lián)分析
自2012年甜瓜基因組序列發(fā)表以來,利用全基因組關(guān)聯(lián)分析的方法研究甜瓜相關(guān)性狀的研究也相繼發(fā)表,但其在甜瓜中的應(yīng)用還比較薄弱,所用標(biāo)記和關(guān)聯(lián)的性狀均較少。2015年齊振宇[9]利用14 689個SNP標(biāo)記對構(gòu)建的F2群體的6個性狀進行全基因組關(guān)聯(lián)分析,在1號和10號染色體檢測到與節(jié)間長度相關(guān)的SNP位點,在1、4和8號染色體檢測到與側(cè)枝長相關(guān)聯(lián)的SNP位點,在1、3、4、8、11和12號染色體檢測到與葉面積相關(guān)的SNP位點,在10號染色體檢測到與果皮顏色相關(guān)的SNP位點,在2號染色體上檢測到與甜瓜抗白粉病相關(guān)的SNP。2016年Nimmakayala等[26]利用13 756個SNP標(biāo)記通過GWAS和QTL連鎖作圖相互驗證的方法將甜瓜果肉硬度定位到6、8、9、11和12號染色體。2017年王艷玲等[27]利用104個SSR標(biāo)記對果實相關(guān)性狀進行全基因組關(guān)聯(lián)分析,將果實縱徑、果實橫徑、果形指數(shù)、果肉厚度和果實鮮質(zhì)量分別關(guān)聯(lián)到10、5、9、8和10個SSR標(biāo)記。本研究所用SNP標(biāo)記數(shù)遠(yuǎn)遠(yuǎn)高于以上研究在甜瓜全基因組關(guān)聯(lián)分析中所用的標(biāo)記數(shù),研究中所關(guān)聯(lián)的性狀還未發(fā)現(xiàn)有學(xué)者對其用全基因組關(guān)聯(lián)分析的方法研究過,本研究豐富了甜瓜在全基因組關(guān)聯(lián)分析方面的研究。
3.2 關(guān)聯(lián)模型比較
Q-Q圖可以通過判斷圖形中的點分布是否合理,進而推斷出所用的統(tǒng)計模型是否合理。一般Q-Q圖有兩種比較合理的模型,第1種是觀測值與期望值相同,第2種是Q-Q圖的左下角期望值與觀測值一致,右上角有少量位點高高翹起,超過期望值。第1種表明沒有找到與性狀顯著相關(guān)的SNP,第2種是在進行關(guān)聯(lián)分析中所期望得到的關(guān)聯(lián)結(jié)果,左下角期望值與觀測值一致表明了模型的合理性,右上角少量標(biāo)記超出了期望值,表明對所關(guān)聯(lián)性狀關(guān)聯(lián)到了與性狀顯著相關(guān)的SNP標(biāo)記。筆者同時應(yīng)用了4種關(guān)聯(lián)模型,由本研究中的5個性狀結(jié)果圖可以看出一般線性模型和混合線性模型均有大量的標(biāo)記觀測值高于期望值,顯然這是不符合生物學(xué)邏輯的。而壓縮混合線性模型和多位點混合線性模型從Q-Q圖上來看一方面比較符合生物學(xué)邏輯,另一方面這兩個模型的一致性比較高,從側(cè)面驗證的檢測到的顯著性標(biāo)記具有較高的可信度。
3.3 關(guān)聯(lián)結(jié)果
果面茸毛、果面瘤以及果面溝是影響甜瓜外觀品質(zhì)和商業(yè)品質(zhì)的重要因素,定位調(diào)控果面茸毛、果面瘤以及果面溝的基因位點可以揭示這3類性狀的遺傳機制,為利用分子育種技術(shù)培育外觀品質(zhì)和商業(yè)品質(zhì)優(yōu)異的新品種奠定基礎(chǔ)。目前關(guān)于甜瓜茸毛的報道僅有2篇,Palomares-Rius等[15]所研究的Type I型茸毛主要表現(xiàn)為茸毛短小,且主要是對葉片的研究,Zhu等[16]所研究的無毛突變體在整個生育期整個植株上均表現(xiàn)為無毛,而本研究的果面茸毛僅在果實成熟期開始脫落,基于該性狀對果實幼果的保護,是一個重要的農(nóng)藝性狀,目前尚且沒有學(xué)者對其進行研究,筆者在200份甜瓜種質(zhì)中關(guān)聯(lián)到的位點(chr3_25624260)與前兩位學(xué)者所關(guān)聯(lián)到的位點(11號染色體和8號染色體)完全不同,說明這些性狀是由不同位點控制的。王學(xué)征等[17]將果面溝QTL_qGroove-1-1定位到11號染色體末端的1.1 cM的區(qū)間內(nèi),這與本研究中關(guān)于果面溝所檢測到11號染色體上的SNP標(biāo)記比較接近,同時我們在5號的7號染色體發(fā)現(xiàn)了新的和果面溝顯著相關(guān)的位點,可能果面溝并不是一個簡單的質(zhì)量性狀,推測其可能是由多個位點進行調(diào)控的數(shù)量性狀,這與王學(xué)征等[17]所認(rèn)為的果面溝是由一對等位基因調(diào)控的結(jié)果所不同。甜瓜果面瘤的性狀目前還沒有學(xué)者進行研究。盡管本研究檢測到了156個與表型顯著相關(guān)的SNP,但沒有對所檢測到的SNP附近基因進行定量分析,無法確定所獲得的標(biāo)記附近基因?qū)Ρ硇偷恼{(diào)控模式,仍需后續(xù)研究對其進行深入分析研究。
參考文獻
[1] 吳梅梅,張顯,鄭俊鶱,等.西瓜甜瓜抗寒性研究進展[J].中國瓜菜,2014,27(S1):1-5.
[2] GARCIA-MAS J,BENJAK A,SANSEVERINO W,et al.The genome of melon (Cucumis melo L.)[J].Proceedings of the National Academy of Sciences of the United States of America,2012,109:11872-11877.
[3] HAREL-BEJI R,TZURI G,PORTNOY V ,et al.A genetic map of melon highly enriched with fruit quality QTLs and EST markers,including sugar and carotenoid metabolism genes[J].Theoretical and Applied Genetics,2010,121(3):511-533.
[4] 王賢磊,高興旺,李冠,等.甜瓜遺傳圖譜的構(gòu)建及果實與種子QTL分析[J].遺傳,2011,33(12):1398-1408.
[5] 呂麗華.甜瓜果肉β-胡蘿卜素含量的遺傳分析及QTL定位[D]. 北京:中國農(nóng)業(yè)科學(xué)院,2012.
[6] 楊光華,范榮,楊小鋒,等.甜瓜果實顏色3個質(zhì)量性狀基因的定位[J].園藝學(xué)報,2014,41(5):898-906.
[7] D?AZ AUROR, BELKACEM Z,MOHAMAED F,et al.Mapping and introgression of QTL involved in fruit shape transgressive segregation into ‘Piel de Sapo melon (Cucucumis melo L.)[J]. PLoS ONE,2014,9(8):e104188.
[8] 高興旺,王賢磊,寧雪飛,等.甜瓜掌狀裂葉基因pll的精細(xì)定位[J].北方園藝,2015(6):98-102.
[9] 齊振宇.甜瓜株型和抗白粉病性狀的遺傳與全基因組關(guān)聯(lián)分析[D].杭州:浙江大學(xué),2015.
[10] 矯士琦.甜瓜果實、種子相關(guān)性狀QTL分析[D].哈爾濱:東北農(nóng)業(yè)大學(xué),2017.
[11] 段金鳳.甜瓜果實外觀特征遺傳分析及果皮顏色相關(guān)基因的初步定位[D].武漢:華中農(nóng)業(yè)大學(xué),2016.
[12] WANG Y H,WU D H,HUANG J H ,et al.Mapping quantitative trait loci for fruit traits and powdery mildew resistance in melon (Cucumis melo)[J] .Botanical Studies,2016,57:19.
[13] ARGYRIS J M,D?AZ A,VALENTINO R,et al.QTL Analyses in multiple populations employed for the fine mapping and identification of candidate genes at a locus affecting sugar accumulation in melon (Cucumis melo L.)[J].Frontiers in Plant Science,2017,8:1679.
[14] PEREIRA L,RUGGIERI V,P?REZ S ,et al.QTL mapping of melon fruit quality traits using a high-density GBS-based genetic map[J].BMC Plant Biology,2018,18:324.
[15] PALOMARES-RIUS F J,YUSTE-LIBONA F J,VIRUEL M A,et al.Inheritance and QTL mapping of glandular trichomes type idensity in Cucumis melo L.[J].Molecular Breeding,2016,36(9):132.
[16] ZHU H,SUN X,ZHANG Q,et al.GLABROUS (CmGL) encodes a HD-ZIP IV transcription factor playing roles in multicellular trichome initiation in melon[J].Theoretical and Applied Genetics,2017,131(2):1-11.
[17] 王學(xué)征,邱果,陳克農(nóng),等.基于BSA法開發(fā)CAPS標(biāo)記定位甜瓜果面溝相關(guān)基因研究[J].東北農(nóng)業(yè)大學(xué)學(xué)報,2018,49(5):17-23.
[18] CORDER E H,SAUNDERS A M,RISCH N J,et al.Protective effect of apolipoprotein E type 2 allele for late onset alzheimer disease[J].Nature Genetics,1994,7(2):180-184.
[19] 唐富福,徐非非,包勁松.全基因組關(guān)聯(lián)分析在水稻遺傳育種中的應(yīng)用[J].核農(nóng)學(xué)報,2012,27(5):598-606.
[20] TIAN F,BRADBURY P J,BROWN P J,et al.Genome-wide association study of leaf architecture in the maize nested association mapping population[J].Nature Genetics,2011,43(2):159-162.
[21] 馬雙武,劉君璞.甜瓜種質(zhì)資源描述規(guī)范和數(shù)據(jù)標(biāo)準(zhǔn)[M].北京:中國農(nóng)業(yè)出版社,2006.
[22] MCKENNA A,HANNA M,BANKS E,et al.The genome analysis toolkit: a mapreduce framework for analyzing next-generation DNA sequencing data[J].Genome Research,2010,20(9):1297-303.
[23] PRICE A L,PATTERSON N J,PLENGE R M,et al.Principal components analysis corrects for stratification in genome-wide association studies[J].Nature Genetics,2006,38(8):904-909.
[24] YU J,BUCKLER E S.Genetic association mapping and genome organization of maize[J].Current Opinion in Biotechnology,2006,17(2):155-160.
[25] CAO K,ZHOU Z,WANG Q,et al. Genome-wide association study of 12 agronomic traits in peach[J].Nature Communications,2016,7:13246.
[26] NIMMAKAYALA P,TOMASON Y R,ABBURI V L,et al.Genome-wide differentiation of various melon horticultural groups for use in gwas for fruit firmness and construction of a high resolution genetic map[J].Frontiers in Plant Science,2016,7:1437.
[27] 王艷玲,許彥賓,李瓊,等.基于GWAS發(fā)掘甜瓜核心種質(zhì)果實性狀的關(guān)聯(lián)位點[J].農(nóng)業(yè)生物技術(shù)學(xué)報,2017,25(9):1434-1442.