黃莎, 張正圣, 王文文, 劉大軍
西南大學(xué) 農(nóng)學(xué)與生物科技學(xué)院,重慶 400715
棉花作為全球重要的經(jīng)濟(jì)農(nóng)作物,是最多的天然纖維來源,被廣泛應(yīng)用于織造行業(yè).栽培棉花多為異源四倍體,由兩個(gè)異源二倍體棉屬經(jīng)A基因組與D基因組雜交后染色體加倍形成[1].陸地棉(Gossypiumhirsutum)作為最重要的異源四倍體棉種占領(lǐng)了超過全球95%的棉花市場.產(chǎn)量和纖維品質(zhì)是棉花研究中最受關(guān)注的部分[2],但棉花產(chǎn)量與纖維品質(zhì)呈負(fù)相關(guān),難以同時(shí)改良[3],是培育優(yōu)異棉種的巨大挑戰(zhàn).棉花產(chǎn)量及纖維品質(zhì)作為數(shù)量性狀,受多個(gè)基因控制.探究棉花產(chǎn)量與纖維品質(zhì)的遺傳決定因素,利用分子標(biāo)記檢測來為目的基因定位提供依據(jù),對棉花品質(zhì)改良具有重要意義.由于陸地棉種內(nèi)雜交多態(tài)性低,因此構(gòu)建高密度的陸地棉種內(nèi)遺傳圖譜是其分子標(biāo)記輔助選擇育種的關(guān)鍵.
構(gòu)建高密度遺傳圖譜需要尋找眾多的分子標(biāo)記.簡單序列重復(fù)(Simple sequence repeat,SSR)標(biāo)記分布多且廣,實(shí)驗(yàn)重復(fù)性好且結(jié)果可靠,可以在等位基因間顯示多個(gè)差異[4-5].簡化基因組測序(Specific locus amplified fragment sequencing,SLAF-seq)是在高通量測序的背景下發(fā)展起來的[6-7].SLAF-seq的3個(gè)顯著優(yōu)勢是:深度測序保證了基因分型準(zhǔn)確; 測序成本低; 正式測序前利用預(yù)測系統(tǒng)提升標(biāo)記效率.SLAF-seq近年來已被廣泛用于單核苷酸多樣性(Single nucleotide polymorphism,SNP)檢測[8-11].
數(shù)量性狀位點(diǎn)(Quantitative trait loci,QTL)是在調(diào)控生物體數(shù)量性狀中起重要作用的基因片段在染色體上的位置,數(shù)量性狀不僅受多個(gè)QTL的影響,也與環(huán)境互作相關(guān),部分?jǐn)?shù)量性狀存在一個(gè)主效基因?qū)υ撔誀畹目刂破鹬鲗?dǎo)作用,農(nóng)作物的產(chǎn)量性狀一般為數(shù)量性狀.對棉花而言,產(chǎn)量性狀、纖維品質(zhì)和抗逆性等都是數(shù)量性狀.CottonQTLdb搜集了大量來自全球棉花纖維品質(zhì)、產(chǎn)量性狀、抗病性、耐鹽等各類性狀的QTL,在release 2.3版本中囊括了截至2018年1月來自156個(gè)刊物的4 892個(gè)QTL[12-13]; Ijaz等[14]總結(jié)了2017-2019年多個(gè)研究者定位的、與纖維品質(zhì)相關(guān)的穩(wěn)定QTL.
本研究運(yùn)用SLAF-seq SNP技術(shù)結(jié)合SSR分子標(biāo)記構(gòu)建高密度遺傳圖譜,幫助增加遺傳圖譜的準(zhǔn)確性,縮小了QTL長度區(qū)間,使QTL定位更加準(zhǔn)確高效,可有效推進(jìn)后續(xù)精細(xì)定位群體選擇和候選基因篩選,為陸地棉產(chǎn)量和纖維品質(zhì)的分子育種提供參考.
雜交母本為渝棉1號,由西南大學(xué)棉花研究室自主培育而成,產(chǎn)量高、纖維品質(zhì)好.父本為超早3號,由中國農(nóng)業(yè)科學(xué)院棉花研究所提供,具有早熟、無腺體、株型緊湊等特點(diǎn).重組近交系(RIL)F2:6群體(包含184系)及兩親本材料分別于2019年夏種植于重慶歇馬棉花種植基地,2019年冬種植于海南三亞,2020年夏種植于新疆庫爾勒和新疆奎屯.
提取2019年夏重慶歇馬棉花種植基地的棉花植株嫩葉DNA,提取過程參照Zhang等[15]改良的CTAB(Cetyltrimethylammonium Bromide)法.將提取的184株棉花全套DNA送至北京百邁客生物科技有限公司進(jìn)行SLAF-seq測序.參考棉花基因組來自http://ibi.zju.edu.cn/cotton/,利用北京百邁客生物科技有限公司自主研發(fā)的基因組酶切軟件對DNA進(jìn)行酶切預(yù)測,選擇HaeIII+Hpy166II作為最適內(nèi)切酶組合,經(jīng)酶切得到的片段范圍長度在414~464 bp之間,預(yù)測有254 089個(gè)SLAF(Specific-Locus Amplified Fragment)標(biāo)簽,經(jīng)日本晴酶切顯示,Control數(shù)據(jù)雙端比對效率為88.74%,酶切效率為84.23%,構(gòu)建的SLAF庫合格.
本研究篩選引物包括CCRI,SWU,JESPR,Gh,NAU,BNL,CIR,CGR,HAU,DOW,DPL[16].引物CCRI的設(shè)計(jì)參照亞洲棉基因組[17],引物SWU的設(shè)計(jì)參照雷蒙德氏棉基因組[18],其他來源于棉花引物數(shù)據(jù)庫http://www.cottonmarker.org.PCR反應(yīng)體系:1.5 μL 10x Easy Taq PCR Buffer(Mg2+)、0.2 μL 2 mmol/L dNTP、0.3 μL 25 mmol/L Mg2+、0.2 μL 10 mmol/L前引物(pF)、0.2 μL 10 mmol/L后引物、再用ddH2O定容至10 μL.PCR反應(yīng)流程:預(yù)變性94 ℃ 5 min、35個(gè)循環(huán)(變性94 ℃ 30 sec、退火53 ℃ 30 sec、延伸72 ℃ 30 sec)、延伸72 ℃ 7 min、保溫 16 ℃ 30 sec.采用聚丙烯酰胺凝膠電泳法篩選多態(tài)性SSR引物,并利用篩選得到的具多態(tài)性引物對群體進(jìn)行基因型檢測.
將測序結(jié)果進(jìn)行篩選,并將基因型缺失大于80%的標(biāo)記去除,利用JoinMap 4[19]軟件對經(jīng)SSR分子標(biāo)記和簡化基因組測序得到的SNP標(biāo)記進(jìn)行聯(lián)合分析,作圖映射函數(shù)為Kosambi函數(shù)[20],去除共分離后的位點(diǎn)用于構(gòu)建遺傳圖譜,參照Li等[21]測序得到的陸地棉基因組長度計(jì)算各染色體的基因組覆蓋率.
利用MapQTL?6.0[22-24]對群體進(jìn)行QTL定位,導(dǎo)入所有環(huán)境位點(diǎn)基因型數(shù)據(jù)和表型數(shù)據(jù),選擇區(qū)間作圖法運(yùn)算得到每個(gè)環(huán)境QTL的遺傳距離,設(shè)置似然比對數(shù)LOD≥2.5的位點(diǎn)作為確定的QTL鄰近標(biāo)記,LOD值減1的區(qū)間作為置信區(qū)間,將多個(gè)環(huán)境檢測到的同一性狀、同一位置的QTL記為同一個(gè)QTL,QTL的命名方式為“q性狀-染色體-序號”.利用MapChart將得到的QTL定位在遺傳圖譜上.QTL簇的命名方式為“qClu-染色體-序號”.
鈴質(zhì)量(BW)、衣分(LP)、籽指(SI)、衣指(LI)按常規(guī)方法測定; 纖維上半部平均長度(FL)、纖維整齊度指數(shù)(FU)、纖維斷裂比強(qiáng)度(FS)、纖維馬克隆值(FM)、纖維伸長率(FE)送至中國農(nóng)業(yè)科學(xué)院棉花研究所進(jìn)行纖維檢測.各性狀間的相關(guān)性系數(shù)圖由R語言繪制:https//www.R-project.org/.
4個(gè)環(huán)境下9個(gè)性狀均表現(xiàn)出不同程度的超親分離現(xiàn)象.頻率分布直方圖顯示各性狀均近似正態(tài)分布,且不同環(huán)境間性狀表現(xiàn)存在差異,結(jié)合4個(gè)環(huán)境的9個(gè)表型性狀進(jìn)行方差分析得到F值(表1),表明這些性狀連續(xù)分布且易受環(huán)境影響,符合數(shù)量性狀遺傳特點(diǎn).重組近交系F2:6群體在2019年夏重慶(CQ)、F2:7群體在2019年冬海南(HN)、F2:8群體在2020年夏新疆庫爾勒(KL)和新疆奎屯(KT)4個(gè)環(huán)境中的表型數(shù)據(jù)如表2所示.相關(guān)性分析表明,纖維整齊度、纖維斷裂比強(qiáng)度、纖維伸長率都與纖維長度呈顯著正相關(guān),纖維斷裂比強(qiáng)度、纖維伸長率都與纖維整齊度呈顯著正相關(guān),纖維伸長率與纖維斷裂比強(qiáng)度.籽指和衣分兩兩呈顯著正相關(guān),纖維長度、纖維斷裂比強(qiáng)度都與馬克隆值呈顯著負(fù)相關(guān)(圖1).
表1 4個(gè)環(huán)境間產(chǎn)量與纖維品質(zhì)的方差分析
表2 親本及RIL群體的產(chǎn)量和纖維品質(zhì)性狀表現(xiàn)
圖1中數(shù)據(jù)由對RIL群體4個(gè)環(huán)境9個(gè)性狀統(tǒng)計(jì)得出,經(jīng)R語言分析,可以表示出每個(gè)單株的具體性狀統(tǒng)計(jì)值及性狀間的相關(guān)性.對角線為該環(huán)境各性狀的頻率分布直方圖及擬合曲線; 對角線左側(cè)顯示帶有擬合曲線的二元散點(diǎn)圖,每個(gè)點(diǎn)表示一個(gè)單株,其橫縱方向?qū)?yīng)的數(shù)值為對應(yīng)性狀的統(tǒng)計(jì)值; 對角線右側(cè)顯示兩個(gè)性狀間的相關(guān)性系數(shù)及顯著性水平,***表示p<0.1%; **表示p<1%; *表示p<5%水平差異具有統(tǒng)計(jì)學(xué)意義.圖1 RIL群體產(chǎn)量和纖維品質(zhì)性狀表現(xiàn)及性狀相關(guān)性
利用3 578對SSR引物對親本進(jìn)行多態(tài)性篩選得到有多態(tài)性的引物145對,多態(tài)性比率為4.05%.SLAF-seq測序報(bào)告顯示共有49 528個(gè)SNP標(biāo)記(圖2).過濾掉測序缺失率大于80%和顛倒錯(cuò)位的標(biāo)記.經(jīng)SLAF-seq SNP結(jié)果和SSR分子標(biāo)記結(jié)果共同分析,最終得到分布于26條染色體的8 020個(gè)標(biāo)記,包括60個(gè)SSR分子標(biāo)記和7 960個(gè)SNP標(biāo)記.經(jīng)過分離過濾后,構(gòu)建了包含2 945個(gè)位點(diǎn),總遺傳長度為4 650.71 cM,位點(diǎn)間平均遺傳距離為1.58 cM的遺傳圖譜,物理長度為2 202.95 Mb.對比TM-1參考基因組的2 240.95 Mb,本文構(gòu)建的遺傳圖譜基因組覆蓋率為98.30%(表3).
圖2 SNP密度分布圖
表3 遺傳圖譜標(biāo)記在染色體上的分布情況
續(xù)表3
結(jié)合高密度遺傳圖譜與4個(gè)環(huán)境的產(chǎn)量及纖維品質(zhì)性狀統(tǒng)計(jì)數(shù)據(jù)共同分析,本研究共定位到分布于26條染色體上的76個(gè)QTL,包括35個(gè)產(chǎn)量性狀QTL,41個(gè)纖維品質(zhì)性狀QTL,LOD值分布在2.50~7.76之間,解釋表型變異值為6.4%~23.4%.當(dāng)解釋表型變異值大于10%時(shí),視為主效QTL.加性效應(yīng)值顯示,QTL增效基因來源于渝棉1號的有41個(gè),來源于超早3號的有35個(gè).有10個(gè)QTL在兩個(gè)及以上環(huán)境中被檢測到(表4).纖維長度性狀的QTL qFL-D11-1在4個(gè)環(huán)境中均被檢測到.在4條染色體上共檢測到5個(gè)QTL簇,包含17個(gè)QTL(圖3).
表4 在兩個(gè)及以上環(huán)境中存在的QTL
圖3 遺傳圖譜及產(chǎn)量性狀和纖維品質(zhì)性狀QTL定位圖
分子遺傳圖譜的構(gòu)建已經(jīng)在植物的分子生物學(xué)研究中有了廣泛的應(yīng)用[25-27].分子標(biāo)記是構(gòu)建遺傳圖譜的前提,在RFLP(Restriction fragment length polymorphism),RAPD(Random Amplified Polymorphic DNA),AFLP(Amplified Fragment Length Polymorphism)等眾多的傳統(tǒng)標(biāo)記方式中,本研究選擇了廣泛應(yīng)用的SSR分子標(biāo)記技術(shù),該技術(shù)準(zhǔn)確度高,可重復(fù)利用[28],但工作量大且耗時(shí)長.SNP高多態(tài)性配合SLAF-seq技術(shù)高效且價(jià)格相對便宜的優(yōu)勢,成為分子標(biāo)記的新選擇.在測序結(jié)果分析時(shí),篩除了SNP標(biāo)記中基因型缺失大于80%或者位置明顯錯(cuò)誤的標(biāo)記,導(dǎo)致部分區(qū)域分子標(biāo)記存在較大間隙.本研究結(jié)合了SSR分子標(biāo)記和SLAF-seq SNP技術(shù),且兩者相互補(bǔ)充,提高了遺傳圖譜構(gòu)建的準(zhǔn)確性.
高密度遺傳圖譜是QTL定位的有力保障,多個(gè)環(huán)境及多個(gè)性狀的測量使QTL定位更加準(zhǔn)確.在眾多QTL定位研究中,定位到的QTL數(shù)量差異很大,是因?yàn)檫z傳群體類型不同,親本遺傳背景不同,分子標(biāo)記類型不同,遺傳圖譜密度不同,多數(shù)表型性狀受環(huán)境影響大等各類差異所致[29-31].研究定位到的QTL增效基因來源不同且QTL加性效應(yīng)來源也不一致,表明在子代表型統(tǒng)計(jì)時(shí)出現(xiàn)了超親分離現(xiàn)象.本研究結(jié)合高密度遺傳圖譜與多環(huán)境性狀定位到的76個(gè)產(chǎn)量和纖維品質(zhì)性狀QTL,可以為棉花品質(zhì)精細(xì)定位群體的構(gòu)建提供依據(jù).在41個(gè)纖維品質(zhì)QTL中,關(guān)于纖維長度的QTL qFL-D11-1在4個(gè)環(huán)境中均被檢測到,且其LOD值為所有QTL中的最大值7.76,可為后續(xù)棉花纖維品質(zhì)的圖位克隆提供重要參考.
QTL成簇是在棉花、水稻、玉米等許多農(nóng)作物的QTL定位中都存在的現(xiàn)象[32-34].關(guān)于棉花QTL成簇現(xiàn)象,置信區(qū)間內(nèi)存在“一因多效”現(xiàn)象的解釋被廣泛認(rèn)可,Ulloa等[35]指出棉花的重要農(nóng)藝性狀QTL在染色體上表現(xiàn)出高度重組和基因富集的現(xiàn)象; Rong等[36]提出QTL簇的出現(xiàn)還可能是纖維相關(guān)QTL代表了一組具有新功能的小基因家族,棉花纖維發(fā)育過程的變異涉及復(fù)雜的網(wǎng)絡(luò)或相互作用的基因.本研究過程中發(fā)現(xiàn)當(dāng)遺傳圖譜標(biāo)記間隔較大,定位到的QTL置信區(qū)間較大時(shí),QTL之間易出現(xiàn)區(qū)間交叉形成QTL簇,因此高密度遺傳圖譜的構(gòu)建尤為重要.本研究在A07染色體上的QTL簇qClu-A07-1包含了籽指、衣分、鈴質(zhì)量3個(gè)產(chǎn)量性狀的QTL,且加性效應(yīng)均來自渝棉1號,表明該位點(diǎn)可實(shí)現(xiàn)對陸地棉的3個(gè)性狀同時(shí)改良.
本研究構(gòu)建了一張高密度遺傳圖譜,包含2 945個(gè)上圖位點(diǎn),總遺傳長度為4 650.71 cM,圖譜物理總長為2 202.95 Mb,覆蓋基因組總長的98.30%.定位到76個(gè)QTL,包括產(chǎn)量性狀QTL 35個(gè),纖維品質(zhì)性狀QTL 41個(gè),LOD值分布在2.50~7.76之間,解釋表型變異率為6.4%~23.4%.本研究可為后續(xù)精細(xì)群體構(gòu)建及候選基因篩選奠定基礎(chǔ),為早熟棉的產(chǎn)量與纖維品質(zhì)相關(guān)育種提供參考.