徐劍文,劉劍光,趙君,王希睿,肖松華*
(1.江蘇省農(nóng)業(yè)科學(xué)院經(jīng)濟作物研究所/農(nóng)業(yè)部長江中下游棉花和油菜重點實驗室,南京210014;2.南京市標(biāo)準(zhǔn)化研究院,南京210019)
隨著中國勞動力成本的上升,現(xiàn)階段棉花種植過程中急需推進機械化的栽培模式,提高生產(chǎn)效率,降低勞動力成本,實現(xiàn)快樂植棉[1]。棉花株型育種是棉花生產(chǎn)機械化的一個重要組成部分,與棉花機械化采摘關(guān)系密切,也是現(xiàn)階段育種工作的一個重要方面。
與機械化采摘相適應(yīng)的棉花株型性狀主要包括:主莖葉片數(shù)、株高、果枝數(shù)、果枝類型、葉枝數(shù)等[2]。目前采棉機對棉花株型的要求是:株高在80~100 cm,果枝始節(jié)高度大于18 cm,果枝間距在10~11 cm,株型緊湊,果枝短且夾角小,吐絮集中[2-5]。本研究針對棉花機采株型果枝長度性狀進行分析,初步定位到控制棉花中部果枝節(jié)間長度基因所在染色體區(qū)段。
群體分離分析法(Bulked segregant analysis,BSA)是根據(jù)目的性狀差異,將作圖群體分為2組,分別將其DNA等量混合,構(gòu)建DNA混池進行分子標(biāo)記分析[6]。利用該方法分析,2個DNA混池之間僅目標(biāo)基因所在染色體區(qū)段序列存在差異。因此,在2個混池之間表現(xiàn)出多態(tài)性的標(biāo)記,與目標(biāo)性狀基因連鎖[7-9]。起初,BSA法被用來篩選與目標(biāo)性狀連鎖的限制性內(nèi)切酶片段長度多態(tài)性標(biāo)記(Restriction fragment length polymorphism,RFLP)和隨機擴增多態(tài)性 DNA標(biāo)記(Random amplified polymorphic DNA,RAPD),之后又被用來定位目標(biāo)性狀(Quantitative trait loci,QTLs)[10-11]。但可用的分子標(biāo)記少是該方法利用效率的最大限制性因素[12]。
隨著測序技術(shù)的發(fā)展,下一代測序(Next-generation sequencing,NGS)技術(shù)為目標(biāo)性狀的遺傳分析提供了一個新的有效手段,全基因組重測序被用于精細定位和多態(tài)性鑒定[13]。將NGS和BSA結(jié)合,為加快目標(biāo)基因的精細定位和克隆提供了有效的手段[12-14]。該方法對分子標(biāo)記的依賴性低,基因分型的時間短,大大縮短QTLs定位的時間,提高研究效率。利用該方法,成功定位到水稻中株高相關(guān)、黃瓜中果實長度相關(guān)、大豆種皮顏色相關(guān)等QTLs[12,15-16]。
自20世紀(jì)起研究者就開始對棉花短果枝性狀開展遺傳解析工作。Kearney在1930年發(fā)現(xiàn)來自埃及的比馬棉短果枝性狀受不完全顯性基因控制,狄佳春的研究表明陸地棉的短果枝性狀同樣也受不完全顯性基因控制[17]。而在海島棉中,翟騰飛[18]和Si等[19]都在海島棉的D7染色體上定位到與〇式果枝相關(guān)的基因,并且這些基因都符合單隱性遺傳模式。本研究以本課題組育成的短果枝陸地棉品系蘇機棉125為父本,以泗抗1號為母本[20],構(gòu)建作圖群體。根據(jù)F2群體單株中部果枝節(jié)間平均長度,選擇極端性狀單株分為2組,構(gòu)建DNA混池。再對2個混池進行重測序,分析2個混池之間的單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)和插入缺失突變(Insertion-Deletion,InDel), 利用 SNP 標(biāo)記和 InDel標(biāo)記對Ⅰ式果枝相關(guān)基因進行初定位。
2016年夏季在江蘇省南京市以長果枝棉花品種泗抗1號為母本,以本課題組育成的短果枝棉花品系蘇機棉125為父本,雜交獲得F1種子。2016年冬在海南省三亞市種植F1,自交獲得F2種子。2017年夏季在南京種植含有299個單株的F2分離群體,并調(diào)查株型性狀。
2017年夏季在江蘇南京種植2個親本、F1單株和F2分離群體,種植行距為80 cm,株距15 cm,密度為83 333株·hm-2。待生長至盛花期后,打頂并調(diào)查株高、中部果枝平均長度、中部果枝果節(jié)數(shù)、果枝夾角等株型性狀,果枝類型根據(jù)杜雄明等的標(biāo)準(zhǔn)分類[21]。吐絮期調(diào)查單株鈴數(shù),并收取50個鈴計算鈴重。2個親本材料各調(diào)查20株。
纖維上半部平均長度、斷裂比強度、馬克隆值委托農(nóng)業(yè)農(nóng)村部棉花品質(zhì)監(jiān)督檢驗測試中心(河南省安陽市),利用HFT9000大容量纖維檢測儀根據(jù)GB/T 20392―2006《HVI棉纖維物理性能試驗方法》進行測定。
2017年冬季,根據(jù)F2群體單株的中部果枝節(jié)間平均長度,選擇極端性狀單株,利用CTAB法提取DNA[22],等量混合,構(gòu)建長/短果枝DNA混池。
1.4.1混池的重測序。樣品基因組DNA檢測合格后,委托南京集思慧遠生物科技有限公司,利用Illumina HiSeq平臺進行測序。對測序得到的原始reads(雙端序列)進行質(zhì)量評估并過濾得到Clean Reads,用于后續(xù)生物信息學(xué)的分析。將2個混池之間的Clean Reads進行比對,基于比對結(jié)果進行SNP、Small InDel的檢測和注釋,并對變異基因進行挖掘和功能分析。利用數(shù)據(jù)庫(http://geneontology.org/)對關(guān)聯(lián)區(qū)域內(nèi)的基因進行基因注釋(Gene ontology,GO)。
1.4.2歐式距離法分析關(guān)聯(lián)區(qū)域。采用歐式距離法(Euclidean distance,ED)計算 2組樣品間的歐氏距離,距離越大,差異越大。對在同一條染色體上的SNP或InDel標(biāo)記的ED值,進行LOESS的回歸擬合,獲得關(guān)聯(lián)的閾值,選擇99%分位數(shù)閾值以上的區(qū)域作為與性狀相關(guān)的關(guān)聯(lián)區(qū)域[23-24]。
棉花打頂后至鈴期采集親本材料中部果枝機采相關(guān)性狀。蘇機棉125的中部果枝長度極顯著短于泗抗 1號,P值為 7.79×10-7(表 1)。 將果枝長度數(shù)據(jù)分解為果節(jié)數(shù)和果枝節(jié)間平均長度2個性狀后發(fā)現(xiàn),2個親本在果節(jié)數(shù)上沒有顯著差異(P=0.09),而蘇機棉125的中部果枝節(jié)間平均長度極顯著短于泗抗 1號(P=7.64×10-11)(表1)。因此,本研究中的2個親本果枝性狀差異主要是由中部果枝節(jié)間平均長度所決定。親本蘇機棉125屬于Ⅰ式果枝類型,而泗抗1號屬于Ⅱ式果枝類型(圖1、表1)。此外,蘇機棉125的中部果枝夾角也極顯著小于泗抗1號,P值為9.68×10-9(表1)。結(jié)果顯示:2個親本中部果枝差異最大的性狀為節(jié)間平均長度,P值為7.64×10-11。
主莖性狀中,蘇機棉125與泗抗1號之間的株高、果枝始節(jié)高度、主莖始節(jié)下平均節(jié)間長度存在顯著差異,P值分別為 0.02、0.009、0.009(表2),而果枝始節(jié)以上主莖高度、果枝數(shù)、果枝始節(jié)以上平均節(jié)間長度、果枝始節(jié)沒有顯著差異,P值分別為 0.97、0.75、0.33 和 0.93,2 個親本果株高差異主要是由果枝始節(jié)以下部位的差異決定,而果枝始節(jié)以下部位的果枝始節(jié)高度差異又主要是由節(jié)間平均長度所決定。親本材料的產(chǎn)量和纖維品質(zhì)性狀中,蘇機棉125的單株鈴數(shù)、斷裂比強度和馬克隆值顯著低于泗抗1號,P值為3.31×10-10、0.03 和 0.045;2 個親本的衣分、鈴重、纖維上半部平均長度3個性狀沒有顯著差異,P值分別為 0.06、0.50、0.06; 蘇機棉 125的均顯著小于泗抗1號,P值分別為 0.03和 0.045(表 3)。
2個親本之間共有4個性狀存在極顯著差異,根據(jù)P值大小排序分別為中部果枝節(jié)間平均長度、單株鈴數(shù)、中部果枝夾角、下部平均節(jié)間長度,P值分別 7.64×10-11、3.31×10-10、9.68×10-9、0.009,選擇中部果枝節(jié)間平均長度開展進一步研究。
利用SPSS 19.0軟件對F2群體的中部果枝節(jié)間平均長度進行正態(tài)分布檢驗,結(jié)果(圖2、表4)顯示F2群體中部果枝節(jié)間平均長度最大值為13.67 cm,最小值為 1.5 cm,平均值為 7.91 cm,偏度系數(shù)為-0.447,峰度系數(shù)為-0.002。說明F2群體的中部果枝節(jié)間平均長度表現(xiàn)為單峰連續(xù)分布,沒有明顯的比例關(guān)系,表現(xiàn)出數(shù)量性狀的遺傳特點。因此,我們認為棉花果枝性狀屬于多基因控制,適于QTL分析。
圖1 親本材料果枝表型比較Fig.1 The comparison of fruit branch phenotypes in parents
表1 親本材料中部果枝性狀比較Table 1 The comparison of middle fruit branch traits in parents
表2 親本材料主莖性狀比較Table 2 The comparison of stem traits in parents
表3 親本材料纖維品質(zhì)和產(chǎn)量性狀比較Table 3 The comparison of fiber quality and production traits in parents
對2個混池測序共獲得166.03 Gbp的Clean Data,樣品對基因組的測序深度分別為41.700 1×和40.434 8×,覆蓋度分別為96.55%和96.53%。樣品間共742 959個SNP和104 616個InDel,分布在26條染色體上(圖5)。
采用歐式距離法計算2個極端性狀混池間SNP標(biāo)記的ED值,經(jīng)LOESS回歸擬合后,獲得關(guān)聯(lián)的閾值0.597 3,99%分位數(shù)閾值以上的區(qū)間位于A03染色體上0.8 Mbp范圍內(nèi),為與中部果枝節(jié)間平均長度關(guān)聯(lián)的區(qū)域(圖5A)。同時,計算2個極端性狀混池間InDel標(biāo)記的ED值,經(jīng)LOESS回歸擬合后,獲得關(guān)聯(lián)的閾值0.606 1,99%分位數(shù)閾值以上的區(qū)間位于A03染色體上1.09 Mbp范圍內(nèi),為與中部果枝節(jié)間平均長度關(guān)聯(lián)區(qū)域(圖5B)。且利用SNP標(biāo)記和InDel標(biāo)記獲得的關(guān)聯(lián)區(qū)域重合,重合區(qū)間為0.77 Mbp。
GO分析結(jié)果表明:在細胞組成上,關(guān)聯(lián)區(qū)域的基因主要參與細胞組成,并主要參與細胞膜的構(gòu)成;在分子功能上,關(guān)聯(lián)區(qū)域的基因主要具有催化活性和結(jié)合反應(yīng)的功能;在生物進程上,關(guān)聯(lián)區(qū)域的基因主要參與代謝進程、細胞進程和單生物代謝進程(圖4)。
圖2 F2群體中部果枝節(jié)間平均長度分析Fig.2 The analysis of average internode length in middle fruit branches for F2population
表4 F2群體中部果枝節(jié)間平均長度性狀的統(tǒng)計分析及正態(tài)分布檢測Table 4 Statistic analysis and normal distribution test of average internode length traits in middle fruit branches for F2population
過去,棉花果枝類型被分為零式、一式和二式。零式果枝指無果節(jié),鈴柄直接著生在主莖葉腋間;一式果枝只有1個縮短的果節(jié),棉鈴單生或叢生于果節(jié)頂端;二式果枝型具有多個果節(jié),并且可能不斷延伸增節(jié),又稱為無限果枝。杜雄明在前人研究基礎(chǔ)上將零式和一式果枝統(tǒng)一劃歸為〇式果枝,并根據(jù)果枝節(jié)間長短將二式果枝分為Ⅰ式(節(jié)間長度2~5 cm)、Ⅱ式(節(jié)間長度5~10 cm)、Ⅲ式(節(jié)間長度 10~15 cm)和Ⅳ式(節(jié)間長度大于15 cm)[25]。Si等發(fā)現(xiàn)棉花中GoSP基因(SELF-PRUNING)的突變會在海島棉中形成零式果枝表型,而在陸地棉中形成一式果枝表型[19]。這一研究結(jié)果從分子生物學(xué)角度說明零式果枝和一式果枝應(yīng)當(dāng)被統(tǒng)一劃歸為〇式果枝。本研究中,親本材料蘇機棉125中部果枝平均節(jié)間長度為3.34 cm,屬于標(biāo)準(zhǔn)的Ⅰ式果枝,對該性狀的研究在解析Ⅰ式果枝遺傳規(guī)律和分子機制中具有重要意義。
目前采棉機對棉花株型有特定要求,通常認為適合機采的品種株高矮,果枝始節(jié)高,株型緊湊,果枝短且夾角小,吐絮集中[2-5]。本研究中的親本材料蘇機棉125平均株高為105.45 cm,果枝始節(jié)平均高度為31.48 cm,中部果枝平均長度為14.43 cm,果枝夾角為50.6°;而另一親本材料泗抗1號平均株高為95.7 cm,果枝始節(jié)位平均高度為23.4 cm,中部果枝平均長度為45.23 cm,果枝夾角為69.5°。2個親本的果枝始節(jié)位均大于18 cm,但蘇機棉125的始節(jié)位高度極顯著高于泗抗1號,是改良棉花果枝始節(jié)位高度性狀的理想親本材料。盡管蘇機棉125的中部果枝長度略大于理想長度(10~11 cm),但本研究的種植密度為83 333株·hm-2,在合理密植的基礎(chǔ)上可以進一步縮短果枝長度。蘇機棉125的株高性狀也略大于理想高度(80~100 cm),但通過栽培手段管理和遺傳改良的方式都可以解決這一問題。
圖3 關(guān)聯(lián)分析結(jié)果Fig.3 The association study results
目前對于棉花果枝長度的研究主要還是集中于對于〇式果枝基因的定位和克隆。除了Si等在棉花D7染色體上定位并克隆的GoSP基因之外,劉杰也在棉花D7染色體上定位到與〇式果枝相關(guān)的GhCEN基因(CENTRORADIALIS)[26]。此外,翟騰飛也在A7和D7染色體上定位到〇式果枝相關(guān)基因(cl)[18]。這些基因都符合單隱性遺傳模式。而對于Ⅰ式果枝相關(guān)QTL的定位研究還鮮見報道,但現(xiàn)有研究表明陸地棉短果枝性狀受不完全顯性基因控制,在D7染色體上已定位的基因之外還有其他基因控制棉花果枝長度[17]。本研究F2群體的中部果枝性狀統(tǒng)計結(jié)果顯示Ⅰ式果枝性狀表現(xiàn)出數(shù)量性狀的遺傳特點,這與〇式果枝的單隱性遺傳模式不同。QTL定位結(jié)果表明與Ⅰ式果枝性狀關(guān)聯(lián)的染色體區(qū)段位于A3染色體上,該位點在對〇式果枝的研究中并未被發(fā)現(xiàn)。本研究中,Ⅰ式果枝的遺傳位點、遺傳模式與〇式果枝不同,說明棉花〇式果枝與Ⅰ式果枝之間的差異并不是基因的劑量效應(yīng)引起,而是受不同的基因決定。
圖4 BSA關(guān)聯(lián)基因GO注釋聚類Fig.4 GO Classification of associated genes
本研究中Ⅰ式果枝相關(guān)基因被定位在A3染色體上,說明棉花Ⅰ式果枝和〇式果枝的差異是因為遺傳位點和模式的不同,而不是同一基因的劑量效應(yīng)。對該基因的進一步精細定位和克隆分析,將有助于全面揭示棉花果枝長度的遺傳機制,為棉花機采育種提供新的基因資源和理論支撐。