王康文,王雪平,王軍,梁雨,裴小雨,任翔,3,王星星,張先亮,3*,彭云玲,臧新山,3,4*,馬雄風(fēng),3,4*
(1.甘肅農(nóng)業(yè)大學(xué)農(nóng)學(xué)院/ 甘肅省干旱生境作物學(xué)重點(diǎn)實(shí)驗(yàn)室/ 甘肅省作物遺傳改良與種質(zhì)創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,蘭州730070;2.中國農(nóng)業(yè)科學(xué)院棉花研究所/ 棉花生物育種與綜合利用全國重點(diǎn)實(shí)驗(yàn)室/ 農(nóng)業(yè)農(nóng)村部棉花生物學(xué)與遺傳育種重點(diǎn)實(shí)驗(yàn)室,河南 安陽 455000;3.中國農(nóng)業(yè)科學(xué)院西部農(nóng)業(yè)研究中心,新疆 昌吉 831100;4.鄭州大學(xué)農(nóng)學(xué)院,鄭州 450000)
棉花是重要的天然纖維作物,也是重要的油料作物,在我國國民經(jīng)濟(jì)中處于戰(zhàn)略地位。新疆是我國主要的商品棉生產(chǎn)基地。目前,新疆北疆地區(qū)已基本實(shí)現(xiàn)棉花機(jī)械化采摘,南疆地區(qū)機(jī)采棉面積占比逐年增加。機(jī)采棉技術(shù)的推廣運(yùn)用對(duì)全國棉花產(chǎn)業(yè)發(fā)展具有重要的推動(dòng)作用[1]。棉花在機(jī)械收獲時(shí)混入的雜質(zhì)較多一直是困擾紡織工業(yè)的主要難題。目前,我國的機(jī)采棉含雜率普遍較高,一般在12%~16%,最高達(dá)到20%[2],導(dǎo)致后續(xù)籽棉加工清理工序增多、纖維品質(zhì)顯著下降。
棉花一般有3 片苞葉,呈心臟形,緊貼蕾鈴,苞葉與蕾鈴發(fā)育、光合產(chǎn)物積累、病蟲害防治和紡紗品質(zhì)密切相關(guān)[3]。已發(fā)現(xiàn)的棉花苞葉變異類型主要包括窄卷苞葉[4-5]、凋萎苞片[6]和狹薄卷苞葉[7]。1940 年,美國阿肯色州棉農(nóng)Frego 首次發(fā)現(xiàn)棉花窄卷苞葉突變株,窄卷苞葉狹長、扭曲翻轉(zhuǎn)生長,與絮鈴貼合不緊密;窄卷苞葉突變體在吐絮期苞葉自然下卷,至采收期干枯苞葉與籽棉分離,且處在鈴殼之下,因此可以降低機(jī)采棉含雜率[7]。
1955 年,Green[5]證明棉花窄卷苞葉的遺傳受1 對(duì)隱性基因控制。2010 年,Li 等[4]利用陸地棉(Gossypium hirsutum)T582(含fg基因)和海島棉(G.barbadense)Hai7124 的F2群體,將窄卷苞葉基因fg定位在A03 染色體長臂上簡單序列重復(fù)(simple sequence repeat,SSR)標(biāo)記NAU3016 和NAU3172 之間,fg與NAU3016 和NAU3172 的遺傳距離分別為0.3 cM (centiMorgan,厘摩)和4.7 cM,對(duì)應(yīng)的物理區(qū)間為1.87~3.85 Mb(million base pair,百萬堿基對(duì)),物理距離為1.98 Mb。2017 年,Zhu 等[8]利用混合分組分析測(cè)序法(bulked segregate analysis-sequencing, BSA-Seq)將fg基因定位在A03 染色體上物理位置0.00~4.50 Mb 區(qū)間內(nèi)。
本研究以陸地棉T582 為母本,分別與父本陸地棉TM-1、海島棉3-79 雜交構(gòu)建2 個(gè)F2分離群體,開發(fā)插入缺失(insertion-deletion, Indel)分子標(biāo)記對(duì)窄卷苞葉基因fg進(jìn)行精細(xì)定位,為該基因的圖位克隆和育種利用奠定基礎(chǔ)。
配制雜交組合所用的親本材料為陸地棉T582、陸地棉遺傳標(biāo)準(zhǔn)系TM-1 和海島棉品種3-79,均由中國農(nóng)業(yè)科學(xué)院棉花研究所國家棉花種質(zhì)中期庫提供,本課題進(jìn)行多年連續(xù)自交保存。
親本苞葉性狀穩(wěn)定,3-79 和TM-1 為正常苞葉,T582 為窄卷苞葉。以陸地棉T582 為母本,分別與父本陸地棉TM-1、海島棉3-79 雜交構(gòu)建2個(gè)F2分離群體。群體1(T582×TM-1)F2群體包含370 個(gè)單株;群體2(T582×3-79)F2群體包含2 667 個(gè)單株。2021 年4 月28 日,將親本、F1及F2種植于中國農(nóng)業(yè)科學(xué)院棉花研究所東場(chǎng)試驗(yàn)基地(河南省安陽縣)。3 個(gè)親本分別種植3 行,群體1 種植約10 行,群體2 種植約70 行,行長均為8 m,行距為0.80 m,株距為0.25 m。田間管理措施同當(dāng)?shù)爻R?guī)棉田。
開花后(7 月中旬至8 月底),調(diào)查棉花苞葉表型。與T582 表型一致的記為窄卷苞葉,與TM-1 或3-79 表型一致的記為正常苞葉,并進(jìn)行卡方(χ2)適合性檢驗(yàn),以確定F2群體的苞葉性狀是否符合3∶1 的分離比。
根據(jù)Li 等[4]的定位結(jié)果,窄卷苞葉目標(biāo)基因被定位在A03 染色體長臂上分子標(biāo)記NAU3016和NAU3172 之間,目標(biāo)基因與這2 個(gè)分子標(biāo)記的遺傳距離分別為0.3 cM 和4.7 cM。基于此,本研究結(jié)合海島棉3-79[9]和陸地棉TM-1[10]參考基因組數(shù)據(jù),利用IGV(integrative genomics viewer)軟件來查找Indel 位點(diǎn),選取插入或缺失10 bp 以上的位點(diǎn),共設(shè)計(jì)了20 對(duì)Indel 分子標(biāo)記引物。所有引物序列均由DNAMAN 軟件設(shè)計(jì)獲得,由生工生物工程(上海)股份有限公司合成(引物序列見表1)。
采用十六烷基三甲基溴化銨(Cetyltrimethylammonium bromide,CTAB)法提取T582 和3-79親本的基因組DNA。采用TaqDNA 聚合酶(購自康為世紀(jì)生物科技股份有限公司)進(jìn)行聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reaction,PCR),PCR 反應(yīng)體系:緩沖液10 μL,模板DNA 1 μL,10 μmol·L—1正反向引物各1 μL,加ddH2O 至20 μL。PCR反應(yīng)程序:94 ℃5 min;94 ℃30 s,55 ℃30 s,72 ℃1 min,35 個(gè)循環(huán);72 ℃5 min 。將PCR 產(chǎn)物在3%(質(zhì)量分?jǐn)?shù))的瓊脂糖凝膠中電泳分離,以篩選出在親本間有多態(tài)性的Indel 分子標(biāo)記。
利用篩選出的多態(tài)性Indel 分子標(biāo)記,以提取的親本及群體2 單株的基因組DNA 為模板進(jìn)行PCR 擴(kuò)增,利用瓊脂糖凝膠電泳分析親本及F2各個(gè)單株的擴(kuò)增條帶類型,統(tǒng)計(jì)交換單株數(shù)量,精細(xì)定位目的基因候選區(qū)間。DNA 提取、PCR擴(kuò)增及瓊脂糖凝膠電泳方法同1.3。
根據(jù)精細(xì)定位結(jié)果得到候選區(qū)間,在棉花功能基因組學(xué)數(shù)據(jù)庫(https://cottonfgd.net/)中根據(jù)陸地棉TM-1 參考基因組[10]獲得候選區(qū)間內(nèi)功能基因的注釋信息。從棉花多組學(xué)數(shù)據(jù)庫(http://cotton.zju.edu.cn/)獲取候選區(qū)間內(nèi)的基因在TM-1 不同組織器官(根、莖、葉、花托、花瓣、花藥、雌蕊、花萼、副萼、發(fā)育的胚珠和纖維)中的轉(zhuǎn)錄組測(cè)序數(shù)據(jù),基于FPKM (fragments per kilobase of exon model per million mapped reads,每千個(gè)堿基的轉(zhuǎn)錄每百萬映射讀取的片段)對(duì)基因表達(dá)量數(shù)據(jù)進(jìn)行l(wèi)og2(FPKM+1)標(biāo)準(zhǔn)化處理,使用R軟件pheatmap 包繪制基因表達(dá)量的熱圖。
對(duì)2 個(gè)F2群體進(jìn)行田間性狀調(diào)查,選取開花后15 天(15 days post anthesis,15 DPA)和30 DPA苞葉進(jìn)行表型統(tǒng)計(jì)分析(圖1)。群體1 中正常苞葉單株有285 株,窄卷苞葉單株有85 株,卡方適合性檢驗(yàn)結(jié)果顯示,分離群體的性狀分離比為3∶1(χ2=0.86<χ20.053.84),符合孟德爾遺傳分離定律。群體2 中正常苞葉單株2 015 株,窄卷苞葉單株652 株,卡方適合性檢驗(yàn)結(jié)果顯示,分離群體的性狀分離比為3∶1(χ2=0.45<χ20.05=3.84),符合孟德爾遺傳分離定律(表2)。因此,棉花窄卷苞葉基因fg為隱性單基因調(diào)控,與前人的研究結(jié)果[5]一致。
圖1 正常苞葉和窄卷苞葉形態(tài)對(duì)比Fig.1 Morphology comparison of normal bract and frego bract
表2 F2 作圖群體中窄卷苞葉和正常苞葉分離比Table 2 Segregation ratio of frego bract and normal bract in the F2 mapping populations
根據(jù)Li 等[4]對(duì)fg的定位結(jié)果,本研究在A03染色體上物理區(qū)間1.87~3.85 Mb 內(nèi),開發(fā)了20對(duì)Indel 分子標(biāo)記,在親本T582 和3-79 之間進(jìn)行多態(tài)性篩選,共篩選到6 對(duì)具有多態(tài)性的Indel分子標(biāo)記,分別為M1、M2、M3、M4、M5 和M6(引物序列信息參見表1)。
利用篩選出的6 對(duì)多態(tài)性Indel 分子標(biāo)記,首先對(duì)群體2 的300 個(gè)單株(其中正常苞葉單株237 株,窄卷苞葉單株63 株)的基因組DNA 進(jìn)行擴(kuò)增檢測(cè),將候選區(qū)間縮小在分子標(biāo)記M1 與M4 之間,物理距離為861 kb(圖2)。
圖2 fg 基因的定位Fig.2 Mapping of fg gene
利用M1、M2、M3、M4 分子標(biāo)記對(duì)群體2 中2 667 個(gè)單株的基因組DNA 進(jìn)行檢測(cè),根據(jù)重組數(shù)據(jù),進(jìn)一步將候選區(qū)間縮小至分子標(biāo)記M3 與M4 之間,分子標(biāo)記序列被錨定到陸地棉遺傳標(biāo)準(zhǔn)系TM-1 基因組[10]A03 染色體2 757 376~2 946 245 bp,物理距離為188 kb(圖2)。
結(jié)合基因組注釋結(jié)果,188 kb 定位區(qū)間內(nèi)存在14 個(gè)功能注釋基因(表3)。其中,Gh_A03G021400、Gh_A03G021500編碼乙醛酸/ 羥基丙酮酸還原酶HPR3;Gh_A03G021600編碼RALF-like 26 蛋白;Gh_A03G021700編碼STAY-GREEN 1 蛋白(葉綠體);Gh_A03G021800編碼 Agamous-like MADS-box 蛋白 AGL19;Gh_A03G021900編碼同源異型盒蛋白knotted-1-like 7;Gh_A03G022000、Gh_A03G022100、Gh_A03G022200、Gh_A03G022300、Gh_A03G022400、Gh_A03G022500均編碼抗病蛋白;Gh_A03G022600編碼雙功能dTDP-4-脫氫鼠李糖-3,5-差向異構(gòu)酶/dTDP-4-脫氫鼠李糖還原酶;Gh_A03G022700編碼羥甲基戊二酰輔酶A 合酶。
表3 定位區(qū)間內(nèi)候選基因的注釋信息Table 3 Annotation information of candidate genes in the mapping interval
根據(jù)這14 個(gè)功能注釋基因在棉花不同組織器官中的相對(duì)表達(dá)量數(shù)據(jù),在花萼和副萼中Gh_A03G021700、Gh_A03G021900、Gh_A03G022600、Gh_A03G022700基因的表達(dá)量較高;Gh_A03G021500、Gh_A03G022600、Gh_A03G022700基因在3DPA、5DPA 胚珠和10DPA纖維中高表達(dá);Gh_A03G021900基因在花藥、雌蕊、10 DPA 胚珠和20 DPA 的纖維中高表達(dá);Gh_A03G021400、Gh_A03G021600、Gh_A03G021800、Gh_A03G022000、Gh_A03G022100、Gh_A03G022200、Gh_A03G022300、Gh_A03G022400、Gh_A03G022500基因在不同組織器官(根、莖、葉、花托、花瓣、花藥、雌蕊、花萼、副萼、發(fā)育的胚珠和纖維)中的表達(dá)量均較低(圖3)。
圖3 定位區(qū)間內(nèi)14 個(gè)注釋基因的表達(dá)模式分析Fig.3 Expression pattern analysis of 14 annotated genes in the mapping interval
新疆是我國最大的機(jī)采棉生產(chǎn)基地。機(jī)采技術(shù)減少了勞動(dòng)力投入,降低了棉花生產(chǎn)成本,大大提高了棉農(nóng)的植棉經(jīng)濟(jì)收益,但機(jī)采棉普遍含雜率較高,給棉花的后續(xù)加工帶來了一定的困難。原棉雜質(zhì)主要包括干枯葉片、干枯苞葉和異性纖維等;其中干枯葉片和異性纖維能夠通過及時(shí)采摘吐絮籽棉,嚴(yán)格遵守采收加工規(guī)定等方法得到有效控制;而干枯苞葉難以剔除,原因在于苞葉緊貼棉鈴,吐絮后苞葉雖然枯死但仍緊貼在籽棉上不能自行脫落,在機(jī)械采摘時(shí)易將其混入籽棉[11]。棉花窄卷苞葉突變體在吐絮期表現(xiàn)為苞葉自然下卷,至采收期干枯苞葉與籽棉分離,且處在鈴殼之下,因此可以降低機(jī)采棉的含雜率,利于提高棉花纖維品質(zhì)。
棉花窄卷苞葉突變體表現(xiàn)為苞葉狹長、扭曲翻轉(zhuǎn)生長,花蕾和棉鈴裸露,植株對(duì)棉鈴象甲、棉鈴蟲、棉紅鈴蟲、金剛鉆等害蟲具有一定抗性[4,12]。殺蟲劑對(duì)窄卷苞葉棉株的使用效果更好,研究表明,噴灑藥劑后附著在此類花苞和棉鈴上的殺蟲藥劑量是正常苞葉的7 倍[13]。本研究對(duì)棉花窄卷苞葉基因fg進(jìn)行了精細(xì)定位,并對(duì)定位區(qū)間內(nèi)的14 個(gè)候選基因進(jìn)行了功能注釋,發(fā)現(xiàn)有6個(gè)基因被注釋為抗病蛋白,但其具體的作用機(jī)制尚不清楚。另外,有研究表明窄卷苞葉基因?qū)γ藁ㄉ?、產(chǎn)量、衣分、單株果枝數(shù)、蕾鈴脫落率和纖維品質(zhì)均無明顯不良效應(yīng)[14-16]。綜上,棉花窄卷苞葉突變體具有降低機(jī)采棉含雜率、增強(qiáng)植株抗蟲性等優(yōu)勢(shì),且對(duì)棉花產(chǎn)量和纖維品質(zhì)無顯著不利影響,具有一定的育種利用價(jià)值。
近年來,棉花基因組學(xué)的快速發(fā)展為棉花功能基因的定位及克隆奠定了堅(jiān)實(shí)的基礎(chǔ)[10,17-20],混合分組分析法[21]、全基因組關(guān)聯(lián)分析[22](genomewide association study, GWAS)等方法也逐漸成為挖掘功能基因的重要手段,有效促進(jìn)了棉花功能基因的研究進(jìn)程。在前人研究基礎(chǔ)上,本研究將棉花fg基因定位在A03 染色體上分子標(biāo)記M3和M4 之間,區(qū)間大小為188 kb;區(qū)間內(nèi)有14 個(gè)注釋的功能基因,其中Gh_A03G021700、Gh_A03G021900、Gh_A03G022600、Gh_A03G022700基因在花萼、副萼中高表達(dá),因此推測(cè)這4 個(gè)基因?yàn)榭赡艿恼戆~候選基因。未來將通過進(jìn)一步的精細(xì)定位、圖位克隆、功能驗(yàn)證等方式確定棉花窄卷苞葉的調(diào)控基因并解析其作用機(jī)制。
棉花窄卷苞葉由隱性單基因調(diào)控。在前人工作基礎(chǔ)上,利用陸地棉T582 和海島棉3-79 構(gòu)建F2分離群體,將窄卷苞葉基因fg精細(xì)定位在A03 染色體上分子標(biāo)記M3 與M4 之間,物理距離為188 kb。該區(qū)間內(nèi)存在14 個(gè)功能注釋基因,其中Gh_A03G021700、Gh_A03G021900、Gh_A03G022600和Gh_A03G022700基因在花萼和副萼中高表達(dá)。本研究為棉花窄卷苞葉基因fg的圖位克隆和育種利用奠定了基礎(chǔ)。