陳元軍, 馬娟娟, 史 睿, 李偉龍, 王 婷, 彭 琦, 張 維, 陳 鋒, 王曉東, 高建芹, 付三雄, 張潔夫, 孫程明, 季彪俊, 胡茂龍,3,4
(1.福建農(nóng)林大學(xué)農(nóng)學(xué)院,福建 福州 350002; 2.江蘇省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所/農(nóng)業(yè)農(nóng)村部長(zhǎng)江下游棉花與油菜重點(diǎn)實(shí)驗(yàn)室/江蘇省農(nóng)業(yè)生物學(xué)重點(diǎn)實(shí)驗(yàn)室/江蘇省現(xiàn)代作物生產(chǎn)協(xié)同創(chuàng)新中心,江蘇 南京 210014; 3.南京農(nóng)業(yè)大學(xué)作物遺傳與種質(zhì)創(chuàng)新國(guó)家重點(diǎn)實(shí)驗(yàn)室,江蘇 南京 210095; 4.江蘇大學(xué)生命科學(xué)研究院,江蘇 鎮(zhèn)江 212023)
甘藍(lán)型油菜(BrassicanapusL.)是中國(guó)主要的食用油來源之一,種植面積約7.0×106hm2,所產(chǎn)植物油量約占國(guó)產(chǎn)植物油總量的55%。但中國(guó)菜籽油產(chǎn)量已連續(xù)十年低于消費(fèi)量,2020年,菜籽油產(chǎn)量為6.36×106t,消費(fèi)量為8.25×106t,缺口達(dá)1.89×106t,這對(duì)中國(guó)糧食安全構(gòu)成了重大威脅[1]。因此,油菜產(chǎn)量的提高成為當(dāng)今油菜育種工作中最為關(guān)鍵的目標(biāo)。籽粒質(zhì)量是油菜產(chǎn)量性狀的重要組成部分,相較于角果長(zhǎng)、每角粒數(shù)等其他產(chǎn)量性狀具有更高的遺傳力[2]。研究結(jié)果表明,籽粒質(zhì)量改良是近年來油菜產(chǎn)量提升的重要原因[3]。因此,解析籽粒質(zhì)量遺傳基礎(chǔ)、挖掘有利基因可以提高油菜產(chǎn)量、保障中國(guó)油料供給安全。
甘藍(lán)型油菜是雙子葉植物,油菜種子由胚、胚乳和種皮等部分組成,分別由受精卵、受精中央細(xì)胞和珠被組織發(fā)育而成。基因型通過調(diào)控胚乳發(fā)育決定種子大小,珠被組織決定了種子發(fā)育的空間,受精卵發(fā)育成胚,三者結(jié)合,共同決定了種子的質(zhì)量和大小[4]。目前種子發(fā)育大小的主要形成機(jī)制分為2類,一類是種子早期發(fā)育階段胚乳增殖形成的空腔大小決定了種子體積,隨后胚乳細(xì)胞分裂促進(jìn)種子質(zhì)量增加;另一類是種皮和角果皮等母體組織調(diào)控種子發(fā)育,種子在發(fā)育過程中依賴母體的光合作用提供的養(yǎng)分[5]。目前,一系列基因已被報(bào)道調(diào)控種子發(fā)育,如IKU1通過調(diào)控胚乳生長(zhǎng)影響種子籽粒質(zhì)量[6];STK通過控制種皮的結(jié)構(gòu)和機(jī)械性能調(diào)節(jié)細(xì)胞分裂素水平來控制果實(shí)大小[7];GW5通過泛素蛋白酶體途徑調(diào)節(jié)種子細(xì)胞分裂,控制種子粒寬和籽粒質(zhì)量等[8]。
甘藍(lán)型油菜籽粒質(zhì)量是由多基因控制的數(shù)量性狀,受基因型和環(huán)境共同作用[9]。王瑞等[10]利用7個(gè)黃籽油菜品系配制完全雙列雜交組合,利用ADM(加性-顯性-母體遺傳效應(yīng))遺傳模型分析產(chǎn)量性狀,結(jié)果表明,千粒質(zhì)量的遺傳主要由基因的加性和顯性效應(yīng)聯(lián)合決定,而母體效應(yīng)比重小,同時(shí)環(huán)境對(duì)各性狀的遺傳均有一定影響。崔嘉成等[11]利用11個(gè)甘藍(lán)型油菜親本雜交得到30個(gè)組合,對(duì)各組合及親本角果性狀的遺傳模型的分析結(jié)果表明,基因的加性效應(yīng)控制千粒質(zhì)量的遺傳,無顯性效應(yīng)。戚存扣等[12]對(duì)2個(gè)遺傳差異大的親本構(gòu)建的世代家系群體的分析結(jié)果表明,該組合千粒質(zhì)量主要受主基因的加性效應(yīng)和多基因的加性和顯性效應(yīng)共同決定。李娜[13]的研究結(jié)果表明,油菜籽粒質(zhì)量主要受母體基因型調(diào)控,籽粒質(zhì)量的自然變異由細(xì)胞數(shù)目的變異決定,而非由種子密度決定。盡管油菜籽粒質(zhì)量的遺傳基礎(chǔ)十分復(fù)雜,但前人研究形成的共識(shí)是籽粒質(zhì)量遺傳力較高,籽粒質(zhì)量主要受到基因間加性效應(yīng)的影響,顯性效應(yīng)影響較小,雜種優(yōu)勢(shì)不強(qiáng)。因此,可以通過聚合不同種質(zhì)中的有利基因來增加油菜籽粒質(zhì)量。
全基因組關(guān)聯(lián)分析(Genome-wide association study,GWAS)是一種以位點(diǎn)間連鎖不平衡為基礎(chǔ),用統(tǒng)計(jì)學(xué)分析檢測(cè)遺傳多態(tài)性與目標(biāo)性狀間關(guān)聯(lián)的分析方法[14]。如今GWAS已被廣泛應(yīng)用于解析油菜的重要產(chǎn)量性狀。Lu等[15]對(duì)520份甘藍(lán)型油菜種質(zhì)資源的7個(gè)產(chǎn)量性狀進(jìn)行關(guān)聯(lián)分析,共檢測(cè)到128個(gè)顯著位點(diǎn),其中93個(gè)為新檢測(cè)到的位點(diǎn),結(jié)合4個(gè)產(chǎn)量差異極端材料的轉(zhuǎn)錄組數(shù)據(jù),確定14個(gè)候選基因。Dong等[16]對(duì)157份甘藍(lán)型油菜的籽粒質(zhì)量進(jìn)行關(guān)聯(lián)分析,檢測(cè)到20個(gè)籽粒質(zhì)量顯著位點(diǎn),在A09染色體顯著位點(diǎn)附近找到油菜籽粒質(zhì)量和角果長(zhǎng)已克隆基因BnaA.ARF18.a。Khan等[17]對(duì)521份甘藍(lán)型油菜品種的胚珠數(shù)、每角粒數(shù)和籽粒質(zhì)量性狀進(jìn)行關(guān)聯(lián)分析,利用多位點(diǎn)和單位點(diǎn)模型分別檢測(cè)到280個(gè)和31個(gè)顯著單核苷酸多態(tài)性(SNP),并挖掘出42個(gè)產(chǎn)量性狀候選基因。林升麗[18]通過重測(cè)序?qū)?05份油菜種質(zhì)資源進(jìn)行基因分型,對(duì)關(guān)聯(lián)群體7個(gè)環(huán)境的籽粒質(zhì)量表型進(jìn)行關(guān)聯(lián)分析,檢測(cè)到127個(gè)顯著位點(diǎn),找到BnaA07.KCR、BnaA07.EXPA1和BnaA10.GIF2等多個(gè)候選基因。
加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(Weighted gene co-expression network analysis,WGCNA)是利用大量表達(dá)譜數(shù)據(jù)對(duì)表達(dá)模式類似的基因進(jìn)行聚類,挖掘與性狀關(guān)聯(lián)基因模塊的分析方法。WGCNA目前已被廣泛應(yīng)用于油菜重要性狀的候選基因挖掘。Ma等[19]基于油菜感染黑脛病病菌的轉(zhuǎn)錄組數(shù)據(jù),對(duì)檢測(cè)到的1 892個(gè)差異剪接基因進(jìn)行WGCNA,檢測(cè)到8個(gè)共表達(dá)基因模塊,并挖掘出屬于WRKY、AP2、HMG和C2H2等轉(zhuǎn)錄因子家族的樞紐基因。同時(shí),越來越多的研究將GWAS與WGCNA相結(jié)合,找到一系列調(diào)控目標(biāo)性狀的候選基因。鮮小華等[20]利用GWAS挖掘出1 826個(gè)黃籽名義候選基因,利用WGCNA找到2個(gè)黃籽相關(guān)基因模塊,挖掘到BnF3H、BnANS等多個(gè)候選基因。劉景森[21]利用GWAS檢測(cè)到14個(gè)生物產(chǎn)量顯著位點(diǎn),利用葉片、種子和莖稈等組織的轉(zhuǎn)錄組數(shù)據(jù)構(gòu)建油菜生物產(chǎn)量共表達(dá)網(wǎng)絡(luò),鑒定到BnA04g06420D、BnA09g35380、BnC03g73810D和BnC08g48810D等多個(gè)生物產(chǎn)量候選基因。田貴福等[22]整合了油菜籽粒質(zhì)量的GWAS和QTL定位結(jié)果,利用71份油菜的角果轉(zhuǎn)錄組數(shù)據(jù)構(gòu)建了共表達(dá)網(wǎng)絡(luò),挖掘出樞紐基因BnSWH1并驗(yàn)證了其對(duì)種子籽粒質(zhì)量的負(fù)調(diào)控作用。本研究采用整合GWAS和WGCNA的策略,挖掘控制籽粒質(zhì)量的候選基因,為今后籽粒質(zhì)量相關(guān)的基因克隆和調(diào)控機(jī)制研究提供參考。
本研究的關(guān)聯(lián)群體包含496份國(guó)內(nèi)外的地方品種、育成品種及高世代育種材料,其中有444份材料來源于國(guó)內(nèi)油菜主產(chǎn)區(qū),包括江蘇、湖北、湖南和四川等,國(guó)外材料來自德國(guó)、瑞典和加拿大等國(guó)家。試驗(yàn)材料于2014年種植于江蘇南京(記作14NJ),2015年、2016年種植于江蘇泰州(記作15TZ、16TZ)。在前期研究中,我們已利用MLM(混合線性模型)和GLM(一般線性模型)對(duì)該群體進(jìn)行籽粒質(zhì)量關(guān)聯(lián)分析,本研究所使用的基因型和表型源于前期發(fā)表的論文[23]。
本研究中用于WGCNA的轉(zhuǎn)錄組數(shù)據(jù)集來自國(guó)家基因組科學(xué)數(shù)據(jù)中心(National Genomics Data Center,NGDC)的生物項(xiàng)目數(shù)據(jù)庫(kù)BioProject(ID:PRJCA001246),包含大粒品種中雙11和中小粒品種中油821開花后第7 d、第10 d、第14 d、第45 d的種子和開花后第7 d、第10 d、第14 d的角果皮共計(jì)28份轉(zhuǎn)錄組數(shù)據(jù)。
本研究利用A-D Test模型對(duì)籽粒質(zhì)量基因型和表型進(jìn)行關(guān)聯(lián)分析,顯著性閾值(P)計(jì)算方法為0.01/總標(biāo)記數(shù),取對(duì)數(shù)為-lgP=6.28。若1 Mb區(qū)間內(nèi)存在較多的顯著SNP,把兩兩間決定系數(shù)(R2)≥0.1的SNP視為1個(gè)關(guān)聯(lián)位點(diǎn),選取其中P值最小的為代表,利用qqman包繪制QQ圖(Quantile-quantile plot)和曼哈頓圖(Manhattan plot)[24]。
利用WGCNA包構(gòu)建基因共表達(dá)網(wǎng)絡(luò)[25],過濾變異系數(shù)(CV)<0.4、表達(dá)量(TPM)≤1和缺失樣本比例超過10%的基因,根據(jù)基因間的表達(dá)量數(shù)據(jù)對(duì)樣品進(jìn)行層次聚類分析,采取逐步法聚類表達(dá)模式相近的基因,繪制出聚類樹和每個(gè)樣品的表達(dá)圖。為了使結(jié)果符合無尺度網(wǎng)絡(luò)分布[26],選取擬合曲線R2接近0.9時(shí)的權(quán)重參數(shù)β,power值為10。利用動(dòng)態(tài)剪枝法識(shí)別共表達(dá)模塊,計(jì)算每個(gè)模塊的特征向量,合并距離較近的模塊并選擇相關(guān)系數(shù)絕對(duì)值大于0.75的模塊作為研究的目標(biāo)模塊。使用omicshare在線分析平臺(tái)(https://www.omicshare.com/tools/)對(duì)目標(biāo)模塊進(jìn)行GO富集,對(duì)富集結(jié)果進(jìn)行柱狀圖、氣泡圖和圈圖等圖表的繪制和展示。將|模塊身份(Module membership,KME)|≥0.90的基因定義為樞紐基因,利用Cytoscape軟件對(duì)籽粒質(zhì)量相關(guān)模塊進(jìn)行網(wǎng)絡(luò)可視化展示[27]。
以R2=0.2時(shí)的連鎖不平衡(Linkage disequilibrium,LD)衰減距離作為GWAS顯著位點(diǎn)的置信區(qū)間,提取區(qū)間內(nèi)的基因編碼序列(CDS),與模式植物擬南芥的基因CDS進(jìn)行BLAST比對(duì)(E-value≤1×10-10),用相似比最大的擬南芥基因來標(biāo)注油菜基因。同理,注釋W(xué)GCNA中籽粒質(zhì)量相關(guān)模塊的基因。最終,將2個(gè)分析中找到的油菜籽粒質(zhì)量已知基因和擬南芥籽粒質(zhì)量已知基因的同源基因作為候選基因[28]。
利用A-D Test模型對(duì)籽粒質(zhì)量最佳線性無偏預(yù)測(cè)值(BLUP)進(jìn)行關(guān)聯(lián)分析,設(shè)置顯著性閾值為-lgP=6.28,共檢測(cè)到37個(gè)顯著SNP;合并存在連鎖不平衡的 SNP(R2≥0.1),得到19個(gè)顯著SNP,分布在A01、A02、A06~A09、C02、C03、C05、C06、C09等11條染色體上(圖1、表1)。利用一般線性模型計(jì)算, 19個(gè)位點(diǎn)聯(lián)合解釋34.1%的表型變異。顯著性最高位點(diǎn)Bn-scaff_17526_1-p1066214位于C09染色體1.49 Mb處,-lgP=13.06(表2);顯著性次高位點(diǎn)Bn-scaff_16804_1-p203519位于C02染色體6.98 Mb處,-lgP=11.24;其余位點(diǎn)的-lgP值范圍為6.47~9.67。與單個(gè)環(huán)境的試驗(yàn)結(jié)果相比,14個(gè)位點(diǎn)在至少2個(gè)環(huán)境中被重復(fù)檢測(cè)到,其中,顯著性排名前4的位點(diǎn)Bn-scaff_17526_1-p1066214、Bn-scaff_16804_1-p203519、Bn-scaff_17119_1-p148890和Bn-A08-p20343735在3個(gè)環(huán)境(14NJ、15TZ及16TZ)中均被重復(fù)檢測(cè)到,證實(shí)了本研究結(jié)果的可重復(fù)性和可靠性(表2)。
表1 籽粒質(zhì)量顯著關(guān)聯(lián)位點(diǎn)
表2 各環(huán)境下A-D Test模型關(guān)聯(lián)位點(diǎn)
A:籽粒質(zhì)量A-D Test曼哈頓圖;B:籽粒質(zhì)量A-D Test QQ圖。a:A01;b:A02;c:A03;d:A04;e:A05;f:A06;g:A07;h:A08;i:A09;j:A10;k:C01;l:C02;m:C03;n:C04;o:C05;p:C06;q:C07。圖1 油菜籽粒質(zhì)量A-D Test全基因組關(guān)聯(lián)分析Fig.1 Genome-wide association study of seed weight in rapeseed by A-D Test model
比較前人GLM和MLM模型結(jié)果,8個(gè)位點(diǎn)與GLM重疊,2個(gè)位點(diǎn)與MLM重疊(表1)。位點(diǎn)Bn-scaff_17526_1-p1066214和Bn-A02-p6564861在3個(gè)模型中都被重復(fù)檢測(cè)到。不僅如此,A-D test還找到11個(gè)新位點(diǎn),Bn-scaff_16804_1-p203519分布在C02染色體6.98 Mb處,-lgP=11.24,在3個(gè)環(huán)境中都被檢測(cè)到。Bn-A09-p29991443位于A09染色體27.82 Mb處,-lgP=8.39,在2個(gè)環(huán)境(15TZ、16TZ)中都被檢測(cè)到。位點(diǎn)Bn-A01-p3061223和位點(diǎn)Bn-A08-p4273091均在14NJ和16TZ中被檢測(cè)到,-lgP值分別為7.98和7.75,此外還有7個(gè)新位點(diǎn)位于各染色體上,分別在1~2個(gè)環(huán)境中被檢測(cè)到。合并3個(gè)模型的結(jié)果,得到71個(gè)顯著位點(diǎn),11個(gè)分布在A07染色體上,9個(gè)分布在C06染色體上,8個(gè)分布在A03染色體上,其余染色體上分布1~7個(gè)位點(diǎn)。分析顯著位點(diǎn)的分布,57.7%的位點(diǎn)分布在A亞基因組,42.3%的位點(diǎn)分布在C亞基因組。利用一般線性模型計(jì)算,發(fā)現(xiàn)71個(gè)位點(diǎn)聯(lián)合解釋50.1%的表型變異。
大粒品種中雙11的千粒質(zhì)量約為4.6 g,中小粒品種中油821的千粒質(zhì)量約為3.4 g。本研究下載了兩者開花后第7 d、10 d、14 d、45 d的種子和開花后第7 d、10 d、14 d的角果皮轉(zhuǎn)錄組數(shù)據(jù),利用R軟件中WGCNA包對(duì)28份轉(zhuǎn)錄組數(shù)據(jù)的100 919個(gè)基因進(jìn)行分析,過濾低表達(dá)(TPM≤1)和變異系數(shù)較低(CV<0.4)的基因后,保留了35 540個(gè)基因。通過層次聚類繪制樣本樹并構(gòu)建無尺度網(wǎng)絡(luò)(圖2A、圖2B),采取逐步法聚類表達(dá)模式相近的基因(圖2C),最終得到13個(gè)共表達(dá)模塊。不同模塊間包含的基因數(shù)目差別大,turquoise模塊含有數(shù)量最多的基因,包含7 176個(gè)基因;salmon模塊包含基因數(shù)目最少,僅包含108個(gè)基因;其余模塊內(nèi)基因數(shù)目范圍為185~6 189。根據(jù)模塊間相關(guān)性繪制相關(guān)性熱圖,purple與green,purple與pink,magenta與yellow,magenta與black等模塊間相關(guān)性較高(圖2D)。
計(jì)算模塊特征向量與籽粒質(zhì)量表型的相關(guān)系數(shù),結(jié)果顯示,模塊系數(shù)絕對(duì)值范圍為0.004 9~0.820 0,以0.75為閾值,得到2個(gè)籽粒質(zhì)量關(guān)聯(lián)模塊,其中purple模塊系數(shù)最高(|r|>0.80,P<4×10-7),magenta模塊次之(|r|>0.76,P<2×10-6)(圖3A)。
A:模塊與籽粒質(zhì)量性狀關(guān)聯(lián)熱圖;B:purple模塊表達(dá)值熱圖與特征值條形圖;C:magenta模塊表達(dá)值熱圖與特征值條形圖。圖3 基因共表達(dá)模塊分析Fig.3 Gene co-expression module analysis
purple模塊包含1 109個(gè)基因,分布在19條染色體上,各染色體基因數(shù)目為25~92。比較2個(gè)品種,purple模塊基因在大粒品種中雙11種子和角果皮中表達(dá)量較低,在中小粒品種中油821中表達(dá)量較高(圖3B)。對(duì)模塊基因進(jìn)行GO富集分析,共富集到108個(gè)顯著GO 途徑(圖4A),包括苯丙氨酸氨基轉(zhuǎn)移酶活性、天冬氨酸轉(zhuǎn)氨酶活性、2-酮戊二酸轉(zhuǎn)氨酶活性、硫雙加氧酶活性和肉桂酸生物合成等(圖4B)。這些分子功能在控制種子的生長(zhǎng)發(fā)育中有重要作用,如苯丙氨酸參與幼苗早期細(xì)胞分裂生長(zhǎng)和種子發(fā)育等重要過程[29];天冬氨酸轉(zhuǎn)氨酶(AAT)是合成氨基酸的一種關(guān)鍵酶,Zhou等[30]研究發(fā)現(xiàn)天冬氨酸轉(zhuǎn)氨酶在水稻中過表達(dá)影響種子的氮代謝和氨基酸含量;硫雙加氧酶是擬南芥基因ETHE1編碼的一種對(duì)種子胚胎和胚乳發(fā)育至關(guān)重要的酶類[31];Baleroni等[32]研究發(fā)現(xiàn)肉桂酸衍生物對(duì)甘藍(lán)型油菜種子子葉的脂肪酸和總脂質(zhì)積累有積極作用。
A:紫色(purple)模塊GO富集圈圖;B:purple模塊GO富集分析中生物過程分類前20個(gè)GO富集途徑;C:洋紅色(magenta)模塊GO富集氣泡圖。D:magenta模塊前20個(gè)GO富集途徑。Z值表示某個(gè)基因集合在特定生物過程或功能方面的顯著性程度。圖4 目標(biāo)模塊GO富集分析Fig.4 Target module GO enrichment analysis
magenta模塊含有1 114個(gè)基因,分布在19條染色體上,各染色體基因數(shù)目為23~127。與purple模塊相反,magenta模塊基因在大粒品種中雙11中表達(dá)豐度顯著高于中油821(圖3C)。對(duì)模塊基因進(jìn)行GO富集分析,共富集到521個(gè)顯著GO term。圖4C和圖4D展示的是magenta模塊中生物學(xué)過程、分子功能和細(xì)胞組分三大類TOP 20 GO通路氣泡圖,其中核酸代謝過程、雜環(huán)代謝過程、細(xì)胞氮化合物代謝過程、細(xì)胞芳香族化合物代謝過程等代謝通路被顯著富集。這些通路的基因參與了種子的發(fā)育過程,如在模式植物擬南芥中,焦磷酸酶的表達(dá)促進(jìn)種子中蛋白質(zhì)和油類物質(zhì)的合成,UPF1RNA解旋酶參與調(diào)控種子大小[33-34]。
基于中雙11基因組注釋信息,在Bn-A09-p29991443位點(diǎn)下游0.17 Mb和0.18 Mb處分別找到油菜角果長(zhǎng)和籽粒質(zhì)量已知基因ARF18和CYP78A9。ARF18編碼1個(gè)生長(zhǎng)素響應(yīng)因子,CYP78A9編碼1個(gè)細(xì)胞色素P450單加氧酶,兩者均通過促進(jìn)油菜角果伸長(zhǎng)進(jìn)而影響籽粒質(zhì)量[35-36]。
根據(jù)Darmor基因組的注釋信息,在Bn-A02-p6564861位點(diǎn)上游約0.100 Mb處找到候選基因BnaA02g07770D,其擬南芥同源基因AT5G58230(MSI1)為擬南芥的母性效應(yīng)胚胎滯育基因,在植物胚乳和胚胎發(fā)生過程中起作用,直接影響后期種子的生長(zhǎng)發(fā)育,從而導(dǎo)致籽粒質(zhì)量改變[37]。在位點(diǎn)Bn-A06-p19593266上游約0.695 Mb處找到候選基因BnaA06g21460D,其擬南芥同源基因AT5G62000(ARF2)通過限制種皮細(xì)胞增殖影響籽粒大小[38]。在Bn-A01-p15496639位點(diǎn)上游0.635 Mb處找到候選基因BnaA01g20420D,其擬南芥同源基因AT3G48610編碼1個(gè)非特異性磷脂酶NPC6,過表達(dá)NPC6能顯著提高亞麻薺的籽粒質(zhì)量、含油量和單株產(chǎn)量[39]。在Bn-A03-p8851142位點(diǎn)上游0.122 Mb處找到候選基因BnaA03g17130D,其擬南芥同源基因AT2G37260(TTG2)編碼的WRKY轉(zhuǎn)錄因子表達(dá)于種皮中,通過增加種皮的細(xì)胞延伸從而促進(jìn)種子的生長(zhǎng)發(fā)育[40]。在Bn-A07-p11611255位點(diǎn)上游0.115 Mb處找到候選基因BnaA07g16350D,其擬南芥同源基因AT3G54320(WRI1)編碼1個(gè)AP2/ERWEBP類轉(zhuǎn)錄因子,通過增大種子體積和參與貯藏化合物的生物合成以增加種子質(zhì)量[41]。此外,還找到其他16個(gè)候選基因,包括擬南芥中已知籽粒質(zhì)量調(diào)控基因CLV3、AHK4、FIS1、GLN1;1、TCTP1、FER、CKX1、EOD1、AHK2等在油菜中的同源拷貝(表3)。
表3 籽粒質(zhì)量候選基因信息
利用軟件Cytoscape對(duì)purple和magenta模塊中的基因網(wǎng)絡(luò)進(jìn)行可視化表達(dá)(圖5)。在purple模塊中,根據(jù)|KME|≥0.90的標(biāo)準(zhǔn)篩選出340個(gè)樞紐基因。樞紐基因BnaA06g00850D(KME=0.97)的擬南芥同源基因AT1G53580(ETHE1)編碼1個(gè)硫雙加氧酶,調(diào)節(jié)種子中的硫化物水平,在種子胚胎和胚乳發(fā)育過程中發(fā)揮重要作用[31]。 樞紐基因BnaA01g00990D(KME=0.92)的擬南芥同源基因?yàn)樽蚜Y|(zhì)量已知基因AT4G36860(DAR1)(表4),DAR1屬于泛素結(jié)合蛋白家族,通過限制珠被的細(xì)胞增殖從而控制種子大小和籽粒質(zhì)量[42]。樞紐基因BnaC06g10000D(KME=0.91)的擬南芥同源基因AT5G37600(GLN1;1)編碼1種胞質(zhì)谷氨酰胺合成酶,在種子萌發(fā)和灌漿過程中起到?jīng)Q定作用,影響種子胚乳的發(fā)育從而控制籽粒質(zhì)量[43]。此外,purple模塊還包含擬南芥籽粒質(zhì)量已知基因TTN5和SKP1等在油菜中的同源拷貝?;虮磉_(dá)量熱圖(圖6)顯示,這些基因在中雙11中表達(dá)量很低,而在中油821中表達(dá)量較高,特別是在開花后第7 d、10 d和14 d的籽粒和角果皮中,但在成熟的籽粒中表達(dá)量顯著降低,表明它們?cè)谧蚜G捌诎l(fā)育中發(fā)揮作用。
表4 Purple和magenta模塊包含的籽粒質(zhì)量已知基因
A:purple模塊內(nèi)基因共表達(dá)網(wǎng)絡(luò);B:magenta模塊內(nèi)基因共表達(dá)網(wǎng)絡(luò)。圖5 Purple和magenta模塊的基因共表達(dá)網(wǎng)絡(luò)Fig.5 Gene co-expression network of purple and magenta modules
a:中油821_角果皮_14 d;b:中油821_角果皮_10 d;c:中油821_角果皮_7 d;d:中油821_種子_45 d;e:中油821_種子_14 d;f:中油821_角果皮_10 d;g:中油821_種子_7 d;h:中雙11_角果皮_14 d;i:中雙11_角果皮_10 d;j:中雙11_角果皮_7 d;k:中雙11_種子_45 d;l:中雙11_種子_14 d;m:中雙11_種子_10 d;n:中雙11_種子_7 d。圖6 Purple和magenta模塊內(nèi)的基因表達(dá)量熱圖Fig.6 Heatmap of gene expression in purple and magenta modules
在magenta模塊中,根據(jù)|KME|≥0.90的標(biāo)準(zhǔn)共篩選到149個(gè)模塊樞紐基因,其中樞紐基因BnaC02g44260D(KME=0.96)的擬南芥同源基因?yàn)樽蚜Y|(zhì)量已知基因AT5G19400(SMG7)(表4),編碼減數(shù)分裂所必需的蛋白質(zhì)SMG7,SMG7的缺失會(huì)引起染色體去密集化和減數(shù)分裂紡錘體的異常重排,從而導(dǎo)致胚死亡,影響籽粒發(fā)育[44],BnaC02g44260D在C09染色體的同源基因BnaC9.SMG7b也已被報(bào)道影響油菜每角粒數(shù)、籽粒質(zhì)量等性狀[45]。模塊基因BnaC08g18690D的擬南芥同源基因?yàn)樽蚜Y|(zhì)量已知基因AT1G19270(DA1),編碼1個(gè)泛素受體,在調(diào)節(jié)胚乳種皮細(xì)胞再?gòu)?fù)制中發(fā)揮作用。在甘藍(lán)型油菜中降低DA1的表達(dá)量可以提高種子產(chǎn)量和生物量[46]。模塊基因BnaA06g14090D、BnaA05g14370D和BnaC09g05450D共同對(duì)應(yīng)的擬南芥同源基因?yàn)锳T5G62000(ARF2),通過限制種皮細(xì)胞增殖而影響籽粒大小[38]。此外,magenta模塊還包含擬南芥籽粒質(zhì)量已知基因GLN1;2、RPT2A和BRM等在油菜中的同源拷貝?;虮磉_(dá)量熱圖(圖6)顯示,這些基因在中油821中表達(dá)量很低,而在中雙11中表達(dá)量較高。在角果皮中,它們的表達(dá)量隨著籽粒發(fā)育進(jìn)程逐漸降低。在籽粒中,這些基因在開花后第7 d和45 d表達(dá)量較高,而在第10 d和14 d表達(dá)量顯著降低,這表明它們?cè)谧蚜5陌l(fā)育早期和末期發(fā)揮作用。
整合GWAS和WGCNA 2種分析方法進(jìn)行分析,結(jié)果表明,在42個(gè)顯著關(guān)聯(lián)位點(diǎn)的LD置信區(qū)間內(nèi)找到90個(gè)與籽粒質(zhì)量相關(guān)的模塊基因,其中49個(gè)屬于magenta模塊,41個(gè)屬于purple模塊(表5)。對(duì)比它們的擬南芥同源基因功能注釋,發(fā)現(xiàn)部分基因在種子的各項(xiàng)發(fā)育過程中起著決定性作用。在A01染色體位點(diǎn)Bn-A01-p3061223下游0.120 Mb處找到magenta模塊基因BnaA01g06210D,其擬南芥同源基因AT4G30930(NFD1)編碼1個(gè)定位在線粒體的核糖體蛋白質(zhì),基因突變后影響雌雄配子的發(fā)育[47]。在A07染色體位點(diǎn)Bn-A02-p305007下游0.170 Mb處找到magenta模塊基因BnaA07g14990D,其擬南芥同源基因AT5G40480(EMB3012)與胚發(fā)育缺陷相關(guān),基因在種子和胚中表達(dá)量較高[48]。在A07染色體位點(diǎn)Bn-A10-p11601681下游0.06 Mb處找到purple模塊基因BnaA07g03030D,其擬南芥同源基因AT2G17800(ROP3)編碼1個(gè)GTP結(jié)合蛋白質(zhì),參與生長(zhǎng)素激活的Aux/IAA蛋白質(zhì)水解途徑,基因功能突變后導(dǎo)致胚發(fā)育異常[49]。在C03染色體位點(diǎn)Bn-scaff_26320_1-p269450下游0.14 Mb處找到magenta模塊基因BnaC03g46120D,其擬南芥同源基因AT3G01610(CDC48C)參與細(xì)胞分裂循環(huán),與胚發(fā)育缺陷有關(guān)[50]。
表5 顯著關(guān)聯(lián)位點(diǎn)置信區(qū)間內(nèi)的magenta和purple模塊基因
A-D test是一種非參數(shù)統(tǒng)計(jì)模型,利用中值替換均值,解決了關(guān)聯(lián)分析中基因型分布不均勻造成的偏差,提高了檢測(cè)精度[51]。相較于其他模型,A-D test模型對(duì)于效應(yīng)小、數(shù)據(jù)非正態(tài)分布的基因尤其有效。本研究對(duì)A-D Test設(shè)置了嚴(yán)格的顯著性閾值(閾值=0.01/總標(biāo)記數(shù)),檢測(cè)到19個(gè)顯著位點(diǎn),其中14個(gè)位點(diǎn)在至少2個(gè)環(huán)境中被重復(fù)檢測(cè)到,4個(gè)位點(diǎn)在3個(gè)環(huán)境中均被重復(fù)檢測(cè)到。與另外2個(gè)模型的結(jié)果比較,8個(gè)位點(diǎn)與GLM重疊,2個(gè)位點(diǎn)與MLM重疊。同時(shí),本研究在6個(gè)A-D test顯著位點(diǎn)置信區(qū)間內(nèi)找到ARF18、AHK4、FIS1、GLN1;1和ARF2等擬南芥已知籽粒質(zhì)量基因的同源基因。這些結(jié)果證實(shí)了A-D test模型的準(zhǔn)確性和可靠性。合并3個(gè)模型結(jié)果共得到71個(gè)顯著位點(diǎn),挖掘出ARF2、NPC6、TTG2、WRI1和CLV3等23個(gè)擬南芥已知籽粒質(zhì)量基因的同源基因。同時(shí),Bn-A06-p23674542(-lgP=5.97~7.14)等位點(diǎn)在多個(gè)環(huán)境和多個(gè)模型中被檢測(cè)到,但置信區(qū)間內(nèi)尚未找到籽粒質(zhì)量已知基因,后續(xù)可作為研究重點(diǎn)進(jìn)行深入探究。
隨著測(cè)序技術(shù)的發(fā)展,利用共表達(dá)網(wǎng)絡(luò)對(duì)轉(zhuǎn)錄組進(jìn)行系統(tǒng)研究,是目前比較流行的分析方法。WGCNA能夠聚類表達(dá)模式相似的基因,構(gòu)建與目標(biāo)性狀關(guān)聯(lián)、具有生物學(xué)意義的共表達(dá)模塊,進(jìn)而挖掘共表達(dá)網(wǎng)絡(luò)中的關(guān)鍵基因。在本研究中,我們利用大粒品種中雙11和中小粒品種中油821的28份轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行WGCNA,挖掘到purple和magenta 2個(gè)模塊與籽粒質(zhì)量表型顯著相關(guān)。2個(gè)模塊基因顯著富集條目包括苯丙氨酸氨基轉(zhuǎn)移酶活性、硫雙加氧酶活性、肉桂酸生物合成和焦磷酸酶活性等,這些酶活性在種子生長(zhǎng)發(fā)育過程中都起到重要作用。2個(gè)模塊的樞紐基因如BnaA06g00850D、BnaA01g00990D、BnaA07g36220D和BnaC06g10000D等擬南芥同源基因ETHE1、DAR1、TTN5和GLN1;1等已被報(bào)道參與籽粒質(zhì)量調(diào)控,magenta模塊樞紐基因BnaC02g44260D是油菜已克隆每角粒數(shù)、籽粒質(zhì)量調(diào)控基因BnaC9.SMG7b在C02染色體的同源拷貝。這些結(jié)果證實(shí)了通過WGCNA挖掘油菜籽粒質(zhì)量性狀調(diào)控基因的可行性和可靠性。
GWAS分析的難點(diǎn)之一是在顯著位點(diǎn)置信區(qū)間內(nèi)高效鑒定候選基因,而WGCNA能夠特異地篩選出與目標(biāo)性狀關(guān)聯(lián)的差異表達(dá)基因,2種分析方法具有很好的互補(bǔ)性。Farber[52]首次結(jié)合GWAS和WGCNA挖掘調(diào)控骨密度的相關(guān)基因,對(duì)關(guān)聯(lián)候選基因構(gòu)建共表達(dá)網(wǎng)絡(luò),挖掘到3個(gè)與性狀顯著相關(guān)的基因模塊。在油菜的研究中,越來越多的研究者也采取相同策略,如王艷花等[53]結(jié)合GWAS和WGCNA 2種方法篩選出調(diào)控油菜生物產(chǎn)量的候選基因BnA07g19320D、BnC03g33610D和BnC03g73810D等,鮮小華等[20]結(jié)合GWAS和WGCNA 2種方法挖掘出甘藍(lán)型油菜黃籽候選基因BnATCAD4、BnF3H和BnANS等。在本研究中,我們?cè)?2個(gè)顯著位點(diǎn)的置信區(qū)間內(nèi)找到90個(gè)屬于2個(gè)目標(biāo)模塊(purple模塊和magenta模塊)的基因。盡管這些基因尚未被報(bào)道直接參與籽粒質(zhì)量調(diào)控,但它們?cè)诖罅F贩N中雙11和中小粒品種中油821的籽粒中表達(dá)豐度不同,部分基因如BnaA01g06210D、BnaA07g14990D、BnaA07g03030D等直接或間接調(diào)節(jié)種子、胚胎等相關(guān)發(fā)育進(jìn)程,后續(xù)工作可以深入挖掘這些基因在籽粒質(zhì)量調(diào)控中的具體功能。
本研究利用A-D Test模型對(duì)496份油菜的籽粒質(zhì)量進(jìn)行GWAS分析,共檢測(cè)到19個(gè)顯著位點(diǎn)。整合前期MLM和GLM模型結(jié)果后共得到71個(gè)位點(diǎn),聯(lián)合解釋50.1%的表型變異。在21個(gè)關(guān)聯(lián)位點(diǎn)置信區(qū)間內(nèi)找到SMG7、ARF2、NPC6、TTG2、WRI1等油菜、擬南芥中已被報(bào)道的籽粒質(zhì)量基因的同源基因。利用大粒品種中雙11和中小粒品種中油821的28份轉(zhuǎn)錄組數(shù)據(jù),構(gòu)建了13個(gè)共表達(dá)模塊,其中magenta和purple模塊與籽粒質(zhì)量表型相關(guān)性最高。在2個(gè)目標(biāo)模塊中挖掘出BnaA06g00850D、BnaA01g00990D、BnaC06g10000D、BnaC02g44260D和BnaC08g18690D等籽粒質(zhì)量候選基因。整合GWAS和WGCNA的分析結(jié)果,在42個(gè)顯著位點(diǎn)的置信區(qū)間內(nèi)找到90個(gè)屬于2個(gè)籽粒質(zhì)量相關(guān)的模塊基因,其中BnaA01g06210D、BnaA07g14990D和BnaA07g03030D等參與調(diào)控種子、胚胎等相關(guān)發(fā)育進(jìn)程;同時(shí),A-D Test挖掘的多個(gè)大效應(yīng)位點(diǎn)如Bn-A06-p23674542等置信區(qū)間內(nèi)尚未找到與籽粒質(zhì)量相關(guān)的已知基因,值得后續(xù)深入挖掘。