分子標(biāo)記技術(shù)在準(zhǔn)確度、精密度和產(chǎn)量方面的進(jìn)展為改良重要農(nóng)藝性狀提供了新途徑。基因組選擇是目前最有希望加速新基因型開發(fā)和利用的育種方法。它使用機(jī)器學(xué)習(xí)對(duì)訓(xùn)練群體進(jìn)行建模,將給定性狀的表型數(shù)據(jù)與分子標(biāo)記結(jié)合起來(lái),從而識(shí)別具有改進(jìn)性狀(如生長(zhǎng))的優(yōu)良基因型。進(jìn)一步,性狀模型被用于預(yù)測(cè)已被基因分型但表型未知的試驗(yàn)群體中,根據(jù)植株的基因型估計(jì)基因組估計(jì)育種值(圖1a)。提高全基因組選擇的精確度可以大大縮短育種周期。然而,能否提高全基因組選擇的準(zhǔn)確性,尤其是跨環(huán)境預(yù)測(cè)的準(zhǔn)確性,仍然是個(gè)未知數(shù)。
盡管全基因組選擇通過統(tǒng)計(jì)檢驗(yàn)估計(jì)了分子標(biāo)記的效應(yīng),但它并沒有整合可植物的細(xì)胞網(wǎng)絡(luò)信息。代謝物是遺傳調(diào)控途徑最下游物質(zhì),直接參與到植物的生長(zhǎng)發(fā)育中。代謝反應(yīng)將營(yíng)養(yǎng)物質(zhì)轉(zhuǎn)化為生長(zhǎng)發(fā)育所需物質(zhì),直接影響植物表型。因此代謝網(wǎng)絡(luò)模型研究被越來(lái)越多的應(yīng)用到植物研究中。代謝網(wǎng)絡(luò)模型包括所有已知的影響生長(zhǎng)的代謝酶功能。目前,植物代謝模型主要被用于研究:(i)通過主要途徑預(yù)測(cè)反應(yīng)速率,(ii)研究調(diào)控途徑的影響,(iii)估計(jì)營(yíng)養(yǎng)缺乏對(duì)生長(zhǎng)的影響,以及(iv)比較不同類型的光合作用。
近日,來(lái)自德國(guó)波茲坦大學(xué)生物化學(xué)與生物學(xué)研究所,馬克斯·普朗克分子植物生理學(xué)研究所的Zoran Nikoloski團(tuán)隊(duì)在Nature Communications雜志上在線發(fā)表了題為“Integrating molecular markers into metabolic models improves genomic selection for Arabidopsis growth”的研究論文。該研究提出一種結(jié)合分子標(biāo)記和代謝模型的方法,該方法能夠顯著提高擬南芥生長(zhǎng)特性的全基因組選擇的準(zhǔn)確性。
該研究重點(diǎn)關(guān)注植物生長(zhǎng)這一農(nóng)藝性狀上,而植物的生長(zhǎng)在很大程度上取決于可用營(yíng)養(yǎng)物質(zhì)轉(zhuǎn)化為生物量組成部分的速率。該研究證明,代謝反應(yīng)速率是一個(gè)多基因性狀,可由全基因選擇模型預(yù)測(cè),并且可估計(jì)給定基因型的生長(zhǎng)。為進(jìn)一步提高預(yù)測(cè)的準(zhǔn)確性,作者提出了一種基于網(wǎng)絡(luò)的全基因組選擇(netGS)方法,該方法使用代謝模型,并提高了經(jīng)典GS對(duì)環(huán)境內(nèi)和環(huán)境間生長(zhǎng)的預(yù)測(cè)精度(圖1b)。與現(xiàn)有67份材料的經(jīng)典全基因組選擇結(jié)果相比,新方法在最優(yōu)氮含量和低氮處理情況下的生長(zhǎng)預(yù)測(cè)準(zhǔn)確率分別提高了32.6%和51.4%,從最佳氮環(huán)境轉(zhuǎn)移到低碳環(huán)境下的生長(zhǎng)預(yù)測(cè)準(zhǔn)確率提高了50.4%。這些結(jié)果表明,將分子標(biāo)記整合到代謝模型中,為預(yù)測(cè)與代謝直接相關(guān)的性狀提供了一種方法,并且可以通過收集作物中的匹配數(shù)據(jù)集來(lái)檢驗(yàn)其在育種中的實(shí)用性。