国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

葫蘆科作物基因組學研究進展

2023-06-07 03:44:26閆晉強晏石娟謝大森劉文睿
廣東農(nóng)業(yè)科學 2023年4期
關(guān)鍵詞:葫蘆科甜瓜黃瓜

江 彪,閆晉強,晏石娟,謝大森,劉文睿,王 敏

(1.廣東省農(nóng)業(yè)科學院蔬菜研究所/廣東省蔬菜新技術(shù)研究重點實驗室,廣東 廣州 510640;2.廣東省農(nóng)業(yè)科學院農(nóng)業(yè)生物基因研究中心,廣東 廣州 510640)

葫蘆科(Cucurbitaceae)是世界上最重要的食用植物科之一,有95 個屬900 多個種,其重要性僅次于禾本科、豆科和茄科,位居植物界第四。據(jù)聯(lián)合國糧食及農(nóng)業(yè)組織(Food and Agriculture Organization of the United Nations,F(xiàn)AO)2019 年統(tǒng)計顯示,世界葫蘆科作物的栽培面積約400 萬hm2,年產(chǎn)值約3 000 億元。葫蘆科包含許多重要作物,包括黃瓜(Cucumis sativus)、甜瓜(Cucumis meloL.)、西瓜(Citrullus lanatus)、南瓜(Cucurbitaspp.)、冬瓜(Benincasa hispida)、絲瓜(Luffa aegyptiaca)、苦瓜(Momordica charantiaL.)等常見的蔬菜和瓜果,在農(nóng)業(yè)生產(chǎn)和人民生活中均占有舉足輕重的地位[1-2]。葫蘆科作物不僅是人們重要的飲食來源,許多還具有獨特的食療保健價值。冬瓜富含丙醇二酸,可抑制人體內(nèi)糖轉(zhuǎn)化為脂肪,能有效防止體內(nèi)脂肪堆積,對于腎病、高血壓、浮腫患者大有益處[3]。苦瓜富含皂苷,具有明顯的降血糖、減肥、抗氧化等多種藥理作用[4-7]。

全基因組測序,就是一次性測定一個生物體基因組全部DNA 序列的過程。自2004 年以來,以Illumina 邊合成邊測序為代表的高通量測序技術(shù)逐漸發(fā)展成熟,測序通量大幅提升、成本急劇下降,其大規(guī)模商業(yè)化應用促成數(shù)以千計的生物體完成了全基因組測序[8]。近年來,以Pacific Biosciences 單分子實時測序和Nanopore 納米孔測序為代表的長讀長測序技術(shù)得到快速發(fā)展,為基因組從頭組裝以及結(jié)構(gòu)變異檢測、泛基因組學研究等提供了極大便利[9]。

基因組從頭組裝(de novo assembly)是指在不需要任何參考序列的情況下,將生物體基因組測序產(chǎn)生的序列進行拼接、組裝,從而繪制該生物體的全基因組序列信息?;蚪M從頭組裝過程,可簡單描述為測序片段(reads)組裝形成重疊群(contig)、重疊群連接產(chǎn)生支架片段(scaffold),最后再借助遺傳圖譜、光學圖譜等進行錨定產(chǎn)生染色體(chromosome)?;蚪M從頭組裝的核心算法主要可以分為幾類:基于貪婪算法(Greedyextention)、基于Overlap-Layout-Consensus(OLC)、基于de Bruijn Graph,以及上述兩種或多種算法的組合[10]。在這些算法的基礎上,大量研究者開發(fā)出多種適用于不同測序平臺的組裝軟件和流程,如適用于Illumina 測序平臺的Velvet、SOAPdenovo、ABySS 等[11],以及針對長讀長測序或者混合測序數(shù)據(jù)的Canu、Flye、Hifiasm 等[12]。隨著測序技術(shù)、組裝算法的不斷發(fā)展,組裝質(zhì)量也不斷提升,越來越多的生物體基因組測序?qū)崿F(xiàn)了染色體水平組裝。截至目前,葫蘆科作物中的黃瓜、甜瓜、西瓜、南瓜、苦瓜、葫蘆、冬瓜、絲瓜、蛇瓜、佛手瓜等均完成了全基因組測序(表1),顯著提升了葫蘆科作物基因組學、系統(tǒng)進化和分子生物學等領(lǐng)域的研究水平[13-14]。本文簡要回顧了葫蘆科主要作物的全基因組測序進展,并總結(jié)歸納了全基因組測序在葫蘆科作物起源與進化關(guān)系、重要農(nóng)藝性狀基因挖掘等方面的實際應用,旨在為葫蘆科作物基因組學相關(guān)研究提供重要的參考依據(jù)。

表1 已測序葫蘆科作物基因組列表Table 1 List of genome-sequenced Cucurbitaceae crops

1 葫蘆科作物基因組測序

1.1 黃瓜基因組測序

1.1.1 栽培黃瓜 黃瓜(Cucumis sativus,2n=2x=14)起源于喜馬拉雅南麓的熱帶雨林地區(qū),是國際上最重要的蔬菜作物之一,也是分子生物學研究的重要模式作物。在葫蘆科作物中,黃瓜的染色體數(shù)最少,其基因組大小約376 Mb[15]。2007年初,中國農(nóng)業(yè)科學院蔬菜花卉研究所發(fā)起國際黃瓜基因組計劃,這是我國發(fā)起并主導的第一個大型植物基因組計劃。該研究利用Sanger 測序方法對華北密刺類型黃瓜高代自交系9930 進行全基因組測序,測序深度為72.2×,組裝獲得的基因組為243.5 Mb,約占其基因組的66.3%。在黃瓜基因組中共預測26 682 個蛋白編碼基因,每個基因的長度平均為1 046 bp,其中20 000 多個基因被定位到染色體上[16]?;?930 參考基因組,Qi 等[17]從世界范圍內(nèi)3 342 份黃瓜種質(zhì)資源中篩選出115 份核心種質(zhì),并對其進行深度重測序,構(gòu)建了一張包含360 多萬個位點的全基因組遺傳變異圖譜;在遺傳變異圖譜中共鑒定到112 個假定的馴化區(qū)段,其中1 個區(qū)段含有1 個與果實苦味丟失有關(guān)的基因,丟失苦味是黃瓜重要的馴化特征。此外,通過研究栽培群體之間的基因組差異,Qi 等[17]在β-胡蘿卜素羥化酶基因中發(fā)現(xiàn)1 個自然變異,可用于培育營養(yǎng)價值更高的黃瓜品種。

隨后,學者們陸續(xù)完成不同品系黃瓜的基因組測序。美國威斯康星大學麥迪遜分校以典型北美加工類型黃瓜品系Gy14 為材料,利用Roche 454 平臺,采用從頭測序策略進行基因組測序,測序深度為36×,組裝獲得4 219 個scaffolds,其基因組序列總長為203.0 Mb[18]。Wóyciki 等[19]以北歐Borszczagowski 品種B10 為材料,利用Sanger 測序方法進行全基因組測序,組裝獲得247 Mb 的基因組序列。為提高Gy14 基因組質(zhì)量,Yang 等[20]將173.1 Mb 的Gy14 基因組和193.3 Mb 的9930 基因組掛載到同一個遺傳圖譜上,利用9930 基因組的scaffold 填補Gy14 基因組中相鄰scaffolds 間的空隙,最終獲得192.6 Mb 的Gy14基因組(占基因組的53.0%),其中19.5 Mb 的序列來源于9930 的基因組序列。

1.1.2 哈氏黃瓜 哈氏黃瓜(C.sativusvar.hardwickii,2n=2x=14)是目前公認的栽培黃瓜的野生祖先,具有較好的抗逆和抗病蟲能力[21]。Qi等[17]以哈氏黃瓜PI183967(CG0002)為材料,利用Illumina 測序技術(shù)進行從頭測序,共組裝獲得204.8 Mb 基因組序列,其scaffold N50 為4.2 Mb,并預測了23 836 個蛋白編碼基因。通過與9930基因組進行對比,共鑒定到21 021 個直系同源基因[17]。

1.1.3 酸黃瓜 酸黃瓜(C.hystrixChakr.,2n=2x=24)是黃瓜的野生近緣種,具有耐低溫弱光、高抗霜霉病、抗線蟲等優(yōu)良性狀[22-25]。酸黃瓜基因組約為416 Mb,大于黃瓜基因組,但小于甜瓜基因組[26]。Qin 等[26]利用Illumina 測序平臺完成酸黃瓜全基因組測序,組裝獲得的基因組約為289 Mb,預測了23 864 個蛋白編碼基因。通過全面的比較基因組分析發(fā)現(xiàn),與甜瓜相比,酸黃瓜在系統(tǒng)發(fā)育上與黃瓜更為接近,為酸黃瓜與黃瓜成功雜交奠定了分子基礎。此外,Qin 等[26]還發(fā)現(xiàn)酸黃瓜基因組中富含“防御響應”基因,共有104 個編碼抗病基因類似物的核苷酸結(jié)合位點。

1.1.4 刺角瓜 刺角瓜(C.metuliferus,2n=2x=24)又名非洲角黃瓜,是黃瓜屬野生種,具有較強的抗病蟲害能力。刺角瓜基因組約368 Mb,Ling等[27]以CM27(PI482460)為材料,利用PacBio SMART 測序平臺進行全基因組從頭測序,測序深度為93×,組裝獲得329 Mb 的基因組序列,其N50 序列長度為2.9 Mb,共預測了29 214 個蛋白編碼基因。隨后,通過Hi-C 組裝和人工校正,共有316.82 Mb 的CM27 基因組序列被掛載到12條染色體上[27]。系統(tǒng)發(fā)育分析結(jié)果表明,刺角瓜與甜瓜的分化時間在1 780 萬年以前,通過刺角瓜與甜瓜基因組之間的比較,發(fā)現(xiàn)這兩個物種的8 條染色體存在較大的結(jié)構(gòu)變異[27]。

1.2 甜瓜基因組測序

甜瓜(Cucumis meloL .)是第二個完成基因組測序的葫蘆科作物,其染色體數(shù)目為2n=2x=24,基因組大小約為450 Mb[28]。2012年,西班牙農(nóng)業(yè)基因組研究中心以甜瓜雙單倍體DHL92 為材料,采用羅氏454 平臺進行全基因組測序,測序深度為13.52×,組裝獲得1 594 個scaffolds,序列總長為375.0 Mb(v3.5.1)[29]。其scaffold N50 為4.68 Mb,且最長的78 個scaffolds序列總長占組裝基因組的90%,表明該基因組的質(zhì)量較好。該基因組共預測27 427 個蛋白編碼基因,每個基因的平均長度為2 776 bp、外顯子為5.85 個[24]。隨著生物信息學技術(shù)的不斷發(fā)展,Ruggieri 等[30]對DHL92基因組進行重新組裝和注釋,發(fā)布了序列信息更完整、注釋信息更全面的參考基因組v3.6.1 版本,新基因組在基因結(jié)構(gòu)完整性、UTR 區(qū)域界線等方面均得到明顯提升。

2019 年,韓國學者發(fā)布了薄皮甜瓜(C.meloL.var.makuwa)Chang Bougi 和SW3 的基因組序列[31]。其中Chang Bougi 是韓國地方甜瓜品種,組裝的基因組為344 Mb,scaffold N50 為1.0 Mb,預測了36 235 個蛋白編碼基因。SW3 是來源于農(nóng)友生物公司(NongWoo Bio Company)的高品質(zhì)材料,其組裝的基因組為354 Mb,scaffold N50 達到1.6 Mb,預測了38 173 個蛋白編碼基因[31]。此外,Ling 等[27]以北京薄皮甜瓜地方種IVF77 為材料,組裝獲得染色體水平的參考基因組,其測序深度為84×,組裝獲得364 Mb 的基因組,其中339.72 Mb 的基因組掛載到12 條染色體上,并預測了27 073 個蛋白編碼基因。薄皮甜瓜參考基因組的繪制,為其果實發(fā)育、抗病機理及品種選育等研究奠定了基礎。

為探明甜瓜的遺傳基礎和馴化歷史,中國農(nóng)業(yè)科學院鄭州果樹研究所聯(lián)合國內(nèi)外單位,構(gòu)建了世界上第一個甜瓜全基因組變異圖譜[32]。該研究分析了1 175 份甜瓜種質(zhì)資源的基因組變異,共鑒定了560 萬個SNP;在此基礎上,發(fā)現(xiàn)甜瓜可能發(fā)生過3 次獨立的馴化事件,一次發(fā)生在非洲地區(qū),另外兩次發(fā)生在亞洲地區(qū),并分別產(chǎn)生厚皮甜瓜和薄皮甜瓜兩個栽培亞種;同時,通過全基因組關(guān)聯(lián)分析(Genome wide association study,GWAS)等手段,定位了200 余個與甜瓜苦味、酸味、果實大小、果肉顏色等性狀相關(guān)的候選基因和位點[32]。東北農(nóng)業(yè)大學甜瓜團隊進一步研究發(fā)現(xiàn),同為栽培類型的地方品種和改良品種在群體結(jié)構(gòu)和進化方面存在明顯差異,提出野生材料-地方品種-改良品種的“Two-step”獨立馴化模式,并結(jié)合選擇壓力分析和全基因組關(guān)聯(lián)分析鑒定到8 個影響果實性狀的改良位點[33]。

1.3 西瓜基因組測序

西瓜(Citrullus lanatus)是世界性重要水果之一,其染色體數(shù)目為2n=2x=22,基因組大小約為425 Mb[28]。Guo 等[34]以東亞西瓜品種97103為材料,利用Illumina 測序技術(shù)獲得46.18 Gb 的高質(zhì)量基因組,測序深度達到108.6×,通過從頭組裝產(chǎn)生353.5 Mb 的基因組(97103v1),占其基因組的83.2%,共預測了23 440 個蛋白編碼基因。組裝的基因組由1 793 個scaffolds 構(gòu)成,其scaffold N50 長度為2.38 Mb,其中234 個scaffolds掛載到西瓜11 條染色體上,其序列總長約為330 Mb(占組裝基因組的93.5%)。通過對3 個不同西瓜亞種的20 份種質(zhì)進行重測序,獲得多個單倍型,確定了西瓜種質(zhì)的遺傳多樣性和種群結(jié)構(gòu),并鑒定了在馴化過程中有限選擇的基因組區(qū)域[34]。

Guo 等[35]進一步利用PacBio 測序平臺對西瓜品種97103 進行長讀長測序,結(jié)合BioNano 光學圖譜和Hi-C 染色體構(gòu)象捕獲技術(shù),繪制了全新一代西瓜高質(zhì)量基因組精細圖譜(97103v2)。組裝的基因組大小為365.1 Mb,scaffold N50 為21.9 Mb,預測了22 596 個蛋白編碼基因。其中31 個scaffolds 構(gòu)成11 條染色體,共362.7 Mb,覆蓋西瓜組裝基因組的99.3%。同時,Guo 等[35]還對414 份代表西瓜屬所有現(xiàn)存物種的材料進行全基因組重測序,通過系統(tǒng)進化分析首次明確西瓜7 個種之間的進化關(guān)系,發(fā)現(xiàn)野生黏籽西瓜是與現(xiàn)代栽培西瓜親緣關(guān)系最近的種群;該研究同時發(fā)現(xiàn)了利用野生西瓜進行抗性改良的基因組痕跡,獲得與果實含糖量、瓤色、形狀等性狀關(guān)聯(lián)的43 個信號位點,并鑒定了關(guān)鍵候選基因[35]。

為補充現(xiàn)有參考基因組(97103),Wu 等[36]以美國西瓜栽培種Charleston Gray 為材料,利用Illumina 測序技術(shù)進行全基因組測序,測序深度為228×,組裝獲得396.4 Mb 基因組序列,約占其基因組的94.6%。進一步對美國國家植物種質(zhì)資源系統(tǒng)中保存的1 365 份西瓜種質(zhì)進行測序分型(Genotyping-by-Sequencing,GBS),將其分為栽培西瓜、黏籽西瓜和飼用西瓜3 個物種,并從GBS 數(shù)據(jù)中獲得大約25 000 個高質(zhì)量SNPs[36]。此外,為深入了解從祖先到馴化西瓜的遺傳變化,Renner 等[37]以Kordofan melon 為材料,利用PacBio 測序結(jié)合Illumina 測序以及Hi-C 繪圖技術(shù)進行全基因組測序,測序深度約388.8×,組裝的基因組包含86 個contigs,總長度為367.9 Mb,N50 為9.34 Mb,并預測了23 043 個蛋白編碼基因。在Kordofan melon 和栽培西瓜97103 之間共檢測到15 824 個基因組結(jié)構(gòu)變異(Structure Variantions,SVs),并在超過400 份西瓜種質(zhì)中定位到這些SVs,揭示了等位基因在進化過程中的頻率變化[37]。

然而,以上參考基因組仍然有許多缺口。2022 年,北京大學現(xiàn)代農(nóng)業(yè)研究院等單位以小果型西瓜自交系G42 為材料,利用PacBio HiFi 和ONT 數(shù)據(jù),結(jié)合多種組裝策略,完成了端粒到端粒(Telomere-to-Telomere,T2T)無缺口的高質(zhì)量基因組圖譜[38]。組裝的基因組總長度為369.3 Mb,預測了24 205 個蛋白編碼基因,解析了全部22 個端粒和11 個著絲粒序列信息,同時填補了97103v2 參考基因組所有的220 個缺口[38]。

1.4 南瓜基因組測序

南瓜(2n=2x=40)原產(chǎn)于墨西哥到中美洲一帶,在世界范圍內(nèi)普遍種植,包括中國南瓜(Cucurbita maxima)、印度南瓜(C.moschata)、西葫蘆(C.pepo)等栽培種[39]。2017 年,中國國家蔬菜工程技術(shù)研究中心和美國博伊斯湯普森研究所(BTI)專家合作完成了中國南瓜(基因組約372.0 Mb)和印度南瓜(基因組約386.8 Mb)的全基因組從頭測序,測序深度分別為215×和283×,分別組裝獲得269.9 Mb 和271.4 Mb 的基因組序列,其scaffold N50 分別為4.0 Mb 和3.7 Mb,蛋白編碼基因為32 205 和32 076 個[40]。通過與其他瓜類的基因組序列進行進化比較,發(fā)現(xiàn)其他瓜類在形成四倍體后會失去部分祖輩基因、重新回到二倍體狀態(tài),而南瓜卻仍保留四倍體,比較完整地保存了兩種祖輩的基因,因此其染色體對數(shù)幾乎是其他瓜類的2 倍[40]。隨后,Montero-Pau 等[41]利用全基因組鳥槍測序方法完成西葫蘆(基因組約為283 Mb)全基因組從頭測序,組裝獲得263 Mb 基因組,其scaffold N50 為1.8 Mb,蛋白編碼基因共有27 870 個。盡管西葫蘆基因組較小,但是其基因組的形成經(jīng)歷了全基因組復制過程[41]。

銀籽瓜(C.argyrosperma)是南瓜屬另一種重要作物,其基因組約238 Mb[42]。2019 年,墨西哥學者利用Illumina HiSeq2000、Illumina MiSeq和PacBio RS II 等3 個測序平臺完成了銀籽瓜的全基因組從頭測序,Illumina 和PacBio 的測序深度分別為120×和31×,組裝的基因組為228.8 Mb,其蛋白編碼基因共有28 298 個[43]。葫蘆科作物的蛋白編碼基因比較和長鏈非編碼RNA(Long non-coding RNA,lincRNA)分析結(jié)果表明,南瓜全基因組復制是通過復制基因的新功能化而加快其基因家族的進化速度[43]。

1.5 苦瓜基因組測序

苦瓜(Momordica charantiaL.,2n=2x=22)是一種重要的蔬菜和藥用植物,因果實富含具有特殊苦味的三萜化合物而命名[44]??喙匣蚪M約339 Mb,Urasaki 等[45]以苦瓜自交系OHB3-1為材料,通過Illumina 測序,測序深度為110×,從頭組裝了285.5 Mb 的苦瓜基因組,其scaffold N50 為1.1 Mb,基因組覆蓋率約84%。在組裝的苦瓜基因組中,共鑒定到45 859 個蛋白編碼基因,其數(shù)量遠高于黃瓜、甜瓜、西瓜等其他葫蘆科作物[16,29,34,45]。

隨后,Cui 等[46]完成了對苦瓜栽培種Dali-11(基因組約為300 Mb)和野生材料TR(基因組約為300 Mb)的全基因組從頭測序,測序深度分別為251×和185×,從頭組裝的基因組大小分別是293.6 Mb(scaffold N50 為3.3 Mb)和296.3 Mb(scaffold N50 為0.6 Mb)。預測的蛋白編碼基因分別為26 427 個(Dali-11)和28 827 個(TR),其數(shù)量與黃瓜、西瓜、甜瓜等葫蘆科作物的蛋白編碼基因相近,但遠少于苦瓜OHB3-1 基因組中的數(shù)量[16,29,34,45-46]。進一步對從全球16 個國家收集到的187 份苦瓜種質(zhì)進行重測序,通過基因組遺傳多樣性分析,發(fā)現(xiàn)以TR為代表的21 份野生苦瓜與166 份栽培苦瓜具有顯著的遺傳分化,推測大果型栽培苦瓜charantia 來源于小果型栽培苦瓜muricata,而不是來源于野生苦瓜macroloba[46]。

2022 年10 月,F(xiàn)u 等[47]利用Illumina 測序平臺完成苦瓜變種金鈴子的基因組測序,測序深度為74.31×,組裝獲得295.6 Mb 的基因組序列。本次組裝的金鈴子基因組是一個具有高完整性和準確性的端粒至端粒的高質(zhì)量基因組,其scaffold N50 達到25.4 Mb,蛋白編碼基因為19 895 個。在金鈴子苦瓜11 條染色體中,有8 條均無gap 存在,其中6 條同時檢測到兩段的端粒信號[47]。結(jié)合轉(zhuǎn)錄組和代謝組分析,進一步揭示金鈴子果實色素積累與葫蘆素生物合成機制[47]。

1.6 葫蘆基因組測序

葫蘆(Lagenaria siceraria,2n=2x=22)起源于撒哈拉沙漠以南的非洲地區(qū),是葫蘆科重要作物,因具有較好的抗病性和耐冷性而常被用作砧木[48-49]。葫蘆的基因組約334 Mb[50],Wu 等[51]以葫蘆高代自交系USVL1VR-Ls 為材料,利用Illumina HiSeq2500 測序平臺進行全基因組從頭測序,測序深度為395×,組裝獲得313.4 Mb 的基因組序列,其N50 為8.7 Mb,共預測到22 472 個蛋白編碼基因。Wu 等[51]基于比較基因組學分析確定了葫蘆與其他葫蘆科作物直接的線性關(guān)系以及譜系特異性基因家族的擴增特點,并通過重建葫蘆科最新共同祖先的基因組,揭示葫蘆科祖先的核型由12 個原染色體和18 534 個原基因組成,且這12 個原染色體大部分保留在目前的甜瓜基因組中,而其他葫蘆科作物的基因組則經(jīng)歷了不同程度的重排事件。

1.7 冬瓜基因組測序

冬瓜(Benincasa hispidaCogn.,2n=2x=24)起源于我國南部和印度,廣泛分布于亞洲的熱帶、亞熱帶及溫帶地區(qū),是我國最重要的北運菜和度淡蔬菜之一。冬瓜是目前已知葫蘆科中基因組最大的作物,達到1.03 Gb[52]。2019 年,廣東省農(nóng)業(yè)科學院蔬菜研究所聯(lián)合中國農(nóng)業(yè)科學院蔬菜花卉研究所等國內(nèi)外單位,以黑皮冬瓜自交系B227 為材料,利用Illumina 和單分子實時(Singlemolecular real-time,SMAT)測序技術(shù)完成冬瓜全基因組從頭測序,測序深度為50×,組裝獲得913 Mb 的基因組序列,其scaffold N50 為3.4 Mb,最長scaffold 為14.5 Mb,并預測了27 467 個蛋白編碼基因[52]。通過6 個葫蘆科作物的基因組比較分析,揭示冬瓜基因組代表了最古老的核型,并預測祖先基因組擁有15 條始祖染色體。進一步完成146份核心資源的重測序,將其分成野生種(W)、地方種(L)和栽培種(C)等不同類群,其中栽培種又分黑皮冬瓜(C1)和粉皮冬瓜(C2)亞群。同時,構(gòu)建了一張包含1 600 萬個SNP 的基因組變異圖譜,發(fā)現(xiàn)冬瓜果實變大經(jīng)歷了從野生種到地方種、再到栽培種的兩步進化歷程[52]。

為豐富冬瓜參考基因組,Luo 等[53]以粉皮冬瓜自交系pf3 為材料,利用PacBio Sequel II 和Illumina NovaSeq-6000 測序平臺完成從頭測序,測序深度為230×,組裝的基因組大小為975.6 Mb,其scaffold N50 高達70.97 Mb,共預測到37 092 個蛋白編碼基因,其中85.05%的基因具有功能注釋。

1.8 絲瓜基因組測序

絲瓜(2n=2x=26)起源于印度,是一種重要的蔬菜作物,廣泛分布于溫帶和熱帶地區(qū)[54]。我國絲瓜共有2 種,即普通絲瓜(Luff a cylindrica)和有棱絲瓜(L.acutangula)。2020年,河南農(nóng)業(yè)大學以普通絲瓜(基因組約為737 Mb)為材料,結(jié)合單分子實時測序(SMRT)、Illumina 測序和Hi-C 等方法,獲得74 Gb 的高質(zhì)量序列,組裝的基因組大小為669 Mb,其contig N50 和scaffold N50 分別為5 Mb 和53 Mb,并預測到31 661 個蛋白編碼基因[55]。同年,廣東省農(nóng)業(yè)科學院蔬菜研究所以普通絲瓜高代自交系P93075 為材料,利用PacBio、Illumina 和Hi-C 技術(shù)進行基因組測序,組裝的基因組為656.2 Mb,其scaffold N50 為48.76 Mb,共有25 508 個蛋白編碼基因[56]。許多與生物和非生物脅迫相關(guān)的基因在絲瓜基因組中進行擴增(絲瓜基因組共有462 個NBS-LRR 基因,遠多于其他葫蘆科作物),該結(jié)果與絲瓜的高抗性相一致[56]。

1.9 蛇瓜基因組測序

蛇瓜(Trichosanthes anguinaL.,20=2x=22)原產(chǎn)于印度,世界各地普遍栽培,是集觀賞、食用和藥用價值于一身的重要葫蘆科作物[15,57-58]。Ma 等[59]采用Illumina 測序平臺完成蛇瓜基因組從頭測序,測序深度為108.5×,并利用Hi-C 技術(shù)組裝獲得919.8 Mb 的基因組,被掛載到11 條染色體上。蛇瓜基因組共注釋到22 874 個蛋白編碼基因,而重復序列占整個基因組的80.0%[59]。系統(tǒng)發(fā)育分析結(jié)果表明絲瓜與蛇瓜的近緣關(guān)系最為密切,可能于3 300 萬~4 700 萬年前由它們的共同祖先分化而來[59]。

1.10 佛手瓜基因組測序

佛手瓜(Sechium edule,2n=2x=28)原產(chǎn)于墨西哥,是一種藥食兼用型蔬菜作物。佛手瓜基因組大小為710.23 Mb,F(xiàn)u 等[60]利用Nanopore三代測序技術(shù)完成基因組從頭測序,測序深度為151×,進一步利用Hi-C 技術(shù)組裝獲得606.4 Mb 的基因組序列,被掛載到14 條染色體上,其scaffold N50 為46.56 Mb,基因組共含有28 237 個蛋白質(zhì)編碼基因。通過與其他物種基因家族比較,發(fā)現(xiàn)佛手瓜與蛇瓜的進化關(guān)系最為密切,并可能于2 700 萬~4 500 萬年前由它們的共同祖先分化而來,同時研究發(fā)現(xiàn)佛手瓜在2500(±400)萬年間發(fā)生過一次全基因組復制事件,是葫蘆科內(nèi)的第三次全基因組復制事件,為佛手瓜的基因進化研究提供了理論依據(jù)[60]。

2 全基因組測序在葫蘆科作物中的應用

2.1 葫蘆科作物的起源與進化

在基因組測序開展之前,葫蘆科作物的共同原始祖先具有什么特征,不同物種之間的進化關(guān)系如何尚不清楚。隨著黃瓜、甜瓜、西瓜、南瓜和葫蘆參考基因組的陸續(xù)發(fā)布,人們推測葫蘆科作物的祖先含有12條染色體,與甜瓜最為接近[51]。冬瓜基因組測序后,Xie 等[52]發(fā)現(xiàn)冬瓜比甜瓜更為保守,是迄今發(fā)現(xiàn)擁有最古老基因組的葫蘆科作物,并推斷它們起源于一個擁有15 條染色體的祖先基因組,經(jīng)過染色體多次斷裂和融合等事件形成目前豐富多樣的葫蘆科大家族。Guo 等[13]以葫蘆科52 個屬136 個物種的轉(zhuǎn)錄組與基因組數(shù)據(jù)為基礎,確認了葫蘆科作物屬以上的親緣關(guān)系(圖1),揭示葫蘆科最近共同祖先起源于白堊紀晚期,推測基因組加倍事件是促使葫蘆科作物起源后快速分化的原因。

圖1 葫蘆科作物親緣關(guān)系[13]Fig.1 Relationship between Cucurbitacea crops[13]

2.2 重要農(nóng)藝性狀相關(guān)基因的挖掘

參考基因組是挖掘與農(nóng)藝性狀緊密關(guān)聯(lián)基因的基石??辔妒怯绊扅S瓜商品性的重要農(nóng)藝性狀,在黃瓜參考基因組的基礎上,結(jié)合黃瓜變異組圖譜、傳統(tǒng)的基因定位方法、生物化學與分子生物學等技術(shù)手段進行系統(tǒng)分析,發(fā)現(xiàn)9個控制黃瓜果實苦味物質(zhì)葫蘆素的合成基因以及2 個參與調(diào)控苦味物質(zhì)合成的調(diào)控因子Bl和Bt[16-17,61],其中Bl調(diào)控葉片苦味、而Bt調(diào)控果實苦味[61]。

全基因組關(guān)聯(lián)分析(GWAS)是研究基因組序列變異與目標性狀關(guān)聯(lián)程度、挖掘候選基因的重要方法。在葫蘆科作物基因組測序的基礎上,基于核心種質(zhì)資源或自交系材料的重測序開展全基因組關(guān)聯(lián)分析,挖掘到許多控制重要農(nóng)藝性狀的候選基因。Zhao 等[32]通過1 067 份甜瓜資源的全基因組關(guān)聯(lián)分析,除鑒定到已報道的性別決定基因CmACS-7、果肉顏色基因CmOr、果皮顏色基因CmKFB和酸度基因CmPH外,還分別獲得76、29 和99 個與產(chǎn)量、果實品質(zhì)和外觀性狀相關(guān)的基因位點?;?46 份冬瓜核心種質(zhì)資源的重測序和全基因組關(guān)聯(lián)分析結(jié)果,Yan等[62]和Luo 等[63]進一步通過基于遺傳圖譜的基因定位,初步明確編碼跨膜O-?;D(zhuǎn)移酶和YABBY 轉(zhuǎn)錄因子的基因分別控制冬瓜果實表面蠟粉和種子籽型形成的候選基因。Du 等[64]在全基因組關(guān)聯(lián)分析基礎上,進一步通過基因定位推斷一個編碼AGAMOUS MADS-box 轉(zhuǎn)錄因子的MELO3C019694.2為決定甜瓜果實表面棱溝有無的候選基因。

3 展望

3.1 高質(zhì)量參考基因組組裝

葫蘆科不同物種參考基因組的繪制,顯著促進了該領(lǐng)域分子生物學研究水平。然而,前期的Roche 454、Sanger 和Illumina 測序平臺的讀長相對較短(100~150 bp),且依賴于遺傳圖譜輔助組裝,高重復區(qū)域或著絲粒區(qū)域存在大量的gap 區(qū)域,限制了其在后續(xù)研究中的應用。隨著測序技術(shù)的發(fā)展,三代測序讀長顯著提升(如Nanopore 讀長可達150 kb),可以填補基因組中大片段的gap。近年來,基于PacBio HiFi、Hi-C 及Nanopore ultralong 測序技術(shù),構(gòu)建端粒到端粒(T2T)基因組逐漸成為研究熱點。T2T 基因組具有高度準確性、連續(xù)性、完整性,有助于深入研究基因組中高重復序列區(qū)域,為研究著絲粒區(qū)域或未知高重復區(qū)域的變異特征提供了契機。在葫蘆科作物中,西瓜[38]和苦瓜[47]T2T 參考基因組已有報道,其基因組的連續(xù)性和完整性得到顯著提高。因此,對其他參考基因組質(zhì)量相對不太完善的葫蘆科作物,組裝T2T 高質(zhì)量參考基因組可能將為新功能基因鑒定和物種遺傳變異分析奠定基礎。

3.2 泛基因組研究

葫蘆科作物同一物種內(nèi)遺傳變異豐富,單一或少數(shù)幾個參考基因組不能完整呈現(xiàn)這些資源中的所有遺傳變異,以單一參考基因組進行基因組學研究容易出現(xiàn)偏差或錯誤。構(gòu)建來自多個個體的高質(zhì)量泛基因組,不僅能在基因組水平上更全面地解析物種間的遺傳變異,探明不同個體表型差異的遺傳基礎,而且可通過對多個物種、亞種間基因組比較分析,挖掘其特有基因和變異位點,為功能基因研究和全基因組設計育種奠定基礎。目前,黃瓜、西瓜、甜瓜已完成多個參考基因組和大量核心資源基因組重測序,并利用全基因組關(guān)聯(lián)分析挖掘了多個重要性狀的關(guān)鍵候選基因。然而,其他葫蘆科作物雖然組裝了參考基因組,但是基因組深入分析與利用不足。因此,泛基因組構(gòu)建及應用將成為今后葫蘆科作物基因組學研究的熱點。

猜你喜歡
葫蘆科甜瓜黃瓜
甜瓜的重量
清新脆嫩的黃瓜
中老年保健(2021年5期)2021-08-24 07:08:02
黃瓜留瓜要注意兩點
我喜歡黃瓜
不同葫蘆科作物中瓜氨酸含量的比較
中國瓜菜(2020年6期)2020-07-08 09:47:18
葫蘆科主要蔬菜再生體系建立影響因素的研究進展
葫蘆科植物離體雌核發(fā)育研究進展
中國瓜菜(2017年10期)2018-02-03 18:46:35
摘黃瓜
葫蘆科作物矮生性狀研究進展
薄皮甜瓜新品種墾甜1號的選育
中國蔬菜(2016年8期)2017-01-15 14:23:41
营山县| 高青县| 忻州市| 枞阳县| 高州市| 永善县| 海晏县| 密云县| 宣汉县| 高碑店市| 丹寨县| 赣州市| 永平县| 滨海县| 浪卡子县| 罗源县| 漳平市| 颍上县| 巫山县| 理塘县| 河源市| 府谷县| 玉门市| 本溪市| 荃湾区| 海原县| 柘城县| 古蔺县| 万载县| 文化| 凯里市| 石门县| 定襄县| 鹤山市| 彰化市| 宝应县| 枝江市| 尚义县| 桃园县| 靖边县| 三亚市|