郝曉燕,張躍進,郭宏波,柯衛(wèi)東
(1.西北農林科技大學生命科學學院,陜西楊凌,712100;2.國家種質武漢水生蔬菜資源圃,武漢市蔬菜科學研究所)
水生蔬菜是在淡水中生長、可供食用的特色蔬菜,在我國主要有蓮藕、芋頭、茭白、慈姑、荸薺、水芹、芡實、菱角、莼菜、蒲菜等12種類型。因多數(shù)水生蔬菜含膳食纖維,醫(yī)學及食品科學研究結果均表明膳食纖維對高血脂、高血壓等心血管系統(tǒng)疾病,以及便秘、腸癌等消化系統(tǒng)疾病具有良好的調理和輔助治療功能[1]。目前蓮藕、菱白、慈姑、芡實、荸薺、菱角等品種的加工產品均已銷售到國外市場,出口量呈逐年增長趨勢,國際市場需求量也很大。隨著海外需求量的不斷增長以及消費需求的多樣化,借助日益更新的分子技術培育優(yōu)質、抗病性強和適合加工的品種將是水生蔬菜今后育種的方向。
隨著分子生物學和生物技術的迅猛發(fā)展,分子標記技術日新月異。單核苷酸多態(tài)性 (single nucleotide polymorphism-SNP)是繼第一代分子標記限制性片斷長度 多態(tài)性 (restricted fragments length polymorphism-RFLP)和第二代分子標記微衛(wèi)星DNA之后第三代分子標記技術。因其具有在基因組中數(shù)量多、分布密度高,在基因分型過程中不需要根據(jù)片段大小將DNA分帶,即可實現(xiàn)大規(guī)模、高度自動化,從而更適合于大樣本量的檢測分析,因此SNP被認為是很有應用前景的分子標記技術[2]。分子標記是物種表現(xiàn)型在分子水平上遺傳多態(tài)性的直接映射,分子水平的遺傳多態(tài)性表現(xiàn)為DNA核苷酸序列的差異,因此檢測手段更直接、精確。隨著人類、擬南芥及水稻基因組測序的完成,越來越多的生物基因組計劃正在被闡明。目前利用SNP標記已發(fā)現(xiàn)與人類一些重要疾病(哮喘病、糖尿病、精神分裂癥、癌癥、鐮狀細胞貧血、血友病等)緊密連鎖的標記基因[3]。同樣,SNP在植物多樣性、群體遺傳、系統(tǒng)進化和功能基因組學等領域亦已顯示出廣泛的應用價值[4]?;谒卟嗽谖覈奶厥庑院椭匾?,以及SNP技術的廣泛應用前景,本文對單核苷酸多態(tài)性特點、檢測技術及其在其他作物上的應用進行了綜述,并對其在水生蔬菜遺傳育種上的借鑒作用進行了探討。
單核苷酸多態(tài)性主要是指在基因組水平上由單個核苷酸變異所引起的DNA序列多態(tài)性,在群體中發(fā)生頻率不小于1%。它是人類可遺傳變異中最常見的一種,所表現(xiàn)的多態(tài)性只涉及到單個堿基的變異,這種變異可由單個堿基轉換或顛換所引起,也可由堿基插入或缺失所致,但通常所說SNP并不包含后兩種情況[5]。所謂轉換是指同型堿基之間的轉換,如嘌呤與嘌呤(GA)、嘧啶與嘧啶(T-C)間的替換;所謂顛換是指發(fā)生在嘌呤與嘧啶(A-T、A-C、C-G、G-T)之間的替換。 研究發(fā)現(xiàn),在變異中轉換發(fā)生頻率較高,而且以C-T轉換為主,其原因是CpG的C是甲基化的,容易自發(fā)脫氨基形成胸腺嘧啶T,CpG也因此變?yōu)橥蛔儫狳c[6~7]。Kanazin等[8]對5個大麥品系的54個基因分別進行測序時,發(fā)現(xiàn)3個基因的SNP共有112種多態(tài)性。Tenaillon等[9]測算出玉米1號染色體上平均每104 bp中就有一個SNP多態(tài)位點?;蜓芯恐行母鶕?jù)其完成的92%秈稻(Oryza sativaL.ssp.indica)基因組草圖,估算出其SNP豐度為0.43%,即170萬個左右[10]。由此可見,作物中SNP多態(tài)性非常豐富,且數(shù)量明顯高于其他分子標記。
在基因組DNA中,任何堿基均有可能發(fā)生變異,所以SNP幾乎遍布于整個基因組中。研究表明,編碼區(qū)內SNP(coding SNP,cSNP)比較少,這主要是由于外顯子內堿基變異率僅有周圍序列的1/5[11~12],但它在研究遺傳性疾病時具有重要意義,因此cSNP的研究備受關注。在遺傳學分析中SNP作為一類遺傳標記得以廣泛應用,主要因其具有以下幾個特點:①標記遺傳穩(wěn)定性高。SNP是基于單核苷酸的突變,所以其突變率低;②分布密度高。在人類基因組中平均每1 900個堿基對出現(xiàn)1個SNP,在玉米一號染色體中平均每104個堿基就出現(xiàn)1個SNP位點,幾乎可以在任何待測基因內部或附近提供一系列標記;③易于自動化分析。SNP與傳統(tǒng)分子標記方法存在明顯不同,不再以DNA長度差異作為檢測手段,而是直接檢測序列變化,從而擺脫凝膠電泳的瓶頸限制,實現(xiàn)高效檢測[13]。
原則上任何能檢測單個堿基突變或多態(tài)的技術均可用于發(fā)現(xiàn)和識別SNP。近年來隨著生物技術的快速發(fā)展,SNP檢測技術日趨成熟,新的方法不斷涌現(xiàn),按研究對象不同主要分為兩類:①對未知SNP位點的檢測。傳統(tǒng)方法包括如單鏈構象多態(tài)性(SSCP)、溫度梯度凝膠電泳(TGGE)、變性梯度凝膠電泳(DGGE)、限制性片段長度多態(tài)性(RFLP)、隨機擴增多態(tài)性 DNA(RAPD)等,這些方法只能檢測SNP位點的有或無,不能確知突變位置和堿基類別,且不能用于SNP的發(fā)掘。而SNP的發(fā)掘需要伴隨著測序工作的進行,所以對SNP進一步研究則需對含SNP的DNA鏈進行測序。由于這些方法都需通過電泳進行檢測,因而難以實現(xiàn)高效、快速、自動化的檢測目標。
②對已知SNP位點的檢測。查找已知SNP的方法包括:以雜交為基礎的等位基因特異寡核苷酸片段分析(ASO)、突變錯配擴增檢驗 (MAMA)、基因芯片技術(gene chips)等。
目前興起的一些高通量、自動化檢測SNP的方法,包括Taq Man探針技術、芯片技術陣列分析、變性高效液相色譜(DHPLC)、動態(tài)等位基因特異的雜交、基質輔助激光解析/電離-飛行時間質譜 (MALDI-TOF MS)技術、毛細管電泳(CE)等[14],這些技術的出現(xiàn)使SNP位點的基因分型更易于實現(xiàn)。但是使用成本較高。其中最直接的檢測SNP位點的方法是通過對已定位的序列標簽位點 (sequence tagged sites,STS) 和表達序列標簽(expressed sequence tag,EST)進行再測序發(fā)現(xiàn)植物基因組SNP,其優(yōu)點是EST包含有許多表達基因的序列資料,其中一些可能會涉及作物的重要農藝性狀,對其進行關聯(lián)分析可以實現(xiàn)輔助遺傳育種,或者通過設計特異的PCR引物擴增某個特定區(qū)域的DNA片段,通過測序和遺傳特征的比較來鑒定該DNA片段是否可以作為SNP標記,但缺點是誤差較大。綜上所述,每種方法都有其優(yōu)缺點,試驗者可根據(jù)自身需求及試驗設備等條件選擇適合自己的SNP檢測方法。
分子標記已被廣泛用于人類、動物和植物(或作物)的遺傳圖譜構建、遺傳資源分類與系統(tǒng)進化和功能基因組學等研究中。SNP以其特有的優(yōu)勢在人類遺傳學研究中已得到廣泛應用,而其在作物中的應用才剛剛起步,國內外報道相對較少,從而顯示出其在作物應用研究中具有廣闊前景。目前,在玉米、大豆、小麥中已有SNP報道,并表現(xiàn)出高度的種內核苷酸多態(tài)性,但在功能基因組中的應用尚處于起步階段[15]。而SNP在水生蔬菜的相關研究中尚未見報道。
隨著SNP標記的發(fā)現(xiàn)和定位功能的提高,作物遺傳連鎖圖譜標記密度日益升高,這為作物育種提供了前所未有的便利。隨著標記密度的逐漸加大,基因組掃描就能將數(shù)量性狀基因位點(QTL)定位于染色體更細微的區(qū)域內,從而為新的主基因的發(fā)現(xiàn)和定位克隆打下良好的基礎;高密度SNP遺傳圖譜的出現(xiàn)可使我們更精確地進行標記輔助選擇(MAS)和標記輔助導入(MAI),降低或消除目的基因之外的遺傳背景對這些技術帶來的不良影響。Nasu等[16]建立了213個共顯性,遍布于整個水稻基因組的SNP分子標記,并將94個SNP整合到已有的遺傳圖譜中。Davis等[17]用SNP進行EST作圖成功獲得高分辨率的玉米B73×Mo17隨機交配4代后的群體遺傳圖譜。SNP作為一類遺傳標記用于遺傳圖譜構建,以此來定位和識別具有重要功能的基因。建立起完整的高密度分子圖譜,就可以定位相應的基因,這將為水生蔬菜中農藝性狀和重要經(jīng)濟性狀的基因定位,培育高產、抗逆性和抗病性強的品種,提供了重要的技術支撐。
生物體在漫長的進化過程中形成了自身特有的DNA堿基序列,比較物種間SNP差異,可以了解物種間親緣關系和進化的生物學信息,從而對物種進行精細鑒定和分類。
Wang等嘗試采用玉米中稱為“進化位點”的tb1基因的SNP數(shù)據(jù)來回答栽培玉米的起源問題。他們從17個玉米基因型大約2.9 kb序列搜尋SNP,發(fā)現(xiàn)其中12個基因型屬于玉米的祖先,野生玉米在編碼tb1蛋白的基因部分序列僅有3%變異,而在啟動子區(qū)域的變異卻非常高,但所有栽培玉米在該啟動子區(qū)域的變異卻非常低,由此他們認為玉米在長期栽培過程中,影響啟動子區(qū)域的選擇要比影響編碼區(qū)多得多,這些選擇導致了玉米表現(xiàn)型的變化[18]。Germano等[19]用核酸和葉綠體的2種特異性SNP標記成功地對親緣關系較近、形態(tài)相似的云杉屬紅云杉和白云杉以及黑云杉進行了區(qū)分,其中有2個SNP可將黑云杉與紅云杉和白云杉分開。比如,第410堿基位置存在SNP,在黑云杉中它編碼異亮氨酸,而在紅云杉和白云杉中卻編碼亮氨酸;有5個SNP將白云杉與紅云杉和黑云杉分開。Yamanaka等[20]對不同來源的糯稻品種進行SNP分析,結果表明Waxy基因位點上兩個復等位基因Wxa和Wxb差別在于Wx基因中第一個內含子的一個酶切位點單堿基發(fā)生替代 (由AGGT變?yōu)锳GTT)導致酶切位點改變而產生多態(tài)性,從而使Wx基因在該位點形成復等位基因Wxa和Wxb,同時在353個糯稻中發(fā)現(xiàn)11個是AGGT,由于認為粳稻W(wǎng)x基因都AGTT,因此他們認為糯稻來源于粳稻。
單個堿基的差異可能決定一個基因功能的改變,SNP用于研究基因功能具有重要意義。利用SNP探索作物基因功能組學的研究在小麥、水稻中報道較多。
水稻抗稻瘟病基因Pi-ta與等位感病基因的區(qū)別在于基因編碼區(qū)存在7個堿基替換,造成氨基酸鏈中有5個氨基酸差異,通過表型分析發(fā)現(xiàn),造成抗病基因與感病基因功能差異的關鍵因素是等位基因編碼的氨基酸鏈中第918個氨基酸的差異,抗病基因編碼丙氨酸,而感病基因則編碼為絲氨酸[21]。水稻淀粉酶IIa(SSIIa)基因位點存在5個SNP,其中一個SNP引起了氨基酸編碼的改變,并認為靠近C末端的兩個SNP引起氨基酸的變化,可能是引起淀粉酶Ⅱa基因活性和淀粉粒群叢改變的關鍵因素[22]。水稻半矮稈基因sd21等位基因中大多數(shù)是由于基因組中編碼一種赤霉素氧化酶(GA20-ox)的基因編碼區(qū)一段核苷酸缺失造成GA20-ox基因功能喪失;另一種情況是在GA20-ox基因編碼區(qū)內第798個堿基由C變?yōu)門,從而使氨基酸鏈第266個氨基酸由亮氨酸變?yōu)楸彼?,而亮氨酸在GA20-ox的氨基酸鏈中是高度保守的,由于單堿基的取代使基因編碼的氨基酸改變,導致了GA20-ox功能的喪失,使水稻由高稈突變?yōu)榘抂23]。Wang等[24]在研究了6個野生稻品種谷子中淀粉結構和理化特性后發(fā)現(xiàn),與栽培稻的長鏈淀粉相比,野生稻谷子具有更高的膨脹力、水溶性、較低的β-淀粉分解限制和粘性,并認為因野生稻中直鏈淀粉含量和支鏈淀粉結構的差異會造成加工以及品質上的差異。在水稻中,直鏈淀粉的含量常常是決定烹調和米食加工質量的一個重要指標,直鏈淀粉含量低的品質優(yōu)。研究發(fā)現(xiàn),所有直鏈淀粉含量低于18%的品種其序列都是AATTATA,而直鏈淀粉含量在中等水平以上的26個品種在該位置的序列都是AAGTATA,這種TG轉換與直鏈淀粉含量的相關性在育種實踐中很有價值[25]。
SNP具有多態(tài)性豐富,在作物基因組中分布密度大等優(yōu)點,在人類和重要作物上已顯示出其特有的優(yōu)勢和廣泛應用前景,它在遺傳圖譜構建、資源分類和遺傳進化,以及功能基因組學方面的特長將為其他經(jīng)濟作物提供良好的技術支撐。水生蔬菜是我國乃至世界蔬菜的特色種類,對其育種、遺傳學和基因組學方面的研究尚處于初級階段,盡快吸納新技術加速我國特色蔬菜的研究是當務之急。
我國水生蔬菜資源豐富,其中以蓮藕資源最為豐富。盡管過去在形態(tài)學分類[26~27]、分子標記技術[28]和品質方面[29]做了一些工作,但無論是基礎研究還是應用研究,都仍有許多工作需要開展?;A研究方面包括:美洲黃蓮作為中國蓮亞種的直接分子證據(jù);中國蓮3種類型的進化機理及其時間次序;藕蓮不開花或少開花的分子調控機理;藕蓮和子蓮產量和品質的調控機理;花蓮不同花型、花色的進化與分子雜交機制;應用研究包括:藕蓮和子蓮高產品種的選育;藕蓮加工品種的選育;花蓮品種各花色和花型形的選育。而其他水生蔬菜種類與蓮藕相比,則還有更多的工作需要開展。
[1]Tungland B C,Meyer D.Non digestible oligo-and Polysaccharides(dietary fiber):their physiology and role in human health and food [J].Comprehensive Reviews in Food Science and Food Safety,2002,3:73-92.
[2]劉傳光,張桂權.水稻單核苷酸多態(tài)性及其應用[J].遺傳,2006,28(6):737-744.
[3]Risch N,Merikangas K.The future of genetic studies of complex human diseases [J].Science,1996,273:1 516-1 517.
[4]杜春芳,劉惠民,李潤植,等.單核苷酸多態(tài)性在作物遺傳及改良中的應用[J].遺傳,2003,25(6):735-739.
[5]杜瑋南,孫紅霞,方福德.單核苷酸多態(tài)性的研究進展[J].中國醫(yī)學科學院學報,2000,8(22):392-394.
[6]Johnson G C L,Told J A.Strategies in complex disease mapping [J].Current Opinion Genetics&Development,2000,10(3):330-334.
[7]Mullikin J C,Hunt S E,Cole C G,et al.A single-nu-cleotide polymorphisms map of human chromosome 22[J].Nature,2000,407(6803):516-520.
[8]Kanazin V,Talbert H,See D,et al.Discovery and assay of single-nucleotide polymorphisms in barley (Hordeum vulgare)[J].Plant Molecular Biology,2002,48(5):529-537.
[9]Maud I,Tenaillon,Mark C,et al.Patterns of DNA sequence polymorphism along chromosom-e 1 of maize (Zea mays ssp.maysL.)[J].PNAS,2001,98(16):9 161-9 166.
[10]Yu J,Hu S N,Wang J,et al.A draft sequence of the rice genome (Oryza sativaL.ssp.indica)[J].Science,2002,296(13):79-92.
[11]Li W,Sadler L A.Low nucleotide diversity in Man[J].Genetics,1991,129:513-523.
[12]Nickerson D A,Taylor S L,Weiss K M,et al.DNA sequence diversity in a 917 kb region of the human lipoprotein lipase gene[J].Nature Genetics,1998,19:233-240.
[13]Mochida K,Yamazaki Y,Ogihara Y.Discrimination of homoelogous gene expression in hexaploid wheat by SNP analysis of contigs grouped from A large number of expressed sequence tags [J].Molecular Genetics and Genomics,2004,270:371-377.
[14]汪維鵬,倪坤儀,周國華.單核苷酸多態(tài)性檢測方法研究進展[J].遺傳,2006,28(1):117-126.
[15]Rafalski A.Applications of Single Nucleotide Polymorphisms in Crop Genetics[J].Current Opinion in Plant Biology,2002(5):94-100.
[16]Nasu S,Suzuki J,Ohta R,et al.Search for and analysis of single nucleotide polymorphisms (SNPs)in rice(Oryza sativa,Oryza rufipogon)and establishment of SNP markers[J].DNA Research,2002,9(5):163-171.
[17]Davis G,Long M J,Lee M,et al.The Intermated B73 x Mo17 Genetic Map:a Community Resource 2001,(http://www.agron.missouri.edu)[EB//OL].
[18]Wang R L,Syeca A,Hey J,et al.The limits of selection during maize domestication[J].Nature,1999,398:236-239.
[19]Germano J,Klein A S.Species-specific nuclear and chloroplast single nucleotide polymorphisms to distinguish Picea glauca,P.mariana and P.rubens [J].Theoretical and Applied Genetics,1999,99:37-49.
[20]Yamanaka S,Nakamura I,Watanabe K N,et al.Identification of SNPs in the waxy gene among glutinous rice cultivars and their evolutionary significance during the domestication process of rice [J].Theoretical and Applied Genetics,2004,108(7):1 200-1 204.
[21]Bryan G T,Wu K S,Farrall L,et al.A single amino acid difference distinguishes resistant and susceptible alleles of the rice blast resistance genePi-ta [J].Plant Cell,2000,12(11):2 033-2 046.
[22]Umemoto T,Aoki N.Single-nucleotide polymorphisms in rice starch synthaseⅡa that alter starch gelatinisation and starch association of the enzyme [J].Functional Plant Biology,2005,32(9):763-768.
[23]Spielmeyer M,Ellis M H,Chandler P M.Semidwarf(sd21), “Green Revolution” Rice,contains a defective gibberellin 20-oxidase gene[J].Proceeding of the National Academy of Sciences of the United States of America,2002,99(13):9 043-9 048.
[24]Wang L F,Wang Y J,Porter R.Structure and physicochemical properties of six wild rice starch [J].Journal of Agricultural and Food Chemistry,2002,50:2 695-2 699.
[25]Ayres N M,McClung A M,Larkin P D,et al.Microsatellites and a single-nucleotide polymorphism in an extended pedigree of US rice germplasm [J].Theoretical and Applied Genetics,1997,94:773-781.
[26]倪學明.中國蓮 [M].北京:科學出版社,1987:1-163.
[27]王其超,張行言,胡春根.荷花分類新系統(tǒng)[J].武漢植物學研究,1997,15(1):19-26.
[28]Guo H B,Li S M,Peng J,et al.Genetic diversity of Nelumbo accessions revealed by RAPD [J].Genetic Resources and Crop Evolution,2007,54:741-748.
[29]柯衛(wèi)東,黃新芳,傅新發(fā).蓮藕主要營養(yǎng)品質和農藝性狀的遺傳分析[J].武漢植物學研究,2000,18(6):519-522.