徐海鵬,劉顯軍,陸 贏,馬 鵬,胡慶一,劉忠松
(湖南農(nóng)業(yè)大學(xué)油料作物研究所,長沙 410128)
?
芥菜型油菜B03染色體黃籽基因區(qū)域BAC重疊群的構(gòu)建及分析
徐海鵬,劉顯軍,陸贏,馬 鵬,胡慶一,劉忠松*
(湖南農(nóng)業(yè)大學(xué)油料作物研究所,長沙 410128)
在前人研究中,芥菜型黃籽基因被定位到B03連鎖群的1.5 cM區(qū)域內(nèi)。本試驗利用與B03染色體控制黃籽基因區(qū)域緊密連鎖的unigene(通過RNA_seq技術(shù)獲得的芥菜型油菜種皮的非冗余基因)和BESs開發(fā)標記,并對芥菜型油菜作圖群體親本紫葉芥BAC文庫(ZBjuH BAC文庫)進行篩選,由開發(fā)的320對引物共篩到BAC 920個,對其中483個BACs進行了末端測序,返回序列860條。構(gòu)建了6段芥菜型油菜B03染色體黃籽區(qū)域BAC重疊群,共計長約3.3 Mb;通過BES blast分析表明,在B03染色體黃籽區(qū)域與A03、A09染色體存在高度的重復(fù)序列。
芥菜型油菜;黃籽基因;B03染色體;BAC重疊群
油菜是唯一的冬季油料作物,同時也是世界上第三大油料作物,包括了白菜型、芥菜型和甘藍型三種類型。在相同遺傳背景下,黃籽油菜與黑籽油菜相比,在種皮、色素、含油量、蛋白質(zhì)含量和菜餅飼用價值方面更具優(yōu)勢[1,2],因此黃籽油菜是現(xiàn)代油菜育種的重要目標。而在甘藍型油菜中,并沒有發(fā)現(xiàn)天然的黃籽材料,一般都是通過遠緣雜交或者誘變育種獲得,但是其后代遺傳具有不穩(wěn)定性,對甘藍型黃籽油菜的市場推廣和種質(zhì)選育產(chǎn)生嚴重制約。
在白菜型油菜種皮顏色基因定位中,Rahman等[3,4]通過SRAP標記擴增產(chǎn)物測序,推測出白菜型油菜和甘藍型油菜可能具有相同的黃籽基因。而Kebede等[5]和Xiao等[6]通過進一步研究,將白菜型油菜的黃籽基因定位于A09染色體。
相比較而言,芥菜型油菜天然黃籽材料更加豐富,占芥菜型油菜資源一半還多[7]。在前人研究中,認為芥菜型油菜黃籽基因一般由兩個基因位點控制[8~10]。Padmaja[11]通過關(guān)聯(lián)作圖找到位于2個不同連鎖群的3個和種皮顏色基因連鎖的SSR標記,分別是Ra2A11、Na10A08、Ni4F11。王卓等[12]通過PCR步移篩選法構(gòu)建了芥菜型油菜A09染色體黃籽區(qū)域的BAC重疊群。劉顯軍等[13]以高代回交分離群體作材料,將黃籽基因定位到A09和B03兩個連鎖群的0.9 cM和1.5 cM區(qū)域里。Lakshmi等[14]通過同源克隆推測并克隆出與黃籽性狀相關(guān)聯(lián)的TT8基因,但未證實與其共分離標記區(qū)域之間是否存在其他基因影響黃籽性狀的表達。
本研究利用與芥菜型油菜B03染色體黃籽基因區(qū)域相關(guān)的標記,對芥菜型油菜作圖親本紫葉芥BAC文庫進行四維篩選,構(gòu)建目的區(qū)域的BAC重疊群,并通過測序獲得序列,研究芥菜型油菜黃籽形成的分子機制,為定位黃籽候選基因提供參考,為油菜黃籽育種和芥菜型油菜基因組研究奠定基礎(chǔ)。
1.1材料
材料包括芥菜型油菜紫葉芥(Purple-leaf Mustard,PM)、四川黃籽(Sichuan Yellow Seed,SY)、由紫葉芥和四川黃籽連續(xù)回交獲得的近等基因系A(chǔ)(Near-Isogenic Line A,NILA)和近等基因系B(Near-Isogenic Line B,NILB)。其中紫葉芥作為試驗用親本,用其構(gòu)建芥菜型油菜BAC文庫既ZBjuH BAC文庫(華中農(nóng)業(yè)大學(xué)羅美中教授實驗室協(xié)助完成)。
1.2方法
1.2.1親本(紫葉芥)DNA的提取
試驗檢測用親本DNA采取CTAB法[15]提取。步驟如下:(1)取指甲大小幼嫩鮮葉(紫葉芥)放入事先清洗干凈的研缽中,加950 μL2%CTAB研磨,而后轉(zhuǎn)入2.0 mL離心管置于冰上;(2)放入65℃水浴鍋1 h,每10~15 min顛倒數(shù)次;(3)取出將每管大致分配均勻,加入1000 μL24∶1氯仿/異戊醇,置于冰上15 min,12 000 rpm離心10 min,取上清,重復(fù)步驟(3);(4)取上清入1.5 mL離心管,加入2倍體積預(yù)冷(-20℃)無水乙醇,-30℃保存30 min;(5)挑出DNA入新1.5 mL離心管,加入75%乙醇1000 μL,顛倒數(shù)次,8000 rpm離心3 min,去上清,再次加入1000 μL75%乙醇,10 000 rpm離心5min,去上清;(6)吹干DNA(超凈工作臺),加入100 μLddH2O,-20℃保存?zhèn)溆谩?/p>
1.2.2BAC文庫DNA混合池的構(gòu)建
作圖親本紫葉芥ZBjuH BAC文庫包含187塊平板,每塊平板都是橫向16行(編號A-P)和縱向24列(編號1-24),每塊平板含有384(16×24)個單克隆,總共71 808(384×187)個BAC單克隆。為了減輕標記篩選過程中的壓力,利用文庫構(gòu)建了3個水平的混合池(一級池、二級池、三級池)。
三級池:包括縱向和橫向兩個池,其中橫向池為一塊平板相鄰兩行48個單克隆混合而成(如100號平板的AB、CD、EF…OP);縱向池為一塊平板的相鄰2列32個單克隆混合而成(如100號平板的1,2、3,4、5,6…23,24)。
二級池:一個二級池由一塊平板所有單克隆(384個)混合而成。
一級池:總共19個一級池。每個一級池由連續(xù)相鄰的10塊平板組成(即10個二級池),其中第19號一級池只有7個二級池(181~187)混合組成。
1.2.3目標BAC克隆的篩選
利用已有的標記對ZBjuH文庫進行四維篩選。首先是對19個一級池篩選,得到陽性一級池,接著篩選陽性一級池所包含的二級池,再對陽性二級池所包含的三級池(橫向和縱向)進行篩選。此步驟得到4個可能的BAC克隆(如100-AB-3,4),從文庫中挑出這4個BAC克隆搖菌過夜,再利用標記篩選這4個克隆,得到最終目的陽性BAC。
1.2.4引物開發(fā)
引物來源主要為目的基因區(qū)域BAC末端序列設(shè)計的末端引物、利用unigene設(shè)計的引物以及利用芥菜型油菜SURVEY序列設(shè)計的引物。引物設(shè)計采用Primer Premier 5.0或者利用在線網(wǎng)址(http://122.205.95.67/tools/primer.php)上的Primer 3設(shè)計。引物長度控制在20~30個堿基內(nèi),擴增產(chǎn)物大小300~500 bp,GC含量盡量要求大于45%。
引物由上海立菲生物有限公司合成。
1.2.5BAC末端測序和全長測序
BAC末端測序由Invitrogen生物公司或生工生物上海有限公司完成,測序引物為M13R和S2。
BAC全長測序由武漢未來組生物技術(shù)有限公司完成。
1.2.6BAC序列的BLAST分析
測序獲得的序列在實驗室建成的數(shù)據(jù)庫(http://172.28.10.232/index.php)進行比對和分析。
2.1B03染色體黃籽基因區(qū)域標記分析
試驗利用已定位到芥菜型油菜B03黃籽基因區(qū)域的連鎖標記Ni4F11、TT8和參考芥菜型油菜unigene序列設(shè)計的引物對作圖親本紫葉芥ZBjuH BAC文庫進行四維篩選。本試驗利用測得的目的基因區(qū)域的BAC末端序列設(shè)計了219對STS引物,其中204對引物可以擴增;利用芥菜型油菜unigene序列設(shè)計36對引物,其中35對引物可以擴增;利用芥菜型基因組SURVEY序列設(shè)計41對引物,其中39對引物可以擴增;另外還合成了15對IP標記引物,其中14對可以擴增(表1)。
表1 有效擴增引物統(tǒng)計Table 1 Statistics of effective amplification primer
并用近等基因系對部分標記進行多態(tài)性分析,檢測標記是否與目的性狀連鎖。部分引物序列信息及篩選到的BAC于表2,多態(tài)性分析結(jié)果于圖1。
圖1 芥菜型油菜親本及其近等基因系多態(tài)性分析結(jié)果Fig.1 Polymorphism analysis of the primers using the parents and their nearisogenic lines of Brassica juneca注:SY.四川黃籽(aabb);PM.紫葉芥親本(AABB);NILA.近等基因系A(chǔ)(AAbb);NILB.近等基因系B(aaBB)。
引物名稱引物序列(5'→3')擴增產(chǎn)物長度(bp)篩到的BACsNi4F11F:CGTAAGTTTCAATTGTCAACGGR:TCGTACGAAACAATCAACGG295099-K-04 146-B-03115-K-08 161-J-23B15_3884F:GCAAAAGCCAAATTGTCGATR:TAGAGTCGGCGAAAAGGAGA350027-P-09 041-M-20101-N-06 102-J-20159-J-08 171-B-24ST8F:CCGTGCTTGATGGCGTTTTGGAR:TTTGACTTCGGGTGGTTGTGGA328005-J-08033-E-04036-F-18SY_5263F:AGGCGGTGGTTTGAGTTTCGGTGGCR:GCCTTTACCTATCTTCTCCTCACGGTTA-CAGTCCTC266001-P-23 031-F-06059-L-09 014-J-10099-O-18 101-F-06144-J-05 149-A-11B15_39736F:TAACAGGTGATGTCGATCCAAGR:CTTTTGTCGTGAAGACGATGAG318119-P-24 165-P-15020-O-04 028-H-14
2.2芥菜型油菜B03染色體目的區(qū)域BAC重疊群構(gòu)建及分析
試驗通過對ZBjuH文庫篩選,獲得BAC克隆640個,對其中435個克隆進行末端測序,得到BAC末端序列866條(部分測序結(jié)果不理想)。分別利用與芥菜型油菜B03染色體緊密連鎖的標記B15_33151,B15_3884,B15_39736,SY15_5263,以及與B03染色體控制黃籽基因緊密連鎖的標記篩選到的BAC為支點,構(gòu)建了6段芥菜型油菜B03染色體黃籽基因區(qū)域的BAC重疊群(圖2)。
圖2 芥菜型油菜B03染色體黃籽基因區(qū)域種子BAC群Fig.2 Seeds BACs contigs of yellow-seeded locus of the chromosome B03 in B.juncea注:圖中用一條長線代表B03染色體,箭頭表示該引物在B03染色體上的位置,短豎線表示引物,短橫線表示BAC并用數(shù)字-字母-數(shù)字表示BAC名稱。
圖2為構(gòu)建的重疊群的種子BAC群,共計有48個BAC和49個標記。此6段BAC重疊群其中心標記(B15_33151,B15_3884,Ni4F11,B15_39736,ST8,SY15_5263)用近等基因系分析都具有多態(tài)性,與目的性狀連鎖。第一段BAC重疊群為引物B15_33151篩到并延伸,左起B(yǎng)AC147-A-13(標記為BJS4447-1),右至045-M-17(標記為184F10L),包含6個種子BAC;第二段為引物B15_3884-1篩到并延伸,左起B(yǎng)AC187-C-13(標記為102J20R-1),右至029-A-10(標記為015M19R-2),包含8個種子BAC;第三段為引物Ni4F11篩到并延伸,左起B(yǎng)AC053-I-19(標記為146B03L),右至006-M-09(標記為146B03R),包含6個種子BAC;第四段為引物B15_39736-1篩到并延伸,左起B(yǎng)AC175-G-14(標記為119P24L),右至BAC129-K-23(標記為033J20L),包含7個種子BAC;第五段為引物ST8篩到并延伸,左起B(yǎng)AC036-F-18(標記為B15_39506-4),右至BAC056-H-03(標記為011G16L),包含11個種子BAC;第六段為引物SY15_5263篩到并延伸,左起B(yǎng)AC139-F-06(標記為143K05R),右至BAC014-J-10(標記為SY15_5263),包含10個種子BAC。
芥菜型油菜(AABB)、甘藍型油菜(AACC)、白菜型油菜(AA)這3種油菜,雖然具有不同的基因組,但是仍然存在大量的重復(fù)區(qū)域和片段。在Truco等[16]的研究中,發(fā)現(xiàn)白菜型、芥菜型、甘藍型油菜中的A、B、C3個基因組中,存在大量的保守區(qū)塊(BLOCK);Kumar等[17]進一步研究將芥菜型油菜分成24個保守區(qū)塊,而且其中A09、A03、B03染色體存在相同的保守區(qū)塊block O和block P,這兩個相同的保守區(qū)塊正好是B03染色體黃籽基因區(qū)域。在本試驗中,利用BAC033-E-04末端序列設(shè)計引物033E04R篩選到了BAC142-O-19,而后測序利用其末端序列設(shè)計引物142O19L,篩得BAC090-N-23。但是經(jīng)過BLAST分析和設(shè)計引物驗證,證明BAC142-O-19位于A03染色體000064支架上,而BAC033-E-04和BAC090-N-23位于目標區(qū)域;另外利用引物B15-39736可以篩到BAC171-K-20、114-I-20、052-G-12等,但證明這些BAC均位于A03染色體000001支架上;利用引物090N23L篩到了BAC015-F-18,而在前人對芥菜型油菜A09黃籽區(qū)域研究中,已對ZBjuH015F18進行了全長測序,并確定該BAC位于芥菜型油菜A09染色體的黃籽區(qū)域。證明在芥菜型油菜中,染色體A09黃籽基因區(qū)域和B03黃籽基因區(qū)域及A03染色體存在高度同源的重復(fù)序列。也正是由于這些重復(fù)序列的存在,所以在本試驗研究過程中,需要加強對篩到的BAC進行驗證及分析,保證引物設(shè)計的特異性和保證文庫不被混雜。
2.3全長測序BAC
在試驗計劃中,從24個候選BAC中選取了5個(ZBjuH036F18,ZBjuH090N23,ZBjuH171K20,ZBjuH146B03,ZBjuH153B10)送往武漢未來組生物技術(shù)有限公司進行BAC全長測序。其中ZBjuH036F18,ZBjuH090N23,ZBjuH171K20完成全長測序。后經(jīng)對返回序列分析及驗證,認為ZBjuH171K20此BAC位于A03染色體,得到的返回序列中確定2個BAC全長序列位于芥菜型油菜B03染色體黃籽區(qū)域,即ZBjuH036F18(138 109 bp)和ZBjuH090N23(125 151 bp)。在實驗室對這兩個BAC進行組裝和注釋后,發(fā)現(xiàn)由這兩個BAC組成的重疊群(長254 376 bp)編碼12個基因,并包含轉(zhuǎn)錄因子基因TT8。劉顯軍等[13,14]認為,TT8是控制芥菜型油菜種皮顏色形成的基因。
本試驗通過PCR步移篩選文庫構(gòu)建了6段重疊群,但是未將整個重疊群整合,重疊群之間存在間隙,如何填補這些間隙是接下來的主要工作。在使用標記篩選BAC文庫過程中,有些標記無法篩到BAC繼續(xù)延伸。出現(xiàn)無法延伸重疊群的一般情況為:(1)引物設(shè)計出現(xiàn)差錯;(2)引物在篩選文庫過程中出現(xiàn)誤篩、漏篩等情況;(3)我們的BAC文庫覆蓋度為整個芥菜型基因組的8.7倍,但不能排除基因組某些區(qū)域仍存在沒有BAC片段插入的情況。針對這些情況,首先要保證引物設(shè)計的特異性高,同時篩選過程中盡量保證菌池不受污染,以盡量降低假陽性片段的出現(xiàn);再就是注意試驗過程中引物進行PCR時的退火溫度、電泳時瓊脂糖膠的濃度及電泳儀的電壓都會對實驗結(jié)果產(chǎn)生誤差。如已進行全長測序的BAC 036-F-18,利用036-F-18R端和對應(yīng)的芥菜型基因組survey序列(B.juncea_gss_scaffold54318_27.4)設(shè)計了6對引物對文庫進行篩選,均無法使重疊群繼續(xù)延伸。因為設(shè)計了6對引物對該引物進行篩選延伸,且引物均可以擴增,故推測在此區(qū)域是否是構(gòu)建文庫時無BAC插入片段,在后續(xù)試驗時可進行進一步分析和驗證。
芥菜型油菜黃籽基因是一對等位基因,在A09染色體和B03染色體上高度保守,而相對于基因信息豐富的A09染色體,芥菜型油菜B基因組信息比較缺乏,且與A09染色體及A03染色體存在同源區(qū)塊和重復(fù)序列,因此在研究過程中獲得的序列、標記等信息資源是否可靠,更加需要反復(fù)思量、多次驗證,注意延伸出去的克隆與原克隆之間的重疊關(guān)系,預(yù)估延伸區(qū)域、重疊區(qū)域的大小、未填補的間隙(Gap)的大小,注意標記之間的回篩驗證,并加密標記篩選,以保證構(gòu)建的重疊群的質(zhì)量。
在本試驗中,利用引物篩到BAC并進行測序獲得末端序列后,我們先將其末端序列和芥菜型基因組survey序列進行比對,選擇匹配度較高(高于95%)的survey序列,可利用這段survey序列比對,分析是否含有與近等基因系NILB相對應(yīng)的unigenes,如果存在則可以利用三者之間共同的堿基序列設(shè)計引物。另外,有些BAC末端序列無法找到相對應(yīng)的survey序列,我們發(fā)現(xiàn)利用其設(shè)計的末端引物也很難篩到BACs,推測其可能不是此區(qū)域BAC,或者是由于存在大量重復(fù)序列導(dǎo)致無法篩出BAC。
本試驗利用定位到芥菜型油菜B03染色體黃籽基因區(qū)域標記篩選BAC文庫,并開發(fā)引物,構(gòu)建了芥菜型油菜B03染色體黃籽區(qū)域共計3.3 Mb的重疊群,為B03染色體黃籽基因區(qū)域提供了新的分子標記,為芥菜型油菜黃籽基因的精細定位和圖位克隆提供參考。由于目標區(qū)域與A09及A03染色體存在較高程度重復(fù)序列和區(qū)塊,且B03基因組信息較為缺乏,因此構(gòu)建重疊群難度較高。在以后的試驗過程中,在綜合PCR篩選、BAC測序、標記多態(tài)性檢測等方法上,應(yīng)注重結(jié)合生物信息學(xué)分析。
[1]劉后利.對油菜品質(zhì)改良的看法[J].作物雜志,1992(3):6-7.
[2]諶利,唐章林,張學(xué)昆.甘藍型油菜高油分育種初報[J].西南農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版),2004,26(5):550-553.
[3]Rahman M,McVetty PB.A review ofBrassicaseed color[J].Can J Plant Sci,2011,91:437-446.
[4]Rahman M,McVetty PB,Li G.Development of SRAP,SNP and Multiplexed SCAR molecular markers for the major seed coat color gene inBrassicarapaL[J].Theor Appl Genet,2007,115:1101-1107.
[5]Kebede B,Cheema K,Greenshields DL,et al.Construction of genetic linkage map and mapping of QTL for seed color inBrassicarapa[J].Genome,2012,55:813-823.
[6]Xiao L,Zhao Z,Du D,et al.Genetic characterization and fine mapping of a yellow-seeded gene in Dahuang (aBrassicarapalandrace) [J].Theor Appl Genet,2012,124:903-909.
[7]劉淑艷,劉忠松,官春云.芥菜型油菜種質(zhì)資源研究進展[J].植物遺傳資源學(xué)報,2007,8(3)351-358.
[8]Negi M,Device M,Delseny M,et al.Identification of AFLP fragments linked to seed coat colour inBrassicajunceaand conversion to a SCAR marker for rapis selection[J].Theor Appl Genet,2000,101:146-152.
[9]Mahmood T,Rahman M,Stringam G,et al.Molecular markers for seed colour inBrassicajuncea[J].Genome,2005,48:755-760.
[10]嚴明理.芥菜型油菜黃籽形成的分子機理研究[D].長沙:湖南農(nóng)業(yè)大學(xué)博士學(xué)位論文,2007.
[11]Padmaja KL,Arumugam N,Gupta V,et al.Mapping and tagging of seed coatcolor and the identification of microsatellite markers formarker-assisted manipulation of the trait inBrassicajuncea[J].Theor Appl Genet,2005,111:8-14.
[12]王卓,袁玉輝,胡學(xué)芳,等.芥菜型油菜A09黃籽基因區(qū)域BAC重疊群的構(gòu)建[J].湖南農(nóng)業(yè)科學(xué),2012(11):1-3,7.
[13]劉顯軍,袁謀志,官春云,等.芥菜型油菜黃籽性狀的遺傳、基因定位和起源探討[J].作物學(xué)報,2009,35:839-847.
[14]Lakshmi KP,Parul A,Vibha G,et al.Natural mutations in two homoeologousTT8 genes control yellow seed coat trait in allotetraploidBrassicajuncea(AABB) [J].Theor Appl Genet,2014,127(2):339-347.
[15]Doyle JJ,Doyle JL.A rapid DNA isolation procedure for small quantities of fresh leaf tissue[J].Phytochemistry Bulletin,1987,19:11-15.
[16]Truco MJ.Inter-and intra-genomic homology of theBrassicagenomes:implications for their origin and evolution[J].Theoretical and Applied Genetics,1996,93(8):1225-1233.
[17]Kumar P,Vibha G,Satish KY,et al.RNA-seq based SNPs for mapping inBrassicajuncea(AABB):synteny analysis between the two constituent genomes A (fromB.rapa) and B (fromB.nigra) shows highly divergent gene block arrangement and unique block fragmentation patterns[J].BMC Genomics,2014,15:396-410.
Construction and Analysis of BAC Contigs Around the Yellow-Seeded Locus of the Chromosome B03 in Brassica juncea
XU Haipeng,LIU Xianjun,LU Ying,MA Peng,HU Qingyi,LIU Zhongsong*
(Oil Crops Research Institute,Hunan Agricultural University,Changsha,Hunan 410128,China)
The yellow seed genes were located in 1.5 cM region of B03 linkage group ofBrassicajunceain previous studies.Yellow seed genetic regions (through the mustard RNASeq technology of rape seed non redundant genes) and BESs tightly linked to yellow seed genes of B03 were used to design markers in this study,and the markers were used to screenBrassicajunceamapping population parents purple leaf mustard BAC library (ZBjuH BAC library).In this study,320 markers were exploited and 920 BACs screened out from them,483 BACs of which were subject to end sequencing,and 860 sequences were returned.Six contigs (about 3.5Mb) were constructed around yellow seed coat gene on B03 chromosome in B.juncea.It was found that highly repetitive sequences are present in the area with yellow seed B03,A03,and A09.
Brassicajuncea;yellow seed coat gene;B03 chromosome;BAC contig
2016-03-07
徐海鵬(1991-),男,碩士研究生,Email:315214941@qq.com。*通信作者:劉忠松,博士,教授,Email:zsliu48@sohu.com。
國家自然科學(xué)基金(30471098)。
S565.403.2
A
1001-5280(2016)04-0353-06
10.16848/j.cnki.issn.1001-5280.2016.04.02