王珧 鄧逸桐 戴習(xí)彬 張安 曹清河 陳艷麗
摘? 要:利用流式細(xì)胞術(shù),以大豆Williams 82為內(nèi)參,對(duì)甘薯近緣野生種Ipomoea cordatotriloba進(jìn)行基因組大小測(cè)定,結(jié)合染色體壓片技術(shù)進(jìn)行倍性鑒定,并利用二代高通量測(cè)序技術(shù)對(duì)測(cè)定結(jié)果進(jìn)行驗(yàn)證。結(jié)果表明:利用流式細(xì)胞術(shù)測(cè)得I. cordatotriloba基因組大小為(539.69±13.76)Mb;染色體壓片結(jié)果顯示其染色體數(shù)目為30條,由于其基數(shù)x=15,從而獲知I. cordatotriloba為二倍體;經(jīng)K-mer計(jì)算并修正后得出的C值為560.70 Mb,與流式細(xì)胞分析結(jié)果相近;同時(shí),測(cè)序結(jié)果顯示其基因組雜合率為0.40%;重復(fù)序列比率為57.93%;GC含量為38.10%。以上結(jié)果為此物種全基因組精細(xì)圖譜繪制打下基礎(chǔ),同時(shí)為甘薯近緣野生種的利用提供參考。
關(guān)鍵詞:甘薯;Ipomoea cordatotriloba;基因組大小;流式細(xì)胞法;K-mer計(jì)算中圖分類號(hào):S531;Q75 ?????文獻(xiàn)標(biāo)識(shí)碼:A
DNA Amount Estimation and Genome Survey of Sweetpotato Wild RelativesIpomoea cordatotriloba
WANG Yao1, 2, DENG Yitong2, DAI Xibin2, ZHANG An2, CAO Qinghe2, CHEN Yanli1*
1. College of Horticulture, Hainan University, Haikou, Hainan 570228, China; 2. Jiangsu Xuhuai Regional Xuzhou Institute of Agricultural Sciences, Xuzhou, Jiangsu 221131, China
Abstract: DNA content of sweetpotato wild relativesIpomoea cordatotrilobawas determinated by flow cytometry using soybeanWilliams 82 as the internal reference in this study. The ploidy was determined by chromosome counting. In order to verify the reliability of the results, the next-generation sequencing was used to further test and verify. It was a diploid species with base number was 15. The genome size was (539.69±13.76) Mb by the flow cytometry analysis. The C-value determined by sequencing was similar to the results of flow cytometry. Furthermore, the genomic heterozygosity rate, repeat sequence ratio and GC content was 0.40%, 57.93% and 38.10%, respectively. The above results would lay the foundation for the whole genome sequencing and assemble of this species, and provide references for the utilization of sweetpotato relatives.
Keywords: sweetpotato;Ipomoea cordatotriloba; genome size; flow cytometry; sequencing
DOI: 10.3969/j.issn.1000-2561.2020.06.012
甘薯因具有營(yíng)養(yǎng)豐富、適應(yīng)性廣等優(yōu)點(diǎn)大面積種植于熱帶、亞熱帶地區(qū)[1],是世界第七大主糧作物(FAO,2018)。甘薯屬植物約有800~900個(gè)種,其中有二倍體、四倍體和六倍體等不同倍性的物種資源,且許多野生種具有優(yōu)良的抗性基因[2-3]?;蚪M特征研究是植物基因資源開(kāi)發(fā)、利用的前提?;蚪M大小、重復(fù)序列比例、雜合率和GC含量等參數(shù)會(huì)影響基因組的拼接組裝過(guò)程[4]?;蚪M大小是指物種單倍體所含的DNA量,是表征生物基因組多樣性的基本參數(shù)[5]。目前測(cè)定基因組大小的方法很多,流式細(xì)胞法(Flow cytometry,F(xiàn)CM)因其快速、準(zhǔn)確的特點(diǎn)而被廣泛應(yīng)用[6],超過(guò)80%的物種都是采用該方法進(jìn)行基因組大小測(cè)定[7],如棗、月季、草莓、靈芝[8-11]等。近年來(lái),采用低深度測(cè)序后進(jìn)行K-mer分析也是常用方法之一[12]。通過(guò)低深度高通量測(cè)序(Survey分析)判斷基因組大小及復(fù)雜程度,以此選擇合適的后續(xù)測(cè)序方案,從而增加測(cè)序的準(zhǔn)確性[13]。
由于倍性復(fù)雜,甘薯遺傳基礎(chǔ)薄弱,導(dǎo)致甘薯的物種起源和基因組學(xué)研究落后于其他主要農(nóng)作物[14]。近年來(lái)甘薯基因組研究逐漸興起,然而甘薯屬多數(shù)物種仍缺乏基本的基因組信息。Ipo?moeacordatotriloba是甘薯組與栽培甘薯親緣關(guān)系較近的13個(gè)物種之一,對(duì)研究甘薯親緣關(guān)系及物種起源具有重要意義。本研究利用流式細(xì)胞術(shù)和染色體計(jì)數(shù)法,結(jié)合高通量測(cè)序技術(shù),對(duì)I. cordatotriloba的基因組大小、倍性及基因組特征進(jìn)行評(píng)估,為下一步全基因組測(cè)序提供參考并為甘薯野生資源利用提供支撐。
1.1材料
Ipomoea cordatotriloba(PI 518495)引自美國(guó)國(guó)家種質(zhì)資源庫(kù),來(lái)源地為墨西哥Tabasco州。用已知基因組大小的大豆Williams 82(1?C= 1127?Mb[15])作為內(nèi)參。
1.2方法
1.2.1? 流式細(xì)胞術(shù)? 將搜集的野生種種子浸種催芽之后置于25?℃的溫室內(nèi)生根,于1~2?d后取200?mg根尖進(jìn)行實(shí)驗(yàn);參照Peggy Ozias-Akins[16]的實(shí)驗(yàn)方法,取樣后用蒸餾水洗凈、晾干,放入預(yù)冷的無(wú)菌培養(yǎng)皿中,加入預(yù)冷4?℃的改良硫酸鎂裂解液600 μL。材料須浸沒(méi)在裂解液中,用一次性滅菌刀片在一分鐘內(nèi)快速切碎該組織;用38?μm篩網(wǎng)過(guò)濾到1.5?mL EP管中;以2000 r/min離心6?min,棄上清液;加入200?μL PI染液(含濃度為50?μg/mL的RNase酶)置于4?℃冰箱避光染色15?min,添加染料后震蕩EP管;最后用BD公司C6流式細(xì)胞儀收集10 000個(gè)事件,重復(fù)測(cè)定3次。通過(guò)公式(1)計(jì)算基因組大小[17](單位用pg或Mb來(lái)表示,兩者間的換算關(guān)系為1?pg=978 Mb[18])。
1.2.2? 染色體壓片? 參照楊慧嫻等[19]的方法,取I. cordatotriloba新鮮1 cm根尖于8-羥基喹啉中處理2~3 h,經(jīng)蒸餾水洗凈后轉(zhuǎn)移至卡諾固定液中,24 h后于70%酒精中保存?zhèn)溆?。?shí)驗(yàn)時(shí),取出根尖先用無(wú)菌水沖洗2~3次,再用檸檬酸沖洗2次,吸干檸檬酸后加入200 μL 2%纖維素酶和1%果膠酶的混合酶液進(jìn)行酶解。切取根尖于載玻片上,用濾紙吸走多余水分,取干凈的鑷子輕輕敲打根尖。制片成功后加DAPI染色,于熒光顯微鏡下觀察并拍照。
1.2.3? 基因組survey分析? 取4~6片甘薯野生種I. cordatotriloba葉片,洗凈后置于液氮保存,委托北京諾禾致源科技股份有限公司進(jìn)行測(cè)序。通過(guò)Covaris超聲波破碎儀將DNA樣品隨機(jī)打斷,構(gòu)建250 bp小片段測(cè)序文庫(kù)。將得到的原始序列數(shù)據(jù)進(jìn)行質(zhì)控,去除污染序列,得到有效數(shù)據(jù),采用K-mer計(jì)算方法[20]分析有效數(shù)據(jù)。通過(guò)公式(2)、(3)可估計(jì)基因組大小。通過(guò)公式(4)(適用于重復(fù)序列影響較小的基因組)計(jì)算雜合率,參照霍愷森等[12]的方法(純合峰深度1.8倍后面的K-mer數(shù)/K-mer總數(shù)?100%)來(lái)估計(jì)重復(fù)序列比例。
1.2.4? 基因組初步組裝? 通過(guò)被reads截?cái)嗟母⌒蛄衅沃g的重疊關(guān)系構(gòu)建de Brujin圖,去掉測(cè)序錯(cuò)誤造成的分支,隨機(jī)選擇少量雜合位點(diǎn)并合并。將簡(jiǎn)化后的de Brujin圖的每個(gè)分叉位點(diǎn)的序列截?cái)?,即為最初的Contigs。再將reads和Contigs進(jìn)行比對(duì),將Contigs組裝成Scaffolds。
2.1流式分析結(jié)果
圖1為大豆作為內(nèi)參時(shí),參照物與待測(cè)樣本的熒光強(qiáng)度圖。圖中I. cordatotriloba和大豆主峰清晰可見(jiàn),區(qū)分明顯。圖1中3個(gè)峰分別為I. cor?datotriloba的G1峰,Williams 82大豆的G1峰以及G2峰。參照物和樣本峰的CV值均小于5%,表明測(cè)定結(jié)果穩(wěn)定可靠。通過(guò)對(duì)參照物和待測(cè)樣品3個(gè)生物學(xué)重復(fù)測(cè)定,I. cordatotrilobaG1峰的平均熒光強(qiáng)度為71?291.67,Williams 82大豆G1峰的平均熒光強(qiáng)度為148 601.00,根據(jù)公式(1)計(jì)算得出(表1),I. cordatotriloba基因組大小為(539.69±13.76)Mb。
2.2染色體壓片結(jié)果
通過(guò)染色體壓片計(jì)數(shù)法,確定I. cordatotriloba的倍性。DAPI染液只對(duì)染色體進(jìn)行特異性染色,雜質(zhì)無(wú)法被染色,因此較易判斷染色體的輪廓,背景干凈,計(jì)數(shù)較方便。I. Corda?totri?lo?ba染色體形態(tài)清晰,呈長(zhǎng)棒狀,分散良好,粘連現(xiàn)象較少,存在拖尾現(xiàn)象但不影響計(jì)數(shù)(圖2)。通過(guò)觀察10個(gè)細(xì)胞的分裂相,染色體數(shù)目均為30條,由于甘薯屬植物染色體基數(shù)x=15,從而獲知I. cordatotriloba為二倍體。
2.3基因組survey分析結(jié)果
2.3.1? 測(cè)序產(chǎn)出數(shù)據(jù)統(tǒng)計(jì)? 對(duì)經(jīng)過(guò)Illumina高通量測(cè)序技術(shù)得到的數(shù)據(jù)進(jìn)行嚴(yán)格過(guò)濾,得到24.46?Gb的有效數(shù)據(jù)用于K-mer分析。由表2可知,測(cè)序質(zhì)量≥20的堿基比率為97.01%,測(cè)序質(zhì)量≥30的堿基比率達(dá)到92.05%,說(shuō)明I. cordatotriloba基因組的測(cè)序質(zhì)量較高。
2.3.2? K-mer分析及基因組特征預(yù)估? 本研究選用K-mer=17進(jìn)行分析,其頻率分布圖(圖3)顯示,I. cordatotriloba的期望深度即圖中的主峰,在38附近,且主峰的2倍處有凸起,表明樣品有一定重復(fù)率,經(jīng)計(jì)算I. cordatotriloba的重復(fù)序列比率為57.93%,并根據(jù)公式(4)得到雜合率為0.40%。由表3可知,I. cordatotriloba的K-mer數(shù)量為18 867 813 720,通過(guò)公式(3)計(jì)算得出I. cordatotriloba基因組大小為571.75 Mb,經(jīng)修正后為560.70 Mb。
2.3.3? 基因組組裝結(jié)果分析? K-mer值取41時(shí)可得到最優(yōu)的拼接效果。將24.46?Gb有效數(shù)據(jù)進(jìn)行拼接,分別得到978?566條Contigs和961?850條Scaffolds;由表4可知,I. corda?to?triloba經(jīng)組裝后得到Contigs總長(zhǎng)度為466?005?979?bp,占基因組大小的81.3%,其中最長(zhǎng)為67?068?bp。Scaffolds總長(zhǎng)度為467?229?510?bp,占基因組大小的81.5%,最長(zhǎng)為67?068?bp。
圖4顯示I. cordatotriloba只有1個(gè)明顯的峰,與K-mer結(jié)合分析得知,該樣品為純合峰。如圖5,右方是測(cè)序深度分布,上方是GC含量分布,圖中顏色越紅,表示密度越大。GC含量分布在25%~55%,由上方含量分布峰可知40%?左右最密集,預(yù)估樣本的GC含量為38.10%。圖中未出現(xiàn)明顯分層現(xiàn)象,且無(wú)高GC含量區(qū)域,故認(rèn)為I. cordatotriloba無(wú)細(xì)菌污染。
基因組大小是分析種群進(jìn)化、物種分類和生態(tài)學(xué)等領(lǐng)域研究的重要參照[21]。本研究通過(guò)對(duì)I. cordatotriloba基因組大小進(jìn)行測(cè)定,為探究甘薯近緣野生種的基因組學(xué)信息提供參考。張志珂等[22]用蘿卜、大豆、番茄做外參,通過(guò)流式細(xì)胞術(shù)估算‘解放鐘枇杷基因組大小為654.399 Mb,與測(cè)序得到的結(jié)果773?Mb有較大的差異,誤差達(dá)15.3%。Bennett等[23]以新桿狀線蟲(chóng)和果蠅作為內(nèi)標(biāo)測(cè)得擬南芥的基因組大小為157 Mb,與早期測(cè)序得到的125?Mb也存在較大差異,誤差為基因組大小的25.6%。本研究以Williams 82大豆為內(nèi)參,通過(guò)流式細(xì)胞儀測(cè)定I. cordatotriloba的基因組大小為(539.69±13.76)Mb?;贙-mer分析得到的I. cordatotriloba的基因組大小為560.70?Mb,與流式細(xì)胞術(shù)得到的結(jié)果誤差僅為3.7%,說(shuō)明2種測(cè)定方法得到的結(jié)果較為接近。前人研究表明I. cordatotriloba是四倍體,基因組大小為3.3?pg/2C[16],與本研究得出的基因組大小差異較大。隨著科學(xué)技術(shù)的發(fā)展,現(xiàn)代的流式細(xì)胞儀器更先進(jìn),準(zhǔn)確性更高,且本研究根據(jù)染色體計(jì)數(shù)得出I. cordatotriloba為二倍體,結(jié)合survey預(yù)估的數(shù)據(jù)認(rèn)為本研究的結(jié)果更為準(zhǔn)確。
植物基因組雜合受到品系、繁殖方式等因素影響[24]。甘薯具有自交不親和性[25],有性繁殖和無(wú)性繁殖共存。雜合率低的植物種群內(nèi)及種群間基因交流程度低,基因資源穩(wěn)定,環(huán)境適應(yīng)能力較強(qiáng)[26]。郭水良等[27]認(rèn)為同一科(或?qū)伲﹥?nèi)相關(guān)物種間的DNA C-值較小的植物可能具有更強(qiáng)的入侵性。甘薯近緣野生種馬鞍藤(Ipomoea pes-ca?praeL.)雜合率為0.99%,DNA C-值為1041.65 Mb[12],I. cordatotriloba雜合率為0.40%,DNA C-值為560.70 Mb;由此推測(cè),I. cordatotriloba環(huán)境適應(yīng)能力比馬鞍藤更強(qiáng),是進(jìn)一步篩選優(yōu)異基因資源、研究甘薯近緣野生種的重要材料。
從Sanger測(cè)序到第2代(Roche 454、SoLiDTM、Illumina)測(cè)序平臺(tái)以及第3代PacBio測(cè)序平臺(tái),基因組測(cè)序的蓬勃發(fā)展使得測(cè)序技術(shù)普遍應(yīng)用于植物研究中[28]?;蚪M越大、倍性越高對(duì)測(cè)序技術(shù)、機(jī)器性能要求越高;而雜合度會(huì)導(dǎo)致組裝基因組偏大,數(shù)值高于0.5%則認(rèn)為該品種不易組裝,高于1%則認(rèn)為該品種很難實(shí)現(xiàn)組裝[29-30]。本研究利用二代Illumina測(cè)序平臺(tái)對(duì)I. cord?a?totriloba進(jìn)行K-mer分析,得到I. cordatotriloba基因組大小為560.70?Mb,雜合率為0.40%,重復(fù)序列比率為57.93%,GC含量為38.10%,具有一定重復(fù)率和較低的雜合度。結(jié)合染色體壓片法進(jìn)行染色體計(jì)數(shù)可知I. cordatotriloba為二倍體。綜上所述,研究認(rèn)為I. cordatotriloba為簡(jiǎn)單基因組,可盡快實(shí)施全基因組測(cè)序計(jì)劃,可采用低成本二代測(cè)序技術(shù)進(jìn)行全基因組測(cè)序。以上結(jié)果為I. cordatotriloba全基因組測(cè)序策略的選取和甘薯近緣野生種的利用提供參考。
參考文獻(xiàn)