張小燕,劉志香,廖保生,肖水明,徐 江**,盛 瑋
(1.淮北師范大學(xué)生命科學(xué)學(xué)院 淮北 235000;2.中國中醫(yī)科學(xué)院中藥研究所 北京 100700)
本草基因組學(xué)(herbgenomics)是利用組學(xué)技術(shù)研究中藥基原物種的遺傳信息及其調(diào)控網(wǎng)絡(luò),闡明中藥防治人類疾病分子機(jī)制的學(xué)科,從基因組水平研究中藥及其對人體作用的前沿科學(xué)[1,2]。人參作為我國傳統(tǒng)名貴藥材,享有“百草之王”美譽(yù)。人參具有48條染色體(2n=4x=48)[3],由于基因組數(shù)據(jù)的缺乏嚴(yán)重制約了人參基礎(chǔ)研究和產(chǎn)業(yè)的開展。評價(jià)人參基因組的大小及復(fù)雜程度,將有助于確定適合人參全基因組測序的研究策略。目前多種方法可用于測定基因組大小,如物理圖譜法[4]、流式細(xì)胞術(shù)[5-7]和高通量測序技術(shù)[8,9]。流式細(xì)胞術(shù)是基因組預(yù)估常用的方法[10],可檢測單細(xì)胞倍性以及細(xì)胞核DNA含量[11,12],具有特異性好,靈敏度高,同時(shí)進(jìn)行多參數(shù)檢測等優(yōu)點(diǎn)。新一代測序技術(shù)的迅速發(fā)展使其成為測定基因組大小的重要方法,具有通量高、速度快、單次運(yùn)行能產(chǎn)生大量數(shù)據(jù)等優(yōu)點(diǎn)。
本研究聯(lián)合流式細(xì)胞術(shù)和高通量測序技術(shù)對人參基因組進(jìn)行測定和評估,并把這兩種技術(shù)的測定結(jié)果進(jìn)行相互驗(yàn)證,旨在為人參全基因組測序方案的制定提供依據(jù),為人參本草基因組學(xué)[1,2]的研究奠定基礎(chǔ)。
人參(Panax ginsengC.A.Mey)(實(shí)驗(yàn)基地栽培株系IR826);大豆(Glycine max(L.)Merrill);粳稻(Oryza sativassp.Nipponbare)。
Accuri C6型流式細(xì)胞儀(美國BD公司),1-14K低溫冷凍離心機(jī)(美國Sigma公司);RXZ型智能人工氣候箱(寧波江南儀器廠);DK-8D型電熱恒溫水槽(上海森信實(shí)驗(yàn)儀器有限公司);Illumina Hiseq X Ten(美國Illumina公司);Agilent Technologies 2100生物分析儀(美國 Agilent公司);Covaris M220 Focusedultrasonicator(美國Covaris公司)。
吐溫-20(Sigma-Aldrich,cat.No.SZBD2190V);碘化丙啶(BD Biosciences Pharmingen,cat.No.550825);RNaseA(TIANGEN,cat.No.K20822);Quick-Load 1kb Extend DNA Ladder(BioLabs,cat.No.0041602)。
水稻、大豆材料培養(yǎng):選取飽滿成熟完整的水稻和大豆種子,用去離子水沖洗種子3-5次,并浸泡過夜,將種子放在浸濕的有孔濾膜上,置于燒杯中室溫條件下培養(yǎng)一周。
人參愈傷組織培養(yǎng):切取人參幼嫩的葉片置于含有植物激素的MS培養(yǎng)基(1 mg·L-12,4-二氯苯氧乙酸,0.1 mg·L-1激動素)上,于12 h黑暗、12 h光照的20±2℃恒溫培養(yǎng)中培養(yǎng)。
水稻與大豆均取其幼嫩的葉各兩份,每份質(zhì)量100 mg,人參取其愈傷組織各兩份,每份質(zhì)量200 mg,將其置于冰浴的培養(yǎng)皿中,吸取2 mL Otto I緩沖液(0.1 mol·L-1檸檬酸,0.5%(v/v)吐溫-20,pH 2.0-3.0),用鋒利刀片迅速將葉片、愈傷組織切碎;用移液器反復(fù)吹打使其與緩沖液混合均勻,經(jīng)40μm尼龍篩網(wǎng)(Corning,cat.No.352340)過濾,濾液置入2 mL的離心管,于4℃離心機(jī)中以5000 r·min-1離心3 min去除上清,加入1 mL預(yù)冷的Otto I緩沖液,重懸后,2600 r·min-1離心30 s,去上清,加入1 mL預(yù)冷的Otto I緩沖液,再次2600 r·min-1離心30 s去上清,加入900 μL的Otto I緩沖液,輕搖混勻,置于冰上待用。上機(jī)檢測前加入600 μL的Otto II緩沖液(0.4 mol·L-1磷酸二氫鈉,pH 8.0-9.0),加等體積的碘化丙啶(propidium iodide,PI)染料,避光染色15 min。
經(jīng)PI染色的樣品,在高速液流下受到激光照射,發(fā)射產(chǎn)生熒光信號,其熒光信號的強(qiáng)弱與DNA含量成正比,可用于估測生物基因組大小。本實(shí)驗(yàn)選取水稻和大豆為內(nèi)參,根據(jù)公式:樣品基因組大小=(樣品平均峰值/內(nèi)參平均峰值)×內(nèi)參基因組大小,獲得待測樣品的基因組大小。再根據(jù)1 pg=0.978×109bp[13]計(jì)算得到待測樣品的相對DNA含量。
取人參愈傷組織,采用CTAB法提取人參基因組DNA,Qubit 2.0檢測濃度,瓊脂糖凝膠電泳檢測基因組完整性,檢測參數(shù)為膠濃度0.8%,電壓為120 V,電泳時(shí)間為30 min,選用1 kb Extend DNA Ladder作為參照。
對符合質(zhì)量要求的DNA樣品構(gòu)建shotgun文庫,首先基因組DNA片段化成約250-500 bp的片段,在片段兩端連接接頭序列,篩選去除接頭序列自連片段,而后采用瓊脂糖凝膠電泳進(jìn)行片段的長度篩選,氫氧化鈉變性產(chǎn)生單鏈DNA片段,進(jìn)行橋式PCR擴(kuò)增。最后用Illumina Hiseq X Ten平臺進(jìn)行雙末端PE 150測序,通過Skewer軟件(Version 0.2.2)過濾低質(zhì)量數(shù)據(jù)后,得到的高質(zhì)量數(shù)據(jù)用于后續(xù)的基因組大小、雜合度以及GC含量分析。
本實(shí)驗(yàn)采用基于K-mer的分析方法估計(jì)人參基因組大小和雜合率,所得數(shù)據(jù)進(jìn)行17-mer分析。假設(shè)從reads中逐堿基取出所有K-mer能夠遍歷整個(gè)基因組,且K-mer頻次分布服從泊松分布,即可從所有測序reads中逐堿基取K-mer,統(tǒng)計(jì)K-mer頻數(shù)分布,然后以K-mer及其出現(xiàn)的次數(shù)為橫坐標(biāo),以出現(xiàn)次數(shù)的片段總數(shù)占總片段的百分比為縱坐標(biāo)作圖,計(jì)算獲得K-mer深度估計(jì)值,用于估計(jì)基因組大小。
本研究選用模式生物擬南芥基因組序列進(jìn)行人參基因組雜合率評估。分別加入雜合率為1%,0.5%和0.1%的模擬數(shù)據(jù)進(jìn)行擬合,將所得模擬數(shù)據(jù)分別進(jìn)行17-mer分析。通過所測物種真實(shí)曲線的主峰和雜合峰與模擬數(shù)據(jù)線的對比,可判斷所測物種雜合率水平與最接近的模擬數(shù)據(jù)相近。
首先對水稻,大豆和人參進(jìn)行單獨(dú)測定,比較分析了待測樣品水稻與大豆、大豆與人參、水稻大豆與人參測定的結(jié)果,確定了水稻、大豆與人參的基因組測定峰無重疊,保證了選取水稻和大豆作為內(nèi)參的可靠性,可用于預(yù)測基因組大小(圖1)。由表1可以看出,通過比較其峰均值,大豆基因組為水稻的2.25倍,由此預(yù)估得到大豆的基因組大小為0.89±0.02 Gb,其DNA相對含量為1.82±0.03 pg;人參基因組大小是大豆的3.71倍(表2),因此可得人參基因組大小為3.32±0.02 Gb,其DNA相對含量為6.79±0.05 pg。另外,水稻、大豆和人參峰均值進(jìn)行比較,大豆基因組大小是水稻的2.40倍,人參是大豆的3.58倍(表3),由此可估測大豆基因組大小為0.95±0.01 Gb,相對DNA含量為1.95±0.02 pg,人參基因組大小為3.42±0.02 Gb,相對DNA含量為6.98±0.05 pg。
圖1 水稻、大豆,人參流式細(xì)胞儀測定結(jié)果
表1 流式細(xì)胞儀測定的樣品(大豆)和內(nèi)參(水稻)峰均值
表2 流式細(xì)胞儀測定的樣品(人參)和內(nèi)參(大豆)峰均值
表3 流式細(xì)胞儀測定的樣品(大豆,人參)和內(nèi)參(水稻)峰均值
3.2.1 測序數(shù)據(jù)量統(tǒng)計(jì)
如表4所示,經(jīng)高通量測序得到的原始數(shù)據(jù)為191.41 Gb,按照流式細(xì)胞所得人參基因組大小為3.42 Gb計(jì)算測序深度為55.97 X。過濾掉低質(zhì)量數(shù)據(jù)后,得到的總數(shù)據(jù)量為183.82 Gb,測序深度為53.75 X。
3.2.2 17-mer分析和基因組大小預(yù)測
使用人參基因組過濾后有183.82 Gb的數(shù)據(jù)用于17-mer分析,Reads形成17-mer頻率深度分布圖,如圖2。橫、縱坐標(biāo)分別表示17-mer出現(xiàn)的次數(shù)和出現(xiàn)的頻率。圖中在49 X深度和100 X深度位置分別有一個(gè)峰,其中49 X的位置為主峰,即基因組正常期望深度,100 X位置為重復(fù)峰位置。從表5可以看出,K-mer的總數(shù)為163927.97,可以通過公式:基因組大小=K-mer的總數(shù)/K-mer的期望深度,計(jì)算得到的人參基因組大小為3.35 Gb。
3.2.3 雜合率估計(jì)
選用擬南芥基因組作為訓(xùn)練序列集,模擬1%,0.5%和0.1%雜合程度情況下17-mer的分布曲線,從而對人參的雜合度進(jìn)行定性評估。由圖3研究結(jié)果可知,人參的雜合度與雜合度為0.1%的擬南芥模擬數(shù)據(jù)最接近,因此,可以認(rèn)為人參的雜合率處于0.1%左右,其基因組雜合度較低。
流式細(xì)胞術(shù)是應(yīng)用較多的基因組預(yù)測方法,已被成功的應(yīng)用于五節(jié)芒[7]、毛竹[14]、山櫻花[15]等植物的基因組大小研究上,在樣品處理上,要求被檢測的植物樣本必須是完整的單細(xì)胞或細(xì)胞核懸液,因此,實(shí)驗(yàn)操作中取材上優(yōu)先選取新鮮葉片或幼嫩葉片,置于冰上并充分切碎。高通量測序技術(shù)的迅速發(fā)展使其成為基因組評估的重要手段,利用K-mer分析的方法對基因組進(jìn)行預(yù)估,其操作較為簡單,而且獲得除基因組外更多的物種信息,如物種的雜合率、重復(fù)序列、GC含量等[16]。然而,流式細(xì)胞儀在檢測植物樣品時(shí)由于植物細(xì)胞結(jié)構(gòu)及次生代謝產(chǎn)物的影響,會對檢測結(jié)果造成一定的干擾[17]。高通量測序技術(shù)用于預(yù)測植物基因組大小,克服了內(nèi)源性物質(zhì)對植物基因組大小評估的影響[16,18]。因此對植物基因組大小的預(yù)測選取流式細(xì)胞術(shù)和K-mer分析相結(jié)合,以期獲得更好的結(jié)果。
本研究采用流式細(xì)胞術(shù)和K-mer分析的方法得到人參基因組大小分別為3.42 Gb和3.35 Gb。基因組雜合度評估顯示人參基因組有較低的雜合度,雜合率約為0.1%;但重復(fù)序列較高,因此對人參進(jìn)行全基因組組裝,可使用BAC-by-BAC策略以及構(gòu)建大片段文庫,跨越重復(fù)區(qū)。本研究結(jié)果有助于人參全基因組的de novo組裝和功能基因注釋等本草基因組學(xué)的研究。
表4 人參基因組數(shù)據(jù)量統(tǒng)計(jì)
圖2 17-mer分布曲線
圖3 17-mer雜合率估計(jì)圖
表5 17-mer分析數(shù)據(jù)統(tǒng)計(jì)
1 陳士林,宋經(jīng)元.本草基因組學(xué).中國中藥雜志,2016,21(41):3881-3889.
2 Chen S L,Song J Y,Sun C,et al.Herbal genomics:examining the biology of traditional medicines.Science,2015,347(6219):S27-S29.
4 Huang Z H,Xu J,Xiao S M,et al.Comparative optical genome analysis of two pangolin species:Manis pentadactyla and Manis javanica.Gigascience,2016,5(1):1-5.
5 王亞之,李秋實(shí),陳士林,等.基于流式細(xì)胞分析技術(shù)的茯苓基因組大小測定.世界科學(xué)技術(shù)-中醫(yī)藥現(xiàn)代化,2010,12(3):452-456.
6 李秋實(shí),徐江,朱英杰,等.基于流式細(xì)胞技術(shù)的靈芝基因組大小估測.菌物學(xué)報(bào),2013,32(5):899-906.
7 鄧果特,劉清波,蔣建雄,等.五節(jié)芒基因組大小測定.植物遺傳資源學(xué)報(bào),2013,14(2):339-341.
8 Chen S L,Xu J,Liu C,et al.Genome sequence of the model medicinal mushroom Ganoderma lucidum.Nat Commu,2012,3(2):913-921.
9 Xu H B,Song J Y,Luo H M,et al.Analysis of the Genome Sequence of the Medicinal Plant Salvia miltiorrhiza.Mol Plant,2016,9(6):949-952.
10 Dolezel J,Greilhuber J,Suda J.Estimation of nuclear DNA content in plants using flow cytometry.Nat Protoc,2007,2(9):2233-2244.
11 Miyashita T,Araki H,Hoshino Y.Ploidy distribution and DNA content variations of Lonicera caerulea(caprifoliaceae)in Japan.J Plant Res,2011,124(1):1-9.
12 Obidiegwu J,Rodriguez E,Eneobong E.Ploidy levels ofDioscorea alataL.germplasm determined by flow cytometry.Genet Resour Crop Evol,2010,57(3):351-356.
13 Bennett M D,Leitch I J.Genome Size Evolution in Plants.The evolution of the genome,2005:89-162.
14李潞濱,武靜宇,胡陶,等.毛竹基因組大小測定.植物學(xué)報(bào),2008,25(5):574-578.
15李禎,伊賢貴,顧宇,等.山櫻花基因組大小的測定.南京林業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,38(S1):17-19.
16唐其,馬小軍,莫長明,等.羅漢果全基因組Survey分析.廣西植物,2015,35(6):786-791.
17汪艷,肖媛,劉偉,等.流式細(xì)胞儀檢測高等植物細(xì)胞核DNA含量的方法.植物科學(xué)學(xué)報(bào),2015,33(1):126-131.
18 Zhang T Z,Hu Y,Jiang W K,et al.Sequencing of allotetraploid cotton(Gossypium hirsutumL.acc.TM-1)provides a resource for fiber improvement.Nat Biotechnol,2015,33(5):531-537.