国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組SSR和SNP分析

2018-09-05 06:17焦秀潔更吉卓瑪賈留坤王智華陳世龍高慶波
西北植物學(xué)報(bào) 2018年7期
關(guān)鍵詞:虎耳草基元堿基

李 彥, 焦秀潔,更吉卓瑪,賈留坤,王智華,陳世龍,高慶波,4*

(1 中國(guó)科學(xué)院 西北高原生物研究所,高山植物適應(yīng)與進(jìn)化重點(diǎn)實(shí)驗(yàn)室,西寧 810001;2 中國(guó)科學(xué)院大學(xué),北京 100039;3中國(guó)科學(xué)院 西北高原生物研究所,信息與學(xué)報(bào)編輯部,西寧 810001;4 中國(guó)科學(xué)院 西北高原生物研究所,青海省作物分子育種重點(diǎn)實(shí)驗(yàn)室,西寧 810001)

近年來(lái),隨著現(xiàn)代分子生物學(xué)技術(shù)的發(fā)展,第二代簡(jiǎn)單重復(fù)序列標(biāo)記和第三代單核苷酸多態(tài)性標(biāo)記已逐漸成為動(dòng)植物遺傳多樣性分析、系統(tǒng)發(fā)育和進(jìn)化研究中使用較為廣泛的遺傳標(biāo)記,并成為了生命科學(xué)研究領(lǐng)域一個(gè)不可或缺的工具。簡(jiǎn)單重復(fù)序列(simple sequence repeats,SSR),又稱(chēng)微衛(wèi)星(microsatellite),是一類(lèi)由幾個(gè)核苷酸(2~6個(gè))為重復(fù)單位組成的長(zhǎng)達(dá)幾十個(gè)核苷酸的重復(fù)序列,廣泛分布于真核生物基因組中,約每10~50 kb的序列中就有1個(gè)微衛(wèi)星位點(diǎn),且具有共顯性、長(zhǎng)度短、多態(tài)性高、易于檢測(cè)和相對(duì)保守等特點(diǎn)[1-3]。

單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)指染色體基因組中單個(gè)核苷酸的變異而引起的DNA序列多態(tài)性,形式包括單堿基的缺失、插入、轉(zhuǎn)換及顛換等[4]。SNP是二等位基因,具有在基因組中分布廣泛、多樣性高及可高通量自動(dòng)化檢測(cè)等特點(diǎn)[5]。

虎耳草屬(SaxifragaL.)是虎耳草科(Saxifragaceae)中最大的屬,大約有450~500種,主要分布在歐洲和亞洲的高山地區(qū)[6-7]。中國(guó)產(chǎn)約220種虎耳草屬植物,主要分布在青藏高原-喜馬拉雅地區(qū)[8]。山地虎耳草(SaxifragasinomontanaJ.T. Pan & Gornall)和棒腺虎耳草(SaxifragaconsanguineaW.W. Smith)均隸屬于虎耳草科虎耳草屬,是多年生草本植物,在中國(guó)主要分布于青海、甘肅、四川、云南及西藏等地,其生境多為高海拔地區(qū)的高山草甸、灌叢和石隙[8],是青藏高原地區(qū)高寒草甸生態(tài)系統(tǒng)的重要組成部分。此外,二者形態(tài)學(xué)差別較大,主要體現(xiàn)為山地虎耳草基生葉發(fā)達(dá),邊緣具有褐色卷曲長(zhǎng)柔毛,而棒腺虎耳草莖基部葉腋處有絲狀鞭匐枝,且基生葉密集聚成蓮座狀,邊緣具腺睫毛(短棒狀)[8]。目前DNA分子標(biāo)記已廣泛應(yīng)用于虎耳草屬植物的系統(tǒng)發(fā)育學(xué)和譜系地理學(xué)研究,結(jié)果表明對(duì)于該屬內(nèi)的不同物種,其遺傳結(jié)構(gòu)和進(jìn)化歷史不盡相同[6-7,9-12]。

本研究基于山地虎耳草和棒腺虎耳草的高通量測(cè)序結(jié)果,分析和比較SSR和SNP在2個(gè)物種內(nèi)的分布規(guī)律和特點(diǎn),為后期SSR標(biāo)記的開(kāi)發(fā)和系統(tǒng)發(fā)育學(xué)研究奠定理論基礎(chǔ)。

1 材料和方法

1.1 樣品采集和高通量測(cè)序

山地虎耳草(S.sinomontana)和棒腺虎耳草(S.consanguinea)分別采集于青海省玉樹(shù)藏族自治州玉樹(shù)縣小蘇莽鄉(xiāng)(32°34′20.7″N,97°12′41.6″E,4 880 m)、青海省玉樹(shù)藏族自治州玉樹(shù)縣勒巴溝(32°55′18.2″N,97°13′54.4″E,3 667 m)。將野外采集的活體材料置于室內(nèi)種植68 d,再采取二者同一叢植株上的葉片,放入冷凍管中,用液氮處理約15 s后放入-80 ℃冰箱保存。憑證標(biāo)本保存于中國(guó)科學(xué)院西北高原生物研究所青藏高原生物標(biāo)本館(HNWP)。

分別從山地虎耳草和棒腺虎耳草的葉片材料中提取100 μg總RNA;利用諾禾致源生物信息科技有限公司的Illumina HiSeqTM2000高通量測(cè)序平臺(tái)對(duì)其進(jìn)行測(cè)序;對(duì)測(cè)得的原始序列(Raw reads)進(jìn)行過(guò)濾:去除帶接頭(adapter)的、N比例大于10%的以及低質(zhì)量的reads,得到干凈的讀序(Clean reads);最終用Trinity[13]將其拼接成一個(gè)轉(zhuǎn)錄組,并取每條基因中最長(zhǎng)的轉(zhuǎn)錄本作為Unigene,以此進(jìn)行后續(xù)分析。

1.2 SSR和SNP的篩選和統(tǒng)計(jì)分析

用MicroSatellite(MISA;http://pgrc. ipk-gatersleben. de/misa/)對(duì)Unigene進(jìn)行SSR檢測(cè)、篩選和分析。檢索標(biāo)準(zhǔn)同時(shí)包括精確型(perfect)和復(fù)合型(compound)SSR重復(fù)單元[14],各重復(fù)微衛(wèi)星類(lèi)型重復(fù)次數(shù)設(shè)定如下:兩堿基(di-nucleotide repeats,DNRs)至少重復(fù)6次,三堿基(tri-nucleotide repeats,TNRs)至少重復(fù)5次,四堿基(tetra-nucleotide repeats,TTNRs)至少重復(fù)5次,五堿基(penta-nucleotide repeats,PTNRs)至少重復(fù)5次,六堿基(hexanucleotide repeats,HXNRs)至少重復(fù)5次。最終對(duì)SSR出現(xiàn)頻率、重復(fù)基元類(lèi)型、重復(fù)次數(shù)及其多態(tài)性進(jìn)行統(tǒng)計(jì)分析。

通過(guò)samtools和picard-tools等工具對(duì)比對(duì)結(jié)果進(jìn)行染色體坐標(biāo)排序并去掉重復(fù)的reads等處理,最后利用變異檢測(cè)軟件CATK2[15]以Unigene為參考序列對(duì)reads進(jìn)行SNP Calling,并對(duì)原始結(jié)果進(jìn)行過(guò)濾:去除質(zhì)量值小于30,距離小于5的SNP。最終對(duì)得到的SNP位點(diǎn)位于編碼區(qū)或者非編碼區(qū),以及屬于編碼區(qū)中的同義轉(zhuǎn)換或者非同義轉(zhuǎn)換的SNP數(shù)量進(jìn)行統(tǒng)計(jì)分析。

2 結(jié)果與分析

2.1 山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組測(cè)序結(jié)果

對(duì)于RNA-seq技術(shù),其測(cè)序錯(cuò)誤率會(huì)隨著測(cè)序序列長(zhǎng)度的增加而升高,這是測(cè)序過(guò)程中化學(xué)試劑的消耗所導(dǎo)致的[16-17],其次,可能因?yàn)殡S機(jī)引物與RNA模板的不完全結(jié)合使得前6個(gè)堿基的位置也會(huì)發(fā)生較高的測(cè)序錯(cuò)誤率[17],且單個(gè)堿基位置的測(cè)序錯(cuò)誤率一般在1%以下。本研究中,山地虎耳草和棒腺虎耳草分別獲得94 855 756條和93 118 446條Raw reads,過(guò)濾后分別獲得90 311 228條、88 874 280條Clean reads,分別占Raw reads的95.21%和95.44%。其中,兩物種的單堿基錯(cuò)誤率分別為0.035%和0.04%,堿基Q20分別為94.36%、94.00%,堿基Q30分別為88.98%、88.38%,堿基G和C的數(shù)量總和比例分別為42.39%和42.44%。

用Trinity軟件對(duì)所得的Clean reads進(jìn)行拼接,最終山地虎耳草獲得176 110個(gè)Transcripts 和63 763個(gè)Unigene,棒腺虎耳草獲得150 308個(gè)Transcripts 和60 972個(gè)Unigene(圖1);之后對(duì)2個(gè)物種的Transcripts和Unigene的長(zhǎng)度統(tǒng)計(jì)結(jié)果(圖1)表明,在山地虎耳草中Transcripts和Unigene總的核苷酸數(shù)分別為189 919 691個(gè)、46 218 250個(gè),棒腺虎耳草中二者總的核苷酸數(shù)分別為180 129 302個(gè)、47 241 106個(gè)。

2.2 山地虎耳草和棒腺虎耳草SSR的頻率及其分布

采用MISA對(duì)Unigene進(jìn)行SSR檢測(cè),結(jié)果顯示:山地虎耳草中含有SSR的序列為7 700條,發(fā)生頻率為12.08%,其中6 454條序列含有單個(gè)SSR,1 246條序列含有1個(gè)以上的SSR。表1顯示,山地虎耳草中共檢測(cè)出4 622個(gè)SSR,包括4 098個(gè)完全型SSR和524個(gè)復(fù)合型SSR,其發(fā)生頻率為7.25%(檢測(cè)出的SSR數(shù)量與總序列數(shù)目的比值)。在棒腺虎耳草中,共7 073條序列含有SSR,發(fā)生頻率為11.60%,其中5 981條序列含有單個(gè)SSR,1 092條序列含有1個(gè)以上的SSR,共檢測(cè)出4 542個(gè)SSR,包括4 051個(gè)完全型SSR和491個(gè)復(fù)合型SSR,發(fā)生頻率為7.45%(表1)。從分布情況來(lái)看,山地虎耳草轉(zhuǎn)錄組序列中平均每10.00 kb出現(xiàn)一個(gè)SSR,棒腺虎耳草中平均每10.40 kb出現(xiàn)一個(gè)SSR,略低于前者(表1)。

對(duì)2個(gè)物種的SSR類(lèi)型進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn),二至六核苷酸重復(fù)類(lèi)型均有出現(xiàn),但各類(lèi)型出現(xiàn)的頻率和分布的平均距離相差較大。表1顯示,在山地虎耳草和棒腺虎耳草中,三核苷酸重復(fù)類(lèi)型的SSR含量均為最多,分別占總SSR的55.50%和56.36%;其次為二核苷酸重復(fù)類(lèi)型,所占比例分別為30.23%和30.32%;其他類(lèi)型(四核苷酸、五核苷酸、六核苷酸和復(fù)合核苷酸重復(fù))所占比例較小,總和分別為14.28%和13.32%。從分布情況來(lái)看,兩個(gè)物種不同重復(fù)基元SSR分布的平均距離均差別較大。其中,在山地虎耳草中,三核苷酸重復(fù)數(shù)量最多,出現(xiàn)頻率為4.02%,每條SSR分布的平均距離為18.02 kb,六核苷酸重復(fù)最少,出現(xiàn)頻率為0.02%,平均距離為3 355.25 kb;在棒腺虎耳草中,三核苷酸的出現(xiàn)頻率為4.20%,每條SSR分布的平均距離為18.45 kb,與山地虎耳草不同的是,在該物種中五核苷酸重復(fù)最少,出現(xiàn)頻率僅為0.01%,平均距離為5 905.14 kb。此外,棒腺虎耳草各重復(fù)基元類(lèi)型的平均距離均高于山地虎耳草(表1)。

圖1 山地虎耳草和棒腺虎耳草拼接后的Transcript與Unigene長(zhǎng)度分布Fig.1 The length distribution of Transcripts and Unigenes after assemblage of S. sinomontana and S. consanguinea

2.3 山地虎耳草和棒腺虎耳草SSR基元類(lèi)型和比例

表2顯示,在山地虎耳草轉(zhuǎn)錄組4 098個(gè)完全型SSR中共發(fā)現(xiàn)了110種重復(fù)基元,其中二至六核苷酸重復(fù)基元分別有6種、30種、42種、19種和13種。在棒腺虎耳草轉(zhuǎn)錄組4 051個(gè)完全型SSR中則發(fā)現(xiàn)了85種重復(fù)基元,明顯少于山地虎耳草,其中二至六核苷酸重復(fù)基元分別有6種、30種、31種、8種和10種。

在2個(gè)物種的二核苷酸重復(fù)基元中,均屬AG/TC出現(xiàn)次數(shù)最多,分別有521個(gè)和548個(gè),為二堿基的優(yōu)勢(shì)重復(fù)單元,分別占二核苷酸重復(fù)基元SSR總數(shù)的37.29%和39.80%;同時(shí)AG/TC也是所有二至六核苷酸重復(fù)基元中數(shù)量最多的SSR,而其余的二核苷酸重復(fù)類(lèi)型在2個(gè)物種中所占比例也均有不同。此外,2個(gè)物種的三堿基和四堿基的優(yōu)勢(shì)重復(fù)單元也有所不同,山地虎耳草中,AAG/TTC(233個(gè))和AAGA/TTCT(8個(gè))出現(xiàn)頻率最高,在棒腺虎耳草中出現(xiàn)頻率最高的則是CTT/GAA(203個(gè))和AAAT/TTTA(14個(gè))。五核苷酸和六核苷酸在2個(gè)物種中出現(xiàn)頻率普遍偏低(表2)。

2.4 山地虎耳草和棒腺虎耳草SSR重復(fù)次數(shù)分布

研究表明,SSR基元重復(fù)次數(shù)變異而引起的位點(diǎn)長(zhǎng)度變化是產(chǎn)生位點(diǎn)多態(tài)性的主要原因[18-19]。通過(guò)對(duì)山地虎耳草4 098個(gè)和棒腺虎耳草4 051個(gè)完全型SSR進(jìn)行分類(lèi)統(tǒng)計(jì),結(jié)果(圖2)發(fā)現(xiàn),隨著重復(fù)次數(shù)的增加,二者的SSR數(shù)量均逐漸減少。且2個(gè)物種的SSR均主要分布在5~10次的較低重復(fù)次數(shù)基元中,其中山地虎耳草有4 036個(gè)SSRs,占總SSR的98.49%;棒腺虎耳草中有3 994個(gè)SSRs,占98.59%;11次、12次和14次為一般重復(fù)次數(shù)基元,在2個(gè)物種中分別有61個(gè)和60個(gè)SSRs,分別占1.49%和1.48%;20次以上為較高重復(fù)次數(shù)基元,在山地虎耳草和棒腺虎耳草中分別只出現(xiàn)了50次和25次的重復(fù),且均僅含1個(gè)SSR(圖2)。

表1 山地虎耳草和棒腺虎耳草SSR序列的出現(xiàn)頻率

注:比例:各核苷酸SSR在總SSR中所占比例;頻率:含有SSR的序列數(shù)目與總序列數(shù)目的比值;平均分布距離:序列總長(zhǎng)度與SSR數(shù)目的比值

Note: Proportion: Proportion in all SSRs; Frequency: The percentage of SSR number in all sequences; Average distance: Ratio of total sequence length and SSR number

表2 山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組中不同SSR序列的出現(xiàn)情況

注:比例:各核苷酸SSR在總SSR中所占比例;頻率:含有SSR序列數(shù)目與總序列數(shù)目的比值

Note: Proportion: Proportion in all SSRs; Frequency: The percentage of SSR number in all sequences

據(jù)統(tǒng)計(jì),在山地虎耳草和棒腺虎耳草中,均屬二核苷酸基元重復(fù)次數(shù)類(lèi)型最多,跨度最大,分別有8種和7種,且主要類(lèi)型均為6次重復(fù),分別有627個(gè)、596個(gè)(圖3),占相應(yīng)物種二核苷酸基元的44.88%和43.28%;位于二核苷酸之后的是三核苷酸,分別為山地虎耳草中的ATT/TAA(5種)和棒腺虎耳草中的CCA/GGT(5種)出現(xiàn)的類(lèi)型最多;2物種的四核苷酸、五核苷酸和六核苷酸重復(fù)基元中多以5次、6次重復(fù)類(lèi)型出現(xiàn)。此外,在這2個(gè)物種的5種核苷酸基元中,隨著重復(fù)次數(shù)的增加,SSR數(shù)量所占比例都有逐漸減少的趨勢(shì)(圖3,A、B)。

2.5 山地虎耳草和棒腺虎耳草SSR基元長(zhǎng)度分布及其多態(tài)性

圖4和表3顯示,山地虎耳草和棒腺虎耳草的完全型SSR基元長(zhǎng)度區(qū)間分別為12~100 bp和12~75 bp,其中最大的片段長(zhǎng)度分別為前者二核苷酸重復(fù)50次(100 bp)和后者三核苷酸重復(fù)25次(75 bp)的SSR。從整體來(lái)看,二者SSR的分布范圍較為集中,主要在12~30 bp,且在所有SSR中,最多的為15 bp長(zhǎng)度的SSR,其中山地虎耳草有1 529個(gè),占37.31%,棒腺虎耳草有1 581個(gè),占39.03%,并且均為5次重復(fù)的三核苷酸基元(圖4)。

研究表明,當(dāng)SSR基序長(zhǎng)度大于等于20 bp時(shí)其多態(tài)性較高,長(zhǎng)度在12~20 bp時(shí)多態(tài)性中等,而長(zhǎng)度在12 bp以下時(shí)多態(tài)性極低[20]。本研究篩選得到的山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組SSR的長(zhǎng)度均大于等于12 bp,其中前者12~19 bp的SSR有3 439個(gè)(83.92%),后者有3 462個(gè)(85.46%)(表3),這些SSR具有中等多態(tài)性;而2種虎耳草大于等于20 bp的SSR分別有659個(gè)(16.08%)、589個(gè)(14.54%)(表3),這些SSR具有較高的多態(tài)性。由此推測(cè)本研究中山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組SSR的多態(tài)性均在中等以上。此外,研究發(fā)現(xiàn)高級(jí)基元SSR的多態(tài)性普遍比低級(jí)基元的低[21]。本研究中山地虎耳草和棒腺虎耳草的二、三核苷酸基元總和分別占完全型SSR的96.68%、97.19%,在長(zhǎng)度大于等于20 bp的SSR中,兩物種所包含的低級(jí)基元(二核苷酸和三核苷酸)總數(shù)分別為523條、475條,占長(zhǎng)度大于等于20 bp的所有SSR的79.36%、80.65%,表明大部分山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組SSR具有高多態(tài)性潛能(表3)。

圖2 山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組SSR重復(fù)次數(shù)分布Fig.2 The distribution of repeat number of SSRs in transcriptome of S. sinomontana and S. consanguinea

圖3 山地虎耳草(A)和棒腺虎耳草(B)轉(zhuǎn)錄組SSR不同重復(fù)類(lèi)型的重復(fù)次數(shù)分布Fig.3 The distribution of repeat number of SSRs for different repeat types in transcriptome of S. sinomontana (A) and S. consanguinea (B)

圖4 山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組SSR基元長(zhǎng)度分布Fig.4 The distribution of motif length of SSRs in transcriptome of S. sinomontana and S. consanguinea

重復(fù)類(lèi)型Repeat type長(zhǎng)度Length/bp山地虎耳草 S. sinomontana棒腺虎耳草 S. consanguineaSSR數(shù)量Number of SSRsSSR所占百分比Percent of total SSRs/%SSR數(shù)量Number of SSRsSSR所占百分比Percent of total SSRs/%二核苷酸Di-nucleotide1262744.8859643.281431522.5534224.841620814.8920314.74181087.731138.2120785.58715.1622533.79473.412470.5050.3610010.0700.00三核苷酸Tri-nucleotide151 52959.611 58161.761865225.4262724.492135513.8432412.6624281.09261.023300.0010.044210.0400.007500.0010.04四核苷酸Tetra-nucleotide208581.738285.42241716.351212.502810.9622.083610.9600.00五核苷酸Penta-nucleotide251789.47787.503015.2600.003515.26112.50六核苷酸Hexa-nucleotide30969.23330.003617.69330.004217.69110.0054215.3800.006600.00330.00

圖5 山地虎耳草和棒腺虎耳草SNPs類(lèi)型分析Fig.5 The analysis of SNP types in transcriptome of S. sinomontana and S. consanguinea

2.6 山地虎耳草和棒腺虎耳草的SNP位點(diǎn)特征分析

通過(guò)數(shù)據(jù)處理,最終在山地虎耳草和棒腺虎耳草中分別獲得118 424個(gè)和112 006個(gè)SNP位點(diǎn),其中非編碼區(qū)的SNP位點(diǎn)分別為82 420個(gè)(69.60%)、79 986個(gè)(71.41%),編碼區(qū)的SNP位點(diǎn)分別為36 004個(gè)(30.40%)、32 020個(gè)(28.59%)。在山地虎耳草的編碼SNP中,同義突變有35 849個(gè)(30.27%),非同義突變155個(gè)(0.13%);棒腺虎耳草的編碼SNP中,同義突變有31 899個(gè)(28.48%),非同義突變有121個(gè)(0.11%)。

對(duì)二者SNP進(jìn)行類(lèi)型分析結(jié)果(圖5)發(fā)現(xiàn),在山地虎耳草中,轉(zhuǎn)換類(lèi)型有72 076個(gè)(60.86%),顛換類(lèi)型有46 321個(gè)(39.11%);棒腺虎耳草中,轉(zhuǎn)換類(lèi)型有66 819個(gè)(59.66%),顛換類(lèi)型有45 169個(gè)(40.33%)。

3 討 論

轉(zhuǎn)錄組代表了特定物種的組織或細(xì)胞在不同發(fā)育階段、不同生理狀態(tài)下的全部mRNA總和[22],且不同物種、同一物種的不同個(gè)體、同一個(gè)體的不同組織以及同一組織不同時(shí)期的轉(zhuǎn)錄本表達(dá)情況都有所不同[23]。本研究從山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組中分別獲得了63 763個(gè)和60 972個(gè)Unigene,為后續(xù)分析奠定了堅(jiān)實(shí)的基礎(chǔ)。其中,山地虎耳草中,堿基Q20和Q30分別為94.36%、88.98%,棒腺虎耳草中相應(yīng)比例為94.00%、88.38%,研究指出,當(dāng)Q30值在80%以上就認(rèn)為測(cè)序質(zhì)量非??煽縖24],而堿基Q20與堿基識(shí)別的錯(cuò)誤率呈對(duì)數(shù)相關(guān),其表示每100個(gè)序列堿基中僅有1個(gè)出錯(cuò)的概率[25]。

從2物種的Unigene中分別檢測(cè)出了4 622個(gè)和4 542個(gè)SSR,平均分布距離為1/10.00 kb、1/10.40 kb,二者差別不大,但與其他高山植物相比,其平均分布距離高于冷蒿(1/18.46 kb)[26]和川西獐牙菜(1/12.6 kb)[27],與藍(lán)玉簪龍膽(1/9.97 kb)[28]相差較小,但低于唐古特紅景天(1/8.52 kb)[29]。由此表明,2個(gè)物種轉(zhuǎn)錄組中SSR的數(shù)量較為豐富。此外,山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組中SSR出現(xiàn)頻率也相似,分別為7.25%、7.45%,與唐古特紅景天(7.1%)[29]的出現(xiàn)頻率較為接近,高于冷蒿(2.61%)[26]和藍(lán)玉簪龍膽(6.12%)[28],但低于川西獐牙菜(8.16%)[27]。出現(xiàn)這種差異可能與物種選擇、組裝方法、SSR搜索的標(biāo)準(zhǔn)及分析方法等有關(guān)。

研究表明,大多數(shù)植物的SSR主要以二核苷酸和三核苷酸重復(fù)為主要類(lèi)型,但是主導(dǎo)重復(fù)基元的類(lèi)型有所不同[27,30]。本研究發(fā)現(xiàn),這2個(gè)物種轉(zhuǎn)錄組SSR的優(yōu)勢(shì)基元均是三核苷酸重復(fù),這與冷蒿[26]、藍(lán)玉簪龍膽[28]和唐古特紅景天[29]和等植物的優(yōu)勢(shì)基元結(jié)果相一致;但在金銀花[31]和芝麻[32]等植物中二核苷酸重復(fù)占主導(dǎo)地位,在川西獐牙菜[27]和燈盞花[30]等植物中主導(dǎo)類(lèi)型為二核苷酸和三核苷酸重復(fù)基元。這種主導(dǎo)重復(fù)基元的不同可能與物種自身的差異有關(guān)。此外,有研究指出三核苷酸和六核苷酸SSR重復(fù)基序的突變情況,可能是一種有利于植物進(jìn)化的突變[33],在山地虎耳草和棒腺虎耳草中以三核苷酸SSR為主體的分布可能與長(zhǎng)期以來(lái)自然選擇所導(dǎo)致的適應(yīng)性變化有關(guān)。

多項(xiàng)研究指出,作為堿基序列的重要特征之一,GC含量反映了基因的結(jié)構(gòu)、功能和進(jìn)化信息,SSR序列中GC含量的增加會(huì)使某些氨基酸序列的增加而獲得某些特定功能,如脅迫抗性、轉(zhuǎn)錄調(diào)控、信號(hào)轉(zhuǎn)導(dǎo)等[14,34-35]。并且在大多數(shù)植物中GC重復(fù)基元很少出現(xiàn),例如在唐古特紅景天[29]、金銀花[31]和小麥[36]等植物中均未發(fā)現(xiàn)該重復(fù)基元,但在山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組SSR中均檢測(cè)到了6個(gè)GC重復(fù)基元,這種現(xiàn)象在川西獐牙菜[27]和大豆[37]中也出現(xiàn)過(guò)。其次,山地虎耳草和棒腺虎耳草對(duì)青藏高原高寒干旱、土壤貧瘠等極端環(huán)境的適應(yīng)機(jī)制是否與GC重復(fù)單元有關(guān)還需要進(jìn)行更深入的探討。

對(duì)山地虎耳草和棒腺虎耳草的SNP分析發(fā)現(xiàn),兩者SNP的轉(zhuǎn)換類(lèi)型比例均明顯高于顛換類(lèi)型,并且在轉(zhuǎn)換類(lèi)型中,C?T發(fā)生頻率較高,與藍(lán)玉簪龍膽的SNPs結(jié)果相一致[28],這一現(xiàn)象可能是由于SNP在CG序列上出現(xiàn)最為頻繁,并且CG中的C常為甲基化,在自發(fā)地脫氨后便成為T(mén)所導(dǎo)致[38]。此外,對(duì)這2個(gè)物種的編碼SNP比較發(fā)現(xiàn),物種間同義突變個(gè)數(shù)和非同義突變個(gè)數(shù)均為接近,但物種內(nèi)同義突變個(gè)數(shù)均明顯高于非同義突變,這可能是由于在自然選擇的作用下,絕大多數(shù)引起氨基酸序列的突變因?yàn)榻档土宋锓N的適合度而遭到淘汰,進(jìn)而導(dǎo)致了蛋白質(zhì)編碼區(qū)的非同義突變率低于同義突變率。

青藏高原作為虎耳草屬植物多樣性中心之一,雖然資源豐富獨(dú)特,但相關(guān)物種的基因組學(xué)研究相對(duì)滯后,遺傳信息較為缺乏。本研究通過(guò)分析和比較山地虎耳草和棒腺虎耳草轉(zhuǎn)錄組序列中SSR和SNP的分布情況,發(fā)現(xiàn)二者的結(jié)果差別較小,這可能與選取的組織部位相同、發(fā)育階段相同以及物種間的系統(tǒng)發(fā)育學(xué)關(guān)系較近有關(guān)。本研究結(jié)果可為今后對(duì)山地虎耳草和棒腺虎耳草進(jìn)行引物設(shè)計(jì)、生態(tài)適應(yīng)和系統(tǒng)發(fā)育學(xué)研究提供基礎(chǔ),為保護(hù)生物學(xué)提供理論依據(jù)。

猜你喜歡
虎耳草基元堿基
面向游戲場(chǎng)景生成的細(xì)分插槽WFC算法研究
基于多重示范的智能車(chē)輛運(yùn)動(dòng)基元表征與序列生成
古人竟然用這種小花熏屁股
應(yīng)用思維進(jìn)階構(gòu)建模型 例談培養(yǎng)學(xué)生創(chuàng)造性思維
中國(guó)科學(xué)家創(chuàng)建出新型糖基化酶堿基編輯器
生命“字母表”迎來(lái)新成員
生命“字母表”迎來(lái)4名新成員
沈從文的“邊城”,“翠翠”的虎耳草
3種虎耳草屬藥材提取物對(duì)CCl4致小鼠急性肝損傷防治作用的比較
人體細(xì)胞內(nèi)存在全新DNA結(jié)構(gòu)
陵川县| 伽师县| 城步| 临潭县| 应城市| 鹤岗市| 昭通市| 阜城县| 义马市| 卓资县| 建宁县| 泸州市| 榆林市| 吴忠市| 桑日县| 双流县| 常宁市| 邹城市| 绵阳市| 连平县| 凭祥市| 鲁山县| 宜兴市| 疏附县| 萨迦县| 洛宁县| 河津市| 延川县| 砀山县| 阿克陶县| 达日县| 洛宁县| 应用必备| 平昌县| 漠河县| 泸溪县| 吴旗县| 昭通市| 修文县| 阿瓦提县| 牟定县|