周思思 王露露 胡芳麗 何紅 柳鳳 張國輝 普金安 張翠英 沐云松
摘 要 旨在挖掘與芒果抗細菌性角斑病緊密聯(lián)系的SNP/In Del位點,以進一步揭示芒果抗細菌性角斑病的遺傳多樣性和分子機理。試驗材料為細菌性角斑病高抗品種‘熱農(nóng)1號和高感品種‘凱特,分別對兩個品種接病菌后0 d、2 d、6 d的果皮進行轉(zhuǎn)錄組分析,以基因組‘紅象牙作為參考,鑒定并分析芒果中SNP/In Del位點的特征。結(jié)果表明,‘凱特和‘熱農(nóng)1號分別獲得32.77 Gb和36.83 Gb的數(shù)據(jù)量,每個樣本過濾后的Q30均高于90%。將reads比對到芒果參考基因組上,兩個品種共檢測到1 213 112個SNP位點,62 888個In Del位點,主要分布在內(nèi)含子區(qū)、外顯子區(qū)、基因間區(qū)和基因上下游區(qū)域。SNP中轉(zhuǎn)換位點和顛換位點分別為751 006個(61.91%)和462 106個(38.09%),其中轉(zhuǎn)換型中A->G略多,而A->T在顛換型中占多數(shù);In Del位點插入和缺失分別每個樣本平均有18 769和25 015個。生物信息學(xué)分析表明,全部的SNP和In Del位點所在的差異基因,主要參與分子功能有代謝途徑、應(yīng)答刺激和生物學(xué)調(diào)控等過程。
關(guān)鍵詞 芒果; 細菌性角斑病; 轉(zhuǎn)錄組測序; 單核苷酸多態(tài)性; 插入缺失標記
芒果(Mangifera indica Linn.)為漆樹科芒果屬常綠喬木,最初產(chǎn)于印度及馬來西亞地帶,有著悠久的栽培歷史,是聞名的熱帶水果之一[1-2]。細菌性角斑?。╔anthomonas citri pv.mangiferaeindicae)是芒果生產(chǎn)中的主要病害[3-4],直接影響芒果的生長發(fā)育,輕者造成20%~50%的減產(chǎn)[5],重者造成失收。近年來有關(guān)芒果細菌性角斑病的研究,多集中在形態(tài)學(xué)、細胞學(xué)和生理生化學(xué)的分析上[6-7],對分子領(lǐng)域尤其開發(fā)抗病相關(guān)分子標記的研究甚少。挖掘芒果抗細菌性角斑病抗病相關(guān)位點,對選育抗病品種具有重要意義。傳統(tǒng)的抗病育種選育大多為常規(guī)的實生選種、雜交育種等途徑[8],育種周期長,選育限制眾多[9]。近年來,隨著高通量測序技術(shù)的出現(xiàn)與快速發(fā)展,轉(zhuǎn)錄組可以填補傳統(tǒng)形態(tài)學(xué)進行分類的缺點,為芒果種質(zhì)資源的分類提供更快速、更準確的新手段,加速種質(zhì)篩選和鑒定工作[10],目前該技術(shù)主要關(guān)注在芒果開花期與果實大小等方面,而對以細菌性角斑病侵染芒果的轉(zhuǎn)錄組測序工作還鮮有報道。
轉(zhuǎn)錄組測序技術(shù)具有通量大、周期短、成本低等優(yōu)點,能夠?qū)€體基因組進行快速篩選,找到變異基因,檢測變異類型[11],基于突變SNP位點和In Del位點的分子標記開發(fā),可以挖掘跟抗病緊密連鎖的位點,可用于抗病品種的選育和遺傳多樣性的分析。利用SNP和In Del位點分布廣泛和多態(tài)性好的特點,可以將差異的SNP或In Del位點用于某些功能基因的精細定位或遺傳圖譜的構(gòu)建等[12]。劉小紅[13]對玉米的耐高溫和高溫敏感兩個品種進行轉(zhuǎn)錄組測序,得到的數(shù)據(jù)進行SNP和In Del位點分析,挖掘與耐高溫有關(guān)的SNP和In Del標記;國鈺環(huán)等[14]對三雌蕊小麥幼穗的3個生長階段進行轉(zhuǎn)錄組測序,通過篩選開發(fā)出4個位于Pis1基因附近的SNP標記,豐富了小麥中的SNP標記資源;吳宇瑤[15]通過對10個煙草材料進行轉(zhuǎn)錄組測序,篩選出11個多態(tài)性SNP位點,成功構(gòu)建了34份煙草種質(zhì)的指紋圖譜;但在芒果中對SNP和In Del標記相關(guān)研究卻很少,尤其是芒果抗細菌性角斑病的SNP和In Del分子標記的開發(fā)研究還未見報道。
徐志豪等[16]通過全基因組重測序?qū)Α疅徂r(nóng)1號和‘凱特兩個品種間差異的SNP位點進行了分析,在此基礎(chǔ)上為了挖掘與抗病緊密相關(guān)的位點,本研究利用轉(zhuǎn)錄組測序技術(shù),繼續(xù)以這兩個品種為試驗材料,通過RNA-Seq方法檢測芒果在? 0 d、2 d、6 d接種細菌性角斑病病菌后轉(zhuǎn)錄水平差異,系統(tǒng)比較細菌性角斑病病菌侵染芒果后不同時期SNP和In Del位點的不同差異信息及轉(zhuǎn)錄組表達特征,通過觀察基因表達量的變化,篩選抗病相關(guān)位點,為構(gòu)建芒果高密度遺傳圖譜、分子標記輔助選擇育種和抗病相關(guān)的功能基因挖掘等提供數(shù)據(jù),同時也為后期深入研究芒果與細菌性角斑病互作機理奠定基礎(chǔ)。
1 材料與方法
1.1 試驗材料
以高抗和高感細菌性角斑病的‘熱農(nóng)1號和‘凱特芒果為材料,分別從云南等地采集健康無病害芒果果實。用3號昆蟲針自制直徑為1 cm的7針頭梅花針進行刺傷,使用LB培養(yǎng)液培養(yǎng)? 2 d后的菌液進行接種,對接種后的果實進行100%濕度下28℃恒溫黑暗培養(yǎng)。取接種后? 0 d、2 d、? 6 d以及接種LB培養(yǎng)液(CK)的果皮用于后續(xù)試驗,共10個樣品,分別命名為T1~T10。具體如下:T1為‘凱特?zé)o處理樣品;T2和T4分別為‘凱特接種細菌性角斑病第2天和第6天的樣品;T3和T5為接種LB培養(yǎng)液的樣品;T6為‘熱農(nóng)1號無處理樣品;T7和T9分別為‘熱農(nóng)1號接種細菌性角斑病第2天和第6天的樣品;T8和T10為接種LB培養(yǎng)液的樣品。
1.2 RNA-Seq測序
采集‘熱農(nóng)1號和‘凱特接菌后的2 d、6 d以及接種LB培養(yǎng)液0 d-CK、2 d-CK、6 d-CK的果皮,共10個樣品,每個樣品3個生物學(xué)重復(fù)(數(shù)據(jù)取交集展示)。提取組織總RNA,利用NanoDrop微量分光光度計進行RNA濃度和純度精確定量;用1.5%瓊脂糖凝膠電泳檢測樣品RNA完整性及是否存在DNA污染;Agilent 2100 bioanalyzer精確檢測RNA完整性。轉(zhuǎn)錄組采用雙末端測序,委托廣州基迪奧生物科技有限公司? 完成。
1.3 轉(zhuǎn)錄組文庫構(gòu)建及測序
提取總RNA,再進一步對接種細菌性角斑病菌后0 d、2 d和6 d兩個品種的芒果,每個處理3個生物學(xué)重復(fù)的總RNA進行mRNA純化、打斷mRNA、cRNA的合成、上機測序等試驗工作,該工作在廣州基迪奧生物科技有限公司完成。
1.4 數(shù)據(jù)整理和過濾
為了保證數(shù)據(jù)質(zhì)量,從堿基含量與錯誤率等方面對原始reads進行質(zhì)量評估,以減少無效數(shù)據(jù)所來帶的分析干擾。首先,對下機的raw reads數(shù)據(jù),利用fastp[17]進行質(zhì)控,過濾低質(zhì)量數(shù)據(jù),得到clean reads,過濾標準為去掉adapter的reads;去除含N比例大于10%的reads;去除全部都是A堿基的reads;除去平均質(zhì)量分數(shù)小于Q20的Reads進行數(shù)據(jù)過濾。
1.5 SNP和In Del位點分析
病菌侵染后不同時期的樣品存在RNA編輯,均可能產(chǎn)生不同的SNP和In Del變異的位點,針對過濾后的轉(zhuǎn)錄組數(shù)據(jù),使用軟件GATK進行SNP以及In Del的變異檢測并最終進行數(shù)據(jù)統(tǒng)計,對SNP的位點進行過濾:(1)使用GATK軟件在call SNP的同時已將低質(zhì)量的SNP過濾;(2)對于In Del附近的SNP,已使用GATK軟件進行矯正;(3)篩選基因不重疊的utr和exon端的SNP;(4)篩選參考reads>=2且突變reads>=3的位點;(5)篩選突變頻率在0.1到0.9的SNP位點。
1.6 差異表達基因富集分析
將差異基因向GO數(shù)據(jù)庫的各term映射,并計算每個term的差異基因數(shù),得到具有某個GO功能的差異基因,列表差異基因數(shù)目并統(tǒng)計。應(yīng)用超幾何檢驗,找出在差異基因中顯著富集的GO條目。corrected-pvalue≤0.05為閾值;基于KEGG公共數(shù)據(jù)庫對差異表達基因進行Pathway分析,應(yīng)用超幾何檢驗,找出在差異表達蛋白中顯著性富集的Pathway。通過Pathway顯著性富集確定差異表達蛋白參與的最主要生化代謝途徑和信號轉(zhuǎn)導(dǎo)途徑。Qvalue≤0.05為閾值。
2 結(jié)果與分析
2.1 數(shù)據(jù)質(zhì)控和對比
轉(zhuǎn)錄組測序的原始數(shù)據(jù)經(jīng)過質(zhì)控和GC含量分析,‘凱特和‘熱農(nóng)1號各獲得了32.77 Gb和36.83 Gb的數(shù)據(jù)量。每個樣本的clean reads均在4 045萬條以上,GC含量均在43%以上。Clean Data中每個樣品的Q30均大于90%,Q20均大于96%,表明測序質(zhì)量較好,可以支撐后續(xù)進一步分析。通過將測得的reads與芒果的參考基因組進行對比,每個樣本中平均有48 547 865條reads對比到參考基因組上。其中,對比到參考基因組的唯一位置有86.02%~97.70%,可對比到參考基因組上的有90.01%~91.65%,比對到參考基因組的多個位置有3.91%~4.73%,比對結(jié)果正常,可用于后續(xù)的變異檢測及相關(guān)分析。
2.2 SNP數(shù)量及雜合統(tǒng)計
分別對T1、T2、T3、T4、T5、T6、T7、T8、T9和T10共10個樣品的SNP位點進行統(tǒng)計,平均每個樣本的SNP位點數(shù)目約為843 282個,結(jié)果如表1所示。從表1還可以看出,‘凱特每個樣本純合突變的SNP至少有560 592個,雜合突變的有325 025個;‘熱農(nóng)1號每個樣本純合突變的SNP至少有542 741個,雜合突變的有? 293 208個,且兩個品種每個樣品純合位點的數(shù)量都大于雜合位點的數(shù)量。
2.3 SNP類型統(tǒng)計
根據(jù)突變類型種類統(tǒng)計轉(zhuǎn)錄組測序的10個樣本中SNP基因突變型所占比,結(jié)果如圖1所[CM(21]示,其中最少的為顛換C->G型,僅占3.96%,最多的為轉(zhuǎn)換A->G型,占15.57%。轉(zhuǎn)換類型(T<->C,A<->G)總數(shù)為751 006個,顛換類型(A<->C,A<->T,C<->G和G<->T)總數(shù)為462 106個,轉(zhuǎn)換類型的數(shù)量比顛換類型的數(shù)量要多,轉(zhuǎn)換和顛換的比值為1.6。
2.4 兩兩樣品間SNP數(shù)目統(tǒng)計
利用軟件進行樣品間的分析,經(jīng)篩選確定打分在30以上,且深度在10X~100X的多態(tài)位點作為最終的位點,兩兩樣品間的數(shù)目統(tǒng)計矩陣見表2。分析發(fā)現(xiàn)兩個品種在接菌后2 d、6 d與0 d的樣品(CK)SNP數(shù)量都在減少,可用于后續(xù)篩選抗病位點的分子標記。
2.5 In Del統(tǒng)計分析
對10個樣品的In Del位點進行統(tǒng)計,總共檢測62 888個In Del位點(表3)。平均每個樣本的In Del插入和缺失位點分別有18 769和25 015個,‘凱特的純合突變與雜合突變比值為? 1.23;‘熱農(nóng)1號的純合突變與雜合突變比值為1.16,且雜合位點和純合位點在這10個樣品中數(shù)量變化也不呈現(xiàn)相關(guān)關(guān)系。
2.6 SNP/In Del功能元件上的分布統(tǒng)計分析
將10個樣品材料中SNP/In Del變異位點的分布進行統(tǒng)計,其中內(nèi)含子區(qū)分布最多,有? 471 938個,占全部SNP/In Del位點數(shù)目的? 38.61%;其次是外顯子區(qū)、基因間區(qū)、基因上游、基因下游,分別占總量的24.54%、16.31%、? 10.06%和9.02%;其余位點占總量的比例均低于5%。特別是剪切位點的SNP/In Del位點最少,統(tǒng)計數(shù)量為4 162個(圖2)。
2.7 SNP/In Del功能統(tǒng)計分析
堿基的變異會影響基因的翻譯,因而本試驗對10個樣品材料中SNP/In Del的各種類型密碼子突變比例和總量進行統(tǒng)計(圖3)。在每個樣本中SNP/In Del造成非同義突變的數(shù)量都最多,共有160 296個,占53.48%;同義單核苷酸突變有136 391個,占44.50%;非移碼替換突變僅有151個;而移碼替換,無義突變,終止密碼子突變較少,分別為812、1 755和381個。
2.8 基因功能注釋分析
隨著接菌時間的延長,差異表達基因數(shù)目增多。兩個品種2個侵染時期(接菌后2 d和6 d)‘凱特上調(diào)差異表達基因數(shù)量分別為3 623和? 3 853個,‘熱農(nóng)1號上調(diào)差異表達基因數(shù)量分別為1 118和1 019個,‘凱特下調(diào)差異表達基因數(shù)量分別為1 653和3 226個,‘熱農(nóng)1號下調(diào)差異表達基因數(shù)量分別為927和2 024個(圖4)。將全部的SNP和In Del位點所在的差異基因用GO和KEGG數(shù)據(jù)庫進行富集分析顯示,芒果果實響應(yīng)細菌性角斑病不同時期的差異表達基因,主要參與分子功能有代謝、細胞、單生物等過程,顯著富集到代謝途徑、應(yīng)答刺激、生物學(xué)調(diào)控等過程?;蚬δ茏⑨尩?RAR1、 SGT1、 HSP90在芒果接種細菌性角斑病后均表達。 RAR1、 SGT1基因在接病菌后2 d、6 d與0 d-CK對比發(fā)現(xiàn)在‘凱特中顯著下調(diào)表達,‘熱農(nóng)1號隨著病菌的侵染表達量無顯著變化; HSP90基因在接病菌后2 d、6 d與0 d-CK,均顯著下調(diào),但‘熱農(nóng)1號表達量遠大于‘凱特的表達量,可能與兩芒果品種抗病性差異有關(guān)。
3 討? 論
目前,轉(zhuǎn)錄組的高通量測序主要是為了分析全局性基因表達變化,大量的差異SNP/In Del位點反映了侵染后不同時間段在基因組水平上DNA的多樣性。從轉(zhuǎn)錄水平作為切入點研究SNP/In Del差異位點的方法被廣泛使用[18],利用SNP和In Del位點分布廣泛和多態(tài)性好的特點,可以將差異的SNP或In Del位點用于遺傳多樣性分析和某些功能基因的精細定位等[19],在桑葚、金佛山方竹、葡萄等常見作物中已有很多報道。王暉等[20]對桑葚果實顏色3個時期進行轉(zhuǎn)錄組測序獲得大量SNP/In Del位點,通過將含有SNP/In Del位點的差基因通過GO、KOG/COG、KEGG數(shù)據(jù)庫進行功能注釋最終篩選出SNP/In Del標記的基因,為后續(xù)研究奠定基礎(chǔ);朱瀟等[21]也通過轉(zhuǎn)錄組測序技術(shù)對金佛山方竹3個發(fā)育部位筍籜進行SNP和SSR分析,最終獲得大量高質(zhì)量的SNP位點,為后續(xù)開發(fā)分子標記、品種鑒定及遺傳多樣性分析等奠定了理論基礎(chǔ)。對發(fā)現(xiàn)功能基因的SNP/In Del位點而言,轉(zhuǎn)錄組測序是一種高效且經(jīng)濟的方法[22]。本研究通過分別對兩個品種接菌后0 d、2 d、6 d進行轉(zhuǎn)錄組測序,獲得大量SNP/In Del位點信息,并對這些位點進行篩選和統(tǒng)計。大量的差異SNP/In Del位點可以通過基因功能注釋,從植物與病原互作的途徑、植物激素信號傳導(dǎo)、對細菌的防御反應(yīng)[23]、類黃酮生物合成等與抗病相關(guān)的途徑中挖掘表達量高的基因,篩選出與芒果抗病性緊密關(guān)聯(lián)的SNP/In Del位點進行驗證,可為后期開發(fā)抗病相關(guān)的特異性分子標記,遺傳多樣性的分析,選育抗病品種等奠定基礎(chǔ)。
SNP(Single nucleotide polymorphism)指在基因組水平上因單個堿基的突變引起的DNA序列多態(tài)性[24],關(guān)于SNP的突變類型,結(jié)果顯示本試驗中兩個高抗和高感的芒果品種,轉(zhuǎn)換/顛換達1.63,SNP的轉(zhuǎn)換類型發(fā)生頻率比顛換類型的SNP發(fā)生頻率高,類似的結(jié)果在不少植物中都有體現(xiàn),小果甜柿中轉(zhuǎn)換/顛換達1.69[25],珠芽魔芋球莖中轉(zhuǎn)換/顛換達1.84[26],主要可能是與結(jié)構(gòu)有關(guān),顛換是嘌呤換嘧啶,嘧啶換嘌呤,結(jié)構(gòu)差異比較大,更為復(fù)雜,轉(zhuǎn)換是嘌呤換嘌呤,嘧啶換嘧啶。而In Del(Insertion-Deletion)則是基因組小片段的插入或缺失所引起的變異。In Del位點每個樣本平均有43 784個,一般而言SNP突變數(shù)目極顯著大于In Del突變。In Del突變會帶來更大影響,將會出現(xiàn)移碼突變現(xiàn)象,造成插入和缺失位點后堿基的錯位,由此后續(xù)將出現(xiàn)氨基酸序列的錯亂排布,最終導(dǎo)致蛋白質(zhì)失去原有功能。
本研究在基因功能注釋分析中注釋到的RAR1、 SGT1、 HSP90基因可以相互作用,構(gòu)成分子伴侶復(fù)合物(HRS)[27],它們之間的相互作用在R基因介導(dǎo)的植物抗病過程中是必不可少的[28-29]。HSP90家族是一組高度保守的蛋白質(zhì),存在于幾乎所有的生物物種中,維持信號傳導(dǎo)蛋白功能[30];RAR1蛋白包含兩個鋅結(jié)合結(jié)構(gòu)域,CHORD1和CHORD2[31-32],在多種植物對真菌、細菌和病毒的抗性中均是必要的信號分子;SGT1蛋白最初被確定為酵母著絲粒組裝途徑的重要組成部分[33]。并且RAR1、SGT1、HSP90在高抗和高感的兩個品種中存在著47個非同義突變位點,可為后續(xù)的深入研究相關(guān)基因功能和開發(fā)抗病分子標記提供參考。
參考文獻 Reference:
[1] MITRA S K.Mango production in the world-present situation and future prospect[J].Scientia Horticulturae,2016,1111:287-296.
[2] 李桂珍.芒果細菌性黑斑病防治技術(shù)[J].農(nóng)村百事通,2017(15):34.
LI G ZH.Control technology of mango bacterial black spot disease[J].Nongcun Baishitong,2017(15):34.
[3] GAGNEVIN L,PRUVOST O.Epidemiology and control of mango bacterial black spot[J].Plant Disease,2001,85(9):928-935.
[4] DOIDGE E M.A bacterial disease of the mango Bacillus mangiferae n.sp[J].Annals of Applied Biology,1915,? 2(1):1-45.
[27] MUSKETT P R,KAHN K,AUSTIN M J,et al.Arabidopsis RAR1 exerts rate-limiting control of R gene-mediated defenses against multiple pathogens[J].Plant Cell,2002,14:979-92.
[28] YUAN C.Genome-wide identification and characterization of HSP90-RAR1-SGT1-Complex members from Arachis genomes and their responses to biotic and abiotic stresses[J].Frontiers in Genetics,2021,12:689669.
[29] PEI H,SUN Q,HAO Q,et al.The HSP90-RAR1-SGT1 based protein interactome in barley and stripe rust[J].Physiological and Molecular Plant Pathology,2015,? 91(7):11-19.
[30] AUSTIN M J,MUSKETT P,KAHN K,et al.Regulatory role of SGT1 in early R genemediated plant defenses[J].Science,2002,295:2077-2080.
[31] KADOTA Y,SHIRASU K.The HSP90 complex of plants[J].Biochim Biophys Acta,2012,1823(3):689e97.
[32] SHIRASU K,LAHAYE T,TAN M W,et al.A novel class of eukaryotic zinc-binding proteins is required for disease resistance signaling in barley and development in?? C.elegans[J].Cell,1999,99:355e66.
[33] KITAGAWA K,SKOWYRA D,ELLEDGE S J,et al.SGT1 encodes an essential component of the yeast kinetochore assembly pathway and a novel subunit of the SCF ubiquitin ligase complex[J].Molecular Cell,1999,4:21e33.
SNP/In Del Analysis of Mango Bacterial Black Spot Disease Based on Transcriptome Sequencing
Abstract In order to explore the SNP/In Del loci closely associated with mango bacterial black spot disease,and further reveal the genetic diversity and molecular mechanism of mango bacterial black spot disease, the high resistance variety ‘Renong No.1 and the high susceptible variety ‘Keitt were used as experimental materials, the pericarp transcriptome of the two varieties at 0 d, 2 d, and 6 d? was analyzed after pathogen exposure, and the genome ‘Red Ivory was used as a reference to identify and analyze the characteristics of SNP/In Del loci in mango.The results showed that ‘Keitt and ‘Renong No.1 obtained 32.77 Gb and 36.83 Gb of data, respectively, and the filtered Q30 of each sample was higher than 90%.Reads were compared to the reference genome of mango.A total of?? 1 213 112 SNPS and 62 888 In Del loci were detected in the two cultivars, which were mainly distributed in the intronic region, exon region, intergene region and upstream and downstream region of the gene.There were 751 006 (61.91%) conversion sites and 462 106 (38.09%) inversion sites, respectively.A->G was slightly more in conversion type, while A->T was the majority in inversion type.There were 18 769 insertions and 25 015 deletions per sample, respectively.Bioinformatics analysis showed that all the SNPS and the differentially located genes in the In Del locus were mainly involved in the molecular functions which include metabolic pathways, response stimulation and biological regulation.
Key words Mango; Mango bacterial black spot disease; Transcriptome sequencing; Single nucleotide polymorphism; In Del markers