夏雄飛,陳云芳,覃 悅,韓長志,3
(1.西南林業(yè)大學 生物多樣性保護學院,云南 昆明 650224;2.中華人民共和國蘇州海關,江蘇 蘇州 215000;3.云南省森林災害預警與控制重點實驗室,云南 昆明 650224)
分泌蛋白、碳水化合物活性酶(CAZymes)和次生代謝產(chǎn)物等致病因子顯著影響真菌、細菌和卵菌等諸多植物病原物對植物的侵入、定殖和擴展等過程[1-3],其中,分泌蛋白在病原菌種間競爭和侵染寄主植物的過程中起重要作用。近年來,基于全基因組序列相關數(shù)據(jù)的公布,前人開展了植物病原物中有關分泌蛋白的諸多研究工作[4],明確了葡萄座腔菌(Botryosphaeria dothidea)[5]、香蕉枯萎病菌(Fusarium oxysporum)[6]、核盤菌(Sclerotinia sclerotiorum)[7]、梨火疫病菌(Erwinia amylovora)[8]、可可毛色二孢(Lasiodiplodia theobromae)[9]、尖孢鐮刀菌(Fusarium oxysporumf)[10]、柑橘黃龍病菌(Citrus Huanglongbing)[11]、甘薯長喙殼(Ceratocystis fimbriata)[12]、小麥葉銹菌(Puccinia triticina)[13]、黃單胞菌(Xanthomonas campestris)[14]和細菌性黑斑病菌(Xanthomonas arboricola)[15]等植物病原菌中的分泌蛋白情況。CAZymes 主要包括碳水化合物酯酶、糖苷水解酶、糖基轉移酶、多糖裂解酶和碳水化合物結合模塊等類別,對目標細胞壁的降解具有重要意義。陳相永等[16]通過對不同營養(yǎng)型植物病原真菌的分泌蛋白及CAZymes 進行預測比對,明確活體、半活體和死體營養(yǎng)型真菌的潛在分泌蛋白數(shù)量有差異性,且非專性寄生真菌的CAZymes 數(shù)量和分泌蛋白占比顯著高于專性寄生真菌。然而,目前尚未見有關不同類型植物病原物在實現(xiàn)其侵染植物過程中分泌蛋白及CAZymes 的對比研究。為明確不同類型植物病原物分泌蛋白及CAZymes 分布情況,本研究選擇隸屬于真菌、細菌和卵菌的23種具有全基因組序列的病原物作為研究對象,根據(jù)分泌蛋白信號肽、亞細胞定位和跨膜結構域等典型特征,利用多種分析工具明確不同類型病原物中的分泌蛋白數(shù)量差異性,并基于CAZymes數(shù)據(jù)庫對已篩選的分泌蛋白進行比對。研究結果對于解析不同營養(yǎng)型病原物的入侵作用機制具有重要的指導意義,以期為深入解析不同類型植物病原物中CAZymes 的致病機制和相關驗證試驗等研究奠定理論基礎。
利用NCBI (美國國立衛(wèi)生院數(shù)據(jù)庫)搜索并下載真菌、細菌和卵菌的23 種植物病原物蛋白序列共290 884 個。經(jīng)統(tǒng)計,這些病原物所含蛋白數(shù)量范圍為2 169~26 824 個,平均含有11 635個蛋白,其中,卵菌平均含有蛋白最多(16 529個),細菌平均含有蛋白最少(4 994 個),真菌平均含有蛋白13 063 個(表1)。
表1 不同類型植物病原物的基本信息Tab.1 Basic information of different types of plant pathogens
根據(jù)分泌蛋白的基本特征[4],利用SignalPv5.0[17]、ProtComp v9.0[18]和TMHMM v2.0[19]分 別對23 種植物病原物進行蛋白信號肽、亞細胞定位和跨膜結構域預測分析,排除不具有分泌蛋白特征的蛋白,再通過big-PI predictor 排除具有糖基磷脂酰肌醇 (gly-cosylphosphatidylinositol,GPI)的錨定蛋白[20],最終獲取23 種植物病原物的分泌蛋白。
利用在線工具dbCAN[21]中的HMMER、DIAMOND 和Hotpep 數(shù)據(jù)庫,按照CAZymes 蛋白序列之間同源比對的標準,分別對前期獲取的分泌蛋白進行CAZymes 預測。
利用Microsoft Excel 2010 統(tǒng)計和分析分泌蛋白及CAZymes 基本情況,并采用Origin 2021 軟件制圖。
由圖1 可知:真菌、細菌和卵菌中含有信號肽的蛋白數(shù)量為337~2 374 個,占比為5.20%~17.10%,平均為1 135 個,平均占比9.87%。其中,真菌、細菌和卵菌含有的信號肽蛋白數(shù)量分別為337~1 739、400~870 和589~2 374 個,平均分別為1 119、636 和1 429 個,占比分別為5.20%~13.39%、10.62%~17.10%和7.59%~10.80%,平均占比分別為9.70%、13.17%和8.22%。
圖1 不同類型植物病原物中的信號肽Fig.1 Signal peptides in different types of plant pathogens
由圖2 可知:在已篩選具有信號肽的蛋白中,真菌、細菌和卵菌所具有的胞外蛋白數(shù)量分別為75~537、106~232 和130~816 個,分別占總蛋白數(shù)的0.85%~4.13%、2.08%~4.00%和1.07%~3.10%,平均占比分別為2.38%、3.03%和2.07%。
圖2 不同類型植物病原物中的胞外蛋白Fig.2 Extracellular proteins in different types of plant pathogens
由圖3 可知:在已篩選的具有信號肽的胞外蛋白中,除隱襲腐霉(P.insidiosum)、致病疫霉(P.infestans)、煙草疫霉(P.parasitica)、大豆疫霉(P.sojae)及萵苣盤霜霉(B.lactucea)具有68、15、9、8 和7 個跨膜結構域的蛋白外,其余菌株蛋白僅有少量跨膜結構域在不具有跨膜結構域的胞外蛋白中,僅有解淀粉歐文氏菌(E.amylovora)、黃單胞菌(X.campestris)和隱襲腐霉(P.insidiosum)不具有GPI 錨定蛋白,其余病原物均具有0.94%~11.57%的GPI 錨定蛋白。
圖3 不同類型植物病原物中具有跨膜結構域的蛋白和GPI 錨定蛋白Fig.3 Transmembrane domains and GPI-anchored proteins in different types of plant pathogens
由圖4 可知:篩選獲取分泌蛋白共計6 194個,其中真菌、細菌和卵菌分別有分泌蛋白71~510、105~227 和119~768 個,分別占總蛋白數(shù)量的0.74%~3.93%、2.05%~3.91%和0.96%~2.90%。
圖4 不同類型植物病原物的分泌蛋白Fig.4 Secretory proteins in different types of plant pathogens
HMMER 數(shù)據(jù)庫對不同植物病原物中的CAZymes 預測結果顯示:23 種病原物中共有433 個CAZymes,大豆疫霉(P.sojae)菌株具有的CAZymes 數(shù)量最多(55 個),其次分別為串珠鐮孢(F.fujikuroi)、稻瘟菌(P.oryzae)和煙草疫霉(P.parasitica),分別為47、46 和45 個,而白銹菌(A.candida)僅具有1 個(圖5 a)。進一步分析發(fā)現(xiàn):上述菌株具有的CAZymes 共計99 個種類(圖5b,未完全顯示),除解淀粉歐文氏菌(E.amylovora)、熒光假單胞菌(P.fluorescens)、黃單胞菌(X.campestris)、發(fā)根農桿菌(A.rhizogenes)、隱襲腐霉(P.insidiosum)和白銹菌(A.candida)僅具有1~3 種CAZymes 外,其他菌株均具有5 種以上,其中PL3_2 的數(shù)量最多(52 個),其次為AA9、GH17 和GH6 等。此外,真菌、細菌和卵菌的CAZymes 數(shù)量分別為238、15 和214 個,分屬于68、14 和36 種。
圖5 不同類型植物病原物中的CAZymes (HMMER 數(shù)據(jù)庫)Fig.5 CAZymes in different types of plant pathogens (HMMER database)
DIAMOND 對CAZymes 的查詢結果顯示:23 種不同植物病原物含有311 個CAZymes,尤以串珠鐮孢(F.fujikuroi)具有的數(shù)量最多(54 個),其次為稻瘟菌(P.oryzae)、大豆疫霉(P.sojae)和禾谷鐮刀菌(F.graminearum),分別為49、42 和40 個,而白銹菌(A.candida)、黃單胞菌(X.campestris)、隱襲腐霉(P.insidiosum)不具有CAZymes。進一步分析發(fā)現(xiàn):上述菌株具有的CAZymes 共計93 個種類,其中CBM1 的數(shù)量最多(31個),其次為PL3_2、AA9 和GH28 等。真菌、細菌和卵菌的CAZymes 數(shù)量分別為204、10 和97個,分屬于76、8 和24 種。Hotpep 對CAZymes 的短保守基序查詢結果顯示:23 種不同植物病原物含有332 個CAZymes,其中大豆疫霉(P.sojae)具有的CAZymes 短保守基序的蛋白數(shù)量最多(49 個),其次為串珠鐮孢(F.fujikuroi)和稻瘟菌(P.oryzae),均為40 個,而白銹菌(A.candida)不具有CAZymes 短保守基序。進一步分析發(fā)現(xiàn):上述菌株具有的CAZymes 短保守基序共計85 個種類,其中CBM1 的數(shù)量最多(72 個),其次為PL3、CBM13、AA9 和GH28 等。真菌、細菌和卵菌的CAZymes 數(shù)量分別為 164、17 和104 個,分屬于62、14 和35 種。
綜合HMMER、DIAMOND 和Hotpep 對CAZymes 的預測可知:23 種不同植物病原物中共含有489 個CAZymes。其中,大豆疫霉(P.sojae)、串珠鐮孢(F.fujikuroi)和稻瘟菌(P.oryzae)具有的CAZymes 數(shù)量較多,分別為58、54、50 個;稻瘟菌(P.oryzae)、禾谷鐮刀菌(F.graminearum)和串珠鐮孢(F.fujikuroi)的CAZymes 占總蛋白數(shù)量比例較高,分別為0.38%、0.32%和0.36%;而白銹菌(A.candida)、解淀粉歐文氏菌(E.amylovora)和根癌土壤桿菌(A.tumefacines)僅有1~3 個CAZymes。由圖6 可知:真菌、細菌和卵菌的CAZymes 數(shù)量分別為7~54、2~5 和5~58 個,平均數(shù)量分別為26、4 和26 個。可見,真菌和卵菌所具有的CAZymes 數(shù)量與種類均多于細菌,推測上述差異與病原物致病能力和寄生類型之間的差異有關。
圖6 不同類型植物病原物中的CAZymesFig.6 CAZymes in different types of plant pathogens
在當前的植物病原菌相關研究中,分泌蛋白和CAZymes 等還有許多亟待研究的重點和難點[4]。隨著植物病原菌全基因組序列的釋放以及生物信息學分析方法的應用,已經(jīng)對尖孢鐮刀菌[10]、黃單胞菌[22]、柑橘黃龍病菌[23]、枯草芽孢桿菌[24]和細菌性黑斑病菌[15]等進行了大量的分泌蛋白預測和生物信息學分析,為病原菌致病基因的進一步研究夯實了理論基礎。前人研究表明:不同植物的不同類型病原菌所含的分泌蛋白數(shù)量和占比不盡相同[20]。其中,不同真菌中分泌蛋白占總蛋白的3.65%~9.58%,CAZymes 的數(shù)量為64~438 個,且不同活體營養(yǎng)型病菌之間存在著一定差異[16,25];不同細菌中分泌蛋白約占總蛋白的5.05%~5.41%[15];不同卵菌中分泌蛋白約占總蛋白的2.96%~4.01%[16]。上述研究結果與本研究結果有一定差異,推測原因在于分泌蛋白篩選的方法不同,因此,有待于進一步深化對比分析差異蛋白的數(shù)量和種類。此外,本研究明確了不同類型植物病原物中分泌蛋白和CAZymes 的數(shù)量及種類差異,尚未明確分泌蛋白表達量差異以及冗余性問題,均有待于后續(xù)進一步開展科學研究驗證。
一般而言,植物病原物在與寄主協(xié)同進化的過程中,為了克服侵染過程中的組織障礙,進化出復雜的細胞壁降解機制,包括分泌蛋白及CAZymes 的功能強化、與植物細胞壁降解相關酶類的數(shù)量擴增等,以達到侵染寄主植物的目的。例如:病原真菌在侵染寄主植物的過程中分泌多種糖苷水解酶,將植物多糖分解成寡糖或單糖,破壞細胞壁結構以突破表皮障礙,并吸收利用其繁殖所需的營養(yǎng)物質[4]。本研究以生物信息學為研究工具,明確真菌、細菌和卵菌等不同植物病原物中分泌蛋白和CAZymes 的數(shù)量和種類差異,為進一步解析不同病原物侵染植物過程中分泌蛋白和CAZymes 的功能及表達具有重要的理論價值,但造成CAZymes 的種類差異是否與菌株的生長環(huán)境、致病能力以及寄生類型等有關還有待于驗證。此外,侵染過程中諸多植物病原物的分泌蛋白和CAZymes 功能尚不清楚,嚴重制約著新型農藥的開發(fā),對于CAZymes 的預測還有待進一步通過生物學試驗進行驗證。
不同菌種之間、或同一類型病原物不同物種之間、或同屬真菌、細菌和卵菌的不同種之間,所含有的分泌蛋白和CAZymes 存在數(shù)量和種類差異,暗示不同植物病原物在與植物協(xié)同進化過程中存在著共性化和差異化策略,從而實現(xiàn)其對植物的侵染及營養(yǎng)物質的利用。本研究為進一步開展不同物種、不同群體以及同一群體不同物種間分泌蛋白和CAZymes 的功能共性化和差異化研究提供了重要參考。