蔡志英,施玉萍,戴利銘,高 鋒,龍青姨,毛常麗,穆洪軍
(云南省熱帶作物科學研究所,云南景洪666100)
天然橡膠是全球重要的戰(zhàn)略性物資,也是關系我國國計民生的可再生資源,迄今為止已有100多年的栽培歷史。1906年,斯里蘭卡首次報道橡膠樹炭疽病為害,目前該病已廣泛分布于非洲、南美洲、亞洲等地的橡膠種植國[1-3]。該病害在我國早期僅在苗圃和幼樹上發(fā)現(xiàn),上世紀60年代初期在海南的開割膠樹上首次發(fā)現(xiàn)少數(shù)橡膠品系整年因病落葉而導致停割。1992年,該病在海南暢好橡膠農(nóng)場大面積爆發(fā),發(fā)病面積達1 550.53 hm2,占開割膠樹的75%,受害樹30多萬株,造成20多萬株橡膠樹重度落葉,損失干膠達250 t[4]。目前該病日趨嚴重。
炭疽菌分布廣泛,其種內(nèi)變異較多,寄主范圍廣,能引起谷類、蔬菜、果樹、林木等多種作物炭疽病發(fā)生,導致嚴重產(chǎn)量損失[5-8]。該菌可侵染橡膠樹的葉、花和果,嚴重時誘發(fā)落葉,嫩梢回枯以及橡膠樹果實腐爛[4,6]。目前炭疽菌已成為研究植物寄生真菌的生長、發(fā)育、侵染過程、信號轉(zhuǎn)導、寄主與微生物互作機理的模式菌株[9]。α-淀粉酶是生物體內(nèi)參與淀粉水解的一類重要酶,了解橡膠樹炭疽菌HK-36菌株α-淀粉酶家族基因,對深入研究該家族基因功能有著重要意義。
α-淀粉酶(α-1,4-D-葡萄糖苷水解酶)是生物體分泌的一種重要的淀粉水解酶,它水解淀粉和糖原中的α-1,4-D-糖苷鍵,產(chǎn)生短的麥芽低聚糖和麥芽糖。大多數(shù)α-淀粉酶(EC 3.2.1.1)屬于糖苷水解酶(GH)家族13[10-11]。淀粉不能直接透過細胞膜,沒有淀粉酶微生物就不能利用淀粉。微生物先分泌胞外α-淀粉酶內(nèi)切α-1,4-糖苷鍵將淀粉水解成雙糖和單糖,然后再攝入體內(nèi)利用[12]。從微生物中提取的α-淀粉酶已大量應用于食品工業(yè)、釀造、紡織品工業(yè)和醫(yī)藥行業(yè)等,是應用最為廣泛、最重要的工業(yè)酶之一。目前已知真菌來源的α-淀粉酶多數(shù)為曲霉屬、青霉屬、木霉屬、根霉屬和酵母屬。對真菌來源的α-淀粉酶基因功能的研究多集中于工業(yè)上應用較廣的曲霉屬微生物。從黑曲霉基因組中發(fā)現(xiàn)6種α-淀粉酶,分 別 為aamA、amyA、amyB、amyC、amyD和amyE。其中amyD與amyE淀粉酶參與細胞壁α-葡聚糖的合成;amyC是一種前導酶,在異麥芽糖或麥芽糖誘導下激活AmyR(淀粉酶轉(zhuǎn)錄調(diào)控基因),以誘導其他淀粉酶水解酶表達,amyC的表達量非常低,目前研究相對少;aamA基因的表達產(chǎn)物是耐酸性α-淀粉酶水解酶,amyA和amyB兩個基因的相似度非常高,與米曲霉的Taka-淀粉酶相似度大于98%[13-14]。
α-淀粉酶基因家族在炭疽菌中的分布、數(shù)量、基因結(jié)構(gòu)以及其在炭疽菌中的生長發(fā)育過程中的作用知之甚少。通過對基因組的信息分析,以期望發(fā)現(xiàn)和解釋具有普遍意義的生命現(xiàn)象和它們的變化、內(nèi)在規(guī)律和相互關系。本文借助炭疽菌HK-36菌株基因組測序數(shù)據(jù)和生物信息學方法分析炭疽菌α-淀粉酶基因家族的種類、數(shù)量、結(jié)構(gòu)特征和功能,為進一步深入研究炭疽菌中α-淀粉酶基因家族奠定基礎。
本項目組前期已對野生型橡膠樹炭疽菌HK-36菌株進行全基因組測序(序列未公布),用已知真菌的α-淀粉酶氨基酸序列[15-17],利用BioEdit Sequence Alignment Editor軟件比對HK-36菌株全基因組測序數(shù)據(jù)(E-Value≤1e-6),找出α-淀粉酶家族成員基因。
利用FGENESH在線工具,以Colletotrichum gloeosporioides、C.graminicola和C.higginsianum菌株為 參 比(http://www.softberry.com/berry.phtml?topic=fgenesh&group=programs&subgroup=gfind/)進 行 基 因結(jié)構(gòu)分析[18]。使 用ProtParam(https://web.expasy.org/protparam/)預測蛋白質(zhì)基本理化性質(zhì)(分子式、分子量、等電點和親水系數(shù))。分別采用HMMTOP(http://www.enzim.hu/hmmtop/html/submit.html)、Euk-mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/Cell-PLoc-2/)、SignalP 4.1 Server(http://www.cbs.dtu.dk/services/SignalP-4.1/)進行蛋白的跨膜螺旋[19]、亞細胞定位[20]和信號肽分析[21]。
從NCBI中下載曲霉α-淀粉酶的氨基酸序列,用Clustal Omega軟件(https://www.ebi.ac.uk/Tools/msa/clustalo/)進行氨基酸多序列比對,用MEGA 6.0軟件鄰位相連法(Neighbor-joining,NJ)構(gòu)建系統(tǒng)發(fā)育樹,進化樹的可靠性采用Bootstrap-Method 1 000次重復檢驗,分析蛋白系統(tǒng)進化關系。
根據(jù)同源預測和建模的原理,用在線工具PredictProtein(http://www.predictprotein.org/)蛋 白 質(zhì)數(shù)據(jù)庫進行α-淀粉酶蛋白質(zhì)家族二級結(jié)構(gòu)分析。使用工具SWISS-MODEL/SWISS-PdbViewer(http://swissmodel.expasy.org/)預測 蛋 白質(zhì) 三 級結(jié)構(gòu)分析。采用InterProScan(http://www.ebi.ac.uk/interpro)進行蛋白結(jié)構(gòu)域的分析,應用程序選擇HMMPfam、HMMSmart和SuperFamily。
用CgAmys家族成員基因開放閱讀框起始密碼子ATG前端的1450 bp的核酸序列,用在線軟件PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)分析CgAmys家族成員基因的啟動子區(qū)域順式調(diào)控元件[22],并按功能進行統(tǒng)計分析。
用已知真菌的29個α-淀粉酶氨基酸序列,利用BioEdit Sequence Alignment Editor軟件程序搜索橡膠樹HK-36炭疽菌株全基因組核酸序列(EValue≤1e-6),共找出5個推定的α-淀粉酶基因,分別命名為CgAmy1~CgAmy5,基因序列已提交NCBI(登 錄 號 分 別 為:MN637822、MN637823、MN637824、MN637825和MN637826)。該菌α-淀粉酶酶推導基因編碼蛋白的氨基酸平均數(shù)目為529.8個,其中CgAmy2的最大的含有549個氨基酸,CgAmy3的最小含有500個氨基酸(表1)。
分析橡膠樹炭疽菌HK-36菌株α-淀粉酶蛋白質(zhì)家族基因內(nèi)含子、外顯子發(fā)現(xiàn),CgAmy3基因含有6個外顯子,CgAmy1和CgAmy4基因外顯子數(shù)量為3,CgAmy2基因含有2個外顯子,CgAmy5基因僅含有1個外顯子(圖1)。α-淀粉酶基因編碼序列長度介于1 593(CgAmy5)~1 805(CgAmy4)bp之間;蛋白分子量介于57.2(CgAmy3)~61.5(CgAmy1)kDa,平均分子量為59.48 kDa;等電點介于4.59(CgAmy4)~6.12(CgAmy1),均為親水性蛋白,蛋白呈酸性;HK-36菌株α-淀粉酶蛋白質(zhì)家族基因CgAmy1~CgAmy5都未預測到跨膜螺旋;通過在線工具Euk-mPLoc預測到CgAmy1定位于溶酶體和質(zhì)膜,CgAmy2定位于內(nèi)質(zhì)網(wǎng),CgAmy3定位于過氧物酶體,CgAmy4和CgAmy5定位于線粒 體;其 中CgAmy2、CgAmy4和CgAmy5酶 蛋 白具有信號肽(表1)。
通過鄰位相連法對曲霉屬(Aspergillus niger、A.shirousamii、A.awamori、A.oryzae)踝節(jié)菌屬埃默森藍狀菌(Rasamsonia emersonii)和羅克福爾青霉菌(Penicillium roqueforti)等其他23個α-amylase蛋白序列進行系統(tǒng)聚類分析(圖2)。α-amylase蛋白被分成3個亞組,亞組I包含13個α-amylase蛋白;亞組II包含CgAmy2、CgAmy4和CgAmy5等9個αamylase蛋 白;亞 組III包 含CgAmy1和CgAmy3等6個α-amylase蛋白。
表1 CgAmy基因家族及其推導的蛋白的基本特征
如圖3-A所示,CgAmys蛋白N端由延長鏈和螺旋結(jié)構(gòu)組成,C端基本由延長鏈組成。CgAmys蛋白的延長鏈數(shù)量在20(CgAmy1)~26(CgAmy5),其中CgAmy3和CgAmy4延長鏈數(shù)量均為22,CgAmy2蛋白延長鏈數(shù)量均為25;CgAmys蛋白的螺旋結(jié)構(gòu)數(shù)量介于11(CgAmy3)~18(CgAmy5),CgAmy1、Cg-Amy2和CgAmy4蛋白的螺旋結(jié)構(gòu)數(shù)量分別為14、16和15(圖3-A和表1)。CgAmys三級結(jié)構(gòu)也表明α-淀粉酶家族蛋白含有多個螺旋、延長鏈及回折結(jié)構(gòu)。Swiss-Model分析結(jié)果發(fā)現(xiàn),CgAmy1和CgAmy3結(jié) 構(gòu) 幾 乎 相 同,CgAmy2和CgAmy4結(jié) 構(gòu) 相似。這一結(jié)果與CgAmys蛋白系統(tǒng)進化分析相吻合,CgAmy1和CgAmy3聚 類 在 一 個 亞 組,CgAmy2和CgAmy4位于同一進化枝上。
CgAmys蛋白具有同源α-淀粉酶蛋白家族指紋Glycoside hydrolase superfamily(IPR017853)和Glycosyl hydrolase,all-beta(IPR013780),同 時 含Glyco_hydro_13_cat_dom(IPR006047)結(jié)構(gòu)域,含有該結(jié)構(gòu)域的酶屬于糖基水解酶家族13(GH 13)。α-淀粉酶是一種催化水解多糖中(1-4)-α-D-葡萄糖鍵的酶,在淀粉轉(zhuǎn)化為麥芽糖的過程中,從糖鏈的非還原端去除α-麥芽糖殘基。Glyco_hydro_13_cat_dom(IPR006047)的催化結(jié)構(gòu)域中有一個(α/β)8桶狀結(jié)構(gòu),其中包含活性位點。70氨基酸鈣結(jié)合結(jié)構(gòu)域位于第3個β鏈和第3個α螺旋之間,羧基端有個β折疊的Greek key桶狀結(jié)構(gòu)域。此外CgAmy4和CgAmy5還含有A_amylase_DUF1966_C(IPR015340)結(jié)構(gòu)域,這種結(jié)構(gòu)域存在于各種真菌α-淀粉酶蛋白中。到目前為止,它的確切功能還沒有被定義。
通過CgAmys家族各成員基因的啟動子元件分析結(jié)果表明(表2),除含有TATA box核心啟動子元件和CAAT框等外,主要涉及激素響應和非生物逆境脅迫應答和生長調(diào)節(jié)。CgAmys基因家族各成員都具有茉莉酸應答順式作用元件(TGACG-motif),此外還有赤霉素、水楊酸、脫落酸和生長素多種激素的響應元件,推測CgAmys對茉莉酸的響應還受其他激素共同調(diào)節(jié),可能涉及一個較復雜的信號傳遞網(wǎng)絡。
α-淀粉酶是一種催化水解多糖中(1-4)-α-D-葡萄糖鍵的酶,在淀粉轉(zhuǎn)化為麥芽糖的過程中,從糖鏈的非還原端去除α-麥芽糖殘基。目前關于α-淀粉酶基因功能研究多見于模式菌株黑曲霉(Aspergillus niger)[23-26],但是在橡膠樹炭疽菌中該類基因的功能研究至今未見報道。本研究利用生物信息學方法鑒定HK-36菌株α-淀粉酶基因家族,對比分析該菌α-淀粉酶家族成員的基因結(jié)構(gòu)、蛋白理化性質(zhì)與結(jié)構(gòu)、亞細胞定位、啟動子元件,蛋白三維結(jié)構(gòu)等,有助于進一步解析真菌CgAmy基因在生長發(fā)育及逆境脅迫響應中的功能。
表2 Amy基因家族上游順式作用元件
微生物α-淀粉酶通常含有3個結(jié)構(gòu)域(被命名為A、B和C結(jié) 構(gòu) 域)。A為α-淀粉酶催化反應中心結(jié)構(gòu)域,其典型特征為(α/β)8 TIM桶 狀 結(jié) 構(gòu),B和C結(jié)構(gòu)域大多位于A結(jié)構(gòu)域的兩邊。其中Ca2+的保守結(jié)合位點在A和B結(jié)構(gòu)域之間,通常Ca2+對α-淀粉酶家族保持活性和穩(wěn)定性是必不可少的[27]。本研究通過InterProScan分析炭疽菌HK-36菌株CgAmys家族蛋白結(jié)構(gòu)域發(fā)現(xiàn),CgAmys基因的推定蛋白都含Glyco_hydro_13_cat_dom(IPR006047)結(jié)構(gòu)域,含有該結(jié)構(gòu)域的蛋白酶屬于糖基水解酶家族13(GH 13)。這個催化結(jié)構(gòu)域有一個(α/β)8 TIM桶狀結(jié)構(gòu),其中包含活性位點。70個氨基酸鈣結(jié)合結(jié)構(gòu)域位于第3個β鏈 和 第3個α螺 旋 之 間,羧 基 端 有 個β折 疊 的Greek key桶狀結(jié)構(gòu)域。這一結(jié)果與前人的研究報道相吻合,炭疽菌株HK-36的CgAmys家族的推導,它們的推導蛋白都含有(α/β)8 TIM桶狀催化結(jié)構(gòu)域和鈣結(jié)合位點。此外,CgAmy4和CgAmy5還 含 有A_amylase_DUF1966_C(IPR015340)結(jié) 構(gòu)域,暗示它們可能具有其他的功能。
基因的內(nèi)顯子/外含子結(jié)構(gòu)數(shù)量可作為重要的進化印記,揭示家族基因各成員間的進化關系[28-29]。在 炭 疽 菌 株HK-36的CgAmys蛋 白 基 因 家族中,CgAmy5沒 有 內(nèi) 含 子。而其他4個CgAmys蛋白基因具有1~5個內(nèi)含子,可能是在CgAmy5基礎上進化而來。尤其是CgAmy3具有高達5個內(nèi)含子,在進化中可能經(jīng)歷了多次外顯子重排或內(nèi)含子插入等,屬于CgAmy家族基因中最新的。
系統(tǒng)進化分析推斷炭疽菌株HK-36的5個α-淀粉酶可能來源于一個共同的祖先,但進化成二個亞組。現(xiàn)有研究結(jié)果表明亞組I對淀粉水解具有較高的活性[15];亞組II為糖基磷脂酰肌醇錨定α-淀粉酶,它們對淀粉的水解活性很低,但對麥芽糖和淀粉的α-葡聚糖轉(zhuǎn)移酶活性很高[25];亞組III為胞內(nèi)α-淀粉酶,對淀粉的水解活性相對較低,這些酶可能與細胞壁α-葡聚糖合成有關[26]。
通過CgAmys家族基因上游序列的啟動子元件分析,發(fā)現(xiàn)該家族基因的啟動子區(qū)域有不同的順式元件,表明它們的表達很可能受多種轉(zhuǎn)錄因子調(diào)節(jié)。CgAmys基因家族各成員都具有茉莉酸響應元件(TGACG-motif),預示這些基因的表達可能受茉莉酸調(diào)控。此外,CgAmys基因上游序列的啟動子區(qū)還具有赤霉素、水楊酸、脫落酸和生長素多種激素的響應元件,暗示CgAmys基因家族可能涉及一個較為復雜的信號傳輸網(wǎng)。關于赤霉素調(diào)控α-淀粉酶基因的表達在水稻糊粉層細胞中已經(jīng)得到證實,受赤霉素刺激水稻糊粉層細胞中Ca2+-ATP酶和Ca2+通道共同調(diào)控胞質(zhì)內(nèi)的Ca2+濃度,以刺激α-淀粉酶基因的表達[30]。
通過生物信息學分析,在炭疽菌株HK-36的基因組篩選到5個α-淀粉酶基因。通過氨基酸序列的多重比對分析,這5個α-淀粉酶基因的推導蛋白分別聚類在II和III亞組,亞組II包含CgAmy2、CgAmy4和CgAmy5等9個α-amylase蛋白;亞組III包含CgAmy1和CgAmy3等6個α-amylase蛋白。CgAmys基因上游序列的啟動子區(qū)存在茉莉酸赤霉素、水楊酸、生長素和脫落酸多種激素的應答元件。但是,CgAmys基因所包含的順式元件不盡相同,說明它們可能具有不同的功能。本文借助炭疽菌HK-36菌株基因組測序數(shù)據(jù)和生物信息學方法分析炭疽菌α-淀粉酶基因家族的種類、數(shù)量、結(jié)構(gòu)特征和功能,為進一步深入研究炭疽菌中α-淀粉酶基因家族奠定基礎。