章鴻宇,張燎原
(福建農(nóng)林大學(xué)生命科學(xué)學(xué)院, 福建 福州 350002)
靈芝Ganodermalucidum屬多孔菌科高等真菌,是我國傳統(tǒng)藥用真菌,具有補氣安神,止咳平喘的功效。靈芝多糖是靈芝重要的活性成分,具有調(diào)節(jié)免疫作用、抗腫瘤作用、促進體內(nèi)核酸與蛋白質(zhì)的代謝、抗衰老作用、鎮(zhèn)靜作用等功能[1-2]。
尿苷二磷酸葡萄糖脫氫酶(UDPglucose dehydrogenase,UDP-GlcDH)廣泛分布于微生物及動植物的組織中,是多糖合成中糖醛酸途徑的限速酶,參與糖代謝,催化尿苷二磷酸葡萄糖(UDP-Glc)反應(yīng)生成尿苷二磷酸葡萄糖醛酸(UDP-GlcUA),UDP-GlcUA是細胞生長代謝和形成結(jié)構(gòu)多糖必不可少的前體物質(zhì)[3]。
截至目前,靈芝UDP-GlcDH基因的cDNA序列尚未見報道。本研究利用靈芝表達序列標簽數(shù)據(jù)庫(EST)資源和生物信息學(xué)分析方法,電子克隆了靈芝UDP-GlcDH基因的cDNA,并對其表達的蛋白序列的理化性質(zhì)、結(jié)構(gòu)特征以及系統(tǒng)進化關(guān)系進行預(yù)測和分析,為進一步開展靈芝多糖生物合成機制等相關(guān)研究奠定基礎(chǔ)。
靈芝GanodermalucidumCurtis:Fr.P.Karst 由福建農(nóng)林大學(xué)菌物研究中心保藏。
1.2.1靈芝UDP-GlcDH基因的電子克隆 以黃曲霉AspergillusflavusAF70的UDP-GlcDH蛋白序列(GenBank accession: KOC08495.1)作為探針,利用NCBI中的tBLASTn工具與靈芝Ganodermalucidam的EST數(shù)據(jù)庫進行相似性搜索,選擇與探針序列同源性較高的序列。利用BioEdit軟件進行拼接,將拼接后的基因序列在NCBI的ORF finder進行開放閱讀框查詢,結(jié)合SmartBLAST分析,確認UDP-GlcDH基因。
1.2.2靈芝UDP-GlcDH基因序列的驗證 按照北京鼎國昌盛生物技術(shù)有限責(zé)任公司的Trigol試劑提取靈芝細胞的RNA,再用反轉(zhuǎn)錄劑盒將mRNA反轉(zhuǎn)錄成cDNA。以電子克隆所得的基因序列為模板,用 Primer 5.0軟件設(shè)計正向引物F:5′-ATGGCCCCCGTCAAGGTCTC-3′,反向引物R:5′-TCAAAGGCGGTCTCC ACGACCA-3′,預(yù)計產(chǎn)物大小為1 416 bp。以反轉(zhuǎn)錄的cDNA作為模板進行PCR反應(yīng),PCR條件為:95℃預(yù)變性5 min,循環(huán)35次(95℃、30 s,55℃、30 s,72℃、90 s),最后72℃充分延伸10 min,4℃保存。用1.0%瓊脂糖凝膠電泳鑒定PCR產(chǎn)物,并將PCR產(chǎn)物交上海生工測序。
1.2.3生物信息學(xué)分析 利用生物信息學(xué)軟件對所得的UDP-GlcDH基因序列進行分析,并對基因編碼的蛋白質(zhì)進行理化性質(zhì)、親/疏水性、跨膜區(qū)結(jié)構(gòu)、信號肽、二級結(jié)構(gòu)、活性中心及底物結(jié)合位點等生物信息學(xué)的分析和預(yù)測[4],具體分析內(nèi)容和工具軟件見表1。
表1 預(yù)測基因結(jié)構(gòu)功能所用到的網(wǎng)站及軟件
經(jīng)過相似性搜索、拼接、驗證、延伸等電子克隆過程,獲得1條全長為1 591 bp的基因序列,ORF finder分析顯示,該序列從13~1 428 bp包含一個長度為1 416 bp的完整的開放閱讀框,該序列編碼471個氨基酸,起始密碼子和終止密碼子分別為ATG和TGA。電子克隆獲得的靈芝UDP-GlcDH基因序列及其編碼的氨基酸序列見圖1。
圖1 靈芝UDP-GlcDH基因cDNA序列及其編碼的氨基酸序列
提取靈芝mRNA,經(jīng)過RT-PCR驗證,得到電泳圖,從圖2可知,電泳條帶與預(yù)計的1 416 bp相符。將PCR產(chǎn)物進行測序,結(jié)果也與電子克隆得到的基因相序列符,確定所克隆的基因確實為靈芝UDP-GlcDH基因。
圖2 RT-PCR電泳結(jié)果
2.2.1靈芝UDP-GlcDH蛋白的保守結(jié)構(gòu)域預(yù)測與分析 利用NCBI中的conserved domain search 工具分析蛋白序列,結(jié)果見圖3,可以看出該蛋白的Specfic hits為UDPG_MGDP_dh_N、UDPG_MGDP_dh、UDPG_MGDP_dh_C,分別屬于F420_oxidored superfamily、UDPG_MGDP_dh和UDPG_MGDP_dh_C的超家族,是一個Multi domains蛋白,編號為PLN02353,是UDPglucose dehydrogenase。
圖3 蛋白質(zhì)的保守結(jié)構(gòu)域預(yù)測結(jié)果
從上述結(jié)果可以得出,電子克隆出的序列所編碼的蛋白確為UDP glucose dehydrogenase,說明電子克隆的結(jié)果是準確的。
2.2.2蛋白質(zhì)理化性質(zhì)預(yù)測與分析 利用Protparam軟件對蛋白質(zhì)的理化性質(zhì)進行分析,得出該蛋白包含471個氨基酸,含有20種基本氨基酸,每種氨基酸的含量見表2。
表2 UDP-GlcDH蛋白的氨基酸含量
結(jié)果表明,該蛋白相對分子質(zhì)量為51 764.4 Da,等電點為6.29。該蛋白中含量較高的氨基酸是Ala(A)11.0%和Val(V)9.1%,含量較低的是His(H)1.1%和Met(M)1.3%。另外,該蛋白含有55個帶負電荷的殘留物(天冬氨酸+谷氨酸),含有53個帶正電荷的殘留物(精氨酸+賴氨酸),其分子表達式為C2317H3683N627O685S15。
該蛋白質(zhì)水溶液在280 nm處所有成對的半胱氨酸形成半胱氨酸吸光系數(shù)為59 400,吸光度為1.148,所有半胱氨酸藏殘留減少吸光系數(shù)58 900,吸光度為1.138。估計其半衰期在哺乳動物體內(nèi)為30 h。不穩(wěn)定系數(shù)(II)為25.52,是穩(wěn)定蛋白。脂肪指數(shù)高達96.31,蛋白質(zhì)流動性好,平均親水性為0.010,表明該蛋白總體上親水性和疏水性比較平衡。
2.2.3蛋白質(zhì)親/疏水性預(yù)測與分析 利用ProtScale在線分析蛋白質(zhì)親/疏水性,結(jié)果見圖4,可知波動在0上下,說明該蛋白質(zhì)蛋白總體上親水性和疏水性比較平衡。
圖4 親/疏水性分析結(jié)果
2.2.4蛋白質(zhì)信號肽預(yù)測和分析 采用SignalP 4.1 Server軟件預(yù)測靈芝UDP-GlcDH蛋白的信號肽,結(jié)果見圖5,根據(jù)馬爾可夫模型,由于C、S、Y峰值分別為0.166、0.157、0.288,均不達到0.5,沒有發(fā)現(xiàn)信號肽的存在,所以基本可以推測此蛋白不是分泌蛋白。
圖5 信號肽預(yù)測結(jié)果
2.2.5蛋白質(zhì)亞細胞定位預(yù)測與分析 利用PSORT軟件,對蛋白質(zhì)的亞細胞定位進行預(yù)測與分析,結(jié)果見表3,該蛋白質(zhì)的亞細胞定位在內(nèi)質(zhì)網(wǎng)膜的概率最大。
表3 亞細胞定位預(yù)測結(jié)果
2.2.6蛋白質(zhì)跨膜區(qū)域結(jié)構(gòu)預(yù)測與分析 使用TMHMM在線預(yù)測工具對蛋白質(zhì)進行跨膜分析,結(jié)果見圖6,在1.0處為細胞膜外分界線,0是細胞膜內(nèi),本試驗的UD-PGlcDH蛋白在此范圍內(nèi)并無發(fā)現(xiàn)跨膜結(jié)構(gòu),其主要是胞內(nèi)活動,與細胞質(zhì)之外缺少關(guān)聯(lián),其結(jié)果表明靈芝UDP-GlcDH蛋白不存在跨膜區(qū)。
圖6 跨膜區(qū)域預(yù)測結(jié)果
2.2.7蛋白質(zhì)二級結(jié)構(gòu)預(yù)測與分析 使用GOR secondary structure prediction method version IV(GOR4)軟件對蛋白質(zhì)二級結(jié)構(gòu)進行預(yù)測與分析。
結(jié)果見圖7,可知其中無規(guī)則卷曲(random coil)的比例最高,為42.25%,其次是α螺旋(Alpha helix),占41.83%,而延伸鏈(extended strand)則只占15.92%。
注:豎線從長到短依次為α螺旋、β折疊與轉(zhuǎn)角、隨機卷曲
2.2.8蛋白質(zhì)三級結(jié)構(gòu)預(yù)測與分析 采用SWISSMODEL 在線同源建模方法,對UDP-GlcDH蛋白進行分析,預(yù)測其三級結(jié)構(gòu),并利用3D Molecule Viewer 軟件查看該三維立體分子結(jié)構(gòu)[5],見圖8,可知UDP-GlcDH蛋白的空間結(jié)構(gòu)主要由無規(guī)則卷曲和α螺旋構(gòu)成,延伸鏈數(shù)量比較少,這與二級結(jié)構(gòu)所預(yù)測的結(jié)果相一致。
圖8 靈芝UDP-GlcDH蛋白的空間構(gòu)象
2.2.9蛋白質(zhì)進化樹分析 通過ORF finder數(shù)據(jù)庫BLAST出來的結(jié)果(圖9),選取同源性較高的15條序列,使用clustal X軟件和MEGA軟件進行靈芝UDP-GlcDH蛋白與15種高等真菌的系統(tǒng)進化樹分析,從圖9可知,本試驗拼接的UDP-GlcDH基因是靈芝UDP-GlcDH基因的家族成員,與污叉絲孔菌和云芝等真菌中的UDP-GlcDH基因編碼的氨基酸序列高度同源。
圖9 靈芝UDP-GlcDH蛋白與16種真菌的系統(tǒng)進化關(guān)系
與傳統(tǒng)基因克隆方法相比,電子克隆具有高效、快速、針對性強、技術(shù)要求低等[6-7]。本研究使用的探針為黃曲霉的UDP-GlcDH序列,與靈芝的同源性較高,并且靈芝的ESTs序列比較豐富,目前已報道靈芝ESTs數(shù)量達到48 334條,本試驗采用電子克隆的可行性是很高的。
利用NCBI豐富的EST數(shù)據(jù)庫資源,以米黃霉的UDP-GlcDH蛋白質(zhì)序列為探針,經(jīng)BLAST相似性檢索和Bioedit軟件拼接得到靈芝UDP-GlcDH蛋白相應(yīng)的基因序列,通過RT-PCR試驗進行驗證,其確實是靈芝的UDP-GlcDH序列。該cDNA序列長度為1 591 bp,其中包含能編碼471個氨基酸的序列,分子量為51.8 kD,PI為6.29,存在于內(nèi)質(zhì)網(wǎng)膜中,不屬于分泌蛋白,不存在跨膜區(qū)域,UDP-GlcDH蛋白的二級結(jié)構(gòu)主要以無規(guī)則卷曲和α螺旋構(gòu)成。系統(tǒng)進化樹分析可知,靈芝UDP-GlcDH基因的家族成員,與污叉絲孔菌和云芝等真菌中的UDP-GlcDH基因編碼的氨基酸序列高度同源,可見其在進化上相對比較保守,可能與該蛋白家族的功能有密切關(guān)系。本研究成功克隆了靈芝多糖合成途徑中關(guān)鍵酶之一的UDP-GlcDH基因序列,這為今后繼續(xù)研究靈芝多糖合成奠定了良好的基礎(chǔ)。