, , ,2, ,2, ,2
重慶市科委項目(No.2015jcyA10017)和重慶市教委(No.KJ1400210)聯(lián)合資助
肺孢子菌肺炎[1],又稱卡氏肺孢子蟲肺炎,卡氏肺囊蟲肺炎,是由肺孢子菌引起的間質(zhì)性漿細胞性肺炎,為條件性肺部感染性疾病。本病20世紀(jì)50年代前僅見于早產(chǎn)兒,營養(yǎng)不良嬰兒,近10年來隨著免疫抑制劑的應(yīng)用,腫瘤化療的普及尤其是HIV感染的出現(xiàn),發(fā)病率明顯上升,已成為HIV感染患者最常見的機會感染與致死的主要病因。肺孢子菌[2]主要定位在肺泡內(nèi),主要通過纖維連接蛋白等黏著蛋白被固著在肺泡巨噬細胞上。此外,菌體的一些抗原成分如主要表面糖蛋白(Major surface glycoprotein,MSG)[3]和P55同時激發(fā)宿主產(chǎn)生細胞免疫和體液免疫反應(yīng),產(chǎn)生包括α-腫瘤壞死因子、白細胞介素-2、調(diào)理素和特異性抗體等一系列細胞和體液因子,使菌體迅速被活化的巨噬細胞吞噬殺滅。但是在免疫功能缺陷的宿主體內(nèi),菌體卻能逃脫巨噬細胞的吞噬而不斷繁殖并充滿肺泡腔。如果能夠通過破壞纖維連接蛋白從而阻斷菌體侵入肺泡的橋梁,就可以為PCP的治療提供新的研究方向。蛇毒[4],其組成的蛋白質(zhì)中幾乎半數(shù)以上是具有各種催化活性的酶類,這些酶無論在生物化學(xué)研究上,還是在臨床應(yīng)用實踐中,都有其重要意義[5]。如果證明纖維連接蛋白結(jié)構(gòu)具有不穩(wěn)定性,就可以預(yù)測纖維連接蛋白很容易被破壞,然后探索纖維連接蛋白和膠原蛋白的空間結(jié)構(gòu)的相似性,就可以利用蛇毒中的膠原蛋白酶[6]來破壞纖維連接蛋白,從而阻斷纖維連接蛋白與肺孢子菌MSG(主要表面糖蛋白,Major surface glycoprotein)的結(jié)合,阻止肺孢子菌侵入肺泡。
1.1.1從GenBankTM(ftp://ncbi.nlm.nih.gov/genbank)中獲得蛋白質(zhì)序列
1.1.2用NCBI中的BLAST軟件進行蛋白質(zhì)的序列比對
1.2.1用ProtParam(http://us.expasy.org/tools/protparam.html)預(yù)測纖維連接蛋白及膠原蛋白的分子量、等電點、氨基酸組成、穩(wěn)定指數(shù)等一系列理化特性
1.2.2用ProtScale(http://www.expasy.org/cgi-bin/protscale.pl)預(yù)測纖維連接蛋白的親水性/疏水性
1.2.3用BioEdit(http://www.mbio.ncsu.edu/BioEdit/BioEdit.html)分析纖維連接蛋白的親水性/疏水性
1.2.4用TMHMM(http://www.cbs.dtu.dk/services/TMHMM/)預(yù)測纖維連接蛋白的跨膜結(jié)構(gòu)域
1.2.5用SignalP(http://www.cbs.dtu.dk/services/SignalP/)對纖維連接蛋白進行信號肽的預(yù)測
1.2.6用TargetP(http://www.cbs.dtu.dk/services/TargetP/)預(yù)測纖維連接蛋白的亞細胞定位
1.3.1為準(zhǔn)確預(yù)測纖維連接蛋白和膠原蛋白的高級結(jié)構(gòu),利用 SWISS-MODEL(http://www.expasy.ch/swissmod/SWISS-MODEL.html/)和Verify3D,通過同源建模法對纖維連接蛋白和膠原蛋白進行預(yù)測,然后通過Verify3D進行質(zhì)量評估
1.3.2采用expasy系統(tǒng)中的SMART軟件預(yù)測纖維連接蛋白和膠原蛋白的保守結(jié)構(gòu)域。
2.1纖維連接蛋白的序列查找結(jié)果 根據(jù)發(fā)現(xiàn)纖維結(jié)合素的文章所提供的提交在NCBI上的纖維連接蛋白序列號P02751從NCBI上調(diào)出該蛋白質(zhì)的序列,包含2 386個氨基酸。
2.2P02751蛋白的理化性質(zhì)分析 利用ProtParam工具分析P02751蛋白的理化性質(zhì)分析得知,P02751的蛋白分子量約為259 kDa,理論等電點PI為5.39,總共包括35 841個原子,分子式為C11351H17590N3169O3644S88。在組成P02751蛋白的20種氨基酸中,蘇氨酸所占的比例最高,達到10.8%,而甲硫氨酸所占的比例最低,為1.1%。P02751蛋白的不穩(wěn)定指數(shù)為40.56,脂肪指數(shù)為66.02。根據(jù)Guruprasad方法表明P02751蛋白不穩(wěn)定。
2.3P02751蛋白的疏水區(qū) 通過訪問ExPAsy服務(wù)器,計算基于K-D法的蛋白質(zhì)疏水性,結(jié)果得知P02751蛋白有疏水區(qū)(圖1)。
圖1 ProtScale程序分析P02751蛋白的疏水性Fig.1 Analysis on the hydrophobicity of P02751 protein by ProtScale program
2.4P02751 蛋白的疏水性分析 使用生物信息學(xué)軟件BioEdit分析蛋白質(zhì)的疏水性,結(jié)果表明P02751蛋白在0-50位氨基酸之間有一個疏水區(qū),在2200-2300位氨基酸之間有一個親水區(qū),與ProtScale程序分析結(jié)果一致(圖2)。
圖2 利用BioEdit軟件分析P02751蛋白的疏水性Fig.2 Using BioEdit software to analyze the hydrophobicity of P02751 protein
2.5P02751蛋白的跨膜區(qū)分析 使用TMHMM對P02751蛋白進行跨膜區(qū)分析,結(jié)果顯示P02751蛋白的1-2386位氨基酸全部位于細胞膜表面,表明該蛋白可能不是一個與細胞信號轉(zhuǎn)導(dǎo)有關(guān)的膜受體蛋白,它發(fā)揮生物學(xué)功能的方式可能不是以信號轉(zhuǎn)導(dǎo)的方式。
2.6P02751 蛋白的信號肽預(yù)測結(jié)果及分析 使用SignalP3.0服務(wù)器對P02751蛋白進行信號肽預(yù)測,從結(jié)果中分析s平均值>0.5,則預(yù)測該蛋白為分泌蛋白,存在信號肽。基于神經(jīng)網(wǎng)絡(luò)算法的結(jié)果表明,該蛋白具有信號肽序列,最可能的剪切位點位于第26-27位氨基酸之間,具體序列為MLRGPGPGLLLLAVQCLG,說明P02751蛋白可能在跨膜運輸中起信號識別作用,剪切位點在第26-27位氨基酸之間,表明成熟肽始于第26位氨基酸(圖3,表1)。
圖3 使用SignalP3.0軟件預(yù)測信號肽Fig.3 Using SignalP3.0 to predict signal peptide
2.7P02751蛋白的亞細胞定位預(yù)測結(jié)果及分析 通過TargetP對P02751蛋白的亞細胞定位進行預(yù)測,結(jié)果顯示目的蛋白P02751的分泌途徑為S型,即分泌通路,可靠性級別為2級(0.800>diff>0.600),與SignalP3.0服務(wù)器預(yù)測的結(jié)果一致(表2)。
表1 基于神經(jīng)網(wǎng)絡(luò)算法的SignalP預(yù)測結(jié)果
Tab.1 Prediction results of SignalP based on neural network algorithm
測量指標(biāo)位置計算值量值信號肽max. C270.303max. Y270.458max. S50.895mean S1-260.717 D1-260.5980.450YES
Name=sp_P02751_FINC_HUMAN;SP='YES' Cleavage site between pos. 26 and 27: TGA-SK D=0.598 D-cutoff=0.450;Networks=SignalP-noTM
表2 TargetP1.1Server亞細胞定位結(jié)果
Tab.2 TargetP1.1Server subcellular localization results
名稱 長度線粒體導(dǎo)肽信號肽其他類型可能定位可靠性級別sp_P02751_FINC_HUMAN 23860.1670.7970.034S2cutoff0.0000.0000.000
2.8P02751蛋白和Q99715蛋白的序列相似性比對結(jié)果 P02751蛋白質(zhì)在人類基因組數(shù)據(jù)庫用Blastp命令、選擇Swissprot and TREMBL proteins(AA)數(shù)據(jù)庫進行蛋白質(zhì)序列比對,結(jié)果得出p02751蛋白和q99715蛋白的各個種屬均有不同程度的相似性,一致性在30%(表3)。
2.9Q99715蛋白的理化性質(zhì)分析 同樣對膠原蛋白(Q99715)進行理化性質(zhì)分析,結(jié)果顯示膠原蛋白(Q99715)的分子質(zhì)量約為330 kDa、理論等電點pI為7.62,總共包括46 349個原子,分子式為C14662H23037N3975O4610S65;在組成Q99715蛋白的20種氨基酸中,甘氨酸所占的比例最高,為9.2%,半胱氨酸所占的比例最低,為0.7%;Q99715蛋白的不穩(wěn)定指數(shù)為32.52,脂肪指數(shù)為74.92,根據(jù)Guruprasad方法表明該蛋白穩(wěn)定。
2.10同源建模結(jié)果 同源建模結(jié)果及通過Verify 3D軟件對建模結(jié)果進行質(zhì)量評估,得出p02751蛋白的質(zhì)量評估結(jié)果是89.95%,q99715蛋白的質(zhì)量評估結(jié)果是80.5%(在3D結(jié)構(gòu)中,至少80%的氨基酸的得分≥0.2分,建模結(jié)果屬于可信)。(圖4(1,2),圖5(1,2))。
2.11蛋白保守結(jié)構(gòu)域的預(yù)測結(jié)果 纖維連接蛋白和膠原蛋白的保守結(jié)構(gòu)域的預(yù)測結(jié)果及它們所屬蛋白家族,得出纖維連接蛋白和膠原蛋白的保守結(jié)構(gòu)域所屬家族同是Ensembl家族(圖6(1,2))。
表3 之間的相似性分析p02751蛋白和q99715蛋白
Tab.3 The similarity analysis between P02751 protein and Q99715 protein
類型比對序列最大值序列總長度所占百分比(%)期望值相似度登錄號 Collagen alpha-1(xx)chain iso-form x5 [Homo sapiens]130307574e-2930XP011527242.1Collagen alpha-1(xx)chain precur-sor [Homo sapiens]129306574e-2930NP066933.2Collagen alpha-1(xx)chain iso-form x1 [Homo sapiens]129392568e-2930XP011527238.1Collagen alpha-1(xx)chain iso-form x2 [Homo sapiens]129395588e-2930XP011527239.1Collagen alpha-1(xx)chain iso-form x5 [Homo sapiens]129307574e-2930XP011527242.1Collagen alpha-1(xx)chain precur-sor [Homo sapiens]129306575e-2930NP065933.2Collagen alpha-1(xx)chain iso-form x2 [Homo sapiens]129395587e-2930XF011527239.1Collagen alpha-1(xx)chain iso-form x1 [Homo sapiens]129392567e-2930XF011527238.1Collagen alpha-1(xx)chain iso-form x4 [Homo sapiens]128392581e-2630XF011527241.1Collagen alpha-1(xx)chain iso-form x3 [Homo sapiens]128392591e-2830XF011527240.1
圖4(1) 纖維連接蛋白的三級結(jié)構(gòu)Fig.4(1) Three level structure of P02751 protein圖4(2) 纖維連接蛋白的同源性建模及質(zhì)量評價結(jié)果Fig.4(2) The results of homology modeling and quality evaluation of fibronectin圖5(1) 膠原蛋白的三級結(jié)構(gòu)Fig.5(1) Three level structure of Q99715 protein圖5(2) 膠原蛋白的同源性建模和質(zhì)量評價結(jié)果Fig.5(2) The results of collagen homology modeling and quality assessment
圖6(1) 纖維連接蛋白的保守結(jié)構(gòu)域圖Fig.6(1) Conserved domain of P02751 protein圖6(2) 膠原蛋白的保守結(jié)構(gòu)域圖Fig.6(2) Conserved domain of Q99715 protein
PCP是一種嚴(yán)重的機會感染性疾病, AIDS患者應(yīng)用磺胺甲惡唑/甲氧芐啶或噴他脒療程要長,為3周或更長[7]。初期療效同非AIDS患者相似,但藥物副作用的發(fā)生率和嚴(yán)重性更明顯,復(fù)發(fā)率可高達50%[8]。目前,尚沒有研制出針對肺孢子菌的疫苗,也沒有研制出副作用較小的藥物,加之肺孢子菌在不同的生物體中的基因型有很大差異[9],如此一來對于研究靶向疫苗就成為難題了,由于該蟲種的體外培養(yǎng)和獲取都有一定的難度,動物模型的建立需要很長的時間,最后的結(jié)果也不盡如人意,所以對于其治療手段的研究就出現(xiàn)了挑戰(zhàn)。
近年來,隨著科學(xué)發(fā)展,國內(nèi)外蛇毒研究工作迅速興起,蛇毒應(yīng)用越來越廣,蛇毒的科學(xué)價值和經(jīng)濟價值逐步被認識。例如磷酸二酯酶被用作核酸和核苷酸類輔助因子結(jié)構(gòu)的分析[4];蛋白酶被用作蛋白質(zhì)和多肽一級結(jié)構(gòu)的測定,磷脂酶A2用作細胞膜結(jié)構(gòu)和功能的研究等[10]。膠原蛋白不被一般水解酶水解,而對動物體內(nèi)的膠原蛋白酶(EC3,4,24)敏感。動物體內(nèi)的膠原蛋白酶作用于膠原蛋白三螺旋體特殊部位,釋放出二種肽,分別稱為TcA和TcB,長度分別為膠原蛋白單體的3/4和1/4。很早就有人懷疑蛇毒中也含有膠原蛋白酶,直到近些年才得以證實[11]。該酶和其他動物膠原蛋白酶相似,作用于膠原蛋白螺旋區(qū)的特異部位,水解產(chǎn)生兩種肽,大小和其他動物膠原蛋白酶水解的產(chǎn)物相似,只不過TcA分子量稍大而已,可能蛇毒膠原蛋白酶水解的部位更接近C端。它不能水解合成的蛋白酶底物TAME和A-TEE,這說明它與胰蛋白酶、胰凝乳蛋白酶不同,而是一種特異的膠原蛋白酶[12],因此蛇毒的應(yīng)用就顯得更有意義了。但是蛇毒的獲取比較困難加上考慮到生態(tài)問題,科學(xué)家不能大量捕殺蛇類來做科學(xué)研究,那么通過生物信息學(xué)手段探索出哪些蛋白質(zhì)能夠被蛇毒成分中的哪些酶類水解和破壞就顯得極其重要了。
生物信息學(xué)軟件分析[13]顯示纖維連接蛋白疏水區(qū)沒有親水區(qū)有典型優(yōu)勢。因為氨基酸的疏水的相互作用[14],在保持蛋白質(zhì)三級結(jié)構(gòu)的形成和穩(wěn)定性中起著重要作用,所以可以推測纖維連接蛋白結(jié)構(gòu)不夠穩(wěn)定[15]。而分析得知膠原蛋白屬于較穩(wěn)定蛋白,纖維連接蛋白(P02751)與膠原蛋白(Q99715)具有序列相似性,空間結(jié)構(gòu)具有相似性以及具有相似的保守結(jié)構(gòu)域,它們所屬的蛋白家族也具有相似性。纖維連接蛋白相對于膠原蛋白又較不穩(wěn)定,蛇毒中的膠原蛋白酶可以水解膠原蛋白,因此推測蛇毒中的膠原蛋白酶可以水解纖維連接蛋白,為PCP的研究提供了新的方向。纖維連接蛋白廣泛存在于動物組織和組織液中,是一種高分子糖蛋白,具有多種生物學(xué)功能。纖維連接蛋白在進化過程中保守性很強,各種動物體液中的纖維連接蛋白具有相近的結(jié)構(gòu)性質(zhì)和生物學(xué)功能,因而不同來源的纖維連接蛋白可以相互替代使用,這也給下一步探索肺孢子菌寄生在動物和人體兩類宿主內(nèi)的聯(lián)系和區(qū)別提供了新的線索。從另一個方面來研究,因為蛇毒中還有一些細胞毒素,神經(jīng)毒素等可以對細胞等結(jié)構(gòu)進行破壞,也可以作為肺孢子菌治療的研究熱點,后續(xù)的研究需要各國科學(xué)家極力探索。