馮志國, 王一帆,李 琳,劉振振,盧甜甜, 劉慧娟
(1. 瓊臺師范學院 a. 理學院; b. 熱帶生物多樣性與資源利用實驗室,海南 ???71000; 2. 信陽師范學院 生命科學學院,河南 信陽 464000)
果蠅作為模式生物對研究動物免疫具有重要作用。目前在黑腹果蠅體內(nèi)已發(fā)現(xiàn)了 8 種抗菌肽[1]。果蠅抗菌肽SK66是一種富含甘氨酸的多肽,主要對革蘭氏陽性菌有強烈的抑制作用。據(jù)報道[2]SK66對子宮頸癌細胞Hela的細胞增殖有明顯的抑制效果,細胞的存活率為77%。SK66可能通過細胞膜上某種受體作用使細胞穿孔,形成了陽離子通道。這說明 SK66能在細胞上形成陽離子通道,使細胞膜形成穿孔,原生質(zhì)嚴重泄漏,細胞裂解死亡。
昆蟲不具備特異性免疫系統(tǒng),其利用自身產(chǎn)生的各種昆蟲抗菌肽來應(yīng)對損傷和感染[3]。SK66是一個編碼N端為絲氨酸、C端為賴氨酸且含有66個氨基酸殘基的富甘氨酸果蠅抗菌肽[4-5]。富含甘氨酸(Gly)的抗菌肽的共同特點是一級結(jié)構(gòu)中含甘氨酸,有些是全序中富含甘氨酸[6],果蠅抗菌肽SK66結(jié)構(gòu)域中富含甘氨酸。SK66能殺滅宮頸癌細胞Hela, 經(jīng)SK66處理后子宮頸癌細胞Hela的貼壁性很快被破壞,大量細胞懸浮并死亡[7]。通過MTT試驗,發(fā)現(xiàn)SK66能夠顯著抑制子宮頸癌細胞 Hela 的增殖[8]。
在對該抗菌肽所報道信息的挖掘下發(fā)現(xiàn),編碼SK66多肽的基因CG13551屬于IATP家族,而該家族主要對線粒體ATP酶起抑制作用。在人類中編碼該家族成員的基因為ATPIF1。該基因與人類的眾多疾病的發(fā)生以及治療相關(guān)。在模式動物試驗中,敲除掉小鼠基因組中的Atpif1基因,純合變異小鼠表現(xiàn)出過度興奮和腦部發(fā)育異常的癥狀,雄性小鼠還表現(xiàn)出循環(huán)堿性磷酸酶水平下降的現(xiàn)象[9]。ATPIF1KO組小鼠腸道結(jié)構(gòu)、線粒體超微結(jié)構(gòu)得到改善,腸上皮細胞線粒體吞噬功能增強,細胞凋亡率減少,腺核苷酸轉(zhuǎn)位酶2(ANT2)蛋白減少,腸道微生物區(qū)系完整[10]。對于一些線粒體疾病,抑制ATPIF1的功能可以改善嚴重的電子傳遞鏈機能障礙[2]。利用模式動物斑馬魚的試驗中發(fā)現(xiàn)Atpif1缺失有助于先天性鐵粒幼細胞性貧血和線粒體疾病等人類疾病的治療。
抗菌肽SK66是由果蠅CG13551基因所編碼的多肽,該多肽抗菌效果顯著[2]。因此,本文通過生物信息學的手段從美國國家生物技術(shù)信息中心NCBI、歐洲分子生物學實驗室EMBL 等生物數(shù)據(jù)庫檢索出CG13551基因氨基酸序列信息,找到其所從屬的基因家族,并在一些常見的模式生物中找出該基因家族的成員,并用各種軟件對其蛋白的進化關(guān)系、結(jié)構(gòu)、性質(zhì)及功能進行系統(tǒng)的分析和預(yù)測,希望能夠?qū)υ摶蚓幋a的多肽以及其所從屬的基因家族,以及成員之間的進化有所了解。
SK66是由果蠅基因CG13551所編碼的多肽。利用該基因ID,登錄NCBI(National Center for Biotechnology Information)主頁(http://www.ncbi.nlm.nih.gov/),在“All Databases”對話框欄中輸入檢索詞“CG13551”,單擊Search 檢索。Protein 數(shù)據(jù)庫命中5條記錄。點擊“Proteins-Protein”進入數(shù)據(jù)庫,其中排在第三位、登錄號為 NP_726315.1的記錄是符合要求的記錄,單擊進入顯示相關(guān)信息。單擊右上角Send to下拉菜單選擇“FileFASTA”選項,將該蛋白序列(sequence.fasta)進行本地下載。并將序列保存在sequence.txt文件中。
通過瑞士生物信息學研究所的蛋白分析專家系統(tǒng)(Expert Protein Analysis Systerm,ExPASY,http://web.expasy.org/protparam/) 分析蛋白質(zhì)序列理化參數(shù),如分子量、等電點、氨基酸組成、摩爾消光系數(shù)、脂肪系數(shù)和總平均親水性等分析。利用ProtScale 程序(http://web.expasy.org/protscale/) 預(yù)測SK66蛋白的親疏水性。 利用在線工具SignalP (http://www.cbs.dtu.dk/services/SignalP)預(yù)測蛋白質(zhì)信號肽。使用TMHMM服務(wù)器 (http://www.cbs.dtu.dk/services/TMHMM/) 預(yù)測跨膜區(qū)結(jié)構(gòu)域。利用波蘭Bio-Informatique Lyonnais( http://npsa-pbil.ibcp.fr/cgi-bin/npsa_-automat.pl?page=/NPSA/npsa_seccons.html)對蛋白質(zhì)二級結(jié)構(gòu)進行預(yù)測。利用Swiss-model Workspace (http://swissmodel.expasy.org)對蛋白質(zhì)的空間構(gòu)象建模。
進入簡單分子結(jié)構(gòu)在線分析工具(Simple Modular Architecture Research Tool,SMART,http://smart.embl-heidelberg.de/)主頁,利用“Sequence analysis”一欄中的“Protein sequence”,在該欄中粘貼SK66蛋白序列。將“Outlier homologues and homologues of known structure”等四項全部打鉤選中,執(zhí)行“Sequence SMART”,得到該蛋白質(zhì)的PFAM domain為IATP,其Pfam號為PF04568。通過歐洲分子生物學實驗室的Pfam分析網(wǎng)站(http://pfam.xfam.org/),在JUMP TO欄中輸入“IATP”,對該domain信息進行了解。在HMM information中下載IATP基因家族保守domain的隱馬科夫模型。在歐洲分子生物學實驗室與維爾康姆基金會桑格研究所聯(lián)合出版在線網(wǎng)站(Ensembl,http://www.ensembl.org/index.html),下載果蠅(Drosophilamelanogaster)、斑馬魚(Daniorerio)、人(Homosapiens)、河豚(Tetraodontidae)、小鼠(Musmusculus)的Protein sequence和Annotated sequence,保存為FASTA格式文件。通過Xshell端口將文件上傳至本地服務(wù)器數(shù)據(jù)庫中,利用HMMsearch將這些物種中IATP家族成員序列調(diào)取出來。將成員序列保存至All sequence. FASTA文件中。
打開MEGA7.0,利用“Align”菜單下的“Edit/Build Alignment”選項,新建一個蛋白質(zhì)序列比對。將保存的All sequence.FASTA文件打開并用MUSCLE Align Protein,保存文件All sequence.mas。在主窗口中打開上步保存的All sequence.mas文件,序列輸入到MEGA軟件中。在主窗口點擊“Phylogeny”執(zhí)行“Construct/Neighbor-Joining”,選擇臨近法操作,得到NJ進化樹。
通過NCBI主頁( http://www.ncbi.nlm.nih.gov/),在Protein 數(shù)據(jù)庫中檢索得到的SK66蛋白序列文件,如圖1所示。
圖1 利用Clustal2.0顯示的SK66蛋白序列Fig. 1 SK66 protein sequence as shown by Clustal2.0
利用在線工具對蛋白質(zhì)的各種理化性質(zhì)進行預(yù)測,SK66蛋白含有107個氨基酸殘基,分子量約11 948.3 Da,理論等電點為8.96。其不穩(wěn)定系數(shù)為56.12,根據(jù)不穩(wěn)定參數(shù)值在40以下才是穩(wěn)定蛋白的標準,可推定該段蛋白穩(wěn)定性一般。脂肪系數(shù)為63.93,疏水性評估系數(shù)為-0.903。該蛋白中,甘氨酸(Gly)含量最高,為14.0%;其次為谷氨酸(Glu)和丙氨酸(Ala),分別為11.2%和9.3%。
使用ProtScale對SK66蛋白的親疏水性進行預(yù)測,分值越低代表親水性越強,分值越高疏水性越強。圖2結(jié)果表明該蛋白質(zhì)親水性最大的氨基酸是精氨酸,分值為-4.5;疏水性最大的氨基酸是異亮氨酸,分值為4.5。由圖2可知,從整體上看來,該蛋白的親水性氨基酸要遠遠多于疏水性氨基酸,因此可以認為SK66蛋白是一個親水蛋白質(zhì)。
圖2 SK66氨基酸親水性/疏水性輪廓Fig. 2 Hydrophilic/hydrophobic profile of SK66 amino acid
利用在線工具SignalP預(yù)測到SK66蛋白信號肽,并未顯示信號肽剪切位點。預(yù)測該蛋白并非分泌蛋白,如圖3所示。
圖3 SK66蛋白信號肽預(yù)測結(jié)果Fig. 3 Prediction results of SIGNAL peptide of SK66 protein
跨膜結(jié)構(gòu)是蛋白質(zhì)與膜內(nèi)在蛋白的靜電相互作用和氫鍵相互作用與膜結(jié)合的一段氨基酸片段,一般由20個氨基酸左右的疏水性氨基酸殘基組成,主要形成α-螺旋[6]。預(yù)測和分析利用在線軟件TMHMM2.0 Server對果蠅抗菌肽SK66蛋白進行跨膜結(jié)構(gòu)分析,不存在跨膜結(jié)構(gòu)域(見圖4)。
圖4 SK66蛋白跨膜區(qū)預(yù)測結(jié)果Fig. 4 Prediction results of SK66 protein transmembrane region
蛋白質(zhì)的空間結(jié)構(gòu)決定了它的生物學功能,而它的空間結(jié)構(gòu)又由其一級結(jié)構(gòu)即氨基酸序列決定。蛋白質(zhì)二級結(jié)構(gòu)包括α-螺旋、β-折疊、β-轉(zhuǎn)角以及無規(guī)則卷曲等構(gòu)象。利用波蘭Network Protein Sequence Analysis對果蠅的抗菌肽SK66蛋白二級結(jié)構(gòu)預(yù)測(圖5)。其中α-螺旋(helix)占57.96%,β-折疊占(sheet)10.28%,無規(guī)則卷曲(coil)占31.78%。
圖5 SK66蛋白二級結(jié)構(gòu)預(yù)測結(jié)果Fig. 5 Prediction results of secondary structure of SK66 protein
蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測對研究蛋白質(zhì)的功能至關(guān)重要。常用于預(yù)測蛋白質(zhì)三維結(jié)構(gòu)的方法有從頭預(yù)測法和同源建模的方法。本文中使用同源建模的方法來對SK66蛋白的三維結(jié)構(gòu)進行預(yù)測。利用Expasy中的SWISS-MODEL同源建模方法預(yù)測SK66蛋白的三級結(jié)構(gòu),獲得SK66蛋白的三維結(jié)構(gòu)模型(圖6)。由圖6可知,α-螺旋(占主要部分)。
圖6 SK66蛋白三維結(jié)構(gòu)模型預(yù)測Fig. 6 Prediction of THREE-DIMENSIONAL structure model of SK66 protein
本文所探討的果蠅抗菌肽SK66蛋白質(zhì)序列在SMART網(wǎng)站中,進行motif分析后發(fā)現(xiàn),該多肽含有一保守的domain, 名稱為IATP(如圖7所示)。該domain從多肽的第三位氨基酸至第107位氨基酸。在Pfam網(wǎng)站上輸入該保守domain的Pfam號,得知IATP家族主要功能為線粒體ATP酶抑制劑。在人類中該酶是由ATP1F1基因所編碼。該基因在翻譯時會發(fā)生可變間接,并且已經(jīng)檢測到3個不同的轉(zhuǎn)錄本。在電子傳遞鏈受損時,線粒體ATP酶抑制劑能夠抑制ATP酶水解ATP[9]。每一個ATP合酶抑制劑都與F1ATP酶由α-β連接起來。ATP合酶抑制劑通過組織ATP的釋放來抑制ATP合酶的功能[6,10]。該抑制劑有二聚體和四聚體兩種低聚物狀態(tài),活性狀態(tài)時變現(xiàn)為二聚體狀態(tài)。在低pH值時,該抑制劑形態(tài)表現(xiàn)為由兩個單體的C末端經(jīng)反平行的螺線圈連接而成的二聚體。在高pH值時,該抑制劑表現(xiàn)為四聚體狀態(tài),四聚體由螺線圈將N末端和抑制活性區(qū)連接的所構(gòu)成。由于四聚體的抑制活性區(qū)被連接隱藏,該酶無抑制活性。
圖7 保守domain-IATP模式圖Fig. 7 Diagram of the conservative Domain-IATP schema
在HMM information中下載IATP基因家族保守domain的隱馬科夫模型。將所選取物種的蛋白質(zhì)序列以及IATP家族的隱馬爾科夫模型通過Xshell終端上傳至服務(wù)器。每個物種建立相關(guān)文件夾,在終端對話框中利用Linux系統(tǒng)中的HMMSearch功能,執(zhí)行命令“nohup hmmsearch-E 1e-5-domtblout IATP.hmm.txt IATP.hmm某物種蛋白質(zhì)庫 > IATP.hmm.out &”,分別找出果蠅(Drosophilamelanogaster)、斑馬魚(Daniorerio)、人(Homosapiens)、河豚(Tetraodontidae)、小鼠(Musmusculus)的IATP家族成員。由于所得到的序列中可能存在一些不屬于或不含IATP domain的蛋白,因此需要將這些偽成員剔除。將這些IATP家族成員在MEME(Multiple Em for Motif Elicitation)在線網(wǎng)站進行motif檢測分析。對所得到的家族成員進行初次篩選,去除不含有IATP domain的家族成員。為了確保所得序列確實是均為IATP家族以及實驗的嚴謹。利用SMART網(wǎng)站的序列檢測分析每一個家族成員的保守domain。結(jié)果發(fā)現(xiàn)共有來自5個物種的12條序列含有IATP Pfam,均為IATP家族成員。圖8所示的1號矩形框為IATP Pfam。
根據(jù)Mega軟件中的muscle對不同來源的IATP家族成員蛋白氨基酸序列進行序列對齊(如圖9所示)
圖8 5個物種中12條序列的motif模型Fig. 8 Motif models of 12 sequences in five species
圖9 利用Clustal2.0對SK66蛋白進行的比對結(jié)果Fig. 9 Comparison results of SK66 protein using Clustal2.0
根據(jù)相似度進行同源性分析,利用MEGA 7.0作同源樹,并用TreeView 進行顯示(圖10)。
注:A為人(Homo sapiens),B為小鼠(Mus musculus),C為河豚(Tetraodontidae),D為斑馬魚(Danio rerio),E為果蠅(Drosophila melanogaster)。
圖10進化樹顯示,主要分成兩類,較為高等的動物分為第一類包括:人、小鼠、河豚,而較為低等的動物歸為一類包括:斑馬魚、果蠅。這與物種的進化程度相一致。
應(yīng)用生物信息學方法和工具對果蠅抗菌肽SK66蛋白的理化性質(zhì)、信號肽、疏水性/親水性、二級結(jié)構(gòu)、三級結(jié)構(gòu)、結(jié)構(gòu)域、蛋白質(zhì)的功能分類和氨基酸同源性進行了分析。結(jié)果顯示,SK66蛋白為一親水性的分泌蛋白,編碼該蛋白的基因?qū)儆贗ATP家族成員。通過利用IATP家族保守domain隱馬爾科夫模型,進行不同物種蛋白質(zhì)庫家族成員搜索,多重比對和進化分析,發(fā)現(xiàn)了從屬于同一IATP家族、不同動物來源的進化關(guān)系。分布在不同物種中的IATP家族成員的進化關(guān)系,是與這些物種的進化程度成正比關(guān)系的。在后續(xù)的研究中,可在模式動物基因組內(nèi)發(fā)現(xiàn)旁系同源的基因或蛋白,從而可以更好地研究該基因乃至該家族成員的功能。這些分析和預(yù)測為進一步研究IATP家族成員在對于線粒體疾病的預(yù)防和治療以及其潛在功能打下理論基礎(chǔ)。