陳 慧,陳玉梅,周 怡,謝雨彤,楊 潮
(贛南師范大學(xué)生命科學(xué)學(xué)院,江西,贛州 341000)
WD 基序最早被發(fā)現(xiàn)存在于G 蛋白的β 亞基中,通常以glycine-histidine(GH)開始而以 tryptophan- asparticacid (WD)結(jié)束,GH 和WD 之間由大約 40個保守的氨基酸核心序列組成,其主要功能是形成多個蛋白復(fù)合物可逆裝配的平臺[1-3]。WD 重復(fù)蛋白(WD repeat protein)家族是一類蛋白結(jié)構(gòu)域中存在有多個WD 基序的蛋白家族。該家族成員廣泛存在于真核細(xì)胞中,不僅在信號轉(zhuǎn)導(dǎo)、轉(zhuǎn)錄調(diào)控和細(xì)胞凋亡等生物學(xué)過程中發(fā)揮重要作用,還與癌癥、神經(jīng)變性病等多種疾病的發(fā)生發(fā)展密切相關(guān)[4-5]。WDR70 隸屬于WD 重復(fù)蛋白家族,它是一個進(jìn)化高度保守的基因,參與調(diào)控基因的同源重組過程,對基因組和染色體穩(wěn)定性的維護(hù)有重要貢獻(xiàn)[6]。在cullin-4-DDB1 Ring 型E3 泛素連接酶復(fù)合體的組裝中WDR70 蛋白發(fā)揮了重要作用,可通過促進(jìn)組蛋白H2B 的單泛素化來實現(xiàn)對DNA 損傷的修復(fù)。WDR70 基因的沉默或WDR70 突變型的過度表達(dá)都會破壞同源重組功能蛋白RPA32 的磷酸化水平和重組酶RAD51 在DNA 損傷部位的募集能力,而WDR70 功能的喪失也會導(dǎo)致中期染色體斷裂的升高[7]。同時,WDR70 被發(fā)現(xiàn)與癌癥關(guān)系密切,唐子執(zhí)等發(fā)現(xiàn)WDR70 在卵巢癌臨床樣本中出現(xiàn)多種突變,這些突變可能導(dǎo)致WDR70 轉(zhuǎn)錄本穩(wěn)定性降低,翻譯移位或提前終止,都會最終導(dǎo)致WDR70 蛋白功能喪失[8]。
本研究利用多種生物信息學(xué)軟件對WDR70 蛋白結(jié)構(gòu)與功能進(jìn)行分析和預(yù)測,以人類和其他物種的WDR70 同源蛋白數(shù)據(jù)作為分析對象,獲得了人WDR70 基因特征及蛋白理化性質(zhì)、二級結(jié)構(gòu)、三級結(jié)構(gòu)和互作網(wǎng)絡(luò)等信息。同時,比對了不同物種來源的WDR70 蛋白氨基酸序列并構(gòu)建了系統(tǒng)發(fā)育樹,為后續(xù)開展該蛋白生物學(xué)功能的研究提供信息數(shù)據(jù)支撐。
在NCBI 網(wǎng)站上獲取不同物種WDR70 蛋白的氨基酸序列(如表1)。
表1 不同物種的WDR70 蛋白信息 Table 1 The information of WDR70 protein from different species
本研究采用了多種生物信息學(xué)軟件,具體軟件和功能如下:ProtParam tool 用于計算WDR70 蛋白各種氨基酸的組成和理化性質(zhì)分析;TMHMM Server2.0 和 SignalP 4.1 用于分析人WDR70 蛋白是否含有跨膜區(qū)域和信號肽;Gene Cards 用于預(yù)測人WDR70 蛋白的亞細(xì)胞定位情況;MEGA5.0 軟件用于分析不同物種來源的WDR70 蛋白之間的進(jìn)化關(guān)系;DNAStar 軟件用于不同物種來源的蛋白質(zhì)多重序列比對;SOPMA 和PSIPRED Server 4.0 軟件用于預(yù)測人 WDR70 蛋白進(jìn)行二級結(jié)構(gòu);SWISS-MODEL 和RasMol 軟件用于人WDR70 蛋白進(jìn)行同源建模和三級結(jié)構(gòu)數(shù)據(jù)的分析。
人 WD 重復(fù)包含蛋白 70 (WD repeat- containing protein 70)基因位于人類5 號染色體短臂2 區(qū)13 帶,Gene ID 號為55100,該基因跨越373413 bp,包含有18 個外顯子。人WDR70 基因轉(zhuǎn)錄產(chǎn)物長度為2169 bp,編碼了654 個氨基酸殘基,分子量約為 73 kD。
為了探究人WDR70 蛋白的物理和化學(xué)特性, ProtParam tool 軟件被用于分析人WDR70 蛋白,結(jié)果發(fā)現(xiàn)該蛋白由654 個氨基酸殘基構(gòu)成,分子式為C3178H5021N907O1017S31,包含10154 個原子,相對分子量為 73.2016 kD(表2)。在氨基酸組成中,有20 種氨基酸參與了該蛋白的編碼,其中絲氨酸的含量最高,所占比例達(dá)到了8.6%。同時從表2 中可以看出,人WDR70 蛋白的等電點pI 為5.94;不穩(wěn)定參數(shù)為47.89,數(shù)值高于40;蛋白半衰期約為30 h,因而推測人WDR70 為酸性不穩(wěn)定蛋白質(zhì)[9]。對WDR70 蛋白的疏水性分析發(fā)現(xiàn),其疏水性平均系數(shù)(grand average of hydropathicity,GRAVY)為-0.769,數(shù)值小于0,推測人WDR70 為親水蛋白[10]。同時,ProtScale 軟件分析結(jié)果發(fā)現(xiàn)WDR70 蛋白氨基酸序列中親水性氨基酸所占比例達(dá)到了77.83%,而疏水性氨基酸約占21.56%,其中第157-160 位氨基酸的分值最低為-3.5,第246 位氨基酸的分值最高為1.756,這樣的結(jié)果表明WDR70 為親水性蛋白質(zhì),與ProtParam tool 軟件分析結(jié)果一致 (圖1)。
表2 人WDR70 蛋白理化性質(zhì)分析表 Table 2 The physical and chemical properties of human WDR70 protein
圖1 WDR70 蛋白親水性和疏水性分析 Fig.1 The hydrophilicity/hydrophobicity analysis of human WDR70 protein
為了考察跨膜區(qū)域和信號肽是否存在于人WDR70蛋白中,我們采用了TMHMM和SignalP 4.1 軟件對人 WDR70 蛋白進(jìn)行了預(yù)測和分析。TMHMM 軟件預(yù)測結(jié)果發(fā)現(xiàn)人WDR70 蛋白不包含跨膜區(qū)域,預(yù)示著人WDR70 蛋白不是跨膜蛋白(如圖2)。
圖2 WDR70 蛋白跨膜區(qū)預(yù)測 Fig.2 The prediction of WDR70 protein transmembrane structure
同時,SignalP4.1 軟件對人WDR70 蛋白進(jìn)行分析,結(jié)果發(fā)現(xiàn)所有氨基酸的C 值、S 值、Y 值均遠(yuǎn)低于平均值0.5, mean S score 小于0.5 被認(rèn)為是非分泌性蛋白質(zhì),因而推斷WDR70 蛋白不具有信號肽,為非分泌性蛋白(圖3)。
圖3 WDR70 蛋白信號肽分析 Fig.3 The prediction of signal peptide in WDR70 protein
Gene Cards 的分析結(jié)果顯示,人WDR70 蛋白主要定位于細(xì)胞核中,在細(xì)胞質(zhì)和線粒體中存在有少量分布。這也印證了人WDR70 蛋白為非分泌蛋白,說明它是一種在細(xì)胞內(nèi)行使功能作用的蛋白(圖4)。
圖4 人WDR70 蛋白亞細(xì)胞定位 Fig.4 The subcellular localization of human WDR70
為了構(gòu)建不同物種之間的WDR70 蛋白的系統(tǒng)發(fā)育樹,我們在NCBI 網(wǎng)站上檢索獲得了人、黑猩猩、白枕白眉猴和食蟹獼猴等物種的WDR70 蛋白氨基酸序列,利用DNA-Star 軟件進(jìn)行序列比對后發(fā)現(xiàn)這些氨基酸序列存在高度的同源性,其中部分氨基酸序列完全重疊(圖5)。序列比對的結(jié)果顯示,人WDR70 與黑猩猩、白枕白眉猴、食蟹獼猴的WDR70 氨基酸序列相似性高達(dá)98.78%,表明不同物種來源的WDR70蛋白具有高度的保守性 (圖5)。圖6 所示的MEGA 軟件構(gòu)建的Neighbor-Joining (NJ)系統(tǒng)發(fā)育樹,表明人WDR70 與黑猩猩WDR70 蛋白同屬于一個分支類群,而其他物種的WDR70 蛋白則形成另外的分支,且與物種之間的親緣關(guān)系和進(jìn)化關(guān)系基本一致(圖6)。
圖5 人、黑猩猩、白枕白眉猴、食蟹獼猴WDR70 蛋白序列比對結(jié)果 Fig.5 The alignment result of the WDR70 sequences from human, Pan troglodytes, Cercocebus atys and Macaca fascicularis.
圖6 WDR70 蛋白序列分析進(jìn)化樹 Fig.6 Phylogenetic tree of the A1AT proteins from different spices
SOPMA 軟件分析結(jié)果發(fā)現(xiàn)WDR70 蛋白中 a-螺旋、β-折疊和無規(guī)則卷曲分別占17.76%、29.71%和53.53%; PSIPRED Server 4.0 軟件對WDR70 蛋白分析顯示,α-螺旋、β-折疊和無規(guī)則卷曲是其主要的結(jié)構(gòu)形式,分別所占比例為12.8%、18.0%和69.2%。兩種軟件的預(yù)測結(jié)果顯示無規(guī)則卷曲是人WDR70 蛋白主要的二級結(jié)構(gòu)(圖7 和圖8)。
圖7 SOPMA 軟件預(yù)測WDR70 蛋白二級結(jié)構(gòu) Fig.7 The prediction of WDR70 secondary structure by SOPMA software
圖8 PSIPRED 軟件預(yù)測WDR70 蛋白二級結(jié)構(gòu) Fig.8 The prediction of WDR70 secondary structure by PSIPRED software
對蛋白質(zhì)的三級結(jié)構(gòu)的了解將有助于更好地理解生物體中蛋白的理化特性,以及其相關(guān)聯(lián)的化學(xué)反應(yīng)途徑及其機(jī)制,對于生物世界的認(rèn)識和藥物的研發(fā)都起著關(guān)鍵作用。我們采用SWISS-MODEL同源建模方式得到人WDR70 蛋白的三維預(yù)測模型(如圖9), RasMol 軟件對三維預(yù)測模型分析發(fā)現(xiàn)該蛋白三級結(jié)構(gòu)的主要形式是無規(guī)則卷曲,這一結(jié)果與二級結(jié)構(gòu)預(yù)測結(jié)果一致,表明模擬構(gòu)建的WDR70 蛋白三維結(jié)構(gòu)合理。
圖9 WDR70 蛋白的三維結(jié)構(gòu) Fig.9 The 3D structure of WDR70 protein
人WDR70 蛋白包含有多個高度保守的WD 基序,其主要功能是形成多個蛋白復(fù)合物可逆裝配的平臺,預(yù)示著WDR70 可通過與其他蛋白分子相互作用行使功能。為了更好明確WDR70 蛋白互作網(wǎng)絡(luò),我們利用String 數(shù)據(jù)庫對人WDR70 蛋白進(jìn)行預(yù)測,發(fā)現(xiàn)在WDR70 相互作用網(wǎng)絡(luò)中包括轉(zhuǎn)運蛋白 ABCA3、EIF4ENIF1;細(xì)胞遷移相關(guān)蛋白C5orf42;核孔復(fù)合物蛋白NUP155;鈉離子依賴性高親和力氨基酸轉(zhuǎn)運蛋白SLC1A3、SLC2A13;泛素蛋白連接酶PFPF19;促進(jìn)皮層神經(jīng)元遷移蛋白NIPBL;與大腦和感覺器官發(fā)育相關(guān)蛋白OTX1 等(圖10)。
圖10 人 WDR70 蛋白相互作用網(wǎng)絡(luò) Fig.10 Human WDR70 protein interaction network
同源重組修復(fù)是一種無錯誤的DNA 分子重新組合的方式,對基因組穩(wěn)定性和完整性的維持具有重要意義。同源重組修復(fù)發(fā)生錯誤或異常能夠?qū)е聜€體發(fā)育異常和癌癥等多種疾病[9-11]。組蛋白H2B 的泛素化能夠使染色質(zhì)更為松散,有利于轉(zhuǎn)錄復(fù)合物進(jìn)入DNA 的啟動子和編碼區(qū)域,對同源重組修復(fù)起到重要作用[12-13]。WDR70 是WD 蛋白家族的一個重要成員,能夠通過促進(jìn)組蛋白H2B 的單泛素化作用,實現(xiàn)DNA 雙鏈斷裂的同源重組修復(fù)。此外,WDR70 基因還被發(fā)現(xiàn)對胚胎期小鼠腦部的發(fā)育有重要的影響[14]。目前,關(guān)于WDR70 的功能和機(jī)制研究較少,因而本研究利用生物信息學(xué)軟件分析WDR70 蛋白,為今后的研究工作提供新思路和新線索。
通過多種軟件對WDR70 蛋白的氨基酸序列的分析,我們發(fā)現(xiàn)該蛋白由654 個氨基酸殘基構(gòu)成,相對分子量約為73 kD,等電點為5.94,半衰期為30 h,無信號肽和跨膜區(qū)域,為酸性不穩(wěn)定蛋白質(zhì)。為了確立物種之間的親緣關(guān)系,我們比對了不同物種的WDR70 蛋白質(zhì)序列,發(fā)現(xiàn)該蛋白的氨基酸序列是在進(jìn)化過程中高度保守的,應(yīng)該歸類于直系同源蛋白質(zhì)(orthologous protein)[15]。這表明不同物種之間的WDR70 蛋白均擁有共同祖先的蛋白,并且具有共同或者相類似的生物學(xué)功能。對蛋白質(zhì)的二級結(jié)構(gòu)預(yù)測發(fā)現(xiàn)WDR70 蛋白主要的結(jié)構(gòu)形式是無規(guī)則卷曲。SWISS-MODEL 和RasMol 軟件對人WDR70 蛋白三維結(jié)構(gòu)的預(yù)測和分析,發(fā)現(xiàn)該蛋白三級結(jié)構(gòu)與二級結(jié)構(gòu)預(yù)測結(jié)果是一致的。
在蛋白質(zhì)相互作用網(wǎng)絡(luò)中,與WDR70 互作的蛋白有包括轉(zhuǎn)運蛋白ABCA3、EIF4ENIF1;細(xì)胞遷移相關(guān)蛋白C5orf42;核孔復(fù)合物蛋白NUP155;鈉離子依賴性高親和力氨基酸轉(zhuǎn)運蛋白SLC1A3、SLC2A13;泛素蛋白連接酶PFPF19;促進(jìn)皮層神經(jīng)元遷移蛋白NIPBL;與大腦和感覺器官發(fā)育相關(guān)蛋白OTX1 等。這些表明WDR70 蛋白功能為一種結(jié)合蛋白質(zhì),可能在蛋白的泛素化和轉(zhuǎn)運過程中發(fā)揮重要的生物學(xué)功能??傊?,本研究可為今后更進(jìn)一步揭示W(wǎng)DR70 蛋白的結(jié)構(gòu)與功能,為進(jìn)一步研究WDR70 蛋白功能和其他蛋白的相互關(guān)系提供信息數(shù)據(jù)支撐和新線索。