王子豪, 錢榮凱, 蘇林杰, 賈 寧, 孫欽儒
(1.西安交通大學(xué)醫(yī)學(xué)部, 西安 710061; 2.西安交通大學(xué)醫(yī)學(xué)部基礎(chǔ)醫(yī)學(xué)院, 西安 710061; 3.西安交通大學(xué)醫(yī)學(xué)部法醫(yī)學(xué)院, 西安 710061)
哺乳動物擁有復(fù)雜的基因表達(dá)調(diào)控機制,其中翻譯后修飾是重要的調(diào)控方式,可以快速改變蛋白質(zhì)的生物學(xué)性質(zhì)。蛋白質(zhì)糖基化通過產(chǎn)生具有不同特性的多種糖蛋白極大地放大了蛋白質(zhì)組的功能,在哺乳動物細(xì)胞的識別[1-2]、增殖[3]以及代謝活動[4]中均具有重要的作用。
大多數(shù)蛋白質(zhì)通過14種不同糖基化途徑中的一種或多種進行修飾,包括N-糖基化、11種O-糖基化、C-甘露糖基化和GPI錨定蛋白,這些途徑在人類中涉及至少173種糖基轉(zhuǎn)移酶以及許多其他修飾聚糖的酶[5]。對于N-糖基化,糖鏈通過共價作用結(jié)合在目標(biāo)蛋白的天冬酰胺殘基[6]。其中,核心巖藻糖糖基化是較常見的一種方式,由GDP-巖藻糖(GDP-fucose)作為供體,在α-1,6-巖藻糖基轉(zhuǎn)移酶(α-1,6-fucosyltransferase, FUT8)的催化下,將巖藻糖殘基共價連接至位于目標(biāo)蛋白糖鏈核心最內(nèi)側(cè)的N-乙酰氨基葡萄糖(GlcNAc),從而形成α-1,6-糖苷鍵,完成核心巖藻糖糖基化[7-8]。
多項研究表明,F(xiàn)UT8介導(dǎo)的核心巖藻糖糖基化與上皮組織再生、神經(jīng)炎癥、乳腺癌及肺癌等多種疾病相關(guān)[9],細(xì)胞內(nèi)的多種代謝及信息傳遞途徑受其調(diào)節(jié)。然而,F(xiàn)UT8的作用機制還不甚清楚,Wang等[10]認(rèn)為FUT8可以調(diào)節(jié)表皮生長因子受體與其配體的親和力。另有實驗表明,抑制FUT8可導(dǎo)致細(xì)胞對促炎細(xì)胞因子(如IFN-γ和IL-6)的敏感性增加[11-12]。這些研究雖然探索了FUT8的部分作用,但是對于全面揭示FUT8的生物學(xué)特性還遠(yuǎn)遠(yuǎn)不夠,近年來的生物信息學(xué)的蓬勃發(fā)展為蛋白質(zhì)結(jié)構(gòu)和功能的研究打開新的大門。因此,現(xiàn)利用生物信息學(xué)分析fut8基因的結(jié)構(gòu)及表達(dá)特點;分析FUT8的結(jié)構(gòu)和功能特征、蛋白質(zhì)作用網(wǎng)絡(luò)關(guān)系及其參與的蛋白質(zhì)通路,為進一步研究該蛋白在肥胖及相關(guān)疾病、腫瘤轉(zhuǎn)移、炎癥及免疫和造血異常中的作用以及相應(yīng)藥物的研發(fā)提供分子依據(jù)。
所用fut8基因及其轉(zhuǎn)錄產(chǎn)物序列來自NCBI網(wǎng)站的GenBank數(shù)據(jù)庫。產(chǎn)物蛋白FUT8的一級序列信息源自NCBI網(wǎng)站的GenPept數(shù)據(jù)庫,空間結(jié)構(gòu)數(shù)據(jù)來自PDB數(shù)據(jù)庫。
通過ExPASy網(wǎng)站旗下ProtParam分析工具預(yù)測FUT8蛋白的理化性質(zhì);使用TMHMMServer和SignalP-5.0在線數(shù)據(jù)庫預(yù)測FUT8蛋白的跨膜區(qū)段和信號肽信息;使用Prabi數(shù)據(jù)庫下的SOPMA和GOR4兩種分析引擎推斷FUT8蛋白的二級結(jié)構(gòu)元件;通過在線數(shù)據(jù)庫網(wǎng)站STRING研究蛋白質(zhì)FUT8的分子相互作用關(guān)系(PPI分析),KEGG Pathway數(shù)據(jù)庫分析蛋白質(zhì)通路(KEGG分析);利用BLAST在線工具進行蛋白序列比對并獲取保守位點,DNAMAN軟件繪制分子進化樹圖。
人類fut8基因定位于14號染色體長臂2區(qū)3帶3亞帶(14q23.3),外顯子合計共16個,其中編碼序列含外顯子9個,其拼接關(guān)系如圖1所示。
圖1 FUT8編碼序列外顯子拼接關(guān)系 Fig.1 FUT8 coding sequence exon splicing relationship
人類fut8基因轉(zhuǎn)錄產(chǎn)物共有7種,分別稱為變體1~6,其中變體6又根據(jù)長度不同分為兩種,除變體5為非編碼序列外,其余均編碼不同的同工酶。FUT8同工酶分a、b、c三種,各剪接變異體及其編碼產(chǎn)物如表1。變體1又稱為變體B6,全長3 895 bp,編碼較長的同工酶即同工型a,含氨基酸數(shù)575個,后文分析所用均為變體1及其翻譯產(chǎn)物同工酶a。
表1 各剪接變異體及其編碼產(chǎn)物關(guān)系Table 1 Relationship between splice variants and coding products
FUT8蛋白分子式為C2986H4636N838O856S17,原子總數(shù)9 333個,分子量為66 515.78 D,理論等電點7.36。其中酸性氨基酸殘基77個,堿性氨基酸殘基77個,為弱堿性蛋白質(zhì)分子。亮氨酸為含量最豐富的氨基酸,占到整個氨基酸組成的9.7%。
FUT8在哺乳動物的網(wǎng)織紅細(xì)胞中半衰期為30 h,不穩(wěn)定系數(shù)為42.22,因此認(rèn)為是不穩(wěn)定蛋白質(zhì)。根據(jù)推斷,理論脂肪系數(shù)為84.56,平均親水性(GRAVY)達(dá)-0.551,故將FUT8認(rèn)為是親水性蛋白質(zhì)。
通過TMHMMServer在線分析預(yù)測,如圖2所示,F(xiàn)UT8蛋白序列存在理論跨膜區(qū)段6個。綜合考慮可信度最高的模型為單次跨膜結(jié)構(gòu),即由17個疏水氨基酸構(gòu)成的由內(nèi)向外的跨膜區(qū)段,范圍從第10~26位氨基酸,總得分2 561分。使用SignalP-5.0在線工具分析,F(xiàn)UT8不存在信號肽序列。
i→o為跨膜由內(nèi)向外;o→i為跨膜由外向內(nèi)圖2 FUT8蛋白跨膜區(qū)段分析結(jié)果Fig.2 Analysis of transmembrane segment of FUT8 protein
使用Prabi網(wǎng)站旗下SOPMA工具得出結(jié)果如圖3所示,該多肽鏈中α螺旋結(jié)構(gòu)占48.00%,為最主要的結(jié)構(gòu)元件,β片層占12.52%,β轉(zhuǎn)角占4.35%,無規(guī)則卷曲占35.13%。而GOR4工具沒有將β轉(zhuǎn)角納入考慮,認(rèn)為在FUT8蛋白序列中α螺旋和β片層結(jié)構(gòu)分別占32.17%和22.09%,無規(guī)則卷曲則占到了45.74%。
圖3 FUT8蛋白分子二級結(jié)構(gòu)分析Fig.3 Secondary structure analysis of protein FUT8
FUT8的三級結(jié)構(gòu)如圖4所示,共有4個結(jié)構(gòu)域,分別為氨基端胞漿域、跨膜區(qū)、莖區(qū)以及羧基端催化域。
圖4 蛋白質(zhì)分子FUT8的三級結(jié)構(gòu)Fig.4 Tertiary structure of protein molecule of FUT8 protein
FUT8與B4GALT3、B4GALT1、MGAT3、MGAT4D、MGAT2等有著密切的互相聯(lián)系,如圖5所示。
圖5 FUT8蛋白分子相互作用關(guān)系Fig.5 Protein-protein interaction (PPI) of FUT8 protein
B4GALT3又稱β-1,4-半乳糖基轉(zhuǎn)移酶3,負(fù)責(zé)在多種糖蛋白以及糖脂的糖鏈部分中添加較為復(fù)雜的N-連接寡糖鏈。
B4GALT1又稱β-1,4-半乳糖基轉(zhuǎn)移酶1,在哺乳期乳腺腺泡細(xì)胞高爾基復(fù)合體中催化乳糖的產(chǎn)生,同時參與其他N-連接寡糖鏈的形成。
MGAT3又稱β-1,6-N-乙酰氨基葡萄糖基轉(zhuǎn)移酶3(GnT-Ⅲ),參與糖鏈的生物合成和調(diào)節(jié),催化N-乙酰氨基葡萄糖添加到N-連接糖鏈的三甘露糖核心上形成β-1-4糖苷鍵。是糖蛋白生物合成調(diào)控過程中的最重要的酶之一。
MGAT4D又稱α-1,3-甘露糖基糖蛋白4-β-N-乙酰氨基葡萄糖轉(zhuǎn)移酶,屬于糖基轉(zhuǎn)移酶54家族。定位于高爾基體中,在精母細(xì)胞和精子中高表達(dá)。
MGAT2又稱α-1,6-甘露糖基糖蛋白2-β-N-乙酰氨基葡萄糖轉(zhuǎn)移酶或N-乙酰葡糖氨基轉(zhuǎn)移酶Ⅱ,參與催化低聚甘露糖轉(zhuǎn)化為復(fù)雜N-聚糖的關(guān)鍵步驟。
聚糖不是主要的基因產(chǎn)物,與蛋白質(zhì)相比,它們的合成是在沒有模板的情況下進行的。圖6展示了核心巖藻糖生物合成的三個步驟,首先進行的是N-連接糖蛋白前體的合成,隨后前體末端的幾個糖基將被逐漸水解,并裝配出糖鏈的核心結(jié)構(gòu),之后多種糖基轉(zhuǎn)移酶相繼將寡糖基轉(zhuǎn)移至核心結(jié)構(gòu)上從而使糖基得以延長。FUT8則將巖藻糖殘基轉(zhuǎn)移至糖鏈核心最內(nèi)側(cè)的N-乙酰氨基葡萄糖(GlcNAc)上,最終形成α-1,6-糖苷鍵。
圖6 核心巖藻糖基化形成過程 Fig.6 Core fucosylation formation process
通過對蛋白序列的比對分析,發(fā)現(xiàn)其在不同物種間高度保守,圖7和圖8分別展示了FUT8的保守結(jié)構(gòu)域和分子進化樹。人與黑猩猩FUT8蛋白序列幾乎完全相同,與大鼠、小鼠相似度高達(dá)96.7%和96.5%,與雞、熱帶爪蟾及東方果蠅FUT8蛋白序列相似度分別為93.9%、90.1%和46.1%。
圖7 FUT8蛋白序列保守位點Fig.7 Protein sequence conserved site of FUT8
圖8 FUT8蛋白分子進化樹Fig.8 The phylogenetic tree of FUT8
FUT8是哺乳動物體內(nèi)唯一的N-連接的核心巖藻糖基轉(zhuǎn)移酶[13],本研究利用生物信息學(xué)分析方法,得知人fut8基因位于14號染色體長臂2區(qū)3帶3亞帶,編碼序列共有外顯子9個,轉(zhuǎn)錄產(chǎn)物共有剪接變異體5種,其中最主要的變體長度為3 895 bp,其翻譯產(chǎn)物含氨基酸575個,為弱堿性、親水性的蛋白質(zhì),細(xì)胞內(nèi)不穩(wěn)定,存在由內(nèi)向外的跨膜區(qū)段,α螺旋是最主要的二級結(jié)構(gòu)元件。序列比對發(fā)現(xiàn),從非哺乳動物到人的不同物種中FUT8蛋白高度保守,且其在不同哺乳動物間的差別較其他巖藻糖轉(zhuǎn)移酶小[14],因此推測FUT8較其他巖藻糖轉(zhuǎn)移酶分化晚。
FUT8與多種蛋白質(zhì)及受體相互作用,廣泛參與調(diào)節(jié)細(xì)胞內(nèi)的多種代謝及信息傳遞途徑。蛋白分子的相互作用分析結(jié)果顯示,F(xiàn)UT8與B4GALT1、B4GALT3,以及MGAT2、MGAT3、MGAT4D的作用密切相關(guān)。B4GALTs是一類進化保守的半乳糖基轉(zhuǎn)移酶,作為穿膜蛋白定位于高爾基/反面高爾基網(wǎng)狀結(jié)構(gòu),參與蛋白折疊、細(xì)胞相互作用和免疫抵抗等生物過程[15-16]。最近的研究發(fā)現(xiàn),F(xiàn)UT8與B4GALT1都可以通過糖基化免疫球蛋白G(IgG)而調(diào)節(jié)其作用[17],具體機制還有待于進一步的實驗驗證;體外實驗證下調(diào)FUT8的表達(dá),同樣可通過改變IgG的糖基化進而對炎癥疾病產(chǎn)生影響[18]。MGAT2是三酰甘油在體內(nèi)吸收和積累途徑中的關(guān)鍵酶,此過程在肥胖及其相關(guān)疾病的發(fā)生中起重要作用[19];FUT8與MGAT2均參與尿素轉(zhuǎn)運蛋白A-1(UT-A1)的糖基化,從而調(diào)節(jié)腎的尿素轉(zhuǎn)運活性,與糖尿病人滲透性利尿癥狀的減輕有關(guān)[20]。MGAT3可以抑制上皮-間充質(zhì)轉(zhuǎn)化,從而抑制腫瘤的轉(zhuǎn)移[21];FUT8和MGAT3的高表達(dá)均可易化急性髓性白血病細(xì)胞(KG1a細(xì)胞)對缺氧的敏感性而啟動p53依賴性細(xì)胞凋亡[22]。全基因組關(guān)聯(lián)分析也發(fā)現(xiàn)fut8和MGAT4D的編碼基因mgat4d均與高血壓的發(fā)生相關(guān)[23-24],提示這兩者之間可能存在密切聯(lián)系。這些結(jié)果表明,F(xiàn)UT8與B4GALTs、MGATs可能具有協(xié)同作用,具體機制還需要進一步的研究證明。
利用生物信息數(shù)據(jù)庫及工具成功獲取人FUT8蛋白的理化性質(zhì)、理論跨膜域信息、立體結(jié)構(gòu),以及其與多種蛋白通路及其的相互作用網(wǎng)絡(luò),為深入未來進一步研究FUT8在肥胖及相關(guān)疾病、腫瘤轉(zhuǎn)移、炎癥及免疫和造血異常中的作用提供重要的理論依據(jù)。