趙毛毛,龐灝
(中國醫(yī)科大學(xué)法醫(yī)學(xué)院法醫(yī)物證教研室,沈陽 110122)
巖藻糖基轉(zhuǎn)移酶(fucosyltransferase,FucT)是一類催化巖藻糖基向寡糖、糖蛋白、糖脂上的糖鏈轉(zhuǎn)移的生物合成酶,屬于糖基轉(zhuǎn)移酶超家族,在真核細(xì)胞和原核細(xì)胞均有表達(dá)[1-2]。巖藻糖基化聚糖參與信號轉(zhuǎn)導(dǎo)、宿主與微生物相互作用、受精、炎癥反應(yīng)、癌癥進(jìn)展以及轉(zhuǎn)移等生理學(xué)和病理學(xué)過程[3]。目前共發(fā)現(xiàn)13種FucT,分別由13個(gè)基因編碼[3]。根據(jù)酶反應(yīng)形成的糖苷鍵類型可將FucT分為α(1,2)巖藻糖基轉(zhuǎn)移酶(FucT-Ⅰ和 FucT-Ⅱ)、α(1,3/1,4)巖藻糖基轉(zhuǎn)移酶(FucT-Ⅲ和FucT-Ⅴ)、α(1,3)巖藻糖基轉(zhuǎn)移酶(FucT-Ⅲ~Ⅶ和FucT-Ⅸ)、α(1,6)巖藻糖基轉(zhuǎn)移酶(FucT-Ⅷ)、蛋白-O-巖藻糖基轉(zhuǎn)移酶(FucT-Ⅻ和FucT-)[4],其中FucT-Ⅱ和FucT-Ⅲ與人類血型密切相關(guān),具有重要的生物學(xué)意義。此外,編碼FucT-Ⅱ和FucT-Ⅲ的基因FUT2、FUT3不僅具有高度多態(tài)性,還有明顯的種族和地理區(qū)域差異性,因此FUT2和FUT3基因多態(tài)性成為遺傳學(xué)和法醫(yī)學(xué)領(lǐng)域關(guān)注的熱點(diǎn)。FUT2和FUT3基因變異與多種疾病顯著相關(guān),由其介導(dǎo)產(chǎn)生的血型抗原參與多種微生物感染,并且兩者聯(lián)合影響體內(nèi)腫瘤標(biāo)志物的水平。現(xiàn)就FUT2和FUT3基因多態(tài)性在基因水平、酶蛋白水平、酶相關(guān)產(chǎn)物水平的研究進(jìn)展進(jìn)行綜述。
1.1FucT-Ⅰ和FucT-Ⅱ參與的生物合成過程 人類H血型系統(tǒng)和Lewis血型系統(tǒng)的抗原并不是相應(yīng)基因的直接產(chǎn)物,而是來源于前體物質(zhì),這個(gè)前體物質(zhì)的實(shí)質(zhì)是一系列單糖有順序連接形成的寡糖鏈,而形成寡糖的單糖一共有7種:葡萄糖、半乳糖(galactose,Gal)、甘露糖、N-乙酰葡萄糖胺(acetylglucosamine,GlcNAc)、N-乙酰半乳糖胺、巖藻糖和N-乙酰神經(jīng)氨酸[5]。根據(jù)糖的種類和二糖之間糖苷鍵的連接方式可分為6種類型[6]。FucT會以碳-碳單鍵鍵合的方式將巖藻糖連接在前體物質(zhì)糖鏈末端的單糖上,從而形成對應(yīng)的特異抗原。α(1,2)巖藻糖基轉(zhuǎn)移酶主要對應(yīng)Ⅰ型(Galβ1-3GlcNAc-)和Ⅱ型(Galβ1-4GlcNAc-)前體物質(zhì)。
α(1,2)巖藻糖基轉(zhuǎn)移酶分為FucT-Ⅰ(H酶)和FucT-Ⅱ(Se酶),其通過在巖藻糖的1號碳原子與Gal的2號碳原子之間形成糖苷鍵,將巖藻糖基轉(zhuǎn)移到Ⅰ型和Ⅱ型糖鏈末端的Gal上,由于基因在組織中選擇性表達(dá),F(xiàn)UT1主要在紅細(xì)胞中表達(dá),并作用于Ⅱ型糖鏈形成紅細(xì)胞膜表面的H抗原,而FUT2主要在呼吸道黏膜、消化道黏膜以及分泌腺中表達(dá),作用于Ⅰ型糖鏈形成分泌液中的H抗原[7-10]。無論是紅細(xì)胞膜還是分泌液中的H抗原,其形成的前提條件是H酶和Se酶均有活性,當(dāng)H酶和Se酶均失活時(shí),則形成經(jīng)典的孟買型表型,紅細(xì)胞膜和分泌液中均無H抗原,個(gè)體的基因型是(h/h;se/se);只有H酶失活,紅細(xì)胞膜上不表達(dá)H抗原,而分泌液中的H抗原正常分泌,這樣的個(gè)體被稱為para-孟買型,個(gè)體的基因型是(h/h;Se/Se)或(h/h;Se/se);相反,當(dāng)只有Se酶失活,紅細(xì)胞膜上有H抗原,而分泌液中無H抗原,這樣的個(gè)體被稱為非分泌型,基因型是非分泌型基因的純合子(se/se)[11]。
1.2FucT-Ⅱ活性缺失的分子機(jī)制 非分泌型個(gè)體的FUT2的單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)、假基因融合、編碼區(qū)完全缺失3種類型的突變會導(dǎo)致FucT-Ⅱ失活。FUT2基因編碼區(qū)所有的SNP以及突變所造成的氨基酸替換對編碼蛋白影響的預(yù)測結(jié)果,見網(wǎng)絡(luò)版的附件1。FUT2基因結(jié)構(gòu)具有以下兩種特性:首先,F(xiàn)UT2及其假基因序列相似程度高,定位于19q13.3約30 kb范圍內(nèi)。研究人員發(fā)現(xiàn)了一個(gè)融合基因sefus,其是由FUT2假基因5′端與FUT2的3′端融合而成,目前sefus為日本人群所特有[12]。另外,F(xiàn)UT2的基因組區(qū)富含穿插的Alu及長末端重復(fù)等重復(fù)元件。目前,共發(fā)現(xiàn)3種缺失變異sedel、sedel2、sedel3,這3種缺失變異是由Alu介導(dǎo)的編碼區(qū)的完全缺失,而另一個(gè)sedel4則是由長末端重復(fù)介導(dǎo)[13-16]。上述4種缺失變異均具有明顯的人群特異性,是法醫(yī)學(xué)族源推斷良好的遺傳標(biāo)記。
1.3FUT2點(diǎn)突變的人類遺傳學(xué)分析 FUT2多態(tài)性分析表明,無論功能性還是非功能性等位基因都具有種族特異性。FUT2位點(diǎn)4個(gè)主要等位基因的人群頻率分布比較,見圖1[12,15,17-28],非功能性等位基因se428主要分布在非洲和歐洲人種中,而se357,385在東亞、東南亞人群中占主導(dǎo)地位;人群分布中具有明顯差異性的等位基因(se428、se357,385)在南亞的孟加拉國人和中國維吾爾族人中均占有一定比例,由此推測孟加拉國人和中國維吾爾族人混合了歐洲人和東亞人兩種血統(tǒng);與野生型等位基因Se相比,功能性等位基因Se357在人群中分布頻率更高,且分布范圍更廣;se357,385等位基因在歐洲和非洲人種中是缺失的,提示385位點(diǎn)的突變可能是在人類進(jìn)化過程中較晚出現(xiàn)在亞洲人群的。通過以上分析說明,F(xiàn)UT2基因多態(tài)性能為人類遺傳學(xué)研究提供更多有價(jià)值的信息。
1.4FUT2變異與人類疾病的關(guān)系 近年來有研究證明了FUT2 的多個(gè)SNP與克羅恩病[29-30]、潰瘍性結(jié)腸炎[31-32]、乳糜瀉[33]、1型糖尿病[34]、銀屑病[35-36]、白塞病[37]、肝細(xì)胞癌[38]及原發(fā)性硬化性膽管炎[39]關(guān)系密切,其中3個(gè)導(dǎo)致酶失活的SNP[428G>A(rs601338)、385A>T(rs1047781)、739G>A(rs602662)]與疾病的關(guān)聯(lián)性最強(qiáng)。一方面,非功能性等位基因純合突變個(gè)體(se428/se428)不僅對白色念珠菌[40]、鏈球菌[41]、腦膜炎奈瑟菌[40]的易感性增強(qiáng),且患克羅恩病[30]、慢性胰腺炎[42]、乳糜瀉[33]和1型糖尿病(日本人se385/se385)[43]的風(fēng)險(xiǎn)增加。另一方面,非分泌型個(gè)體也有多方面優(yōu)勢。一項(xiàng)關(guān)于中國西北部地區(qū)漢族和維吾爾族人群的研究顯示,非分泌型個(gè)體(se428/se428或se357,385/se357,385)不易患潰瘍性結(jié)腸炎[32],且具有抵抗諾如病毒感染的能力,但對GⅡ型諾如病毒具有完全的保護(hù)作用[44]。Kindberg等[45]報(bào)道,428位點(diǎn)非分泌型等位基因A與人類免疫缺陷病毒感染者的疾病發(fā)展進(jìn)程減慢相關(guān)。由此可見,非分泌型個(gè)體利弊兼具,在人群中廣泛存在并在人類進(jìn)化過程中保持一定的比例。因此未來對非分泌型個(gè)體與疾病的關(guān)聯(lián)研究將有助于針對性地預(yù)防和治療疾病。
圖1 FUT2位點(diǎn)se428(1a)、se357,385(1b)、Se357(1c)、Se(1d)等位基因的人群頻率分布比較
2.1FucT-Ⅲ所參與的生物合成過程 FucT-Ⅲ~Ⅶ、 FucT-Ⅸ均可以α(1,3)碳碳單鍵鍵合的方式將巖藻糖基轉(zhuǎn)移到前體物質(zhì)糖鏈末端N-乙酰葡萄糖胺的3號碳原子上,其中FucT-Ⅲ和FucT-Ⅴ既可以將巖藻糖基轉(zhuǎn)移到3號碳原子上,也可將其轉(zhuǎn)移到4號碳原子上,因此將其命名為α(1,3/1,4)巖藻糖基轉(zhuǎn)移酶[46]。當(dāng)FucT-Ⅲ發(fā)揮α(1,4)糖苷鍵鍵合作用時(shí),其作用底物是Ⅰ型前體物質(zhì)。FucT-Ⅱ也是以Ⅰ型前體物質(zhì)作為作用底物。當(dāng)FucT-Ⅲ催化GDP-巖藻糖中的L-巖藻糖轉(zhuǎn)移到Ⅰ型前體物質(zhì)時(shí)即形成路易斯a抗原(Lewis a,Lea),個(gè)體表型為Le(a+b-);而當(dāng)FucT-Ⅱ 先作用于 Ⅰ 型前體物質(zhì),在形成H抗原后,再由FucT-Ⅲ 作用于H抗原則形成路易斯b抗原(Lewis b,Leb),個(gè)體表現(xiàn)為Le(a-b+)。但當(dāng)同一個(gè)體的FucT-Ⅱ和FucT-Ⅲ均有活性時(shí),F(xiàn)ucT-Ⅱ的酶活性更大,會優(yōu)先將Ⅰ型前體物質(zhì)轉(zhuǎn)變?yōu)镠抗原,進(jìn)而形成Leb抗原,其將Ⅰ型前體物質(zhì)耗盡,導(dǎo)致無法形成Lea抗原,因而分泌型個(gè)體的表型是Le(a-b+),如果是弱分泌型個(gè)體,其FucT-Ⅱ活性很弱,此個(gè)體同時(shí)形成Lea和Leb抗原,表型為Le(a+b+)。當(dāng)FucT-Ⅲ無活性時(shí),無論FucT-Ⅱ是否有活性,其表型為Le(a-b-),由此可見FucT-Ⅲ才是決定Le表型的關(guān)鍵酶,F(xiàn)UT3基因也被稱為Lewis基因。
2.2FucT-Ⅲ活性缺失的分子機(jī)制 Le表型在不同人群中的分子學(xué)基礎(chǔ)一直是研究的重點(diǎn)。Koda等[47]調(diào)查了2個(gè)Le陽性和2個(gè)Le陰性個(gè)體胃黏膜的Lewis轉(zhuǎn)移酶發(fā)現(xiàn),決定兩種表型產(chǎn)生的Lewis轉(zhuǎn)移酶信使RNA的水平相同,證明Lewis轉(zhuǎn)移酶基因結(jié)構(gòu)上的缺陷導(dǎo)致了Le的陰性表型,而不是其表達(dá)水平。后續(xù)對Lewis基因進(jìn)行深入研究發(fā)現(xiàn),具有Le(a-b-)紅細(xì)胞表型的分子學(xué)基礎(chǔ)不是純一的[25]。根據(jù)目前數(shù)據(jù)庫和文獻(xiàn)記載,造成Lewis酶活性丟失的分子機(jī)制分別為SNP、插入、缺失。
Lewis基因編碼區(qū)所有的SNP以及氨基酸替換對酶活性影響的預(yù)測結(jié)果,見網(wǎng)絡(luò)版的附件2。Lewis酶呈Ⅱ型膜蛋白拓?fù)鋵W(xué)結(jié)構(gòu),由胞質(zhì)區(qū)(1~24 bp)、跨膜區(qū)(25~75 bp)、干區(qū)(76~276 bp)和C端酶催化區(qū)(277~1 086 bp)組成[48]。發(fā)生在以上區(qū)域的SNP會不同程度的影響酶活性,從表中可以發(fā)現(xiàn):與N端相比,造成酶活性丟失的變異點(diǎn)更多分布在C端。一項(xiàng)蛋白截?cái)嘌芯匡@示,去除N端一部分氨基酸序列(50~70個(gè)氨基酸)不會影響酶活性,而去除C端僅幾個(gè)氨基酸就會造成酶活性的完全喪失[49]。研究人員調(diào)查人群中Lewis陰性表型的分子學(xué)基礎(chǔ)過程中對一些SNP的功能意義進(jìn)行了探索,其中有兩種SNP(S124A、L149M)和預(yù)測結(jié)果(3種軟件:PROVEAN、PolyPhen2、SIFT)不一致[50],提示單核苷酸變異軟件預(yù)測結(jié)果僅能預(yù)測整體趨勢,而具體導(dǎo)致酶活性喪失的氨基酸序列或氨基酸替換還需依賴酶蛋白空間晶體結(jié)構(gòu)進(jìn)行判斷。目前按照Lewis酶蛋白膜定位定義的催化區(qū)(62~361)不夠精確,因?yàn)榘l(fā)生在此區(qū)域的變異可能不影響酶活性,而發(fā)生在N端胞質(zhì)區(qū)、跨膜區(qū)和干區(qū)的SNP會影響酶活性。如跨膜區(qū)的突變59T>G未損害酶的催化活性,但可影響酶在高爾基體膜上的定位,降低酶的利用率[47]。酶蛋白正常發(fā)揮功能需要以下幾個(gè)功能區(qū),包括供體底物的結(jié)合區(qū)、受體底物的特異性識別區(qū)、催化區(qū)以及酶蛋白自身的翻譯后修飾點(diǎn)等,發(fā)生在以上幾個(gè)功能區(qū)的SNP可影響酶活性。因此,獲得酶蛋白的空間結(jié)構(gòu)是未來研究的關(guān)鍵。
2.3FUT3基因點(diǎn)突變的人類遺傳學(xué)分析 Lewis基因具有明顯的種族差異性和地理區(qū)域特異性,le202,314、le59,508、Le59、le59,10674個(gè)等位基因人群頻率分布比較情況見圖2[24-25,27,50-55]。首先,le202,314等位基因在代表白色人種的高加索人中頻率最高;而在代表東方人種的中國人中頻率較低,韓國人和日本人甚至缺失le202,314;非洲科薩人、加納人頻率分布趨于兩者之間。值得注意的是,le202,314在巴基斯坦人群中的頻率分布與高加索人基本持平。綜合le59,1067的頻率分布特征,Zhao等[50]得出結(jié)論,巴基斯坦人群的Lewis基因頻率分布特征最接近于高加索人。le59,508等位基因最顯著的特點(diǎn)是高加索人頻率較低,幾乎缺失該等位基因,其主要分布在亞洲和非洲人種中。聯(lián)合le202,314、le59,508兩種等位基因頻率分布即可區(qū)分高加索人和非洲科薩人。Le59在亞馬孫人群中頻率分布顯著高于其他人群,提示該等位基因可能起源于亞馬孫地區(qū)。根據(jù)le59,1067等位基因的分布特征,可以看到同種人群的頻率分布差異較大,其分布特點(diǎn)有待進(jìn)一步加大樣本量以及擴(kuò)展人群后確定。綜上所述,Lewis等位基因頻率分布特征提示了很多種族進(jìn)化信息,是遺傳學(xué)研究的重要基因。
2.4FUT3基因變異與人類疾病的關(guān)系 同F(xiàn)UT2一樣,多項(xiàng)研究表明FUT3基因變異與結(jié)腸癌[28]、消化性潰瘍、萎縮性胃炎[56-57]、潰瘍性結(jié)腸炎[31]、克羅恩病[58]以及冠心病[59]等疾病有關(guān)。Hu等[31]的研究發(fā)現(xiàn),與正常對照組相比,F(xiàn)UT3基因508G>A位點(diǎn)的突變基因A和基因型AA在潰瘍性結(jié)腸炎患者中的頻率明顯升高。59T>G和508G>A兩個(gè)SNP還與潰瘍性結(jié)腸炎和克羅恩病的病變位置有關(guān)[58]。Djoussé等[60]報(bào)道,59T>G位點(diǎn)GG基因型受試者患動(dòng)脈粥樣硬化血栓性疾病的風(fēng)險(xiǎn)是TT基因型受試者的6.7倍。此研究結(jié)果佐證了Lewis(a-b-)表型患冠心病風(fēng)險(xiǎn)增加的結(jié)論[59]。以上研究表明,F(xiàn)UT2、FUT3基因變異可能與消化系統(tǒng)疾病的關(guān)聯(lián)性更強(qiáng),但與FUT2相比,F(xiàn)UT3與疾病的關(guān)聯(lián)研究尚未廣泛開展,需要進(jìn)一步研究與探討。
3.1組織血型抗原與體內(nèi)微生物群感染的相關(guān)性 FUT2和FUT3基因影響機(jī)體腸道菌群的組成,因?yàn)镕UT2和FUT3基因控制胃腸道黏膜和體液中組織血型抗原(包括H抗原和Le抗原)的表達(dá),上述抗原不僅是胃腸道菌群(幽門螺桿菌、空腸彎曲桿菌、諾如病毒、輪狀病毒)的結(jié)合點(diǎn),還是一些菌群的碳源[31,61]。幽門螺桿菌表達(dá)一種血型抗原結(jié)合黏附素,該物質(zhì)與健康人胃黏膜上皮細(xì)胞表面的I-H抗原和Leb抗原結(jié)合,從而介導(dǎo)幽門螺桿菌感染人體的過程[56]。輪狀病毒和諾如病毒是世界范圍內(nèi)造成兒童急性胃腸炎的最主要病因,這兩種病毒屬均與個(gè)體的分泌狀態(tài)和Lewis表型相關(guān)。據(jù)報(bào)道,I-H抗原和Leb抗原是P8輪狀病毒株的受體[62]。在布基納法索,P8輪狀病毒株和GⅠ型諾如病毒僅感染Le和Se抗原雙陽性兒童,不感染Le抗原陰性兒童,P6輪狀病毒株主要感染Le抗原陽性兒童,與個(gè)體分泌狀態(tài)無關(guān),而GⅡ型諾如病毒易感染分泌型個(gè)體,卻不依賴于Lewis分泌狀態(tài)[63-64]。因此,F(xiàn)UT2和FUT3基因聯(lián)合分型有助于識別對微生物感染相關(guān)疾病具有高風(fēng)險(xiǎn)的個(gè)體,從而設(shè)計(jì)出具有針對性的根治感染的治療策略。
圖2 FUT3位點(diǎn)le202,314(2a)、le59,508(2b)、le59,1067(2c)、Le59(2d)等位基因的人群頻率分布比較
3.2FUT2和FUT3基因型聯(lián)合影響體內(nèi)腫瘤標(biāo)志物的水平 FUT2和FUT3基因協(xié)同調(diào)控血清中糖類抗原(carbohydrate antigen,CA)19-9和癌胚抗原(carcinoembryonic antigen,CEA)兩種腫瘤標(biāo)志物的水平[25,65-67]。研究發(fā)現(xiàn),Lewis功能性等位基因純合子(Le/Le)體內(nèi)CA19-9的水平明顯高于雜合子個(gè)體(Le/le);Le抗原陰性個(gè)體中未檢測到CA19-9;Le抗原陽性的非分泌型個(gè)體(Le/se)血清CA19-9水平最高[25]。而另一項(xiàng)研究顯示,Le抗原陽性的FUT2基因428位點(diǎn)突變純合子個(gè)體(se428/se428)血清CEA水平最高,野生型純合子個(gè)體(Se/Se)最低,雜合子個(gè)體(Se/se428)介于兩者之間,說明CEA水平與非分泌型等位基因se428的劑量密切相關(guān),Le抗原陰性個(gè)體血清CEA的上述變化趨勢更加明顯[65]。以上研究說明,F(xiàn)UT2和FUT3基因變異聯(lián)合影響體內(nèi)腫瘤標(biāo)志物的水平,而近年的一項(xiàng)研究進(jìn)一步佐證了這一結(jié)論,該研究根據(jù)FUT2和FUT3基因分型設(shè)定CA19-9界值,結(jié)果發(fā)現(xiàn)CA19-9檢測提高了診斷胰管腺癌的靈敏度,特別是在Le抗原陽性組中,診斷靈敏度從52.7%提高到66.4%[66]。因此在未來針對不同人群,選擇FUT2和FUT3基因上特異性SNP,在聯(lián)合分型的基礎(chǔ)之上選擇不同的腫瘤志物以及定義腫瘤標(biāo)志物的界值可能會大大提高腫瘤標(biāo)志物的診斷效能。
近年來,隨著DNA測序技術(shù)的發(fā)展,研究人員在FUT2和FUT3基因編碼區(qū)識別出大量新的SNP,并發(fā)現(xiàn)FUT2和FUT3基因多態(tài)性研究不僅在遺傳學(xué)領(lǐng)域和法醫(yī)學(xué)領(lǐng)域具有重要意義,在臨床疾病的研究和實(shí)踐中同樣具有重要價(jià)值,尤其是FUT2和FUT3基因聯(lián)合分型對疾病的診斷和治療均至關(guān)重要。非分泌型及Le抗原陰性表型在經(jīng)歷長期的自然選擇后,能夠在多種人群中穩(wěn)定保持一定的比例,相信必然有其存在的意義,但需要進(jìn)一步研究和探索。未來將對FUT2和FUT3基因多態(tài)性與消化系統(tǒng)疾病的關(guān)聯(lián)機(jī)制進(jìn)行深入研究,以期為消化系統(tǒng)疾病的治療提供指導(dǎo)。
(文中附件1和附件2圖形內(nèi)容復(fù)雜,詳見中國知網(wǎng)網(wǎng)絡(luò)版)