王貞超 孟嬌
表皮生長(zhǎng)因子受體(Epidermal Growth Receptor, EGFR)是一種重要的跨膜受體。本文擬采用生物信息學(xué)分析方法,對(duì)其胞內(nèi)區(qū)的酪氨酸激酶氨基酸序列性質(zhì)進(jìn)行分析,為探究EGFR與腫瘤之間的關(guān)系提供參考。
EGFR是原癌基因HER-1的表達(dá)產(chǎn)物,其基因位于第7號(hào)染色體上,全長(zhǎng)200 kb,由28個(gè)外顯子組成,具有酪氨酸激酶(Tyrosine Kinase, TK)活性。EGFR分為3個(gè)區(qū)域:胞內(nèi)區(qū)、跨膜區(qū)和胞外區(qū),其中胞內(nèi)區(qū)包括近膜區(qū)、TK區(qū)和C末端。EGFR-TK對(duì)腫瘤細(xì)胞的形成與生長(zhǎng)起著重要的作用,酪氨酸殘基的磷酸化激活各種信號(hào)分子和信號(hào)通路。本研究將對(duì)EGFR-TK區(qū)展開研究,利用生物信息學(xué)方法研究其理化性質(zhì),為探究EGFR基因及其編碼蛋白與腫瘤之間的關(guān)系提供理論基礎(chǔ)。
一、方法
在NCBI數(shù)據(jù)庫(kù)下載EGFR-TK區(qū)序列信息;采用Gendoc軟件進(jìn)行多重序列比對(duì)分析;采用Prot Param tool在線分析軟件,探究氨基酸的理化性質(zhì);應(yīng)用WoLF PSORT預(yù)測(cè)亞細(xì)胞定位;應(yīng)用ProtScale分析氨基酸序列親疏水性;采用SignalP4.1在線服務(wù)器分析EGFR的信號(hào)肽;采用TMHMM Server和SMART5.0分析軟件,對(duì)EGFR跨膜結(jié)構(gòu)進(jìn)行分析。
二、結(jié)果與結(jié)論
(一)多重序列比對(duì)分析
經(jīng)過分析發(fā)現(xiàn)這些序列的保守性較強(qiáng),BAH11869.1在32 aa處N突變成S,突變率8.3%;BAF83041.1有2處發(fā)生了突變,分別是223 aa處Y突變成H,247 aa處Y突變C,突變率都為8.3%;AAZ66620.1在436 aa處S突變?yōu)镻,突變率8.3%。
(二)理化性質(zhì)分析
經(jīng)過分析發(fā)現(xiàn),12個(gè)氨基酸序列理化性質(zhì)相似。分子量為61.09 kDa~61.17 kDa,理論等電點(diǎn)為5.85~5.89。脂肪系數(shù)為83.28,總平均親水性為-0.434~-0.428。不穩(wěn)定指數(shù)為55.45~56.30。說明這些氨基酸是不穩(wěn)定弱疏水氨基酸。9個(gè)序列和AAZ66620.1亞細(xì)胞定位推測(cè)其位于cyto_nucl,BAH11869.1、BAF83041.1推測(cè)其位于nucl。
(三)序列表征
經(jīng)過分析發(fā)現(xiàn),12個(gè)氨基酸序列具有相同的性質(zhì):ProtScale程序分析蛋白有一個(gè)較強(qiáng)的親水區(qū)域,位于445~455 aa,同時(shí)有一個(gè)較強(qiáng)的疏水區(qū)域,位于105~110 aa(圖3-A);SignalP 4.1研究發(fā)現(xiàn)蛋白無(wú)信號(hào)肽(圖3-B);TMHMM Server對(duì)其跨膜結(jié)構(gòu)進(jìn)行分析發(fā)現(xiàn),有跨膜結(jié)構(gòu)域,分別位于50~70 aa和110~140 aa (圖3-C);SMART 5.0對(duì)其結(jié)構(gòu)域分析表明,其有三個(gè)低度復(fù)雜區(qū),在7~24 aa,334~347 aa,357~378 aa處,酪氨酸激酶活性區(qū)域在44~300 aa。(圖3-D)。
3-A親水性和疏水性;3-B信號(hào)肽;3-C跨膜結(jié)構(gòu);3-D結(jié)構(gòu)域
三、展望
EGFR在腫瘤細(xì)胞中過表達(dá)導(dǎo)致腫瘤產(chǎn)生,成為國(guó)內(nèi)外研究焦點(diǎn)。本文利用生物信息學(xué)方法對(duì)EGFR-TK區(qū)的性質(zhì)進(jìn)行分析,從而為選擇特定部位作為靶點(diǎn),研發(fā)更安全、更高效的EGFR-TKI提供新的研究思路。(作者單位:貴州大學(xué) 藥學(xué)院)