張小雪 趙利明 劉佳 楊曉斌 李沖
摘要:以綿羊鉀電壓門控通道H亞家族成員1(potassium voltage-gated channel subfamily H member 1,KCNH1)基因?yàn)檠芯繉?duì)象,利用生物信息學(xué)數(shù)據(jù)庫(kù)及其相關(guān)軟件,對(duì)其進(jìn)行生物信息學(xué)分析,以初步了解其結(jié)構(gòu)和生物學(xué)功能。結(jié)果表明,綿羊KCNH1基因所含最大長(zhǎng)度序列為2 961 bp,且編碼986個(gè)氨基酸殘基。KCNH1基因編碼的蛋白質(zhì)分子式為C4972H7816N1342O1447S40,其蛋白分子質(zhì)量為110 827.28 KDa,理論等電點(diǎn)(pI)為7.52。亞細(xì)胞定位結(jié)果表明其編碼產(chǎn)物主要可能定位于質(zhì)膜(43.5%),其次為內(nèi)質(zhì)網(wǎng) (34.8%),屬于非分泌蛋白。KCNH1蛋白質(zhì)中不存在信號(hào)肽序列,但存在5段跨膜結(jié)構(gòu)區(qū)域,該蛋白的二級(jí)結(jié)構(gòu)以α螺旋為主,三級(jí)結(jié)構(gòu)主要由α螺旋盤曲纏繞的方式形成。
關(guān)鍵詞:綿羊;KCNH1基因;生物信息學(xué)分析
中圖分類號(hào):S826? ? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ? ? ? 文章編號(hào):1001-1463(2022)03-0039-07
doi:10.3969/j.issn.1001-1463.2022.03.009
Bioinformatics Analysis of Sheep KCNH1 Gene
ZHANG Xiaoxue, ZHAO Liming, LIU Jia, YANG Xiaobin, LI Chong
(College of Animal Science and Technology, Gansu Agricultural University, Lanzhou Gansu 730070, China)
Abstract:In this study, the potassium voltage-gated channel subfamily H member 1(KCNH1) gene of sheep was taken as the research object, and bioinformatics analysis was conducted using bioinformatics software to analyze sheep KCNH1 gene for understand its structure and predict its function. The results suggested that the maximum length sequence of sheep KCNH1 gene was 2 961 bp and encoded 986 amino acid residues. The molecular formula of the protein encoded by KCNH1 gene was C4972H7816N1342O1447S40, the molecular weight of the protein was 110 827.28 kDa, and the th-eoretical isoelectric point(pI) was 7.52. The results of subcellular localization showed that the coding products were mainly located in the plasma membrane(43.5%), followed by the endoplasmic reticulum(34.8%), which were non-secreted proteins. There is no signal peptide sequence in KCNH1 protein, but there are five transmembrane structure regions. The secondary structure of KCNH1 protein is dominated by α-helix, and the tertiary structure is mainly formed by the winding of α-helix.
Key words:Sheep;KCNH1 gene;Bioinformatics analysis
電壓門控鉀通道(Kv10.1鉀通道),又稱為ethera-go-go相關(guān)基因1,由KCNH1(鉀電壓門控通道),H亞家族成員1編碼[1 ],其主要分布于中樞神經(jīng)系統(tǒng)和癌細(xì)胞中。KCNH1通道包含1個(gè)N端PAS結(jié)構(gòu)域、1個(gè)c端環(huán)核苷酸結(jié)合同源結(jié)構(gòu)域(cNBHD),以及鈣調(diào)素的N端和c端結(jié)合位點(diǎn)[2 ],且KCNH1通道受到包括活性氧在內(nèi)的多種內(nèi)源信號(hào)的調(diào)節(jié)[3 ]。目前有關(guān)于KCNH1基因的研究大多見于人類,如基因KCNH1突變與綜合征性神經(jīng)發(fā)育障礙相關(guān),且支持S4結(jié)構(gòu)域的功能重要性[1 ];KCNH1突變導(dǎo)致ZLS(指一種發(fā)育障礙,其特征是面部畸形,且伴有牙齦增大、智力殘疾、指甲和終末趾骨發(fā)育不全或發(fā)育不全以及多毛癥)[4 ];H亞家族(eagrelated),成員1 (KCNH1)鉀通道是潛在的腫瘤標(biāo)志物和癌癥治療靶點(diǎn),被雌激素和人乳頭狀瘤病毒(HPV)致癌基因上調(diào)[5 ];人類冠狀動(dòng)脈擴(kuò)張被認(rèn)為與鉀電壓門控通道亞家族成員1 KCNH1(編碼醚à go-go,EAG1或KV10.1蛋白)的基因變異有關(guān)[6 ];發(fā)育性和癲癇性腦病合并智力殘疾(DEE)和遺傳性廣泛性癲癇(GGE)都存在著新的KCNH1突變[7 ];KCNH1通道對(duì)腫瘤發(fā)展和治療有重大意義[8 ]等,而有關(guān)綿羊KCNH1基因的結(jié)構(gòu)和功能研究較少,其生物學(xué)作用尚不清楚。
我們基于綿羊生物基因組數(shù)據(jù)庫(kù)檢索到的KCNH1基因序列,利用生物信息學(xué)方法,對(duì)綿羊KCNH1基因及其編碼產(chǎn)物的理化性質(zhì)、序列特征、蛋白質(zhì)結(jié)構(gòu)以及生物學(xué)功能進(jìn)行了預(yù)測(cè)和分析,以期為進(jìn)一步探索KCNH1基因及其編碼蛋白基本結(jié)構(gòu)和生物學(xué)功能提供線索。
1? ?材料與方法
1.1? ?序列來(lái)源
研究所用10個(gè)物種(綿羊、狗、水牛、鹿、貓、羊駝、兔、灰鼠、豬、人)的mRNA序列均來(lái)源于NCBI網(wǎng)站的GenBank數(shù)據(jù)庫(kù)。其物種名稱及GenBank登錄號(hào)見表1。
1.2? ?方法
KCNH1基因的開放閱讀框(Open reading frame,ORF)利用ORF Finder程序分析,采用Bioedit及ExPASy分析軟件預(yù)測(cè)其基因編碼產(chǎn)物的理化性質(zhì)。亞細(xì)胞定位利用PSORT Ⅱ 預(yù)測(cè)[9 ]。采用Signalp 3.0軟件預(yù)測(cè)蛋白潛在信號(hào)肽剪切位點(diǎn)。跨膜螺旋區(qū)域及蛋白保守結(jié)構(gòu)域分析采用TMHMM程序和Smart軟件完成。蛋白親疏水性及其二級(jí)結(jié)構(gòu)利用Prot Scale和Jpred分析預(yù)測(cè)。蛋白三級(jí)結(jié)構(gòu)多序列比對(duì)及同源性分析利用Swiss-model和DNAMAN軟件分析[10 - 12 ]。
2? ?結(jié)果與分析
2.1? ?綿羊KCNH1基因開放閱讀框分析
由 NCBI的開放閱讀框查找器程序分析(圖1)可知,綿羊KCNH1基因序列的ORF序列長(zhǎng)度為2 961 bp,起始密碼子為ATG,共編碼986個(gè)氨基酸。
2.2? ?綿羊KCNH1編碼產(chǎn)物的理化性質(zhì)分析
蛋白質(zhì)的基本性質(zhì)包括相對(duì)分子質(zhì)量、氨基酸組成、等電點(diǎn)(pI)、半衰期、不穩(wěn)定系數(shù)和總平均親水性等[13 ]。通過(guò)Bioedit及ExPASy軟件分析可知,綿羊的KCNH1基因共編碼986個(gè)氨基酸,分子式為C4972H7816N1342O1447S40,分子質(zhì)量為110 827.28 KDa,理論等電點(diǎn)pI為7.52。氨基酸組成如圖2所示,其中Leu(亮氨酸)含量最多,所占比例為9.1%;Trp(色氨酸)含量最少,所占比例1.5%。負(fù)電荷殘基總數(shù)(Asp+Glu)為117,正電荷殘基總數(shù)(Arg+Lys)為118?;蚓幋a產(chǎn)物半衰期為30 h,不穩(wěn)定指數(shù)為45.07,確定綿羊KCNH1基因編碼產(chǎn)物屬于不穩(wěn)定蛋白。
2.3? ?綿羊KCNH1編碼產(chǎn)物的同源性比對(duì)及系統(tǒng)發(fā)育分析
采用DNAMAN對(duì)綿羊、狗、水牛、鹿、貓、羊駝、兔、灰鼠、豬和人的KCNH1蛋白的多序列比對(duì)(圖3)表明,KCNH1基因在這10個(gè)物種中都有表達(dá),且綿羊與水牛的KCNH1氨基酸序列同源性較為相似,說(shuō)明它們?cè)谶M(jìn)化過(guò)程親緣關(guān)系較近。從KCNH1基因編碼產(chǎn)物序列的同源樹得出,在分析中選取的10個(gè)物種中,綿羊和水牛的同源性最高,可達(dá)99%(圖4)。
2.4? ?綿羊KCNH1蛋白亞細(xì)胞定位
利用PSORTⅡ軟件對(duì)綿羊KCNH1基因編碼蛋白進(jìn)行亞細(xì)胞定位的結(jié)果(表2)表明,綿羊KCNH1蛋白有43.5%的可能分布于質(zhì)膜,有34.8%的可能分布于內(nèi)質(zhì)網(wǎng), 有13.0%的可能分布于線粒體, 有4.3%的可能分布于囊泡分泌系統(tǒng), 且有4.3%的可能分布于細(xì)胞核。由此預(yù)測(cè),綿羊KCNH1基因最有可能定位于質(zhì)膜中發(fā)揮生物學(xué)作用,其次在內(nèi)質(zhì)網(wǎng)中發(fā)揮生物學(xué)作用。
2.5? ?綿羊KCNH1蛋白潛在信號(hào)肽剪切位點(diǎn)預(yù)測(cè)
信號(hào)肽序列是指存在于分泌蛋白基因編碼序列中、在起始密碼子之后的一段富含疏水氨基酸多肽,能夠指導(dǎo)蛋白質(zhì)定位的序列。通過(guò)檢測(cè)綿羊KCNH1蛋白潛在信號(hào)肽的存在情況可知該基因編的產(chǎn)物是否是分泌蛋白和跨膜蛋白的基本信息。用Signalp 3.0軟件分析得出,綿羊KCNH1基因的編碼產(chǎn)物最大C值為0.088,位于第46個(gè)氨基酸位點(diǎn)上;最大Y值為0.056,位于第19個(gè)氨基酸位點(diǎn)上;最大S值為0.422,位于第1個(gè)氨基酸位點(diǎn)上(圖5)。用PSORTⅡ軟件分析得到,綿羊KCNH1蛋白是跨膜蛋白,不存在信號(hào)肽(圖6)。
2.6? ?綿羊KCNH1蛋白跨膜螺旋結(jié)構(gòu)預(yù)測(cè)
從TMHMM軟件分析的結(jié)果(圖7、圖8)可知,KCNH1基因編碼的蛋白質(zhì)不存在信號(hào)肽,該蛋白是跨膜蛋白,蛋白鏈的N端位于膜內(nèi),C端位于膜外。共有5段跨膜區(qū)域,分別是216~235、251~269、293~308、345~372和449~468。
2.7? ?綿羊KCNH1蛋白保守結(jié)構(gòu)域分析
通過(guò)Smart軟件分析(表3)可知,綿羊KCNH1有8段保守結(jié)構(gòu)域,分別是PAS(16~92)、PAC(94~ 136)、Pfam:lon_trans(217~483)、Pfam:lon_ trans2 (397~477)、cNMP (554~672)、low complexity (687~ 699)、low complexity (765~777)和coiled coil (898~926)(圖9)。
2.8? ?綿羊KCNH1蛋白親疏水性分析
采用Prot Scale軟件分析綿羊KCNH1蛋白親疏水性可知,該基因編碼蛋白疏水性最大疏水值為3.722,位于第382位氨基酸位點(diǎn)上;最小疏水值為-3.278,位于第719位氨基酸位點(diǎn)上。由此確認(rèn)該基因編碼的蛋白屬于疏水蛋白(圖10)。
2.9? ?綿羊KCNH1蛋白二級(jí)結(jié)構(gòu)的預(yù)測(cè)
蛋白質(zhì)的二級(jí)結(jié)構(gòu) (secondary structure)是指多肽主鏈骨架原子沿一定的軸盤旋或折疊而形成的特定的局部構(gòu)象,不涉及氨基酸殘基側(cè)鏈的空間分布。蛋白質(zhì)二級(jí)結(jié)構(gòu)的主要形式有α螺旋、β折疊、β轉(zhuǎn)角和無(wú)規(guī)卷曲[14 ]。通過(guò)Jpred軟件分析得出,組成綿羊KCNH1蛋白二級(jí)結(jié)構(gòu)有α螺旋(42.96%)、無(wú)規(guī)則卷曲(41.50%)、延伸鏈(12.20%)和β轉(zhuǎn)角(3.34%),分別有412、398、117和32段,由此推斷綿羊KCNH1蛋白二級(jí)結(jié)構(gòu)主要為α螺旋,其次為無(wú)規(guī)則卷曲(圖11)。
2.10? ?綿羊KCNH1蛋白三級(jí)結(jié)構(gòu)預(yù)測(cè)與分析
三級(jí)結(jié)構(gòu)( tertiary structure)是指多肽鏈在二級(jí)結(jié)構(gòu)基礎(chǔ)上的進(jìn)一步卷曲折疊,通過(guò)借助次級(jí)鍵維系而形成的特定的三維構(gòu)象。由Swiss-model軟件分析可知(圖12),綿羊KCNH1基因蛋白三級(jí)結(jié)構(gòu)中無(wú)配基,且為單體蛋白。其中與它同源性最高的蛋白質(zhì)是5k7l.1,且待測(cè)蛋白與模板蛋白的匹配度為-2.87。由圖12可知,同源率為95.64%,且KCNH1基因編碼蛋白的三級(jí)結(jié)構(gòu)主要由α螺旋盤曲折疊形成。
3? ?結(jié)論
綿羊KCNH1基因的ORF長(zhǎng)度為2 961 bp,編碼986個(gè)氨基酸殘基;亮氨酸所占比例最多,為9.1%;色氨酸所占比例最少,為1.5%;目的基因蛋白質(zhì)的分子質(zhì)量為110 827.28 KDa,理論等電點(diǎn)(pI)為7.52。KCNH1基因編碼的產(chǎn)物為不穩(wěn)定性蛋白。亞細(xì)胞定位的結(jié)果顯示其在質(zhì)膜中的可能性最大,為43.5%。KCNH1基因編的碼產(chǎn)物在多種物種中氨基酸序列相似程度極高,且綿羊與水牛在系統(tǒng)發(fā)育樹中距離最近。KCNH1基因的編碼產(chǎn)物中不存在信號(hào)肽,為非分泌性蛋白,且發(fā)現(xiàn)了跨膜區(qū),故該蛋白是跨膜蛋白。該基因編碼的蛋白有5段跨膜結(jié)構(gòu)。KCNH1編碼的蛋白為疏水蛋白。綿羊KCNH1基因編碼產(chǎn)物的二級(jí)結(jié)構(gòu)主要以α螺旋為主,三級(jí)結(jié)構(gòu)主要由α螺旋盤曲折疊形成。
參考文獻(xiàn):
[1] FUKAI R,SAITSU H,TSURUSAKI Y,et al.? De novo KCNH1 mutations in four patients with syndromic developmental delay,hypotonia and seizures[J].? Journal of Human Genetics,2016,1:381-387.
[2] SAHOO N,SCHNHERR R,HOSHI T,et al.? Cysteines control the N- and C-linker-dependent gating of KCNH1 potassium channels[J].? Biochimica Et Biophysica Acta,2012,1818(5):1187-1195.
[3] BO H,TOKAY T,ZHANG G,et al.? Eag1 K + Channel:endogenous regulation and functions in nervous system[J].? Oxidative Medicine & Cellular Longevity,2017,
2017(2):7371010.
[4] KORT?譈M,F(xiàn)ANNY,CAPUTO V,et al.? Mutations in KCNH1 and ATP6V1B2 cause Zimmermann-Laband syndrome[J].? Nature Genetics,2015,47(6):661-667.
[5] RAMIREZ A,HINOJOSA L M,GONZALES J,et al. KCNH1 potassium channels are expressed in cervical cytologies from pregnant patients and are regulated by progesterone[J].? Reproduction,2013,146(6):615-623.
[6] NOORI M R,ZHANG B,PAN L.? Is KCNH1 mutation related to coronary artery ectasia[J].? BMC Cardiovascular Disorders,2019,19(1):1-2.
[7] WREDE R V,JEUB M,ARIZ I,et al.? Novel kcnh1 mutations associated with epilepsy: broadening the phenotypic spectrum of kcnh1-associated diseases[J].? Genes,2021,12(2):7-9.
[8] 王玉琴,田志龍,施會(huì)彬,等.? 湖羊肌肉營(yíng)養(yǎng)特點(diǎn)及肌纖維組織學(xué)特性[J].? 動(dòng)物營(yíng)養(yǎng)學(xué)報(bào),2017,29(8):2867-2874.
[9] NAKAI K,HORTON P.? PSORT:a program for detecting sorting signals in proteins and predicting their subcellular localization[J].? Trends in Biochemical Sciences, 1999,24(1):34-36.
[10] 張小雪,潘香羽,李發(fā)弟,等.? 綿羊ESR基因生物信息學(xué)分析[J].? 甘肅農(nóng)業(yè)科技,2014(9):30-33.
[11] 宋雅萍,李彥霞,郭文婧,等.? 綿羊GP5基因的生物信息學(xué)分析[J].? 甘肅農(nóng)業(yè)科技,2020(10):54-59
[12] 靳澤希,馮? ?芬,鄧曉銀,等.? 綿羊NRCAM基因的生物信息學(xué)分析[J].? 甘肅農(nóng)業(yè)科技,2020(12):19-24.
[13] 袁? ?媛,黃璐琦.? 中藥資源轉(zhuǎn)錄組分析操作指南[M].? 上海:上??茖W(xué)技術(shù)出版社,2016.
[14] 孔繁良.? 基于二級(jí)結(jié)構(gòu)的蛋白質(zhì)三級(jí)結(jié)構(gòu)預(yù)測(cè)[D].? 濟(jì)南:濟(jì)南大學(xué),2016.
收稿日期:2022 - 02 - 18
基金項(xiàng)目:國(guó)家畜禽良種聯(lián)合攻關(guān)計(jì)劃項(xiàng)目(19210365);甘肅農(nóng)業(yè)大學(xué)伏羲青年英才培養(yǎng)計(jì)劃項(xiàng)目(Gaufx-03Y11)。
作者簡(jiǎn)介:張小雪(1984 — ),女,湖北武漢人,副教授,主要從事動(dòng)物遺傳育種與繁殖研究及教學(xué)工作。聯(lián)系電話:(0931)7631225。Email:zhangxx@gsau.edu.cn。
通信作者:李? ?沖(1986 — ),男,甘肅崇信人,副教授,博士,主要從事動(dòng)物營(yíng)養(yǎng)與飼料科學(xué)研究及教學(xué)工作。聯(lián)系電話:(0931)7631225。Email:lichong@gsau.edu.cn。