孫美濤,王昀,李月,張曉娟,楊勇琴,楊澤芳,熊偉*
(1.大理大學(xué)基礎(chǔ)醫(yī)學(xué)院,云南大理671000;2.云南省昆蟲醫(yī)藥研發(fā)重點(diǎn)實(shí)驗(yàn)室,云南大理671000;3.大理大學(xué)大理教學(xué)醫(yī)院呼吸內(nèi)科,云南大理671000)
hMTERF3基因啟動子區(qū)的生物信息學(xué)分析
孫美濤1,2,王昀1,2,李月1,2,張曉娟3,楊勇琴1,楊澤芳1,熊偉1,2*
(1.大理大學(xué)基礎(chǔ)醫(yī)學(xué)院,云南大理671000;2.云南省昆蟲醫(yī)藥研發(fā)重點(diǎn)實(shí)驗(yàn)室,云南大理671000;3.大理大學(xué)大理教學(xué)醫(yī)院呼吸內(nèi)科,云南大理671000)
目的:探討人線粒體轉(zhuǎn)錄終止因子3基因啟動子區(qū)的序列特征、轉(zhuǎn)錄因子及其結(jié)合位點(diǎn)。方法:利用Promoter 2.0、NNPP、Proscan、FirstEF軟件分別預(yù)測hMTERF3基因5端上游的啟動子數(shù)目及分布;利用CpG Island Searcher和CpG Plot軟件預(yù)測CpG島位置;利用P-match 1.0程序搜索TRANSFAC數(shù)據(jù)庫預(yù)測與hMTERF3基因啟動子結(jié)合的轉(zhuǎn)錄因子及其結(jié)合位點(diǎn)。結(jié)果:hMTERF3基因定位于8q21.2,基因全長22 216 bp,含有11個外顯子和10個內(nèi)含子。hMTERF3基因上游至5'側(cè)翼共3 000 bp的核苷酸序列至少存在2個啟動子區(qū),其中1 733~2 302 bp之間可能為包含TATA盒的核心啟動子區(qū)。啟動子區(qū)序列中存在1個長為1 145 bp的CpG島。hMTERF3基因啟動子區(qū)存在1 055個轉(zhuǎn)錄因子結(jié)合位點(diǎn),進(jìn)化足跡法分析其保守的核心啟動子區(qū)轉(zhuǎn)錄因子結(jié)合位點(diǎn)共19個。結(jié)論:hMTERF3基因啟動子區(qū)的生物信息學(xué)分析能夠提高基因啟動子的研究效率,為后續(xù)實(shí)驗(yàn)構(gòu)建hMTERF3基因啟動子表達(dá)載體及鑒定啟動子功能提供理論依據(jù)。
hMTERF3;生物信息學(xué);啟動子區(qū);轉(zhuǎn)錄因子;CpG島
人類線粒體轉(zhuǎn)錄終止因子3(human mitochon?drial transcription termination factor 3,hMTERF3)基因又稱為人類線粒體轉(zhuǎn)錄終止因子結(jié)構(gòu)域1(human mitochondrial transcription termination domain contain?ing 1,hMTERFD1)基因〔1〕。2007年,PARK C B等在Cell雜志上首次報(bào)道哺乳動物MTERF3基因編碼的蛋白質(zhì)是線粒體基因轉(zhuǎn)錄的負(fù)調(diào)控因子,與線粒體DNA(mitochondrial DNA,mtDNA)重鏈及輕鏈啟動子區(qū)結(jié)合,抑制線粒體DNA雙鏈的基因轉(zhuǎn)錄水平〔2〕。WREDENBERG A等最近的研究結(jié)果揭示哺乳動物MTERF3也能調(diào)節(jié)線粒體中核糖體大亞基的組裝,并且影響線粒體中核糖體的生物合成〔3〕。hMTERF3基因的表達(dá)異常,可能與線粒體心肌病、線粒體糖尿病、神經(jīng)退行性疾病、線粒體腦病、惡性腫瘤等人類疾病的發(fā)生密切相關(guān)〔4-5〕。然而,目前對于hMTERF3基因自身的轉(zhuǎn)錄調(diào)控及其分子機(jī)制仍不明確。
本研究利用不同的生物信息學(xué)軟件對hM?TERF3基因序列和啟動子區(qū)分別進(jìn)行分析,獲取該基因的啟動子位置與分布、CpG島位置及啟動子區(qū)轉(zhuǎn)錄因子結(jié)合元件,旨在為后續(xù)實(shí)驗(yàn)研究中構(gòu)建hMTERF3基因啟動子表達(dá)載體和鑒定基因啟動子功能提供基本的理論參考。
1.1hMTERF3基因組DNA序列hMTERF3基因定位于人類基因組8q22.1,該基因又被稱為hCGI-12或hMTERFD1,基因全長為22 216 bp,由10個內(nèi)含子和11個外顯子構(gòu)成〔6〕。hMTERF3基因轉(zhuǎn)錄的mRNA登錄號為NM_015942.4,編碼的蛋白質(zhì)產(chǎn)物登陸號為NP_057026.3,但在NCBI(National Center for Biotechnology Information,NCBI)的GenBank尚未記錄此基因啟動子區(qū)的序列〔7〕。
1.2數(shù)據(jù)庫和程序美國國立生物技術(shù)信息中心數(shù)據(jù)庫:http://www.ncbi.nlm.nih.gov/genbank/?;騿幼釉诰€分析軟件:Promoter 2.0(http://www.cbs. dtu.dk/services/promoter/);NNPP(http://www.fruitfly. org/seq_tools/promoter.html/);Proscan(http://www-bi?mas.cit.nih.gov/molbio/proscan/);FirstEF(http://rulai. cshl.org/tools/FirstEF/)。啟動子區(qū)的轉(zhuǎn)錄因子預(yù)測軟件:P-match 1.0(http:www.gene-regulation.com/ pub/programs.html#p-match/)。CpG島預(yù)測軟件:CpG Island Searcher(http://www.uscnorris.com/cpgis?lands2/cpg.aspx/);CpG Plot(http://www.ebi.ac.uk/ emboss/cpgplot/index.html/)。
1.3獲取hMTERF3基因序列在NCBI Gene數(shù)據(jù)庫中檢索hMTERF3,獲得hMTERF3基因的ID為51001,采用FASTA格式獲取基因信息〔8〕。
1.4hMTERF3基因啟動子區(qū)序列的確定在NCBI數(shù)據(jù)庫中查找,獲得hMTERF3基因的轉(zhuǎn)錄起始位點(diǎn)在基因序列圖上的定位,并獲取轉(zhuǎn)錄起始位點(diǎn)上游-2 500 bp至轉(zhuǎn)錄起始點(diǎn)下游的+500 bp序列(包括第1外顯子和第1內(nèi)含子)。此段共計(jì)3 000 bp的序列包含潛在的基因啟動子序列。
1.5hMTERF3基因啟動子區(qū)序列的分析利用啟動子在線預(yù)測軟件Promoter 2.0、NNPP、Proscan、FirstEF分別在軟件默認(rèn)條件下對獲取的hMTERF3基因上游至5'側(cè)翼啟動子區(qū)合計(jì)3 000 bp的序列進(jìn)行分析。
1.6hMTERF3基因啟動子區(qū)CpG島的分析利用CpG Island Searcher和CpG Plot分別在軟件默認(rèn)條件下對獲取的hMTERF3基因上游至5'側(cè)翼共計(jì)3 000 bp的序列進(jìn)行基因啟動子區(qū)CpG島的分析〔9〕。
1.7hMTERF3基因啟動子區(qū)轉(zhuǎn)錄因子結(jié)合位點(diǎn)分析利用P-Match 1.0程序,設(shè)定矩陣序列相似性設(shè)定為0.95,核心序列相似性為0.90,輸入hMTERF3基因上游至5'側(cè)翼3 000 bp的序列,搜索TRANSFAC 5.0數(shù)據(jù)庫中的脊椎動物轉(zhuǎn)錄因子結(jié)合元件,分別對hMTERF3基因的正、負(fù)義鏈轉(zhuǎn)錄因子結(jié)合元件進(jìn)行分析〔10〕。
2.1hMTERF3基因特征GenBank中hMTERF3基因的登錄號為NC_000008.11,定位于8q22.1,該基因也被命名為hCGI-12或hMTERFD1,基因組序列全長22 216 bp(Chromosome 8:96239398..96261613),由10個內(nèi)含子和11個外顯子構(gòu)成。該基因轉(zhuǎn)錄的mRNA全長為1 470 bp,編碼417個氨基酸構(gòu)成的蛋白質(zhì),N端1~68個氨基酸為定位線粒體的導(dǎo)肽,緊隨其后的349個氨基酸組成成熟肽。
2.2hMTERF3基因啟動子區(qū)分析Promoter 2.0軟件預(yù)測的結(jié)果提示,hMTERF3基因上游可能存在2個不同的啟動子區(qū),其中臨界性預(yù)測位于200 bp處,1 200 bp處為最大可能預(yù)測。Neural Network Promoter Prediction(NNPP)軟件預(yù)測的結(jié)果提示,hMTERF3基因上游可能存在6個不同的啟動子序列,分別位于413~463 bp,467~517 bp,1 036~1 086 bp,2 048~2 098 bp,2 217~2 267 bp,2 863~2 913 bp。Proscan軟件預(yù)測的結(jié)果提示,hMTERF3基因正義鏈有1個可能的啟動子序列,位于1 663~1 883 bp;負(fù)義鏈則有3個可能的啟動子序列,分別位于2 724~2 474 bp,1 948~1 698 bp,664~414 bp。FirstEF軟件預(yù)測的結(jié)果提示,hMTERF3基因啟動子在正義鏈位于1 733~2 302 bp之間,P值為0.998 3,在負(fù)義鏈位于2 564~1 995 bp之間,P值為1.000 0。見表1。
2.3hMTERF3基因CpG島預(yù)測和分析
2.3.1 CpG Island Searcher預(yù)測結(jié)果采用在線軟件CpG Island Searcher預(yù)測hMTERF3基因啟動子區(qū)的CpG島,預(yù)測標(biāo)準(zhǔn)為(G+C)%>55.00%;觀察值/預(yù)期值>0.65,長度>200 bp。結(jié)果顯示,hMTERF3基因CpG島位于啟動子區(qū)1 452~2 596 bp之間。CpG島的(G+C)%=57.9%,觀察值/預(yù)期值=0.832,長度= 1 145 bp,軟件預(yù)測的CpG島橫跨第1啟動子及轉(zhuǎn)錄起始位點(diǎn),這與CpG島的分布特點(diǎn)相符。見圖1。
2.3.2 CpG Plot預(yù)測結(jié)果使用歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)提供的CpG Plot在線軟件,CpG島的預(yù)測標(biāo)準(zhǔn)為(G+C)%>50.00%;觀察值/預(yù)期值>0.60,長度>200 bp,在hMTERF3基因5'端上游啟動子區(qū)發(fā)現(xiàn)3個CpG島。第1個CpG島位于1 448~1 770 bp之間,長度為323bp;第2個CpG島位于1791~2313bp之間,長度為523bp;第3個CpG島位于2337~2 732 bp之間,長度為396 bp。該軟件預(yù)測的CpG島位置與CpG Island Searcher軟件預(yù)測的CpG島位置高度重合。見圖2。
表1 hMTERF3基因啟動子的預(yù)測結(jié)果
圖1 CpG Island Searcher軟件預(yù)測hMTERF3基因上游5'端啟動子區(qū)的CpG島(圖中黑色粗線區(qū)域?yàn)镃pG島所在的位置)
圖2 CpG Plot軟件預(yù)測hMTERF3基因上游5'端啟動子區(qū)的CpG島(柱狀圖A、B、C為CpG島所在位置)
2.4hMTERF3基因轉(zhuǎn)錄因子結(jié)合位點(diǎn)分析利用P-Match 1.0程序檢索TRANSFAC 4.0數(shù)據(jù)庫,共計(jì)獲得基因啟動子區(qū)3 000 bp正負(fù)鏈轉(zhuǎn)錄因子結(jié)合位點(diǎn)1 055個,再用進(jìn)化足跡法分析hMTERF3基因及小鼠同源MTERF3基因(Gene ID:66410)核心啟動子區(qū)保守區(qū)域,只保留位于核心啟動子保守區(qū)域內(nèi)共有的轉(zhuǎn)錄因子結(jié)合部位19個。見表2。
表2 hMTERF3基因核心啟動子區(qū)轉(zhuǎn)錄因子結(jié)合位點(diǎn)的預(yù)測結(jié)果
hMTERF3基因?qū)儆谌祟惥€粒體轉(zhuǎn)錄終止因子(mitochondrial transcription termination factor,MTERF)基因家族。該基因定位于人類第8號染色體長臂(8q22.1),由10個內(nèi)含子和11個外顯子構(gòu)成。hMTERF3基因編碼的蛋白質(zhì)產(chǎn)物共有417個氨基酸,N端1~68個氨基酸為定位線粒體的導(dǎo)肽,其后349個氨基酸為成熟的hMTERF3多肽〔7〕。hMTERF3蛋白是目前為止報(bào)道的唯一一個人類線粒體基因轉(zhuǎn)錄的負(fù)調(diào)控因子,對人類惡性腫瘤、線粒體糖尿病、神經(jīng)退行性疾?。ㄈ缗两鹕Y、阿爾茨海默病等)等線粒體相關(guān)疾病的診斷與治療具有良好的應(yīng)用前景。
基因啟動子的鑒定作為研究復(fù)雜基因調(diào)控網(wǎng)絡(luò)的基礎(chǔ)和前提,是細(xì)胞分子生物學(xué)領(lǐng)域長期以來致力研究的重要問題。使用計(jì)算方法對基因啟動子進(jìn)行鑒定的工作通常是基于DNA序列特征開展的,這些鑒定方法按其研究目的大致分為啟動子區(qū)域搜尋和啟動子調(diào)控序列鑒定兩類。識別啟動子區(qū)域等同于識別轉(zhuǎn)錄起始位點(diǎn)的位置,其基本原理是搜索核心序列如TATA盒,或搜索已知的轉(zhuǎn)錄因子結(jié)合位點(diǎn)等〔11〕。本研究分別采用Promoter 2.0、NNPP、Proscan、FirstEF 4種不同的啟動子分析軟件對hMTERF3基因啟動子區(qū)進(jìn)行分析,結(jié)果發(fā)現(xiàn)該基因至少存在著2個啟動子,大致分布于500 bp和2 500 bp之內(nèi),尤其是啟動子區(qū)1 733~2 302 bp的序列可能為包含TATA盒的核心啟動子。預(yù)測結(jié)果與文獻(xiàn)報(bào)道的基因啟動子區(qū)存在于轉(zhuǎn)錄起始位點(diǎn)上游-2 500 bp之內(nèi)是基本一致的〔12〕。
CpG雙核苷酸在人類基因組中的分布很不均一,而在基因組的某些區(qū)段,CpG保持或高于正常概率,這些區(qū)段被稱作CpG島。研究表明,CpG島主要位于基因的啟動子和第1外顯子區(qū)域,人類基因組中有60%以上基因的啟動子含有CpG島〔13〕。CpG島的(G+C)%含量通常都超過50%,長度>200 bp。本研究利用CpG Island Searcher和CpG Plot兩個不同軟件對基因啟動子區(qū)CpG島進(jìn)行分析,CpG Island Searcher軟件分析出hMTERF3基因啟動子區(qū)有1個CpG島,位于啟動子區(qū)的1 452~2 596 bp之間,長度為1 145 bp。CpG Plot軟件則分析出hMTERF3基因啟動子區(qū)有3個CpG島,分別位于啟動子區(qū)的1 448~1 770 bp、1 791~2 313 bp和2 337~2 732 bp,長度依次為323、523和396 bp,這3段序列所在的位置與CpG Island Searcher軟件分析的CpG島位置是高度重合的。
生物信息學(xué)方法鑒定基因啟動子區(qū)轉(zhuǎn)錄因子結(jié)合位點(diǎn)的基本流程如下:首先,確定啟動子區(qū)域的大致范圍,通常取基因轉(zhuǎn)錄起始位點(diǎn)上游的1 000~3 000 bp的范圍;然后,確定一類具有共同特征(諸如相似的表達(dá)譜)的基因,并獲取它們的啟動子區(qū)序列;接著使用多重序列比對(Multiple sequence alignment,MSA)的方法鑒定上述序列中一致性出現(xiàn)的模體(motif),并計(jì)算模體每個位置的堿基比例,生成相應(yīng)的權(quán)重矩陣(weight matrix)。模體的權(quán)重矩陣可用以預(yù)測轉(zhuǎn)錄因子的結(jié)合位點(diǎn),常用的轉(zhuǎn)錄因子數(shù)據(jù)庫有JASPAR和TRANSFAC等〔14-15〕。本研究利用P-match 1.0程序搜索TRANSFAC 4.0數(shù)據(jù)庫,預(yù)測hMTERF3基因啟動子區(qū)共1 055個轉(zhuǎn)錄因子結(jié)合位點(diǎn)。采用進(jìn)化足跡法,對人和小鼠的MTERF3基因上游5'端的保守區(qū)域進(jìn)行比較分析表明,在hMTERF3基因核心啟動子區(qū)1 733~2 302 bp相似性較大,對比確定同源基因啟動子保守區(qū)域內(nèi)共有的轉(zhuǎn)錄因子有19個。因此,綜合結(jié)果表明這個區(qū)域可能是基因表達(dá)調(diào)控的關(guān)鍵部位。由于在轉(zhuǎn)錄因子結(jié)合位點(diǎn)的分析中,P-match 1.0程序只能針對已知轉(zhuǎn)錄因子的結(jié)合位點(diǎn)進(jìn)行預(yù)測,對未知的或新的轉(zhuǎn)錄因子結(jié)合位點(diǎn)則無法進(jìn)行分析,該預(yù)測方法存在著一定的局限性〔16〕。所以,生物信息學(xué)軟件分析的結(jié)果可為后續(xù)的研究指明方向,但尚需后續(xù)的實(shí)驗(yàn)研究來進(jìn)一步驗(yàn)證。
此外,隨著近年來表觀基因組學(xué)的迅猛發(fā)展,開發(fā)出了一大批基于基因組蛋白修飾和DNA甲基化數(shù)據(jù)預(yù)測啟動子的方法,比如Segway、ChromHMM等,已經(jīng)在基因組注釋研究中發(fā)揮了不可替代的作用〔17-18〕??梢灶A(yù)見的是,利用表觀基因組學(xué)的數(shù)據(jù)來鑒定啟動子是未來生物信息學(xué)分析基因啟動子的主要發(fā)展方向〔19〕。
綜上所述,本研究首先通過NCBI GenBank數(shù)據(jù)庫獲取hMTERF3基因序列,并獲取hMTERF3基因上游至5'側(cè)翼3 000 bp序列,再采用不同的生物信息學(xué)軟件對hMTERF3基因序列特征、啟動子序列、CpG島以及轉(zhuǎn)錄因子結(jié)合位點(diǎn)進(jìn)行了預(yù)測和分析,為下一步實(shí)驗(yàn)構(gòu)建hMTERF3基因啟動子表達(dá)載體和檢測啟動子的活性提供基本的理論依據(jù)。
〔1〕HYV?RINEN A K,POHJOISM?KI J L,HOLT I J,et al. Overexpression of MTERFD1 or MTERFD3 impairs the completion of mitochondrial DNA replication〔J〕.Mol Biol Rep,2011,38(2):1321-1328.
〔2〕PARK C B,ASIN-CAYUELA J,CáMARA Y,et al. MTERF3 is a negative regulator of mammalian mtDNA transcription〔J〕.Cell,2007,130(2):273-285.
〔3〕WREDENBERG A,LAGOUGE M,BRATIC A,et al. MTERF3 regulates mitochondrial ribosome biogenesis in invertebrates and mammals〔J〕.PLoS Genet,2013,9(1):e1003178.
〔4〕ANDERSSON D C,F(xiàn)AUCONNIER J,PARK C B,et al. Enhanced cardiomyocyte Ca(2+)cycling precedes terminal AV-block in mitochondrial cardiomyopathy Mterf3 KO mice〔J〕.Antioxid Redox Signal,2011,15(9):2455-2464.
〔5〕熊偉,余敏,左紹遠(yuǎn).線粒體轉(zhuǎn)錄終止因子蛋白家族在線粒體基因表達(dá)中的調(diào)節(jié)作用〔J〕.中國生物化學(xué)與分子生物學(xué)報(bào),2015,31(3):223-231.
〔6〕XIONG W,LUO Y,ZHANG C,et al.Expression,purifi?cation of recombinant human mitochondrial transcription termination factor 3(hMTERF3)and preparation of poly?clonal antibody against hMTERF3〔J〕.Appl Biochem Biotechnol,2012,167(8):2318-2329.
〔7〕熊偉,張曉娟,張海洋,等.基于生物信息學(xué)方法預(yù)測人線粒體轉(zhuǎn)錄終止因子3蛋白的結(jié)構(gòu)與功能〔J〕.生物技術(shù)通訊,2015,26(3):367-373.
〔8〕孫勇,王良喜,孫曙光,等.人三葉因子3基因啟動子區(qū)的生物信息學(xué)分析〔J〕.醫(yī)學(xué)研究生學(xué)報(bào),2013,26(4):340-342.
〔9〕唐亮,王燕,陳碧峰.人Toll樣受體9基因啟動子區(qū)的生物信息學(xué)分析〔J〕.生物技術(shù)通訊,2014,25(2):210-212.
〔10〕楊樹德,曹奇志,馮小英,等.人LAIR-1/CD305基因啟動子的生物信息學(xué)分析〔J〕.細(xì)胞與分子免疫學(xué)雜志,2010,26(8):826-828.
〔11〕KLINGENHOFF A,F(xiàn)RECH K,QUANDT K,et al.Func?tional promoter modules can be detected by formal models independent of overall nucleotide sequence similarity〔J〕. Bioinformatics,1999,15(3):180-186.
〔12〕管曉翔,陳巍魏,陳龍邦,等.p27Kip1基因啟動子區(qū)的生物信息學(xué)分析〔J〕.醫(yī)學(xué)研究生學(xué)報(bào),2010,23(10):1029-1032.
〔13〕TAKAI D,JONES P A.Comprehensive analysis of CpG islands in human chromosomes 21 and 22〔J〕.Proc Natl Acad Sci USA,2002,99(6):3740-3745.
〔14〕WINGENDER E.TRANSFAC:a database on transcrip?tion factors and their DNA binding sites〔J〕.Nucleic Acids Research,1996,24(1):238-241.
〔15〕PORTALES-CASAMAR E,THONGJUEA S,KWON A T,et al.JASPAR 2010:the greatly expanded open-access database of transcription factor binding profiles〔J〕.Nucle?ic Acids Res,2010,38:105-110.
〔16〕王佐廣,牛秋麗,劉雅,等.線粒體融合基因2啟動子的生物信息學(xué)研究〔J〕.中國動脈硬化雜志,2013,21(2):97-104.
〔17〕HOFFMAN M M,BUSKE O J,WANG J,et al.Unsuper?vised pattern discovery in human chromatin structure through genomic segmentation〔J〕.Nat Methods,2012,9(5):473-476.
〔18〕ERNST J,KELLIS M.ChromHMM:automating chroma?tin-state discovery and characterization〔J〕.Nat Methods,2012,9(3):215-216.
〔19〕盧一鳴,屈武斌,張成崗.基于表觀基因組學(xué)的DNA元件鑒定方法研究進(jìn)展〔J〕.生物化學(xué)與生物物理進(jìn)展,2014,41(7):640-648.
Bioinformatics Analysis of hMTERF3 Gene Promoter Region
Sun Meitao1,2,Wang Yun1,2,Li Yue1,2,Zhang Xiaojuan3,Yang Yongqin1,Yang Zefang1,Xiong Wei1,2
(1.Pre-clinical College,Dali University,Dali,Yunnan 671000,China;2.Key Laboratory of Pharmaceutical R&D of Insects in Yunnan Province,Dali,Yunnan 671000,China;3.Respiratory Department,Dali Teaching Hospital of Dali University,Dali, Yunnan 671000,China)
Objective:To investigate the characters,transcription factors and their binding sites ofhuman mitochondrial transcription termination factor 3(hMTERF3)gene promoter by different bioinformatics tools.Methods:Promoter 2.0,NNPP,Proscan,and FirstEF softwares were used to analyze the numbers and distributions ofhMTERF3gene promoter;CpG Islander and CpG Plot softwares were used to analyze the GpG island ofhMTERF3gene promoter;P-match 1.0 protocol and TRANSFAC database were used to analyze the transcription factors and their binding sites ofhMTERF3gene promoter.Results:hMTERF3gene was located on 8q21.2.The full length ofhMTERF3gene was 22 216 bp,consisting of 11 exons and 10 introns.There were at least two promoters in the 5'unconding region ofhMTERF3gene.The core promoter ofhMTERF3gene was located between 1 733-2 302 bp,containing TATA box.InhMTERF3gene promoter region,a 1 145 bp CpG island could be found.In addition,1 055 transcription factor binding sites were predicted by P-Match 1.0 protocol,and only 19 transcription factor binding sites were found in conserved core promoter region of human and mouse homologousMTERF3genes by phylogenetic foot-printing analysis.Conclusion:Gene promoter related bioinformatics analysis can improve the efficiency ofhMTERF3gene promoter research,and provide significant information for the construction of promoter expression vector,also for the further study of promoter function.
hMTERF3;bioinformatics;promoter;transcription factor;CpG island
Q71:Q811.4
A
2096-2266(2017)02-0040-06
10.3969/j.issn.2096-2266.2017.02.008
(責(zé)任編輯 李楊)
國家自然科學(xué)基金資助項(xiàng)目(81560458);云南省教育廳科學(xué)研究基金資助項(xiàng)目(2014Z126);大理大學(xué)博士科研啟動基金資助項(xiàng)目(BSKY2012018);大理大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)計(jì)劃資助項(xiàng)目(201402)
2016-01-03
2016-05-07
孫美濤,碩士研究生,主要從事病理與病理生理學(xué)研究.
*通信作者:熊偉,副教授,博士.