国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

pre-mRNA剪接調(diào)控因子的檢測與估計(jì)研究現(xiàn)狀分析

2013-08-15 00:43:39邢婧
生物技術(shù)世界 2013年10期
關(guān)鍵詞:內(nèi)含子外顯子鄰域

邢婧

(湖北經(jīng)濟(jì)學(xué)院統(tǒng)計(jì)學(xué)院 湖北武漢 430205)

耗時(shí)13年的人類基因工程的完成是生命科學(xué)發(fā)展的一個(gè)里程碑,標(biāo)志著生命科學(xué)走向后基因組時(shí)代。事實(shí)上,基因表達(dá)的復(fù)雜性要遠(yuǎn)超過人們的想象。已知可增加蛋白質(zhì)種類和數(shù)量的方式有DNA重組、RNA編輯和pre-mRNA的選擇性剪接等,其中pre-mRNA的選擇性剪接是產(chǎn)生如此眾多蛋白質(zhì)的主要機(jī)制。以下簡介premRNA剪接調(diào)控因子的檢測與估計(jì)研究現(xiàn)狀分析

1 目前關(guān)于pre-mRNA剪切調(diào)控因子的檢測與估計(jì)的方法分類

(1)利用調(diào)控因子在外顯子與內(nèi)含子分布的不同以及在不同類型的剪接位點(diǎn)鄰域分布的不同進(jìn)行估計(jì)。W.G.Fairbrother等首先提出了RESCUE方法,該方法利用以下兩個(gè)性質(zhì)估計(jì)ESE:(a)ESE在外顯子分布高于在內(nèi)含子的分布;(b)ESE在強(qiáng)的剪接位點(diǎn)鄰域的分布密度低于弱的剪接位點(diǎn)鄰域的分布密度。

(2)利用調(diào)控因子在真外顯子與偽外顯子分布密度的不同以及在外顯子和非轉(zhuǎn)錄區(qū)分布密度的不同。X.H.F.Zhang等利用兩個(gè)具有代表性的統(tǒng)計(jì)屬性來識別ESE和ESS。這兩種屬性是:(a)ESE以及ESS在組成性剪接的非編碼的外顯子內(nèi)部分布對比在未剪接的偽外顯子中的分布;(b)ESE以及ESS在組成性剪接的非編碼的外顯子內(nèi)部分布對比無內(nèi)含子的5’未翻譯區(qū)域的分布。

(3)利用近鄰ESE或ESS分布強(qiáng)度來檢測新的ESE以及ESS。M.B.Stadler等提出了一種基于近鄰方法的ESE以及ESS識別模型,通過對輸入序列鄰域已知的ESE或ESS分布強(qiáng)度進(jìn)行測定并對輸入序列進(jìn)行打分,正分表示該序列周圍有較多已知的ESE,負(fù)分表示該序列周圍有較多已知的ESS。

(4)基于支持向量機(jī)的分類估計(jì)。B.Mersch等通過已有的生物信息應(yīng)用啟發(fā)式規(guī)則構(gòu)造了兩類數(shù)據(jù)集,一類是中立集,一類是基于模體的數(shù)據(jù)集,分別用局部改進(jìn)的支持向量機(jī)和基于組合級聯(lián)核函數(shù)的支持向量機(jī)對兩類數(shù)據(jù)集進(jìn)行檢測和估計(jì),具有較高的ESE識別率。

(5)利用直系同源不同生物進(jìn)化較為保守的外顯子或與外顯子鄰近的內(nèi)含子區(qū)域的序列頻率分布差異估計(jì)。

(6)利用序列在包含內(nèi)含子的基因與不包含內(nèi)含子的基因的分布差別進(jìn)行估計(jì)。

2 pre-mRNA的選擇性剪接調(diào)控因子的估計(jì)存在的主要問題

(1)主要針對一種調(diào)控因子進(jìn)行估計(jì)。目前大部分算法設(shè)計(jì)均僅針對單一的一種調(diào)控因子進(jìn)行估計(jì),較少利用多種調(diào)控因子分布的相關(guān)特征,難以做到針對多種調(diào)控因子進(jìn)行系統(tǒng)的同時(shí)估計(jì)。

(2)主要針對固定長度的一種調(diào)控因子進(jìn)行估計(jì)。已有大多數(shù)算法在估計(jì)調(diào)控因子時(shí)往往固定調(diào)控因子的長度在6-10范圍內(nèi),僅僅針對其中一種長度的調(diào)控因子進(jìn)行估計(jì),較少考慮多種長度情形下的估計(jì)。

(3)必須依靠確定的閾值來進(jìn)行估計(jì)。目前大部分算法均是基于調(diào)控因子在不同區(qū)域的分布差異設(shè)立某個(gè)確定的閾值,將超過臨界閾值的固定長度的序列作為調(diào)控因子的估計(jì)結(jié)果。然而固定的閾值設(shè)定可能漏掉一些真正的調(diào)控因子或者得到一些錯(cuò)誤的估計(jì)。

3 改進(jìn)策略建議

將不同長度、不同類型、不同特征的pre-mRNA剪接調(diào)控因子在pre-mRNA上的分布特征以及相關(guān)特征進(jìn)行綜合考慮,利用隱Markov模型建立不同類型的pre-mRNA剪接調(diào)控因子與其觀測特征之間概率估計(jì)的內(nèi)在聯(lián)系??蓮浹a(bǔ)了目前對于pre-mRNA剪接調(diào)控因子估計(jì)方法單調(diào)、檢測長度單一以及檢測種類單一等不足,通過引入隱Markov模型對pre-mRNA剪接調(diào)控因子進(jìn)行系統(tǒng)的綜合的考慮,有利于提高估計(jì)的準(zhǔn)確率,發(fā)現(xiàn)新的調(diào)控因子。

[1]B.Modrek and C.Lee,A genomic view of alternative splicing,Nature Genetics,2002,30:13-19.

[2]S.M.Berget,Exon recognition in vertebrate splicing, J Biol Chem,1996,270:2411-2414.

[3]A.Churbanov,I.Vorechovsk and C.Hicks,Computational prediction of splicing regulatory elements shared by Tetrapoda organisms,BMC genomics,2009,10:508.

[4]A.P.Dempster,N.M.Laird and D.B.Rubin,Maximum likelihood from incomplete data via the EM algorithm,J R Stat Soc B,1977,39:1-38.

[5]J.C.Rajapakse and L.S.Ho,Markov encoding for detecting signals in genomic sequences,IEEE/ACM Trans Comput Biol Bioinform,2005,2(2):131-142.

猜你喜歡
內(nèi)含子外顯子鄰域
外顯子跳躍模式中組蛋白修飾的組合模式分析
線粒體核糖體蛋白基因中內(nèi)含子序列間匹配特性分析
外顯子組測序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
稀疏圖平方圖的染色數(shù)上界
不同方向內(nèi)含子對重組CHO細(xì)胞中神經(jīng)生長因子表達(dá)的影響
更 正
外顯子組測序助力產(chǎn)前診斷胎兒骨骼發(fā)育不良
內(nèi)含子的特異性識別與選擇性剪切*
基于鄰域競賽的多目標(biāo)優(yōu)化算法
關(guān)于-型鄰域空間
讷河市| 铜陵市| 额尔古纳市| 宣武区| 乌拉特后旗| 图片| 都江堰市| 普格县| 锡林浩特市| 宁强县| 宁海县| 那坡县| 贡山| 湖州市| 龙里县| 专栏| 乌兰浩特市| 平乐县| 陆川县| 双江| 玛沁县| 化德县| 乌鲁木齐县| 长春市| 河东区| 布尔津县| 比如县| 四会市| 寻乌县| 兴和县| 浮山县| 安泽县| 新晃| 汝阳县| 广灵县| 精河县| 平乐县| 磐石市| 彰武县| 潜山县| 武定县|