国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

染色體相互作用密度與拓?fù)溆蛳嚓P(guān)分析

2020-04-08 09:30:50許希倫
電腦知識(shí)與技術(shù) 2020年3期
關(guān)鍵詞:生物信息學(xué)相關(guān)性分析

許希倫

摘要:生物信息學(xué)是一門(mén)交叉科學(xué),利用計(jì)算機(jī)方法來(lái)揭示大量復(fù)雜生物數(shù)據(jù)所包含的生物學(xué)意義。染色體相關(guān)結(jié)構(gòu)域是染色體上相互作用密集的一種重要結(jié)構(gòu),但目前缺少相互作用與拓?fù)溆蛳嚓P(guān)性分析。針對(duì)此問(wèn)題,使用計(jì)算機(jī)分析方法,設(shè)計(jì)了相互作用密度指標(biāo),可以較好地表示相互作用地聚集程度,并分析了相互作用密度和拓?fù)溆虻奶攸c(diǎn)和相關(guān)性。

關(guān)鍵詞:生物信息學(xué);染色體相互作用;染色體拓?fù)浣Y(jié)構(gòu)域;相互作用密度;相關(guān)性分析

中圖分類號(hào):TP3-05 文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1009-3044(2020)03-0011-02

1 概述

在過(guò)去,人們主要依賴顯微技術(shù)來(lái)研究染色體的空間組織模式。受顯微技術(shù)的限制,觀察的精度有限。隨著染色質(zhì)構(gòu)象捕獲技術(shù)的發(fā)展,可以通過(guò)Hi-C實(shí)驗(yàn)[1]測(cè)序得到染色體在三維空間中相互接近的片段。通過(guò)對(duì)Hi-C數(shù)據(jù)的分析,可以得到染色體上兩個(gè)區(qū)域間的相互作用強(qiáng)度,并計(jì)算得到一種染色體結(jié)構(gòu)——拓?fù)湎嚓P(guān)結(jié)構(gòu)域,簡(jiǎn)稱拓?fù)溆騕2-4]。拓?fù)溆蚴侨旧w中重要的結(jié)構(gòu)單元,它廣泛存在于多種物種間,是一種保守的結(jié)構(gòu)。這種結(jié)構(gòu)在同一生物的不同細(xì)胞系間十分穩(wěn)定,具有很高的相似性。對(duì)拓?fù)溆虻难芯繉⒂兄谖覀兞私馊旧w發(fā)揮功能的機(jī)制,同時(shí)也有助于揭露染色體結(jié)構(gòu)相關(guān)疾病的發(fā)生原因,為治療相關(guān)疾病提供幫助[5-7]。

本文中我們將分析拓?fù)溆蚺c相互作用的性質(zhì),并提出相互作用密度的指標(biāo),來(lái)表示拓?fù)溆蛑邢嗷プ饔玫拿芗潭取?/p>

2 實(shí)驗(yàn)分析

本文中,我們將分析相互作用的性質(zhì),拓?fù)溆虻男再|(zhì)和相互作用密度與拓?fù)溆虻南嚓P(guān)程度。我們使用兩種常用的細(xì)胞系IMR90(人胚肺成纖維細(xì)胞),并使用DI算法和ICFinder算法得到的拓?fù)溆騺?lái)進(jìn)行分析。

為了構(gòu)建染色體上的相互作用矩陣,我們首先將染色體按照40Kb的窗口大小分割成一個(gè)個(gè)等長(zhǎng)且連續(xù)的區(qū)間,可依次記為B1,B2,…,Bn(假設(shè)分成n個(gè)區(qū)間)。之后根據(jù)Hi-C數(shù)據(jù)構(gòu)建的相互作用矩陣定義為Mnxn其中第i行,第j列元素Mi,j表示區(qū)間Bi與Bj的相互作用強(qiáng)度。

2.1 相互作用分析

本小節(jié)我們比較了IMR90細(xì)胞中相互作用強(qiáng)度與距離的關(guān)系,其結(jié)果如圖1所示。其橫坐標(biāo)表示位點(diǎn)之間的距離l,實(shí)線表示兩個(gè)位點(diǎn)在當(dāng)前距離下相互作用的平均值,距離以40kb為一個(gè)單位。虛線表示其標(biāo)準(zhǔn)差。

可以看到,隨著兩個(gè)位點(diǎn)距離的增加,之間的相互作用強(qiáng)度下降明顯。并且其方差在不同距離下都較大,說(shuō)明即使兩個(gè)位點(diǎn)距離相同,其相互作用強(qiáng)度也有很大差異。

由此我們可以得出結(jié)論,兩個(gè)位點(diǎn)之間的相互作用受距離影響明顯,隨著兩個(gè)位點(diǎn)距離變遠(yuǎn),其相互作用的強(qiáng)度會(huì)下降。

2.2 染色體拓?fù)溆蚍治?/p>

在本節(jié)中,我們采用兩個(gè)經(jīng)典DI算法[4]和ICFinder算法[5]得到的拓?fù)溆颍瑏?lái)探究拓?fù)溆虻男再|(zhì)。本節(jié)我們使用IMR90細(xì)胞系的1號(hào)染色體為例,使用兩種不同的算法,得到其拓?fù)溆驒z測(cè)結(jié)果,并進(jìn)行對(duì)比。

表1統(tǒng)計(jì)了兩個(gè)檢測(cè)結(jié)果的信息,可以看到,兩個(gè)結(jié)果間的拓?fù)溆蚱骄笮【?0個(gè)單位。

2.3 相互作用密度與拓?fù)溆蚍治?/p>

染色體拓?fù)溆蚴侨旧w上相互作用密集的區(qū)域,也即在染色體上的兩個(gè)位置間的相互作用相較于域外或者跨域邊界這兩種情況,在拓?fù)溆騼?nèi)其相互作用會(huì)明顯較大。為了讓不同距離的兩個(gè)位置間的相互作用具有可比性,并且考慮其全局信息,我們對(duì)每個(gè)相互作用的兩個(gè)位置的距離,根據(jù)前面介紹的平均值,對(duì)其轉(zhuǎn)換得到一個(gè)規(guī)范化的相互作用矩陣Ⅳ。

如果Ni,j大于1,說(shuō)明這兩個(gè)位置間的相互作用大于全局的均值。根據(jù)規(guī)范化后的矩陣Ⅳ,我們提出了相互作用密度的概念。相互作用密度主要用于描述一個(gè)區(qū)域內(nèi)部相互作用相較于全局的密集程度,值越大,說(shuō)明其密集程度越大。

為了驗(yàn)證其有效性,我們使用IMR90細(xì)胞系的1號(hào)染色體,使用DI和ICFinder算法得到的拓?fù)溆?,我們統(tǒng)計(jì)了其結(jié)果的基本信息,如表2所示??梢钥吹剑?fù)溆虻拿芏染荡笥?,且ICFinder拓?fù)溆蛑忻芏却笥?的拓?fù)溆虮壤_(dá)到74%。

我們計(jì)算其拓?fù)溆虻南嗷プ饔妹芏鹊姆植迹玫降姆植紙D如圖2所示??梢钥吹剑浯蟛糠滞?fù)溆虻拿芏染性诖笥?的部分。由此我們可以得出結(jié)論,我們所定義的相互作用密度可以有效地體現(xiàn)拓?fù)溆騼?nèi)相互作用的密集程度,密度越大,表示其密集程度越高。

接下來(lái)我們繼續(xù)探究拓?fù)溆蜷L(zhǎng)度對(duì)相互作用密度的影響,我們統(tǒng)計(jì)了兩個(gè)方法得到的拓?fù)溆蛑?,不同長(zhǎng)度拓?fù)溆虻钠骄芏取F浣Y(jié)果如圖3所示,隨著拓?fù)溆蜷L(zhǎng)度的增大,其相互作用密度也隨之增大。由此可以得出結(jié)論,在拓?fù)溆騼?nèi),長(zhǎng)間隔的兩個(gè)區(qū)間的相互作用強(qiáng)度較短間隔相比,其與全局平均水平差異更大。

3 結(jié)論

在本文中,我們分析了相互作用矩陣和已有算法檢測(cè)得到的拓?fù)溆虻奶攸c(diǎn),并基于我們的發(fā)現(xiàn),提出了相互作用密度的指標(biāo),該指標(biāo)考慮到了距離的因素,可用于描述染色體上相互作用的聚集程度。通過(guò)分析該指標(biāo)與已有算法檢測(cè)得到的拓?fù)溆虻年P(guān)系,我們發(fā)現(xiàn)該指標(biāo)有以下特點(diǎn):1)已有算法檢測(cè)的拓?fù)溆蚱湎嗷プ饔妹芏却蟛糠志笥?;2)隨著拓?fù)溆虻脑龃?,其相互作用密度也隨之增大。

參考文獻(xiàn):

[1] Lieberman-Aiden E,Van Berkum N L,Williams L,et al.Comprehensive mapping of long-range interactions revealsfolding principles of the human genome[J]. science, 2009, 326(5950):289-293.

[2]張文力,高通量測(cè)序數(shù)據(jù)分析現(xiàn)狀與挑戰(zhàn)[J].集成技術(shù),2012 (3):20-24.

[3]呂紅強(qiáng),郝樂(lè)樂(lè),劉源,等,基于生物信息學(xué)的Hi-C研究現(xiàn)狀與發(fā)展趨勢(shì)(三維基因組??寮J].遺傳,2019: 0-0.

[4] Dixon J R,Selvaraj S,Yue F,et al.Topological domains inmammalian genomes identified by analysis of chromatin inter-actions[J]. Nature, 2012, 485(7398):376.

[5] De Laat W. Duboule D.Topology of mammalian developmen-tal enhancers and their regulatory landscapes[J]. Nature. 2013.502(7472):499-506.

[6] Pombo A,Dillon N.Three-dimensional genome architecture:players and mechanisms[J]. Nature reviews Molecular cell biol-ogy, 2015, 16(4):245-257.

[7] Matharu N,Ahituv N.Minor loops in major folds: enhancerproruoter looping, chroruatin restructuring, and their associa-tion with transcriptional regulation and disease[J]. PLoS genet-ics, 2015, 11(12):e1005640.

[8] Haddad N,Vaillant C,Jost D.IC-Finder: inferring; robustlythe hierarchical organization of chromatin folding[J]. Nucleicacids research. 2017, 45(10):81.

猜你喜歡
生物信息學(xué)相關(guān)性分析
淺談醫(yī)學(xué)院校生物信息學(xué)專業(yè)青年教師規(guī)范培訓(xùn)模式的建立
濱州市城區(qū)苔蘚植物主要重金屬含量的調(diào)查與分析
“PBL+E—learning”教學(xué)模式探索
移動(dòng)教學(xué)在生物信息學(xué)課程改革中的應(yīng)用
今傳媒(2016年11期)2016-12-19 11:35:50
中醫(yī)大數(shù)據(jù)下生物信息學(xué)的發(fā)展及教育模式淺析
人民幣匯率變動(dòng)與中國(guó)入境旅游相關(guān)性分析(2002—2016)
上市公司財(cái)務(wù)指標(biāo)與股票價(jià)格的相關(guān)性實(shí)證分析
數(shù)據(jù)挖掘技術(shù)在生物信息學(xué)中的應(yīng)用
淘寶星店成長(zhǎng)中的粉絲力量
中國(guó)城市化與經(jīng)濟(jì)發(fā)展水平關(guān)系研究
商(2016年33期)2016-11-24 22:04:19
东丰县| 利津县| 安多县| 祁连县| 开阳县| 唐河县| 枣阳市| 常德市| 开封市| 庐江县| 皮山县| 灵武市| 郴州市| 磐石市| 岐山县| 内黄县| 綦江县| 百色市| 宿州市| 红原县| 遂溪县| 荣昌县| 长垣县| 宜春市| 阿坝县| 南宁市| 固始县| 始兴县| 永丰县| 上栗县| 盘锦市| 贡山| 华蓥市| 嘉善县| 曲沃县| 重庆市| 东兴市| 达拉特旗| 长武县| 沂源县| 昌邑市|