国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建及分析方法研究綜述

2014-04-29 00:44:03汪濤等

汪濤等

摘 要:隨著高通量生物實(shí)驗(yàn)技術(shù)的快速發(fā)展,特別是基因芯片和新一代測(cè)序技術(shù)的發(fā)展,全基因組范圍內(nèi)的基因表達(dá)數(shù)據(jù)呈爆炸式增長(zhǎng)。利用網(wǎng)絡(luò)生物學(xué)的方法對(duì)高通量基因表達(dá)數(shù)據(jù)進(jìn)行分析和挖掘已經(jīng)成為生物信息學(xué)重要的研究方向。對(duì)基因共表達(dá)網(wǎng)絡(luò)的研究與分析從系統(tǒng)層面上加深了研究人員對(duì)生物系統(tǒng)的認(rèn)識(shí)。本文綜述了基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建和分析的常用方法,主要包括基因相似性度量方法、閾值選擇方法、拓?fù)浞治龇椒?、基因模塊識(shí)別及其功能注釋注釋方法,并對(duì)一些常用的分析工具進(jìn)行了分析總結(jié)。

關(guān)鍵詞:基因共表達(dá)網(wǎng)絡(luò);基因模塊;功能和拓?fù)浞治?/p>

中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)號(hào):A 文章編號(hào):2095-2163(2014)06-

Abstract: With the rapid development of high-throughput biological experiments technology, particularly the development of gene microarray and next generation sequencing technology, the genome wide gene expression data grow explosively. Network biology has become an important research direction in bioinformatics, which enhances the analysis of high throughput gene expression data. The study and analysis of gene co-expression network help the researchers to understand the biological system in system level better. This article reviewes the common methods on constructing and analyzing gene co-expression network, including the methods of measuring similarity of genes, selecting proper threshold, analyzing topological structure, detecting gene module and functional annotation on gene module. In the end, the paper summarizes some commonly used tools for analyzing gene co-expression network.

Keywords: Gene Co-expression Network; Gene Module; Functional and Topological Analysis

0 引 言

后基因組時(shí)代生命科學(xué)研究的一個(gè)主要目的是理清生物細(xì)胞內(nèi)所有分子以及分子之間的聯(lián)系,并且揭示分子之間相互作用以及如何決定細(xì)胞生命功能的內(nèi)在機(jī)理[1]。隨著系統(tǒng)生物學(xué)和復(fù)雜圖理論的發(fā)展,分子生物網(wǎng)絡(luò)的研究為探索復(fù)雜生命活動(dòng)提供了有力工具。分子生物網(wǎng)絡(luò)在系統(tǒng)層面反映了生物分子的相互作用關(guān)系,因而在相當(dāng)過(guò)程中有助于研究者深入理解生物細(xì)胞中各種生物分子是如何相互作用、進(jìn)而行使生物功能的完整處理實(shí)現(xiàn)過(guò)程。目前人們已經(jīng)對(duì)各種類(lèi)型的分子生物網(wǎng)絡(luò)進(jìn)行了廣泛的研究,如基因共表達(dá)網(wǎng)絡(luò)(gene co-expression network)、基因調(diào)控網(wǎng)絡(luò)(gene regulatory network)、蛋白質(zhì)相互作用網(wǎng)絡(luò)(protein-protein interaction network)、代謝網(wǎng)絡(luò)(metabolic network)等。這些探索已經(jīng)從對(duì)單個(gè)生物分子研究層面上升到解析研究分子相互作用關(guān)系的系統(tǒng)研究層面,并且產(chǎn)生了豐碩的研究成果。

基因芯片技術(shù)以及新一代測(cè)序技術(shù)的應(yīng)用,使得全基因組范圍內(nèi)基因表達(dá)數(shù)據(jù)得以快速累積。僅僅對(duì)單個(gè)基因功能水平的研究已經(jīng)限制了人們探索生物細(xì)胞行使生命功能的視野和進(jìn)程。利用系統(tǒng)生物學(xué)的方法構(gòu)建基因共表達(dá)網(wǎng)絡(luò),從而由系統(tǒng)層面揭示基因之間的相互關(guān)系已經(jīng)成為一個(gè)主要的研究方向。本文中,主要對(duì)基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建方法以及常用的分析方法進(jìn)行了關(guān)注及論述。

1基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建

基因共表達(dá)網(wǎng)絡(luò)大多是以基因間表達(dá)譜數(shù)據(jù)的相關(guān)性為基礎(chǔ)而實(shí)現(xiàn)構(gòu)建的。在基因共表達(dá)網(wǎng)絡(luò)的表示中,經(jīng)常使用圖模型來(lái)描述基因之間的關(guān)系。圖中的節(jié)點(diǎn)代表基因,邊表示兩個(gè)基因之間的共表達(dá)相互作用關(guān)系。基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建主要分為兩個(gè)步驟,第一是對(duì)所有基因進(jìn)行相似性度量;第二是通過(guò)閾值的選擇確定共表達(dá)網(wǎng)絡(luò)的邊。以下則對(duì)其展開(kāi)具體分析。

1.1數(shù)據(jù)來(lái)源及表示

在分子生物學(xué)領(lǐng)域,基因表達(dá)譜是指基因表達(dá)活性的有效度量。從基因表達(dá)譜的數(shù)據(jù)來(lái)源上進(jìn)行分類(lèi),常用于基因共表達(dá)網(wǎng)絡(luò)構(gòu)建的表達(dá)譜數(shù)據(jù)主要將劃定為兩類(lèi):一類(lèi)是基因芯片(microarray)數(shù)據(jù),另一類(lèi)是RNA-seq數(shù)據(jù)。基因的表達(dá)譜數(shù)據(jù)可以用一個(gè)n*m的矩陣X=[xij]來(lái)表示,數(shù)學(xué)表述如公式(1)所示。其中,第i行數(shù)據(jù)xi (i = 1,…,n)對(duì)應(yīng)一個(gè)基因的表達(dá)譜,矩陣中的列則能夠反映在不同樣本或者時(shí)間點(diǎn)下該基因的表達(dá)水平。

因相似性度量方法

在基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建和分析中,經(jīng)常需要對(duì)兩個(gè)基因進(jìn)行表達(dá)相似性度量?;蜷g的相似性有多種度量方式,若從計(jì)算方法上進(jìn)行分類(lèi),主要可以分為基于表達(dá)譜的相似性度量和基于拓?fù)浣Y(jié)構(gòu)的相似性度量。具體地,基于基因表達(dá)譜的相似性度量指標(biāo)主要通過(guò)計(jì)算不同基因表達(dá)譜的線性或非線性相關(guān)系數(shù)而最終得到。其中,常見(jiàn)的線性相關(guān)性指標(biāo)主要有皮爾森相關(guān)系數(shù)(Pearson Correlation Coefficient, Pcc)、斯皮爾曼相關(guān)系數(shù)(Spearman Correlation Coefficient),以及排除其他變量影響的偏相關(guān)系數(shù)(Partial Correlation Coefficient)等。而非線性相關(guān)性指標(biāo)則可列舉實(shí)例,諸如互信息(Mutual Information, MI)等。在基因模塊識(shí)別的過(guò)程中,有些研究者又利用網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)對(duì)基因相似性實(shí)現(xiàn)了進(jìn)一步的度量。

1.3閾值選取方法

設(shè)定合理的閾值,將具有潛在生物功能的邊保留下來(lái),是基因共表達(dá)網(wǎng)絡(luò)構(gòu)建的重點(diǎn)及關(guān)鍵。以計(jì)算方法為依據(jù),大致可以分為以下幾類(lèi):基于人工設(shè)定的閾值選取方法、基于統(tǒng)計(jì)顯著水平的閾值選取方法、基于對(duì)照試驗(yàn)的閾值選取方法、基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的閾值選取方法以及基于多種方法綜合的閾值選取方法等。在此,即對(duì)各類(lèi)方法做以詳細(xì)的探討與分析。

首先,基于人工設(shè)定的閾值選取方法是最簡(jiǎn)單、也是應(yīng)用最廣的方法。其中有兩類(lèi)模型使用最為廣泛:

(1)選取固定的閾值t,將相似性大于閾值t的基因?qū)ΡA粝聛?lái),例如Tom C Freeman[4]等人的文章中就采取了這種策略。

(2)將所有基因?qū)Π凑障嗨菩韵禂?shù)進(jìn)行排序,選擇前百分之x(例如前1%)的基因?qū)M(jìn)行保留,Ala等人[5]選取前0.5%作為閾值,構(gòu)建保守的共表達(dá)網(wǎng)絡(luò)。但這種方法最大的缺點(diǎn)在于其具有的武斷性,而并未考慮到生物網(wǎng)絡(luò)本身的特性,也沒(méi)有驗(yàn)證其生物統(tǒng)計(jì)顯著水平。對(duì)應(yīng)地,基于統(tǒng)計(jì)顯著水平的閾值選取方法往往通過(guò)與隨機(jī)網(wǎng)絡(luò)進(jìn)行比對(duì),得到不同閾值下的顯著性水平,由此而進(jìn)行閾值選擇。并且,顯著性水平往往多采用p值(p-value)、q值(q-value)等來(lái)衡量。然而這種方法卻無(wú)法保留那些相似性系數(shù)較低、但卻具有生物意義的邊。

其次,基于對(duì)照試驗(yàn)的閾值選取方法解決了計(jì)算方法帶來(lái)的隨機(jī)性。這種方法在基因芯片的實(shí)驗(yàn)階段,通過(guò)在基因芯片中引入與目標(biāo)物種親緣關(guān)系較遠(yuǎn)的物種基因而形成對(duì)照組。理論上,對(duì)照組的基因由于未與任何RNA雜交而不曾產(chǎn)生任何信號(hào),但是現(xiàn)實(shí)中隨機(jī)雜交的情況卻使得對(duì)照組將產(chǎn)生一定的噪音信號(hào)。而且,這種噪聲信號(hào)可以作為參考,用于輔助目標(biāo)網(wǎng)絡(luò)的閾值選擇。Voy等人[6]證明了利用這種方法保留下的邊具有顯著的生物統(tǒng)計(jì)意義。但是,該種方法卻增加了實(shí)驗(yàn)成本,并且結(jié)果將十分依賴(lài)所選擇的對(duì)照樣本。

再有,基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的閾值選取方法考慮到了基因共表達(dá)網(wǎng)絡(luò)所具有的特性,如無(wú)標(biāo)度(scale-free)以及小世界(small world),并通過(guò)優(yōu)化閾值的方法,使得網(wǎng)絡(luò)的某些拓?fù)涮匦缘靡悦黠@體現(xiàn)。Horvath等人[7]即提出了一種“軟”閾值選取方法,利用網(wǎng)絡(luò)達(dá)到無(wú)標(biāo)度的拓?fù)浣Y(jié)構(gòu)而以此來(lái)確定閾值。Elo等人在文獻(xiàn)[8]中則提出了一種基于聚集系數(shù)(Clustering Coefficient)的閾值選擇策略。由于基因共表達(dá)網(wǎng)絡(luò)具有小世界的特性,因此往往比隨機(jī)網(wǎng)絡(luò)具有更高的聚集系數(shù)。作者利用這種特點(diǎn),將閾值選擇的問(wèn)題轉(zhuǎn)化為具體的關(guān)于聚集系數(shù)C*的優(yōu)化問(wèn)題。Borate等人又在文章[9]中將基于最大團(tuán)和基于譜圖理論的閾值選擇方法等進(jìn)行了對(duì)比研究。當(dāng)閾值從高到低下降時(shí),網(wǎng)絡(luò)中的最大團(tuán)的數(shù)目是指數(shù)增長(zhǎng)的。根據(jù)這一原理,基于最大團(tuán)的方法在最大團(tuán)的數(shù)目隨閾值變化的趨勢(shì)線中將選擇一個(gè)關(guān)鍵拐點(diǎn)作為閾值。該選取拐點(diǎn)往往是最大團(tuán)的數(shù)目突然增加2倍或者3倍時(shí)的閾值點(diǎn)。而與此類(lèi)似,利用譜圖理論的閾值選擇方是基于網(wǎng)絡(luò)的拉普拉斯矩陣的特征值和特征向量,來(lái)發(fā)現(xiàn)網(wǎng)絡(luò)的基因模塊,并會(huì)選擇一個(gè)模塊劃分最優(yōu)時(shí)的閾值。

最后,基于多種方法綜合的閾值選取方法通常是融合了上述方法的優(yōu)點(diǎn),從而用多種指標(biāo)來(lái)選取閾值。例如,Langston等人[10]利用了本體距離、統(tǒng)計(jì)顯著性以及多種圖的拓?fù)涮匦詠?lái)進(jìn)行閾值選擇。

2基因共表達(dá)網(wǎng)絡(luò)的拓?fù)浞治龇椒?/p>

生物網(wǎng)絡(luò)的快速發(fā)展表明分子網(wǎng)絡(luò)遵從著某些普適性的規(guī)則[1]。這些規(guī)則通常會(huì)在網(wǎng)絡(luò)的拓?fù)涮匦灾械玫较鄳?yīng)體現(xiàn)。因此,對(duì)有關(guān)基因共表達(dá)網(wǎng)絡(luò)的拓?fù)湔归_(kāi)分析即是從系統(tǒng)層面了解基因共表達(dá)關(guān)系的重要工具。根據(jù)度量拓?fù)浣Y(jié)構(gòu)中的基因個(gè)數(shù)的不同,可以將拓?fù)浞治龇椒ù笾路譃閮深?lèi),也就是:全局網(wǎng)絡(luò)拓?fù)浞治龊途W(wǎng)絡(luò)中心性分析。

在研究進(jìn)展中,為了從全局角度刻畫(huà)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),一些學(xué)者即利用圖論的的方法定義了許多衡量網(wǎng)絡(luò)全局性拓?fù)浣Y(jié)構(gòu)的度量指標(biāo),常見(jiàn)的主要包括平均度(average degree)和度分布(degree distribution)、聚集系數(shù)(clustering coefficient)、平均路長(zhǎng)(average path length)、直徑(diameter)等。這些全局性的度量指標(biāo)能夠很好地反應(yīng)出基因共表達(dá)網(wǎng)絡(luò)的三種全局拓?fù)涮匦?,分別是:無(wú)標(biāo)度分布(scale-free distribution)、小世界特性(small world property)、功能模塊網(wǎng)絡(luò)(functional modular network)。另外,基因共表達(dá)網(wǎng)絡(luò)中不同節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要性是不同的,通常用中心性(Centrality)來(lái)度量網(wǎng)絡(luò)節(jié)點(diǎn)的地位。中心性往往體現(xiàn)在網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)上,度很高的節(jié)點(diǎn)或者是起著關(guān)鍵連接作用的節(jié)點(diǎn)都可能在某些生物途徑中發(fā)揮著重要的作用,因此人們往往根據(jù)所研究問(wèn)題的不同來(lái)定義節(jié)點(diǎn)的中心性。具體地,較為常用的中心性度量指標(biāo)主要有度中心性(degree centrality)、親近中心性(closeness centrality)、居間中心性(betweenness centrality)、特征向量中心性(eigenvector centrality)等。

CentiBiN[11]就是一款專(zhuān)門(mén)用于生物網(wǎng)絡(luò)中心性的計(jì)算和可視化軟件,其中集成了17種無(wú)向圖的中心性度量方法(針對(duì)有向圖則匯總了15種中心性度量方法),并且可以計(jì)算網(wǎng)絡(luò)直徑、平均路長(zhǎng)等全局性網(wǎng)絡(luò)拓?fù)渲笜?biāo)。另外,諸如Cytoscape[12]、Pajek[13]、Visone[14]、VisANT[15]等復(fù)雜網(wǎng)絡(luò)分析和可視化軟件工具,雖然不是專(zhuān)門(mén)為了計(jì)算網(wǎng)絡(luò)拓?fù)涮匦远a(chǎn)生的,但對(duì)于常用的網(wǎng)絡(luò)拓?fù)涮匦苑治鰠s都能提供良好的支持。

3基因共表達(dá)網(wǎng)絡(luò)的模塊分析

3.1 基因模塊識(shí)別

基因功能模塊識(shí)別是基因共表達(dá)網(wǎng)絡(luò)分析中的最重要方法之一。研究證明,在基因共表達(dá)網(wǎng)絡(luò)中致密的連通子圖往往具有特定的生物學(xué)功能。基因共表達(dá)網(wǎng)絡(luò)模塊識(shí)別算法大多來(lái)源于對(duì)蛋白質(zhì)相互作用網(wǎng)絡(luò)的研究中。Junzhong Ji等人[16]對(duì)蛋白質(zhì)網(wǎng)絡(luò)中的模塊識(shí)別方法即做了詳細(xì)的綜述。在本文中,僅對(duì)目前常用于基因模塊識(shí)別的四種典型算法進(jìn)行了深入分析,如基于層次的模塊識(shí)別方法(WGCNA[7])、基于密度的模塊識(shí)別方法(MCODE[17])、基于流模擬的模塊識(shí)別方法(MCL[18])以及基于劃分的模塊識(shí)別方法(Qcut[19])。下面依然對(duì)其展開(kāi)綜合性論述。

首先,WGCNA[7](Weighted Gene Co-expression Network Analysis)是以基于相關(guān)系數(shù)構(gòu)建基因共表達(dá)網(wǎng)絡(luò)的代表性方法,其中集成了多種網(wǎng)絡(luò)分析方法,主要具有網(wǎng)絡(luò)構(gòu)建、功能模塊探測(cè)、基因選擇、拓?fù)涮匦杂?jì)算、數(shù)據(jù)模擬、可視化以及與其他軟件交互等功能。WGCNA使用了基于拓?fù)浣Y(jié)構(gòu)交疊的度量指標(biāo),利用無(wú)先驗(yàn)知識(shí)的聚類(lèi)策略來(lái)探測(cè)基因的功能模塊,實(shí)際默認(rèn)使用的則是層次聚類(lèi)方法——hclust[20]。層次聚類(lèi)得到的系統(tǒng)樹(shù)圖的分支對(duì)應(yīng)著可能的功能模塊,并且可以使用多種剪枝的方法如固定高度的剪枝方法或者兩種動(dòng)態(tài)剪枝方法[21]來(lái)確定功能模塊。作為多種生物網(wǎng)絡(luò)構(gòu)建的代表性方法,WGCNA現(xiàn)已成功地應(yīng)用到多種研究的開(kāi)展和實(shí)現(xiàn)當(dāng)中。

其次,MCODE[17](Molecular Complex Detection)算法是一種基于圖論(或網(wǎng)絡(luò)密度)的網(wǎng)絡(luò)模塊發(fā)現(xiàn)算法。算法共分為三個(gè)步驟:網(wǎng)絡(luò)節(jié)點(diǎn)加權(quán)、模塊預(yù)測(cè)以及模塊優(yōu)化處理。分別來(lái)說(shuō),網(wǎng)絡(luò)節(jié)點(diǎn)加權(quán)是指根據(jù)節(jié)點(diǎn)所在的、最高的k-core的密度來(lái)為網(wǎng)絡(luò)中的所有節(jié)點(diǎn)賦予一個(gè)權(quán)值。在第二步模塊的預(yù)測(cè)中,首先選取一個(gè)具有最高權(quán)值的節(jié)點(diǎn)作為種子節(jié)點(diǎn),而后依次向外擴(kuò)增,再將那些權(quán)值在閾值VWP之上的周邊節(jié)點(diǎn)依次納入模塊中,直到?jīng)]有節(jié)點(diǎn)再可包含進(jìn)入該模塊為止。上述操作后,就將選擇剩余節(jié)點(diǎn)中權(quán)值最高的作為種子節(jié)點(diǎn)進(jìn)行同樣的操作。而在第三步的模塊優(yōu)化處理中,算法會(huì)將那些不包含2-core的模塊刪除。并且用戶(hù)可以指定是否進(jìn)行“fluff”和“haircut”操作來(lái)處理模塊邊緣節(jié)點(diǎn)。AllegroMCODE[22]是一款基于MCODE算法的Cytoscape[12]插件,可通過(guò)GPU進(jìn)行加速,多將用于高效地挖掘基因模塊。

3.2 模塊的功能分析方法及工具

為了發(fā)現(xiàn)基因模塊的功能,往往需要對(duì)基因模塊進(jìn)行模塊富集分析(Modular enrichment analysis, MEA)[23]。模塊富集分析多數(shù)時(shí)候是通過(guò)計(jì)算基因本體注釋數(shù)據(jù)庫(kù)[24](Gene Ontology, GO )或通路注釋數(shù)據(jù)庫(kù)(如KEGG[25])中的術(shù)語(yǔ)(term)在每個(gè)模塊上的富集程度,再根據(jù)假設(shè)檢驗(yàn)中的p值(p-value)來(lái)衡量富集到模塊上的功能的顯著性。計(jì)算p值的經(jīng)典統(tǒng)計(jì)檢驗(yàn)方法主要包括卡方檢驗(yàn)(Chi-square test)、Fisher精確檢驗(yàn)(Fisher's exact test)、累計(jì)超幾何檢驗(yàn)(cumulative hypergeometric test)等。模塊富集分析不僅繼承了單一富集分析(singular enrichment analysis, SEA)的一些特點(diǎn)(如在預(yù)選感興趣的基因集后,再計(jì)算各基因與注釋數(shù)據(jù)庫(kù)中的術(shù)語(yǔ)的富集得分),而且模塊富集分析在計(jì)算p值時(shí)還考慮到了模塊基因-基因之間的關(guān)系以及對(duì)應(yīng)的術(shù)語(yǔ)-術(shù)語(yǔ)關(guān)系。這種術(shù)語(yǔ)-術(shù)語(yǔ)間關(guān)系的著重關(guān)注將可提高功能富集的敏感性和準(zhǔn)確度。常見(jiàn)的能夠基于GO進(jìn)行模塊功能富集工具可概略給出為:GO::TermFinder[26]、Ontologizer[27]、 topGO[28]、 GENECODIS[29]、 ADGO[30]、GoToolBox[31]、DAVID[32]等。

4 結(jié)束語(yǔ)

基因共表達(dá)網(wǎng)絡(luò)的分析方法已成為高通量生物數(shù)據(jù)分析強(qiáng)有力的工具,并已經(jīng)廣泛應(yīng)用于生物學(xué)研究中。但是目前的構(gòu)建和分析方法還存在著一些不足,例如基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建方法繁多,時(shí)下還缺乏可靠的評(píng)價(jià)系統(tǒng);模塊功能富集方法對(duì)連接度較低的節(jié)點(diǎn)的識(shí)別能力還有待進(jìn)一步提高等。因此總地來(lái)說(shuō),對(duì)于基因共表達(dá)網(wǎng)絡(luò)的構(gòu)建和分析也依然是目前一項(xiàng)頗具挑戰(zhàn)性的研究工作。

參考文獻(xiàn):

[1] BARAbASI A L,OLTVAI Z N. Network biology: understanding the cell's functional organization[J]. Nature Reviews Genetics, 2004,5(2): 101-113.

[2] RAVASZ E, et al. Hierarchical organization of modularity in metabolic networks[J]. science, 2002, 297(5586):1551-1555.

[3] YIP A M, HORVATH S. Gene network interconnectedness and the generalized topological overlap measure[J]. BMC bioinformatics, 2007,8(1): 22.

[4] FREEMAN T C, et al. Construction, visualisation, and clustering of transcription networks from microarray expression data[J]. PLoS computational biology, 2007, 3(10): e206.

[5] ALA U, et al. Prediction of human disease genes by human-mouse conserved coexpression analysis[J]. PLoS computational biology, 2008, 4(3): e1000043.

[6] VOY B H, et al. Extracting gene networks for low-dose radiation using graph theoretical algorithms[J]. PLoS computational biology, 2006, 2(7): e89.

[7] LANGFELDER P, HORVATH S. WGCNA: an R package for weighted correlation network analysis[J]. BMC bioinformatics, 2008, 9(1): 559.

[8] ELO L L, et al. Systematic construction of gene coexpression networks with applications to human T helper cell differentiation process[J]. Bioinformatics, 2007, 23(16): 2096-2103.

[9] BORATE B R. Comparative Analysis of Thresholding Algorithms for Microarray-derived Gene Correlation Matrices, 2008.

[10] LANGSTON M A, et al. Innovative computational methods for transcriptomic data analysis: A case study in the use of FPT for practical algorithm design and implementation[J]. The Computer Journal, 2008, 51(1): 26-38.

[11] KOSCHUTZKI D. CentiBiN Version 1.4. 2, in, 2006,CentiBiN Version, 2006,1(2): 2004-2006.

[12] SHANNON P, et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks[J]. Genome research, 2003, 13(11): 2498-2504.

[13] BATAGELJ V, MRVAR A. Pajek-program for large network analysis[J]. Connections, 1998, 21(2): 47-57.

[14] BAUR M, et al. Visone Software for visual social network analysis. in Graph Drawing. Springer,2002.

[15] HU Z, et al. VisANT: data-integrating visual framework for biological networks and modules[J]. Nucleic acids research, 2005, 33(suppl 2): W352-W357.

[16] JI J, et al. Survey: Functional module detection from protein-protein interaction networks. Knowledge and Data Engineering[J]. IEEE Transactions on, 2014, 26(2): 261-277.

[17] BADER G D, HOGUE C W. An automated method for finding molecular complexes in large protein interaction networks[J]. BMC Bioinformatics, 2003, 4: 2.

[18] HWANG W, et al. A novel functional module detection algorithm for protein-protein interaction networks[J]. Algorithms for Molecular Biology, 2006, 1(24).

[19] RUAN J, ZHANG W. Identifying network communities with a high resolution[J]. Physical Review E, 2008, 77(1): 016104.

[20] Kaufman L, Rousseeuw P J. Finding groups in data: an introduction to cluster analysis. John Wiley & Sons,2009,34.

[21] LANGFELDER P, ZHANG B, HORVATH S. Defining clusters from a hierarchical cluster tree: the Dynamic Tree Cut package for R[J]. Bioinformatics, 2008, 24(5): 719-720.

[22] YOON J, JUNG W H. A GPU-accelerated bioinformatics application for large-scale protein interaction networks. APBC poster presentation, 2011.

[23] HUANG D W, SHERMAN B T, LEMPICKI R A. Bioinformatics enrichment tools: paths toward the comprehensive functional analysis of large gene lists[J]. Nucleic acids research, 2009, 37(1): 1-13.

[24] GO T. Gene Ontology: tool for the unification of biology[J]. AMERICA N, editor. Nature Genetic, 2000, 25: 25-29.

[25] KANEHISA M, GOTO S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic acids research, 2000, 28(1): 27-30.

[26] BOYLE E I, et al. GO:: TermFinder—open source software for accessing Gene Ontology information and finding significantly enriched Gene Ontology terms associated with a list of genes[J]. Bioinformatics, 2004, 20(18): 3710-3715.

[27] BAUER S, et al. Ontologizer 2.0—a multifunctional tool for GO term enrichment analysis and data exploration[J]. Bioinformatics, 2008, 24(14): 1650-1651.

[28] Alexa A, Rahnenfuhrer J. topGO: enrichment analysis for gene ontology. R package version 2.8, 2010.

[29] CARMONA-SAEZ P, et al., GENECODIS: a web-based tool for finding significant concurrent annotations in gene lists[J]. Genome biology, 2007, 8(1): R3.

[30] NAM D, et al. ADGO: analysis of differentially expressed gene sets using composite GO annotation[J]. Bioinformatics, 2006, 22(18): 2249-2253.

[31] MARTIN D, et al. GOToolBox: functional analysis of gene datasets based on Gene Ontology[J]. Genome biology, 2004, 5(12): R101.

[32] ALVORD G, et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists[J]. Genome Biol, 2007,8: R183.

河池市| 平邑县| 阳城县| 鹤壁市| 蓬莱市| 旺苍县| 双流县| 吉水县| 垣曲县| 中山市| 东至县| 中宁县| 娄底市| 肃北| 葫芦岛市| 成都市| 轮台县| 福建省| 天柱县| 措勤县| 磐石市| 宜黄县| 鹰潭市| 铜山县| 宝清县| 灵丘县| 渭源县| 嘉义市| 罗定市| 廉江市| 老河口市| 蓝山县| 论坛| 色达县| 额尔古纳市| 宜昌市| 五河县| 象州县| 芒康县| 通州区| 昔阳县|