趙 靜,林麗梅
?
基于分子網(wǎng)絡(luò)的疾病基因預(yù)測方法綜述
趙 靜,林麗梅
(陸軍勤務(wù)學(xué)院數(shù)學(xué)教研室 重慶沙坪壩區(qū) 401331)
疾病基因預(yù)測是揭示疾病作用機(jī)理、系統(tǒng)研究復(fù)雜疾病的關(guān)鍵環(huán)節(jié)。高通量生物實(shí)驗(yàn)技術(shù)的成熟,促進(jìn)了基于分子網(wǎng)絡(luò)的疾病基因預(yù)測方法的發(fā)展?;凇斑B接有罪”的生物學(xué)假設(shè),疾病基因預(yù)測算法在生物網(wǎng)絡(luò)中衡量候選基因與已知疾病基因的鄰近性或相似性,以預(yù)測潛在的致病基因。該文將疾病基因預(yù)測方法歸納為3種:基于已知疾病基因信息的預(yù)測方法、融合表型相似性信息的預(yù)測方法以及融合多結(jié)果的預(yù)測方法,并對(duì)這3種方法的研究現(xiàn)狀進(jìn)行了綜述,指出了現(xiàn)有研究成果的不足以及未來的研究方向。
疾病基因預(yù)測; 異構(gòu)網(wǎng)絡(luò); 分子網(wǎng)絡(luò); 表型相似性; 多結(jié)果融合
生物學(xué)研究的實(shí)用價(jià)值之一是應(yīng)用于醫(yī)學(xué)研究,造福人類健康。識(shí)別與疾病相關(guān)的基因,是復(fù)雜疾病病理學(xué)研究中的重要任務(wù)之一,它是進(jìn)行疾病預(yù)防、臨床治療和藥物設(shè)計(jì)的前期工程[1]。疾病基因預(yù)測實(shí)質(zhì)上是一個(gè)優(yōu)選問題,即在眾多潛在基因中優(yōu)選出最有可能與疾病關(guān)聯(lián)的基因。經(jīng)過科學(xué)家長期的努力,目前已獲得大量人類疾病的分子基礎(chǔ)方面的知識(shí),例如遺傳學(xué)方面的連鎖分析(linkage analysis)研究已識(shí)別了許多與疾病相關(guān)的染色體區(qū)域,有些染色體區(qū)域中的疾病基因已得到確認(rèn),但仍有許多區(qū)域上具體的致病基因是未知的[2-3]。這些染色體區(qū)域包含多達(dá)數(shù)百個(gè)基因,要用實(shí)驗(yàn)手段去確認(rèn)其上具體的致病基因,需要耗費(fèi)大量的人力、物力及時(shí)間。因此,采用計(jì)算方法預(yù)測區(qū)域內(nèi)的疾病基因,使得生物學(xué)家可以有選擇地進(jìn)行實(shí)驗(yàn)驗(yàn)證,就是很好的方法。
大量研究證實(shí),相同或相關(guān)疾病的致病基因,在功能上通常是相似或相關(guān)的[4-7]。這種相似或相關(guān)可能是物理意義上的直接結(jié)合或?qū)儆谕坏鞍讖?fù)合物,也可能是存在非直接的相互作用,例如參與相同的代謝通路或細(xì)胞過程,可以從多種視角進(jìn)行量化研究[8-10]。例如,利用蛋白質(zhì)組學(xué)信息探究基因間的相互作用[11]、利用基因表達(dá)數(shù)據(jù)衡量基因間共表達(dá)的程度[12-14]、從基因本體注釋即GO中挖掘基因間GO term的相似性[15-16]等,這些方法都可以識(shí)別功能上相似或相關(guān)的基因。尤其是,功能相似或相關(guān)的基因在分子網(wǎng)絡(luò)中的位置往往是相鄰或相近的,這使得開發(fā)基于分子網(wǎng)絡(luò)的疾病基因預(yù)測算法,成為近年來的熱點(diǎn)課題。這類方法主要基于“連接有罪”原則(guilt-by-association)[17-18],即在分子網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)中,尋找與已知疾病基因相鄰、相近、或相似的基因,將其預(yù)測為疾病基因。
本文將從數(shù)據(jù)資源、計(jì)算方法、驗(yàn)證方法等方面,綜述基于分子網(wǎng)絡(luò)的疾病基因預(yù)測所取得的進(jìn)展,討論存在的問題及今后發(fā)展的方向。
本節(jié)介紹基于網(wǎng)絡(luò)的疾病基因預(yù)測算法所需要的基礎(chǔ)數(shù)據(jù),包括背景網(wǎng)絡(luò)、已知疾病基因和疾病表型相似性數(shù)據(jù)。
在分子網(wǎng)絡(luò)中進(jìn)行疾病基因預(yù)測,首先需要一個(gè)人類全基因組的蛋白-蛋白相互作用(PPI)網(wǎng)絡(luò)或基因關(guān)聯(lián)網(wǎng)絡(luò)作為背景網(wǎng)絡(luò)。目前,通過高通量生物學(xué)實(shí)驗(yàn)[19]、低通量生物學(xué)實(shí)驗(yàn)、文獻(xiàn)挖掘等多種方法已建立人類的多個(gè)PPI數(shù)據(jù)庫,如HPRD[20]、BioGrid[21]、BIND[22]、MINT[23]、IntAct[24]等。然而,現(xiàn)有的數(shù)據(jù)只是實(shí)際存在數(shù)據(jù)的冰山一角,覆蓋率太低,據(jù)估計(jì),經(jīng)實(shí)驗(yàn)證實(shí)的人類蛋白質(zhì)相互作用數(shù)據(jù)只占實(shí)際存在的相互作用數(shù)據(jù)量的0.3%[25];而且,高通量實(shí)驗(yàn)通常產(chǎn)生大量的假陽性和假陰性的數(shù)據(jù),造成大量的數(shù)據(jù)噪聲。為了解決現(xiàn)有數(shù)據(jù)覆蓋率低、準(zhǔn)確性差的問題,一些研究用計(jì)算方法融合不同來源的生物學(xué)數(shù)據(jù),推斷基因之間的關(guān)聯(lián)關(guān)系,這里的關(guān)聯(lián)關(guān)系既包括基因編碼的蛋白間物理上的相互作用、也包括它們功能上的相關(guān)性,并對(duì)其中每一對(duì)關(guān)聯(lián)關(guān)系賦予置信分,從而構(gòu)建了更大的加權(quán)基因關(guān)聯(lián)網(wǎng)絡(luò),如FLN[26]、String[27]、Humannet[28]、Fun-coup[29]、Hippie[30]等。這些無權(quán)的PPI網(wǎng)絡(luò)和加權(quán)的基因關(guān)聯(lián)網(wǎng)絡(luò)已被應(yīng)用于不同的研究中,作為疾病基因預(yù)測的背景網(wǎng)絡(luò)。
已知的疾病基因作為疾病基因預(yù)測的先驗(yàn)信息組成種子集,一般由5~30個(gè)基因組成。種子數(shù)目太少將導(dǎo)致信息量不足以預(yù)測出潛在的疾病基因,如果太多會(huì)導(dǎo)致網(wǎng)絡(luò)預(yù)測的生物信息異構(gòu)化而無法正確反應(yīng)實(shí)際的疾病信息[31]。
隨著生物信息技術(shù)的不斷發(fā)展,在科學(xué)家的努力下集成了多個(gè)疾病基因數(shù)據(jù)庫,如人類孟德爾遺傳在線數(shù)據(jù)庫[32](online mendelian inheritance in man, OMIM)、遺傳關(guān)聯(lián)數(shù)據(jù)庫[33](genetic association database, GAD)、癌基因組解剖項(xiàng)目[34](cancer genomeanatomy project, CGAP)、癌癥基因譜數(shù)據(jù)庫[35](cancer gene census,CGC)、DisGeNET[36]等。這些數(shù)據(jù)庫中的信息,可以作為疾病基因預(yù)測的先驗(yàn)信息,也可以用于構(gòu)造訓(xùn)練集評(píng)估算法優(yōu)劣。
研究表明,引起相同或相似疾病的基因在功能上相似且在染色體上彼此臨近,因而疾病之間的表型相似性會(huì)導(dǎo)致功能相關(guān)的基因在網(wǎng)絡(luò)上產(chǎn)生模塊化結(jié)構(gòu),形成由疾病相關(guān)基因構(gòu)成的疾病子圖[37]。因此,疾病之間的表型相似性信息將有助于疾病基因的預(yù)測,尤其對(duì)于一些缺少已知致病基因信息的疾病,可用該疾病的相似表型及其致病基因作為信息補(bǔ)充。
文獻(xiàn)[38]基于文本挖掘的方法率先總結(jié)疾病表型的相似性,他們采用醫(yī)學(xué)主題詞表(MeSH)對(duì)每一表型的臨床特征或性狀表現(xiàn)進(jìn)行描述,形成描述疾病的特征向量,再對(duì)表型間的特征向量求余弦值以量化表型間的相似性,建立了5080個(gè)不同疾病表型間相似性的數(shù)據(jù)庫,該數(shù)據(jù)庫可以從Minminer[39]網(wǎng)頁中在線下載。
本節(jié)將介紹僅利用已知疾病基因信息,在背景網(wǎng)絡(luò)中進(jìn)行疾病基因預(yù)測的算法。即這里的算法不考慮疾病相似性等其他信息。這類算法將疾病候選基因置于背景網(wǎng)絡(luò)中,根據(jù)候選基因與已知疾病基因在網(wǎng)絡(luò)位置上的拓?fù)潢P(guān)系,來預(yù)測候選基因是疾病基因的可能性。這種對(duì)候選基因進(jìn)行打分的機(jī)制模擬熱量傳播過程,將已知疾病基因看作初始熱源,熱量通過網(wǎng)絡(luò)中的邊進(jìn)行傳播,節(jié)點(diǎn)獲得的熱量越多,則越有可能與疾病相關(guān)。
局部預(yù)測算法只運(yùn)用局部的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)信息,篩選與已知致病基因距離最近、最相關(guān)的候選基因。
2.1.1 直接鄰居法
基于“連接有罪”的生物學(xué)假設(shè),直接鄰居法認(rèn)為與已知疾病基因在背景網(wǎng)絡(luò)上直接相連的基因,最有可能是潛在的疾病基因。一個(gè)候選基因與疾病的親疏關(guān)系,由其與已知疾病基因間的連邊總數(shù)或者邊權(quán)和決定,該數(shù)值越大則越有可能預(yù)測為致病基因。
文獻(xiàn)[40]利用直接鄰居法對(duì)OMIM中289種至少包含兩個(gè)以上致病基因的疾病進(jìn)行檢驗(yàn),這些疾病共有1003個(gè)不同的疾病基因。他們分別采用5個(gè)不同的PPI數(shù)據(jù)集作背景網(wǎng)絡(luò),對(duì)算法進(jìn)行驗(yàn)證,發(fā)現(xiàn)盡管不同數(shù)據(jù)集在預(yù)測準(zhǔn)確性上存在差異,但其預(yù)測表現(xiàn)均優(yōu)于隨機(jī)選擇。
文獻(xiàn)[26]利用樸素貝葉斯分類器融合了16組不同的基因功能相關(guān)數(shù)據(jù),構(gòu)建了一個(gè)具有21657個(gè)基因、22388609條邊的加權(quán)基因關(guān)聯(lián)網(wǎng)絡(luò)。他們以這個(gè)足夠稠密的網(wǎng)絡(luò)為背景網(wǎng)絡(luò),利用直接鄰居算法預(yù)測潛在的致病基因,即取候選基因與疾病的關(guān)聯(lián)得分為其與該疾病所有已知致病基因連邊的邊權(quán)和,取得了很好的預(yù)測效果。
2.1.2 最短路徑法
相比局部預(yù)測方法,全局預(yù)測算法在全局范圍內(nèi)運(yùn)用網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)分析候選基因與已知疾病基因的親疏關(guān)系。全局方法能夠擴(kuò)大候選基因的范圍以免遺漏那些連接度較低、位于網(wǎng)絡(luò)邊緣的節(jié)點(diǎn),提高準(zhǔn)確性[42]。運(yùn)用較廣的全局方法有擴(kuò)散核算法(diffusion kernel, DK)[43]、重啟的隨機(jī)游走(random walk with restart, RWR)[43]、網(wǎng)絡(luò)傳播算法(network propagation, NP)[44]、Katz指標(biāo)[45]等。
2.2.1 擴(kuò)散核算法[43]
網(wǎng)絡(luò)的擴(kuò)散核矩陣,是用懶惰的隨機(jī)游走(lazy random walk)[46]度量節(jié)點(diǎn)對(duì)在網(wǎng)絡(luò)中的鄰近程度,其定義為:
因此擴(kuò)散核矩陣的()元素代表懶惰的隨機(jī)漫步者從節(jié)點(diǎn)游走到節(jié)點(diǎn)的概率,也稱為這兩個(gè)節(jié)點(diǎn)間的擴(kuò)散核距離。
用擴(kuò)散核矩陣預(yù)測疾病基因時(shí),候選基因與疾病的關(guān)聯(lián)得分定義為其與所有疾病基因的核擴(kuò)散距離總和。由此可見,擴(kuò)散核方法實(shí)質(zhì)上是在網(wǎng)絡(luò)的擴(kuò)散核矩陣上使用的直接鄰居算法[47]。文獻(xiàn)[43]將核擴(kuò)散算法推廣至疾病基因預(yù)測領(lǐng)域,實(shí)驗(yàn)結(jié)果表明該算法在預(yù)測復(fù)雜疾病時(shí)效果顯著優(yōu)于直接鄰居法和最短路徑法。
2.2.2 重啟的隨機(jī)游走[43]
文獻(xiàn)[43]將RWR算法成功用于疾病基因預(yù)測,初始節(jié)點(diǎn)向量為由已知疾病基因組成的種子集,在第+1步時(shí),網(wǎng)絡(luò)節(jié)點(diǎn)的概率向量為:
RWR算法是Google搜索引擎的核心算法PageRank的擴(kuò)展應(yīng)用[49-50]。作為從全局衡量節(jié)點(diǎn)間相似性的指標(biāo),RWR在鏈路預(yù)測領(lǐng)域也發(fā)揮著重要作用[51-52]。
2.2.3 網(wǎng)絡(luò)傳播算法[44]
文獻(xiàn)[44]將網(wǎng)絡(luò)傳播算法用于疾病基因預(yù)測。該算法與RWR算法相似,它模擬信息在網(wǎng)絡(luò)中的傳播過程。信息從初始節(jié)點(diǎn)沿著網(wǎng)絡(luò)上的邊開始傳播,在每一時(shí)刻,節(jié)點(diǎn)不僅向鄰居節(jié)點(diǎn)傳播信息也收到來自其他鄰居節(jié)點(diǎn)的信息。當(dāng)信息流達(dá)到穩(wěn)態(tài)時(shí),各個(gè)節(jié)點(diǎn)所獲得的信息量便是其與初始節(jié)點(diǎn)的臨近性或相似性。其具體公式如下:
2.2.4 Katz指標(biāo)[45]
Katz指標(biāo)作為基于路徑的相似性指標(biāo),考慮了節(jié)點(diǎn)之間所有路徑數(shù)并對(duì)較短的路徑賦予更大的權(quán)重,從全局預(yù)測節(jié)點(diǎn)之間產(chǎn)生連邊的可能性。Katz指標(biāo)充分地考慮了網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特征,在鏈路預(yù)測領(lǐng)域取得了相當(dāng)?shù)男Ч鸞53-54]。其數(shù)學(xué)定義為:
2.2.5 DADA[57]
大多數(shù)基于網(wǎng)絡(luò)的疾病基因預(yù)測算法偏向于網(wǎng)絡(luò)中心節(jié)點(diǎn),連接度大的節(jié)點(diǎn)更容易被篩選為致病基因,而忽視了那些連接度較低的真正的疾病基因。為了減弱這種偏向性,抑制高連接度節(jié)點(diǎn)的虛假得分,文獻(xiàn)[57]提出3種數(shù)據(jù)調(diào)整策略對(duì)候選基因的原始網(wǎng)絡(luò)得分進(jìn)行調(diào)整。
策略1保持種子節(jié)點(diǎn)的度分布,計(jì)算原始得分的z-score:
類似地,策略2保持候選基因的度分布,計(jì)算原始得分的z-score。對(duì)每個(gè)候選基因隨機(jī)產(chǎn)生1 000組與其度分布一致的對(duì)照組,并計(jì)算對(duì)照組網(wǎng)絡(luò)得分的平均分和標(biāo)準(zhǔn)差,最后得到候選基因網(wǎng)絡(luò)得分的z-score,作為調(diào)整后的得分。
實(shí)驗(yàn)結(jié)果表明,總體上3種調(diào)整策略的表現(xiàn)相當(dāng)且均優(yōu)于重啟的隨機(jī)游走算法,但是會(huì)抑制高連接度基因的表現(xiàn)。因此文獻(xiàn)[57]進(jìn)一步提出3種組合策略,對(duì)數(shù)據(jù)調(diào)整后的排名和調(diào)整之前的排名進(jìn)行組合優(yōu)選。組合的中心思想是對(duì)連接度較低的基因采取數(shù)據(jù)調(diào)整后的排名,對(duì)大度節(jié)點(diǎn)采用調(diào)整前的排名。這3種組合策略分別基于候選基因的度分布、樂觀的優(yōu)選策略以及基于已知致病基因度分布。驗(yàn)證結(jié)果表明基于特征向量中心性進(jìn)行數(shù)據(jù)調(diào)整并且采取基于已知致病基因度分布的組合策略表現(xiàn)最好,其表現(xiàn)顯著優(yōu)于RWR[43]和NP[44]。
表型相似性與基因相似性之間存在一定程度的相關(guān)性[18,58-59]。在疾病基因預(yù)測中結(jié)合疾病的表型相似性,將有助于增強(qiáng)潛在疾病基因與預(yù)測疾病的關(guān)聯(lián),使得預(yù)測更為精準(zhǔn)。這類研究中,疾病表型間的相似性信息主要來自文獻(xiàn)[38]建立的表型相似分?jǐn)?shù)據(jù)庫,而疾病的表型相似性信息主要通過兩種方式運(yùn)用到疾病基因預(yù)測中。一種方式仍然以PPI網(wǎng)絡(luò)或基因關(guān)聯(lián)網(wǎng)絡(luò)為背景網(wǎng)絡(luò),直接將表型相似性信息結(jié)合到預(yù)測算法中。第二種方式是構(gòu)建一個(gè)包含基因-基因、基因-疾病、疾病-疾病3類關(guān)系的異構(gòu)網(wǎng)絡(luò)作為背景網(wǎng)絡(luò),在此網(wǎng)絡(luò)上分析候選基因與疾病的關(guān)聯(lián)關(guān)系。下文將詳細(xì)介紹基于這兩種方式的疾病基因預(yù)測方法。
這類方法中,種子集通常不僅包含已知的疾病基因,還包含與該疾病相似的其他疾病表型的疾病基因,這對(duì)于一些具有較少先驗(yàn)信息的疾病具有重要意義。
3.1.1 VAVIEN[60]
文獻(xiàn)[60]提出的VAVIEN算法利用候選基因與致病基因在網(wǎng)絡(luò)拓?fù)渖系慕Y(jié)構(gòu)相似性,來衡量候選基因與疾病的關(guān)聯(lián)性。詳細(xì)的預(yù)測步驟如下:
3.1.2 PRINCE[44]
PRINCE采用的表型數(shù)據(jù)仍然來源于Minminer數(shù)據(jù)庫。van Driel對(duì)不同數(shù)值的表型相似性的預(yù)測能力進(jìn)行了測試,發(fā)現(xiàn)當(dāng)相似值在[0,0.3]時(shí)信息量不足,而當(dāng)值落在[0.6,1]時(shí)表型間具有顯著的功能相似性。因此,PRINCE算法在融合表型相似性信息時(shí),用Logistic函數(shù)抑制相似性值較低的表型、保留具有顯著性的表型:
文獻(xiàn)[62]后續(xù)提出的ProSim算法是對(duì)PRINCE的進(jìn)一步改進(jìn)。ProSim在初始向量中不僅考慮了表型的相似性信息,也考慮了所有候選基因與已知致病基因在網(wǎng)絡(luò)中的鄰近性。
此類方法將PPI網(wǎng)絡(luò)(或基因關(guān)聯(lián)網(wǎng)絡(luò))、疾病與基因關(guān)聯(lián)的二部網(wǎng)絡(luò)、以及疾病表型相似性網(wǎng)絡(luò)整合在一起,構(gòu)建一個(gè)包含基因-基因、基因-疾病、疾病-疾病三類關(guān)系的異構(gòu)網(wǎng)絡(luò)(見圖1),以此網(wǎng)絡(luò)作為背景網(wǎng)絡(luò),分析候選基因與疾病的關(guān)聯(lián)關(guān)系。
圖1 異構(gòu)網(wǎng)絡(luò)
3.2.1 RWRH[63]
RWRH(random walk with restart on heterogeneous network)是在異構(gòu)的網(wǎng)絡(luò)中運(yùn)用RWR算法進(jìn)行全局預(yù)測,即將RWR的計(jì)算式(4)修改為:
RWRH是典型的基于異構(gòu)網(wǎng)絡(luò)整合表型相似性信息進(jìn)行疾病基因預(yù)測的方法。后續(xù)的RWRHN[64]是對(duì)RWRH的改進(jìn),其主要的創(chuàng)新點(diǎn)在于利用RWS[65]算法對(duì)背景蛋白質(zhì)網(wǎng)絡(luò)通過鏈路預(yù)測進(jìn)行重構(gòu),從而得到一個(gè)可信度更高的PPI網(wǎng)絡(luò);Singh-Blom等利用Katz算法在異構(gòu)網(wǎng)絡(luò)中游走,其與RWRH的主要區(qū)別在于只考慮有限路徑和異構(gòu)矩陣的歸一化方式不同[56];文獻(xiàn)[66]繼承和發(fā)展了Katz思想,提出HeteSim MultiPath (HSMP)方法在異構(gòu)網(wǎng)絡(luò)中衡量不同節(jié)點(diǎn)之間的相似性。值得注意的是基于異構(gòu)網(wǎng)絡(luò)的游走方法忽視了不同網(wǎng)絡(luò)量級(jí)上的差別以及信息的異構(gòu)性,對(duì)不同網(wǎng)絡(luò)的轉(zhuǎn)移概率矩陣采取統(tǒng)一處理的做法存在缺陷。漫步者能否成功地在不同網(wǎng)絡(luò)中順利游走且這種游走是否存在生物學(xué)意義有待進(jìn)一步解釋。
3.2.2 CIPHER[61]
如前所述,生物學(xué)網(wǎng)絡(luò)數(shù)據(jù)存在覆蓋率不足、準(zhǔn)確率低的缺點(diǎn),以這樣的數(shù)據(jù)為基礎(chǔ)進(jìn)行疾病基因預(yù)測等方面的研究,一定程度上會(huì)影響結(jié)果的準(zhǔn)確性。目前主要采取數(shù)據(jù)融合的方法克服這一困難,這類方法可分成兩種,一是對(duì)網(wǎng)絡(luò)的融合[67],即在實(shí)施預(yù)測之前將多種組學(xué)數(shù)據(jù)利用統(tǒng)計(jì)推斷、機(jī)器學(xué)習(xí)等方法融合為一個(gè)大網(wǎng)絡(luò),如FLN[26]、Hippie[30]、STRING[27]等,或者基于某個(gè)網(wǎng)絡(luò)進(jìn)行鏈路預(yù)測,以獲得更多的潛在連接,如Biomine[68]。另一種方法則是本節(jié)介紹的融合多個(gè)結(jié)果的方法,即首先按照疾病基因預(yù)測的流程,針對(duì)不同的數(shù)據(jù)源構(gòu)造不同的網(wǎng)絡(luò)分別進(jìn)行預(yù)測,最后將多種預(yù)測的結(jié)果利用統(tǒng)計(jì)學(xué)方法融合為最后結(jié)果。
由文獻(xiàn)[69]開發(fā)的Endeavour是在多結(jié)果融合方面最早的研究成果。Endeavour包括兩個(gè)工作階段,第一階段依據(jù)不同的數(shù)據(jù)源計(jì)算候選基因與致病基因之間的相似性得到候選基因的排序列表,第二階段針對(duì)多個(gè)候選基因的排序列表,通過維序列統(tǒng)計(jì)(NDOS)融合為一個(gè)最后的排序結(jié)果。盡管Endeavour相較之單個(gè)數(shù)據(jù)源的預(yù)測結(jié)果表現(xiàn)更好,但是仍然存在以下3個(gè)缺陷[70]:1) Endeavour對(duì)不同的數(shù)據(jù)源需要不同的衡量標(biāo)準(zhǔn),如果想添加新的數(shù)據(jù)源,工作量將會(huì)增大且繁瑣。2) 由于不同的數(shù)據(jù)源之間存在系統(tǒng)誤差和噪音,因此在第二階段融合多個(gè)排名時(shí)將難以衡量和消除這些誤差和噪音,可能會(huì)對(duì)預(yù)測結(jié)果產(chǎn)生不利影響。3) Endeavour采用局部方法測量基因間的拓?fù)渚嚯x,預(yù)測效果不如全局方法。因此,目前有很多新方法繼承和發(fā)展了Endeavour的思想,從結(jié)果融合這個(gè)方向進(jìn)行疾病基因預(yù)測。
與Endeavour每次對(duì)單個(gè)基因分別基于單一數(shù)據(jù)源進(jìn)行排名預(yù)測不同,DIR(data integration rank)同時(shí)利用多個(gè)數(shù)據(jù)源對(duì)某一基因進(jìn)行排名,只采用排名最好的名次作為該基因的最終排名,即只采用對(duì)某一基因而言信息量最大的數(shù)據(jù)源作為背景網(wǎng)絡(luò)。DIR的詳細(xì)步驟如下:
1) 分別基于單個(gè)背景網(wǎng)絡(luò),利用擴(kuò)散核計(jì)算基因?qū)Φ臄U(kuò)散核分?jǐn)?shù)。
DIR選擇擴(kuò)散核算法[43]計(jì)算基因間的相似性?;虻臄U(kuò)散核分?jǐn)?shù)越高,基因間的距離越近。
2) 基于基因?qū)Φ臄U(kuò)散核分?jǐn)?shù)計(jì)算相對(duì)重要性分值。
文獻(xiàn)[70]提出了一個(gè)新的排名融合策略DRS(discounted rating system)。DRS對(duì)Endeavour的兩個(gè)階段進(jìn)行改進(jìn),在第一階段采用RWR對(duì)以單個(gè)數(shù)據(jù)源為背景網(wǎng)絡(luò)的候選基因進(jìn)行排名,在第二個(gè)階段,基于DRS策略進(jìn)行排名融合。DRS采用了4種數(shù)據(jù)源:HPRD[20]和BioGRID[72]組成的PPI網(wǎng)絡(luò),以及GO數(shù)據(jù)庫的3個(gè)部分BP(biological process)、MF (molecular function)、CC(cellular component)分別構(gòu)成的3個(gè)獨(dú)立的子網(wǎng)絡(luò)。分別基于4個(gè)網(wǎng)絡(luò)利用RWR對(duì)候選基因打分,取前100個(gè)基因形成排名表。隨后利用DRS進(jìn)行排名融合,步驟如下:
1) 將排名表轉(zhuǎn)化為等級(jí)表
將排名靠前的100個(gè)候選基因等分成5個(gè)等級(jí),排名越前,等級(jí)越高。
2) 將等級(jí)表轉(zhuǎn)化為打折排名表:
3) 基于多個(gè)背景網(wǎng)絡(luò)融合打折排名:
本文簡單介紹疾病基因預(yù)測中常用的評(píng)價(jià)預(yù)測效果的方法,即留一交叉驗(yàn)證法(leave-one-out-cross-validation)、ROC曲線法、富集得分、以及模擬尋找疾病基因流程的方法。前兩種方法是計(jì)算機(jī)科學(xué)中常用的檢驗(yàn)算法優(yōu)劣的方法,后兩種方法是針對(duì)疾病基因預(yù)測這一特定問題的評(píng)價(jià)方法。
將數(shù)據(jù)源分為兩類,候選基因作為測試集,已知疾病基因組成訓(xùn)練集。每次從訓(xùn)練集中選取一個(gè)疾病基因作為目標(biāo)基因,將目標(biāo)基因放入候選基因中組成測試集,運(yùn)用算法對(duì)測試集中的每一個(gè)基因打分,驗(yàn)證算法是否能夠成功地預(yù)測目標(biāo)基因?yàn)橹虏』?。最后以目?biāo)基因的平均排名或者前5%或前1%作為衡量算法的預(yù)測能力的指標(biāo)。候選基因一般通過一條人為的連鎖區(qū)間產(chǎn)生,即在染色體區(qū)域選取距離目標(biāo)基因最近的100個(gè)基因作為候選基因[43]。除此之外,候選基因也可以根據(jù)不同的驗(yàn)證目而改變。例如,文獻(xiàn)[71]為了驗(yàn)證DIR算法的魯棒性,產(chǎn)生了另外兩組候選基因,分別是全網(wǎng)絡(luò)的基因和隨機(jī)產(chǎn)生的100個(gè)基因[71]。
1)如果真正的陽性數(shù)據(jù)預(yù)測為陽性,則稱之為真陽性數(shù)據(jù)(true positive, TP)
2)如果真正的陰性數(shù)據(jù)被預(yù)測為陰性,則稱之為真陰性數(shù)據(jù)(true negative, TN)
3)如果真正的陽性數(shù)據(jù)被預(yù)測為陰性,則稱之為假陰性數(shù)據(jù)(false negative, FN)
4)如果真正的陰性數(shù)據(jù)被預(yù)測為陽性,則稱之為假陽性數(shù)據(jù)(false positive, FP)
根據(jù)上述4種情況可以計(jì)算數(shù)據(jù)的真陽性與假陽性,ROC曲線代表著數(shù)據(jù)的假陽性與真陽性數(shù)據(jù)關(guān)系的曲線。AUC面積是ROC曲線下的面積,面積越大,算法的表現(xiàn)越好[74]。
大量研究表明,疾病基因預(yù)測傾向于那些已經(jīng)得到充分研究的基因,高估了預(yù)測算法的表現(xiàn)。由于一旦一個(gè)致病基因被確認(rèn),會(huì)引起更多科學(xué)工作者深入研究,造成針對(duì)該基因的信息較之其他潛在基因在基因預(yù)測中更具有優(yōu)勢。為了避免這種知識(shí)污染,公平客觀的評(píng)價(jià)算法的表現(xiàn),可以模擬發(fā)現(xiàn)該致病基因的流程,具體如下:首先在OMIM數(shù)據(jù)庫中人工地核對(duì)每個(gè)致病基因與該疾病產(chǎn)生關(guān)聯(lián)的時(shí)間節(jié)點(diǎn)。假如該致病基因是在2007年以后發(fā)現(xiàn)的,那么將2007年以前的疾病基因作為種子集,在2007年之前的OMIM數(shù)據(jù)庫中進(jìn)行疾病基因預(yù)測,驗(yàn)證是否能成功預(yù)測出2007年之后發(fā)現(xiàn)的疾病基因[75]。
目前,基于網(wǎng)絡(luò)的疾病基因預(yù)測方法取得了令人矚目的發(fā)展,日益受到生物醫(yī)學(xué)工作者的重視,產(chǎn)生了許多基于網(wǎng)絡(luò)的疾病基因預(yù)測的在線工具[76],如Suspects[77]、ToppGene[78]、GeneDistiller[79]、GeneWander[43]、Endeavour[69]等。使用這些工具,可縮小潛在疾病基因的范圍,較之傳統(tǒng)的實(shí)驗(yàn)方法,極大地解放了勞動(dòng)力,降低了實(shí)驗(yàn)耗費(fèi),減少了實(shí)驗(yàn)誤差和系統(tǒng)誤差。除此之外,疾病基因預(yù)測算法反過來可以作為在實(shí)驗(yàn)中觀測到的可疑基因結(jié)果的輔助證據(jù)。越來越多的預(yù)測方法,傾向于指導(dǎo)非專業(yè)人員,在無需太多統(tǒng)計(jì)、計(jì)算方面知識(shí)的前提下,運(yùn)用預(yù)測工具進(jìn)行預(yù)測活動(dòng)[80-81]。
[1] LAN W, WANG J, LI M, et al. Computational approaches for prioritizing candidate disease genes based on PPI networks[J]. Tsinghua Science and Technology, 2015, 20(5): 500-512.
[2] EASTON D, BISHOP D, FORD D, et al. Genetic linkage analysis in familial breast and ovarian cancer: Results from 214 families the breast cancer linkage consortium[J]. American Journal of Human Genetics, 1993, 52(4): 678.
[3] OTT J, WANG J, LEAL S M. Genetic linkage analysis in the age of whole-genome sequencing[J]. Nature Reviews Genetics, 2015, 16(5): 275-284.
[4] GOH K-I, CUSICK M E, VALLE D, et al. The human disease network[J]. Proceedings of the National Academy of Sciences, 2007, 104(21): 8685-8690.
[5] BRUNNER H G, VAN DRIEL M A. From syndrome families to functional genomics[J]. Nature Reviews Genetics, 2004, 5(7): 545-551.
[6] LAGE K, KARLBERG E O, ST?RLING Z M, et al. A human phenome-interactome network of protein complexes implicated in genetic disorders[J]. Nature Biotechnology, 2007, 25(3): 309-316.
[7] BARABáSI A-L, GULBAHCE N, LOSCALZO J. Network medicine: a network-based approach to human disease[J]. Nature Reviews Genetics, 2011, 12(1): 56-68.
[8] TIFFIN N, ANDRADE-NAVARRO M A, PEREZ-IRATXETA C. Linking genes to diseases: it's all in the data[J]. Genome Medicine, 2009, 1(8): 77.
[9] ANTANAVICIUTE A, DALY C, CRINNION L A, et al. GeneTIER: Prioritization of candidate disease genes using tissue-specific gene expression profiles[J]. Bioinformatics, 2015, 31(16): 2728-2735.
[10] CRUZ-MONTEAGUDO M, BORGES F, PAZ-Y-MI?O C, et al. Efficient and biologically relevant consensus strategy for Parkinson’s disease gene prioritization[J]. BMC Medical Genomics, 2016, 9(1): 12.
[11] RUAL J-F, VENKATESAN K, HAO T, et al. Towards a proteome-scale map of the human protein–protein interaction network[J]. Nature, 2005, 437(7062): 1173-1178.
[12] TEJERA E, BERNARDES J, REBELO I. Co-expression network analysis and genetic algorithms for gene prioritization in preeclampsia[J]. BMC Medical Genomics, 2013, 6(1): 51.
[13] CARTER S L, BRECHBüHLER C M, GRIFFIN M, et al. Gene co-expression network topology provides a framework for molecular characterization of cellular state[J]. Bioinformatics, 2004, 20(14): 2242-2250.
[14] NITSCH D, GON?ALVES J P, OJEDA F, et al. Candidate gene prioritization by network analysis of differential expression using machine learning approaches[J]. BMC Bioinformatics, 2010, 11(1): 460.
[15] LI M, LI Q, GANEGODA G U, et al. Prioritization of orphan disease-causing genes using topological feature and GO similarity between proteins in interaction networks[J]. Science China Life Sciences, 2014, 57(11):1064-1071.
[16] SCHLICKER A, LENGAUER T, ALBRECHT M. Improving disease gene prioritization using the semantic similarity of Gene Ontology terms[J]. Bioinformatics, 2010, 26(18): i561-i567.
[17] OLIVER S. Proteomics: Guilt-by-association goes global[J]. Nature, 2000, 403(6770): 601-603.
[18] OTIM, BRUNNER H G. The modular nature of genetic diseases[J]. Clinical Genetics, 2007, 71(1): 1-11.
[19] CAGNEY G, UETZ P, FIELDS S. High-throughput screening for protein-protein interactions using two-hybrid assay[J]. Methods in Enzymology, 2000, 328: 3-14.
[20] PRASAD T S K, GOEL R, KANDASAMY K, et al. Human protein reference database-2009 update[J]. Nucleic Acids Research, 2009, 37(suppl 1): D767-D772.
[21] CHATR-ARYAMONTRI A, BREITKREUTZ B-J, OUGHTRED R, et al. The BioGRID interaction database: 2015 update[J]. Nucleic Acids Research, 2015, 43(D1): D470-D478.
[22] BADER G D, BETEL D, HOGUE C W. BIND: the biomolecular interaction network database[J]. Nucleic Acids Research, 2003, 31(1): 248-250.
[23] LICATA L, BRIGANTI L, PELUSO D, et al. MINT, the molecular interaction database: 2012 update[J]. Nucleic Acids Research, 2012, 40(D1): D857-D861.
[24] KERRIEN S, ARANDA B, BREUZA L, et al. The IntAct molecular interaction database in 2012[J]. Nucleic Acids Research, 2011, 40(D1): D841-D846.
[25] AMARAL L A N. A truer measure of our ignorance[J]. Proceedings of the National Academy of Sciences, 2008, 105(19): 6795-6796.
[26] LINGHU B, SNITKIN E S, HU Z, et al. Genome-wide prioritization of disease genes and identification of disease-disease associations from an integrated human functional linkage network[J]. Genome Biology, 2009, 10(9): 91.
[27] SZKLARCZYK D, FRANCESCHINI A, WYDER S, et al. STRING v10: Protein–protein interaction networks, integrated over the tree of life[J]. Nucleic Acids Research, 2014, 43(D1): D447-D452.
[28] LEE I, BLOM U M, WANG P I, et al. Prioritizing candidate disease genes by network-based boosting of genome-wide association data[J]. Genome Research, 2011, 21(7): 1109-1121.
[29] SCHMITT T, OGRIS C, SONNHAMMER E L. FunCoup 30: Database of genome-wide functional coupling networks[J]. Nucleic Acids Research, 2014, 42(D1): D380-D388.
[30] SCHAEFER M H, FONTAINE J-F, VINAYAGAM A, et al. HIPPIE: Integrating protein interaction networks with experiment based quality scores[J]. PloS One, 2012, 7(2): e31826.
[31] MOREAU Y, TRANCHEVENT L-C. Computational tools for prioritizing candidate genes: Boosting disease gene discovery[J]. Nature Reviews Genetics, 2012, 13(8): 523-536.
[32] HAMOSH A, SCOTT A F, AMBERGER J S, et al. Online mendelian inheritance in man (OMIM), a knowledgebase of human genes and genetic disorders[J]. Nucleic Acids Research, 2005, 33(suppl 1): D514-D517.
[33] BECKER K G, BARNES K C, BRIGHT T J, et al. The genetic association database[J]. Nature Genetics, 2004, 36(5): 431-432.
[34] PENNISI E. Europe’s cancer genome anatomy project[J]. Science, 1997, 276(5315): 1024.
[35] FUTREAL P A, COIN L, MARSHALL M, et al. A census of human cancer genes[J]. Nature Reviews Cancer, 2004, 4(3): 177-183.
[36] BAUER-MEHREN A, RAUTSCHKA M, SANZ F, et al. DisGeNET: a cytoscape plugin to visualize, integrate, search and analyze gene-disease networks[J]. Bioinformatics, 2010, 26(22): 2924-2926.
[37] FREUDENBERG J, PROPPING P. A similarity-based method for genome-wide prediction of disease-relevant human genes[J]. Bioinformatics, 2002, 18(suppl 2): S110-S115.
[38] VAN DRIEL M A, BRUGGEMAN J, VRIEND G, et al. A text-mining analysis of the human phenome[J]. European Journal of Human Genetics, 2006, 14(5): 535-542.
[39] VAN DRIEL M A, BRUGGEMAN J, VRIEND G, et al. MimMiner:a online mendelian inheritance in man mining tool[DB/OL]. [2006-05-08]. http://wwwcmbirunl/MimMiner/supplhtml.
[40] OTIV M, SNEL B, HUYNEN M A, et al. Predicting disease genes using protein-protein interactions[J]. Journal of Medical Genetics, 2006, 43(8): 691-698.
[41] KRAUTHAMMER M, KAUFMANN C A, GILLIAM T C, et al. Molecular triangulation: Bridging linkage and molecular-network information for identifying candidate genes in Alzheimer's disease[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(42): 15148-15153.
[42] NAVLAKHA S, KINGSFORD C. The power of protein interaction networks for associating genes with diseases[J]. Bioinformatics, 2010, 26(8): 1057-1063.
[43] K?HLER S, BAUER S, HORN D, et al. Walking the interactome for prioritization of candidate disease genes[J]. The American Journal of Human Genetics, 2008, 82(4): 949-958.
[44] VANUNU O, MAGGER O, RUPPIN E, et al. Associating genes and protein complexes with disease via network propagation[J]. PLoS Comput Biol, 2010, 6(1): e1000641.
[45] KATZ L. A new status index derived from sociometric analysis[J]. Psychometrika, 1953, 18(1): 39-43.
[46] ZHANG S, NING X M, ZHANG X S. Graph kernels, hierarchical clustering, and network community structure: experiments and comparative analysis[J]. The European Physical Journal B-Condensed Matter and Complex Systems, 2007, 57(1): 67-74.
[47] FOUSS F, PIROTTE A, RENDERS J-M, et al. Random-walk computation of similarities between nodes of a graph with application to collaborative recommendation[J]. IEEE Transactions on Knowledge and Data Engineering, 2007, 19(3): 355-369.
[48] TAUCHEN G. Finite state markov-chain approximations to univariate and vector autoregressions[J]. Economics Letters, 1986, 20(2): 177-181.
[49] BRIN S, PAGE L. Reprint of: the anatomy of a large-scale hypertextual web search engine[J]. Computer Networks, 2012, 56(18): 3825-3833.
[50] 汪小帆, 李翔, 陳關(guān)榮.網(wǎng)絡(luò)科學(xué)導(dǎo)論[M].北京: 高等教育出版社, 2012.
WANG Xiao-fan, LI Xiang, CHEN Guan-rong. Network science: an introduction[M]. Beijing: Higher Education Press, 2012.
[51] LIU W, Lü L. Link prediction based on local random walk[J]. EPL (Europhysics Letters), 2010, 89(5): 58007.
[52] 呂琳媛, 周濤.鏈路預(yù)測[M].北京:高等教育出版社, 2013: 69-70.
Lü Lin-yuan, ZHOU Tao. Link Prediction[M]. Beijing:Higher Education Press, 2013: 69-70.
[53] Lü L, ZHOU T. Link prediction in complex networks: a survey[J]. Physica A: Statistical Mechanics and Its Applications, 2011, 390(6): 1150-1170.
[54] 呂琳媛.復(fù)雜網(wǎng)絡(luò)鏈路預(yù)測[J]. 電子科技大學(xué)學(xué)報(bào), 2010, 39(5): 651-661.
Lü Lin-yuan. Link prediction on complex networks[J]. Journal of University of Electronic Science and Technology of China, 2010, 39(5): 651-661.
[55] ZHAO J, YANG TH, HUANG Y, et al. Ranking candidate disease genes from gene expression and protein interaction: a Katz-centrality based approach[J]. PloS One, 2011, 6(9): e24306.
[56] SINGH-BLOM U M, NATARAJAN N, TEWARI A, et al. Prediction and validation of gene-disease associations using methods inspired by social network analyses[J]. PloS One, 2013, 8(5): e58977.
[57] ERTEN S, BEBEK G, EWING R M, et al. DADA: Degree-aware algorithms for network-based disease gene prioritization[J]. BioData Mining, 2011, 4(1): 19.
[58] WAGNER G P, PAVLICEV M, CHEVERUD J M. The road to modularity[J]. Nature Reviews Genetics, 2007, 8(12): 921-931.
[59] OTI M, HUYNEN M A, BRUNNER H G. Phenome connections[J]. Trends in Genetics, 2008, 24(3): 103-106.
[60] ERTEN S, BEBEK G, KOYUTüRK M. Vavien: an algorithm for prioritizing candidate disease genes based on topological similarity of proteins in interaction networks[J]. Journal of Computational Biology, 2011, 18(11): 1561- 1574.
[61] WU X, JIANG R, ZHANG M Q, et al. Network-based global inference of human disease genes[J]. Molecular Systems Biology, 2008, 4(1): 189.
[62] GANEGODA G U, SHENG Y, WANG J. ProSim: amethod for prioritizing disease genes based on protein proximity and disease similarity[J]. BioMed Research International, 2015(5):213750.
[63] LI Y, PATRA J C. Genome-wide inferring gene- phenotype relationship by walking on the heterogeneous network[J]. Bioinformatics, 2010, 26(9): 1219-1224.
[64] LUO J, LIANG S. Prioritization of potential candidate disease genes by topological similarity of protein-protein interaction network and phenotype data[J]. Journal of Biomedical Informatics, 2015, 53: 229-236.
[65] LEI C, RUAN J. A novel link prediction algorithm for reconstructing protein-protein interaction networks by topological similarity[J]. Bioinformatics, 2013, 29(3): 355-364.
[66] ZENG X, LIAO Y, ZOU Q. Prediction and validation of disease genes using HeteSim scores[J]. IEEE/ACM Transactions on Computational Bilolgy and Bioinformatics, 2017, 14(3): 687-695.
[67] BERSANELLI M, MOSCA E, REMONDINI D, et al. Methods for the integration of multi-omics data: Mathematical aspects[J]. BMC Bioinformatics, 2016, 17(2): 167.
[68] ERONEN L, TOIVONEN H. Biomine: Predicting links between biological entities using network models of heterogeneous databases[J]. BMC Bioinformatics, 2012, 13(1): 119.
[69] AERTS S, LAMBRECHTS D, MAITY S, et al. Gene prioritization through genomic data fusion[J]. Nature Biotechnology, 2006, 24(5): 537-544.
[70] LI Y, PATRA J C. Integration of multiple data sources to prioritize candidate genes using discounted rating system[J]. BMC Bioinformatics, 2010, 11(1): S20.
[71] CHEN Y, WANG W, ZHOU Y, et al. In silico gene prioritization by integrating multiple data sources[J]. PloS One, 2011, 6(6): e21137.
[72] STARK C, BREITKREUTZ B-J, CHATR-ARYAMONTRI A, et al. The BioGRID interaction database: 2011 update[J]. Nucleic Acids Research, 2011, 39(suppl 1): D698-D704.
[73] ZOU Q, LI J, WANG C, et al. Approaches for recognizing disease genes based on network[J]. BioMed Research International,2014(5013): 416323.
[74] FAWCETT T. An introduction to ROC analysis[J]. Pattern Recognition Letters, 2006, 27(8): 861-874.
[75] B?RNIGEN D, TRANCHEVENT L-C, BONACHELA-CAPDEVILA F, et al. An unbiased evaluation of gene prioritization tools[J]. Bioinformatics, 2012, 28(23): 3081-3088.
[76] TRANCHEVENT L-C, CAPDEVILA F B, NITSCH D, et al. A guide to web tools to prioritize candidate genes[J]. Briefings in Bioinformatics, 2011, 12(1): 22-32.
[77] ADIE E A, ADAMS R R, EVANS K L, et al. SUSPECTS: Enabling fast and effective prioritization of positional candidates[J]. Bioinformatics, 2006, 22(6): 773-774.
[78] CHEN J, XU H, ARONOW B J, et al. Improved human disease candidate gene prioritization using mouse phenotype[J]. BMC Bioinformatics, 2007, 8(1): 392.
[79] SEELOW D, SCHWARZ J M, SCHUELKE M. GeneDistiller—distilling candidate genes from linkage intervals[J]. PLoS One, 2008, 3(12): e3874.
[80] CASCI T. Human disease: Something old, something new[J]. Nature Reviews Genetics, 2011, 12(6): 382-383.
[81] HUANG D W, SHERMAN B T, LEMPICKI R. A systematic and integrative analysis of large gene lists using DAVID bioinformatics resources[J]. Nature Protocols, 2009, 4(1): 44-57.
[82] WANG X, GULBAHCE N, YU H. Network-based methods for human disease gene prediction[J]. Briefings in Functional Genomics, 2011, 10(5): 280-293.
編 輯 蔣 曉
A Survey of Disease Gene Prediction Methods Based on Molecular Networks
ZHAO Jing and LIN Li-mei
(Department of Mathematics, Army Logistics University of PLA Shapingba Chongqing 401331)
The identification of disease genes is the crucial step in uncovering disease pathology and systematically analyzing polygenetic disease. The high-throughput technology has advanced the development of network-based approaches for disease gene prediction. Based on the “guilt-by-association” principle, now disease gene prioritization methods can measure the proximity between candidate genes and causal genes so as to pinpoint the potential disease genes. In this review, we first classify the network-based approaches for disease gene prediction into three categories: the approach based on disease genes information, the approach integrated with phenotype similarity and the approach that integrates several results from multiple data resources into one final result. Then we bring out the current situation of these approaches and summarize the current achievements and existing problems. Finally we put forward some suggestions for future research.
disease gene prediction; heterogeneous network; molecular networks; phenotype similarity; result integration
TP301.6; O29
A
10.3969/j.issn.1001-0548.2017.05.019
2016-11-01;
2017-05-08
國家自然科學(xué)基金(61372194,81260672);重慶市研究生教改項(xiàng)目(yjg152017)
趙靜(1965-),女,教授,主要從事生物醫(yī)藥及藥理學(xué)領(lǐng)域的復(fù)雜網(wǎng)絡(luò)方面的研究.