国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于XG-B00ST和多數(shù)據(jù)源的藥物重定位預(yù)測(cè)

2020-05-25 02:30李苗苗
軟件導(dǎo)刊 2020年2期

李苗苗

摘 要:新藥物研發(fā)時(shí)間長(zhǎng)、成本高,但成功率低,為了提高收益比,藥物重定位即舊藥新用受到了廣泛關(guān)注。從臨床和實(shí)驗(yàn)角度鑒定藥物的新用途需要耗費(fèi)大量人力和物力,從計(jì)算角度預(yù)測(cè)藥物新用途成為研究熱點(diǎn);并且,隨著藥物和疾病相關(guān)的大量多層次組學(xué)數(shù)據(jù)積累,通過挖掘藥物相關(guān)數(shù)據(jù)鑒定藥物新用途成為可能。重點(diǎn)挖掘藥物化學(xué)結(jié)構(gòu)、藥理性質(zhì)、藥物靶蛋白功能、疾病表型等數(shù)據(jù)得到相應(yīng)特征,并將這些藥物疾病特征進(jìn)行整合,再將特征輸入XG-BOOST模型進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,該方法準(zhǔn)確率達(dá)87.9%,較邏輯回歸、隨機(jī)森林具有更高的預(yù)測(cè)精度。

關(guān)鍵詞:藥物重定位;XG-BOOST模型;預(yù)測(cè)精度

DOI:10. 11907/rjdk. 191526 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):

中圖分類號(hào):TP301文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2020)002-0110-04

英標(biāo):Drug Reposition Prediction Based on XG-BOOST and Multi-source Data

英作:LI Miao-miao

英單:(Business School, University of Shanghai for Science and Technology, Shanghai 200090, China)

Abstract: The development of new drugs is long and costly, but the success rate is low. Therefore, in order to improve the yield, drug relocation, that is, the new use of old drugs has received extensive attention. The clinical and experimental identification of new uses of drugs requires a lot of manpower and material resources, and predicting the new use of drugs from a computational perspective has become a research hotspot in recent years. On the other hand, in recent years, the rapid accumulation of a large number of multi-level omics data related to drug-related and disease has made it possible to identify new drug uses by mining drug-related data. In this paper, the characteristics of the chemical structure, pharmacological properties, drug target protein function, disease phenotype, etc. of the drug were obtained, and the characteristics of these drugs were integrated. Finally, the feature is input into the XG-BOOST model for prediction. The experimental results show that our method has higher prediction accuracy than logistic regression and random forest.

Key Words: drug reposition;XG-BOOST model;prediction accuracy

0 引言

藥物從最初的實(shí)驗(yàn)研究到最終批準(zhǔn)上市,整個(gè)階段需要13~15年,耗資20~30億美元[1]。而近兩年數(shù)據(jù)顯示,新藥研究數(shù)量與最終上市數(shù)量的比例還不到1%。因此越來越多的公司開始對(duì)現(xiàn)有的藥物分子進(jìn)行篩選,以期挖掘出藥物的新療效,這也就是人們常說的藥物重定位。與新藥研發(fā)相比,藥物重定位只需3~5年時(shí)間,藥代動(dòng)力學(xué)等不確定性顯著減小;并且,用于開展藥物重定位研究的藥物通常已經(jīng)通過了臨床試驗(yàn)的幾個(gè)階段或是已經(jīng)上市,這使得研發(fā)成本及風(fēng)險(xiǎn)明顯降低,周期縮短。因此,藥物重定位是目前解決新藥開發(fā)高投入低成功率問題的有效方法之一[2]。

隨著藥物重定位技術(shù)的不斷發(fā)展和成熟,成功的實(shí)例也越來越多。其中具有代表性的如阿司匹林,原來用于解熱鎮(zhèn)痛和抗風(fēng)濕,后來發(fā)現(xiàn)可以用于感冒、發(fā)熱、頭痛、牙痛、關(guān)節(jié)痛、風(fēng)濕痛心肌梗死以及預(yù)防術(shù)后血栓的形成[3]。再如沙利度胺,原來用作鎮(zhèn)靜劑,后來發(fā)現(xiàn)能夠?qū)盒?、失眠、孕吐產(chǎn)生作用。而近期研究表明,它可能適用于麻風(fēng)病,多發(fā)性骨髓瘤,中到重度麻風(fēng)結(jié)節(jié)性紅斑以及Ⅱ型糖尿病[4]。盡管藥物重定位蘊(yùn)含著巨大潛力,但是藥物新療效的發(fā)現(xiàn)并不容易,因?yàn)榇蟛糠炙幬锏男掠猛究赡芘c原本的適應(yīng)癥并無明顯關(guān)系。近年來,大規(guī)模的基因組、表型數(shù)據(jù)以及藥物的化學(xué)與生物活性數(shù)據(jù)的爆炸式增長(zhǎng),又為藥物重定位提供了機(jī)遇。有研究人員基于藥物重定位的生物學(xué)依據(jù),即一藥多靶和一靶多治提出了多種假設(shè),從而實(shí)現(xiàn)了藥物的重定位?;谶@種假設(shè),具有相同屬性的藥物傾向于有相同或相似療效,因此可以用于治療相同或相似疾病。例如,Iwata等[5]通過比較藥物在癌細(xì)胞系上的Pathway信息,發(fā)現(xiàn)了可以用于抗癌的新藥物;Iorio F等[6]依據(jù)數(shù)據(jù)庫(kù)中不同的小分子藥物所影響的基因表達(dá)譜發(fā)現(xiàn)血管擴(kuò)張藥物法舒地爾可與抗精神藥物三氟拉嗪通過組合方式治療退行性疾病;Ken等[7]通過假設(shè)作用于相似靶標(biāo)或者Pathway的藥物可能會(huì)產(chǎn)生相似的副作用,然后通過評(píng)估8種常規(guī)阿爾茲海默癥病藥物的共同副作用,發(fā)現(xiàn)了25種可能可以用于該疾病的新藥物。同理,基于相似的疾病傾向于被相同或相似的藥物所治療的假設(shè),Hu等[8]通過基因表達(dá)譜構(gòu)建了疾病相似性網(wǎng)絡(luò),發(fā)現(xiàn)躁郁癥和遺傳痙攣性截癱有著相似的發(fā)病機(jī)制,因此認(rèn)為治療躁郁癥的藥物可以用于遺傳痙攣性截癱。此外,基于藥物與疾病特征之間的負(fù)相關(guān)思想,已經(jīng)提出了幾種利用疾病相關(guān)特征尋找藥物新適應(yīng)癥的方法。例如,Azam等[9]根據(jù)KEGG數(shù)據(jù)庫(kù)中所給出的信號(hào)通路,基于基因表達(dá)特征在疾病狀態(tài)和藥物狀態(tài)的擾動(dòng)方向相反,則該藥物可以用于治療該疾病的假設(shè),構(gòu)建了全局生物分子網(wǎng)絡(luò),從而發(fā)現(xiàn)了可能可以用于治療IPF(特發(fā)性肺纖維化)的8種新的治療藥物。還有研究人員根據(jù)藥物疾病的負(fù)相關(guān)性預(yù)測(cè)抗?jié)兯幬锛浊柽潆铱梢杂脕碇委煼蜗侔10-11]。此外,基于靶標(biāo)藥物重定位的基本思想即發(fā)現(xiàn)已有藥物的未知靶標(biāo),提出假設(shè):如果已知藥物可以結(jié)合的靶標(biāo)是其原用途以外,并且是某種疾病的關(guān)鍵分子,那么這種藥物可以用于治療該疾病?;诖思僭O(shè),預(yù)測(cè)出很多藥物潛在的新靶標(biāo)。例如,恩他卡朋原來是用于治療帕金森疾病的,后來發(fā)現(xiàn)可以作用于結(jié)核病中的結(jié)合桿菌酶,使其喪失活性,從而達(dá)到治療結(jié)核病的效果[12]。例如,致幻劑DMT與血清素受體之間的關(guān)系就是基于此種原理發(fā)現(xiàn)的[13]。

與之前通過單一或較少數(shù)據(jù)源提取特征相比,通過藥物的化學(xué)結(jié)構(gòu)、副作用以及靶標(biāo)相關(guān)數(shù)據(jù)和疾病表型數(shù)據(jù)等多種數(shù)據(jù)源提取出更多的特征,然后將藥物疾病特征根據(jù)已知的公式進(jìn)行關(guān)聯(lián)整合,最后應(yīng)用于新的模型,即XG-BOOST模型進(jìn)行預(yù)測(cè)。

1 數(shù)據(jù)源

本文應(yīng)用XG-BOOST模型預(yù)測(cè)已有藥物的潛在適應(yīng)癥,具體流程如圖1所示。首先,將獲得的藥物信息與疾病信息通過計(jì)算機(jī)處理成一個(gè)個(gè)二階矩陣,矩陣中的每個(gè)元素表示藥物與藥物的相似度(或疾病與疾病的相似度),然后將每個(gè)藥物矩陣與疾病矩陣分別整合成一個(gè)個(gè)低秩矩陣,每個(gè)低秩矩陣分別表示一個(gè)特征。最后,通過這些特征數(shù)據(jù)以及參數(shù)調(diào)節(jié)獲得一個(gè)性能更優(yōu)的模型,該模型可以進(jìn)一步用于預(yù)測(cè)新的潛在藥物疾病關(guān)聯(lián)。

1.1 藥物疾病的黃金標(biāo)準(zhǔn)集

本次用于訓(xùn)練的黃金標(biāo)準(zhǔn)集來自多個(gè)數(shù)據(jù)源,其中疾病主要來自O(shè)MIM,藥物來自DrugBank數(shù)據(jù)庫(kù),這是一個(gè)混合的化學(xué)信息資源,具有詳細(xì)的藥物數(shù)據(jù)和全面的目標(biāo)信息。通過使用UMLS(Unified Medical Languange System)將藥物、藥物的適應(yīng)癥和疾病名稱進(jìn)行匹配。為確保關(guān)聯(lián)的可信度,要求藥物與疾病必須有多種關(guān)聯(lián),最終得到包括1 244種藥物疾病關(guān)聯(lián)的黃金標(biāo)準(zhǔn)集,其中包括來自DrugBank數(shù)據(jù)庫(kù)的443種藥物,以及OMIM中所列舉的256種疾病。

1.2 藥物疾病相似性

1.2.1 藥物相似性

定義四組衡量藥物與藥物相似策略:

(1)化學(xué)相似性。藥物的SMILE分子式可以直接從DrugBank數(shù)據(jù)庫(kù)中獲得,通過RDKit數(shù)據(jù)包處理成分子指紋,最終獲得的藥物和藥物相似性得分是基于指紋的二維Tanimoto系數(shù)。

(2)副作用相似性。藥物的副作用通過SIDER庫(kù)獲得,這是個(gè)線上開源的數(shù)據(jù)庫(kù),每個(gè)藥物副作用之間相互獨(dú)立,沒有關(guān)聯(lián),因此可以通過Jaccard系數(shù)求得藥物之間的相似性,即用交集比上并集。

(3)ATC相似性[14]。ATC代碼共有7位,其中第1、4、5位是字母,第2、3、6、7位為數(shù)字。ATC系統(tǒng)將藥物分為5個(gè)級(jí)別,分別為解剖學(xué)、治療學(xué)、藥理學(xué)、化學(xué)、化合物上的分類。兩種藥物成分的K級(jí)藥物療效相似性定義為:

(4)Go相似性。藥物相關(guān)的基因語(yǔ)義相似性得分通過軟件GoSemSim獲得,基因之間的功能相似性廣泛應(yīng)用于生物信息學(xué),Go相似性則主要用于評(píng)估基因之間的功能相似性。

(5)ppi相似性。藥物靶蛋白相互作用的相似性主要是通過已知靶蛋白之間的相互作用構(gòu)建出人類靶蛋白相互作用網(wǎng)絡(luò),其中靶蛋白相互作用關(guān)系可以從HPRD數(shù)據(jù)庫(kù)中獲得,該數(shù)據(jù)庫(kù)也是一個(gè)在線的開源數(shù)據(jù)庫(kù)。通過計(jì)算出兩個(gè)靶蛋白之間的最小距離,將最小距離進(jìn)行歸一化從而得到這兩個(gè)靶蛋白的相互作用得分。將兩個(gè)藥物對(duì)應(yīng)的靶蛋白兩兩作用后求出得分平均值,即為兩個(gè)藥物的ppi相似性。

1.2.2 疾病相似性

對(duì)于疾病,主要采用疾病的表型特征,使用的疾病相似性由van Driel等[15]構(gòu)建。疾病相似性由基于疾病表型的MinMiner計(jì)算獲得,其計(jì)算類似于廣泛用于信息檢索的術(shù)語(yǔ)頻率—逆文檔頻率技術(shù)。簡(jiǎn)而言之,通過使用醫(yī)學(xué)主題標(biāo)題詞匯(Mesh)的解剖學(xué)(A)和疾?。–)部分,將每種疾病描述為特征向量,以從其OMIM記錄中自動(dòng)提取Mesh術(shù)語(yǔ),其中特征向量中的每個(gè)值表示Mesh概念與表型的相關(guān)性。每個(gè)概念的相關(guān)性是通過文檔中概念的實(shí)際計(jì)數(shù)加上概念下位詞的相關(guān)性總和計(jì)算得到。一對(duì)疾病{di,dj}之間的相似性通過計(jì)算兩個(gè)網(wǎng)格概念向量之間的余弦相似性ti={ti1,ti2,…,tik}和tj={tj1,tj2,…,tjk}得到。為了計(jì)算藥物化學(xué)相似性,將每種化合物描述為基于PubChem指紋880維的二維向量,其中如果相應(yīng)的指紋包含在藥物中,則向量中的元素為1,否則為0。用Tanimoto系數(shù)計(jì)算出兩種化合物之間的二維相似度,其定義為普通指紋數(shù)與指紋總數(shù)的比率。

1.2.3 藥物疾病整合

將藥物的4種相似性與疾病mesh相似性整合成5個(gè)特征,即特征1為藥物化學(xué)結(jié)構(gòu)相似性-mesh相似性,特征2為藥物副作用相似性-mesh相似性,特征3為藥物atc相似性-mesh相似性,特征4為Go相似性-mesh相似性,特征5為藥物ppi相似性-mesh相似性。對(duì)于一對(duì)藥物疾病的關(guān)聯(lián)得分(dr,di),計(jì)算步驟如下:首先,將之前得到的黃金標(biāo)準(zhǔn)集中的每一對(duì)關(guān)聯(lián)表示為(dr,di),計(jì)算所求藥物和已知藥物之間的相似性S(dr,dr)與所求疾病和已知藥物關(guān)聯(lián)的疾病之間的相似性S(di,di)。根據(jù)Perlman等[16]提出的方法,將這兩個(gè)相似性得分通過計(jì)算加權(quán)平方根合并成一個(gè)相似性得分。

以特征1為例,需將某種藥物m與黃金標(biāo)準(zhǔn)集中的藥物n求基于化學(xué)結(jié)構(gòu)的相似性得分,然后求出該藥物m對(duì)應(yīng)的疾病與藥物n對(duì)應(yīng)疾病基于mesh的相似性得分,這樣會(huì)得到1 244個(gè)相似性數(shù)據(jù)。選取最大的一個(gè)作為該組藥物疾病的關(guān)聯(lián)得分,并以相同的方法求出另外幾組特征。

1.3 數(shù)據(jù)集

數(shù)據(jù)集的正集由黃金標(biāo)準(zhǔn)集組成,為了完善特征數(shù)據(jù),事先刪除存在數(shù)據(jù)缺乏的藥物。最終標(biāo)準(zhǔn)集包括1 244組藥物疾病對(duì),負(fù)集的數(shù)據(jù)量是正集的兩倍大小,它由隨機(jī)產(chǎn)生的藥物疾病對(duì)構(gòu)成。簡(jiǎn)而言之,就是在所有185 609個(gè)藥物疾病對(duì)中,去掉正集,剩下隨機(jī)抽取3 866個(gè)作為負(fù)集。

2 XG-BOOST模型

2.1 監(jiān)督學(xué)習(xí)

監(jiān)督學(xué)習(xí)就是訓(xùn)練帶標(biāo)簽數(shù)據(jù)的學(xué)習(xí)。比如,有10萬條數(shù)據(jù),每條數(shù)據(jù)都包括50個(gè)特征,還有一個(gè)標(biāo)簽。而標(biāo)簽的內(nèi)容取決于學(xué)習(xí)問題,如果數(shù)據(jù)是病人進(jìn)行癌癥診斷做的各項(xiàng)檢查結(jié)果,標(biāo)簽就是病人是否得癌癥,是為1,否為0。監(jiān)督學(xué)習(xí)就是要從這10萬條數(shù)據(jù)中學(xué)習(xí)根據(jù)檢查結(jié)果診斷病人是否得癌癥的知識(shí),而學(xué)習(xí)的范圍就限定在這10萬條數(shù)據(jù)中,形象的理解就是,在這10萬條帶標(biāo)簽數(shù)據(jù)的“監(jiān)督”下進(jìn)行學(xué)習(xí)。

2.2 模型原理

XG-BOOST是一個(gè)監(jiān)督學(xué)習(xí)模型,它是多個(gè)CART樹(分類回歸樹)組合后的模型,這種組合后的模型一般都具有更強(qiáng)大的泛化能力[17-19]。因此,XG-BOOST模型最終的預(yù)測(cè)值就是每棵樹的預(yù)測(cè)值之和。對(duì)于分類問題,由于CART樹的葉子節(jié)點(diǎn)對(duì)應(yīng)的值是一個(gè)實(shí)際分?jǐn)?shù),而非一個(gè)確定的類別,這將有利于實(shí)現(xiàn)高效的優(yōu)化算法,這也是XG-BOOST運(yùn)算快的原因所在。該模型的數(shù)學(xué)表示如下:

K是指樹的棵數(shù),F(xiàn)表示所有可能的CART樹,f表示一個(gè)具體的CART樹,整個(gè)模型由K個(gè)CART樹組成。

模型表示出來后可進(jìn)一步表示出模型的目標(biāo)函數(shù),如式(4)所示。

該目標(biāo)函數(shù)包含兩部分,第一部分是損失函數(shù),第二部分是正則項(xiàng),正則項(xiàng)由K棵樹的正則化項(xiàng)相加而來。

2.2.1 目標(biāo)函數(shù)

訓(xùn)練該模型的任務(wù)就是最小化目標(biāo)函數(shù),尋找一組最佳參數(shù)組。XG-BOOST模型的參數(shù)優(yōu)化不是直接優(yōu)化整個(gè)目標(biāo)函數(shù),而是分步驟優(yōu)化目標(biāo)函數(shù),先優(yōu)化第一棵樹,再優(yōu)化第二棵樹,直至最后一顆樹。過程如下:

2.2.2 正則化項(xiàng)

對(duì)于一棵樹的正則化,作出如下定義:

首先,一棵樹有T個(gè)葉子節(jié)點(diǎn),這T個(gè)葉子節(jié)點(diǎn)的值組成了一個(gè)T維向量w,q(x)是一個(gè)映射,用來將樣本映射成1~T的某個(gè)值,也即它分到某個(gè)葉子節(jié)點(diǎn),q(x)其實(shí)代表了CART樹的結(jié)構(gòu),w_q(x)自然就是這棵樹對(duì)樣本x的預(yù)測(cè)值。

有了上述定義,XG-BOOST的正則化項(xiàng)如下:

這里的參數(shù)[γ]和[λ]都是XG-BOOST自己定義的,在使用該模型時(shí),這兩個(gè)參數(shù)可以自己調(diào)節(jié),[γ]越大表示希望獲得結(jié)構(gòu)越簡(jiǎn)單的樹,因此對(duì)較多葉子節(jié)點(diǎn)的樹懲罰越大。[λ]越大也表示希望獲得結(jié)構(gòu)越簡(jiǎn)單的樹。

3 結(jié)果分析

運(yùn)用上述方法預(yù)測(cè)潛在的藥物疾病關(guān)聯(lián),并將該方法與邏輯回歸、隨機(jī)森林進(jìn)行比較。

3.1 性能評(píng)估

K折交叉驗(yàn)證常用的是5、10、20折,在折數(shù)選擇問題上,不同折數(shù)的計(jì)算成本和效果均存在差異,因此需要進(jìn)行權(quán)衡。本文采用5折交叉驗(yàn)證,并通過AUC、F-measure及精度等常用性能指標(biāo)對(duì)模型進(jìn)行評(píng)價(jià),具體性能指標(biāo)如表1。

3.2 性能分析

進(jìn)一步繪制得到AUC,即ROC曲線面積,其中橫軸表示真負(fù)率,縱軸表示真正率或靈敏度。在整個(gè)預(yù)測(cè)過程中,正樣本被預(yù)測(cè)出來的比率越大越好,與之對(duì)應(yīng)的負(fù)樣本被預(yù)測(cè)為正樣本的比率越小越好,也即ROC曲線越靠近坐標(biāo)系左上角,分類效果越好。根據(jù)圖2可以看出,XG-BOOST的性能最好,隨機(jī)森林次之,最后是邏輯回歸[20]。XG-BOOST部分預(yù)測(cè)結(jié)果如表2所示。

4 結(jié)語(yǔ)

傳統(tǒng)新藥開發(fā)耗時(shí)長(zhǎng)且風(fēng)險(xiǎn)高,舊藥新用作為另一種研究范式受到廣泛關(guān)注。近年來,隨著藥物和疾病數(shù)據(jù)的快速積累,挖掘各層次生物醫(yī)學(xué)數(shù)據(jù)預(yù)測(cè)藥物新用途成為系統(tǒng)生物領(lǐng)域的研究熱點(diǎn)。本文從藥物的化學(xué)結(jié)構(gòu)、藥理性質(zhì)、副作用、靶蛋白功能和疾病表型等數(shù)據(jù)中挖掘出有信息量的特征,然后應(yīng)用于XG-BOOST模型,并與邏輯回歸、隨機(jī)森林模型性能作對(duì)比。實(shí)驗(yàn)結(jié)果表明,本文方法性能更優(yōu),原因在于其整合利用了藥物化學(xué)結(jié)構(gòu)、靶蛋白、藥理、表型等各層次數(shù)據(jù);在特征構(gòu)建完后,采用XG-boost模型。

但該方法仍有一些問題待研究解決,如數(shù)據(jù)的黃金標(biāo)準(zhǔn)集是通過使用UMLS將Drugbank中的藥物、藥物適應(yīng)癥和OMIM中的疾病名稱進(jìn)行匹配得到的,因此獲得的藥物疾病關(guān)聯(lián)不完善;并且負(fù)集是隨機(jī)產(chǎn)生的一個(gè)兩倍大的集合,這會(huì)存在許多不確定性。隨著更多關(guān)聯(lián)的產(chǎn)生,預(yù)計(jì)可以構(gòu)建更多具有生物學(xué)意義的集合,使得預(yù)測(cè)結(jié)果更準(zhǔn)確。

參考文獻(xiàn):

[1] 楊光,郝逸凡. 基于互信息法的抗前列腺癌藥物重定位分析[J]. 沈陽(yáng)師范大學(xué)學(xué)報(bào):自然科學(xué)版,2019(1):34-37.

[2] 劉艷飛,孫明月. 網(wǎng)絡(luò)藥理學(xué)在中藥研究中的應(yīng)用現(xiàn)狀與思考[J]. 中國(guó)循證醫(yī)學(xué)雜志,2017(11):1344-1349.

[3] 張永祥. 藥物重定位——網(wǎng)絡(luò)藥理學(xué)的重要領(lǐng)域[J]. 中國(guó)藥理學(xué)與毒理學(xué)雜志,2012(6):779-786.

[4] WANG Y Y,CUI C F,QI L Q,et al. DrPOCS:Drug repositioning based on projection onto convex sets[J]. IEEE/ACM Transactions on Computational Biology & Bioinformatics,2019,16(1): 154-162.

[5] IWATA M,HIROSE L. Pathway-based drug repositioning for cancers: computational prediction and experimental validation[J].? Medical Chemtsry,2018, 61:9583-9595.

[6] IORIO F. Discovery of drug mode of action and drug repositioning from transcriptional responses[J].? Proc Natl Acad Sci. USA,2010,107(33): 14621-14627.

[7] MCGARRY K, GRAHAM? Y. RESKO: Repositioning drugs by using side effects and knowledge from ontologies[J].? Knowledge-based Systems,2018,160: 34-48.

[8] HU G,AGARWAL P. Human disease-drug network based on genomic expression profiles[J].? PLoS One,2009,4(8): 6536.

[9] NAFISEH A. A novel computational approach for drug repurposing using systems biology[J]. Bioinformatics,2018,34(16):2817-2825.

[10] LI Y. Gene expression module-based chemical function similarity search[J]. Nucleic Acids Res,2008,36(20): 137.

[11] WANG G. Expression-based in silico screening of candidate therapeutic compounds for lung adenocarcinoma[J]. PLoS One,2011,6(1): 14573.

[12] KINNINGS S L. Drug discovery using chemical systems biology: repositioning the safe medicine Comtan to treat multi-drug and extensively drug resistant tuberculosis[J]. PLoS Comput Biol.,2009,5(7): 1000423.

[13] KEISER M J. Relating protein pharmacology by ligand chemistry[J]. Nat Biotechnol,2007,25(2): 197-206.

[14] 陳范曙. 基于信息整合的藥物相關(guān)信息挖掘方法研究[D]. 2016.

[15] VANDRIEL M A. A text-mining analysis of the human pheome[J]. Eur J Hum Genet,2006,14:535-542.

[16] ASSAF G, GIDEON Y. PREDICT: a method for inferring novel drug indications with application to personalized medicine[J]. Molecular System Biology, 2011,7(496).

[17] MASON L, BAXTER J,BARTLETT P L.Boostig algorithms as gradient deacent[C]. Conference on Advantage in Neural Information Processing Systems,2000:512-518.

[18] DIOGO M,KATHERINE M. Next-generaion machine learning for biological network[J]. Cell,2018,173:1581-1592.

[19] KHADER S, K W J, B S G,et al. priortizing small molecule as candinates for drug repositioning using machine learning[EB/OL].? https://www.biorxiv.org/content/10.1101/331975v1,2018.

[20] 王博. 基于Logistic Regression的數(shù)學(xué)成績(jī)預(yù)測(cè)系統(tǒng)的研究[D]. 南昌:南昌大學(xué),2018.

(責(zé)任編輯:孫 娟)

杭州市| 台江县| 孙吴县| 封开县| 荣昌县| 松溪县| 阳高县| 祁阳县| 渭源县| 五华县| 南木林县| 汶上县| 巴中市| 乌苏市| 大城县| 河间市| 尼勒克县| 广灵县| 灵武市| 灵丘县| 家居| 平塘县| 蓬莱市| 太原市| 乌什县| 平武县| 东港市| 庄浪县| 哈尔滨市| 大石桥市| 彝良县| 桦川县| 奇台县| 祁门县| 合阳县| 多伦县| 新沂市| 青浦区| 襄汾县| 渭源县| 岐山县|