吳 昊,林 銘,孫 懿,趙 欣,蒲小平
(北京大學(xué)藥學(xué)院分子與細(xì)胞藥理學(xué)系,北京 100191)
新藥研發(fā)是一項(xiàng)復(fù)雜的工程,具有高風(fēng)險(xiǎn)、高投入、周期長(zhǎng)的特點(diǎn)。利用傳統(tǒng)方式開發(fā)新藥的費(fèi)用已接近25億美元,而且每9年會(huì)增加1倍,不僅如此,傳統(tǒng)開發(fā)新藥的方式漫長(zhǎng)而且效率低下,近九成的藥物在Ⅰ期臨床階段就會(huì)被淘汰[1]。因此,國(guó)內(nèi)外藥品公司都積極地將人工智能(artificial intelligence, AI)技術(shù)應(yīng)用于新藥研發(fā)(Tab 1),以提高研發(fā)效率,即能在早期通過計(jì)算生物學(xué)和生物信息學(xué)等手段,篩選除去無活性藥物,并形成新的藥物開發(fā)模式。所以,本文將圍繞以“統(tǒng)計(jì)學(xué)習(xí)”為特征的新一代AI技術(shù)驅(qū)動(dòng)下的新藥研發(fā),探究AI技術(shù)對(duì)傳統(tǒng)新藥研發(fā)模式的顛覆性改變。
一般來說,傳統(tǒng)新藥研發(fā)的起點(diǎn)是利用分子生物學(xué)結(jié)合生物信息學(xué)相關(guān)數(shù)據(jù),分析確定疾病治療的有效靶點(diǎn),再圍繞靶點(diǎn)逐步尋找活性藥物。在開發(fā)過程中,一般利用虛擬篩選(virtual screening,VS)、高通量篩選(high throughput screening,HTS)和高內(nèi)涵篩選(high content screening,HCS)[2]等。其中,確定疾病靶點(diǎn)以及靶點(diǎn)相關(guān)基因和蛋白的過程耗時(shí)耗力,嚴(yán)重影響新藥研發(fā)進(jìn)程。與傳統(tǒng)新藥研發(fā)相比,AI技術(shù)具有明顯的優(yōu)勢(shì),能利用大數(shù)據(jù)樣本表型篩選的方法,加快復(fù)雜疾病新藥研發(fā)的速度和效率。
1.1 表型篩選及其優(yōu)勢(shì)表型篩選是在疾病靶點(diǎn)不明確,而且發(fā)病機(jī)制不清楚的條件下,基于生物體表型改變來進(jìn)行藥物篩選。相對(duì)于傳統(tǒng)體內(nèi)和器官/組織表型篩選,結(jié)合了AI技術(shù)的現(xiàn)代表型篩選適用于更復(fù)雜的病理生理過程,并且能在細(xì)胞水平利用表型改變來篩選新的化合物[3]。一般來說,先導(dǎo)化合物篩選過程中,常用到3種類型細(xì)胞表型篩選方法,分別是細(xì)胞活力測(cè)定、細(xì)胞信號(hào)通路分析和疾病相關(guān)表型分析。此外,細(xì)胞表型篩選還會(huì)用于細(xì)胞自噬、凋亡、細(xì)胞分泌、細(xì)胞運(yùn)動(dòng)、細(xì)胞核易位、骨架重排等[4]。
AI篩選平臺(tái)和高敏感檢測(cè)系統(tǒng)的發(fā)展,更推進(jìn)了表型分析小型化和大型樣品庫(kù)的快速篩選[5]。Berg Health公司Narain等[6]通過將轉(zhuǎn)移性前列腺癌PC-3細(xì)胞系暴露于模擬的腫瘤微環(huán)境中(氧氣不足、低pH和營(yíng)養(yǎng)不足),分別在培養(yǎng)24、48 h后,吸取15 mL條件培養(yǎng)基進(jìn)行蛋白質(zhì)組學(xué)分析,再使用AI貝葉斯神經(jīng)網(wǎng)絡(luò)推斷方法分析蛋白質(zhì)組數(shù)據(jù),生成每個(gè)特定因子的獨(dú)特概率模型,再根據(jù)功能變量子網(wǎng)的Burt約束度量得分進(jìn)行排名,找到潛在的前列腺癌生物標(biāo)志物Filamin-A和Filamin-B等,并在前列腺癌患者血樣中得到驗(yàn)證。
在過去的20年里,藥物靶點(diǎn)篩選一直是新藥研發(fā)的主流,而到近十年,AI技術(shù)的崛起,使得基于表型篩選的方法回到人們的視線,又重新成為藥物篩選和先導(dǎo)化合物發(fā)現(xiàn)的趨勢(shì)(Fig 1)[5],像白血病治療的溴結(jié)構(gòu)域抑制劑篩選[7]、丙型肝炎病毒NS5A抑制劑開發(fā)[8]等。這一改變主要是因?yàn)锳I技術(shù)在藥物研發(fā)方面具有的優(yōu)勢(shì),使人們進(jìn)一步意識(shí)到基于靶點(diǎn)篩選方法的缺陷,即對(duì)于多數(shù)靶點(diǎn)不明確、發(fā)病機(jī)制多樣的復(fù)雜疾病,其局限性較大。此外,再利用批準(zhǔn)藥物的表型篩選方法,還能明顯減少潛在藥物的臨床前開發(fā)時(shí)間和成本[9]。新藥研發(fā)的模式也因此從單一的分子靶點(diǎn)篩選向整合表型篩選轉(zhuǎn)變[10]。不過,表型篩選并不能有效確定藥物作用機(jī)制和靶點(diǎn),因此不能完全覆蓋靶點(diǎn)篩選的功能,這是目前表型篩選未能被藥企普遍接受的主要原因。
Fig 1 Development of drug screening methods Black wireframe indicates phenotypic screening
Tab 1 Selected collaborations in AI-drug discovery space
1.2 基于細(xì)胞圖像組學(xué)的表型篩選細(xì)胞圖像組學(xué)是指利用AI技術(shù),將模擬疾病的細(xì)胞模型圖像進(jìn)行形態(tài)學(xué)分析,建立疾病的細(xì)胞表型數(shù)據(jù)庫(kù),并確定疾病的指紋特征。而基于細(xì)胞圖像組學(xué)的表型篩選則是將指紋特征和大量化合物測(cè)定的生物學(xué)活性相結(jié)合,構(gòu)建特征-活性網(wǎng)絡(luò),再根據(jù)特定化合物的細(xì)胞特征信息,來確定其生物學(xué)活性并進(jìn)行篩選[11]。與基于靶點(diǎn)藥物篩選缺乏細(xì)胞學(xué)信息相比,基于細(xì)胞表型圖像藥物篩選可以提供更多的生物學(xué)信息,通過相互作用蛋白所處的細(xì)胞環(huán)境和信號(hào)網(wǎng)絡(luò)相關(guān)信息,并能保留高通量篩選能力[12]。美國(guó)猶他州Recursion Pharmaceuticals(遞歸醫(yī)藥)利用HTS經(jīng)過大量的分析開發(fā)后,決定采用6種熒光染料進(jìn)行染色,包括Hoechst 33342(DNA)、伴刀豆球蛋白A/Alexa Fluor 488結(jié)合物(內(nèi)質(zhì)網(wǎng))、SYTO 14綠色熒光核酸染色(核仁,細(xì)胞質(zhì)RNA)、鬼筆環(huán)肽/Alexa Fluor 568結(jié)合物(肌動(dòng)蛋白)、小麥胚芽凝集素/Alexa Fluor 555結(jié)合物(高爾基體,質(zhì)膜)和Mito Tracker深紅(線粒體),在5個(gè)通道成像,并能在單個(gè)顯微鏡中區(qū)別以上8種細(xì)胞成分或區(qū)室,再借助開源軟件CellProfiler提取每個(gè)細(xì)胞的1 000多個(gè)形態(tài)特征,從形態(tài)學(xué)上反映細(xì)胞的表型信息,再對(duì)上百種罕見病的幾萬張細(xì)胞圖片進(jìn)行特征分析,從而找到罕見病的指紋特征(Fig 2)[13]。之后,結(jié)合自動(dòng)化生化指標(biāo)檢測(cè),實(shí)現(xiàn)大規(guī)模并行化的高通量藥物篩選。目前,該公司已經(jīng)確定了幾十種罕見疾病有前景的候選化合物,例如,治療2型神經(jīng)纖維瘤病(neurofibromatosis type 2,NF2)的mTOR受體抑制劑AZD2014和VEGF c-KIT激酶抑制劑PTC99等[14],還與賽諾菲(Sanofi)集團(tuán)建立合作關(guān)系,以評(píng)價(jià)開發(fā)過程和臨床前測(cè)試中獲得成功的化合物。此外,Cell Image LibraryTM在線有各種細(xì)胞圖像、視頻和動(dòng)畫以及藥物處理后的細(xì)胞形態(tài)學(xué)數(shù)據(jù),有利于其他團(tuán)隊(duì)使用該技術(shù)進(jìn)行采集、分析和比較細(xì)胞圖像,免費(fèi)提供數(shù)據(jù)庫(kù),實(shí)現(xiàn)資源共享。
Fig 2 Morphological analysis based on cell phenotype images
基于細(xì)胞圖像組學(xué)的表型篩選雖然滿足了大量化合物快速篩選以及活性測(cè)定的需求,但仍未解決無法有效確定藥物作用機(jī)制和靶點(diǎn)的問題,因此,該技術(shù)目前還只是被AI技術(shù)團(tuán)隊(duì)使用。
從小樣本中學(xué)習(xí)和概括的能力是人類智慧的標(biāo)志[15]。道格拉斯·霍夫斯塔特(Douglas Hofstadter)曾指出,只有全面的AI技術(shù)才具備人類處理文字的靈活性,而小樣本的學(xué)習(xí)能力正是其中重要的一環(huán)[16]。AI技術(shù)已經(jīng)在大數(shù)據(jù)樣本中獲得成功(Tab 1),尤其是深度學(xué)習(xí)(deep learning),通過搭建多個(gè)神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)大量標(biāo)記樣本的學(xué)習(xí),而且樣本越大,診斷精準(zhǔn)度越高。所以,AI技術(shù)實(shí)現(xiàn)對(duì)小樣本學(xué)習(xí)(one/few/low-shot learning),可以推動(dòng)AI向小樣本學(xué)習(xí)模式的發(fā)展,有利于在缺乏大樣本的疾病中進(jìn)行新藥研發(fā),并降低成本。
2.1 遷移學(xué)習(xí)和半監(jiān)督學(xué)習(xí)對(duì)于某些情況,比如確定個(gè)體沙門氏菌血清型[17]等,研究者只能夠獲取單個(gè)或幾個(gè)樣本,有時(shí)還是未知樣本。為了實(shí)現(xiàn)小樣本學(xué)習(xí),AI技術(shù)常會(huì)用到遷移學(xué)習(xí)(transfer learning)以及半監(jiān)督學(xué)習(xí)(semi-supervised learning)等。遷移學(xué)習(xí)指先在樣本源領(lǐng)域(source domain)訓(xùn)練,再把整合的知識(shí)遷移到目標(biāo)領(lǐng)域(target domain),從而將已知的樣本信息與小樣本目標(biāo)信息進(jìn)行聯(lián)系。研究者往往將遷移學(xué)習(xí)和深度學(xué)習(xí)結(jié)合,形成深度遷移學(xué)習(xí)(deep transfer learning)。美國(guó)芝加哥大學(xué)Huynh等[18]先從小樣本乳腺癌圖像數(shù)據(jù)庫(kù)中找到每個(gè)圖像中病灶的感興趣區(qū)域(region of interest,ROI),并進(jìn)行截圖標(biāo)記(良性或惡性)作為目標(biāo)集,再通過非醫(yī)學(xué)任務(wù)預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),從該小樣本醫(yī)學(xué)圖像集中提取腫瘤信息,再借助支持向量機(jī)分類器進(jìn)行特征分類,之后利用接收器操作特征分析和交叉驗(yàn)證進(jìn)行模型評(píng)估,最終很好地完成了對(duì)乳腺癌的準(zhǔn)確診斷,并發(fā)現(xiàn)潛在的藥物作用靶點(diǎn)。此外,遷移學(xué)習(xí)還可用于阿爾茨海默病、前列腺癌等的準(zhǔn)確診斷。所以,遷移學(xué)習(xí)有利于小樣本信息分析,能夠推動(dòng)精準(zhǔn)醫(yī)學(xué)中AI技術(shù)的發(fā)展。
而半監(jiān)督學(xué)習(xí)通過標(biāo)記的小樣本信息和未標(biāo)記的大樣本信息進(jìn)行訓(xùn)練和分類,從而完成小樣本學(xué)習(xí)。Chen等[19]通過基于網(wǎng)絡(luò)的拉普拉斯正則化最小二乘協(xié)同藥物組合預(yù)測(cè)(network-based Laplacian regularized least square synergistic drug combination prediction,NLLSS)算法,整合少量已知的協(xié)同抗真菌藥物組合和大量未知的抗真菌藥物組合,并根據(jù)發(fā)揮協(xié)同作用的藥物具有相似的性質(zhì),同時(shí)借助藥物-靶點(diǎn)相互作用和藥物化學(xué)結(jié)構(gòu)來檢測(cè)藥物相似性,從而預(yù)測(cè)潛在的協(xié)同藥物組合,結(jié)果證明,NLLSS可以有效識(shí)別潛在的協(xié)同藥物組合,探索藥物的新適應(yīng)癥,并有助于協(xié)同藥物組合的潛在分子機(jī)制研究。加拿大Hao等[20]則通過間接闡明陽性無標(biāo)記學(xué)習(xí)(positive unlabeled learning for splicing elucidation,PULSE)算法,利用剪接、進(jìn)化、調(diào)節(jié)性、蛋白質(zhì)組學(xué)、結(jié)構(gòu)功能等5個(gè)維度,共計(jì)48個(gè)預(yù)測(cè)特征的小樣本蛋白質(zhì)異形體(protein isoforms)數(shù)據(jù)集和大量未標(biāo)記的蛋白質(zhì)異形體數(shù)據(jù)集,進(jìn)行半監(jiān)督學(xué)習(xí),首次成功預(yù)測(cè)約32%的“外顯子跳躍”選擇性剪接事件會(huì)產(chǎn)生穩(wěn)定的蛋白質(zhì),并獲得了大量推測(cè)的和未表征的蛋白質(zhì),再對(duì)預(yù)測(cè)的活性蛋白質(zhì)異形體進(jìn)行結(jié)構(gòu)分析,包括剪接掉PK酶結(jié)構(gòu)域261~271片段的BRSK2蛋白質(zhì)異形體、剪接掉WD40結(jié)構(gòu)域431~496片段的多聚體調(diào)節(jié)因子1蛋白質(zhì)異形體等,找到疾病特異的蛋白質(zhì)異形體(disease-specific protein isoforms),有助于疾病預(yù)測(cè)和靶點(diǎn)研究。
2.2 基于高維小樣本數(shù)據(jù)的靶點(diǎn)篩選高維數(shù)據(jù)是多變量數(shù)據(jù),使用更多變量來描述樣本,而不增加要分析的樣本數(shù)量,而且變量的數(shù)量往往超過了樣本的數(shù)量。例如,同時(shí)測(cè)量所有已知基因的表達(dá)(大于20 000),但研究中受試者血樣可能只有幾百個(gè)[21]。如何方便有效地實(shí)現(xiàn)高維數(shù)據(jù)可視化,一直都是國(guó)內(nèi)外科研機(jī)構(gòu)關(guān)注的問題。而AI技術(shù)通過深度自動(dòng)編碼器的反向傳播,實(shí)現(xiàn)了高維數(shù)據(jù)的非線性降維,并能保留全局特征[22],因此,可以幫助人們分析并整合疾病高維數(shù)據(jù)和遺傳信息,以便更好地找到對(duì)藥物篩選有價(jià)值的作用靶點(diǎn)。由于研究樣本的復(fù)雜性,小樣本數(shù)據(jù)往往以高維數(shù)據(jù)形式被獲取。目前,基于高維小樣本數(shù)據(jù)的疾病靶點(diǎn)篩選方法還在逐步完善當(dāng)中。中國(guó)科學(xué)院陳洛南團(tuán)隊(duì)將高維小樣本動(dòng)態(tài)網(wǎng)絡(luò)生物標(biāo)志物應(yīng)用于流感病毒感染和癌癥轉(zhuǎn)移的數(shù)據(jù)集,來準(zhǔn)確識(shí)別疾病的臨界狀態(tài),以進(jìn)行個(gè)體化疾病診斷,并能分析疾病進(jìn)展的分子機(jī)制。此外,還能識(shí)別許多非線性生物過程的臨界狀態(tài),如細(xì)胞分化和細(xì)胞增殖等,這有助于找到潛在的藥物靶點(diǎn)[23-24]。加拿大Chao等[25]則通過動(dòng)態(tài)基因組信息,借助于微陣列雜交(microarray hybridization,MH)和MAS5算法,找到選定血樣集中穩(wěn)定的探針組,再對(duì)挑選出的探針組進(jìn)行評(píng)估和優(yōu)化,從而利用單個(gè)外周血液樣品找到多種疾病的生物標(biāo)志物,包括精神疾病、骨關(guān)節(jié)炎、心血管疾病、胃腸道疾病、腫瘤等,從而獲得每個(gè)患者的多種疾病患病風(fēng)險(xiǎn),為組織活檢提供了替代方案,也便于不同疾病的診斷和預(yù)后,以及藥物潛在靶點(diǎn)的篩選。
總之,隨著小樣本學(xué)習(xí)的發(fā)展,基于高維小樣本數(shù)據(jù)的新藥研發(fā)會(huì)使AI技術(shù)變得更加全面、成熟。
2018年,AI技術(shù)出現(xiàn)重大突破,英國(guó)雜志Nature發(fā)表重磅文章,指出AlphaGo Zero只使用單一的深度強(qiáng)化學(xué)習(xí)(deep reinforcement learning)算法和蒙特卡羅樹搜索(Monte Carlo tree search, MCTS)[26],從空白狀態(tài)學(xué)起,無人工監(jiān)督,利用自我對(duì)弈模型來不斷迭代,進(jìn)而找到全局最優(yōu)解。其中,自我對(duì)弈模式可以類似地理解為近似策略迭代方案,由MCTS來進(jìn)行策略評(píng)估和策略優(yōu)化。AlphaGo Zero已經(jīng)擊敗了AlphaGo及其升級(jí)版AlphaGo Fan、AlphaGo Lee等,而且只使用1臺(tái)機(jī)器和4個(gè)張量處理單元(tensor processing unit,TPU),非常節(jié)省資源[27]。AlphaGo Zero的成功,表明深度強(qiáng)化學(xué)習(xí)算法在沒有大量先驗(yàn)知識(shí)的情況下,能很好地完成復(fù)雜任務(wù),突破了現(xiàn)有AI技術(shù)需要樣本訓(xùn)練集的局限性。
最近,德國(guó)Segler等[28]通過深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)和MCTS,利用Reaxys化學(xué)數(shù)據(jù)庫(kù)學(xué)習(xí)已知的大約1 240萬個(gè)單步化學(xué)反應(yīng),再反復(fù)訓(xùn)練進(jìn)行算法優(yōu)化,使其可以預(yù)測(cè)單步可用的化學(xué)反應(yīng)。再結(jié)合指導(dǎo)搜索的擴(kuò)展策略網(wǎng)絡(luò)和過濾網(wǎng)絡(luò),預(yù)先選擇目標(biāo)化合物的最優(yōu)合成路線,大幅提高了化合物合成效率。該算法被稱作“化學(xué)界的AlphaGo”,具有劃時(shí)代意義。而AlphaGo Zero比AlphaGo學(xué)習(xí)能力更強(qiáng),所以,AlphaGo Zero理論上具備更強(qiáng)的處理復(fù)雜問題的能力,將會(huì)進(jìn)一步推動(dòng)新藥研發(fā)的快速發(fā)展。
AI技術(shù)通過高維數(shù)據(jù)分析結(jié)果來生成假設(shè),改變了新藥研發(fā)“先假設(shè)再驗(yàn)證”的傳統(tǒng)模式,此外,AI技術(shù)可以利用小樣本學(xué)習(xí),進(jìn)一步推動(dòng)精準(zhǔn)醫(yī)學(xué)和個(gè)體化醫(yī)療的發(fā)展。而AlphaGo Zero的成功表明機(jī)器無需幫助就可能超越人類,為AI技術(shù)帶來重大突破,但AlphaGo Zero的成功經(jīng)驗(yàn)?zāi)芊裢卣沟叫滤幯邪l(fā),還需要進(jìn)一步探索和研究。目前,世界上還沒有AI技術(shù)研發(fā)的新藥被批準(zhǔn)上市,然而,Berg Health公司的候選藥物BPM 31510和BPM 31543均進(jìn)入臨床研究階段,而BPM 31510預(yù)計(jì)會(huì)在2020年獲得FDA批準(zhǔn)[29]。最近,美國(guó)國(guó)防高級(jí)研究計(jì)劃局(Defense Advanced Research Projects Agency,DARPA)開展的“AI Next”項(xiàng)目,使機(jī)器具備理解和推理能力,為人類開啟第3次AI浪潮[30],預(yù)計(jì)會(huì)為新藥研發(fā)策略帶來又一次革命性轉(zhuǎn)變。