知平
1950年,人工智能之父,英國計算機科學家阿蘭·圖靈,發(fā)表了一篇里程碑式的論文《機器能思考嗎》,為人類帶來了一個新學科:人工智能(AI);1956年,“人工智能”首次在達特茅斯會議中被提出,緊接著人工智能開始醞釀其第一次浪潮,人工智能實驗室在全球各地扎根。
到了上世紀90年代后期,由于計算機計算能力的不斷提高,人工智能再次成為熱潮。以數(shù)據(jù)挖掘和商業(yè)診斷為主要代表的應用非常成功,使人工智能重回人們的視野。隨后,人們意識到,限制人工智能發(fā)展的不僅僅是硬件問題,而是軟件以及算法層面的挑戰(zhàn)沒有形成突破。
于是,2006年,以杰佛瑞·辛頓為代表的研究人員發(fā)現(xiàn)了訓練高層神經網絡的有效算法?;ヂ?lián)網的興起,為計算機訓練提供了更多的場景和海量的數(shù)據(jù),從而讓計算機視覺訓練更加全面,準確率也更高。
人工智能與藥物研發(fā),至此也有了新的故事可講。
早在上世紀60至70年代,國外AI在醫(yī)藥領域的應用研究就開始了:1968年,美國斯坦福大學計算機科學家愛德華·費根鮑姆研制了世界上第一個用于推斷化學分子結構的AI系統(tǒng)DENDRAL;20世紀70年代,斯坦福大學的愛德華·索爾特夫等人開發(fā)了第一個用于血液感染病的診斷、治療和咨詢服務的AI醫(yī)療系統(tǒng)MYCIN。
一款藥物從研發(fā)到批準生產,并投入臨床使用,一般要花費10年或者更長的時間,研發(fā)金額也高達十億美元及其以上。但投入時間、精力、資本,未必就一定能走向成功。新藥研發(fā)失敗率很高,美國密歇根大學一位學者曾指出,90%的研制藥物都在臨床試驗階段遭遇失敗。
這些因素致使一些正版藥物在專利期售出“天價”,加之一部分藥物尚未被納入醫(yī)保范疇,很多患者會面臨“救命藥吃不起”的窘境。因此,新藥研發(fā)亟須一場變革。
2007年6月12日,一個名叫Adam的機器人,發(fā)現(xiàn)了一種酵母基因的功能。通過搜索公共數(shù)據(jù)庫,Adam提出了一個假設,認為存在某些基因編碼的釀酒酵母反應催化酶。在實驗室中,這個假設得到了機械技術的驗證—英國亞伯大學和劍橋大學的研究人員各自檢驗了Adam關于19種基因有何功能的假設,其中9個假設是新的和正確的,只有1個假設是錯誤的。
這是AI干涉人類科學發(fā)現(xiàn)的歷史性一步,更讓人們意識到,AI在藥物研發(fā)領域的優(yōu)勢。AI制藥技術不是替代傳統(tǒng)藥物研發(fā),是把人類的生產力從傳統(tǒng)的、低效的工作中解脫出來,讓人類去做需要更多智慧和創(chuàng)造力的事情,為人類創(chuàng)造更多的、新的生命科學研究方法。
在藥物研發(fā)路線設計速度方面,AI算法比化學家快10倍。
利用AI技術,人類可以快速、精確地鎖定各方面條件理想的候選化合物,然后高效合成目標分子,提升整體的研發(fā)速度、降低藥物研發(fā)成本。
根據(jù)設計藥物研發(fā)合成路線的速度來評定結果數(shù)據(jù),人類化學家平均所花時間為1.5小時左右;而AI計算平均時長為8.7分鐘,找到第一條路所需的時間平均為2分鐘。
AI還會給出多條路線,并能夠按照合成路線難易和總步數(shù)排序。在藥物研發(fā)路線設計速度方面,AI算法比化學家快10倍。
在進行化合物篩選時,AI也可以更快地發(fā)現(xiàn)新的分子化合物或者有潛力的新靶點,從而加快藥物研發(fā)過程。它們還能更加準確地預測新藥后續(xù)的實驗結果,從而盡可能提高藥物開發(fā)過程中,每個環(huán)節(jié)的成功率。
一般來說,制藥分為3個階段,第一階段是“靶點發(fā)現(xiàn)”。因為人體實在是太復雜了,某一個疾病,可能是由一堆蛋白質的變化引起的。那么,選擇具體的蛋白質作為靶點,就是一個非常重要的問題—而大部分AI制藥公司都不會投入過多:原因比較簡單,因為這個領域研究周期特別長(十年甚至更長),而且很難受到有效的商業(yè)化保護。
第二個階段是“藥物發(fā)現(xiàn)”(Drug Discovery),大部分AI制藥公司的重心集中在這里。在該階段,核心有3步:找hit(苗頭化合物);優(yōu)化hit從而找到lead(先導化合物);繼續(xù)優(yōu)化,直到從lead優(yōu)化到pcc(臨床前候選化合物)。
這基本上就是一個“先生成,再篩選”的過程。簡單而言,即為通過各種生成算法生成一些分子,然后通過各種篩選方式找到合適的。
第三個階段是臨床試驗。當有了pcc之后,可以考慮放在市場上去賣,也可以考慮推動臨床試驗。這一階段的工作就變成了招募患者、給藥、收集數(shù)據(jù)等。目前基本上,AI制藥也不會涉足這個階段,主要是因為這個階段太花錢,而且在實踐中,尚未進展到這個階段。
是故,關于AI在新藥研發(fā)領域的主要應用,集中在靶點發(fā)現(xiàn)、化合物合成、化合物篩選、晶型預測、患者招募、優(yōu)化臨床試驗設計和藥物重定向等7大場景。
具體來看,AI可以幫助尋找、確定和制備藥物靶點。對于大型企業(yè)的AI系統(tǒng),完成新藥候選的時間和資金成本,只需傳統(tǒng)方法的四分之一。
同時,AI還可以利用大量的化合物和分子數(shù)據(jù),來預測新藥的療效和副作用,幫助科學家快速發(fā)現(xiàn)新藥,預測藥物的副作用,進而在藥物研發(fā)過程中提前識別和解決問題。
如英國公司Benevolent Bio,就利用技術平臺JACS,從100個可用于治療肌萎縮性側索硬化癥(ALS)的潛在化合物中,篩選出5個化合物;再經過試驗,證實4個化合物在治愈運動神經衰退方面確有療效。
并且,AI可以幫助優(yōu)化臨床試驗的設計,從而減少成本和時間。
從2020年至今,行業(yè)進入高速發(fā)展期,伴隨著技術的不斷成熟,AI新藥企業(yè)與藥企的合作頻次、合作范圍、合作深度不斷拓寬拓深。另外,包括谷歌等在內的多家科技互聯(lián)網巨頭,亦相繼進場AI制藥:谷歌旗下Deepmind團隊開發(fā)的兩代AlphaFold算法,解決了生物學界長達50年的蛋白質空間結構預測難題—這在為AI新藥領域吸引更多目光的同時,也為該領域帶來更多資源和人才。
可以說,AI在輔助藥物研發(fā)上,目前正推動著新一波創(chuàng)新潮的到來。但與此同時,AI制藥現(xiàn)階段在實際應用中還有不少阻礙。就AI醫(yī)療賽道而言,現(xiàn)在最大的瓶頸不完全在于算法和模型,而在于數(shù)據(jù)的積累及標注、對醫(yī)療場景的理解(醫(yī)生或者生物醫(yī)藥出身)、大量的資金以及三類醫(yī)療器械審批證書。
換句話說,計算機模擬得再好,沒有實驗室數(shù)據(jù)支撐,相關機構也不會讓其上臨床。獨立的AI制藥公司可以幫助大藥企做輔助設計,提高篩選效率,但是藥企并不一定愿意把自家積累的核心數(shù)據(jù)交出來。
數(shù)據(jù)問題之外,老一代的合成生物學專家的接受度也是阻礙之一,要知道,他們很多時候是有一票否決權的。并且,醫(yī)藥行業(yè)的容錯率比互聯(lián)網行業(yè)低得多,對算法和數(shù)據(jù)的要求高好幾個檔次。所以,現(xiàn)在很多AI制藥公司都開始自己建實驗室,自己做藥了。
所以,如果AI制藥想要真正大規(guī)模發(fā)展開來,我們還是要等算法再成熟一點,數(shù)據(jù)積累得再多一點,醫(yī)藥圈的接受程度再高一點,監(jiān)管再與時俱進點。新老交替快完成的時候,就是AI在藥物研發(fā)中的騰飛之時。
責任編輯吳陽煜 wyy@nfcmag.com