方陵生/編譯
賽博科學(xué)家
方陵生/編譯
生物技術(shù)初創(chuàng)公司Zymergen利用AI控制一項菌株培養(yǎng)任務(wù),機器人手指正在選擇能夠產(chǎn)生更多化學(xué)物質(zhì)的微生物菌落
● 人工智能不再只是一種工具,在一些實驗室里,它能夠構(gòu)思并做實驗,然后解釋結(jié)果。
如果說這是未來生物實驗室的圖景,那么今天的實驗室和它已經(jīng)沒有什么很大的不同了。穿著白色實驗服的科學(xué)家在裝著冷凍試管的箱盒旁走動著,架子上擺滿了各種化學(xué)品:一瓶瓶純酒精、糖、蛋白質(zhì)和鹽,這些是培養(yǎng)微生物和操縱基因的標準配置。至于人工智能,直到你在風(fēng)扇低沉的嗡嗡聲中聽到機器人似蛐蛐叫的聲音時,你才會注意到它們的存在。
這些機器人都是為Zymergen工作的,Zymergen是一家生物技術(shù)公司,2014年建立于加利福尼亞舊金山灣東海岸的一個電子廠舊址上。這里每天都在進行著各種各樣的微生物實驗,以尋找提高有用化學(xué)品產(chǎn)量的途徑。在一片雜亂的設(shè)備叢中有一個叫“回聲”的機器人,它的機械臂抓起一個嵌有數(shù)百個裝著液體小格的塑料塊,激光掃描塑料塊一側(cè)的條形碼后,“回聲”將它放到托盤上。接下來發(fā)生的事情非常微妙,人眼難以觀察得到。
“它吸移液體時并不是復(fù)制人手操作的方式,”該公司聯(lián)合創(chuàng)始人之一、分子生物學(xué)家、運營工程副總裁杰德·迪安(Jed Dean)說道,“而是一種完全不同的方式。”它用一個移液管吸取以微升計的微量液體并噴射到塑料塊的每個凹槽小格里(在細胞尺度上就相當于潮汐波浪般的水量了),事實上機器人從來沒有接觸到它,而是通過每秒500次的聲波脈沖使液體自身產(chǎn)生漣漪,吸移比人類傳送操作時小到1‰的水滴。
以上情景并不是在未來發(fā)生的。一些大型生物實驗室使用機器人和條形碼已經(jīng)有多年歷史,被稱為聲波液滴噴射(ADE)的液體移動技術(shù)甚至已經(jīng)存在了幾十年。當問及實驗機器人目前正在做什么實驗的時候,迪安透露說,這個實驗不是他設(shè)計的,而是一個計算機程序的輸出結(jié)果。
“我想讓一切都清楚明白,”Zymergen首席執(zhí)行官約書亞·霍夫曼(Joshua Hoffman)說道,他指的是一個長期以來的誤解。他說,“在這個決策圈里有一位人類科學(xué)家,觀察結(jié)果并進行真實性檢驗?!钡?,在數(shù)據(jù)解釋、假說產(chǎn)生以及實驗計劃制定方面,最終的目標是“擺脫人類的直覺”。
Zymergen是有著相同目標的幾家公司之一:利用人工智能(AI)來增強或取代人類在科學(xué)過程中的作用?!罢f起人工智能,人們就會想到機器人下棋?!痹摴臼紫夹g(shù)官亞倫·金伯爾(Aaron Kimball)說道?!拔覍L很滿意,”霍夫曼說,ML指的是機器學(xué)習(xí),是計算機科學(xué)的一個分支,它幾乎包攬了AI最新進展的所有成果,“AI滲透進了所做的一切事情。”
Zymergen實際研究開發(fā)的工業(yè)微生物,最終為生物燃料、塑料或藥物提供原材料。為了提高生產(chǎn)效率,一些公司將他們主要的菌株樣本送到Zymergen,然后由機器人對每種微生物的基因組進行探索和修改,以便設(shè)計出生產(chǎn)效率更高的產(chǎn)品?!皢栴}是,被送到Zymergen的微生物本身已是高度優(yōu)化的?!被舴蚵f。經(jīng)過多年的研究和培育,這些細胞對于它們所要做的事情已經(jīng)非常擅長。因此,要“擠出”更高的效率需要深入研究基因組,做很多次的實驗,并且跟蹤每次實驗的數(shù)據(jù);換句話說,就是要搞科學(xué)研究。Zymergen試圖加速科學(xué)研究的進度?;舴蚵f道,在傳統(tǒng)生物學(xué)研究中,“一個人站在實驗臺前,對各種假設(shè)進行測試,但數(shù)量終究有限,比如說每個月可以測試10種假設(shè)。”而讓機器人來做這樣的工作就快多了,Zymergen運行的機器每周可做多達1 000次實驗。但是機器人只會遵照人類的指令行事:如何給它們提供正確的命令才是真正的瓶頸。
當有人問如何通過算法設(shè)計實驗時,金伯爾從一個簡單的前提開始說起,“比如原來的微生物有大約5 000個基因,假設(shè)有10種方法可以改變某個基因,那么你就需要做50 000次實驗來進行嘗試,實驗性的“戰(zhàn)役”一開始就要培育1 000個菌株,每一株都有一個有意為之的突變?!彼f,“每一株都生活在一個小水滴里,你要給它喂糖,讓它‘烹調(diào)’一段時間,然后檢測可以獲得多少產(chǎn)品?!逼渲锌赡軙?5株能夠產(chǎn)生稍微多一些的目標化學(xué)物質(zhì),這些菌株成為下一輪實驗的“種畜”,其余的則存放到冷凍室。“但發(fā)現(xiàn)之路絕不會是平坦的。尋找正確的突變組合需要對遺傳基因的整體‘景觀’進行漫長而曲折的探索,”金伯爾說,“盲目地朝著效率頂峰的方向走去,永遠不會實現(xiàn)真正重大的登頂。這是因為如果你只是把所有產(chǎn)生微小改進的突變結(jié)合到一種微生物中,它們不會有大的增益。相反,微生物還會‘生病’,遠遠不如原來的菌株健康?!痹谶x擇正確道路的過程中,需要繞過許多曲折的歧路旁道,才有可能抵達廣闊的山谷,需要心中擁有一種同時顯示所有突變影響的心理地圖,一種三維的、包括成千上萬突變的心理地圖。機器學(xué)習(xí)需要時刻保持導(dǎo)向。但這里關(guān)鍵的區(qū)別在于:當機器人最終發(fā)現(xiàn)能促進化學(xué)產(chǎn)出的基因變化時,人們對生物效應(yīng)背后的生物化學(xué)卻仍然毫無頭緒。
自動化的發(fā)現(xiàn)之路
如果實驗不能加深我們對生物學(xué)原理的理解,那真的是科學(xué)嗎?但對于金伯爾,這并不是問題,“我們能得到回報,是因為它可行,而不是因為我們明白為什么。”
霍夫曼說道,至目前為止,Zymergen的機器人實驗室將生產(chǎn)效率提高了10%以上,這個增長幅度聽起來可能并不算多,但對于以微生物發(fā)酵為基礎(chǔ)的年產(chǎn)值1 600億美元的化學(xué)工業(yè)部門來說,這一點提高轉(zhuǎn)化的經(jīng)濟效益,比國家科學(xué)基金會每年70億美元的預(yù)算還要多。機器人發(fā)現(xiàn)的占有優(yōu)勢的遺傳變化代表著真正的發(fā)現(xiàn),包括那些人類科學(xué)家可能還沒有確認的一些發(fā)現(xiàn)。例如,大多數(shù)促進產(chǎn)出的基因與合成想要的化學(xué)物質(zhì)沒有直接關(guān)系,其中一半沒有已知的功能?!拔乙呀?jīng)在幾種不同的微生物中看到了這種模式,”迪安說,在沒有機器學(xué)習(xí)的情況下,找到正確的基因組合就像在保險箱的轉(zhuǎn)盤上試圖用數(shù)千個數(shù)字破解密碼一樣,“我們的直覺在復(fù)雜性面前很容易一觸即潰。”到底有多少科學(xué)可以委托給機器學(xué)習(xí)系統(tǒng),這取決于你問的是誰?!昂芏?。”加利福尼亞大學(xué)研究基因組學(xué)的計算機科學(xué)家伊利亞斯·塔格科波洛斯 (Ilias Tagkopoulos)說,“如果沒有理由,我們就不能讓數(shù)據(jù)決定我們下一步應(yīng)該做什么實驗,從而最大限度地提高信息的獲取率和接近我們的目標?!彼此茻o窮無盡的應(yīng)用包括預(yù)測改變醫(yī)院環(huán)境的細菌的進化,以及設(shè)計更健康美味的休閑食品等,基本上包括任何復(fù)雜的優(yōu)化問題。
如果機器真的能在某些科學(xué)任務(wù)中取代人類,許多科學(xué)家都將欣然接受。與工人或出租車司機不同的是,大多數(shù)研究人員都喜歡自動化部分工作。特別是在分子和細胞生物學(xué)領(lǐng)域內(nèi),諸如噴出液體、電鍍細胞、計數(shù)菌落等手工操作,都是相當繁瑣和昂貴的。某位研究生最微不足道的一點小小的失誤或計算不精確,都有可能會浪費數(shù)周的工作成果。在更糟糕的情況下,為那位學(xué)生設(shè)計實驗的博士后的草率決定,甚至可能會導(dǎo)致幾個月的辛勤勞動付之東流。
然而,一些生物學(xué)家在用人工智能解釋數(shù)據(jù)和設(shè)計實驗后,卻發(fā)現(xiàn)它并沒有想象中那么理想?!拔覀儼l(fā)現(xiàn),現(xiàn)有的機器學(xué)習(xí)方法仍然不足以完成這個任務(wù)?!奔永D醽喫固垢4髮W(xué)計算生物化學(xué)家萊朱·達斯(Rhiju Das)說道,他的研究領(lǐng)域是分子折疊和新藥物設(shè)計。“與利用同樣數(shù)據(jù)的人類相比,它們在RNA設(shè)計問題上失誤得可怕。”盡管他不知道這是為什么,但涉及“設(shè)計”的任務(wù)似乎更需要人類的直覺。也許Zymergen碰巧遇到了一些生物學(xué)中極少見的非常適合計算機控制的部分實驗。加利福尼亞門洛帕克的Transcriptic是另一家探索自動化的生物技術(shù)公司,它的創(chuàng)始人之一馬克斯·霍達克(Max Hodak)也意識到了這種方法的局限性,他相信機器人可以承擔實驗室很多單調(diào)乏味的工作。但他說,“如果你還在用你的雙手做事,那你就不是在做科學(xué)研究?!钡飳W(xué)家的大腦不會很快被取代,因為自然世界是如此的復(fù)雜?;暨_克說道,“進化帶來了生物物種的豐富性,但這也是為什么它這么難以理解,它具有不可簡約、不可還原的復(fù)雜性。”為了設(shè)計更好的實驗,人工智能可以給生物學(xué)家一些有限的幫助,但他擔心外包更多的科學(xué)過程將“比我們想象的復(fù)雜得多。”霍達克說。
即使人工智能控制研究工作能夠行得通,人類會明白計算機發(fā)現(xiàn)了什么嗎?結(jié)果背后的計算可能仍然是一個黑匣子?!耙粋€引人注目的可能性是,我們正在結(jié)束一個‘可理解的’科學(xué)時代?!辟e夕法尼亞匹茲堡市卡內(nèi)基梅隆大學(xué)與分子生物學(xué)家進行合作研究的計算機科學(xué)家阿德里安·特里尤勒(Adrien Treuille)說道,研究人員對計算機的依賴可能不僅是做科學(xué)實驗,而且還要對它做出解釋,生物學(xué)理論的一些證據(jù)是如此的復(fù)雜,接受這些證據(jù)需要對計算結(jié)果有信心才行。
既然如此,科學(xué)家是否應(yīng)該把他們的計算機也作為論文的合著者呢?“我當然不會這么做,”波士頓一家利用人工智能進行科學(xué)發(fā)現(xiàn)的Nutonian公司的首席執(zhí)行官邁克爾·施米特 (Michael Schmidt)說道,但他又加了一句,“嗯,當人工智能可以讀并能理解報紙的時候,它們就能成為作者了。”
[資料來源:Science][責任編輯:松 石]