張曄
近日,頂尖學(xué)術(shù)期刊《自然》上線了一項(xiàng)有關(guān)癌癥診斷的重要研究。
與以往不同的是,來自美國(guó)加州大學(xué)圣迭戈分校的科學(xué)家,通過訓(xùn)練人工智能從血液中鑒定微生物的遺傳物質(zhì),不僅可以識(shí)別出癌癥,還能對(duì)不同類型的癌癥做出區(qū)分。
“這是一個(gè)很有前景的方向,改變了傳統(tǒng)的檢測(cè)方法,而且運(yùn)用人工智能技術(shù),使得海量的檢索和比對(duì)工作得以快速而準(zhǔn)確地完成?!蹦暇┬畔⒐こ檀髮W(xué)教授徐軍評(píng)價(jià)道。
菌群與人體的關(guān)系毫無疑問是十分密切的。近年來,許多研究證據(jù)顯示,人體微生物對(duì)多種類型的腫瘤有“貢獻(xiàn)”??茖W(xué)家猜想,這些微生物在癌癥中所起的作用也許比我們已知的更多。因?yàn)橐郧暗陌┌Y研究工作,忽略了人體癌細(xì)胞與微生物可能有復(fù)雜的相互作用。
美國(guó)加州大學(xué)圣迭戈分校的科學(xué)家有了一個(gè)大膽的設(shè)想:分析血液中來自微生物的遺傳物質(zhì),可以根據(jù)其特征模式來識(shí)別體內(nèi)的腫瘤。
如果在過去,這種設(shè)想真的只能是想想罷了,“這是因?yàn)榧?xì)菌的數(shù)量十分龐大,檢測(cè)它們的基因序列將是一個(gè)海量工程?!毙燔娬f,但是得益于基因測(cè)序技術(shù)的發(fā)展,現(xiàn)在測(cè)序的費(fèi)用與時(shí)間都在大幅下降,同時(shí)微生物的基因測(cè)序也能夠運(yùn)用AI技術(shù),效率能大大提升。
研究人員在幾千份樣本中找到相應(yīng)的微生物特征后,把工作交給了人工智能。通過相應(yīng)的機(jī)器學(xué)習(xí)模型來挖掘大量數(shù)據(jù),把特定的微生物序列特征與特定的癌癥相匹配。
“機(jī)器學(xué)習(xí)的方式主要有監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),從這個(gè)項(xiàng)目公開的信息來看,采用的是監(jiān)督學(xué)習(xí)模式?!毙燔姺治稣f,監(jiān)督學(xué)習(xí)的特點(diǎn)是人類會(huì)把知識(shí)傳授給計(jì)算機(jī),計(jì)算機(jī)根據(jù)樣本的特征進(jìn)行學(xué)習(xí),接下來就能夠自動(dòng)區(qū)分疾病或者健康的樣本。
另一種非監(jiān)督學(xué)習(xí)將能夠使得機(jī)器具備更高的智能,即人類沒有給計(jì)算機(jī)提示,計(jì)算機(jī)通過歸納的樣本之間的規(guī)律和模式,突破了以往需人類干預(yù)才可學(xué)習(xí)的局限。
“現(xiàn)在還有一種新的非監(jiān)督學(xué)習(xí)模式——對(duì)抗學(xué)習(xí),其特點(diǎn)是人類設(shè)計(jì)出兩個(gè)模型,一個(gè)用于制造偽裝數(shù)據(jù),另一個(gè)用于鑒別偽裝,在你來我往中實(shí)現(xiàn)互贏,最后達(dá)到納什均衡狀態(tài)。”徐軍認(rèn)為,我國(guó)擁有大量的疾病數(shù)據(jù),醫(yī)學(xué)和人工智能領(lǐng)域之間如果能夠長(zhǎng)期深入合作,將能夠更好地為患者服務(wù)。
從此項(xiàng)研究的結(jié)果來看,這套AI模型在實(shí)際診斷中是可靠的??茖W(xué)家讓AI對(duì)100名患者的樣本血漿進(jìn)行分析,并與69名健康無癌個(gè)體的血樣進(jìn)行比較。機(jī)器學(xué)習(xí)模型不僅可以區(qū)分患癌和無癌的樣本,還能區(qū)分不同類型的癌癥:以86%的敏感性識(shí)別出肺癌患者,對(duì)于無肺部疾病的個(gè)體沒有出現(xiàn)假陽性報(bào)告,并且以81%的準(zhǔn)確率區(qū)分出前列腺癌和肺癌。
專家認(rèn)為,AI和大數(shù)據(jù)的加入,可以完成更加復(fù)雜的任務(wù)。比如基因序列的讀取,是人的眼睛和智力水平基本上無法完成的,而人工智能和大數(shù)據(jù)技術(shù)的廣泛使用將能夠很好地解決這個(gè)問題。