□編譯/張含陽
大規(guī)模深度學(xué)習(xí)為女性帶來的醫(yī)療之變
□編譯/張含陽
研究人員證明,在乳腺X光影像的大數(shù)據(jù)集上訓(xùn)練以卷積神經(jīng)網(wǎng)絡(luò)(CNN)形式的深度學(xué)習(xí)模型,超越了計算機輔助檢測(CAD)最先進的系統(tǒng)。
最近,機器學(xué)習(xí)領(lǐng)域揭示了訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)的最新技術(shù),這使得在許多模式識別任務(wù)(如物體檢測和語音識別)中的應(yīng)用非常成功。
在機器學(xué)習(xí)應(yīng)用于醫(yī)療領(lǐng)域的最新研究中,科研人員利用手動設(shè)計的特征集和卷積神經(jīng)網(wǎng)絡(luò)(CNN),與最先進的乳腺影像CAD系統(tǒng)進行了比較。目的是為了建立一套智能系統(tǒng),使得該系統(tǒng)最終可以獨立地 “讀懂”女性乳房的X光照片。當(dāng)兩個系統(tǒng)均在約45000張圖片的大型數(shù)據(jù)集上訓(xùn)練時,結(jié)果表明,在低靈敏度下,CNN勝過傳統(tǒng)CAD系統(tǒng),而在高靈敏度下,二者表現(xiàn)相當(dāng)。
通過持續(xù)研究,科研人員試圖探究在多大程度上,這些特征仍可對CNN進行補充,比如位置、患者信息,以及常用的手動特征。同時,研究人員試圖研究CNN在高特異性上的改善,特別是對于包含那些CNN上不可用的位置及配置指令特征的信息。此外,科研人員還進行了一項實驗,他們將該CNN網(wǎng)絡(luò)與專業(yè)的放射科醫(yī)生進行比較,結(jié)果顯示,它們之間沒有明顯差異。
在美國,每年對近4000萬個女性乳房進行X光照相檢查,這主要是因為X光照相作為早期檢測乳腺癌的篩選程序,被證明可以大大增加患者生存的機會。許多西方國家都實施了類似的篩查方案。但是,這些數(shù)據(jù)必須要由一個或多個經(jīng)驗豐富的醫(yī)生來檢查是否存在癌癥病變的跡象,這是耗時、昂貴的過程,最重要的是,很容易出錯。
為了達到最佳、精準(zhǔn)的醫(yī)療效果,科研人員正不斷開發(fā)計算機輔助檢測和診斷(CAD)系統(tǒng),作為醫(yī)生診斷的輔助工具。來自美國的數(shù)據(jù)顯示,在篩選程序中,CAD系統(tǒng)在醫(yī)院設(shè)施中占比近70%,而在私人機構(gòu)中則高達85%。因為,計算機不會存在注意力下降的困擾,當(dāng)輸入數(shù)據(jù)相同時,結(jié)果也是一致的,并且可以用大量的訓(xùn)練樣本來訓(xùn)練,遠遠超過任何放射科專家在他的一生中所經(jīng)歷的影像樣本。
上圖為候選檢測的流水線。候選檢測器通過五個像素特征來訓(xùn)練,并應(yīng)用于所有圖像中的所有像素,生成似然圖像。似然圖像中的局部最優(yōu)被用作參考系統(tǒng)和CNN的種子點。
直到最近,那些依賴于經(jīng)過人工精心篩選的特征集的CAD系統(tǒng)和許多其他模式識別應(yīng)用程序的有效性,或許要被學(xué)習(xí)算法終結(jié)了。通常,在特征設(shè)計過程中,科研人員需要咨詢放射科醫(yī)生,如損傷的對比,毛刺特征的樣式和邊緣的銳度。這些特征上的改變雖然給醫(yī)生們了解病理知識提供了豐富的土壤,卻使得科研人員對于人腦如何看待識別過程被執(zhí)行,產(chǎn)生了很大的偏差。自人工智能(AI)作為一門科學(xué)學(xué)科誕生以來,研究已逐漸從基于規(guī)則的、問題特定的解決方案,越來越向基于學(xué)習(xí)未知的、通用的問題上轉(zhuǎn)變,其中深度學(xué)習(xí)是AI領(lǐng)域的最新進展。
通過直接從訓(xùn)練樣本中提煉信息,而不是通過該領(lǐng)域的權(quán)威專家,深度學(xué)習(xí)使得科研人員能夠更好地利用不斷增加的數(shù)據(jù)量,盡可能減少人為偏見。對于許多模式識別任務(wù),它已被證明是成功的,以至于現(xiàn)在有些系統(tǒng)可以達到人類,甚至超越人類的性能。
術(shù)語“深度”通常指的是學(xué)習(xí)系統(tǒng)中的分層非線性,這使得模型能夠以更少的參數(shù)來表示函數(shù),并且促進更有效的學(xué)習(xí)。這些模型并不是才誕生,自20世紀70年代末以來,相關(guān)的科研工作就已經(jīng)在進行了。然而,兩篇有關(guān)深度網(wǎng)絡(luò)的論文發(fā)表(一篇是在2006年,由Hinton,Osindero撰寫,另一篇是在2007年,由Bengio,Lamblin,Popovici,Larochelle撰寫),論文發(fā)現(xiàn),深度網(wǎng)絡(luò)可以通過貪婪算法、分層的方式訓(xùn)練,重新引燃了人們對人工智能的熱潮。
上圖為兩個系統(tǒng)的比較。候選檢測器生成一組候選位置。傳統(tǒng)的CAD系統(tǒng)(左)使用這些位置作為圖像分割算法的種子點。這些分割圖像用于計算基于區(qū)域的特征。第二個系統(tǒng)基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)(右),以相同的位置為中心。
受限玻爾茲曼機器(R BM)、概率生成模型和自動編碼器(AE)、單層神經(jīng)網(wǎng)絡(luò),當(dāng)把它們堆疊起來分別形成深信度網(wǎng)絡(luò)(DBN)和棧式自編碼神經(jīng)網(wǎng)絡(luò)(SAE)后,便成為了很好的模式識別器。目前,全監(jiān)督的卷積神經(jīng)網(wǎng)絡(luò)(CNN)占據(jù)著主導(dǎo)位置,相對于過去幾十年,AI這些年得到了高速發(fā)展,在很大程度上歸因于更有效的訓(xùn)練方法、硬件上的進步(如多核心計算的應(yīng)用),以及最重要的——大量的注釋訓(xùn)練數(shù)據(jù)。
在本論文中,科研人員通過一系列人工設(shè)計的特征,將卷積神經(jīng)網(wǎng)絡(luò)(CNN)和計算機輔助檢測和診斷系統(tǒng)(CAD)之間進行了比較,結(jié)果顯示,CNN勝過最先進的乳腺X線影像CAD系統(tǒng),數(shù)據(jù)集大約在45000張圖像??蒲腥藛T將檢測范圍集中在固體惡性病變,包括結(jié)構(gòu)扭曲,治療良性異常,比如假陽性的囊腫或纖維腺瘤。在該論文中,研究人員的目的并不是給出最簡特征集,而是使用一個完整的集合,其中包含所有通常應(yīng)用于乳房X光照相的描述符,并與深度學(xué)習(xí)的方法進行公平比較。
病變(a),其分割圖像(b),用于計算對比特征(c),以及用于計算邊緣銳度(d)的區(qū)域
過去兩年,對象識別的成功,可以部分歸功于科研人員明智地將卷積神經(jīng)網(wǎng)絡(luò)(CNN)與經(jīng)典計算機視覺技術(shù)相結(jié)合。本著這種理念,研究人員采用候選檢測器以獲得一組可疑位置,這些位置通過傳統(tǒng)系統(tǒng)或者CNN進行進一步檢查。我們隨后通過將學(xué)習(xí)的表示與諸如位置、對比度和患者信息等特征結(jié)合,來研究CNN到底在何種程度上仍然與傳統(tǒng)描述符是互補的。
在該論文中,研究人員證明,在乳腺X光影像的大數(shù)據(jù)集上訓(xùn)練的以卷積神經(jīng)網(wǎng)絡(luò)(CNN)形式的深度學(xué)習(xí)模型,超越了計算機輔助檢測(CAD)最先進的系統(tǒng)。因此,該網(wǎng)絡(luò)具有非常巨大的潛力,有助于推動科研水平的發(fā)展。其中,主要的優(yōu)點便是CNN利用數(shù)據(jù)學(xué)習(xí),而不依賴領(lǐng)域內(nèi)的專家,這使得醫(yī)療水平發(fā)展更簡單、更快捷。同時,該論文表明,添加位置信息和配置指令可以輕松地添加到該網(wǎng)絡(luò)中,并且?guī)讉€手動設(shè)計的特征可以進行一些小的改進。除此之外,科研人員將CNN與三個有經(jīng)驗的醫(yī)生進行了比較,其中兩個是專業(yè)的放射科醫(yī)生,結(jié)果證明,人類讀取X光片的能力和卷積神經(jīng)網(wǎng)絡(luò)具有類似的性能。
手機掃碼閱讀
上圖為網(wǎng)絡(luò)架構(gòu)的圖示,數(shù)字表示的是使用的內(nèi)核的數(shù)量??蒲腥藛T采用了VGG模型的縮小版本。為了看到常規(guī)特征仍然可以起作用的程度,網(wǎng)絡(luò)采用全監(jiān)督方式訓(xùn)練,隨后從最終層提取學(xué)習(xí)到的特征,并且與人工特征連接,并使用第二級分類器再訓(xùn)練。