李心怡 賈婉楠 吳健復(fù)旦大學上海醫(yī)學院,上海000;復(fù)旦大學基礎(chǔ)醫(yī)學院,上海000;復(fù)旦大學附屬中山醫(yī)院消化科,上海000
20世紀50年代,計算機剛剛出現(xiàn),就有人提出“人工智能”的概念。機器學習是實現(xiàn)人工智能的一種方法,是計算機通過各種算法對數(shù)據(jù)進行分析,不斷訓(xùn)練用以預(yù)測或決策現(xiàn)實生活的問題。而深度學習(deep learning)是機器學習的一種技術(shù),能整合龐大的數(shù)據(jù)集,學習由輸入值到輸出值之間復(fù)雜的函數(shù)關(guān)系。各種神經(jīng)網(wǎng)絡(luò)組成深度學習模型,在生物研究和生物醫(yī)學中有諸多應(yīng)用,例如預(yù)測遺傳變異在具體發(fā)病機制中的細胞學過程,篩選調(diào)節(jié)治療相關(guān)蛋白質(zhì)活性的小分子以及醫(yī)學影像的判讀。深度學習廣闊的應(yīng)用前景也給研究者們帶來了巨大挑戰(zhàn),在技術(shù)層面上,深度學習模型的性能需要不斷提高;在應(yīng)用層面上,深度學習需要獲得醫(yī)生、監(jiān)管部門和其他相關(guān)機構(gòu)的信任,才能成為輔助決策的良好助手。本文對深度學習的基本神經(jīng)網(wǎng)絡(luò)、在生物醫(yī)學和研究中的應(yīng)用、其面臨的挑戰(zhàn)及應(yīng)用前景進行綜述。
深度學習的名稱來源于深度神經(jīng)網(wǎng)絡(luò)(deep neural networks,DNN),框架基礎(chǔ)為人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)。本文首先介紹幾種基本的神經(jīng)網(wǎng)絡(luò),以期有助于加深對深度學習的理解。
20世紀60年代,科學家發(fā)現(xiàn)貓在視物時,視皮層的不同神經(jīng)元能被激活,證明眼睛與視皮層的神經(jīng)元之間聯(lián)系密切,可逐級處理視覺信息[1-2]。此后,通過抽象和模擬人腦神經(jīng)元,建立了多層復(fù)雜模型,以層為單位將提取到的顏色、形狀、輪廓等各種特征進行整合處理,這一數(shù)據(jù)運算模型被稱為ANN。
DNN可看作由輸入層、隱藏層和輸出層組成的變換數(shù)學函數(shù),有多個層次,前一層的輸出作為后一層的輸入來運算,其模式如圖1A所示。深度學習的另一個重要特性是可訓(xùn)練性,常用的訓(xùn)練方式是反向傳播[3]。在設(shè)計一個神經(jīng)網(wǎng)絡(luò)時,人們不能確保初始設(shè)定的權(quán)重能使誤差最小,所以常需反復(fù)調(diào)整權(quán)重。數(shù)據(jù)依次通過輸入層、隱藏層和輸出層,正向傳播得到預(yù)測值;繼而將預(yù)測值與真實值進行比較;若誤差不能達到目標,則通過不斷調(diào)整權(quán)重減小兩者的誤差。調(diào)整權(quán)重的過程呈現(xiàn)反向傳播的特點,“反向”是指從輸出值到輸入值的計算流程,類似于生物體內(nèi)反饋調(diào)節(jié)原理。
在不同的深度學習構(gòu)架中,循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)在處理序列輸入的方面占優(yōu)勢。RNN的特點是記憶功能,即在輸入新數(shù)據(jù)時能讀取儲存的舊數(shù)據(jù),其模式如圖1B所示。與其他構(gòu)架相似,RNN也可用反向傳播來訓(xùn)練;其在RNA序列剪接、語音識別和機器翻譯等方面應(yīng)用廣泛[4]。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)在深度學習中運用廣泛,主要用于圖像識別和分類,在DNN中加入卷積層,其實就是加入了特征學習的部分。每一卷積層可提取輸入的不同特征,稱之為不同感受野[5-6],類似于人腦在處理視覺信息時對不同特征的提取。卷積層提取特征是個由低級到高級的遞進過程,首個卷積層的濾波器提取初級特征,其輸出信號可作為下一卷積層的輸入,如此逐層推進,達到識別人臉或圖像等復(fù)雜特征之功效。卷積計算過程的模式如圖1C所示。
圖1 深度學習中不同神經(jīng)網(wǎng)絡(luò)的基本原理及流程
長期以來,計算機視覺識別廣泛運用于生物醫(yī)學影像的自動分析。研究聚焦于人工智能對圖像的處理,如分類、分割、配準、目標探測和追蹤等。這些新技術(shù)已應(yīng)用于醫(yī)學成像、診斷、病理學、高內(nèi)涵篩選、分子成像等領(lǐng)域。
利用深度學習可分析X線、MRI、CT掃描圖片、腦電圖等,其具體應(yīng)用主要分為3類:醫(yī)學診斷、生物學圖像分析和數(shù)據(jù)建模。要將千變?nèi)f化的影像學信息轉(zhuǎn)變成能被計算機識別、加工的數(shù)據(jù),并給出相應(yīng)的診斷或建議,關(guān)鍵在于如何標注大批量數(shù)據(jù),并監(jiān)控標注數(shù)據(jù)的質(zhì)量,這有賴于受過專門培訓(xùn)專業(yè)人員的素養(yǎng)和效率。臨床上對同一張影像常無標準答案;對“需由幾個醫(yī)生分若干階段進行標注”的問題缺乏共認標準。這使得圖像輔助識別更為困難。
深度學習模型通過對醫(yī)療數(shù)據(jù)進行分析和建模,能推斷出異常病變或發(fā)病風險,作為臨床診治的一種輔助手段,在一定程度上可提高診斷效率和準確度,減輕醫(yī)生的工作負擔。
Son等[7]利用深度學習模型篩選異常的眼底視網(wǎng)膜圖像,測試10萬多張圖像的超過30萬個讀數(shù)和2個外部數(shù)據(jù)集,內(nèi)容包括出血、硬性滲出物、黃斑裂孔、脈絡(luò)膜萎縮或瘢痕等12個指標。將深度學習模型的靈敏度和特異性與眼科專家的檢查結(jié)果對比后發(fā)現(xiàn),深度學習模型能對黃斑中心視網(wǎng)膜眼底圖像進行分類,推動了視網(wǎng)膜眼底圖像自動篩查系統(tǒng)的臨床應(yīng)用。
膠囊內(nèi)鏡在小腸檢查中應(yīng)用廣泛,但其拍攝到的視頻長達8~10 h,對醫(yī)生來說非常費時。Ding等[8]開發(fā)了一種基于CNN的算法,幫助醫(yī)生分類和評估小腸膠囊內(nèi)鏡圖像。檢測結(jié)果表明,該模型發(fā)現(xiàn)視頻異常的靈敏度為99.88%,對病灶的靈敏度為99.90%;而醫(yī)生常規(guī)讀片對病例的靈敏度為74.57%,對病灶的靈敏度為76.89%。每位患者的常規(guī)讀片時間平均為96.6 min,而該模型縮短為5.9 min。因此,CNN算法對小腸膠囊內(nèi)鏡圖像分析的敏感性可超過醫(yī)生,同時也提高了效率。
Hsieh等[9]建立了一個分析中小血管病變MRI圖像的輔助診斷系統(tǒng)。該系統(tǒng)采用CNN分析腦血管閉塞程度,并將結(jié)果輸出到標記圖像中。標記內(nèi)容包括小血管的坐標位置、阻塞范圍、面積大小,以及是否可能導(dǎo)致卒中,最后對患者所有的MRI圖像進行合成,清晰顯示腦內(nèi)小血管的三維結(jié)構(gòu),幫助臨床醫(yī)生快速判斷患者卒中的可能性和嚴重程度。
目前美國食品藥品監(jiān)督管理局已批準深度學習系統(tǒng)用于心臟分割、腫瘤追蹤和視網(wǎng)膜病變檢測。隨著系統(tǒng)輸出結(jié)果在相關(guān)領(lǐng)域內(nèi)可信度的提高,科學家將研發(fā)出更多新系統(tǒng),助推更高級別的診斷決策。圖2列出了人工智能適用于輔助診斷的疾患及病變類型。
圖2 深度學習在醫(yī)學影像診斷中的具體應(yīng)用
除了醫(yī)學圖像分析,一些基礎(chǔ)研究的圖像也需要進行高通量手段處理。
細胞分裂速率和各分裂階段耗時的差異是區(qū)分正常和腫瘤細胞的重要指標[10]。腫瘤細胞在分裂時會出現(xiàn)有絲分裂構(gòu)型的差錯,所以細胞有絲分裂及其機制對開發(fā)抗腫瘤藥物意義重大,但人工處理有絲分裂構(gòu)型難以實現(xiàn)。Mao等[11]利用時域顯微圖像解決了有絲分裂中定位和分期的難題,該法對有絲分裂事件的定位準確率達99.2%,回收率達98.0%。
外周血顯微檢查是臨床常規(guī)檢查。識別不同類型白細胞需要技術(shù)人員通過光鏡觀察,利用專業(yè)知識和經(jīng)驗[12],耗時且?guī)е饔^判斷因素;利用基于CNN的分類方法能自動識別上述不同類別的白細胞。Wang等[13]利用含14 700幅標注圖像數(shù)據(jù)集訓(xùn)練一個檢測模型,并利用包含11類外周血白細胞的測試集對模型進行了評估,檢測準確度達90%,每幅圖像平均耗時僅53 ms,而人工讀片時間平均需約20 min。
應(yīng)對精準醫(yī)療的需求,臨床亟需從宏觀影像信息中獲取遺傳變異、表觀遺傳學差異等微觀因素,并應(yīng)用于預(yù)測預(yù)后、指導(dǎo)診斷和治療過程。目前深度學習技術(shù)已用于統(tǒng)計方法建模,完善醫(yī)學影像體系,輔助臨床決策。
Larson等[14]開發(fā)了一種基于深度學習的骨齡X光片評估模型,并與放射科專家和自動化模型比較評估結(jié)果。研究者共采集了14 036張手部X光片,訓(xùn)練了一個包含50層、每秒浮點運算次數(shù)為3.8×109的深度殘差網(wǎng)絡(luò)。在200例測試數(shù)據(jù)集中,模型的估計值與專家預(yù)測結(jié)果的平均差為0歲,平均絕對誤差為0.50歲,均方根差為0.63歲。故認為該深度學習模型能準確估計骨齡,且性能與專家預(yù)測水平相當。
確保活產(chǎn)是輔助生殖技術(shù)的最終目標,產(chǎn)婦年齡是影響活產(chǎn)率的主要因素。為了實現(xiàn)在無創(chuàng)前提下按照年齡預(yù)測患者的活產(chǎn)概率,Miyagi等[15]建立了識別囊胚電子顯微鏡圖像的分類模型,每個年齡段分類模型的設(shè)計原理均以CNN為基礎(chǔ),評估結(jié)果顯示該模型的敏感性和特異性均優(yōu)于常規(guī)胚胎檢測方法。
隨著分子生物學的飛速發(fā)展,高通量基因測序技術(shù)不斷進步,全基因組測序也越來越易于完成,測序產(chǎn)生大量組學數(shù)據(jù)等待分析。無論是微生物種屬比較和新種屬鑒定、核酸的復(fù)制、轉(zhuǎn)錄和表達,還是疾病分類和藥物作用預(yù)測,每項突破均依賴于組學數(shù)據(jù)的新發(fā)現(xiàn)。深度學習模型對處理以大數(shù)據(jù)為特征的組學信息極為有助,采用合適模型,經(jīng)過訓(xùn)練,可大大加快處理速度。
通過比較正常組織與病灶(如腫瘤組織)的基因表達信息,得到兩者間差異,根據(jù)基因組學對疾病進行診斷或分類。以腫瘤為例,高維度的復(fù)雜信息是數(shù)據(jù)分析的巨大挑戰(zhàn)。Fakoor等[16]在深度學習中運用主要成分分析將數(shù)據(jù)進行降維且保留其主要特征,使上述問題得以圓滿解決;另外,由于某些類型腫瘤的數(shù)據(jù)量較小,他們用未分類的數(shù)據(jù)代替分類數(shù)據(jù),使小數(shù)據(jù)量腫瘤類型在診斷時也可應(yīng)用其他類型腫瘤學習得到特征性數(shù)據(jù)。Yu等[17]發(fā)現(xiàn)在疾病分類中,單隱藏層或雙隱藏層的DNN更適用于RNA-seq和高通量代謝組學的表型分類,而CNN的分析結(jié)果不盡人意,這可能是由于后者在空間結(jié)構(gòu)上不擅長分析組學數(shù)據(jù)矩陣。
測試全基因組表達譜的費用較高,一個替代方案是先得到L1000——即1 000個精心挑選基因的表達譜,然后據(jù)此推斷出剩余基因的表達譜。Chen等[18]提出了D-GEX深度學習方法,以多層前饋神經(jīng)網(wǎng)絡(luò)來完成上述推斷,與先前使用的線性回歸相比,該法誤差更小,性能更好。在對該法的性能評估時,研究人員發(fā)現(xiàn)當該神經(jīng)網(wǎng)絡(luò)的隱藏層數(shù)增多,且每層隱藏單位相應(yīng)增多,推斷結(jié)果的整體誤差就越小,可見深層的構(gòu)架要比淺層構(gòu)架更具代表性。
深度學習在根據(jù)轉(zhuǎn)錄組數(shù)據(jù)預(yù)測藥物-靶標的相互作用方面具有獨特作用。藥物-靶標作用對新藥研發(fā)具有重大意義,可從疾病或藥物的角度來研究藥物定位,并預(yù)測藥物的不良反應(yīng)[19]。Xie等[20]建立了藥物相關(guān)的基因表達數(shù)據(jù)庫,對含有2 000個隱藏單位的DNN模型進行訓(xùn)練,并對數(shù)據(jù)進行約200倍的降維,使得DNN模型可鑒定患者樣本間的差異,以此來預(yù)測藥物-靶標作用的差異。
深度學習還可推測基因的復(fù)制、轉(zhuǎn)錄、剪接等過程。Liu等[21]提出了DNN與隱馬爾科夫模型(hidden Markov model,HMM)的DNN-HMM混合模型,其利用DNA序列來識別新突變的復(fù)制結(jié)構(gòu)域。增強子位于DNA非編碼區(qū),與轉(zhuǎn)錄過程相關(guān),是調(diào)控基因表達的重要元件。Liu團隊[22]開發(fā)了PELDA的深度學習算法框架,將前述的DNN-HMM作為其中的一個單元,在識別復(fù)制結(jié)構(gòu)域的同時識別增強子,預(yù)測增強子調(diào)控基因轉(zhuǎn)錄能力;DNN-HMM需要在單一細胞類型中訓(xùn)練,而PELDA可在多種細胞或組織類型中訓(xùn)練,更為靈活;PELDA還可擴展到其他功能元件或識別功能域,有助于研究啟動子、增強子或抑制因子對轉(zhuǎn)錄過程的影響。
預(yù)測選擇性剪接對研究基因產(chǎn)物具有重要意義。Zhang等[23]依據(jù)深度學習建立了RNA-seq轉(zhuǎn)錄剪接分析模型——DARTS,其中DNN部分通過外顯子的序列特征和基因調(diào)控特征來預(yù)測選擇性剪接。DARTS已應(yīng)用于研究上皮-間質(zhì)轉(zhuǎn)化過程中的選擇性剪接,對分析胚胎發(fā)育和癌癥轉(zhuǎn)移意義重大。傳統(tǒng)RNA-seq分析選擇性剪接需要高序列覆蓋,而該模型可預(yù)測低表達基因的選擇性剪接,有效改進了傳統(tǒng)方法。
在選擇性剪接中發(fā)揮重要作用的還有RNA結(jié)合蛋白(RNA binding protein,RBP)。由于與RBP結(jié)合的單鏈RNA空間構(gòu)型變化多端,需要多個結(jié)合結(jié)構(gòu)域的組裝才能完成正確結(jié)合,因此深度學習模型對RBP的預(yù)測比對轉(zhuǎn)錄因子更為困難。Alipanahi等[24]開發(fā)的DeepBind工具通過卷積層、糾正層、池化層和神經(jīng)網(wǎng)絡(luò)層4個階段,以體外參數(shù)進行訓(xùn)練,能較準確地鑒定體內(nèi)的相關(guān)結(jié)合序列。另外,DeepBind還能識別與結(jié)合位點產(chǎn)生或消失相關(guān)的突變序列,分析其對蛋白質(zhì)結(jié)合位點的影響,在精準醫(yī)療領(lǐng)域應(yīng)用前景廣闊。
X射線晶體學、核磁共振光譜學和電子顯微術(shù)等實驗方法可用于確定蛋白質(zhì)結(jié)構(gòu),但技術(shù)要求高、成本高、耗時長以及人工需求大等因素限制了這些技術(shù)的普遍開展,也為深度學習在該領(lǐng)域提供了用武之地。深度學習不僅可用于識別、預(yù)測蛋白質(zhì)的二級、三級結(jié)構(gòu),還可分析蛋白質(zhì)-藥物結(jié)合和蛋白質(zhì)-蛋白質(zhì)相互作用,以揭示疾病發(fā)病機制、研發(fā)藥物與疫苗以及尋找合適的藥物靶點。
蛋白質(zhì)二級結(jié)構(gòu)是三級結(jié)構(gòu)的基礎(chǔ),傳統(tǒng)的觀點是將其分為3部分——α螺旋、β折疊和無規(guī)則卷曲,稱為Q3;但現(xiàn)已將Q3擴展為Q8。Q8蛋白質(zhì)二級結(jié)構(gòu)預(yù)測較Q3更為復(fù)雜。
Zhang等[25]使用一個卷積-雙向RNN對上述內(nèi)容進行了預(yù)測。與二維CNN不同,這里使用的一維CNN適用于序列分析,模擬相鄰氨基酸的相互作用;雙向RNN由兩部分組成,分別為從序列起始端正向分析和從序列末端逆向分析的RNN。得益于RNN能記憶過去輸入值的特點,雙向RNN可模擬遠距離氨基酸的相互作用。結(jié)合相鄰氨基酸作用和遠距離氨基酸作用,該模型能預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。DN-Fold模型[26]具有相似的應(yīng)用,可預(yù)測樣本和數(shù)據(jù)庫中模板蛋白質(zhì)是否具有相同的折疊結(jié)構(gòu),以此鑒定蛋白質(zhì)的三級結(jié)構(gòu)是否相似;該模型在大數(shù)據(jù)集和不同倍數(shù)識別水平的應(yīng)用中性能良好。
蛋白質(zhì)-蛋白質(zhì)相互作用與疾病的發(fā)病機制關(guān)系密切。為了研究戈謝病中酶功能喪失的分子機制,Romero等[27]應(yīng)用深度學習模型(其中卷積層能捕獲低維潛在空間內(nèi)大規(guī)模構(gòu)象運動),比較了活性與非活性狀態(tài)葡糖腦苷脂酶(glucocerebrosidase,GCase)-鞘脂激活蛋白C(saposin C,SPAC)復(fù)合物的構(gòu)象改變,從原子層面研究突變GCase在戈謝病的機制。該研究結(jié)果發(fā)現(xiàn)GCase與SPAC的相互作用能穩(wěn)定酶底物的結(jié)合位點,而突變GCase無法與SPAC進行正常的相互作用,從而引起功能障礙和疾病發(fā)生。
深度學習有助于尋找與主要組織相容性復(fù)合體Ⅰ(major histocompatibility complexⅠ,MHC-Ⅰ)類分子具有高親和力的肽鏈。具有二級結(jié)構(gòu)肽鏈折疊形成的超二級空間結(jié)構(gòu)稱為結(jié)構(gòu)模體(structural motif),它是MHC與肽鏈結(jié)合的重要結(jié)構(gòu),但僅僅通過核酸序列無法精確定位模體。Xiao等[28]開發(fā)了模體激活定位網(wǎng)絡(luò),從MHC-Ⅰ-肽復(fù)合物中提取模體,然后在模體中替換氨基酸,在保持模體功能結(jié)構(gòu)不變的基礎(chǔ)上改變其親和力,從而得到高親和力MHC分子結(jié)合肽,用于疫苗的開發(fā)。
綜上所述,深度學習在醫(yī)學影像、組學數(shù)據(jù)和蛋白質(zhì)空間結(jié)構(gòu)等生物醫(yī)學數(shù)據(jù)分析中應(yīng)用廣泛,并不斷改進優(yōu)化。為便于查詢,現(xiàn)將已知深度學習工具的開發(fā)年份、主要任務(wù)和所用模型歸納于表1。
表1 深度學習在生物醫(yī)學數(shù)據(jù)分析中的應(yīng)用
深度學習將生物醫(yī)學信息分析引入了一個新時代,隨著各種技術(shù)的開發(fā)和應(yīng)用,人們也發(fā)現(xiàn)了一些具體問題,有待深入探索。
訓(xùn)練數(shù)據(jù)的質(zhì)與量是模型可靠與否的核心。深度學習依賴于大量的標注數(shù)據(jù),影像標注數(shù)據(jù)的質(zhì)量決定了深度學習模型訓(xùn)練的結(jié)果。目前,國內(nèi)影像標注的質(zhì)量尚未達到統(tǒng)一規(guī)范標準,數(shù)據(jù)質(zhì)量參差不齊且種類繁多,這必定會影響模型的準確性和普適性。在組學研究領(lǐng)域,雖然很容易獲取大量基因組數(shù)據(jù),但在個別研究中,如罕見病,仍不能滿足深度學習模型訓(xùn)練所需要的大樣本量。
深度學習也存在模型本身造成的限制。由于許多組學數(shù)據(jù)有其特殊的多層級結(jié)構(gòu),傳統(tǒng)深度學習模型難以整合不同組學數(shù)據(jù)層,因此無法對這類結(jié)構(gòu)進行處理,限制了其應(yīng)用。在代謝組學研究中,由于深度學習模型缺乏解釋性,所以有時不能識別對特定結(jié)果起主要作用的影響因子。在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面,現(xiàn)主要依賴于目標蛋白質(zhì)與已知蛋白質(zhì)序列和結(jié)構(gòu)的相似性;但在實際折疊過程中,并不確定兩者之間的聯(lián)系,這導(dǎo)致現(xiàn)有預(yù)測方法往往不能得出準確結(jié)果。要解決這個問題,不僅要增加訓(xùn)練集的數(shù)據(jù)庫,還要使深度學習模型能利用完整的輸入數(shù)據(jù),包含整個蛋白質(zhì)序列。
深度學習能從數(shù)據(jù)中尋找深層次、具有鑒別性的特征,已應(yīng)用于醫(yī)學影像分析等多個領(lǐng)域,并取得了突破性進展。隨著云計算和多圖形處理器高性能并行計算技術(shù)的發(fā)展,深度學習能在海量醫(yī)學圖像數(shù)據(jù)中訓(xùn)練;同時,醫(yī)學圖像數(shù)據(jù)庫和分割數(shù)據(jù)集的公開均能用來驗證深度學習算法的精確性。深度學習在醫(yī)學影像分析領(lǐng)域的研究以技術(shù)為主,采用的評價標準主要涉及計算機領(lǐng)域。為更具專業(yè)性和可信度,需要更多從事基礎(chǔ)和臨床醫(yī)學專家的參與,按照不同專業(yè)考察指標對相關(guān)技術(shù)進行評估,來展示這一技術(shù)在特定專業(yè)應(yīng)用的前景。
針對深度學習的直接訓(xùn)練需依賴大量數(shù)據(jù)庫,目前主要采用的方法是微調(diào)網(wǎng)絡(luò),即通過預(yù)訓(xùn)練的網(wǎng)絡(luò),將大數(shù)據(jù)量的特征遷移到小數(shù)據(jù)量的目標任務(wù)上,使得目標任務(wù)對于數(shù)據(jù)量的要求大大減小,這成為發(fā)展趨勢。另外,鑒于醫(yī)學影像的數(shù)據(jù)庫相對較少,無監(jiān)督網(wǎng)絡(luò)也成為一個重要手段。近來Campanella等[31]利用4萬余張未標注的數(shù)字化病理切片,以弱監(jiān)督方式訓(xùn)練模型。訓(xùn)練后模型推斷準確率高于98.3%,表明讀取癌癥切片的特異性很高。這是直接訓(xùn)練未標注生物數(shù)據(jù)而成功建立深度學習模型的一個實例。
深度學習能分析幾乎所有類型的組學數(shù)據(jù),雖然還存在局限性,比如需要專家逐一解釋復(fù)雜表型的因果關(guān)系,但可以預(yù)見,深度學習參與的精準健康管理模式——通過移動設(shè)備實時監(jiān)控基因突變、基因轉(zhuǎn)錄表達和疾病的早期發(fā)生發(fā)展將成為可能。
目前,可從商業(yè)渠道獲得許多深度學習的組織框架??蒲腥藛T即使無計算機專業(yè)背景,也能根據(jù)組織框架來設(shè)計模型,比從頭建立神經(jīng)網(wǎng)絡(luò)更為便捷。人們在不斷發(fā)掘深度學習的優(yōu)勢,基于現(xiàn)有基礎(chǔ),不僅需要擴展處理數(shù)據(jù)的類型,更需要提高預(yù)測的準確性和運行速度,以滿足生物醫(yī)學及臨床實踐服務(wù)的需求。
利益沖突所有作者均聲明不存在利益沖突