彭麗琴,萬雷,汪茂文,李卓,趙虎,王亞輝
(1.中山大學中山醫(yī)學院法醫(yī)學系,廣東 廣州 510080;2.司法鑒定科學研究院 上海市法醫(yī)學重點實驗室 司法部司法鑒定重點實驗室 上海市司法鑒定專業(yè)技術服務平臺,上海 200063)
正常人體骨骼發(fā)育過程中初級、次級骨化中心的出現(xiàn)時間、骨化速度、骨骺與干骺端閉合時間順序以及形態(tài)變化都具有一定的規(guī)律性,這種規(guī)律性以“年”或“月”來表示,稱為骨骼年齡。骨骼年齡評估較為經(jīng)典的傳統(tǒng)方法主要包括計數(shù)法、圖譜法、計測法、計分法以及數(shù)學模型法等方法[1-2]。傳統(tǒng)的骨齡評估方法主要通過人工讀取骨骺和干骺端發(fā)育狀況的形態(tài)特點進行骨齡評估,不同讀片者之間以及同一讀片者在不同時間讀片時均會產(chǎn)生一定的誤差,故讀片結(jié)果會受到一定的質(zhì)疑。于是,在20世紀80年代,便有研究小組提出實現(xiàn)骨齡評估的計算機化,其中最有價值的便是機器學習。1989年,MICHAEL的HANDX系統(tǒng)[3]以及1992年TANNER和GIBBONS的CASAS系統(tǒng)[4],率先將該想法投入實踐,也拉開了機器學習在骨齡評估領域發(fā)展的帷幕。
機器學習(machine learning,ML)是一門人工智能(artificial intelligence,AI)的科學,該領域主要研究在經(jīng)驗學習中如何改善具體算法的性能,是一類自動分析數(shù)據(jù),從中獲取規(guī)律,并利用獲得規(guī)律對未知的數(shù)據(jù)進行預測的算法。同時,機器學習又是使計算機具有智能的根本途徑,是人工智能的核心,其應用遍布人工智能的各領域,主要使用歸納、綜合等方法。目前,機器學習已有十分廣泛的應用領域,如數(shù)據(jù)挖掘、自然語言處理、計算機視覺、DNA序列測序、生物特征識別、語音和手寫識別及機器人應用等[5]。機器學習較為成功的應用領域便是計算機視覺,骨骼影像學圖像識別屬于計算機視覺范疇,因此,運用機器學習實現(xiàn)骨骼圖像的識別,是實現(xiàn)人工智能骨齡評估系統(tǒng)的可靠途徑之一。本文將對近年來國內(nèi)外學者運用機器學習在骨齡評估中的研究進展進行綜述。
機器學習[6-7]是人工智能的一個重要研究領域。學習是人類所具有的一種高級行為,而機器學習就是使計算機具有“通過解析輸入的數(shù)據(jù)進行學習并預測”的能力,并且在實踐中不斷進行改進和完善。與基于相關運算規(guī)則的算法相比,機器學習利用了與實時更新的大型數(shù)據(jù)集進行接觸的優(yōu)勢,可以實時改進和進行經(jīng)驗學習。一般來說,機器學習需要三組數(shù)據(jù),分別用于訓練、測試和驗證過程。機器學習算法的發(fā)展經(jīng)歷了一個漫長的過程,從貝葉斯分類器(Bayes classifier,BC)、感知機(perceptron)、決策樹(decision tree,DT)、反向傳播算法(backpropagation algorithm,BPA)、支持向量機(support vector machine,SVM)的提出,再到隨機森林(random forest,RF)和深度神經(jīng)網(wǎng)絡(deep neural network,DNN)的發(fā)展。隨著數(shù)據(jù)量以及計算能力的迅速提升,以深度學習(deep learning,DL)為基礎的諸多人工智能應用逐漸成熟,如圖像識別、語音識別、無人駕駛等。機器學習任務通常分為三類[8],有監(jiān)督學習、無監(jiān)督學習和強化學習。有監(jiān)督學習包括SVM、DT、線性回歸(linear regression,LR)、logistic回歸、貝葉斯網(wǎng)絡(Bayesian networks,BN)、K最近鄰(K-nearest neighbors)、RF、AdaBoost和神經(jīng)網(wǎng)絡方法等。無監(jiān)督學習中包括K-均值、均值漂移(mean shift,MS)、層次聚類(hierarchical clustering,HC)、高斯混合建模(gaussian mixture model,GMM)、馬爾可夫隨機場(Markov random field,MRF)、迭代自組織數(shù)據(jù)分析(iterative selforganizing data analysis,ISODATA)等。而在強化學習任務中,計算機程序在一個動態(tài)環(huán)境中執(zhí)行一項特定的任務,在該環(huán)境中,接受正強化和負強化的反饋,在與環(huán)境互動的結(jié)果中學習。在實際應用中幾種任務范式可以任意進行組合。
機器學習因為在計算機輔助診斷和決策支持系統(tǒng)中表現(xiàn)的優(yōu)越性和潛能,使人們對其在醫(yī)學領域中的應用產(chǎn)生了巨大興趣。目前已應用于藥物研發(fā)、遠程患者監(jiān)測、醫(yī)療診斷和成像、風險管理、虛擬助理等領域[9],尤其在醫(yī)學圖像識別領域的應用尤為廣泛。與傳統(tǒng)的人工視覺評估方法相比,機器學習擅長識別成像數(shù)據(jù)中的復雜模式和人工無法檢測到的圖像信息,并能提供自動化的定量評估[10]。此外,機器學習還可以將多個數(shù)據(jù)流聚合到強大的綜合診斷系統(tǒng)中[11],包括影像學、基因組學、腫瘤學、病理學及外科學等,進而協(xié)助臨床作出診療決策。
在腫瘤的醫(yī)學成像中,機器學習主要應用于腫瘤的檢測、特征化描述和持續(xù)監(jiān)測三個方面[12],包括精確描述腫瘤大小和體積隨時間的變化、多病變的同時追蹤、腫瘤表型細微差別與基因型的聯(lián)系等。2017年,LIU等[13]采用一個包含4種量化的評分特征(短軸直徑、輪廓、凹度、紋理)的線性分類器對182名肺部腫瘤患者CT圖像進行處理,以對肺結(jié)節(jié)的惡性率進行預測,檢測結(jié)果準確率為74.3%,靈敏度為66.7%,特異度為75.6%。其性能顯著高于常用的基于多元logistics回歸[14]的臨床模型,降低了臨床誤報的概率。同樣將機器學習應用于肺癌的還有HOSNY等[15-16]。除了傳統(tǒng)醫(yī)學影像片,病理切片的數(shù)字掃描片也被應用于機器學習領域。2019年,Nature Medicine刊登了CAMPANELLA等[17]在機器學習方面的進展。該團隊收集了3個活檢切片數(shù)據(jù)集(前列腺、皮膚、乳腺癌淋巴轉(zhuǎn)移)并進行數(shù)字掃描,使用解剖病理學實驗室信息系統(tǒng)(laboratory information system,LIS)提供的診斷,以弱監(jiān)督方式對其進行訓練,包括使用多實例學習(multiple instance learning,MIL)訓練深度神經(jīng)網(wǎng)絡(deep neural network,DNN),從而產(chǎn)生一個語義豐富的像素級特征表示。然后將這些特征表示用于循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN),以整合整個數(shù)字掃描切片中的信息并報告最終分類結(jié)果。其中數(shù)字掃描切片的聚合方法采用最大池法(max-pooling,MP)。研究結(jié)果顯示:(1)三個數(shù)據(jù)集切片分別在放大20倍、5倍、20倍掃描的時候可獲得最大預測準確性,AUC分別為0.986、0.990、0.965。(2)當訓練集達到10000張切片時,平衡誤差最小,并趨于平衡。(3)當對基于MIL的像素級分類器生成的熱圖中提取的人工特征用RF進行訓練時,得到了0.98的AUC,與單獨的MIL相比差異沒有統(tǒng)計學意義。假陽性率得到下降,但是靈敏度亦下降。
此外,機器學習在鼻咽癌、腦腫瘤、結(jié)直腸癌[18]等醫(yī)學領域也均有所發(fā)展。2017年,ZHANG等[19]基于圖像模式和基于機器學習的分類器對鼻咽癌影像學圖片構建計算機輔助設計(computer-aided design,CAD)分類系統(tǒng)。2018年,ZHOU等[20]描述了從腦腫瘤放射圖像中提取定量特征的一套廣泛的機器學習方法,以用于腫瘤的影像學診斷、預后和治療反應。2010年,SUMMERS[18]通過計算機搜索結(jié)腸壁以尋找息肉樣的突出物,并向臨床醫(yī)生提供可疑區(qū)域的列表以進一步分析。除了腫瘤以外,機器學習在醫(yī)學的其他領域也應用甚廣。2018年,CHEN等[21]利用CNN模型通過胸部CT醫(yī)學影像報告單對肺栓塞進行診斷,發(fā)現(xiàn)模型精度高達99%,AUC為0.97,優(yōu)于傳統(tǒng)的自然語言處理模型。此外,對于神經(jīng)退行性疾病如阿爾茨海默病(Alzheimer’s disease,AD),機器學習算法也發(fā)揮著自己的優(yōu)勢,通過對頭部的正電子發(fā)射體層儀(positron emission tomography,PET)掃描片和相關生物標志物的智能分析,大大提高了對早期AD的診斷[22-23]。并且,機器學習能在PET的圖像重建和衰減校正方面發(fā)揮重要作用,從而獲得更高分辨率和更精確的圖像,為相關疾病提供更好的診斷依據(jù)[22]。
在目前的骨齡鑒定中,常用的機器學習算法包括回歸、神經(jīng)網(wǎng)絡[24-25]和SVM[26-27],使用較少的有BN、DT、K最近鄰算法等[28]。有學者[28]經(jīng)過統(tǒng)計發(fā)現(xiàn),X線片是最常被使用的源數(shù)據(jù),其次是CT片、MRI片,并且法醫(yī)學家最感興趣的區(qū)域?qū)偈植?、腕部區(qū)域,使用較少的包括膝關節(jié)、骨盆、胸鎖關節(jié)等。
手部和腕部區(qū)域一直是骨齡研究學者們最感興趣的區(qū)域,因為該解剖區(qū)域存在大量可供骨齡評估的骨骼指標,這些掌骨、指骨、腕骨、尺橈骨、甚至籽骨等骨骼成熟度具有明顯的先后次序性。機器學習在手部區(qū)域影像片中的應用也由來已久,早在1995年,PIETKA便開發(fā)了一種基于指骨和腕骨區(qū)域的模糊分類器[29]。國內(nèi)的王亞輝等[30]在2014年使用SVM對華東地區(qū)青少年左側(cè)腕關節(jié)的X片正位片進行訓練,用留一交叉驗證法(leave one out cross validation,LOOCV)和梯度方向直方圖(histogram of oriented gradient,HOG)分別進行內(nèi)、外部驗證,建立了對尺橈骨遠端骨骺的發(fā)育分級的自動化評估。大大提高了閱片者的閱片速率,但仍需相關專家進行最終的骨齡評估。次年,KASHIF等[31]從南加州大學提供的1 104張手部射線照片中各提取14個感興趣的骨骺特征點(epiphyseal region of interest,eROI),分別用尺度不變特征變換(scale invariant feature transform,SIFT)匹配算法與加速穩(wěn)健特征(speeded up robust feature,SURF)算法進行稀疏、密集特征描述以及用二進制魯棒獨立元特征(binary robust independent elementary feature,BRIEF)算法、二進制魯棒不變尺度特征關鍵點(binary robust invariant scalable keypoint,BRISK)算法、快速視網(wǎng)膜關鍵點(fast retina keypoint,F(xiàn)REAK)算法進行密集特征點描述。采用SVM進行分類,最后進行5倍交叉驗證。結(jié)果顯示,SIFT的密集特征描述平均誤差最小,為0.617歲。此外,中指區(qū)域特征點的表現(xiàn)要優(yōu)于其他手腕區(qū)域。中指、食指、無名指的組合產(chǎn)生的效果最優(yōu)。該方法魯棒性強,易實現(xiàn),相比于PIETKA等的方法不需要語義特征和地圖冊的標注。以上均是基于機器學習領域淺層學習方法而進行的骨齡評估。而最近幾年深度學習以其獨特的優(yōu)勢得到了更為廣泛的應用。如深度卷積神經(jīng)網(wǎng)絡(deep convolutional neural networks,DCNN),因為能夠從大型訓練數(shù)據(jù)集中自動學習與任務相關的特性,省去了如傳統(tǒng)的機器學習方法(如SVM或RF)所需要的手工特征提取的預處理步驟,其在解決各種機器學習和計算機視覺問題方面取得了巨大成功。2017年,LARSON等[32]采用CNN算法對14036張兒童左手部X片進行骨齡評估(12 611張作為訓練集,1 425張作為驗證集)并與人工專家評估結(jié)果進行比對,結(jié)果顯示,CNN模型得出的骨齡結(jié)果與人工評估結(jié)果沒有顯著差異,并且隨著訓練集含量增大誤差減小。KIM等[33]亦采用深度學習方法對兒童左手圖像進行骨齡評估,結(jié)果顯示模型評估骨齡與參考骨齡有69.5%的一致率,有顯著相關性(r=0.992,P<0.001),并且減少了18.0%~40.0%的評估時間。綜上可見,雖然機器學習與人工專家評估效能相當,但是卷積神經(jīng)網(wǎng)絡明顯更省時間,并且不需要特定的學科知識以及特定圖像軟件工程的輔助,具有明顯的優(yōu)勢。
2018年,KOITKA等[34]以來自北美放射學會(radiological society of North America,RSNA)兒科骨齡挑戰(zhàn)賽[35]的240張微調(diào)過的人工注釋手部X線片作為訓練集,另外89張作為驗證集,從遠端指骨、中間指骨、中間指骨和近端指骨間以及近端指骨和掌骨之間的骨骺生長區(qū)、腕骨、尺橈骨遠端分別提取相同類別及數(shù)量的感興趣特征點(region of interest,ROI)。所有選定的圖像都使用名為labelImg的開放源代碼工具進行注釋。整個實驗采用TensorFlow r1.4進行,使用Inception-ResNet-V2作為底層特征提取器,F(xiàn)aster-RCNN模型來運行。最后得到的結(jié)果精確度為92.92%±1.93%。除了X線片外,手部MRI片也因其無輻射的優(yōu)點在骨齡鑒定中得到了重視與發(fā)展。2019年,?TERN等[36]分別使用DCNN網(wǎng)絡和RF網(wǎng)絡對328名白人男性的手部3D MRI圖譜進行訓練并在二維X線片中進行驗證。其中:(1)DCNN網(wǎng)絡由一個特征提取器、多個FEE block(每個FEE block由兩個卷積層和一個最大池層組成)、兩個卷積層及一個年齡推斷輸出層構成。從手部3D MRI圖譜中各提取13個骨骼特征(特征點選取參考TW2法)[37]。(2)在RF網(wǎng)絡中,根據(jù)特征與閾值,將受試者的3D MRI骨骼圖像推送到左或右子節(jié)點,直到達到最大樹深(maximum tree depth,MTD),最后通過存儲在葉節(jié)點中的受試者平均年齡(去掉5%的最高年齡和5%的最低年齡值,計算剩余者的平均年齡)來計算估計年齡。(3)結(jié)果顯示,對于13~18歲的青年,DCNN模型的絕對偏差為(0.37±0.51)歲,RF模型的絕對偏差為(0.48±0.56)歲,均顯著優(yōu)于放射學家預測的年齡。該方法的優(yōu)勢在于使用的是3D MRI圖片,不產(chǎn)生輻射。另外,預估誤差也得到了明顯改善,但是由于手部骨骼基本在18歲前完成了骨化,所以HALABI團隊[35]只對13~18歲年齡段作了評估。這對于司法審判中的應用尚不夠。不過該團隊也指出,當再增加一些其他解剖部位來估計時,可以將預估的年齡段拓展至25歲。這將是一個值得發(fā)展的前景。
膝關節(jié)作為六大關節(jié)之一,其骺軟骨板的骨化程度被證實與年齡顯著相關。國內(nèi)外均有團隊進行了相關研究[38-39]。其中廣為人知的是O’CONNOR等[40]提出的膝關節(jié)骨骼成熟度量表。該量表涉及骨骺形態(tài)變化以及骨骺閉合程度等10個指標,新版量表將其縮略至7個[41]。但以上均是基于閱片者的定性比較。近年來隨著機器學習的發(fā)展,膝關節(jié)的骨齡評估也得到了進一步發(fā)展。2019年,王亞輝團隊[42]采集了500例12~19歲維吾爾族青少年的膝關節(jié)DR攝片。采用主成分分析法(principle component analysis,PCA)對提取的方向梯度直方圖(histogram of oriented gradient,HOG)與局部二值模式(local binary patterns,LBP)圖像進行降維。最后采用支持向量機回歸法(support vector regression,SVR)構建骨齡評估算法模型。結(jié)果顯示,男女性年齡誤差范圍在±0.8歲及±1.0歲以內(nèi)的準確率分別為80.67%、89.33%與80.19%、90.45%。與依賴“大數(shù)據(jù)、大計算、高性能”的深度學習方法相比,該方法具有較易實現(xiàn)、在小樣本數(shù)據(jù)上學習能力及泛化能力良好的優(yōu)點,并且關注到了骨齡發(fā)育在地區(qū)、民族間的差異性,對未來的司法鑒定有一定的價值。
近年來,對膝關節(jié)磁共振圖像進行分割來進行自動化評估的方法有較多的研究[43],如DODIN等[44]運用Ray Casting技術,將MR圖像分解成多個表面層,對骨骼的邊界進行定位,并自動融合多個部分分割對象,最終得到完整的骨骼分割。受此類技術的啟發(fā),PR?VE等[45]將圖像分割應用到了骨齡鑒定領域。該團隊利用CNN建立了一個基于三維無創(chuàng)MRI的全自動膝關節(jié)神經(jīng)網(wǎng)絡分割方法,用于76個數(shù)據(jù)集包含150名14~20歲男性右膝MRI,分別為訓練集(74%)、驗證集(13%)和測試集(13%),并采用多個預處理步驟來校正圖像強度值及減小圖像尺寸。該模型類似用于U-NET的編碼器-解碼器模型。與人工分割相比,訓練后的網(wǎng)絡獲得了98%的戴斯相似性系數(shù)(Dice similarity coefficient score,DSCS),能夠區(qū)分股骨、脛骨和腓骨。模型的精度和重復性也達到平衡,誤差僅為1.2%。經(jīng)過驗證集的驗證,該方法用于青少年骨齡評估的平均絕對誤差可達到(0.48±0.32)歲。該模型切割MRI數(shù)據(jù)集不僅具有很高的準確性,而且能夠從不同的方向切割。此外,該模型對訓練集的噪聲具有魯棒性。同時,該網(wǎng)絡具有高度的通用性,能夠適應其他骨骼、不同的圖像方向和不同的輸入分辨率。當采用合成噪聲時,能夠獲得比其所承受的噪聲水平更高的精度。在未來,該無創(chuàng)方法有希望被推廣于其骨骼、關節(jié)進行骨齡的評估。
在法醫(yī)學領域,骨盆因其成熟期較晚而在對年齡相對較大的青少年進行骨齡鑒定中發(fā)揮了重要的價值。最常用于骨盆骨齡鑒定的包括Risser征和髂嵴骨化[46],其他還包括髂嵴和坐骨結(jié)節(jié)骨化程度[47-48]、髖關節(jié)和股骨近端的融合程度[49]、恥骨聯(lián)合骨化程度[50]等。隨著機器學習的迅速發(fā)展,其也被應用到了骨盆的骨齡評估。
2019年,鄧振華團隊[51]收集了一組1408張10.0~25.0歲中國西部漢族人群的骨盆X線片用于骨齡的機器學習,選擇該年齡范圍是基于髂嵴骨化過程一般晚于12.0歲而早于24.0歲的規(guī)律[52-53]。其中髂嵴上方腹部器官明顯重疊的圖像被從訓練集中移除,但仍用于測試集。該研究采用的是微調(diào)版卷積神經(jīng)網(wǎng)絡,為基于ImageNet數(shù)據(jù)集預先訓練的改良版AlexNet網(wǎng)絡。其保留了原始AlexNet網(wǎng)絡卷積層進行特征提取?;貧w部分則被3個新的全連接層所取代,最后一層為預期結(jié)果輸出層。在訓練過程中,為了避免過度擬合,固定了卷積層的參數(shù),并且僅使用訓練集對完全連接層的參數(shù)進行了微調(diào)。該團隊采用Pearson相關系數(shù)和Bland-Altman圖來評估模型的準確性。另外,還比較了估計值和真實值的平均絕對誤差(mean absolute error,MAE)、均方根誤差(root-mean-square error,RMSE)。結(jié)果顯示,CNN模型的輸出骨齡與參考骨齡顯著相關(r=0.916,P<0.05),且MAE和RMSE分別為0.91歲和1.23歲,優(yōu)于現(xiàn)有的基于骨盆髂嵴和坐骨結(jié)節(jié)發(fā)育狀態(tài)分級系統(tǒng)的三元回歸模型[47](MAE和RMSE分別為1.05歲和1.61歲),并且兩性之間沒有顯著差異。Bland-Altman圖則顯示輸出骨齡與實際骨齡的平均差異為0.1年,95%一致性極限為±2.60年。
綜上,該系統(tǒng)在一定程度上解決了部分18周歲以上青少年(18~22歲)的骨齡評估問題,彌補了手部、膝關節(jié)影像片進行骨齡鑒定的不足。但是,另一方面其評估精度不如基于手部X線圖像的深度學習體系。并且髂嵴上腹部器官疊加產(chǎn)生的偽影也可能會影響結(jié)果的準確性。這可能是導致精度不足的原因之一。
受偽影的影響,模型在自動學習的過程中容易受到干擾而不夠準確。因此,目前對骨盆的應用尚少。未來有待通過對模型的改進,或者偽影的有效處理進一步提高骨盆骨齡評估的精度。
鎖骨胸骨端是構成胸鎖關節(jié)的重要解剖結(jié)構,是全身次級骨化中心出現(xiàn)和骨骺閉合時間最晚的骨骼,也是青春后期骨齡鑒定的重要指標之一,是判斷是否為成年人的重要骨骼指標之一。SCHMELING等[54]提出的鎖骨胸骨端骨骺發(fā)育分級方法是目前應用較廣的分級方法,SCHULZE等[55]、WEI等[56]也提出了鎖骨胸骨端骨骺發(fā)育的CT分級標準。與骨盆相同,受偽影(肺部、胸骨、支氣管等相互重疊)的影響,鎖骨胸骨端在機器學習中的應用相對較少。
幾年前,大多數(shù)關于使用鎖骨胸骨末端進行活體年齡估計的研究中,本質(zhì)上僅是描述性的統(tǒng)計,或者某種形式的線性回歸[57-58]。2013年時,HILLEWIG等[59]將貝葉斯網(wǎng)絡運用于鎖骨的骨齡評估中。2019年,STERN等[60]融合了鎖骨、手部、牙齒三個解剖部位的MRI數(shù)據(jù)信息,利用DCNN對322名年齡在13~25歲的受試者進行訓練。每個DCNN塊由兩個連續(xù)的3×3×3卷積層和一個最大池層組成。最終得到了(1.01±0.74)歲的平均絕對誤差。將鑒定年齡范圍從單純使用手部的19歲拓展到25歲。為了衡量每個解剖部位對于預測年齡的重要性,該團隊計算了特征提取塊后全連接層的平均激活值。結(jié)果顯示,手部的可靠性最高,其次是鎖骨、牙齒。但在16~19歲青少年骨齡評估中,鎖骨和牙齒的協(xié)同產(chǎn)生了最高的評估精度(在其他大部分年齡段,均為手部、鎖骨、牙齒三者的協(xié)同誤差最小)??梢姡瑢τ诓煌哪挲g段,不同的解剖結(jié)構有不同的優(yōu)勢。因此,在實際應用中可根據(jù)不同的需求選擇不同的解剖結(jié)構,并且各解剖結(jié)構之間的聯(lián)合使用能夠提高預測的準確度。
隨著機器學習的迅速發(fā)展,在骨齡評估領域的應用也日趨成熟。如:(1)機器學習所使用的影像圖片從最開始的X線片,到CT片,再到無電離輻射的MRI片,甚至是三維MRI片。隨著影像檢測技術的不斷升級,更復雜的深層特征點有機會被挖掘,并且隨著公眾健康意識的增強,MRI檢測技術或許是未來骨齡研究的重要發(fā)展趨勢。(2)使用的算法從最開始的淺層算法如支持向量機、隨機森林,到現(xiàn)在廣泛應用的深度學習,從開始需要人工提取特征點到后來算法自動學習,算法模型在逐步優(yōu)化。(3)隨著各類機器學習網(wǎng)絡模型及網(wǎng)絡算法的不斷改良和優(yōu)化,今后在骨齡研究中,針對同一類骨骼指標,可以采用多種機器學習手段進行比較研究,從而總結(jié)出與人體不同骨骼指標相匹配的機器學習網(wǎng)絡模型和網(wǎng)絡算法,以期進一步提升機器學習在骨齡評估的應用價值。(4)評估部位由最開始的手腕關節(jié),再到膝關節(jié)、骨盆及胸鎖關節(jié)等。今后可以考慮運用機器學習針對不同年齡組融合多個解剖部位綜合評估骨骼年齡。
綜上,機器學習在醫(yī)學領域及骨齡評估的發(fā)展前景可期,但我們也不能忽略其存在不足之處。正如HOSNY等[9]所說,由于內(nèi)部機制的非透明性,目前人工智能尚不能完全取代放射學家而進行獨立運作,但可以在法醫(yī)人類學領域發(fā)揮重要的輔助作用,大大提高鑒定效能。
目前,對于胸鎖關節(jié)、骨盆等部位的研究尚少,研究樣本的數(shù)量有限以及攝片偽影等影響因素亦未得到有效解決。因此,基于機器學習的青少年骨齡鑒定研究的準確性仍有一定的提升空間,這也是未來需要法醫(yī)學者及計算機學科專家努力解決的問題之一。此外,還可以將算法進一步優(yōu)化,進一步提升骨齡評估精度,以更好地解決14.0、16.0、18.0周歲等法定關鍵年齡的鑒定問題。鑒于我國地廣人多、是一個多民族國家[61],在今后的研究中,我們還會考慮民族、地區(qū)間的差異,在訓練時采用混合數(shù)據(jù)集,或者對于骨齡評估差異較大的地區(qū)、民族,建立該地區(qū)、民族的獨立算法模型。