施強慧,張子凡,胡博,曹鵬,徐辰,袁文,陳華江
海軍軍醫(yī)大學第二附屬醫(yī)院骨科,上海 200433
下腰痛及頸肩痛作為導致中老年人生活質量下降的重要原因,給社會及國家?guī)砹顺林刎摀鶾1]。而腰椎及頸椎的椎間盤退變與突出是導致下腰痛及頸肩痛的重要原因[2],主要包括椎間盤退變、椎間高度降低、椎間盤終板退變或椎體變性等一系列病理生理變化[3-4]。目前對于頸腰椎退變主要依據影像學資料而做出經驗性判斷,該經驗性診斷主要依據突出部位、椎間盤信號改變、椎體信號及形態(tài)改變、脊柱序列穩(wěn)定性等因素綜合考慮,并進一步根據這些因素輔助確定患者手術的必要性及手術方案[5]。但該診斷過程由于極度依賴醫(yī)者的經驗積累,不同醫(yī)者做出的診斷及制定的手術方案存在顯著差異[6]。此外,由于頸腰椎退變性疾病的診斷及手術方案制定過程較為復雜,且在較大程度上依賴影像學資料,容易造成臨床醫(yī)師與患者之間溝通減少的局面,降低了患者臨床信息收集的全面性,同時不利于對患者的人文關懷。因此,具備自動分析及診斷能力的人工智能決策輔助系統(tǒng)將有助于輔助臨床醫(yī)師對頸腰椎退變性疾病進行診斷及制定手術方案,以提高臨床醫(yī)師的工作效率及醫(yī)療質量[7]。
深度學習概念于2006年被提出,最初源于人工神經網絡相關的研究,其后經研究者不斷努力和持續(xù)完善,已發(fā)展成機器學習領域具有良好發(fā)展前景的分支[8-10]。傳統(tǒng)的機器學習模型依賴于數據工程師對原始數據(如肺結節(jié)影像學圖片)進行特征總結及提取,并制定出相應的特征提取器(如提取肺結節(jié)的大小、直徑、邊緣等特征)。機器學習模型通過將特征作為輸入端,將特征對應的結果(如肺結節(jié)的良心或惡性)作為輸出端進行學習,通過一定量的訓練后,可實現對新數據特征對應結果的預測[11]。機器學習算法已被很多學者應用于臨床疾病的診療過程,如有研究報道,根據老年人的步態(tài)數據及慣性分析數據,可以通過機器學習算法來預測其跌倒的風險[12]。前期有研究報道,通過機器學習方法將下腰痛患者與健康者進行鑒別,可達到對下腰痛進行診斷的目的[13]。此外,有學者采用機器學習算法預測脊柱的生物學應力,從而判斷不同人群脊柱生物學應力的分布等[14]。
區(qū)別于傳統(tǒng)機器學習,深度學習可實現直接以原始數據作為輸入端、數據對應結果作為輸出端的完全端對端預測,原始數據特征由深度學習模型自主總結提取,較傳統(tǒng)機器學習模型排除了更多的人為操作因素[15]。此外,深度學習對數據的利用程度、對數據間細微差別及聯系的處理能力均超過了傳統(tǒng)機器學習模型[15-16](表1)。目前深度學習模型主要包括計算機視覺(computer vision,CV)、自然語言處理(natural language processing,NLP)、強化學習(reinforcement learning,RL)、深度學習網絡(deep neural network,DNN)以及泛用深度學習等種類[17]?;诰矸e神經網絡(convolutional neural network,CNN)算法的CV深度學習模型已開始在醫(yī)學領域應用,如影像科對肺結節(jié)的診斷,其敏感性及特異性與影像科專家得出的診斷意見已無明顯差異[18]。
表1 深度學習與傳統(tǒng)機器學習的區(qū)別Tab.1 The difference between deep learning and traditional machine learning
2.1 深度學習對頸椎病的診斷研究進展 由于頸腰椎退變性疾病的診斷與影像學資料密切相關,目前已有許多學者開始使用機器學習模型及深度學習技術對頸腰椎各結構特征進行提取并借此輔助疾病診斷。目前,對于頸椎病的診斷主要采用針對MRI影像的評判,特別是分析T2加權像上椎間盤及周圍神經組織的受壓情況,以明確疾病的診斷[19],這也為深度學習模型創(chuàng)造了良好條件。近年來有研究發(fā)現,利用深度學習模型可為頸椎病患者的脊髓病變區(qū)域提供精準定位,在頸椎MRI檢查圖像上利用CNN模型自動檢測并標記椎體序列,準確率達到99%以上,敏感度達到99.1%~99.8%[20]。Wang等[21]使用磁共振彌散當量成像(DTI)并結合DTI特征提取器對人群頸椎磁共振圖像進行特征提取并使用機器學習算法進行分析,以期該算法可準確預測頸椎病的診斷。但是該方法對磁共振成像提出了特殊要求,能夠獲取的數據量相對較少,且人工制定的特征提取器難以滿足不同類型頸椎病的診斷。隨后,Jin等[22]通過進一步優(yōu)化人工智能的特征提取過程,并比較了不同模型對于脊髓型頸椎病MRI表現與預后的學習和分析情況,發(fā)現利用高斯核函數的支持向量機(RBF-SVM)法能夠顯著提高DTI成像的MRI脊髓特征分析能力,而基于該模型的疾病診斷與預后分析的準確率和敏感性分別達到了85.0%與92.4%。
2.2 深度學習對下腰痛診斷的研究進展
2.2.1 深度學習模型對下腰痛的預測與定性診斷
下腰痛為中老年人的常見疾病,主要由腰椎間盤突出壓迫神經引起,因此其發(fā)病具有一定的規(guī)律特點。Hu等[23]通過記錄人群脊柱不同節(jié)段的運動數據,并結合下腰痛狀態(tài),建立了一種可通過脊柱不同節(jié)段運動數據來預測下腰痛發(fā)生的長短記憶深度學習模型。基于該理念,可進一步將深度學習的輸入端多元化,如將人群性別、年齡、身高、體重、吸煙史、飲酒史、負重習慣等相關數據作為輸入端,以是否有下腰痛作為輸出端,從而輔助診斷下腰痛的發(fā)生。有研究發(fā)現,通過上述方法,利用CNN模型學習后預測的下腰痛發(fā)生情況與實際的下腰痛癥狀之間有很強的相關性(r=0.997),即CNN模型能夠有效地通過影像學及臨床參數預測下腰痛的發(fā)生,提供早期診斷的可能[24];同時,對于特定的脊柱活動度及影像學參數改變與不同類別脊柱疾病的相關性,相較醫(yī)師的主觀預測,利用CNN模型“驗證”數據產生了更好的結果,準確率高達85%[25]。因此,合理利用深度學習模型,可以輔助腰椎退變性疾病的診斷,在一定程度上提高醫(yī)師的工作效率。
2.2.2 深度學習模型對下腰痛的病因診斷與定位價值 對于腰椎間盤突出癥等腰椎退變性疾病,臨床上主要依靠影像檢查結果來確定具體的病灶及病情嚴重程度,因此同樣適合深度學習展開相應工作。例如,Jamaludin等[26]通過CNN模型,將腰椎磁共振影像作為輸入端,腰椎間盤Pfirrmann評分(5個分級)、椎間高度(4個分級)、是否存在椎間盤突出、是否存在椎管狹窄、是否存在終板損害、是否存在椎體Modic改變作為輸出端,對該模型進行訓練后,其對新數據分析輸出的準確率(與影像學專家人工診斷相比)達到95.6%。Han等[27]通過基于多尺度多任務學習網絡的CNN模型,將腰椎T1/T2加權像磁共振影像作為輸入端,將椎間盤、椎間孔、椎體的位置及是否存在病變作為輸出端,實現了通過影像學圖片診斷是否存在椎間孔狹窄、椎間盤退變以及椎體病變,其準確率達到90%以上。此外,圍繞如何通過CCN系統(tǒng)實現椎間盤節(jié)段的自動識別,對腰椎退變的特殊影像學表現如融合椎體、脊柱側彎、腰椎骶化等的識別,對椎間孔大小以及神經根受壓的識別等進行研究發(fā)現,盡管上述表現的典型影像學資料較常規(guī)退變少,但對少量病例的學習仍體現出了較高的分辨準確率,可避免不同醫(yī)師診斷的主觀性和多樣性,對于患者的診治及預后具有十分重要的意義[28]。
3.1 使用基于NLP的深度學習模型預測腰椎退變性疾病的手術療效 相較于CV,NLP對文字、語言及時間相關數據的處理能力較好,目前在智能翻譯、智能寫作等領域已有應用[17]。然而在醫(yī)學領域,由于不同醫(yī)療機構采用的臨床數據收集方法及數據歸納整理方法不完全相同,導致傳統(tǒng)的機器學習難以分析來自不同醫(yī)療機構的臨床數據[29]。NLP深度學習模型的優(yōu)勢在于可通過對不同醫(yī)療機構來源結構不同的臨床數據進行學習,并自動總結出一套可供深度學習模型進行進一步分析的數據特征;同時,采用該模型有望實現對隨時間變化的患者的臨床數據進行學習,并據此預測手術治療方案的療效、患者的預后等指標,具有較好的應用前景[30]。Staartjes等[31]基于NLP深度學習模型,將單節(jié)段腰椎術后腿痛、背痛及功能殘疾等指標改善作為輸出端,將患者術前基線指標以及術后12個月患者的報告結局指標作為輸入端,對模型進行訓練后,對以上三個指標改善程度的預測準確度達85%、87%及75%,相較回歸模型,該深度學習模型表現出更好的預測精準性,以此為依據,可以為患者是否選擇手術治療提供一定的參考。Pedersen等[32]針對不同模型對腰椎間盤突出癥術后療效預測的準確度進行了系統(tǒng)分析:將患者術前的臨床癥狀和基本情況作為輸入端,1年隨訪后的實際療效作為輸出端,通過7種模型學習訓練后發(fā)現,相較于傳統(tǒng)的機器學習模型,基于深度學習的模型能夠更好地預測患者術后的療效,進一步證實了深度學習在復雜疾病預后評估中的優(yōu)勢和潛力。
3.2 使用基于NLP的深度學習模型輔助手術治療
在手術方面,人工智能發(fā)揮著不可替代的作用,如脊柱手術中螺釘的置入需要非常精確[33],采用智能手術規(guī)劃與虛擬手術仿真系統(tǒng)輔助骨科醫(yī)師熟悉局部解剖和制定術前規(guī)劃,在保證手術質量的前提下,能夠最大程度地減少骨質損失,并提高手術效率和準確性[34]。目前采用深度學習模型預測相應腰椎手術節(jié)段的相關問題尚未有學者關注,但在臨床工作中,對腰椎手術節(jié)段的判定常是多維度的,需綜合考慮臨床癥狀、一般體征、定位體征以及影像學證據等因素,其中影像學證據在手術節(jié)段的判定中權重較高。通常對一個腰椎節(jié)段是否需要手術主要從椎間盤是否存在突出壓迫、神經根管是否存在狹窄、相應節(jié)段是否存在椎管狹窄、是否符合整體生物力學穩(wěn)定性等方面進行綜合判斷[35]。該綜合判斷過程對外科醫(yī)師的臨床經驗依賴性較高,若將有豐富經驗的外科醫(yī)師對相應腰椎節(jié)段是否需要手術做出的判斷結果作為輸出端,將影像學證據、臨床癥狀數據、體征數據以及其他輔助檢查數據作為輸入端對深度學習模型進行訓練,可通過深度學習模型實現對需要手術節(jié)段的預測。有研究發(fā)現,CNN模型預測傷口并發(fā)癥和病死率的敏感性高于邏輯回歸(logistics regression,LR)模型[36-37]?;贚R和CNN的機器學習模型在識別后路腰椎固定術并發(fā)癥的危險因素方面較基準美國麻醉醫(yī)師學會(ASA)評分更準確,表明機器學習可能是脊柱手術中危險因素分析的重要工具[36]。CNN模型將有助于輔助外科醫(yī)師做出手術方案的決策,如預測精確性符合預期,對該模型的推廣使用將有助于輔助基層脊柱外科醫(yī)師對腰椎手術方案做出更精準的判斷,從而對患者進行更優(yōu)化的治療。
3.3 使用基于NLP的深度學習模型預測腰椎術后并發(fā)癥的風險 臨床上通常通過綜合分析患者術前及術后各項臨床數據,并探討這些數據與術后并發(fā)癥或其他不良反應的相關性,從而預測術后并發(fā)癥的發(fā)生,如有研究發(fā)現,手術時間與術后腿痛癥狀的嚴重程度存在相關性[38]。但這種對數據相關性進行分析而得出結論的研究方法常疏于考慮不同數據之間微小聯系對總體結果的影響,且不同數據之間的微小聯系通過相關分析常無法得出顯著性結論;此時,引入深度學習模型將有助于綜合分析臨床診療數據與結果(出院后死亡、非常規(guī)出院、并發(fā)癥、術后再入院)的關系。近年來有學者分別建立相關模型[22,39-47],對預測腰椎間盤疾病手術患者的非常規(guī)出院,評估老年患者的椎體強度并預測椎體骨折風險,預測后路腰椎融合術后30 d再入院的可能等進行相應研究,結果表明,這些深度學習模型都具有良好的相關性和準確性(表2)。因此,在實踐中可以考慮將各項診療過程中的臨床數據作為輸入端,各并發(fā)癥的發(fā)生作為輸出端,建立通過患者臨床數據預測手術后情況的新方法,進而輔助外科醫(yī)師在術前、術中及術后制定更優(yōu)化的治療方案。
表2 利用機器學習或深度學習模型預測頸腰椎疾病術后療效的相關研究Tab.2 Related researches on predicting the postoperative outcomes of cervical and lumbar spine diseases using machine learning or deep learning models
目前,我國醫(yī)療的核心矛盾是以醫(yī)師為核心的醫(yī)療資源供給遠不能滿足患者快速增長的需求,導致我國對醫(yī)療人工智能的需求巨大[48]。在疾病診治過程中,患者隨訪跟蹤率低、病例數據非結構化、臨床工作繁忙、壓力大是骨科醫(yī)師工作中的難點。據估計,美國的門診診斷錯誤率為5.08%,每年有600萬患者因為錯誤的診斷而受到二次傷害[49]。當前,深度學習人工智能的應用仍處于起步階段,面臨諸多挑戰(zhàn),如數據鏈不完整、數據量過小及各平臺數據不穩(wěn)定等問題。臨床大數據是AI發(fā)展的基石,將大數據集非結構化,使數據變的直觀可視,最終轉化為通用性工具供醫(yī)護人員和患者使用至關重要。例如,Karhade等[50]的研究納入26 364例因腰椎退變性椎間盤疾病接受擇期住院手術的患者,發(fā)現非常規(guī)出院率為9.28%,而深度學習算法在非常規(guī)出院術前預測的內部驗證方面顯示出了良好的效能,分析這些數據并用于決策支持,可為臨床醫(yī)師提供更多客觀和定量信息,輔助診斷,減少漏診、誤診,制定合適的治療方案等。
綜上所述,深度學習人工智能技術應用于醫(yī)療領域,有利于提高醫(yī)療水平和診斷的準確率,并可增加優(yōu)質醫(yī)療資源的覆蓋廣度。隨著深度學習人工智能技術的不斷發(fā)展,數據的不斷積累,深度學習人工智能技術在醫(yī)療領域的應用前景將更加廣闊。