袁偉,侯文仲,王倩,莊堅(jiān)偉,謝國喜,陳向林*
(1.廣州醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院生物醫(yī)學(xué)工程系,廣東 廣州 511436;2.廣州醫(yī)科大學(xué)附屬第六醫(yī)院腦血管病科,廣東 清遠(yuǎn) 511518)
自發(fā)性腦出血是指非創(chuàng)傷性的腦實(shí)質(zhì)內(nèi)或非腦室系統(tǒng)局灶性的血液集聚并多伴隨快速進(jìn)展的神經(jīng)功能障礙[1-2]。其在腦卒中各亞型中的發(fā)病率僅次于缺血性腦卒中,位居第二,約占所有卒中的10%~15%,是一種高致死致殘的疾患[3]。在早期約有30%的患者會(huì)出現(xiàn)血腫增大,并且致死致殘率會(huì)有明顯的上升。盡管存在一些爭議[2],但一般認(rèn)為血腫體積增大13%~32%會(huì)明顯引起預(yù)后向更差的方向發(fā)展[4]。同時(shí)有學(xué)者研究證實(shí)針對(duì)有血腫增大風(fēng)險(xiǎn)的患者進(jìn)行早期干預(yù)可以降低血腫增大的發(fā)生幾率[5-6]。
目前預(yù)測腦血腫擴(kuò)大概率的方法有“9 分評(píng)分”“BRAIN 評(píng)分”“BAT 評(píng)分”“NAG 評(píng)分”等多種評(píng)分模型。最為常用的BRAIN 評(píng)分是由學(xué)者Wang[7]在2014年提出,評(píng)分項(xiàng)包括基線腦出血量(B)、復(fù)發(fā)性腦出血(R)、使用華法林抗凝(A)、腦室出血(I)和從發(fā)病至CT 時(shí)間(N)5 項(xiàng),總分最高24 分,如表1 所示。其基于一項(xiàng)前瞻性大樣本研究,隨著分?jǐn)?shù)的增加伴隨著腦血腫擴(kuò)大的可能性上升,0~24分的血腫擴(kuò)大概率為3.4%~85.8%。BRAIN 評(píng)分對(duì)腦出血患者血腫擴(kuò)大具有較好預(yù)測效能。
表1 BRAIN評(píng)分量表Table 1 BRAIN rating scale
但BRAIN 評(píng)分也存在一定的局限性。BRAIN評(píng)分標(biāo)準(zhǔn)提出者只是寬泛地給出了0~24 分的血腫擴(kuò)大概率范圍,而在實(shí)際應(yīng)用中,計(jì)算出某位病人BRAIN 評(píng)分后,參照這個(gè)結(jié)論也無法準(zhǔn)確地獲得血腫擴(kuò)大的具體概率值,臨床應(yīng)用具有局限性。而其他研究者,如王永平等[8]根據(jù)收集的111例病人數(shù)據(jù)進(jìn)行血腫擴(kuò)大概率計(jì)算,結(jié)果為0%~62.9%,與BRIAN 結(jié)論不同。學(xué)者Joshua[9]統(tǒng)計(jì)的122 位病人的BRAIN 血腫擴(kuò)大概率為11%~57%,也與其結(jié)論存在較大的差異?;谏鲜龅囊蓡枺芯繄F(tuán)隊(duì)對(duì)該中心部分病人使用金標(biāo)準(zhǔn)(即24 h 內(nèi)2 次CT 檢查,且血腫擴(kuò)大體積超過6 mL)確定血腫擴(kuò)大與否,得到的血腫擴(kuò)大概率為25.0%~72.8%,與BRAIN 評(píng)分結(jié)果差異性較大。因此,如果本研究采集的樣本數(shù)據(jù)直接采用BRAIN 作者的血腫擴(kuò)大概率結(jié)論來預(yù)測血腫擴(kuò)大發(fā)生的可能性,會(huì)產(chǎn)生較大的誤判,指導(dǎo)臨床診斷會(huì)有一定的錯(cuò)誤,不利于后續(xù)治療的進(jìn)行。此外,因?yàn)楹芏嗯R床醫(yī)生在實(shí)際使用時(shí)會(huì)將0~24 的評(píng)分劃分為0~5、6~9、10~11、12~244 個(gè)區(qū)間段,分別計(jì)算每個(gè)區(qū)間對(duì)應(yīng)的血腫擴(kuò)大概率,具體病人根據(jù)所屬區(qū)間段確定血腫擴(kuò)大的可能性[8-9]。但是因?yàn)闃颖究臻g的問題,不同單中心計(jì)算的區(qū)間血腫概率也存在很大的差異,直接參看相互結(jié)論會(huì)造成大概率的誤診。可見BRAIN 評(píng)分非常依賴研究對(duì)象本身的樣本特點(diǎn),因此使用時(shí)不應(yīng)參照已有的研究結(jié)果,應(yīng)該根據(jù)本中心的數(shù)據(jù),獨(dú)立地進(jìn)行0~24分的概率值或者概率區(qū)間的統(tǒng)計(jì),同時(shí)應(yīng)留意樣本數(shù)據(jù)的增加,及時(shí)進(jìn)行重新統(tǒng)計(jì),確保結(jié)論的準(zhǔn)確性。
相比于BRAIN評(píng)分,血腫擴(kuò)大的金標(biāo)準(zhǔn)雖然檢測手段單一,但是因?yàn)橘Y源的限制,并且2 次CT 檢查間隔需要一定的時(shí)間,期間病人的病情會(huì)發(fā)生劇烈的變化,因此,常常希望借助已有的常規(guī)檢查數(shù)據(jù)在第1 次CT 檢查后就能得出病人血腫擴(kuò)大的可能性,以為及時(shí)正確的治療方案提供幫助。但是BRAIN 評(píng)分又有一定的不足?;谏鲜龅膯栴},本研究使用支持向量機(jī)、邏輯回歸、決策樹和極限學(xué)習(xí)機(jī)4 種自動(dòng)預(yù)測模型進(jìn)行血腫擴(kuò)大的分類,對(duì)比BRAIN 評(píng)分結(jié)果的優(yōu)劣,預(yù)期在訓(xùn)練精度、測試精度、敏感性、特異性、模型的實(shí)時(shí)訓(xùn)練提升等指標(biāo)上獲得提高,同時(shí)減輕醫(yī)生的計(jì)算負(fù)擔(dān),更好地輔助臨床的診斷和治療。
回顧性連續(xù)納入廣州醫(yī)科大學(xué)附屬第六醫(yī)院2015 年1月至2019 年12月期間腦科住院的自發(fā)性腦出血患者150例。其中男性98例,女性52例。本研究遵守赫爾辛基宣言,并獲得廣州醫(yī)科大學(xué)附屬第六醫(yī)院倫理委員會(huì)的批準(zhǔn),每位參與研究的對(duì)象均簽署了知情同意書。
納入標(biāo)準(zhǔn):(1)腦出血診斷符合2019 年中國腦出血診治指南修訂的腦出血診斷標(biāo)準(zhǔn);(2)發(fā)病6 h內(nèi)首次行頭部CT;(3)發(fā)病24 h 內(nèi)完成頭部CT 復(fù)查。排除標(biāo)準(zhǔn):(1)既往發(fā)生顱內(nèi)出血;(2)單純的腦室出血(不伴有明顯的腦實(shí)質(zhì)出血)、腦干出血、蛛網(wǎng)膜下腔出血、硬膜下血腫、硬膜外血腫及腦梗死后出血等;(3)因血液系統(tǒng)疾病導(dǎo)致的腦出血或其他原因不明的腦出血。
1.2.1 資料收集 基線數(shù)據(jù)收集 患者的年齡、性別、居住地、種族、出生日期(可用身份證信息識(shí)別)。其他一般病史相關(guān)資料,包括既往有無高血壓史、糖尿病、吸煙、酗酒、相關(guān)其他遺傳病史及家族史、手術(shù)史、藥物治療史,過敏史以及其他特殊疾病史。
所有自發(fā)性腦出血患者入院的生命體征,包括體溫、血壓、脈搏及呼吸次數(shù),其中血壓記錄最重要,包括收縮壓及舒張壓數(shù)值?;颊呷朐簳r(shí)的格拉斯哥昏迷量表評(píng)分(GCS)標(biāo)準(zhǔn)包括睜眼、語言、運(yùn)動(dòng)反應(yīng),最高分為15分。目的是準(zhǔn)確判斷自發(fā)性腦出血患者入院時(shí)意識(shí)障礙程度,分?jǐn)?shù)越低意識(shí)障礙越重。
影像學(xué)資料收集:收集發(fā)病后6 h 內(nèi)的首次CT和發(fā)病后24 h內(nèi)2次復(fù)查CT資料,包括初始血腫體積、增大后血腫體積。血腫體積計(jì)算由廣州醫(yī)科大學(xué)附屬第六醫(yī)院2名影像科醫(yī)師獨(dú)立閱片并出具書面報(bào)告結(jié)果。計(jì)算方法是根據(jù)多田公式計(jì)算得出,公式為:V(出血量)=即血腫體積=(A×B×C)/2[10],其中A:最大血腫面積層面血腫的最長徑,B:最大血腫面積層面上與最長徑垂直的橫徑,C:CT片中出現(xiàn)出血的厚度,長度計(jì)算方式為:層厚×層面數(shù),實(shí)際應(yīng)用中組織層厚常設(shè)為5 mm。血腫擴(kuò)大定義為血腫體積較前增加超過6 mL,并將其作為血腫擴(kuò)大的金標(biāo)準(zhǔn)。所有患者的原始DICOM 圖像均由GE 公司的64排螺旋CT掃描完成,層厚為5 mm。
高血壓病定義為:既往確診高血壓病史,或收縮壓≥140 mmHg,或舒張壓≥90 mmHg,或使用降壓藥物。吸煙的定義為:吸煙≥1 支/天。飲酒的定義為:任意的酒精攝入≥1 次/周[11]。
最終確定納入數(shù)據(jù)分析的檢測項(xiàng)目包括:性別、吸煙史、飲酒史、使用華法林抗凝、抗血小板、破入腦室、年齡、GCS、入院收縮壓、入院舒張壓、急診血壓、急舒張壓、血糖(Glu)、總膽固醇(TC)、三酰甘油(TG)、高密度脂蛋白膽固醇(HDL-C)、低密度脂蛋白膽固醇(LDL-C)、活化部分凝血活酶時(shí)間(APTT)、凝血酶原時(shí)間(PT)、國際標(biāo)準(zhǔn)化比值(INR)、血紅蛋白(Hb)、血小板計(jì)數(shù)(PLT)、血鈣(Ca)、初始血腫體積、發(fā)病至首次CT 檢查時(shí)間??偣?5項(xiàng)。
1.3.1 支持向量機(jī) 支持向量機(jī)由Cortes和Vapnik[12]于1995年提出,是一種二分類模型。它的基本思想是求解特征空間上正確劃分訓(xùn)練數(shù)據(jù)集的唯一分離超平面,并且使得距離超平面最近的異類樣本之間的間隔最大化。可形式化為一個(gè)求解凸二次規(guī)劃問題[13-14]。一般分離超平面被定義為:
對(duì)于給定的超平面樣本點(diǎn)(xi,yi)來說,只需根據(jù)公式(2),(3)計(jì)算得到w和b的值,超平面即可確定:
其中:λi為拉格朗日乘子,S為假設(shè)的支持向量個(gè)數(shù)[15]。
支持向量機(jī)是在包括醫(yī)療領(lǐng)域在內(nèi),廣泛使用的數(shù)據(jù)分類方法[16-17]。根據(jù)本研究的數(shù)據(jù)特點(diǎn),參數(shù)設(shè)置時(shí)懲罰系數(shù)的取值為0.1;核函數(shù)選取為線性(linear);正則化時(shí)采用L2 正則化,即直接在原來的損失函數(shù)基礎(chǔ)上加上權(quán)重參數(shù)的平方和;誤差項(xiàng)達(dá)到指定值時(shí)則停止訓(xùn)練參數(shù)為0.001;默認(rèn)所有類權(quán)重值相同。
1.3.2 邏輯回歸 邏輯回歸又稱為邏輯回歸分析,是一種廣義線性回歸分類模型,目標(biāo)是通過一組變量的組合使得預(yù)測結(jié)果的概率最大化[18]。
邏輯回歸采用對(duì)數(shù)似然損失函數(shù)(代價(jià)函數(shù))[19]:
預(yù)測函數(shù)為:
使用梯度下降算法進(jìn)行邏輯回歸模型參數(shù)的更新:
其中:α為懲罰系數(shù),調(diào)節(jié)懲罰項(xiàng)的大小。
邏輯回歸具有簡單高效、并行性、解釋性好以及方便擴(kuò)展等優(yōu)點(diǎn),被廣泛地應(yīng)用于醫(yī)學(xué)數(shù)據(jù)分類任務(wù)[20-23]。本研究中正則化系數(shù)取值為0.00001;正則化時(shí)采用L1正則化,即直接在原來的損失函數(shù)基礎(chǔ)上加上權(quán)重參數(shù)的絕對(duì)值;誤差項(xiàng)達(dá)到指定值時(shí)則停止訓(xùn)練參數(shù)大小為0.0001;最大迭代次數(shù)為1000。
1.3.3 決策樹 決策樹是一種基于if-then-else 規(guī)則的有監(jiān)督分類學(xué)習(xí)算法,采用樹形結(jié)構(gòu),使用層層推理來實(shí)現(xiàn)最終的分類。一般由根節(jié)點(diǎn)(包含樣本的全集)、內(nèi)部節(jié)點(diǎn)(對(duì)應(yīng)特征屬性測試)和葉節(jié)點(diǎn)(代表決策的結(jié)果)3 個(gè)元素構(gòu)成。決策樹的生成通常有3 個(gè)步驟:特征選擇、決策樹的生成、決策樹的修剪。
1、特征選擇
“佳禾農(nóng)資不管發(fā)展到多大規(guī)模,永遠(yuǎn)不離開農(nóng)業(yè),離不開農(nóng)村。我們種地就是為農(nóng)民打工。”他表示,作為一個(gè)負(fù)責(zé)任的化肥貿(mào)易商、生產(chǎn)商,通過整合農(nóng)業(yè)生產(chǎn)各要素,輸出種植模式,才能更好地為農(nóng)業(yè)服務(wù),使自身的經(jīng)營工作更接地氣、更加穩(wěn)健,從而才能把佳禾打造成一個(gè)基業(yè)長青的“百年老店”。
在訓(xùn)練數(shù)據(jù)集中,每個(gè)樣本的屬性可能有很多個(gè),不同屬性的作用大小不同。通常使用“信息增益”篩選出與分類結(jié)果相關(guān)性較高的特征,也就是分類能力較強(qiáng)的特征,公式(7)。
其中,pk為當(dāng)前樣本集D中第k類樣本所占的比例。K為類別的總數(shù)。
2、決策樹生成
特征選定,就可以從根節(jié)點(diǎn)觸發(fā),計(jì)算所有節(jié)點(diǎn)特征的信息增益,選擇信息增益最大的特征作為節(jié)點(diǎn)特征,再根據(jù)該特征的不同取值建立子節(jié)點(diǎn),并對(duì)每個(gè)子節(jié)點(diǎn)使用相同的方式生成新的子節(jié)點(diǎn),直到信息增益很小或者沒有特征可以選擇為止。
3、決策樹剪枝
防止算法過擬合,去掉部分分支來降低過擬合的風(fēng)險(xiǎn)。
決策樹是最簡單的機(jī)器學(xué)習(xí)算法,它易于實(shí)現(xiàn),可解釋性強(qiáng),完全符合人類的直觀思維,在金融決策、醫(yī)療診斷領(lǐng)域有著廣泛的應(yīng)用[24-25]。
1.3.4 極限學(xué)習(xí)機(jī) 極限學(xué)習(xí)機(jī)是一種用來訓(xùn)練單隱藏層前饋神經(jīng)網(wǎng)絡(luò)算法[26]。根據(jù)插值定理和普通極限定理推導(dǎo)可知,只要激活函數(shù)無限可微,當(dāng)隱含層神經(jīng)元數(shù)等于訓(xùn)練樣本數(shù)時(shí),單隱藏層前饋神經(jīng)網(wǎng)絡(luò)可以零誤差逼近訓(xùn)練樣本,且與隱含層輸入權(quán)值wi和閾值bi的選取無關(guān)[27]。
極限學(xué)習(xí)機(jī)的輸入層權(quán)值和閾值采用隨機(jī)選取方式產(chǎn)生,并且不需要人為設(shè)置網(wǎng)絡(luò)初始權(quán)值和初始閾值等參數(shù),大大提高了訓(xùn)練速度,同時(shí)克服了過擬合問題。
“廣義”的單隱藏層前饋神經(jīng)網(wǎng)絡(luò)極限學(xué)習(xí)機(jī)的輸出表示為[28]:
其中:L為節(jié)點(diǎn)數(shù)目,β是隱藏層與輸出層之間的輸出權(quán)重,hi(x)是第i個(gè)隱藏層節(jié)點(diǎn)的輸出,H(x)是隱藏層輸出矩陣。在實(shí)驗(yàn)中設(shè)置的神經(jīng)元數(shù)為120,與訓(xùn)練樣本數(shù)相同。
近些年極限學(xué)習(xí)機(jī)在醫(yī)學(xué)領(lǐng)域得到廣泛的使用,Hu 等[29]使用深度CNN 和極限學(xué)習(xí)機(jī)器從X 射線圖像中進(jìn)行實(shí)時(shí)COVID-19 的診斷,徐丹使用極限學(xué)習(xí)機(jī)進(jìn)行乳腺腫瘤識(shí)別和診斷[30],王之瓊等[31]利用基于極限學(xué)習(xí)機(jī)算法進(jìn)行輕度認(rèn)知障礙的輔助診斷,都取得了比較好的效果。
應(yīng)用SPSS 26 軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,采用多因素logistic 回歸統(tǒng)計(jì)樣本的基本數(shù)據(jù),并進(jìn)行血腫擴(kuò)大的影響因素及其共線性分析,見表2。其中性別使用女性作為統(tǒng)計(jì)參考類別;吸煙史、飲酒史、抗凝、抗血小板、破入腦室使用陰性作為統(tǒng)計(jì)參考類別。根據(jù)BRAIN 評(píng)分標(biāo)準(zhǔn)(24 分制,見表1),統(tǒng)計(jì)每位病人包括基線腦出血量(B)、復(fù)發(fā)性腦出血(R)、使用華法林抗凝(A)、腦室出血(I)和從發(fā)病至CT 時(shí)間(N)在內(nèi)的5 個(gè)指標(biāo),給出BRAIN 評(píng)分結(jié)果。將0~24 的評(píng)分劃分為0~5、6~9、10~11、12~244 個(gè)區(qū)間段,對(duì)應(yīng)CT 檢測金標(biāo)準(zhǔn)分別計(jì)算每個(gè)區(qū)間對(duì)應(yīng)的血腫擴(kuò)大、非血腫擴(kuò)大以及血腫擴(kuò)大的概率。應(yīng)用受試者工作特征曲線(receiver operating characteristic curve, ROC)評(píng)估BRAIN 評(píng)分對(duì)血腫擴(kuò)大的預(yù)測結(jié)果,計(jì)算其敏感度、特異度,以及曲線下面積(area under the curve,AUC)數(shù)值,以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
支持向量機(jī)、邏輯回歸、決策樹與極限學(xué)習(xí)機(jī)4種算法是在基于python3.6,tensorflow1.2.0 版本Pycharm 軟件下編程實(shí)現(xiàn)的。電腦配置為Intel(R)Xeon(R)CPU E3-1225 v6@3.30GHz,RAM 12.0GB。隨機(jī)抽取80%(120 個(gè)樣本)形成訓(xùn)練集,剩余20%(30 個(gè)樣本)為測試集。算法訓(xùn)練時(shí)采用10 折交叉驗(yàn)證,取平均值作為結(jié)果。最后統(tǒng)計(jì)4 種算法的訓(xùn)練精度和測試精度、敏感度、特異性和ROC 曲線以及AUC值。
根據(jù)統(tǒng)計(jì)結(jié)果(P<0.05),150 例腦出血患者中65例(43.33%)出現(xiàn)血腫擴(kuò)大,85例(56.67%)未出現(xiàn)血腫擴(kuò)大。吸煙史、使用華法林抗凝、抗血小板、GCS 評(píng)分、均有統(tǒng)計(jì)學(xué)意義,為血腫擴(kuò)大的獨(dú)立影響因素。其中吸煙的患者比不吸煙的患者血腫擴(kuò)大概率增加1.925 倍;使用了華法林抗凝比未使用的情況血腫擴(kuò)大概率增加14.50 倍;使用抗血小板后血腫擴(kuò)大的概率會(huì)比未使用的情況增加9.97 倍;GCS 評(píng)分增加一個(gè)級(jí)別,血腫擴(kuò)大概率下降為73.1%,即較低的GCS 評(píng)分與血腫擴(kuò)大顯著相關(guān)。對(duì)上述因素進(jìn)行共線性分析,吸煙史、使用華法林抗凝、抗血小板、GCS 評(píng)分的方差膨脹因子(VIF)分別為1.695、1.373、1.785 和1.710,容差分別為0.590、0.729、0.560 和0.585。膨脹因子均小于10,同時(shí)容差均大于0.1,各因素之間無共線,均為獨(dú)立危險(xiǎn)因素,見表2。
表2 患者臨床資料統(tǒng)計(jì)結(jié)果Table 2 Statistical results of clinical data of patients
剩余的因素均無顯著性(P>0.05),是血腫擴(kuò)大的非獨(dú)立因素。其中與血腫擴(kuò)大概率增大正相關(guān)的因素為“性別”“破入腦室”“年齡”“入院舒張壓”“急舒張壓”“血糖”“總膽固醇”“三酰甘油”“國際標(biāo)準(zhǔn)化比值INR”“血小板計(jì)數(shù)”。與血腫擴(kuò)大概率增大負(fù)相關(guān)的因素為“飲酒史”“入院收縮壓”“急診血壓”“高密度脂蛋白膽固醇”“低密度脂蛋白膽固醇”“活化部分凝血活酶時(shí)間”“凝血酶原時(shí)間”“血紅蛋白”“血鈣”“初始血腫體積”和“發(fā)病至首次CT 檢查時(shí)間”。共線性分析顯示,所有因素的膨脹因子也均小于10,且容差均大于0.1,各因素之間無共線,是影響血腫擴(kuò)大的必要因素。
單獨(dú)對(duì)BRAIN 評(píng)分進(jìn)行分析,所有樣本的BRAIN 評(píng)分平均值為8.65(標(biāo)準(zhǔn)誤差0.041),顯著性小于0.01,且評(píng)分值增加一個(gè)等級(jí)血腫擴(kuò)大概率增加1.18倍。ROC曲線結(jié)果顯示,BRAIN評(píng)分預(yù)測血腫擴(kuò)大的敏感度為56.9%,特異性為74.1%,曲線下面積為0.706,95%CI 為: 0.62~0.79,見表3、圖1。根據(jù)BRAIN 評(píng)分標(biāo)準(zhǔn),0~5、6~9、10~11、12~244 個(gè)區(qū)間的實(shí)際血腫擴(kuò)大概率分別為25%(11/44)、36.2%(17/47)、45.5%(10/22)、72.8%(27/37),見表4。結(jié)果顯示隨著BRAIN 的評(píng)分增加血腫擴(kuò)大率有明顯的上升趨勢,但是較低分?jǐn)?shù)段的血腫擴(kuò)大概率高于以往研究結(jié)論(0~24 分的血腫擴(kuò)大概率為3.4%~85.8%)[7]。
圖1 BRAIN 評(píng)分預(yù)測血腫擴(kuò)大的受試者工作特征曲線Figure 1 ROC curve of BRAIN score prediction model
表3 BRAIN 評(píng)分的logistic回歸分析Table 3 Logistic regression analysis of BRAIN score
表4 BRAIN評(píng)分區(qū)間實(shí)際血腫擴(kuò)大和非血腫擴(kuò)大的統(tǒng)計(jì)結(jié)果Table 4 Statistical results of actual hematoma enlargement and non-hematoma enlargement in BRAIN score range
從4 種算法之間的對(duì)比來看,決策樹模型雖然在訓(xùn)練精度和敏感度上分別達(dá)到了93.33% 和80.00%,高于支持向量機(jī)和邏輯回歸模型,但是在測 試 精 測(66.67%)、特 異 性(53.33%)和AUC(0.667)3 個(gè)指標(biāo)中都是4 種算法最差的。支持向量機(jī)與邏輯回歸模型的5項(xiàng)指標(biāo)非常接近。最好的模型為極限學(xué)習(xí)機(jī),它的訓(xùn)練精度為99.25%,測試精度為93.33%,敏感度為98.50%,特異性為85.90%,AUC為0.926,所有指標(biāo)都是4種算法中最優(yōu)的??梢娔壳白鳛橹髁鞯纳窠?jīng)網(wǎng)絡(luò)方法優(yōu)于傳統(tǒng)的統(tǒng)計(jì)學(xué)分類方法,能夠?qū)W習(xí)更為復(fù)雜的樣本數(shù)據(jù),也說明其廣泛應(yīng)用于醫(yī)學(xué)數(shù)據(jù)分類任務(wù)的合理性,見表5。圖2可以直觀看到4種算法的ROC對(duì)比圖。
表5 4種自動(dòng)預(yù)測模型間的指標(biāo)對(duì)比Table 5 Index comparison among four automatic prediction models
圖2 4種自動(dòng)預(yù)測模型血腫擴(kuò)大的受試者工作特征曲線Figure 2 ROC curve of four automatic prediction models
將4 種算法與BRAIN 評(píng)分進(jìn)行對(duì)比,決策樹在特異性、AUC 兩個(gè)指標(biāo)以及邏輯回歸模型的特異性一個(gè)指標(biāo)比BRAIN 評(píng)分稍差,其他結(jié)果都高于BRAIN 評(píng)分??傮w而言,支持向量機(jī)、邏輯回歸和極限學(xué)習(xí)機(jī)都優(yōu)于BRAIN評(píng)分,尤其是極限學(xué)習(xí)機(jī)模型,敏感度、特異性、AUC 3項(xiàng)指標(biāo)都遠(yuǎn)超BRAIN評(píng)分。這也說明按照金標(biāo)準(zhǔn)統(tǒng)計(jì)出的BRAIN 0~24分血腫擴(kuò)大概率值,用來評(píng)判新的數(shù)據(jù),在準(zhǔn)確度上遜色于機(jī)器學(xué)習(xí)算法,反映出BRAIN評(píng)分標(biāo)準(zhǔn)設(shè)計(jì)合理性欠缺。
此外,本研究也對(duì)比了不同研究者BRAIN區(qū)間概率統(tǒng)計(jì)結(jié)果的差異性。表6 提供了學(xué)者王永平[8]和Joshua[9]各自給出的BRAIN 區(qū)間血腫擴(kuò)大概率值,同時(shí)也計(jì)算了本研究150 例病人在金標(biāo)準(zhǔn)下實(shí)際的區(qū)間血腫概率擴(kuò)大值,并且對(duì)比了4 種算法按照BRAIN 評(píng)分區(qū)間各自預(yù)測的血腫擴(kuò)大概率結(jié)果(樣本數(shù)據(jù)中每個(gè)區(qū)間隨機(jī)抽取20%樣本數(shù)據(jù)進(jìn)行預(yù)測)。從中可以看出,兩位學(xué)者統(tǒng)計(jì)的BRAIN 4個(gè)區(qū)間的血腫擴(kuò)大概率值與本中心實(shí)際血腫擴(kuò)大的概率值差距較遠(yuǎn),也與BRAIN評(píng)分提出者給的結(jié)論不同,說明4個(gè)研究中的數(shù)據(jù)差異較大,無法直接作為結(jié)論相互參看。而如果使用4種血腫擴(kuò)大的自動(dòng)預(yù)測模型進(jìn)行BRAIN 區(qū)間的血腫擴(kuò)大概率計(jì)算會(huì)發(fā)現(xiàn),支持向量機(jī)、邏輯回歸和決策樹3種模型只是在0~5 范圍預(yù)測血腫擴(kuò)大概率相對(duì)誤差稍大(其中邏輯回歸模型預(yù)測概率相對(duì)較好,為18.2%,實(shí)際血腫擴(kuò)大概率為25.0%)。隨著BRAIN 評(píng)分區(qū)間的提高,3 種算法的預(yù)測血腫擴(kuò)大概率都與實(shí)際金標(biāo)準(zhǔn)值逐漸接近。當(dāng)為最大值區(qū)間12~24 時(shí),基本和實(shí)際血腫擴(kuò)大概率值相同,其中支持向量機(jī)模型預(yù)測結(jié)果與實(shí)際血腫擴(kuò)大概率完全吻合(實(shí)際血腫擴(kuò)大概率為72.8%),而決策樹相對(duì)差一些。單獨(dú)分析極限學(xué)習(xí)機(jī)模型,其在BRAIN 評(píng)分的4 個(gè)區(qū)間內(nèi),都可以準(zhǔn)確地預(yù)測血腫擴(kuò)大的概率,與實(shí)際金標(biāo)準(zhǔn)統(tǒng)計(jì)結(jié)論的情況非常接近。相比BRAIN模型,預(yù)測血腫發(fā)生概率更符合樣本采集醫(yī)院的實(shí)際情況,預(yù)測的結(jié)果也更加準(zhǔn)確,屬于4種模型中最好的。
表6 4種自動(dòng)預(yù)測模型在BRAIN評(píng)分區(qū)間預(yù)測血腫擴(kuò)大概率的對(duì)比結(jié)果Table 6 Comparison results of four automatic prediction models in predicting hematoma expansion probability in BRAIN score interval %
另外,4 種算法都可以保存以往的訓(xùn)練模型,當(dāng)新的樣本數(shù)據(jù)加入,可以自動(dòng)地進(jìn)行血腫擴(kuò)大的判定,減輕了醫(yī)護(hù)人員的負(fù)擔(dān)。表7 列舉了支持向量機(jī)、邏輯回歸、決策樹和極限學(xué)習(xí)機(jī)在進(jìn)行模型訓(xùn)練和測試新增單一數(shù)據(jù)時(shí)的運(yùn)行時(shí)間。不同于BRAIN 評(píng)分標(biāo)準(zhǔn)的較長計(jì)算時(shí)間,只有極限學(xué)習(xí)機(jī)的訓(xùn)練時(shí)間為18.902 s,其余時(shí)間均在1 s 以下。日后當(dāng)病例數(shù)據(jù)增加時(shí)動(dòng)態(tài)地進(jìn)行模型的重新訓(xùn)練也非常的省時(shí),也能使得模型更為貼合研究所在醫(yī)院的實(shí)際血腫擴(kuò)大概率分布特點(diǎn)。
表7 4種自動(dòng)預(yù)測模型的模型訓(xùn)練與新樣本血腫擴(kuò)大概率判別時(shí)間對(duì)比Table 7 Comparison between model training time of four automatic prediction models and evaluating time of hematoma enlarge‐ment probability of new samples
腦出血具有較高發(fā)病率、病死率、致殘率的特點(diǎn)。血腫擴(kuò)大是腦出血急性期較為常見現(xiàn)象,也是不良預(yù)后的重要危險(xiǎn)因素。因此,發(fā)現(xiàn)靈敏準(zhǔn)確的血腫擴(kuò)大概率的預(yù)測模型,盡早識(shí)別腦出血患者中血腫擴(kuò)大的高危人群,成為目前該領(lǐng)域研究的重點(diǎn)問題。
本研究根據(jù)多因素logistic 回歸統(tǒng)計(jì)分析,得出吸煙史、使用華法林抗凝、抗血小板、GCS 評(píng)分為血腫擴(kuò)大的獨(dú)立因素,在血腫擴(kuò)大概率評(píng)判時(shí)應(yīng)該作為重點(diǎn)因素考慮。同時(shí)本研究對(duì)比了BRAIN 評(píng)分模型與支持向量機(jī)、邏輯回歸、決策樹和極限學(xué)習(xí)機(jī)這4 種自動(dòng)預(yù)測模型的優(yōu)缺點(diǎn)。測試結(jié)果也顯示,無論從訓(xùn)練精度、測試精度、到敏感性、特異性和ROC 曲線下面積,支持向量機(jī)、邏輯回歸和極限學(xué)習(xí)機(jī)3 種算法都優(yōu)于BRAIN 評(píng)分標(biāo)準(zhǔn),尤其是極限學(xué)習(xí)機(jī)模型,各項(xiàng)結(jié)果都非常的優(yōu)異。并且當(dāng)數(shù)據(jù)量增加時(shí),極短的運(yùn)行時(shí)間,自動(dòng)地進(jìn)行模型的訓(xùn)練,都使得模型的調(diào)整成為可能,而傳統(tǒng)的BRAIN 評(píng)分的區(qū)間統(tǒng)計(jì)方式是不具備這樣的優(yōu)勢的。
分析上述預(yù)測模型優(yōu)略的原因,主要的因素在于BRAIN評(píng)分的分?jǐn)?shù)取值為離散值,并且各個(gè)因素的取值大小也是作者的經(jīng)驗(yàn)考慮,沒有能夠進(jìn)行精確的數(shù)學(xué)建模和計(jì)算,自然精準(zhǔn)性就差一些,同時(shí)該模型也只是考慮了血腫擴(kuò)大的5個(gè)因素,而廣泛的研究顯示影響血腫擴(kuò)大的因素并非只有這5個(gè)指標(biāo),因此該評(píng)分標(biāo)準(zhǔn)與血腫擴(kuò)大的關(guān)聯(lián)性就不夠全面。
而4種自動(dòng)預(yù)測模型將與血腫擴(kuò)大相關(guān)的獨(dú)立和非獨(dú)立因素全部納入到預(yù)測模型的輸入變量中,根據(jù)數(shù)學(xué)的統(tǒng)計(jì)算法和神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機(jī)制,客觀的進(jìn)行血腫擴(kuò)大概率的學(xué)習(xí)和識(shí)別,自然可以得到相對(duì)較好的判別結(jié)果。支持向量機(jī)、邏輯回歸、決策樹屬于傳統(tǒng)的機(jī)器學(xué)習(xí)模型,它們是根據(jù)具體的算法規(guī)則進(jìn)行血腫擴(kuò)大的預(yù)測,一些特異性的數(shù)據(jù)在“規(guī)則”下是無法正確地評(píng)判的。而極限學(xué)習(xí)機(jī)算法屬于神經(jīng)網(wǎng)絡(luò)模型的一種,具備處理線性不可分的問題,并且更精準(zhǔn),容錯(cuò)性更好。在學(xué)習(xí)過程中,神經(jīng)網(wǎng)絡(luò)能夠從輸入數(shù)據(jù)中挖掘更多的信息,完成更復(fù)雜的任務(wù)。因此非常適合學(xué)習(xí)非線性、高緯度、復(fù)雜的樣本數(shù)據(jù),掌握區(qū)分是否血腫擴(kuò)大的特征,得到了最優(yōu)的結(jié)果。這也是目前在醫(yī)學(xué)數(shù)據(jù)分析中大量引入神經(jīng)網(wǎng)絡(luò)的原因。因此根據(jù)腦血腫擴(kuò)大預(yù)測指標(biāo)的特點(diǎn),建議臨床醫(yī)生在選擇自動(dòng)預(yù)測模型時(shí)使用極限學(xué)習(xí)機(jī)模型。
本研究也具有一定的局限性,如所有模型的測試精度都稍差于訓(xùn)練精度,造成的原因是樣本量太少,測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)不完全一致,模型訓(xùn)練后始終無法對(duì)少量測試數(shù)據(jù)進(jìn)行識(shí)別。應(yīng)該在今后的研究中不斷的加大樣本數(shù)據(jù)量。此外,樣本量的不足也造成了采用多因素logistic 回歸進(jìn)行數(shù)據(jù)統(tǒng)計(jì)時(shí),飲酒史對(duì)于血腫擴(kuò)大的影響并沒有正確的體現(xiàn)出來,而在很多研究中這個(gè)因素都被認(rèn)定為影響血腫擴(kuò)大的獨(dú)立影響因素。
綜上所述,本研究引入支持向量機(jī)、邏輯回歸、決策樹和極限學(xué)習(xí)機(jī)這4種自動(dòng)預(yù)測模型來進(jìn)行血腫擴(kuò)大概率的預(yù)測分析,在多個(gè)指標(biāo)對(duì)比中都優(yōu)于傳統(tǒng)的BRAIN 評(píng)分標(biāo)準(zhǔn),尤其是極限學(xué)習(xí)機(jī)模型,各項(xiàng)結(jié)果都非常的優(yōu)異。并且模型可以動(dòng)態(tài)地學(xué)習(xí)和調(diào)整樣本數(shù)據(jù),進(jìn)一步提高了預(yù)測準(zhǔn)確性,能夠得出更為準(zhǔn)確的血腫擴(kuò)大預(yù)測結(jié)果,為臨床醫(yī)生的后續(xù)診斷和治療提供幫助。
廣東藥科大學(xué)學(xué)報(bào)2022年3期