張洪
(四川大學計算機學院,成都610065)
腦卒中(Stroke)是一個危害嚴重的全球性問題,腦卒中分為缺血性腦卒中和出血性腦卒中,缺血性腦卒中是因腦脊動脈閉塞或極重度狹窄而缺乏血流灌注。出血性腦卒中,也稱腦出血(Intracerebral Hemorrhage,ICH),腦出血是因為腦脊動脈破裂而導致腦實質(zhì)內(nèi)、蛛網(wǎng)膜下腔和腦室內(nèi)出血。全球范圍內(nèi),在發(fā)達國家,腦出血占腦卒中約11%,在非發(fā)達國家,腦出血占腦卒中22%左右,一旦出現(xiàn)腦出血,其中有75%的患者會發(fā)生死亡[1-2]。
出現(xiàn)腦出血癥狀后發(fā)生早期血腫擴大(Hematoma Expansion,HE)與不良的預后結果相關,是改善臨床結果的關鍵。及時地發(fā)現(xiàn)可能會發(fā)生血腫擴大的腦出血患者,能夠及時地對患者進行治療。因此,利用可能與血腫擴大有關特征,建立自動化腦出血早期血腫擴大預測模型,已逐漸成為研究熱點。
本文基于機器學習理論,從建模方法上對現(xiàn)有的腦出血血腫擴大預測的關鍵性研究進行了總結,分析后發(fā)現(xiàn),從機器學習的角度來看,當前研究在數(shù)據(jù)、特征選擇、學習器、模型評價指標方面都有值得改進的地方,未來,應多結合機器學習與腦出血血腫擴大預測兩個研究領域,以促進血腫擴大預測研究的發(fā)展。
本節(jié)將從數(shù)據(jù)集、特征提取、特征選擇、訓練算法、模型性能以及血腫擴大劃分標準6 個方面對當前血腫擴大研究的建模方法進行總結,如表1 所示是其中一些關鍵性的研究。
表1 血腫擴大預測關鍵性研究
Takeda 等[3]研究了201 例急性腦出血患者。首先收集了與患者有關的14 個臨床和影像學特征,以基線CT 到隨訪CT 時血腫相對擴大33%或絕對擴大12.5ml作為血腫擴大劃分閾值,3.4%的患者發(fā)生了血腫擴大。然后使用單變量特征選擇方法進行特征選擇,對每個特征進行了T-檢驗、Mann-Whitney U 檢驗以及卡方檢驗,經(jīng)過特征選擇,最優(yōu)特征子集為:血腫體積、入院后1.5 小時心臟收縮壓和血腫密度異質(zhì)性。最后使用多變量邏輯斯蒂回歸建立預測模型,結果顯示,模型在驗證集上的AUC 性能指標為0.91。
Chan 等[4]研究了257 名腦出血患者。首先收集了與患者有關的23 個特征,以基線CT 到隨訪CT 時血腫體積相對擴大33%或絕對擴大12.5ml 將患者分為血腫擴大或非血腫擴大,其中35.4%的患者發(fā)生了血腫擴大。然后使用單變量特征選擇方法進行特征選擇,對每個特征進行了Fisher 精確檢驗和Kruskal-Wallis 檢驗,經(jīng)過篩選,最優(yōu)特征子集為:抗血劑的使用和基線mNIHSS 分數(shù)。最后使用多變量邏輯斯蒂回歸建立血腫擴大自動預測模型,結果顯示,模型在驗證集上的性能指標AUC 為0.67。
Miyahara 等人[5]研究了622 名腦出血患者。首先收集了與患者有關的23 個特征,以基線CT 到隨訪CT時血腫體積相對擴大33%或血腫最大直徑絕對增加5mm 作為閾值,將患者劃分為血腫擴大或非血腫擴大,其中10.8%的患者發(fā)生了血腫擴大。然后使用單變量特征方法選擇進行特征選擇,對每個特征進行了皮爾遜卡方檢驗、Fisher 精確檢驗和Wilcoxon 檢驗,經(jīng)過特征選擇,最優(yōu)特征子集為:是否使用抗凝、血腫周圍發(fā)生水腫、Niveau 形成、血腫不均一性和血腫體積。最后使用多變量邏輯斯蒂回歸建立血腫擴大自動預測模型,結果顯示,模型在驗證集上的AUC 性能指標能達到0.81,在測試集上的性能指標能達到0.80。
Sakuta[6]研究了118 名腦出血患者。首先收集了與患者有關的20 個特征,以基線CT 到隨訪CT 時血腫體積相對擴大33%或血腫體積絕對增加6ml 作為分類閾值,將患者劃分為血腫擴大和非血腫擴大兩個類,其中25%的患者發(fā)生了血腫擴大。然后使用單變量特征選擇方法進行特征選擇,對每個特征進行了卡方檢驗、Fisher 精確檢驗、T-檢驗、Mann-Whitney U 檢驗,經(jīng)過特征特征選擇,最優(yōu)特征子集為:基線NIHSS、抗凝藥使用、血糖。最后使用多變量邏輯斯蒂回歸建立預測模型,并開發(fā)了一個量表,結果顯示,模型在驗證集上的AUC 性能指標為0.81。
除了以上研究外,還有一些類似地血腫擴大預測研究,例如文獻[7-9],其建模方法基本一致??偟膩砜矗[擴大預測研究的建模方法缺乏多樣性,除了數(shù)據(jù)集不一樣外,其他建模流程基本一致。
通過對血腫擴大研究的總結,可以看出當前血腫擴大已經(jīng)取得了一定的研究成果,發(fā)現(xiàn)了一些與血腫擴相關的預測因子。但在建模方法上,當前研究在數(shù)據(jù)、特征選擇、分類器、評價指標方面都有待改進。
現(xiàn)有研究將血腫擴大預測問題轉(zhuǎn)換成了二分類問題進行處理,通過一個閾值將血腫擴大的值變?yōu)槎?,然而,血腫擴大劃分的閾值并不統(tǒng)一。當前研究的結果差異也較大,可能是分類閾值的設定不一致導致的,同時,這也造成了研究之間更沒有可比性。此外,經(jīng)過二值劃分后,發(fā)生血腫擴大的腦出血患者數(shù)量相對較少,機器學習理論表明,類別不平衡會使得預測模型有偏向多數(shù)類樣本的風險,導致模型靈敏度偏低而特異度偏高。當前血腫擴大研究并未報道模型的靈敏度和特異度,有可能是因為類別不平衡導致模型靈敏度過低和特異度過高。
在機器學習中,類別不平衡處理方法主要有過采樣法、欠采樣法和閾值移動法[10]。閾值移動法通過調(diào)整分類的閾值來處理非平衡數(shù)據(jù)集問題。欠采樣法通過去掉部分多數(shù)類來使得兩個類別的樣本量相同,但是,這樣做會使得模型可利用的信息變小了,此外,當少數(shù)類樣本過少時,該方法也不適用。過采樣法通過對訓練集中的少數(shù)類樣本復制多份,使得正例樣本和負例樣本的數(shù)量相同,但是簡單地復制會使得模型嚴重過擬合。SMOTE 系列[11-12]的算法對已有的少數(shù)類樣本進行插值來產(chǎn)生少數(shù)類樣本,從而將數(shù)據(jù)集變?yōu)槠胶鈹?shù)據(jù)集。一般來說,過采樣法效果更好些,因此,未來的血腫擴大研究可嘗試著使用過采樣法來處理類別不平衡問題。
在機器學習中,特征選擇方法主要分為過濾式特征選擇和包裹式特征選擇,當前血腫擴大預測研究所用的特征選擇方法為單變量特征選擇,屬于過濾式特征選擇方法,即特征選擇不依賴于學習器。而包裹式特征選擇在進行特征選擇時,以分類器的分類性能來評價特征子集的好壞,因此,一般來說,過濾式特征選擇相對更好一些,但包裹式特征選擇比較耗時,適合小數(shù)據(jù)集。對于血腫擴大數(shù)據(jù)集,其樣本量都較小,因此,包裹式特征選擇方法可能更適合。
在機器學習中,決策樹、支持向量機、樸素貝葉斯等經(jīng)典算法在眾多領域都取得了較大的成功?,F(xiàn)有血腫擴大研究所用的分學習器為邏輯斯蒂回歸,而回歸只能發(fā)現(xiàn)特征與標簽的之間的線性關系。支持向量機通過尋找一個超平面來進行分類,對于非線性可分數(shù)據(jù),可使用高斯核或多項式核進行將數(shù)據(jù)集映射到高維空間,再尋找超平面來進行分類。決策樹不僅可以發(fā)現(xiàn)多個特征與目標之間的非線性關系,其可解釋性也很強。因此,未來的血腫擴大預測研究中,可嘗試著使用更多的機器學習算法作為學習器。
機器學習領域,對于一個二分類模型性能的評價,有AUC 值、準確率、F1 度量、靈敏度、特異度等指標。現(xiàn)有血腫擴大研究報道的模型性能指標僅AUC 值,而AUC 值僅能展示模型的總體預測能力。靈敏度可以展示預測模型在正例樣本上的預測能力,而特異度可以展示預測模型在負例樣本上的預測能力。因此,血腫擴大研究還應該報道其預測模型的靈敏度和特異度,以展示其模型對血腫擴大患者的預測能力和對非血腫擴大患者的預測能力。
本文總結了當前的關鍵的腦出血早期血腫擴大預測研究,從機器學習建模的角度分析了當前腦出血早期血腫擴大預測研究的建模方法,指出了當前研究在數(shù)據(jù)、特征選擇、學習器、評價指標方面存在的問題,并針對存在的每個問題,提出了可能的解決方法。當前,血腫擴大預測研究的建模方法比較單一,這可能是因為血腫擴大研究者多為醫(yī)學領域的研究者,對機器學習理論及機器學習建模技術了解較少。未來,血腫擴大預測研究者應多于機器學習研究者交流,將更多先進的機器學習建模方法應用到血腫擴大預測中,以促進血腫擴大自動預測研究的發(fā)展。