張 賓,羅曉舟,王澍欣,賀 君,徐展瓊,李克嵩,朱歡歡,莊禮興△
(1. 廣州中醫(yī)藥大學(xué)第一附屬醫(yī)院,廣州 510405; 2. 廣州中醫(yī)藥大學(xué),廣州 510405)
卒中后吞咽功能障礙是卒中常見的并發(fā)癥,據(jù)研究報道30%~65%急性腦卒中患者中存在不同程度的吞咽障礙[1],吞咽障礙容易引起誤吸導(dǎo)致吸入性肺炎,進食困難也會導(dǎo)致患者營養(yǎng)不良,影響患者康復(fù)和卒中患者生活質(zhì)量,并延長住院時間,增加治療費用,甚至增加卒中患者的病死率。舌三針治療卒中后吞咽功能障礙療效確切[2-3],提高卒中患者的生存質(zhì)量,數(shù)據(jù)挖掘技術(shù)是目前醫(yī)學(xué)研究的熱點之一。本研究嘗試采用重復(fù)增量修剪算法(RIPPER算法),探討靳三針治療卒中后吞咽功能障礙顯效率影響因素。
RIPPER算法是在JohannesFurnkranz和GerhardWidmer于1994年提出的增量減少誤差修剪法(IREP)[4]的基礎(chǔ)上,由WilliamW.Cohen所優(yōu)化設(shè)計出的重復(fù)增量修剪(Repeated Incremental Pruning to Produce Error Reduction,PIPPER)算法[5]。本算法基于一種信息指標(biāo)——似然率統(tǒng)計量(LikeihoodRatioStatistic)。
本研究筆者直接選擇“顯效”作為療效影響因素討論的結(jié)局指標(biāo),采用人工智能(AI)技術(shù)中機器學(xué)習(xí)的方法,嘗試通過重復(fù)增量修剪算法對既往病歷資料進行回顧探索,并對結(jié)果進行歸納和辨析。以期總結(jié)出臨床運用舌三針治療本病過程中影響顯效率的因素,并探討在臨床治療中對這些因素加以控制而提高顯效率的可行性?;谶@一設(shè)想,現(xiàn)將其試驗過程報道如下。
通過病歷系統(tǒng)回顧并記錄2014年3月至2017年3月于廣州中醫(yī)藥大學(xué)第一附屬醫(yī)院康復(fù)中心的住院部卒中后吞咽功能障礙患者457例的基本資料、臨床資料及治療效果,包括年齡、性別、脈象、面色、舌質(zhì)、舌苔、疾病分期、BMI體質(zhì)量指數(shù)、血壓、血糖、血甘油三酯、血總膽固醇、吸煙史、飲酒史及最終療效。盡可能只采用客觀的證候體征,而不對證型作出主觀判斷。除最終療效外所有資料均以入院首次記錄為準(zhǔn),最終符合標(biāo)準(zhǔn)者457例。
符合1995年全國第四屆腦血管病學(xué)術(shù)會議制定的腦梗塞或腦出血診斷標(biāo)準(zhǔn)[5],經(jīng)頭顱CT或MRI查實,臨床以吞咽障礙為主要表現(xiàn)。
符合上述診斷標(biāo)準(zhǔn);符合各指標(biāo)分級界定標(biāo)準(zhǔn);年齡45~75周歲;配合完成治療者。排除標(biāo)準(zhǔn):不符合納入標(biāo)準(zhǔn)者;合并其他系統(tǒng)嚴(yán)重疾病者;資料不齊全者;療效判定標(biāo)準(zhǔn)不同者。
1.4.1 年齡 結(jié)合聯(lián)合國2000年制定標(biāo)準(zhǔn),本題將年齡劃分為45歲以下為“青年”,45~59歲為“中年”,60歲及以上為“老年”。
1.4.2 疾病分期 急性期:發(fā)病后2周內(nèi);恢復(fù)期:發(fā)病在2周以上至半年以內(nèi);后遺癥期:發(fā)病在半年以上。
1.4.3 BMI指數(shù) 按照中國肥胖工作小組2003年制定的標(biāo)準(zhǔn)[6]:BMI<18.5為“偏輕”;18.5≤BMI<24為“正?!保?4≤BMI<28為“超重”;BMI≥28為“肥胖”。
1.4.4 血壓 正常:收縮壓90~140mmHg,舒張壓60~90mmHg;低血壓:低于正常標(biāo)準(zhǔn);1級高血壓:收縮壓140~159mmHg,舒張壓90~99mmHg;2級高血壓:收縮壓160~179mmHg,舒張壓100~109mmHg;3級高血壓:收縮壓≥180mmHg,舒張壓≥110mmHg。
1.4.5 血糖 空腹全血血糖為3.9~6.1 mmol/L為“正?!?,高于此標(biāo)準(zhǔn)判定為“偏高”。
1.4.6 血甘油三酯 空腹全血甘油三酯的值在0.22~1.65mmo/L范圍內(nèi)為“正?!保哂诖藰?biāo)準(zhǔn)判定為“偏高”。
1.4.7 血總膽固醇 空腹全血總膽固醇低于5.17 mmol/L為“正?!保哂诖藰?biāo)準(zhǔn)判定為“偏高”。
1.4.8 最終療效 采用吞咽功能障礙療效評定標(biāo)準(zhǔn)[7]:(1)洼田飲水試驗評分: 患者端坐,飲下30 ml溫水。I級:能不嗆咳1次飲下,記1分;Ⅱ級:能不嗆咳分2次以上飲下,記2分;Ⅲ級:有嗆咳能1次飲下,記3分;IV級:有嗆咳分2次以上飲下,記4分;V級:屢屢嗆咳,不能全部咽下,記5分。(2)療效評價:顯效:吞咽障礙癥狀基本消失,洼田飲水試驗提高1~2級,營養(yǎng)狀況好,無并發(fā)癥;有效:吞咽障礙明顯改善,洼田飲水試驗提高1級,營養(yǎng)狀況良好;無效:吞咽障礙改善不明顯或無改善,洼田飲水試驗無變化或在Ⅲ級以上[8]。
對于合并高血壓、高血脂、高血糖的患者選用相應(yīng)藥物予以控制。舌三針取穴及操作:取穴上廉泉及其左右旁開0.8寸。上廉泉穴位于廉泉穴上1寸,或于前正中線頜下1寸,當(dāng)舌骨與下頜緣之間凹陷處取穴,由下頜舌骨肌、頦舌骨肌間至舌體。上廉泉穴為舌I針,上廉泉穴左右旁開0.8寸分別為舌II針、舌III針。操作:選取環(huán)球牌0.3×40 mm規(guī)格毫針,然后常規(guī)75%酒精棉球局部消毒,快速進針后,患者得氣后接G-6805-1型電針治療儀,波形采用連續(xù)波25~35 Hz,強度以患者耐受為度,留針30 min,每日1次,1周為1個療程,共2個療程。
采用Rx64 2.15.3程序包中的RWeka[5]程序包,對上述記錄的病人信息選用RIPPER算法進行規(guī)則學(xué)習(xí)。
在所納入的457例患者中,青年者63例,中年者179例,老年者215例,男性295例,女性162例;吸煙123例,不吸煙334例;共錄得脈象7種,其中沉脈7例,滑脈162例,平脈51例,濡脈199例,澀脈4例,細脈15例,弦脈19例;舌質(zhì)6種,胖大36例,淡紅301例,舌質(zhì)淡者91例,老舌4例,嫩舌25例,瘦舌1;舌苔錄得5種,剝落苔1例,薄白苔2例,白苔259例,黃膩苔167例,少苔28例;面色錄得6種,色正常者(紅黃隱隱,明潤含蓄)29例,色晦暗者84例,色黃者72例,色紅者180例,色黑者44例,色白者48例;BMI體質(zhì)量指數(shù)正常198例,肥胖102例,超重157例;血壓三級67例,二級112例,一級239例,正常28例;血糖正常227例,偏高230例;甘油三酯正常91例,偏高366例;血總膽固醇正常131例,偏高326例;不飲酒416例,飲酒170例;疾病分期急性期64例,恢復(fù)期153例,后遺癥期240例;最終療效非顯效者137例,顯效者320例。
運算結(jié)果顯示,運用RIPPER算法學(xué)習(xí)器以顯效與否作為結(jié)局指標(biāo),對靳三針治療本病顯效因素運算,結(jié)果顯示正確分類率能夠達到98.4683%,占全部457例病人中的450例,最終學(xué)習(xí)器總結(jié)出10條顯效率的影響因素。一是舌質(zhì)為淡、膽固醇偏高且疾病分期處于后遺癥期者療效不明顯(被覆蓋46例/錯分0例),即符合條件者46例,被錯誤劃分為顯效者0例,下同);二是血壓為二級、不吸煙患者療效不明顯(被覆蓋49例/錯分2例);三是舌苔為少苔的患者效果不明顯(被覆蓋10例/錯分1例);四是體質(zhì)量指數(shù)為肥胖、脈象為濡脈、不吸煙且甘油三脂偏高患者效果不明顯(被覆蓋14例/錯分2例);五是膽固醇偏高、肥胖且不飲酒的后遺癥期患者療效不明顯(被覆蓋3例/錯分0例);六是舌質(zhì)為老患者療效不明顯(被覆蓋3例/錯分0例);七是吸煙、血糖偏高且性別為男性患者療效不明顯(被覆蓋9例/錯分0例);八是面色黑且膽固醇正常的患者療效不明顯(被覆蓋3例/錯分0例);九是吸煙、面色紅、膽固醇偏高的老年患者療效不明顯(被覆蓋3例/錯分0例);十是其余情況下治療為顯效(被覆蓋317例/錯分2例)。
RIPPER算法學(xué)習(xí)器運算結(jié)果:
REP的意思是Reduced Error Pruning,意即減少錯誤剪枝,即把訓(xùn)練集分成獨立的生長集和剪枝集,在生長集上貪心地產(chǎn)生規(guī)則并在剪枝集上不斷被簡化直到規(guī)則的準(zhǔn)確性下降。作為一個很基礎(chǔ)的算法其滿足規(guī)則歸納的各個要件,描繪了RIPPER算法大體框架。然后在REP算法上發(fā)展起來的IREP,最主要的改變是使用了先剪枝與后剪枝結(jié)合的辦法。接下來是IREP×算法,相比于IREP,其引入了最小描述長度用于判斷停止條件,并在剪枝時使用了新的度量標(biāo)準(zhǔn)。而RIPPER算法則是在IREP×的基礎(chǔ)上加入了優(yōu)化階段,其在IREP*產(chǎn)生的規(guī)則上進一步調(diào)整后的結(jié)果。RIPPER算法的基本思想就是將訓(xùn)練過程分為兩部分,一是根據(jù)貪心原則(greedy)采用啟發(fā)式方法(heuristics),利用信息增益手段構(gòu)造一個最初的規(guī)則集合,通過一個優(yōu)化過程剪除(prune)規(guī)則集合并提高規(guī)則集合的準(zhǔn)確性。二是分類過程,如果樣本的特征滿足某個規(guī)則就認(rèn)為該樣本屬于此類。RIPPER算法是一個有效探索和規(guī)則學(xué)習(xí)方法的組合,它會考慮多個規(guī)則同時存在的情況。雖然復(fù)雜性會有所增加,但其優(yōu)良性能得到公認(rèn)。RIPPER算法的主框架分為兩個部分,即生成規(guī)則與優(yōu)化規(guī)則。生成規(guī)則部分是1個兩層的循環(huán),其中外循環(huán)每次生成一條規(guī)則修剪后添加到規(guī)則庫,內(nèi)循環(huán)則是每次為規(guī)則增加1個前件;優(yōu)化部分則是根據(jù)規(guī)則庫里的規(guī)則構(gòu)造備選規(guī)則,并使用MDL準(zhǔn)則挑選出最佳規(guī)則加入規(guī)則庫,具有易理解、易優(yōu)化、高效率等特點。RIPPER算法由于不需要事先建立完整決策樹,因此效率比C4.5等要高,復(fù)雜度為ο(Nlog2N),且可以使用很大的數(shù)據(jù)集,同時在算法效果上不亞于C4.5生成的規(guī)則。
就本題而言,計算機對病人顯效率的判斷已經(jīng)能夠達到98.4683%,表明RIPPER算法對顯效率的判斷已經(jīng)很高。對于學(xué)習(xí)器所生成的具體規(guī)則而言,吸煙、肥胖患者、血糖偏高且為后遺癥期患者臨床療效不明顯,這與臨床實踐是密切相符的。吸煙、肥胖及血糖都是臨床可以提前干預(yù)的因素,有利于指導(dǎo)臨床實踐。當(dāng)然,其中也生成了與臨床不一致甚至相反的結(jié)論,如血壓為二級、不吸煙患者療效不明顯,面色黑且膽固醇正常的患者療效不明顯。推測其原因一是本研究雖然納入457例病例資料但終究其例數(shù)相對較少;二是由于RIPPER算法自身的特點所致,其優(yōu)點在于生成相對易于理解的規(guī)則,同時對大數(shù)據(jù)集及噪聲數(shù)據(jù)有效,但缺點也相對明顯,即生成規(guī)則可能違反常理或從業(yè)者常識,且對數(shù)值型數(shù)據(jù)不夠理想。
綜上所述,本課題采用對457例病歷資料進行RIPPER算法學(xué)習(xí)后所得出的規(guī)則中,有的已經(jīng)是臨床上的共識,也有的難于被現(xiàn)有知識所理解。而隨著病例數(shù)據(jù)量的增加,本課題所建成的模型準(zhǔn)確度還會進一步提升,得出的規(guī)則也會相較于現(xiàn)在更加精確。我們在今后的研究中將增加算法,如決策樹模型對病例資料進行分析探討,為臨床醫(yī)生挖掘更有指導(dǎo)意義的規(guī)則。數(shù)據(jù)挖掘和機器學(xué)習(xí)是目前科技界研究的熱點,特別是AlphaGo在圍棋中戰(zhàn)勝人類這一事件,極大地激發(fā)了人類對機器學(xué)習(xí)算法的研究。筆者雖不能斷定計算機技術(shù)在臨床診斷中的運用會取代臨床醫(yī)生的判斷,但是一定會為我們臨床診斷提供有力的幫助。