国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多層學(xué)習(xí)聯(lián)合建模方法設(shè)計(jì)在氣陰兩虛型咳嗽證候的辨證診斷中的應(yīng)用*

2021-01-09 07:01:44浙江中醫(yī)藥大學(xué)310053項(xiàng)莎特瞿溢謙葉含笑
關(guān)鍵詞:氣陰病案證候

浙江中醫(yī)藥大學(xué)(310053) 項(xiàng)莎特 瞿溢謙 葉含笑

【提 要】 目的 采用多層學(xué)習(xí)聯(lián)合建模方法挖掘氣陰兩虛型咳嗽的辨證證候,以期為中醫(yī)學(xué)習(xí)、研究臨床辨證及診斷提供新的思路與方法。方法 聯(lián)合采用隨機(jī)森林、XGBoost及l(fā)ogistic回歸三種機(jī)器學(xué)習(xí)算法,對(duì)767例咳嗽患者病案,運(yùn)用Anaconda 3-5.2.0軟件建立算法模型進(jìn)行分析。結(jié)果 運(yùn)用該方法所得的證候結(jié)果與文獻(xiàn)記載的證候表現(xiàn)大體一致,主要為嗆咳、乏力、口干、痰少而色白,燥苔、脈弱等證候。經(jīng)交叉驗(yàn)證得出,XGBoost算法準(zhǔn)確率為86.7%,隨機(jī)森林為85.3%。結(jié)論 多層學(xué)習(xí)聯(lián)合建模方法可彌補(bǔ)單獨(dú)使用隨機(jī)森林、XGBoost或logistic回歸算法所產(chǎn)生的缺陷,尤其對(duì)于臨床病案較少的小樣本數(shù)據(jù)更為有效,該方法在一定程度上降低了重要變量丟失的可能性。

咳嗽為常見(jiàn)疾病,中醫(yī)治療該疾病的歷史悠久,且對(duì)于臨床檢查無(wú)殊的咳嗽的療效較為顯著[1]。氣陰兩虛為致使原因不明、臨床檢查無(wú)明顯病理性改變的咳嗽發(fā)作的病機(jī)之一。在當(dāng)今大數(shù)據(jù)及人工智能的沖擊下,探索新的中醫(yī)學(xué)習(xí)、傳承方式成為趨勢(shì)[2]。通過(guò)機(jī)器學(xué)習(xí)提取判斷事物屬性特征,從而建立診斷模型的方式,成為了醫(yī)學(xué)領(lǐng)域中蓬勃發(fā)展的一項(xiàng)研究[3]。此方法有助于從隱匿和重疊的證候中挖掘出其分布特點(diǎn),從而預(yù)測(cè)疾病證型[4],同時(shí)可達(dá)到挖掘和學(xué)習(xí)中醫(yī)臨床辨證及診斷的目的。

因此,本研究氣陰兩虛型咳嗽患者的基礎(chǔ)上,聯(lián)合多模型機(jī)器學(xué)習(xí)算法,組成多層學(xué)習(xí)聯(lián)合建模方法,對(duì)所采集氣陰兩虛型咳嗽的四診信息進(jìn)行挖掘和分析,從而為機(jī)器學(xué)習(xí)輔助開(kāi)發(fā)新的中醫(yī)學(xué)習(xí)方式提供參考。

資料與方法

1.數(shù)據(jù)來(lái)源

2018年1月-2018年12月就診于浙江中醫(yī)藥大學(xué)門診部的咳嗽患者病案。

2.納入標(biāo)準(zhǔn)

(1)疾病名稱為咳嗽,證型為氣陰兩虛;(2)復(fù)診資料顯示,該患者咳嗽癥狀緩解;(3)咳嗽的診斷標(biāo)準(zhǔn)同時(shí)參照《咳嗽的診斷與治療指南》(2015)[1];(4)所采集的病案包含了完整的四診信息。

3.排除標(biāo)準(zhǔn)

(1)復(fù)診資料顯示,咳嗽癥狀并未緩解者;(2)未見(jiàn)復(fù)診信息者;(3)病案中四診信息不全者;(5)咳嗽診斷標(biāo)準(zhǔn)不符合《咳嗽的診斷與治療指南》者。

4.數(shù)據(jù)總量

采集咳嗽病例767例,其中氣陰兩虛型咳嗽病例為564例,非氣陰兩虛型咳嗽病例為203例。

5.數(shù)據(jù)預(yù)處理

將采集到的病案按姓名、證候、是否為氣陰兩虛型咳嗽,建立信息標(biāo)簽。證候名稱標(biāo)準(zhǔn)化參照《中醫(yī)藥學(xué)名詞》[5],錄入excel數(shù)據(jù)表,共得到210個(gè)證候標(biāo)簽,并對(duì)各個(gè)證候進(jìn)行語(yǔ)言規(guī)范化處理后,將信息采用“0”“1”變量賦值,是為“1”,否為 “0”。對(duì)疾病類型同樣采用“0”“1”變量賦值,是氣陰兩虛型咳嗽為“1”,非氣陰兩虛型咳嗽為“0”。

模型的選擇、建立與運(yùn)用

1.多層學(xué)習(xí)聯(lián)合建模方法

在機(jī)器學(xué)習(xí)的眾多算法中,隨機(jī)森林、XGBoost算法具有較高的計(jì)算效率,且在一定程度上能有效防止模型的過(guò)擬合[6-7],因此,與支持向量機(jī)、決策樹(shù)、logistic回歸等算法相比,隨機(jī)森林、XGBoost在疾病預(yù)測(cè)中具有較高的準(zhǔn)確度[8-10]。

隨機(jī)森林采用集成學(xué)習(xí)的思想,使用決策樹(shù)作為弱分類器,組合多個(gè)決策樹(shù)形成具有較好效果的強(qiáng)分類器。該算法的準(zhǔn)確率可與Adaboost相媲美[11]。采用隨機(jī)森林模型可以通過(guò)計(jì)算每棵決策樹(shù)的袋外數(shù)據(jù)誤差,及對(duì)袋外數(shù)據(jù)所有樣本的特征隨機(jī)加入噪聲后的袋外數(shù)據(jù)誤差,得出樣本特征變量的重要性[7]。

梯度提升決策樹(shù)(gradient boosting decision tree,GBDT)是XGBoost的基礎(chǔ)算法,它包含一個(gè)迭代殘差樹(shù)的集合,每一棵樹(shù)都在學(xué)習(xí)前N-1棵樹(shù)的殘差,將每棵樹(shù)預(yù)測(cè)的新樣本輸出值相加起來(lái)就是樣本最終的預(yù)測(cè)值。不同于常用的梯度提升決策樹(shù)在優(yōu)化時(shí)僅用一階導(dǎo)數(shù)信息,XGBoost對(duì)代價(jià)函數(shù)進(jìn)行了二階泰勒展開(kāi),同時(shí)用到了一階和二階導(dǎo)數(shù),使得XGBoost得到良好的結(jié)果[12],并在許多機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘挑戰(zhàn)中得到廣泛認(rèn)可[13]。

在采用機(jī)器學(xué)習(xí)挖掘辨別是否為氣陰兩虛型咳嗽的重要證候時(shí),采用隨機(jī)森林結(jié)合XGBoost算法進(jìn)行特征提取。但是,隨機(jī)森林、XGBoost均無(wú)法得出指標(biāo)的方向性影響[14],將兩種算法所得的重要證候特征,再次使用logistic回歸模型進(jìn)行建模。由此,可得到由多模型組合而成,用于輔助學(xué)習(xí)中醫(yī)辨證及診斷的新模型,命名為多層學(xué)習(xí)聯(lián)合建模方法。

2.多層學(xué)習(xí)聯(lián)合建模方法的運(yùn)用

將經(jīng)過(guò)預(yù)處理的數(shù)據(jù)輸入Anaconda 3-5.2.0軟件,刪除決定性單一輸入后,可將210個(gè)證候特征縮減至63個(gè),再經(jīng)隨機(jī)森林及XGBoost算法的運(yùn)算,最終根據(jù)權(quán)重的高低排序,截取經(jīng)兩種算法運(yùn)算后,各自所得結(jié)果的前35個(gè)證候特征及其相應(yīng)的權(quán)重值。所得的兩組證候特征結(jié)果中,具有29個(gè)重合變量。將此29個(gè)證候特征再次采用logistic回歸算法進(jìn)行建模,最終得到辨別氣陰兩虛型咳嗽的重要證候特征。同時(shí)采用10折交叉驗(yàn)證法,對(duì)算法進(jìn)行準(zhǔn)確性評(píng)估。(見(jiàn)圖1)

圖1 多層學(xué)習(xí)聯(lián)合建模方法流程圖

結(jié) 果

表1和表2分別為經(jīng)隨機(jī)森林、XGBoost算法所得氣陰兩虛型咳嗽證候的前35個(gè)重要證候。表3為重合的29個(gè)證候經(jīng)logistic回歸算法后所得結(jié)果,所得權(quán)重為正值的變量,歸屬為氣陰兩虛型咳嗽的重要辨證證候;所得權(quán)重為負(fù)值的變量,歸屬為非氣陰兩虛型咳嗽的重要辨證證候。

因此,經(jīng)多層學(xué)習(xí)聯(lián)合建模方法運(yùn)算后,最終得出判定咳嗽屬氣陰兩虛型證型的重要證候有嗆咳、乏力、口干、氣急、反復(fù)咳嗽、咽中痰少、痰色白、自汗、盜汗、頭暈、裂紋舌、薄苔或少苔、燥苔、脈弱、脈弦(圖2)。經(jīng)10折交叉驗(yàn)證法,得出XGBoost準(zhǔn)確度為86.7%,隨機(jī)森林為85.3%。

表1 基于隨機(jī)森林所得氣陰兩虛型咳嗽證候的重要性排序

表2 基于XGBoost所得氣陰兩虛型咳嗽證候的重要性排序

表3 基于logistic回歸模型所得氣陰兩虛型咳嗽證候的結(jié)果

圖2 辨證氣陰兩虛型咳嗽的重要證候

討 論

1.多層學(xué)習(xí)聯(lián)合建模方法所得證候與中醫(yī)相關(guān)理論探討

通過(guò)多層學(xué)習(xí)聯(lián)合建模方法所得出的氣陰兩虛型咳嗽的重要證候結(jié)果,與臨床文獻(xiàn)報(bào)道[15-18]及《中醫(yī)病證診斷療效標(biāo)準(zhǔn)》[19]記載的證候特征大致相同,主要為乏力、口干、反復(fù)咳嗽、自汗、盜汗、痰少色白、舌紅、苔薄或苔少、苔干燥、脈弱、脈弦。在此基礎(chǔ)上,本研究尚且發(fā)現(xiàn)嗆咳、氣急、裂紋舌亦為氣陰兩虛型咳嗽的表現(xiàn)證候。

2.多層學(xué)習(xí)聯(lián)合建模方法的優(yōu)勢(shì)

在機(jī)器學(xué)習(xí)中,由于隨機(jī)森林在每次劃分時(shí),考慮的屬性較少,因而該算法在大型數(shù)據(jù)庫(kù)上更為有效,但對(duì)于小樣本,其準(zhǔn)確度有所下降[11]。而XGBoost對(duì)于小樣本的特征提取,效果明顯優(yōu)于隨機(jī)森林、支持向量機(jī)、logistic回歸等算法[20]。本研究采用隨機(jī)森林聯(lián)合XGBoost算法,找其重疊證候,既能彌補(bǔ)隨機(jī)森林對(duì)于小樣本的準(zhǔn)確率較低的缺陷,又可進(jìn)一步提升XGBoost結(jié)果的準(zhǔn)確性,從而得出較為滿意的證候特征結(jié)果。此外,在數(shù)據(jù)維度較大的前提下,僅采用logistic回歸算法,會(huì)使得一些對(duì)辨證影響較大的相關(guān)證候被丟失,而影響較小的證候反而得到意義[21],故通過(guò)隨機(jī)森林和XGBoost降維,可剔除相關(guān)性較小的證候,彌補(bǔ)logistic回歸算法的不足。

綜上所述,本研究所采取的多層學(xué)習(xí)聯(lián)合建模方法,具有以下特征:為3個(gè)模型聯(lián)合使用的多模型算法;可輔助中醫(yī)學(xué)者學(xué)習(xí),研究臨床疾病的辨證及診斷;能在臨床疾病樣本較少,維度較大的情況下,確保較高的準(zhǔn)確性。因此,該方法用于挖掘中醫(yī)疾病證型的重要證候特征值得推廣。

3.多層學(xué)習(xí)聯(lián)合建模方法的展望。

該方法雖能確保較好的準(zhǔn)確度,但可能仍存在一些對(duì)辨證影響較小的證候被提取。因此,在解決該問(wèn)題時(shí),可考慮優(yōu)化此模型結(jié)構(gòu),經(jīng)logisitic回歸算法后得出的證候,再經(jīng)專業(yè)人士判定,得出最終較為滿意的結(jié)果,即采用人機(jī)互助的模式,以減弱機(jī)器學(xué)習(xí)刻板化的缺點(diǎn),增強(qiáng)該模型的靈活性,進(jìn)一步提升結(jié)果的準(zhǔn)確性。

猜你喜歡
氣陰病案證候
肥胖中醫(yī)證候動(dòng)物模型研究進(jìn)展
基于二維碼的病案示蹤系統(tǒng)開(kāi)發(fā)與應(yīng)用
試論病案管理在防范醫(yī)療糾紛中的作用
昆明地區(qū)兒童OSAHS中醫(yī)證候聚類分析
生脈飲在氣陰兩虛型心力衰竭中的應(yīng)用
糖網(wǎng)1號(hào)方治療氣陰兩虛型糖尿病性視網(wǎng)膜病變玻璃體積血22例
加味炙甘草湯治療緩慢性心律失常氣陰兩虛型臨床研究
新病案首頁(yè)中存在的問(wèn)題及對(duì)策
補(bǔ)肺養(yǎng)陰湯治療氣陰兩虛兼痰濁停滯型小兒支氣管肺炎恢復(fù)期40例
慢性乙型肝炎的中醫(yī)證候與辨證論治
纳雍县| 永新县| 太保市| 靖宇县| 临沧市| 长沙县| 和龙市| 香格里拉县| 年辖:市辖区| 武隆县| 顺义区| 颍上县| 济源市| 昌宁县| 贵德县| 桦川县| 崇州市| 安顺市| 中山市| 孝昌县| 衡山县| 南丰县| 常宁市| 金坛市| 额尔古纳市| 任丘市| 昭平县| 山阴县| 玉树县| 胶南市| 旅游| 荥阳市| 泾阳县| 安徽省| 佛教| 湾仔区| 安顺市| 澜沧| 城步| 贵阳市| 汉源县|