国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機器學(xué)習(xí)方法在哮喘早期預(yù)測和診斷中的應(yīng)用

2021-12-21 13:35劉寧
河南醫(yī)學(xué)研究 2021年35期
關(guān)鍵詞:哮喘準(zhǔn)確率向量

劉寧

(杞縣人民醫(yī)院 呼吸內(nèi)科,河南 開封 475200)

哮喘是常見慢性呼吸道疾病,發(fā)病率逐年升高[1],我國是哮喘病死率最高的國家之一,給我國帶來巨大的社會負擔(dān)和醫(yī)療負擔(dān)[2]。哮喘的癥狀在其他呼吸道疾病中也同時存在,而人工智能技術(shù)可以使哮喘診斷快速、準(zhǔn)確、知識化[3]。機器學(xué)習(xí)是一門人工智能的科學(xué),可以在經(jīng)驗學(xué)習(xí)中改善具體算法的性能[4]。從本質(zhì)上來說,機器學(xué)習(xí)就是使計算機模擬人的學(xué)習(xí)行為,通過自動的學(xué)習(xí)獲取知識,不斷改善自身性能,最終實現(xiàn)人工智能。機器學(xué)習(xí)的主要算法有回歸算法、神經(jīng)網(wǎng)絡(luò)、支持向量機、聚類算法和推薦算法等[5]。神經(jīng)網(wǎng)絡(luò)的誕生與大腦工作機理的研究密切相關(guān),神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)機理包括分解與整合[6]。一個簡單的神經(jīng)網(wǎng)絡(luò)架構(gòu)包括輸入層、隱藏層和輸出層,所有的層再組成神經(jīng)網(wǎng)絡(luò)[7]。深度神經(jīng)網(wǎng)絡(luò)是一種用于圖像分析的非線性回歸分析方法[8]。支持向量機是一種基于統(tǒng)計學(xué)習(xí)理論的新型學(xué)習(xí)機,是結(jié)構(gòu)風(fēng)險最小化方法的近似實現(xiàn)[9]。本研究選取了571名呼吸系統(tǒng)疾病患者,并選取了哮喘診斷時常用的22個指標(biāo),使用邏輯回歸分析、支持向量機和深度神經(jīng)網(wǎng)絡(luò)3種算法對哮喘進行預(yù)測,比較這三種算法在哮喘預(yù)測和診斷過程中的準(zhǔn)確性。

1 資料與方法

1.1 一般資料選取2020年1月至2021年6月杞縣人民醫(yī)院收治的370例哮喘患者和201例其他呼吸道疾病患者作為研究對象,哮喘的診斷是基于《呼吸疾病診療指南·第3版》中的哮喘的診斷標(biāo)準(zhǔn),根據(jù)患者的癥狀史,并結(jié)合實驗室和影像學(xué)檢測最終診斷為哮喘。其他呼吸道疾病患者包括氣管炎、支氣管炎和肺炎等患者。哮喘患者中男220例,女150例,年齡18~81歲,平均(50.8±7.21)歲。非哮喘患者中男130例,女71例,年齡20~88歲,平均(54.2±6.89)歲。本研究經(jīng)醫(yī)院醫(yī)學(xué)倫理委員會批準(zhǔn),所有受試者均簽署知情同意書。

1.2 輸入記錄在哮喘患者的病歷中,有22條與診斷相關(guān)的輸入記錄如下。(1)癥狀-身體特征:年齡、性別(二分類變量,女性=0,男性=1)、聽診氣喘情況(二分類變量,是=0,否=1)、咳嗽時間、氣喘時間、每日癥狀變化、重復(fù)癥狀、過敏疾病史、家族過敏史、吸煙史。(2)生化分析:外周血嗜酸性粒細胞數(shù)量、外周血嗜堿性粒細胞數(shù)量、總IgE值和氣-骨特異性IgE陽性(二分類變量,是=0,否=1)。(3)肺功能測試:第1秒用力呼氣容積(forced expiratory volume in one second,F(xiàn)EV1)占預(yù)計值的百分比、50%肺活量(V50)、25%肺活量(V25)、V50/V25、使用支氣管擴張劑后FEV1增加容積、使用支氣管擴張劑后FEV1增加容積百分比和呼出氣一氧化氮。(4)使用甲膽堿激發(fā)的支氣管激發(fā)試驗:氣道高反應(yīng)性(二分類變量,是=0,否=1)。

1.3 分析方法使用邏輯回歸分析、支持向量機和深度神經(jīng)網(wǎng)絡(luò)3種算法評估哮喘診斷的準(zhǔn)確性。使用Keras代碼結(jié)合谷歌的Tensor Flow。在張量流顯式初始化變量的處理中,輸入是用數(shù)據(jù)相關(guān)初始化來衡量標(biāo)準(zhǔn)化。隨機分出80%的數(shù)據(jù)做為訓(xùn)練數(shù)據(jù),其余20%的數(shù)據(jù)作為每個系統(tǒng)的測試數(shù)據(jù)。機器學(xué)習(xí)技術(shù)有調(diào)整參數(shù),例如深度學(xué)習(xí)中的神經(jīng)元數(shù)量、批量大小、激活函數(shù)等,也稱為超參數(shù)。由于使用所有的數(shù)據(jù)樣本對超參數(shù)進行調(diào)優(yōu)可能會導(dǎo)致過擬合,因此,使用訓(xùn)練數(shù)據(jù)對超參數(shù)進行調(diào)優(yōu)。Talos軟件包的數(shù)據(jù)庫用于自動模型調(diào)整超參數(shù)學(xué)習(xí)。

邏輯回歸分析通過使用sigmoid型函數(shù)估計概率將數(shù)據(jù)集分類,它被構(gòu)造為一個單層的簡單神經(jīng)網(wǎng)絡(luò)。在進行邏輯回歸分析時,網(wǎng)絡(luò)層分為輸入層、隱藏層和輸出層。輸入層是線性的,只負責(zé)從網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)傳輸數(shù)據(jù)。隱藏層和出口層是sigmoid類型,并在網(wǎng)絡(luò)上執(zhí)行計算。

在支持向量機模型中,對于二值分類支持向量機,使用了線性或輻射基函數(shù)(radial basis function,RBF)核,未進行其他特征提取或特征量選擇,因此,匹配深度學(xué)習(xí)訓(xùn)練中使用的輸入數(shù)據(jù)的標(biāo)準(zhǔn)。網(wǎng)格搜索的評分是根據(jù)評分數(shù)據(jù)的10倍交叉驗證獲得的平均AUC接收器工作特征進行的。訓(xùn)練和驗證中使用的數(shù)據(jù)集與深度學(xué)習(xí)模型中使用的數(shù)據(jù)集相同。

另外,構(gòu)建了一個深度學(xué)習(xí)模型,在分類系統(tǒng)中使用圖1所示的深度神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)是由多個隱藏非線性層組成的前饋神經(jīng)網(wǎng)絡(luò)。它以一組權(quán)重矩陣、偏置向量和一個非線性激活函數(shù)為特征。超參數(shù)優(yōu)化選擇哪個參數(shù)是激活函數(shù)、網(wǎng)絡(luò)結(jié)構(gòu)、批量大小和周期數(shù)的最佳學(xué)習(xí)方式。在正向傳播中,激活網(wǎng)絡(luò)的激活函數(shù)為隱藏層的整流線性單元(relu)或正切雙曲函數(shù)(tanh),輸出層的激活函數(shù)為sigmoid型。在所有因素都輸入的情況下,網(wǎng)絡(luò)結(jié)構(gòu)示例如圖1所示。其結(jié)構(gòu)為22-18-18-18-1,其中輸入層22個節(jié)點,隱藏層18個節(jié)點,隨后隱藏層重復(fù)2次,輸出層1個節(jié)點(哮喘,是=1,非=0)。在傳播過程中,選擇“relu”作為調(diào)優(yōu)超參數(shù)的激活函數(shù)。

圖1 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

2 結(jié)果

2.1 邏輯回歸分析當(dāng)輸入因素僅為癥狀-身體特征時,診斷準(zhǔn)確率為65%;當(dāng)輸入因素為癥狀-身體特征+生化檢測結(jié)果時,診斷準(zhǔn)確率為68%;當(dāng)輸入因素為癥狀-身體特征+生化檢測+肺功能檢測時,診斷準(zhǔn)確率為82%;當(dāng)輸入全部因素時,診斷準(zhǔn)確率提升至94%。

2.2 支持向量機當(dāng)輸入因素僅為癥狀-身體特征時,診斷準(zhǔn)確率為62%;當(dāng)輸入因素為癥狀-身體特征+生化檢測結(jié)果時,診斷準(zhǔn)確率為64%;當(dāng)輸入因素為癥狀-身體特征+生化檢測+肺功能檢測時,診斷準(zhǔn)確率為75%;當(dāng)輸入全部因素時,診斷準(zhǔn)確率提升至82%。

2.3 深度神經(jīng)網(wǎng)絡(luò)當(dāng)輸入因素僅為癥狀-身體特征時,診斷準(zhǔn)確率為68%;當(dāng)輸入因素為癥狀-身體特征+生化檢測結(jié)果時,診斷準(zhǔn)確率為70%;當(dāng)輸入因素為癥狀-身體特征+生化檢測+肺功能檢測時,診斷準(zhǔn)確率為88%;當(dāng)輸入全部因素時,診斷準(zhǔn)確率提升至98%。

2.4 3種方法的AUC比較邏輯回歸分析、支持向量機、深度神經(jīng)網(wǎng)絡(luò)3種方法的ROC曲線如圖2所示。3種模型對所有22個輸入進行了訓(xùn)練,其中邏輯回歸分析的AUC為0.97;支持向量機的AUC為0.83;深度神經(jīng)網(wǎng)絡(luò)的AUC為0.99。見圖2。為了評估分類模型之間的AUC差異,DeLong法檢測ROC曲線顯示,深度神經(jīng)網(wǎng)絡(luò)與支持向量機之間以及深度神經(jīng)網(wǎng)絡(luò)與邏輯分析之間差異有統(tǒng)計學(xué)意義(P<0.05)。

圖2 3種分析方法的ROC曲線

3 討論

本研究的目的是開發(fā)一個智能系統(tǒng)來診斷哮喘,將臨床特征作為輸出,用機器學(xué)習(xí)方法診斷是否為哮喘,結(jié)果可以看出,使用深度神經(jīng)網(wǎng)絡(luò)診斷哮喘,如果輸入了完整的患者信息,其診斷準(zhǔn)確率達到98%。

計算機輔助診斷是提高診斷準(zhǔn)確性的一種有用方法,它涉及到將專家提供的信息與機器學(xué)習(xí)方法相結(jié)合。機器學(xué)習(xí)可以利用完整的臨床信息準(zhǔn)確地診斷哮喘。Zolnoori等[10]研究表明,一個用于檢測兒童哮喘的計算機智能系統(tǒng)被稱為預(yù)測哮喘的模糊智能系統(tǒng),是100%正確的。另一項研究比較了用于預(yù)測兒童哮喘持續(xù)時間的統(tǒng)計方法,發(fā)現(xiàn)貝葉斯分析的準(zhǔn)確性可達86%,而人工神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率約81%[11]。人工神經(jīng)網(wǎng)絡(luò)有潛力成為一種更廣泛使用的分類算法,但由于參數(shù)調(diào)整過程耗時,可選擇的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)類型眾多,以及用于訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)的算法數(shù)量多,所以它的使用頻率較低。在這項研究中,確定深度神經(jīng)網(wǎng)絡(luò)可以高效準(zhǔn)確地診斷成人哮喘。

使用神經(jīng)網(wǎng)絡(luò)的模型往往難以分析大量輸入的系統(tǒng),這是因為系統(tǒng)訓(xùn)練所需的時間較長,并且在訓(xùn)練期間模型可能會過擬合。在本研究中,為了避免過擬合,對超參數(shù)進行了調(diào)整,從而在準(zhǔn)確率和丟失率上都可以確定訓(xùn)練和驗證進度的收斂性。

在比較3種算法診斷成人哮喘的準(zhǔn)確率時,本研究發(fā)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)的檢測準(zhǔn)確率最好,總體準(zhǔn)確率為98%。目前,深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用在準(zhǔn)確性和數(shù)據(jù)處理方面都比支持向量機算法有很大的優(yōu)勢。支持向量機算法是一種非常流行的并且研究的比較深入的監(jiān)督學(xué)習(xí)模型,它不適用深度學(xué)習(xí)的計算能力。與支持向量機相比,深度神經(jīng)網(wǎng)絡(luò)能夠更準(zhǔn)確地對數(shù)據(jù)進行分類。本研究中邏輯回歸分析模型與深度神經(jīng)網(wǎng)絡(luò)在診斷哮喘時準(zhǔn)確性相似,可能是因為該邏輯分析模型是一個簡單的神經(jīng)網(wǎng)絡(luò),無隱藏層,并且有監(jiān)督機器學(xué)習(xí)。

在深度神經(jīng)網(wǎng)絡(luò)發(fā)展中最重要的因素之一是選擇合適的結(jié)構(gòu)和使用最優(yōu)的數(shù)據(jù)輸入。本研究使用一種帶超參數(shù)調(diào)優(yōu)的深度神經(jīng)網(wǎng)絡(luò)算法,使用超參數(shù)優(yōu)化了模型架構(gòu)。并用十倍交叉驗證方法測試了任務(wù)分類器的性能。評價結(jié)果表明,該分類器具有較高的查準(zhǔn)率和查全率。通過統(tǒng)計方法選擇最優(yōu)的數(shù)據(jù)作為網(wǎng)絡(luò)的輸入,可以選擇在網(wǎng)點中效率最高的數(shù)據(jù)量。本研究的結(jié)果與以前的一些報告一致,發(fā)現(xiàn)30%的哮喘患者被醫(yī)生診斷為哮喘時,未使用客觀測試。相比之下,本研究發(fā)現(xiàn)基于癥狀體征作為輸入數(shù)據(jù),深度神經(jīng)網(wǎng)絡(luò)模型診斷成人哮喘的準(zhǔn)確率約為70%。

不過本研究得出的結(jié)果也說明,疾病診斷要根據(jù)具體情況進行分析,在特定情況下,有可能證明其中一種技術(shù)優(yōu)于其他技術(shù),這種技術(shù)可能比其他技術(shù)更適合于分析這種特定情況。在某些情況下,支持向量機在診斷準(zhǔn)確率上優(yōu)于深度學(xué)習(xí)算法[12]。

綜上,深度神經(jīng)網(wǎng)絡(luò)能夠根據(jù)所有臨床數(shù)據(jù)準(zhǔn)確預(yù)測疾病。深度神經(jīng)網(wǎng)絡(luò)的方法比傳統(tǒng)的機器學(xué)習(xí)方法更準(zhǔn)確,可以用于醫(yī)生診斷哮喘時的助理服務(wù),這一研究可以提高醫(yī)生診斷時的準(zhǔn)確性。該技術(shù)值得在臨床推廣應(yīng)用。

猜你喜歡
哮喘準(zhǔn)確率向量
了解并遠離支氣管哮喘
向量的分解
如何治療難治性哮喘(上)
如何治療難治性哮喘(下)
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
聚焦“向量與三角”創(chuàng)新題
頸椎病患者使用X線平片和CT影像診斷的臨床準(zhǔn)確率比照觀察
向量垂直在解析幾何中的應(yīng)用
富源县| 崇州市| 东山县| 禹城市| 嘉荫县| 崇文区| 兴安县| 宣恩县| 马边| 荆门市| 巴楚县| 阳信县| 万源市| 阿克| 汾阳市| 金华市| 汝阳县| 新郑市| 兴业县| 东平县| 盐城市| 太仆寺旗| 龙游县| 财经| 河源市| 松江区| 巴彦淖尔市| 中山市| 乌审旗| 习水县| 太湖县| 贡觉县| 东宁县| 沁阳市| 罗江县| 策勒县| 衢州市| 博罗县| 噶尔县| 洛南县| 新晃|