周飛 鄒寧 趙銀歌 黃倩雅 劉可盈
摘 要:隨著高血壓患者的逐漸增多,并且日趨于年輕化,如何防治高血壓病成為重要課題。鑒于此現(xiàn)狀,文章提出基于支持向量機的高血壓預(yù)測方法。根據(jù)支持向量機原理,對高血壓病理屬性進行分類,建立高血壓病的預(yù)測模型,通過計算不同分類屬性的權(quán)重指數(shù),獲取不同屬性對高血壓病影響的重要程度等級,進而實現(xiàn)潛在高血壓病的預(yù)測。實驗結(jié)果表明,利用支持向量機算法能夠有效對潛在高血壓病進行預(yù)測,為早期高血壓病的檢測與防治提供理論支持。
關(guān)鍵詞:支持向量機;高血壓防治;預(yù)測模型
高血壓病是目前比較常見的心血管疾病[1],隨著人們生活節(jié)奏的加快、生活壓力的增大,高血壓病的發(fā)病率也呈現(xiàn)出上升趨勢,逐漸威脅到現(xiàn)代人的身體健康,對潛在高血壓病的準確預(yù)測能夠為高血壓病的預(yù)防與早期治療提供依據(jù)。常用的潛在高血壓病預(yù)測方法主要包括基于神經(jīng)網(wǎng)絡(luò)算法的預(yù)測方法[2]、基于決策樹算法的預(yù)測方法[3]、和基于關(guān)聯(lián)規(guī)則算法的預(yù)測方法[4]。
上面提到的各種傳統(tǒng)方法在進行潛在高血壓病預(yù)測過程中,沒有計算各項參數(shù)對高血壓病的影響權(quán)重,造成擬合預(yù)測的準確度不高,致使對潛在高血壓病的預(yù)測效率降低。為了避免上述算法的缺陷,本文利用支持向量機算法進行潛在高血壓病的預(yù)測,能夠有效提高預(yù)測的準確率與效率,為早期高血壓病的檢測與防治提供可靠方案。
1 綜合概述
1.1高血壓病影響因素
人們物質(zhì)生活水平的提高也伴隨著高血壓現(xiàn)象的普遍發(fā)生,據(jù)權(quán)威機構(gòu)發(fā)布的數(shù)據(jù)來看,高血壓病不僅發(fā)病率持續(xù)增加,而且正趨于年輕化,如何防治人們患高血壓成為重要研究課題。本文旨在根據(jù)人體的生理指標判斷其是否患有高血壓。
查閱相關(guān)資料[5]得出7個高血壓發(fā)病的主要因素,即體質(zhì)指數(shù)、腰臀比、飲酒年限、日平均運動時間性別、年齡和文化程度。本文根據(jù)以上影響因素進行建模,旨在找出影響高血壓的生理指標,并根據(jù)計算出的指標權(quán)值來判斷樣本(人)是否患有高血壓,進而實現(xiàn)潛在高血壓病的預(yù)測。
1.2可行性分析與創(chuàng)新點闡述
支持向量機是一種理論完善的機器學(xué)習(xí)算法,從提出至今,已有不少專家學(xué)者利用該算法解決實際工程問題,算法理論部分日趨完備。因此,采用支持向量機算法對高血壓進行預(yù)測的可行性良好。本文最大的創(chuàng)新之處在于,通過支持向量機算法預(yù)測出的結(jié)果只有患病和不患病兩種情況,使測試結(jié)果更加明確。大量實驗可以得出高血壓發(fā)病指標的權(quán)重,根據(jù)不同指標的權(quán)重值可以為人們?nèi)粘I钐峁┫嚓P(guān)的預(yù)防建議,這對于高血壓病的早期預(yù)防有重要參考價值和實際意義。
2設(shè)計方案
本文基于支持向量機算法實現(xiàn)對高血壓疾病的預(yù)測,具體方案如下。
2.1數(shù)據(jù)處理 從開源數(shù)據(jù)庫中提取100組含有上述主要生理指標數(shù)據(jù)的高血壓患者作為實驗樣本,然后分別對不同屬性進行標準化處理,最后將處理之后的100組樣本作為訓(xùn)練集。
2.2訓(xùn)練階段
建立支持向量機模型,帶入影響高血壓發(fā)病的因素向量,反復(fù)迭代運算直至目標函數(shù)達最大值。
2.3測試階段
用完成訓(xùn)練的算法對臨床患者進行高血壓預(yù)測,若預(yù)測結(jié)果與臨床測量的結(jié)果相近,則認為算法可行。
3 基于SVM的預(yù)測模型的建立
3.1算法簡介
支持向量機(Support Vector Machine,SVM) [6-7]是基于統(tǒng)計學(xué)習(xí)理論框架開發(fā)的一種機器學(xué)習(xí)和分類識別方法,它較好地實現(xiàn)了結(jié)構(gòu)風(fēng)險最小化原則。最大分類間隔和核函數(shù)思想是SVM的兩個最為重要的技巧,不同核函數(shù)的選擇標準是要求所構(gòu)造的分類器具備較好的推廣性能和較強的抗擾劫能力,并適合于推廣到實時分析。通過實驗對比,建立的預(yù)測模型要求支持向量少、分類間隙大和分類時間適中,因此,本文選擇多項式作為預(yù)測模型的核函數(shù)。SVM分類預(yù)測模型建立的核心就是確立最優(yōu)決策函數(shù):為支持向量對應(yīng)的最優(yōu)解,b為偏差值。
3.2具體實現(xiàn)
3.2.1數(shù)據(jù)處理
用i=l,…,100表示100個患者,影響患者高血壓的指標性別、年齡、文化程度、體質(zhì)指數(shù)、腰臀比、飲酒年限和日平均運動時間分別記為i。第x,j=l,…,7個患者的第j個指標的取值記為
計算得100組樣本點的均值向量為:
標準差向量為:
對所有樣本點數(shù)據(jù)進行標準化處理:
稱為標準化指標變量。記xi= [xl,…,x7T。
3.2.2訓(xùn)練
輸入訓(xùn)練樣本向量(x,y),xi(i為患者的序號)為上述提取的特征參數(shù);y∈{+1,-1),y,為分類標識,x,屬于患高血壓,DiUv。=1; xi未患高血壓,貝吵。=-l。
本文使用Lagrange乘子方法解決此約束的最優(yōu)問題,即在約束條件:
求解下列目標函數(shù)的最大值:
這是一個不等式約束下二次函數(shù)尋優(yōu)的問題,存在唯一解。ai不為零的解ai所對應(yīng)的xi就是支持向量,選取其中一個支持向量,可求得6。求得ai和b的值,就確立了最優(yōu)決策函數(shù)的具體表達形式,從而建立了預(yù)測高血壓分類預(yù)測模型。4結(jié)果分析
使用MATLAB對SVM模型進行求解,結(jié)果顯示:在訓(xùn)練好的模型下,對100組樣本進行測試,有80%的測試結(jié)果與臨床檢驗結(jié)果匹配,從而說明了本文所建模型具有一定的參考價值。進一步得出各指標的影響程度依次為體質(zhì)指數(shù)、腰臀比、日平均運動時間、飲酒年限、年齡文化程度及性別,具體結(jié)果如表1所示。
從結(jié)果看,體質(zhì)指數(shù)、腰臀比、年齡、飲酒年限等是影響高血壓發(fā)病的主要因素,這與國內(nèi)外許多研究結(jié)果一致。
基于以上分析,可將本文所建立的模型應(yīng)用于早期高血壓病的預(yù)測,具體實現(xiàn)為:
Stepl:檢測對象的體質(zhì)指數(shù)、腰臀比、日平均運動時間、飲酒年限、年齡文化程度及性別等屬性值。
Step2:將上述屬性值作為輸入變量帶入到本文所建立的預(yù)測模型中,記錄其返回值。
Step3:若返回值為1被測對象患高血壓;若返回值為1,則被測對象未患高血壓。
5結(jié)語
本文依據(jù)支持向量機原理,對數(shù)據(jù)屬性進行分類,構(gòu)建預(yù)測模型,計算各項生理參數(shù)指標與高血壓病的相關(guān)屬性權(quán)重,得到不同屬性對高血壓病影響的重要程度。實驗結(jié)果表明,采用支持向量機算法進行潛在高血壓病的預(yù)測,能夠有效提高預(yù)測的準確率與預(yù)測效率,為早期高血壓的檢測與防治提供可行方案,進而滿足醫(yī)學(xué)檢測的實際需求。
本文所建立的數(shù)學(xué)模型能夠根據(jù)相關(guān)生理指標有效地判斷樣本(人)患高血壓病的情況,這種方法可以對早期高血壓病的預(yù)防提供一定的參考價值,但是具體是否患病一定要進行臨床檢查,并采取科學(xué)的方法進行治療。此外,該模型即支持向量機的預(yù)測模型還能夠應(yīng)用于其他疾病的預(yù)測。方法大致可概括為:首先,選取疾病的影響指標;然后,構(gòu)建樣本數(shù)據(jù)庫進行訓(xùn)練匹配,提取出特征向量;最后,對待測人員進行疾病預(yù)測。 本文是學(xué)校資助的大學(xué)生創(chuàng)新項目的研究成果之一,接下來所要研究的內(nèi)容是開發(fā)交互式界面,進一步實現(xiàn)預(yù)測結(jié)果的可視化,為早期高血壓疾病預(yù)測提供合理可行的方案。
[參考文獻]
[1]孫艷秋,劉鋼基于大數(shù)據(jù)分析的潛在高血壓病預(yù)測研究[J]計算機仿真,2015(5):386-389. 421
[2]楊洋刑用人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測原發(fā)性高血壓的研究[D]沈陽:中國醫(yī)科大學(xué),2010
[3]李現(xiàn)文,李春玉,MIYONGK,等決策樹與Logistic回歸在高血壓患者健康素養(yǎng)預(yù)測中的應(yīng)用[J]護士進修雜志,2012 (13):1157-1159
[4]程遠關(guān)聯(lián)規(guī)則挖掘在疾病數(shù)據(jù)處理中的應(yīng)用研究[D]重慶:重慶醫(yī)科大學(xué),2010
[5]黃晶晶.天津市市區(qū)高血壓前期人群高血壓發(fā)病危險因素的定量評價[D]天津:天津醫(yī)科大學(xué),2016.
[6]賴麗娟,王志剛,吳效明基于小波變換和支持向量機的急性低血壓預(yù)測方法研究[J].透析與人工器官,2011 (1):28-33
[7]張穎.支持向量機在2型糖尿病影響因素分析中的應(yīng)用[J].電子技術(shù)與軟件工程,2015(9):191-192.