国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

小樣本條件下的血糖濃度預(yù)測算法研究*

2021-03-04 07:58:44黃雄波劉武萍
微處理機(jī) 2021年1期
關(guān)鍵詞:樣條插值間隔

黃雄波,丘 陵,劉武萍

(1.佛山職業(yè)技術(shù)學(xué)院電子信息學(xué)院,廣東 佛山528137;2.佛山市中醫(yī)院藥劑科,廣東 佛山528000)

1 引 言

正常來說,人體自身的血糖調(diào)整機(jī)制可將其體內(nèi)的血糖值維持在正常范圍以內(nèi)。然而,由于胰島素分泌缺陷或其生物作用受損,或兩者兼有所引起的糖、脂肪和蛋白質(zhì)代謝障礙,往往會促進(jìn)人體內(nèi)的血糖值升高,并導(dǎo)致糖尿病的發(fā)生[1-2]。研究表明,高血糖對人體的危害非常大,會給人體造成嚴(yán)重的疾病以及負(fù)面影響,例如急性心肌梗塞、中風(fēng)、重癥感染、敗血癥、感染性休克、多發(fā)性精神病、多器官衰竭等等,嚴(yán)重的甚至?xí)?dǎo)致死亡。按照發(fā)病機(jī)理的不同,糖尿病可以分為I 型糖尿病和II 型糖尿病兩種。其中I 型糖尿病是由于感染(尤其是病毒感染)、毒物等因素誘發(fā)機(jī)體產(chǎn)生異常的細(xì)胞免疫應(yīng)答,導(dǎo)致胰島β 細(xì)胞損傷,胰島素分泌減少而引起的;II 型糖尿病是由于致病因子的存在,正常的血液結(jié)構(gòu)平衡被破壞,血中胰島素效力相對減弱,并經(jīng)過漫長的病理過程而形成的[3-5]。

注射胰島素是糖尿病患者維持正常血糖水平的重要手段。為了提升治療效果,有必要對患者未來一段時(shí)間(一般為30 分鐘)的血糖濃度進(jìn)行精確的預(yù)測,以便確定注射胰島素的最佳時(shí)間和劑量[6]。R.Hovorka 等通過非線性動力系統(tǒng)模擬皮下注射的短效胰島素及腸道的吸收過程,并采用貝葉斯參數(shù)估計(jì)確定時(shí)變模型參數(shù),得到一種有效的非線性血糖預(yù)測模型[7]。H.Efendic 等基于生理學(xué)與血糖變化的轉(zhuǎn)移概率,使用高斯函數(shù)設(shè)計(jì)實(shí)現(xiàn)了區(qū)間概率的血糖濃度短期預(yù)測算法,該法對10耀30 分鐘時(shí)間范圍的血糖濃度有非常好的預(yù)測效果[8]。近年來,基于數(shù)據(jù)驅(qū)動的血糖濃度預(yù)測方法得到了長足的發(fā)展,利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)對既有的血糖序列進(jìn)行特征提取、非線性映射等處理,其預(yù)測精度較基于生理模式的經(jīng)典預(yù)測模型而言,有著不可比擬的優(yōu)勢[9-11]。鑒于現(xiàn)有的血糖濃度預(yù)測模型在小樣本情形下仍有不足,在此設(shè)計(jì)并實(shí)現(xiàn)一種基于小樣本的血糖濃度預(yù)測算法。改進(jìn)后的算法將在保證一定預(yù)測精度的情況下,使得血糖序列的采樣時(shí)間間隔從原來的5 分鐘延長至3 小時(shí)。

2 血糖序列的預(yù)處理

受血糖檢測設(shè)備或輸入轉(zhuǎn)換等原因的影響,所獲得的血糖原始序列往往會混雜著少量的異常數(shù)據(jù),若直接對這些原始序列進(jìn)行建模處理,則可能會導(dǎo)致建模結(jié)果出現(xiàn)較大的誤差。為此,需要對血糖原始序列進(jìn)行相關(guān)的合理性檢驗(yàn),以剔除有明顯偏差的不合理樣本點(diǎn)。同時(shí),為保證原始序列的完整性,應(yīng)使用合理的數(shù)據(jù)替換被剔除的樣本點(diǎn)。

對于異常樣本點(diǎn),常用的檢測與剔除方法有拉依達(dá)準(zhǔn)則、肖維勒準(zhǔn)則、格拉布斯準(zhǔn)則、狄克遜準(zhǔn)則及t 檢驗(yàn)準(zhǔn)則等。其中,t 檢驗(yàn)準(zhǔn)則的計(jì)算過程較為復(fù)雜,但其檢測結(jié)果更為嚴(yán)格和穩(wěn)健。據(jù)此,此處采用t 檢驗(yàn)準(zhǔn)則對血糖原始序列展開檢驗(yàn)。

記血糖原始序列為yt(t=1,2,...,n),按樣本點(diǎn)的數(shù)值大小進(jìn)行排序,有:

若有:

兩式成立,則稱y(1)或y(n)為異常數(shù)據(jù),應(yīng)予以剔除。

而K(n,a)則是對應(yīng)樣本容量n 與某一置信水平a,并結(jié)合t 分布臨界值表計(jì)算得到的數(shù)值。

當(dāng)檢測發(fā)現(xiàn)異常樣本點(diǎn)之后,則以該樣本點(diǎn)為中心、鄰域半徑為2,選取左右相鄰4 個(gè)樣本點(diǎn),依照Lagrange 插值原理[12],析出對應(yīng)的插值函數(shù),在此基礎(chǔ)上,得到異常樣本點(diǎn)的合理替換值。Lagrange 插值原理具體如下:

設(shè)已知函數(shù)y=f(x)在區(qū)間[a,b]上n+1 個(gè)點(diǎn)x0,x1,...,xn所對應(yīng)的值為y0,y1,...,yn,要求作一個(gè)次數(shù)不高于n 次的插值多項(xiàng)式Ln(x),且滿足插值條件:

于是,選取特定的基函數(shù),并用這些基函數(shù)的線性組合來表示Ln(xi),便可得到Lagrange 插值多項(xiàng)式:

3 血糖序列的樣本擴(kuò)充

由于既有的血糖序列是屬于小樣本的情形,為了提高辨識建模的精度,有必要進(jìn)行相應(yīng)的樣本擴(kuò)充處理。與上述的異常樣本的插值替換處理不同,樣本擴(kuò)充的插值范圍為整個(gè)樣本取值區(qū)間。由于此時(shí)的插值函數(shù)需要滿足更多的樣本點(diǎn),于是導(dǎo)致了插值多項(xiàng)式次數(shù)的增加,從而引起龍格(Runge)現(xiàn)象。為了獲得更好的插值效果并同時(shí)增強(qiáng)插值函數(shù)的整體光滑度,此處采用分段的三次樣條函數(shù)來完成樣本擴(kuò)充,即插值函數(shù)是由一段一段的三次多項(xiàng)式(二階連續(xù)導(dǎo)數(shù))拼合而成的曲線。

設(shè)在區(qū)間[a,b]上的插值節(jié)點(diǎn)a=x0<x1<...<xn=b 與所對應(yīng)的函數(shù)值分別為y0,y1,...,yn,若函數(shù)S(x)為三次樣條插值函數(shù),則下列3 個(gè)條件成立[13-14]:

條件1:S(x)=yi, i=0,1,...,n;

條件2:在每一個(gè)小區(qū)間[xi-1,xi]上是一個(gè)關(guān)于x的三次多項(xiàng)式;

使下式:

將原始的小樣本血糖序列代入式(8)耀(10),于是在相鄰樣本點(diǎn)[xi-1,xi]之間求得一個(gè)對應(yīng)的三次樣條插值函數(shù)Si(x)。根據(jù)實(shí)際需要,將[xi-1,xi]劃分為n 等份,有[xi-1,xi-1+Δx,...,xi-1+(n-1)Δx,xi],易知,將xi-1+φΔx(φ=0,1,...,n-1)代入Si(x),便可完成樣本插值的擴(kuò)充處理。

4 血糖濃度的小樣本預(yù)測

4.1 基于廣義回歸神經(jīng)網(wǎng)絡(luò)的血糖濃度預(yù)測

小樣本血糖序列在剔除異常樣本及樣本擴(kuò)充之后,便可進(jìn)行預(yù)測模型的構(gòu)建。注意到血糖序列本身具有的非線性和非平穩(wěn)的特點(diǎn),在此選用廣義回歸神經(jīng)網(wǎng)絡(luò)對小樣本血糖序列進(jìn)行預(yù)測。廣義回歸神經(jīng)網(wǎng)絡(luò)是屬于徑向基神經(jīng)網(wǎng)絡(luò)的一種改進(jìn),具有很強(qiáng)的非線性映射能力及高度的容錯性,特別是在小樣本的情形下,其逼近能力和學(xué)習(xí)收斂速度比徑向基神經(jīng)網(wǎng)絡(luò)具有更優(yōu)越的性能[15-16]。

基于廣義回歸神經(jīng)網(wǎng)絡(luò)的小樣本血糖濃度預(yù)測模型的構(gòu)成如圖1 所示。其中包括輸入層、模式層、求和層和輸出層,其網(wǎng)絡(luò)輸入X= [x1x2...xn]T,而網(wǎng)絡(luò)輸出Y=yi,i=0,1,...,m。

圖1 預(yù)測模型構(gòu)成示意圖

如圖1 可見,輸入層的神經(jīng)元數(shù)目等于待預(yù)測血糖濃度序列點(diǎn)的前p 個(gè)連續(xù)的樣本;模式層的神經(jīng)元數(shù)目與學(xué)習(xí)樣本的數(shù)目n 相等,該層的每個(gè)神經(jīng)元的傳遞函數(shù)如下式所示:

式中,X 為輸入變量,Xi為第i 個(gè)神經(jīng)元對應(yīng)的學(xué)習(xí)樣本,σ 為光滑因子,即高斯函數(shù)的標(biāo)準(zhǔn)差。

求和層用于對所有模式層神經(jīng)元的輸出進(jìn)行算術(shù)求和及加權(quán)求和,如下式所示:

而輸出層神經(jīng)元的取值是將求和層的輸出進(jìn)行相除,即:

4.2 算法設(shè)計(jì)

綜上所述,可以得到如下的小樣本血糖濃度預(yù)測算法:

算法名稱:小樣本血糖濃度預(yù)測算法

輸入:血糖原始序列yt(t=1,2,...,n)

輸出:血糖序列的m 個(gè)預(yù)測值yt(t=n+1,n+2,...,m)

步驟1:利用式(1)耀式(5)對yt進(jìn)行計(jì)算分析,若存在異常樣本,跳轉(zhuǎn)步驟2,否則,跳轉(zhuǎn)步驟3;

步驟2:以步驟1 檢測發(fā)現(xiàn)的異常樣本點(diǎn)為中心,選取其左右相鄰的4 個(gè)樣本點(diǎn),代入式(7)求得Lagrange 插值多項(xiàng)式函數(shù),并將新的函數(shù)插值替換異常樣本點(diǎn);

步驟3:以[1,n]為插值區(qū)間,利用式(8)耀(10)求出對應(yīng)的三次樣條插值函數(shù),并在各個(gè)子區(qū)間[t,t+1](t=1,2,...,n-1)中,根據(jù)實(shí)際需要以細(xì)分的時(shí)間間距完成樣本插值擴(kuò)充處理,完成異常樣本剔除及擴(kuò)充處理的血糖序列記為

步驟4:將分拆為訓(xùn)練樣本和測試樣本,對廣義回歸神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,打印輸出網(wǎng)絡(luò)參數(shù),算法結(jié)束。

5 實(shí)驗(yàn)及結(jié)果分析

為驗(yàn)證本算法的有效性及先進(jìn)性,選取美國國立衛(wèi)生研究院發(fā)布的DirecNet(Diabetes Research in Children Network)糖尿病臨床數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。該數(shù)據(jù)集有100 多名糖尿病兒童患者的連續(xù)血糖數(shù)值,采樣時(shí)間間隔為5 min,由專業(yè)的連續(xù)血糖監(jiān)測系統(tǒng)采集所得。

實(shí)驗(yàn)在PC 機(jī)上進(jìn)行,硬件配置為:Intel 酷睿i5 4570 四核CPU、Kingmax DDR3 16GB RAM、Western Digital 500 G Hard Disk;操作系統(tǒng)與開發(fā)環(huán)境為:Microsoft Windows10、MATLAB R2013。

在實(shí)驗(yàn)過程中,著重對比現(xiàn)有算法與本算法在辨識精度和計(jì)算開銷等技術(shù)指標(biāo)上的差異,并對相關(guān)實(shí)驗(yàn)結(jié)果加以詳細(xì)分析與討論。

5.1 實(shí)驗(yàn)過程與方法

隨機(jī)選取10 名患者的某1 天(24 小時(shí))的血糖序列進(jìn)行濃度預(yù)測建模分析,實(shí)驗(yàn)的過程包括:

步驟a:分別以Δt=1h、2h、3h、4h 對原始實(shí)驗(yàn)樣本抽樣,得到三種不同時(shí)間間隔的小樣本序列;

步驟b:用式(1)耀式(7)分別對步驟a 中三種小樣本序列進(jìn)行異常樣本點(diǎn)剔除和替換;

步驟c:用式(8)耀式(10)分別對步驟b 中的各種小樣本序列進(jìn)行三次樣條插值的樣本擴(kuò)充處理;

步驟d:在MATLAB R2013 中,分別對各名患者的原始序列、不同時(shí)間間隔的小樣本序列進(jìn)行基于廣義回歸神經(jīng)網(wǎng)絡(luò)的預(yù)測模型的訓(xùn)練和構(gòu)建。

5.2 實(shí)驗(yàn)結(jié)果與分析

5.2.1 原始血糖序列的各項(xiàng)預(yù)處理結(jié)果

以5#患者為例,其原始血糖序列如圖2 所示。該血糖序列的采樣時(shí)間間隔Δt=5 min,共有288 個(gè)樣本點(diǎn)。

圖2 5#患者原始血糖序列

圖3 為以時(shí)間間隔Δt=1 h 對原始血糖序列做抽樣處理所得的小樣本序列,共有24 個(gè)樣本點(diǎn)。

圖3 時(shí)隔Δt=1h 抽樣處理所得小樣本序列

利用式(1)耀式(5)對圖3 的小樣本序列進(jìn)行異常樣本點(diǎn)處理,處理后的效果見圖4。通過對比可見,在t=3 和t=22 處已完成異常樣本的剔除和替換。

圖4 異常樣本點(diǎn)處理效果圖

利用式(8)耀式(10)對圖4 的小樣本序列進(jìn)行以時(shí)間間隔Δt=5min 的三次樣條插值函數(shù)的擴(kuò)充處理,處理結(jié)果如圖5 所示。

圖5 三次樣條插值處理效果圖

5.2.2 實(shí)驗(yàn)結(jié)果討論

為驗(yàn)證各種不同時(shí)間間隔的小樣本擴(kuò)充序列的預(yù)測建模性能,此處將基于廣義回歸神經(jīng)網(wǎng)絡(luò)對原始血糖序列、Δt=0.5h、Δt=1h、Δt=2h 及Δt=3h 等4種小樣本擴(kuò)充序列進(jìn)行預(yù)測建模分析。以連續(xù)4 個(gè)小時(shí)的相依血糖序列(共48 個(gè)樣本點(diǎn))對下一個(gè)血糖濃度進(jìn)行預(yù)測,可設(shè)置廣義回歸神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)n=48;將前232 個(gè)序列作為訓(xùn)練樣本,后56個(gè)序列作為測試樣本,模式層和求和層的神經(jīng)元數(shù)目p=184。

為了全面考察各種不同時(shí)間間隔抽樣所得的樣本序列對預(yù)測精度的影響,引入平均絕對百分誤差MAPE 進(jìn)行有關(guān)的性能評價(jià),MAPE 的具體定義為:

式中,yt為輸入序列,為預(yù)測序列,n 為序列長度。

在糖尿病的實(shí)際臨床治療過程中,為了有效地確定注射胰島素的最佳時(shí)間和劑量,醫(yī)護(hù)人員往往需要對未來30 分鐘范圍內(nèi)的血糖水平進(jìn)行預(yù)測,以采樣時(shí)間間隔Δt=5 min 為例,則需要對未來6 個(gè)樣本點(diǎn)進(jìn)行預(yù)測。繼續(xù)以5#患者為例,將各種不同時(shí)間間隔抽樣所得的擴(kuò)充樣本序列輸入至廣義回歸神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練,并利用訓(xùn)練所得的網(wǎng)絡(luò)模型進(jìn)行未來6 個(gè)樣本點(diǎn)的預(yù)測,得到圖6 所示的預(yù)測效果圖。分別對10 名患者的各種擴(kuò)充樣本進(jìn)行相應(yīng)的網(wǎng)絡(luò)訓(xùn)練模型,各樣本的MAPE 預(yù)測性能詳細(xì)見表1 所示。

圖6 5#患者各擴(kuò)充樣本序列6 步預(yù)測效果圖

表1 各抽樣小樣本擴(kuò)充序列MAPE 預(yù)測性能

從圖與表中可知,對各患者而言,以原始血糖樣本訓(xùn)練所得的模型預(yù)測精度最為精確,其MAPE 在98%耀99%之間;隨著抽樣時(shí)間間隔的增大,擴(kuò)充樣本訓(xùn)練模型的預(yù)測精度逐漸下降,在抽樣時(shí)間間隔Δt=3 h 時(shí),其MAPE 仍能維持在90%以上,此時(shí)仍屬高精度預(yù)測。當(dāng)抽樣時(shí)間間隔Δt=4 h 時(shí),MAPE已降至90%以下。在抽樣時(shí)間間隔Δt=mh 時(shí),其三次樣條插值函數(shù)便需要插入60÷5×m-2 個(gè)樣本點(diǎn),不難發(fā)現(xiàn),抽樣時(shí)間間隔越大,插值樣本數(shù)量就越多,相應(yīng)地,插值誤差也就越大。事實(shí)上,過多使用擴(kuò)充樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練,所得模型的預(yù)測性能確實(shí)在逐漸變差。

從上述分析可知,在保證高精度預(yù)測的前提要求下,通過三次樣條插值函數(shù)的擴(kuò)充處理,訓(xùn)練模型所需的樣本抽樣采集時(shí)間可以從5 分鐘延長至3 小時(shí)。據(jù)此便可證明本改進(jìn)算法是正確和有效的。

6 結(jié) 束 語

針對小樣本血糖濃度預(yù)測的醫(yī)療實(shí)際需求,提出了一種改進(jìn)的預(yù)測算法。改進(jìn)算法通過對異常樣本進(jìn)行剔除和替換以及三次樣條插值函數(shù)的樣本擴(kuò)充等處理,實(shí)現(xiàn)了在一定采樣時(shí)間間隔的條件下,以較少的訓(xùn)練樣本獲得較為精確的預(yù)測模型。下一步的主要工作是研究性能更為優(yōu)異的插值函數(shù),以便實(shí)現(xiàn)延長抽樣時(shí)間間隔的同時(shí),進(jìn)一步提升預(yù)測模型的精度。

猜你喜歡
樣條插值間隔
一元五次B樣條擬插值研究
間隔問題
間隔之謎
基于Sinc插值與相關(guān)譜的縱橫波速度比掃描方法
三次參數(shù)樣條在機(jī)床高速高精加工中的應(yīng)用
三次樣條和二次刪除相輔助的WASD神經(jīng)網(wǎng)絡(luò)與日本人口預(yù)測
軟件(2017年6期)2017-09-23 20:56:27
基于樣條函數(shù)的高精度電子秤設(shè)計(jì)
一種改進(jìn)FFT多譜線插值諧波分析方法
基于四項(xiàng)最低旁瓣Nuttall窗的插值FFT諧波分析
上樓梯的學(xué)問
昌平区| 沅江市| 华亭县| 榆中县| 嘉黎县| 文成县| 全州县| 临漳县| 临武县| 皮山县| 磐安县| 镇康县| 焉耆| 霍山县| 合水县| 霸州市| 昆山市| 宿州市| 阳西县| 嘉义市| 三原县| 资源县| 文登市| 灌云县| 磴口县| 嘉义市| 罗江县| 德州市| 沿河| 新乡县| 噶尔县| 霍邱县| 璧山县| 三河市| 江西省| 金塔县| 江阴市| 宁阳县| 海门市| 介休市| 杭锦后旗|