国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于正則化邏輯回歸的阿爾茨海默病早期診斷模型*

2021-10-25 12:35:58張貽泉徐培然韓莉莉張寶昌肖如意劉漢磊崔新春
關(guān)鍵詞:正則受試者預(yù)處理

張貽泉, 徐培然, 韓莉莉, 張寶昌,肖如意, 劉漢磊, 崔新春

(①曲阜師范大學(xué)計算機(jī)學(xué)院,276826,日照市;②濟(jì)寧學(xué)院計算機(jī)科學(xué)系,272071,濟(jì)寧市;③曲阜師范大學(xué)管理學(xué)院,276826,日照市;④濟(jì)寧醫(yī)學(xué)院網(wǎng)絡(luò)信息中心,273100,山東省濟(jì)寧市)

0 引 言

阿爾茨海默病(AD)是一種退行性神經(jīng)疾病,一旦患病不可逆,最常見于老年人[1].2017年全世界有3000多萬人患有AD,到2050年這個數(shù)字將增加2倍[1].由于世界人口老齡化的發(fā)展,患有阿爾茨海默病和其他形式癡呆的人數(shù)迅速增加,這是對世界范圍內(nèi)保健和社會保健系統(tǒng)的一個重大挑戰(zhàn).輕度認(rèn)知障礙(MCI)是介于正常和AD之間的一種中間狀態(tài).據(jù)估計,年齡在58歲以上的MCI患者中有40%~60%有潛在的AD病理[2].每年大約有15%的MCI患者轉(zhuǎn)換成AD.因此,準(zhǔn)確診斷AD和MCI對延緩疾病進(jìn)展具有重要意義.但MCI患者臨床癥狀不明顯,這一階段的診斷非常困難.因此,設(shè)計和實(shí)施正確識別MCI不同階段(早期輕度認(rèn)知障礙(EMCI)和晚期輕度認(rèn)知障礙(LMCI))的方法具有重要意義.

近年來,計算機(jī)輔助診斷AD和MCI引起了人們的廣泛關(guān)注[3].許多機(jī)器學(xué)習(xí)方法已經(jīng)成功地應(yīng)用于AD分類領(lǐng)域[4].其中邏輯回歸(LR)被認(rèn)為是一種較強(qiáng)的判別方法.LR有一個直接的概率解釋,它可以獲得除類標(biāo)簽信息之外的分類概率[5,6].然而,高維問題的求解仍然具有挑戰(zhàn)性[7,8].與從MRI數(shù)據(jù)中提取的特征向量維數(shù)相比,用于訓(xùn)練的樣本數(shù)量通常非常小.這可能會導(dǎo)致邏輯回歸模型的過擬合問題,帶來較大的計算壓力[9,10].為了解決這個問題,在最近的文獻(xiàn)中提出了許多優(yōu)化方法.Koh等人[11]引入L1正則化邏輯回歸作為解決大規(guī)模問題的特例.L1正則化可以縮小回歸系數(shù),同時選擇較小的特征子集[12].L1正則化具有一定的優(yōu)點(diǎn),但也存在一些不足.首先,L1正則化在某些情況下會產(chǎn)生不一致的特征選擇,并且在參數(shù)估計時經(jīng)常引入額外的偏差[13].其次,L1正則化只在一組相關(guān)特征中選擇一個基因.最后,L1正則邏輯回歸是不可微的.它有許多計算上的挑戰(zhàn),特別是當(dāng)任何一個權(quán)值為零時.Jorge等[14]和Zhang等[15]采用L2正則化邏輯回歸對AD進(jìn)行分類.L2正則化直接對每個特征的權(quán)值進(jìn)行優(yōu)化,獲得優(yōu)異的性能[16].此外,L2正則邏輯回歸平滑且凸,計算比較容易.L2正則化雖然可以將特征的權(quán)重限制在盡可能小的范圍內(nèi),但不能減少特征的數(shù)量.本文采用獨(dú)立成分分析方法對數(shù)據(jù)進(jìn)行降維,利用ICA作為一種應(yīng)用廣泛的降維算法,提高了計算效率,減少了特征個數(shù).因此,我們在邏輯回歸模型中加入ICA和L2正則化,提高AD的分類效果,避免過擬合問題.值得注意的是,邏輯回歸的目標(biāo)函數(shù)沒有解析解,不能直接得到最優(yōu)參數(shù),只能采用迭代法求解[17].牛頓算法是優(yōu)化的最常用算法之一,該算法相對簡單過程容易控制.我們利用牛頓算法對模型進(jìn)行優(yōu)化,得到一個最小的損失函數(shù).

1 材 料

1.1 ADNI數(shù)據(jù)庫

本研究使用的所有數(shù)據(jù)均來自阿爾茨海默病神經(jīng)成像倡議(ADNI)數(shù)據(jù)庫(http://www.loni.ucla.edu/ADNI).ADNI是一個非營利性組織,由美國國家生物醫(yī)學(xué)成像和生物工程研究所于2003年成立[18].ADNI用于檢測序列磁共振成像(MRI)、正電子發(fā)射斷層掃描(PET)、其他生物標(biāo)志物、臨床和神經(jīng)心理評估是否可以結(jié)合來測量MCI和AD的進(jìn)展[19].ADNI提供不受限制的數(shù)據(jù)訪問,并鼓勵研究人員開發(fā)分析.

圖1 AD早期診斷框架

1.2 受試者

結(jié)構(gòu)磁共振成像(MRI)是一種廣泛應(yīng)用于AD診斷和預(yù)測的成像方式[20].MRI圖像易于獲取,具有良好的診斷準(zhǔn)確性[21].可以獲得大腦的形態(tài)學(xué)數(shù)據(jù),如灰度密度、灰體積、皮層厚度.因此,使用結(jié)構(gòu)MRI圖像進(jìn)行分析.我們選擇了197例ADNI數(shù)據(jù)庫中的MRI圖像,其中AD 51例、CN 50例、MCI 96例.96名MCI受試者中,LMCI 51名、EMCI 45名.

1.3 系統(tǒng)框架

本文提出的AD早期診斷框架如圖1所示.該框架包括圖像預(yù)處理和特征提取,獨(dú)立成分分析和RLR模型.詳細(xì)信息將在下一節(jié)中描述.

圖2 圖像預(yù)處理和特征提取過程

2 方 法

2.1 數(shù)據(jù)預(yù)處理和特征提取

從ADNI數(shù)據(jù)庫下載的MRI圖像需要進(jìn)行一系列圖像預(yù)處理,提取90個感興趣區(qū)域的灰質(zhì)體積作為有效特征.將有效特征輸入到分類器中進(jìn)行分類.圖2展示的是圖像預(yù)處理和特征提取過程.

本文使用SPM8軟件(http://www.fil.ion.ucl.ac.uk/spm/)和VBM8工具箱對MRI圖像進(jìn)行預(yù)處理.預(yù)處理過程包括5個步驟,即(1)顱骨剝離(移除非腦組織),(2)空間標(biāo)準(zhǔn)化和分割灰質(zhì)(GM),白質(zhì)(WM)和腦脊液(CSF),(3)平滑(去除圖像的噪聲),(4)配準(zhǔn)(將每個受試者的灰質(zhì)圖配準(zhǔn)到一個AAL的模板),(5)選擇90個感興趣區(qū)域的灰質(zhì)體積作為特征. 我們提出的診斷算法見下頁表1.

2.2 獨(dú)立成分分析

ICA是一種將多元分量分離為若干統(tǒng)計獨(dú)立分量線性組合的計算方法,它幫助降低數(shù)據(jù)噪聲,提高分類精度.每個樣本包含90個特征,整個數(shù)據(jù)集包含197幅圖像,總共有17730個功能,計算量很大.為了減少計算量,使用獨(dú)立成分分析方法對數(shù)據(jù)進(jìn)行降維.獨(dú)立成分分析有以下步驟.

協(xié)方差矩陣的特征分解:

(1)

(2)

其中,D是特征值構(gòu)成的對角矩陣.白化過程

如下

(3)

通過白化將混合矩陣轉(zhuǎn)換為Y

(4)

因而通過ICA的白化過程對所需的矩陣進(jìn)行了降維.

2.3 邏輯回歸模型

(5)

(6)

表1 基于L2正則化LR的AD診斷算法

2.4 稀疏邏輯回歸模型

為了簡化邏輯回歸模型,避免過擬合,引入正則化邏輯回歸模型用于AD的早期診斷,提高分類精度.L2正則化可以防止模型過擬合,經(jīng)常用于約束損失函數(shù).基于公式(6)的RLR損失函數(shù)定義為

(7)

2.5 優(yōu)化算法

本研究使用牛頓算法來最小化公式(7)中的目標(biāo)函數(shù),選擇最優(yōu)的權(quán)值.表2總結(jié)了牛頓算法的步驟.

表2 基于牛頓法的迭代算法

2.6 L2正則化邏輯回歸的AD診斷算法

本文提出的基于L2正則化邏輯回歸的AD早期診斷.算法的整個過程主要包括如下幾個部分.首先,對sMRI圖像進(jìn)行預(yù)處理,提取90個感興趣區(qū)域的灰質(zhì)體積作為特征.其次,采用ICA對數(shù)據(jù)進(jìn)行降維,選擇重要的特征用于分類.最后,將L2正則化邏輯回歸用來對AD進(jìn)行分類.算法的具體過程如表1所示.

3 實(shí)驗(yàn)與結(jié)果

3.1 實(shí)驗(yàn)設(shè)置

本文考慮了3個分類任務(wù),即AD受試者與CN受試者(AD vs.CN)、MCI受試者與CN受試者(MCI vs.CN)和LMCI與EMCI (LMCI vs.EMCI).在所有分類方法中,訓(xùn)練集和測試集的比例都是7∶3.為了避免隨機(jī)影響,實(shí)驗(yàn)重復(fù)100次.對該模型進(jìn)行了測試,并與LR、LR-PCA和RLR進(jìn)行了比較.所有比較方法的性能通過計算準(zhǔn)確性(ACC)、敏感性(SEN)、特異性(SPE)、受試者工作特征曲線(ROC)和受試者工作特征下面積(AUC)來量化.具體公式定義為:

(8)

(9)

(10)

ROC曲線是研究分類器性能的有力工具.在ROC曲線上,橫軸為假陽性率(FPR),縱軸為真陽性率(TPR).公式為:

(11)

(12)

真陽性(TP)是正確分類的疾病類別的患者數(shù)量.真陰性(TN)是指健康人被正確劃分為健康類的數(shù)量.假陽性(FP)是指把健康人劃分為病人的數(shù)量.假陰性(FN)是指將病人劃分為健康人的數(shù)量.圖3和圖4分別表示了3種雙比的ROC曲線.

圖3 AD/MCI不同分類方法的ROC曲線 圖4 LMCI和EMCI不同分 類方法的ROC曲線

3.2 結(jié)果分析

ICA的累計貢獻(xiàn)率設(shè)定為95%.在數(shù)據(jù)集AD vs.CN,MCI vs.CN和LMCI vs.EMCI中,特征的數(shù)量分別減少到35,40和24.表3列出了AD/MCI不同分類方法的比較.

表3 AD/MCI不同分類方法的比較

表4 LMCI和EMCI患者的分型表現(xiàn)

表5 不同的方法在AD上分類性能的比較

從表3可以看出,本文方法在分類準(zhǔn)確率、敏感性和特異性方面都優(yōu)于其他競爭方法.具體來說,對于AD和CN的分類,本文方法的分類準(zhǔn)確率為95.22%,靈敏度為92.72%,特異性為93.36%,曲線下面積(AUC)為0.96.對于MCI和CN的分類,該方法的分類準(zhǔn)確率為81.22%,靈敏度為86.40%,特異性為73.23%,曲線下面積(AUC)為0.86.特別是RLR-ICA在AD與CN分類中具有最好的敏感性,表明我們提出的方法能夠有效識別AD患者.高靈敏度值表明對疾病診斷有很高的信心.因此,從臨床的角度來看,與上述方法相比,RLR-ICA較不容易誤診.

圖3為相應(yīng)的ROC曲線.從ROC曲線可以看出,RLR-ICA在3個分類任務(wù)上明顯優(yōu)于其他所有方法,采用L2正則化和ICA的RLR取得了更好的結(jié)果,說明L2正則化和ICA能夠提高LR的分類性能.我們也進(jìn)行了MCI不同階段的分類實(shí)驗(yàn),結(jié)果如表4和圖4所示.

從表4和圖4可以看出,與其他方法相比,本文方法在LMCI和EMCI中取得了更好的分類性能,提出的RLR-ICA方法各項指標(biāo)均優(yōu)于其他幾種邏輯回歸模型.具體來說,本方法在LMCI和EMCI上的分類準(zhǔn)確率達(dá)到74.35%,這對于AD的早期診斷至關(guān)重要.

為了進(jìn)一步評價RLR-ICA方法對AD早期診斷的療效,我們列舉了近年來一些有代表性的方法[8,22-26].使用AD的分類精度作為性能衡量.在表5中,對于使用多模態(tài)生物標(biāo)志物的多項研究,僅使用MRI數(shù)據(jù)報告我們的結(jié)果;使用多模態(tài)數(shù)據(jù)報告他人的結(jié)果.RLR-ICA方法尤其在分類精度方面均優(yōu)于表中其他人提出的方法.本文提出的AD診斷框架與其他研究相比僅采用了MRI數(shù)據(jù)作為AD,LMCI,EMCI,CN的分類依據(jù).在文獻(xiàn)[23]中,提出一種將多圖像歸一到同一公共空間的方法,這意味著更多的信息被考慮在內(nèi).在文獻(xiàn)[26]中,提出一種基于監(jiān)督學(xué)習(xí)的計算機(jī)輔助診斷方法,利用ROI作為評價指標(biāo)進(jìn)行了實(shí)驗(yàn).這種方法的特征提取方法與我們提出的方法不盡相同.這種比較可以在一定程度上顯示RLR-ICA方法的有效性.在大多數(shù)情況下,RLR-ICA方法的準(zhǔn)確性均優(yōu)于其他比較方法,說明RLR-ICA在AD的早期診斷中具有更好的診斷效果.

4 結(jié) 論

本文提出了RLR-ICA方法來識別AD受試者、MCI受試者和CN受試者.為了防止模型對數(shù)據(jù)過擬合,使用ICA對數(shù)據(jù)進(jìn)行降維,并使用L2正則化來限制系數(shù)的權(quán)重.我們在基線ADNI數(shù)據(jù)庫和MRI數(shù)據(jù)上評估此方法.該方法對AD與CN和MCI與CN的分類準(zhǔn)確率分別為95.22%和81.22%.實(shí)驗(yàn)結(jié)果表明,該方法的性能可以與現(xiàn)有技術(shù)相媲美.特別是在LMCI和EMCI中的分類準(zhǔn)確率為74.35%,可以區(qū)分MCI的不同階段.這對MCI的及時診斷和治療具有重要價值.在今后的工作中,我們將進(jìn)一步優(yōu)化邏輯回歸模型,提高模型的分類性能,更好地預(yù)測AD的早期階段.

猜你喜歡
正則受試者預(yù)處理
涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
剩余有限Minimax可解群的4階正則自同構(gòu)
涉及人的生物醫(yī)學(xué)研究應(yīng)遵循的倫理原則
類似于VNL環(huán)的環(huán)
基于預(yù)處理MUSIC算法的分布式陣列DOA估計
淺談PLC在預(yù)處理生產(chǎn)線自動化改造中的應(yīng)用
絡(luò)合萃取法預(yù)處理H酸廢水
基于自適應(yīng)預(yù)處理的改進(jìn)CPF-GMRES算法
404 Not Found

404 Not Found


nginx
资兴市| 滕州市| 阿拉善右旗| 大冶市| 精河县| 巴彦淖尔市| 霞浦县| 靖江市| 白水县| 榆社县| 建平县| 澄江县| 竹溪县| 临城县| 米脂县| 五河县| 双桥区| 大宁县| 宜黄县| 武威市| 汤原县| 上饶县| 松江区| 鹤岗市| 香河县| 海晏县| 股票| 通辽市| 安西县| 延安市| 鹤壁市| 龙泉市| 兰西县| 花莲县| 陆河县| 安福县| 车险| 抚顺县| 婺源县| 岢岚县| 新竹县|