国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于貝葉斯網(wǎng)絡的老年綜合評估過程簡化方法

2022-12-24 12:37:00李關東鄒函怡王藝樺許楊孫怡寧馬祖長高理升
北京生物醫(yī)學工程 2022年6期
關鍵詞:題項結點貝葉斯

李關東 鄒函怡 王藝樺 許楊 孫怡寧 馬祖長 高理升

0 引言

當前,我國人口老齡化進程顯著加劇。第七次全國人口普查數(shù)據(jù)顯示,我國60歲及以上人口有26 402萬人,占總?cè)丝诘?8.70%,與第六次普查數(shù)據(jù)相比上升5.44%[1]。人口老齡化將增加家庭養(yǎng)老負擔,并帶來基本公共服務供給的壓力。為積極應對老齡化,2019年國務院頒發(fā)了《關于推進養(yǎng)老服務發(fā)展的意見》,文件中明確指出,通過政府購買服務,統(tǒng)一開展老年人能力綜合評估,并將評估結果作為領取補貼、接受養(yǎng)老服務的依據(jù)[2]。因此,發(fā)展適宜在社區(qū)大規(guī)模推廣開展的老年綜合評估方法具有緊迫而重要的實際意義。

老年綜合評估(comprehensive geriatric assessment,CGA)是指采用多學科方法評估老年人的軀體情況、功能狀態(tài)、心理健康和社會環(huán)境狀況等,并據(jù)此制訂以維持及改善老年人健康和功能狀態(tài)為目的的治療計劃,最大程度地提高老年人的生活質(zhì)量[3]。目前CGA主要分為綜合評估測量和單項評估累計測量[4]。綜合評估工具內(nèi)容繁雜,評估耗時耗力,難以普及使用。單項評估工具在單一維度評估中準確便捷,但累計多項工具評估同樣喪失其簡捷性。評估過程冗長繁瑣易引起老人的煩躁情緒,進而影響評估結果的準確性,難以在社區(qū)開展大面積篩查評估工作[5]。

為解決上述問題,學者們使用多種方法對問卷內(nèi)容進行簡化。李苗苗等[5]通過文獻分析和專家會議法初步設計CGA指標體系框架和快速篩查條目,并采用Delphi專家函詢法進一步修訂,最終構建CGA快速篩查指標體系,相較傳統(tǒng)綜合評估量表,問題數(shù)明顯減少。Tai等[6]首先通過ROC曲線和約登指數(shù)確定軀體功能截斷值,再使用逐步logistic回歸篩選老年綜合征的危險因素,最后根據(jù)分析結果從常用CGA工具中篩選題項,最終形成簡明綜合評估工具。這些研究使用專家知識或者統(tǒng)計學方法,通過直接刪減部分問題達到了簡化量表的目的。然而,刪減問題將會影響量表的準確性[7]。評估過程中準確性和便捷性不可兼得的問題難以解決。

隨著計算機技術的發(fā)展,有學者嘗試使用智能化方法輔助簡化CGA流程。Daniel等[8]通過推導的分支規(guī)則構建了可應用于老年綜合評估的數(shù)據(jù)挖掘算法,但該方法僅適用于二元問題,具有較大局限性。Mo等[7]基于提出的影響力算法構建了快速前向問卷模型(fast preceding questionnaire model,F(xiàn)PQM),該模型對問卷問題進行預測與重排序。該方法在保證問卷結構完整的前提下減少了調(diào)查題項。但模型空間占用量巨大,不利于推廣使用;此外模型的準確性仍有提升空間。

貝葉斯網(wǎng)絡是一種表示不確定性信息的概率圖模型,它一方面直觀易懂[9],方便學者交流和建模,另一方面又具備嚴格的數(shù)學證明,適合計算機處理[10],被認為是人工智能領域最重要的研究成果之一。Aburai等[11]對富士商業(yè)街居民和游客的需求進行問卷調(diào)查,利用貝葉斯網(wǎng)絡獨特的可視化能力和概率推理能力,分析問卷題項之間的因果關系,并對潛在游客進行預測估計,為構建更有效實用的規(guī)劃建筑提供了參考依據(jù)。貝葉斯網(wǎng)絡可推理問卷問題的回答,基于此特性便可進一步實現(xiàn)簡化評估過程的目的。

本文利用貝葉斯網(wǎng)絡發(fā)掘問卷題項間的關聯(lián),并提出一種用于CGA的問卷調(diào)查算法,以解決評估過程中準確性和便捷性不可兼得的問題,并與前文所述的FPQM進行比較分析,探究該方法在簡化CGA中的應用價值,為普及社區(qū)CGA工作提供一種可行的技術手段。

1 實驗數(shù)據(jù)與預處理

1.1 實驗數(shù)據(jù)

本研究數(shù)據(jù)來源于北京大學健康老齡與發(fā)展研究中心[12]組織的中國老年健康影響因素跟蹤調(diào)查(Chinese Longitudinal Healthy Longevity Survey,CLHLS),在全國23個省(自治區(qū)、直轄市)隨機抽取約一半的縣市,前后總共進行了8次跟蹤調(diào)查。該調(diào)查數(shù)據(jù)質(zhì)量經(jīng)過評估得到國內(nèi)外學者普遍認可,已成為學界公認類似調(diào)研中數(shù)據(jù)信息十分豐富和研究潛力巨大的交叉學科研究項目。該調(diào)查對象為65歲及以上老人,調(diào)查內(nèi)容包括了老人生理心理健康、認知功能、社會參與、社會經(jīng)濟狀況、生活習慣等。

1.2 數(shù)據(jù)預處理

本研究采用2018年橫斷面調(diào)查數(shù)據(jù),該數(shù)據(jù)包含15 874例數(shù)據(jù)。以CGA中國專家共識[3]和民政部2013年頒布的老年人能力評估標準[13]為指導,CGA主要包含日常生活活動能力、精神狀態(tài)、心理健康、感知覺等維度,本研究據(jù)此篩選數(shù)據(jù)集中與CGA內(nèi)容相關的49項題目,并對回答缺失或無效的樣本進行剔除,最后隨機抽取其中958例數(shù)據(jù)用于構建模型和性能測試。認知功能題項中的反應能力、計算能力、記憶力和語言理解中題目有順序要求,應分別當作整體進行評估,因此分別對相應題目進行計分并作為單變量輸入,最終輸入屬性為38個,詳細內(nèi)容如表1所示。

表1 問卷題項內(nèi)容Table 1 Questionnaire items

2 算法設計及評價方法

2.1 問卷模型構建

本研究首先通過貝葉斯網(wǎng)絡發(fā)掘并計算問卷題項之間的關系,并以此構建問卷模型。其中度量問卷題項間的關系對應結構學習過程,計算屬性間關聯(lián)強度對應參數(shù)學習過程。

基于評分搜索的結構學習[14]將在所有可能存在的結構Gn中尋找一個評分最高的結構G*,評分函數(shù)用以度量搜索空間中每個結構與樣本數(shù)據(jù)的擬合程度。以BIC評分函數(shù)為例,其評分函數(shù)主要基于信息論的最小描述長度(minimum description length,MDL)原理實現(xiàn),該評分準則將在網(wǎng)絡精度與復雜度之間尋找一個平衡點。

基于貝葉斯估計的參數(shù)學習[15]先將待估條件概率表參數(shù)Θ視為隨機變量,并將關于Θ的先驗知識表示為先驗概率分布,在觀測到前l(fā)個樣本的完整數(shù)據(jù)后,計算Θ的后驗概率分布以及下一個樣本Dl+1的概率分布。

2.2 問卷調(diào)查算法

本研究提出一種基于貝葉斯網(wǎng)絡的問卷調(diào)查算法,其可抽象為遍歷網(wǎng)絡結構G,通過實際問詢或者推理計算獲取每個屬性的取值。算法的流程如圖 1所示,主要步驟如下。

(1) 對于貝葉斯網(wǎng)絡結構G= (V,E),首先對V按入度從小到大進行排序,優(yōu)先選擇從入度較小的結點開始遍歷。

(2) 已遍歷結點取值作為證據(jù)集,推理當前訪問結點的所有取值的概率P,選取其中最大值與輸入的超參數(shù)閾值σ進行比較,如果P≥σ,則該結點通過推理計算預測取值,否則通過實際問詢老人得到回答,同時將取值加入證據(jù)集。

(3) 繼續(xù)遍歷剩余結點并執(zhí)行步驟(2),直到所有結點訪問完畢,獲得最終調(diào)查結果。

由于貝葉斯網(wǎng)絡支持多種推理類型,因此結構G的遍歷可以選擇如下4種方式。

(1) 單向深度優(yōu)先搜索(DFS):從一個結點V0開始,先訪問其中一個子結點V1,再從V1開始訪問它的子結點,重復上述過程直到結點全部被訪問。

(2) 單向廣度優(yōu)先搜索(BFS):從一個結點V0開始,先訪問它所有的子結點{Vchild},之后再依次訪問{Vchild}的子結點,重復上述過程,直到結點全部被訪問。

(3) 雙向DFS:從一個結點V0開始,先訪問其中一個子結點或父結點V1,再從V1開始訪問它的子結點或父結點,重復上述過程直到結點全部被訪問。

(4) 雙向BFS:從一個結點V0開始,先訪問它所有的子結點和父結點{Vchild,Vparent},之后再依次訪問{Vchild,Vparent}的父子結點,重復上述過程,直到結點全部被訪問。

圖1 算法流程圖Figure 1 Flowchart of the algorithm

2.3 算法評價指標

本算法目的為同時保證評估過程的準確性和簡捷性,因此評價指標主要由準確率和簡化率構成。涉及的定義如下:個體準確率表示正確預測的問題在所有預測問題中的占比,平均準確率(average accuracy rate,AAR)是數(shù)據(jù)集中所有個體準確率的算術平均數(shù),評價算法整體準確率。

(1)

式中:m表示測試集樣本容量;Cij為第i個個體的第j個問題的預測正誤標記,預測正確為1,否則為0;Iij為第i個個體的第j個問題的預測標記,成功預測為1,否則為0。

個體簡化率表示預測的問題在問卷中的占比,平均簡化率(average reduction rate,ARR)是數(shù)據(jù)集中所有個體簡化率的算術平均數(shù),評價算法整體簡化率。

(2)

式中:n表示問卷問題數(shù)。

AFβ綜合考慮平均準確率和平均簡化率兩個指標,用于評價算法的性能。

(3)

式中:β為設定參數(shù),可根據(jù)實際需要對準確率和簡化率的權重進行調(diào)整。AFβ越大表示算法的性能越高。當Iij= 0時,ARR=0,AAR=1恒成立;則AFβ=0。當Iij= 1時,ARR=1恒成立;則AFβ和ARR都會很低。因此需要選取合適的Iij使AFβ最大,Iij取決于閾值σ與遍歷模式。

2.4 試驗流程

將抽取的958例數(shù)據(jù)按7:3的比例劃分訓練集和測試集,其中訓練集用于構建貝葉斯網(wǎng)絡,測試集用于評價算法性能。貝葉斯網(wǎng)絡基于Python的pgmpy庫實現(xiàn),pgmpy庫完全使用Python語言實現(xiàn)貝葉斯網(wǎng)絡,支持多種結構學習、參數(shù)學習和推理算法。

3 實驗結果

3.1 實驗環(huán)境及參數(shù)設計

本實驗在PyCharm 2021.2.1中編寫程序并運行。試驗硬件配置:CPU為AMD Ryzen 5 3500U @ 2.10 GHz,內(nèi)存為20.0 GB,操作系統(tǒng)為Windows 10。

本實驗使用爬山法對貝葉斯網(wǎng)絡結構進行搜索,并通過BIC評分函數(shù)篩選最優(yōu)網(wǎng)絡結構。采用貝葉斯估計進行模型參數(shù)學習,使用變量消元法對屬性進行精確推理。在評價指標中,設置AFβ的β=0.5,表示準確率重要程度為簡化率的2倍。調(diào)查算法中的超參數(shù)閾值σ從0.95開始以0.05為單位依次減小進行試驗,每種閾值條件下分別進行4次不同遍歷模式的試驗,最終選取AFβ最高的參數(shù)組合作為最優(yōu)參數(shù)。

3.2 貝葉斯網(wǎng)絡結構

通過訓練集學習得到的貝葉斯網(wǎng)絡結構,使用Netica軟件對其進行可視化展示,由于網(wǎng)絡結構復雜,本文僅以部分結點為示例,如圖 2所示。每個結點即一個問題,網(wǎng)絡同時存儲每個選項出現(xiàn)的概率,結點之間通過有向邊連接,表示存在依賴關系。調(diào)查開始時,算法從上到下依次執(zhí)行搜索策略,當任意一個問題的回答確定后,網(wǎng)絡將及時自動更新其他問題選項的概率。在積累足夠信息后,算法便可推斷一些問題的回答,否則繼續(xù)直接問詢獲取回答。

3.3 算法驗證分析

在958例數(shù)據(jù)中隨機選取30%的數(shù)據(jù)即288例構建測試集,對設計的算法進行驗證分析。對比輸入不同的閾值σ和遍歷模式下的評價指標,分別選取單項指標最高的參數(shù)組合進行展示,如表 2所示。結果顯示,當閾值σ≤0.2時,無論何種遍歷模式,都能獲得最高的平均簡化率,可達0.92,但準確性較差;當閾值σ取最高的0.95時,單雙向BFS遍歷模式都能獲得最高的平均準確率,可達0.98,但簡化率很低。這符合認知,當閾值過低時,即使出現(xiàn)概率較低也會被直接預測,因此大部分問題都不會被問詢,但這樣的預測結果并不可信;當閾值很高時,預測的問題可信度很高,但大部分問題都不會被預測。因此,考慮算法的綜合性能,應該在這兩個數(shù)值之間尋找平衡,本試驗的結果是σ= 0.7時,無論何種遍歷模式,都能獲得最高的AFβ,可達0.85,此時綜合性能最佳。遍歷模式在相同閾值的條件下對試驗結果影響不大,說明無論模型采用何種推理方式,均能得到較一致的結果。

圖2 貝葉斯網(wǎng)絡結構示意圖Figure 2 Structure diagram of Bayesian network structure

表2 不同參數(shù)組合的性能Table 2 Performance of different parameter combinations

進一步,算法性能隨閾值σ的變化如圖 3所示,平均簡化率從閾值σ= 0.4開始,隨閾值σ的增加快速下降,相反,平均準確率從閾值σ= 0.4開始,隨閾值σ的增加快速上升,而AFβ從σ= 0.4開始先是不斷上升,在σ= 0.7達到最高點,之后開始下降,整體波動幅度較小。因此,權衡準確率和簡化率后,σ= 0.7可作為本實驗的最優(yōu)參數(shù)。

圖3 算法性能隨閾值σ增加的變化Figure 3 Performance with increasing threshold σ

3.4 算法性能比較

為進一步驗證本研究算法的性能,將與其他算法進行對比。調(diào)研發(fā)現(xiàn),現(xiàn)有公開報道中有關老年綜合能力評估的智能算法較少,本文采用其中較有代表性的FPQM[7]作為對比。與本研究算法類似,F(xiàn)PQM同樣需要輸入一個閾值參數(shù)σ對性能進行調(diào)試,因此對閾值σ從0.95開始以0.05為單位依次減小進行實驗。各項指標峰值及模型存儲大小對比結果如表3所示。結果表明,本研究算法在最高準確率和綜合性能上明顯高于FPQM,同時在空間占用上大幅減小,在最高簡化率上雖低于FPQM但差距不大。

表3 不同算法的性能比較Table 3 Performance comparison of different algorithms

4 討論

本研究表明,基于貝葉斯網(wǎng)絡的老年綜合評估過程簡化方法相較先前的FPQM綜合性能更好,準確率更高,同時節(jié)省數(shù)萬倍的存儲空間,在運行時能更加高效地加載訓練好的模型到內(nèi)存中,適合大面積綜合評估的應用場景。

目前CGA普遍采用量表、問卷調(diào)查的方式進行評估[4],量表題項都是經(jīng)過復雜流程挑選得到的,題項之間既存在關聯(lián),也存在獨立的情況[16]。因此,通過刪減題項的方式將會降低評估的準確性。量表的題項以單選題為主[17],少部分多選題可以通過計分方式轉(zhuǎn)化為單選題,這些題項均可作為離散屬性變量輸入計算機處理。通過部分問題回答去預測其他問題回答,屬于多維分類問題,與傳統(tǒng)分類問題不同,這是一個前沿課題[18]。

FPQM基于一階依賴的假設,解釋了部分屬性間的真實關系。一階依賴假設過于理想,本研究考慮基于高階依賴的思想可以更完整地解釋屬性間關系,進一步提升算法的泛化性能[19]。真實問卷中題項間會呈現(xiàn)網(wǎng)狀關系,以圖結構表示題項之間的關系更加貼近實際。貝葉斯網(wǎng)絡以圖為基礎結構表達屬性間的關聯(lián),并通過概率計算具體量化屬性間的關聯(lián)強度。表 4列出了貝葉斯網(wǎng)絡與FPQM原理的比較?;谪惾~斯網(wǎng)絡的問卷調(diào)查算法通過預測部分回答的方式在不刪減題項的前提下減少了問詢問題數(shù),達到了簡化評估過程的目的。

CGA主要通過問卷得分劃分老人能力等級,因此只要最終得分在同一等級范圍內(nèi),即使該算法不能達到100%的準確率,個別問題的失真對最后分級結果的影響也在可控范圍內(nèi),因此本研究提出的算法能夠在保證結果準確的同時實現(xiàn)簡化評估的效果。CGA分級結果的驗證將在后續(xù)研究中進一步實現(xiàn)。在本研究結果中,最優(yōu)參數(shù)組合的平均簡化率達0.75以上,這表示問卷調(diào)查的工作量可以節(jié)省到原先的25%,具有顯著的簡化效果。

表4 不同模型的原理比較Table 4 Comparison of principles between different models

本研究通過訓練數(shù)據(jù)集得到的貝葉斯網(wǎng)絡,提出了一種老年綜合評估過程簡化方法,經(jīng)測試集驗證該方法優(yōu)于其他類似應用的算法。該方法同樣可應用于任何不同的問卷評估流程,解決調(diào)查過程中全面準確和簡捷不可兼得的問題。此外,也可基于該方法設計老人自助評估流程;數(shù)據(jù)分析者也可利用該方法對缺失數(shù)據(jù)進行補全。本研究后續(xù)將考慮納入個人基本信息、各項客觀指標等更多元的屬性變量,并嘗試更多的建模方法對性能進行測試,對算法綜合性能進行進一步優(yōu)化。同時,以本算法為核心開發(fā)的智能化老年綜合評估系統(tǒng)終端設備目前正在研制過程中。

5 結論

本研究針對CGA準確性與便捷性不可兼得的問題,基于貝葉斯網(wǎng)絡提出了一種老年綜合評估過程簡化方法,通過測試數(shù)據(jù)集初步驗證,平均準確率為0.983 6,AFβ為0.849 9,占用空間23 kB,均明顯優(yōu)于已報道的簡化算法。在當前老齡化日益嚴峻背景下,該方法對于基層社區(qū)和養(yǎng)老機構提升CGA工作效率具有重要應用價值。

猜你喜歡
題項結點貝葉斯
教師教學風格測量工具TSI修訂的實證研究
Ladyzhenskaya流體力學方程組的確定模與確定結點個數(shù)估計
貝葉斯公式及其應用
高職學生價值觀調(diào)查的研究變量的項目分析
山西青年(2017年6期)2017-03-15 01:27:59
基于貝葉斯估計的軌道占用識別方法
一種基于貝葉斯壓縮感知的說話人識別方法
電子器件(2015年5期)2015-12-29 08:43:15
12題項一般健康問卷(GHQ-12)結構的多樣本分析
心理學探新(2015年4期)2015-12-10 12:54:02
調(diào)查問卷的信效度檢驗及結構調(diào)整的定量分析
大學教育(2014年6期)2014-07-25 19:06:32
IIRCT下負二項分布參數(shù)多變點的貝葉斯估計
基于Raspberry PI為結點的天氣云測量網(wǎng)絡實現(xiàn)
潮安县| 拉萨市| 塘沽区| 玛纳斯县| 和田市| 红安县| 汾西县| 广南县| 东辽县| 革吉县| 德化县| 南充市| 沾益县| 辽宁省| 新密市| 宜春市| 文成县| 嫩江县| 博野县| 瑞安市| 宣武区| 玉田县| 通渭县| 丘北县| 南阳市| 梁山县| 宣武区| 美姑县| 尤溪县| 汉中市| 商丘市| 青铜峡市| 嘉禾县| 浙江省| 仪陇县| 康平县| 滨州市| 钟祥市| 浦东新区| 湖南省| 巴中市|