降惠
摘 要:在傳統(tǒng)的醫(yī)療過程中,醫(yī)護人員隨機分配,患者被動接受治療的護理管理模式不僅會浪費有限的醫(yī)療資源,使患者承受較高醫(yī)療費用,有時還會延誤最佳治療時機,引發(fā)并發(fā)癥,給患者和其家庭帶來更多的痛苦和困擾。文章通過將幾種常見的聚類算法在護理管理中的應用進行比較,最終選擇了先驗假設(shè)較少的層次聚類算法,基于R語言探討了層次聚類算法分類護理患者的實現(xiàn)過程,說明了層次聚類算法在患者與護理資源的最優(yōu)匹配中的應用方法,為醫(yī)院開展科學護理管理提供一定的參考依據(jù)。
關(guān)鍵詞:聚類算法;護理管理;層次
中圖分類號:TP399 文獻標識碼:A
Abstract:In the process of traditional healthcare,health care providers are randomly assigned and patients are passive to accept various treatments.Besides the high expense of medical treatment and the waste of limited medical resources,it would delay the best treatment time and cause complications,bringing great suffering to patients and their families.By comparing clustering algorithms,this paper chooses the hierarchical clustering algorithm with fewer priori assumptions.Based on R Language,this paper elaborates on the implementation process of hierarchical clustering algorithm in clustering patients,and the methods of using hierarchical algorithm to optimally match the patients and nursing resources,thus providing certain reference and basis to the scientific nursing management.
Keywords:clustering algorithm;nursing management;hierarchical
1 引言(Introduction)
護理管理是醫(yī)療機構(gòu)以改善和提高醫(yī)療水平,合理利用醫(yī)療設(shè)備,最大程度發(fā)揮醫(yī)護人員護理能力為目標的過程。然而,在傳統(tǒng)的醫(yī)療護理管理過程中,醫(yī)護人員隨機分配,患者被動接受治療方案,不僅會浪費醫(yī)療資源,使患者承受較高醫(yī)療費用,有時還會延誤治療,引發(fā)并發(fā)癥,給患者和其家庭帶來更多痛苦和困擾。隨著信息化“智慧醫(yī)療”時代的到來,醫(yī)院信息系統(tǒng)的普及,醫(yī)療數(shù)據(jù)采集、整理、分析不再受到傳統(tǒng)人工操作在時間、效率、成本和療效等方面的制約,取而代之的是高效、便捷、智能、科學的大數(shù)據(jù)分析處理過程?!盎ヂ?lián)網(wǎng)+醫(yī)療護理”的模式已悄然走近我們身邊。許多學者開始嘗試通過計算機算法精準識別患者、最優(yōu)分配護理醫(yī)生、優(yōu)化患者轉(zhuǎn)診流程等方式來提高護理效果和降低醫(yī)療費用。在識別患者和分配醫(yī)生時,為了更好地進行分類識別,聚類算法受到了廣泛關(guān)注。
2 聚類算法(Clustering algorithm)
聚類就是按照“物以類聚”的思想,將抽象數(shù)據(jù)集劃分成若干簇的過程,其中在每一簇中數(shù)據(jù)間具有高度的相似性[1,2]。聚類分析是當前數(shù)據(jù)挖掘中的重要手段。迄今,研究者已提出了多種聚類算法[3]。常用的聚類算法有基于劃分、密度、網(wǎng)格、模型和層次的方法等[4]。
2.1 基于劃分的聚類方法
基于劃分的聚類方法需要提前設(shè)定聚類的數(shù)目,如K均值法和K中心點法等。這類方法分析時需要首先在數(shù)據(jù)集中隨機選擇聚類數(shù)目的對象,每個對象作為該聚類的中心或平均值,通過距離遠近等方法將其余對象逐步聚類到每個類中?;趧澐值木垲惙治鼋Y(jié)果與初始值關(guān)系非常密切,不同的初始值往往會導致不同的聚類結(jié)果,通常會呈現(xiàn)出局部最優(yōu)解。基于這種情況,基于劃分的聚類方法在實際應用中往往要求窮舉所有可能的劃分。
2.2 基于密度的聚類方法
基于密度的聚類分析依據(jù)數(shù)據(jù)是否屬于相連的密度域?qū)?shù)據(jù)對象進行歸類。常用的基于密度的聚類算法為DBSCAN。這種聚類方法可以剔除噪聲點,同時可以發(fā)現(xiàn)任意形狀的聚類而不局限于球狀的類[5]。但DBSCAN必須指定鄰域半徑和最少點數(shù)這兩個參數(shù),同時聚類的結(jié)果對這兩個參數(shù)的依賴性很強。
2.3 基于網(wǎng)格的聚類方法
基于網(wǎng)格的聚類方法將空間分成有限數(shù)目的多維網(wǎng)格,利用網(wǎng)格結(jié)構(gòu)實現(xiàn)聚類。如CLIQUE算法和STING算法。CLIQUE算法主要適用于處理高維數(shù)據(jù),同時它綜合了密度算法,可以發(fā)現(xiàn)其中的密集聚類。STING算法是一種將空間劃分成直方形網(wǎng)格單元,不同方形對應不同分辨率,以實現(xiàn)聚類分析的方法[6]。
2.4 基于模型的聚類算法
基于模型的聚類算法是通過尋找數(shù)據(jù)對每個類預先設(shè)置好的模型的最佳擬合而實現(xiàn)的。最典型的基于模型的聚類算法是COBWEB算法。COBWEB算法不需要用戶提供參數(shù),可以自動劃分簇的數(shù)目[7]。
2.5 基于層次的聚類算法
基于層次的聚類算法對數(shù)據(jù)集按照凝聚或分裂的層次方式進行聚類。凝聚型將每個對象看作一個單獨的類,然后通過合并相近的類實現(xiàn)聚類。分裂型將所有數(shù)據(jù)歸到一個類中,然后通過迭代,分層分裂成小類。常見的基于層次的聚類算法有CURE、ROCK和Chamelemon。Chamelemon算法在合并類的過程中,可以綜合考慮類的內(nèi)在特征、近似度和互連性,可以構(gòu)造任意大小的聚集簇[8]。
2.6 幾種聚類算法比較分析
基于模型的聚類算法要求對象在每個屬性具有獨立的概率分布,但在實際生活中,這種假設(shè)是不存在的。基于網(wǎng)格的聚類算法需要選擇合適大小的單元數(shù)目,基于密度的聚類算法和基于劃分的聚類算法需要用戶設(shè)置一定的參數(shù)來產(chǎn)生可接受的聚類結(jié)果。在基于層次的聚類算法中,執(zhí)行合并或分裂后無法回退修正,其質(zhì)量受到一定的影響,但由于層次聚類算法無需提前知道最終所需的集群數(shù)量,其先驗假設(shè)較少,因此通用性很強。目前,層次聚類算法已廣泛應用于各個領(lǐng)域。
3 護理管理中聚類算法的應用研究(The application of clustering algorithm in Nursing management)
3.1 算法選擇
在護理管理中,聚類可以幫助科研人員從醫(yī)院信息管理系統(tǒng)中區(qū)分患者,聚類分析作為數(shù)據(jù)挖掘的重要分析方法,可以發(fā)現(xiàn)每類患者更深層次的信息,歸納總結(jié)出每類患者的個體特征和臨床檢驗特征,有針對性的為患者提供精準治療,減輕患者心理和財力方面的負擔,縮短就醫(yī)療程,提高患者的生活質(zhì)量。根據(jù)患者個體參數(shù)合理聚類患者往往不同于其他領(lǐng)域聚類分析。首先,患者的個體特征屬性并不滿足獨立的概率分布?;颊吣稠椫笜说钠x往往依賴于其他體征。其次,護理管理初期通過設(shè)置一定的參數(shù)來產(chǎn)生可接受的聚類結(jié)果,需要具備豐富的醫(yī)學經(jīng)驗和較高的計算機理論水平,實際應用中難度很大。再者,患者病情差異較大,選擇合適大小的單元數(shù)目可操作性較低。綜合分析幾種聚類算法,層次聚類算法需要的先驗假設(shè)更少,對患者的聚類集群更科學,更適合當前大數(shù)據(jù)背景下醫(yī)院開展科學、高效的護理管理,因此本文基于凝聚型層次聚類算法探討聚類算法在護理管理中的應用。
3.2 數(shù)據(jù)預處理
護理管理中我們收到的患者數(shù)據(jù)往往具有異構(gòu)性、冗余性、復雜性等特征,在對數(shù)據(jù)進行分析時首先需要進行集成、清理和歸約[9]。
數(shù)據(jù)集成:患者個體數(shù)據(jù)來源主要有幾個方面:(1)醫(yī)學檢驗中心;(2)體檢中心;(3)急診科室;(4)門診科室;(5)住院科室;(6)醫(yī)學影像診斷中心;(7)社區(qū)衛(wèi)生服務(wù)中心;(8)縣級醫(yī)院;(9)??漆t(yī)院。不同的醫(yī)療機構(gòu)對數(shù)據(jù)的存儲格式、方法和實體的命名規(guī)則不同,在數(shù)據(jù)集成過程中需要考慮統(tǒng)一實體、刪除冗余數(shù)據(jù)、處理沖突數(shù)據(jù)等。集成過程中可以考慮可視化分析和相關(guān)性分析等方法實現(xiàn)。
數(shù)據(jù)清理:由于醫(yī)療數(shù)據(jù)的特殊性,臨床檢驗數(shù)據(jù)獲取時間較長,人工填補缺失值困難大,而替代鄰近值處理噪聲數(shù)據(jù)又可能導致分析結(jié)果的不準確性,因此清理數(shù)據(jù)主要通過識別異常值并刪除相應元組的方法實現(xiàn)。
數(shù)據(jù)歸約:隨著大數(shù)據(jù)時代的到來,可獲得的患者個體數(shù)據(jù)越來越多,對患者屬性進行歸約處理可以有效地降低分析的時間復雜度,提高分析質(zhì)量。因此,在分析過程中可以通過屬性約簡等方法歸約處理數(shù)據(jù)。
3.3 基于R語言的層次聚類算法及其在護理管理中的應用
在數(shù)據(jù)預處理的基礎(chǔ)上,將每個患者視為一類,利用歐幾里得距離、曼哈頓距離、切比雪夫距離等方法計算出每類之間的相似度。接著,將相似度最高的合并為一個類,重復計算,直至相似度大于某個終止條件值時結(jié)束聚類。簡言之,層次聚類算法是通過計算每個類中的數(shù)據(jù)點與所有數(shù)據(jù)點之間的距離來確定其相似性,距離越小,相似度越高[10]。在R語言中,具體實現(xiàn)步驟如下:
(1)計算距離矩陣:利用dist()函數(shù)計算患者間的距離矩陣。
d<-dist(x,method=”euclidean”)
其中,x為患者數(shù)據(jù)集,method表示計算距離的方法,常用的方法有euclidean、manhattan、maximum等。方法的選擇可根據(jù)患者具體數(shù)據(jù)而不同。
(2)聚類分析:在距離矩陣的基礎(chǔ)上,使用hclust( )函數(shù)合并聚類簇。
hc<-hclust(d,method=“ward.D2”)
其中,d為患者數(shù)據(jù)的距離矩陣,method表示合并的方法,常用的方法有complete、ward、median、average、centroid等。
(3)剪枝操作:在數(shù)據(jù)分析中,患者數(shù)據(jù)的層次聚類結(jié)果有時很復雜,cutree()函數(shù)可以實現(xiàn)對聚類結(jié)果的剪枝操作,分析時可綜合層次聚類結(jié)果和醫(yī)生數(shù)選擇合適的聚類數(shù)。
clusterCut<-cutree(hc,k)
其中,k為層次聚類結(jié)果的指定聚類數(shù)。最佳聚類數(shù)的選擇是層次聚類剪枝中最復雜的一個問題,可以使用mclust、Nbclust、factoextra等包計算出最優(yōu)聚類數(shù)。
4 護理管理分析(The analysis of Nursing
management)
在實際護理管理中,廣義上講護理管理人員涵蓋的范圍不僅包括醫(yī)院護士、家庭護理人員[11],還包括專家和醫(yī)生。傳統(tǒng)的護理管理中,專家、住院醫(yī)生、護士隨機分配和組合,往往會產(chǎn)生不同的治療效果和醫(yī)療費用。為了改善這一現(xiàn)狀,部分學者開始探討優(yōu)化護理流程、改善護理模式來提高護理質(zhì)量。但這些方法雖然在某種程度上改善了護理質(zhì)量,但護理方法的針對性較差。因此,在護理管理分析中,可以考慮事先仿真不同醫(yī)生對每位患者的治療效果。使用聚類分析方法,將患者進行科學分類,綜合聚類結(jié)果、患者最終的治愈情況和醫(yī)療費用,發(fā)現(xiàn)每類患者的最佳護理者,從而為醫(yī)院開展科學護理管理提供一定的參考依據(jù)。
5 結(jié)論(Conclusion)
隨著“互聯(lián)網(wǎng)+醫(yī)療護理”的發(fā)展,信息化技術(shù)在醫(yī)學中的運用一定會越來越普及,越來越智能。我們探討基于R語言的層次聚類算法在護理中的應用,就是要充分發(fā)揮層次聚類算法的先驗假設(shè)較少的優(yōu)點,可以直接對患者進行科學分類,達到患者與護理資源的最優(yōu)匹配,既有效提高臨床護理效率和效果,又能節(jié)省有限的醫(yī)療人力、物力、財力,最終達到醫(yī)患關(guān)系的和諧融洽,相信隨著互聯(lián)網(wǎng)時代的到來,人工智能、計算機算法必將滲透到醫(yī)療護理的每一個環(huán)節(jié),深入學習探討各種算法在臨床護理實際中的運用,將具有較大的科研和現(xiàn)實意義。
參考文獻(References)
[1] 王有為,吳迪.聚類技術(shù)在醫(yī)學數(shù)據(jù)中的應用[J].河南教育學院學報(自然科學版),2016,2:32-35.
[2] 李雪梅,張素琴.數(shù)據(jù)挖掘中聚類分析技術(shù)的應用[J].武漢大學學報,2009,42(3):396-399.
[3] 陳黎飛,姜青山,王聲瑞.基于層次劃分的最佳聚類數(shù)確定方法[J].軟件學報,2008,19(1):62-72.
[4] Jiawei Han,MichelineKamber.范明,孟小峰,譯.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械工業(yè)出版社,2004:1-262.
[5] 楊海斌.一種新的層次聚類算法的研究與應用[D].蘭州:西北師范大學,2011:8.
[6] 張鑫.層次聚類算法的研究與應用[D].贛州:江西理工大學,2008:19.
[7] 段明秀.層次聚類算法的研究及應用[D].長沙:中南大學,2009:9.
[8] 畢鵬.改進的Chameleon層次聚類算法在目標分群中的應用研究[D].杭州:浙江大學,2009:17.
[9] 尤婷婷.健康大數(shù)據(jù)預處理技術(shù)及其應用[D].成都:電子科技大學,2017:6-16.
[10] 張良均,謝佳標,楊坦等.R語言與數(shù)據(jù)挖掘[M].北京:機械工業(yè)出版社,2017(8):204-206.
[11] Katie M.Dean,Laura A.Hatfield,et al.Preliminary Data on a Care Coordination Program for Home Care Recipients[J].The American Geriatrics Society,2016(64):1900-1903.
作者簡介:
降 惠(1983-),女,碩士,副教授.研究領(lǐng)域:醫(yī)學計算機應用,數(shù)據(jù)挖掘.