国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于人工智能的電子病歷數(shù)據(jù)質量控制

2021-03-26 20:39王志勇
解放軍醫(yī)院管理雜志 2021年2期
關鍵詞:病案結構化病歷

吳 騁,王志勇,徐 蕾,周 全*

(1.海軍軍醫(yī)大學衛(wèi)生勤務學系,上海 200433;2.海軍軍醫(yī)大學第一附屬醫(yī)院,上海 200433;3.海軍第905醫(yī)院財經(jīng)中心,上海 200052)

隨著我國醫(yī)院信息化建設的不斷發(fā)展和完善,醫(yī)療衛(wèi)生數(shù)據(jù)進入大數(shù)據(jù)時代。電子病歷作為醫(yī)療信息的主要載體,在醫(yī)療數(shù)據(jù)中占據(jù)著重要地位。其記錄患者從入院到出院的疾病發(fā)生、發(fā)展和轉歸的全過程,為醫(yī)療管理及臨床研究等提供豐富的信息[1]。2018年,國家衛(wèi)健委發(fā)布《關于進一步推進以電子病歷為核心的醫(yī)療機構信息化建設工作的通知》[2],指出要充分發(fā)揮電子病歷信息化作用,促進醫(yī)療管理水平提高和智慧醫(yī)院發(fā)展,對電子病歷數(shù)據(jù)質量提出更高的要求。而實際工作中,電子病歷數(shù)據(jù)卻因各種原因存在著錯誤、無效、不完整、不一致、異構等問題[3],相應的質量定量評估及治理措施又相對匱乏,嚴重影響其在醫(yī)療管理和臨床科研中的二次利用和有效挖掘。

本研究聯(lián)合人工智能技術(Artificial Intelligence,AI)和統(tǒng)計學方法(statisticalmethods),針對電子病歷中兩種主要的數(shù)據(jù)類型,即結構化數(shù)據(jù)和非結構化數(shù)據(jù),分別探索不同的質控方法和技術,以期為建立符合循證決策或科學研究要求的高質量數(shù)據(jù)庫提供參考。

1 結構化電子病歷數(shù)據(jù)質控方法

結構化數(shù)據(jù)往往在采集時設置一定的質控條件,如病案首頁數(shù)據(jù)、檢查檢驗數(shù)據(jù)等,質量相對較好,可以采用評估數(shù)據(jù)質量、查找定位問題數(shù)據(jù)來進行數(shù)據(jù)清洗的思路,從而獲得可用數(shù)據(jù)。

1.1 多維數(shù)據(jù)質量評估方法針對結構化數(shù)據(jù),筆者已在前期研究中從數(shù)據(jù)的完整性、規(guī)范性、邏輯性及準確性等方面,構建多維數(shù)據(jù)質量評價指標體系[4]。其中,完整性是指關鍵指標的數(shù)據(jù)是否填全,評估內容包括個人信息核心字段缺失情況、首次病程記錄重要字段采集情況等。如果某項必填指標,如性別,未填寫則被認為缺失,數(shù)據(jù)不完整。規(guī)范性是指數(shù)據(jù)是否按規(guī)定的賦值字典填寫,如病案首頁的賦值字典中規(guī)定“入院時情況”為“1.危、2.急、3.一般”,但實際填寫中出現(xiàn)除了1~3以外的阿拉伯數(shù)字,或者其他文字、字符,則為填寫不規(guī)范。邏輯性是指關聯(lián)數(shù)據(jù)間的邏輯關系是否正確,包括邏輯缺失與邏輯錯誤等,如主訴與現(xiàn)病史中對同一癥狀的時間描述不一致。準確性是指數(shù)據(jù)是否真實可靠,需溯源核查,但可通過指標的極端值輔助判斷,例如人口學指標、生活習慣描述等應在合理取值范圍,根據(jù)不同指標的實際意義進行判斷,如身高過高或過低、妊娠年齡過小、日吸煙支數(shù)、日飲酒量過高等均被作為疑似值識別出來,進行后續(xù)核查、清洗。

1.2 數(shù)據(jù)清洗根據(jù)質量評估結果,定位問題數(shù)據(jù)后,可針對不同的數(shù)據(jù)問題制定不同的清洗策略,以控制數(shù)據(jù)質量。如數(shù)據(jù)缺失、異?;蜻壿嬅艿龋刹捎米匀徽Z言處理(Natural Language Processing,NLP)技術,對電子病歷中的醫(yī)療文本數(shù)據(jù)進行語義分析及提取,從中獲取缺失數(shù)據(jù)可能的填補值,核對變量的邏輯性與準確性,并對關鍵變量進行標準化處理,如入院時情況、輸血標志等信息;對無法填補與校正的數(shù)據(jù),予以標記。如果是多次記錄的檢查檢驗縱向數(shù)據(jù)中某次記錄值缺失,也可以根據(jù)缺失機制和比例,采用統(tǒng)計學方法進行填補[5],如多重填補法(Multiple Imputation,MI)。

1.3 應用案例針對結構化數(shù)據(jù)的多維數(shù)據(jù)質量評價方法已用于某三甲醫(yī)院23萬余名出院患者的病案首頁結構化數(shù)據(jù)質量評估,發(fā)現(xiàn)該院病案首頁數(shù)據(jù)的完整性與邏輯性較好,完整率與邏輯吻合率均在99%以上;規(guī)范性有待提高,符合規(guī)范率在86%左右。且通過自動化程序,可準確識別與定位問題數(shù)據(jù),為數(shù)據(jù)清洗奠定基礎。通過這一前期應用,反映出多維數(shù)據(jù)質量評估方法可以快速、高效地發(fā)現(xiàn)病案首頁數(shù)據(jù)的質量問題,便于數(shù)據(jù)質量的定量監(jiān)測[4]。

2 非結構化電子病歷數(shù)據(jù)質控方法

電子病歷中超過80%的數(shù)據(jù)都是非結構化數(shù)據(jù),給數(shù)據(jù)的處理、利用帶來一定障礙。因此,針對這部分數(shù)據(jù),須先通過自然語言處理技術進行后結構化處理,在此基礎上再進行數(shù)據(jù)清洗,控制數(shù)據(jù)質量。

2.1 利用多層級自然語言處理技術進行文本數(shù)據(jù)后結構化自然語言處理是實現(xiàn)電子病歷文本數(shù)據(jù)后結構化的最佳途徑。通過將文本信息進行分詞、整合、提取、標準化等,將其轉化成計算機可理解、分析的信息,實現(xiàn)數(shù)據(jù)的機器可讀性。為得到更加準確、豐富的后結構化數(shù)據(jù)結果,采用一種多層級自然語言處理技術,即根據(jù)不同的文書類型(主訴、現(xiàn)病史等)分別建立符合其內容特點及上下文語義關聯(lián)的數(shù)據(jù)抽取模型,避免數(shù)據(jù)遺漏和信息抽取錯誤。通過對原始數(shù)據(jù)的解析,識別出文本中實體、屬性和關系等信息,最終轉換成極細顆粒度的后結構化數(shù)據(jù)[6]。

2.2 數(shù)據(jù)清洗針對醫(yī)學術語與臨床癥狀表述的多樣性,以及不同信息系統(tǒng)中疾病、指標、治療等術語表達不一致的問題[6],通過分類回歸樹(Classification Regression Tree,CRT)、支持向量機(Support Vector Machine,SVM)等分類算法,以ICD-10、ICD-9-CM3等行業(yè)標準及權威教材用詞為基礎,通過標準化的數(shù)據(jù)清洗流程將日常診療過程中的醫(yī)學自然語言進行規(guī)范化及標準化,完成多樣化數(shù)據(jù)向標準化、規(guī)范化數(shù)據(jù)的轉換,以便對醫(yī)學用語的規(guī)范性進行評價,并對關鍵信息進行匹配、對比、分析。

2.3 數(shù)據(jù)質控系統(tǒng)構建上述步驟在流程上都屬于對已采集數(shù)據(jù)的事后處理,為了在采集源頭進行質量控制,建立內涵質控體系,通過病歷生成過程中對其內容的自動核查與控制,實現(xiàn)在數(shù)據(jù)采集源頭對質量進行把控的目標。主要功能包括醫(yī)療文本結構化、病案質量評價、病案質量分析。

2.3.1 醫(yī)療文本結構化 對電子病歷文本數(shù)據(jù)進行結構化提取,包括有效信息之間的關聯(lián)等。首先,根據(jù)病歷書寫基本規(guī)范和專業(yè)醫(yī)學知識,對病歷各節(jié)點內容進行建模,如“入院記錄-主訴”,模型框架為癥狀、體征、疾病、檢查、手術等。根據(jù)建好的模型,結合自然語言分詞和語義分析技術,完成對病歷文本的后結構化處理[7]。

2.3.2 病案質量評價 針對每份住院病案進行質量評價,詳細報告缺陷內容,幫助醫(yī)務人員快速定位病案書寫錯誤并修正,從而保證病案質控的可追溯性及精細化管理。系統(tǒng)在對病歷文本內容進行后結構化的基礎上,根據(jù)國家統(tǒng)一標準規(guī)范對質控問題進行分類,如病歷是否完整、前后數(shù)據(jù)是否一致、是否依據(jù)患者診治過程書寫等,形成智能質控規(guī)則庫,并通過在醫(yī)生端、環(huán)節(jié)質控及終末質控環(huán)節(jié),設置對病歷文書的自動監(jiān)控、提醒和實時反饋功能,實現(xiàn)對病歷質量的有效監(jiān)控。

2.3.3 病案質量分析 針對科室及全院的病案質量問題,通過橫向、縱向對比分析,以及可視化的統(tǒng)計圖加以展現(xiàn),為病歷質量管理部門提供及時正確的決策依據(jù),輔助其準確定位問題、制定改進措施,提高對病歷質量管理的水平及效力。

2.4 應用案例非結構化電子病歷數(shù)據(jù)質控方法目前正在某三甲醫(yī)院進行測試評價,內容包含入院記錄、出院記錄、病程記錄、手術記錄、護理記錄等。質控前,該院病歷能夠按照時限、頻次、完整度的規(guī)范要求書寫,但存在病歷無內涵、書寫自由、病歷反映患者病情變化、診療過程等核心價值有待提高等問題。而通過前置在病歷書寫界面的自動化質控程序,能夠準確識別雷同病歷、內容前后不符、時間不符合邏輯順序等問題。借助醫(yī)學知識圖譜,根據(jù)病歷所記錄的患者體征、癥狀、檢查、檢驗等文本信息,還可以進一步發(fā)現(xiàn)記錄的體征與診斷有沖突,疾病無對應的檢查結果,疾病對應的診療方案未記錄等問題。測試結果顯示,質控技術的應用可以有效改進常見的病歷質量問題,提升病歷內涵質量;后續(xù)將通過更為豐富的質控規(guī)則設置,擴大病歷內涵質量控制的范圍。

3 展 望

目前,國家正在大力推進醫(yī)療大數(shù)據(jù)的發(fā)展與應用,很多醫(yī)院已將醫(yī)療大數(shù)據(jù)治理及其效果評價作為醫(yī)院建設與發(fā)展的主要工作之一[8-9]。電子病歷數(shù)據(jù)作為醫(yī)療大數(shù)據(jù)的重要組成部分,其建設質量不僅影響到醫(yī)療大數(shù)據(jù)治理的整體效果,還可能影響到醫(yī)療質量管理、開展真實世界醫(yī)學研究的可行性與科學性。缺乏高質量的醫(yī)療數(shù)據(jù),再先進的人工智能和數(shù)據(jù)挖掘算法也會無的放矢。本文提出可用于電子病歷質控的人工智能和統(tǒng)計學聯(lián)合方法與技術,有助于提高電子病歷數(shù)據(jù)質量控制的效率和水平,對于其他醫(yī)療信息數(shù)據(jù)的質控也具有一定參考價值。在“以數(shù)為證、循數(shù)決策”的數(shù)據(jù)文明時代,各級醫(yī)療機構和醫(yī)療管理部門都應建立起有效的數(shù)據(jù)質控體系,開展醫(yī)療數(shù)據(jù)質量評估與治理,方能促進醫(yī)療大數(shù)據(jù)發(fā)揮其應有的價值。

猜你喜歡
病案結構化病歷
基于二維碼的病案示蹤系統(tǒng)開發(fā)與應用
強迫癥病歷簿
促進知識結構化的主題式復習初探
改進的非結構化對等網(wǎng)絡動態(tài)搜索算法
試析病案管理中預防病案錯位發(fā)生的方法
“大數(shù)的認識”的診斷病歷
結構化面試方法在研究生復試中的應用
左顧右盼 瞻前顧后 融會貫通——基于數(shù)學結構化的深度學習
為何要公開全部病歷?
試論病案管理在防范醫(yī)療糾紛中的作用
高安市| 兴城市| 历史| 家居| 泰安市| 包头市| 罗甸县| 肇东市| 祁阳县| 宝应县| 枝江市| 大方县| 吴江市| 临颍县| 六枝特区| 和平区| 杨浦区| 瓦房店市| 鞍山市| 重庆市| 阿克陶县| 祁门县| 西峡县| 鹰潭市| 太保市| 子洲县| 拉孜县| 桃江县| 桐庐县| 澄城县| 临湘市| 抚松县| 福泉市| 罗城| 新泰市| 屏山县| 昂仁县| 永德县| 翼城县| 连山| 同仁县|