王興強 孟 娜*
隨著醫(yī)療信息化技術(shù)的發(fā)展,醫(yī)院信息系統(tǒng)(hospital information system,HIS)中患者診療數(shù)據(jù)的質(zhì)量和完整性越來越重要。患者主索引數(shù)據(jù)的大量冗余,導(dǎo)致以患者主索引數(shù)據(jù)為索引的診療數(shù)據(jù)的低可用性。目前,患者主索引數(shù)據(jù)的管理主要有患者主索引指數(shù)(enterprise master patient index,EMPI)系統(tǒng)[1-4]和醫(yī)院信息集成平臺[5]兩種解決方案,其均為獨立的系統(tǒng),主索引數(shù)據(jù)能夠在HIS、實驗室信息系統(tǒng)(laboratory information system,LIS)以及影像歸檔及傳輸系統(tǒng)(picture archiving and communication systems,PACS)等多系統(tǒng)間交互,但實現(xiàn)復(fù)雜,且成本高。而指紋識別、人臉識別、虹膜識別及靜脈識別等方式均可確定身份的唯一性,可以與患者主索引進行綁定用于識別和支付,但難以對當前大量患者主索引數(shù)據(jù)進行有效管理。為此,本研究提出了一種基于HIS本身的患者主索引數(shù)據(jù)的管理方法。
患者主索引數(shù)據(jù)產(chǎn)生于住院和門診就診兩個環(huán)節(jié)。住院需要登記患者的姓名、性別、出生日期、身份證號、地址、聯(lián)系人及電話等信息,要求信息完整而準確。住院登記患者信息通過患者手工登記或者從門診醫(yī)生站開具的住院單中提取。長期以來門診患者信息登記都是采用手工登記的方式進行登記錄入,其錯誤率和信息不完整率較高,在當前的HIS中已保存了大量的患者主索引數(shù)據(jù)[6-7]。
近年來,隨著信息化技術(shù)的發(fā)展出現(xiàn)了讀取患者身份證、社??般y行卡等身份憑證在自助機或人工窗口辦理的方式,其準確率較高,但重復(fù)登記辦理的情況比較多,尤其是很多醫(yī)院都采用了門診醫(yī)卡通系統(tǒng),患者若將就診卡丟失或遺忘時會重新辦理,從而造成患者信息重復(fù)登記的情況[8-9]。
患者主索引信息中含有身份證號、社??ㄌ柤白o照號等唯一身份識別(identification card,ID)確認其身份,但HIS中存在大量一個ID信息多條主索引的情況;而對于主索引信息中不含有效ID信息的則很難確認其身份的唯一性,尤其是歷史數(shù)據(jù)中的患者主索引信息不完整,直接導(dǎo)致了以不完整主索引數(shù)據(jù)為索引的診療數(shù)據(jù)的低利用率,在很大程度上造成醫(yī)療資源的浪費并延誤患者的診療進程。
患者主索引關(guān)鍵詞數(shù)據(jù)包括姓名、性別、出生日期、民族、身份證號、地址及聯(lián)系人等,按其不同屬性,可分為3類:①具有ID唯一性屬性的身份證號、社??ㄌ柤白o照號等關(guān)鍵詞, 患者主索引數(shù)據(jù)一般來源為住院患者登記或門診患者通過讀取有效身份憑證的方式登記,通過有效的ID可確定患者本人;②具有排他性屬性的性別、民族及姓氏等關(guān)鍵詞,患者信息只會出現(xiàn)信息登記的對或錯,而不會出現(xiàn)相似等不確定的情況;③具有強相似性屬性的名字、出生日期、地址及聯(lián)系人等關(guān)鍵詞,在進行患者信息登記時,患者姓名通過口述或患者手工登記人工錄入時,存在錄入成形似的字或者諧音字等情況,患者出生日期,存在只登記錄入到年份或月份信息的情況,患者聯(lián)系地址登記不全,存在只登記錄入到區(qū)縣,沒有到街道門牌的情況。這些關(guān)鍵詞對于判定多條患者主索引記錄是否屬于同一患者時具有不確定性。
在患者主索引數(shù)據(jù)中,患者ID是確定患者唯一性的標識,多條患者主索引記錄即多個患者ID標識多位患者,但目前大量存在同一患者有多條患者主索引、多個患者ID的情況[10-13]。為解決上述問題,采用一種患者主索引數(shù)據(jù)管理方法,通過創(chuàng)建患者身份主索引表,計算主索引相似度來實現(xiàn)。
患者身份主索引表,是指能夠確立患者身份唯一性的索引表,是患者主索引數(shù)據(jù)的索引表,由身份ID和患者ID為主鍵,從而確定患者身份的唯一性,將患者主索引中的患者ID數(shù)據(jù)存入該表中。通過ID信息查詢該表,可以得出該患者曾經(jīng)使用過的患者ID,從而得出該患者的歷史診療數(shù)據(jù)。ID信息可以是身份證號、社??ㄌ柡妥o照號,也可生成一個系統(tǒng)中唯一序號作為ID信息。
患者主索引相似度計算,是指將當前主索引數(shù)據(jù)中的關(guān)鍵詞數(shù)據(jù)與其他主索引數(shù)據(jù)中的相應(yīng)關(guān)鍵詞數(shù)據(jù)進行相似性計算。第一類具有身份唯一性屬性的關(guān)鍵詞不參與計算,第二類具有排他性屬性的關(guān)鍵詞和第3類具有強相似性屬性的關(guān)鍵詞參與計算。
第二類具有排他性屬性的關(guān)鍵詞wi相似性系數(shù)計算為公式1:
式中Ek,i為第k條主索引數(shù)據(jù)中第二類具有排他性屬性的關(guān)鍵詞wi的相似性系數(shù),w0,i為當前主索引數(shù)據(jù)中的關(guān)鍵詞wi的值,wk,i為第k條主索引數(shù)據(jù)中的關(guān)鍵詞wi的值;i的取值范圍為0<i<m,m為第二類具有排他性屬性的關(guān)鍵詞的數(shù)量(見表1)。
表1 患者排他性關(guān)鍵詞相似性計算
第三類具有強相似性屬性的關(guān)鍵詞wj相似性系數(shù)計算,采用關(guān)鍵詞字符串匹配后長度比加權(quán)的方式,其計算為公式2:
式中Sk,j為第k條主索引數(shù)據(jù)中第三類具有強相似性屬性的關(guān)鍵詞wj的相似性系數(shù),w0,j為當前主索引數(shù)據(jù)中的關(guān)鍵詞wj的值,wk,j為第k條主索引數(shù)據(jù)中的關(guān)鍵詞wj的值,match()為字符串匹配函數(shù),len()為取字符串長度函數(shù),cj為第三類具有強相似性屬性的關(guān)鍵詞wj的加權(quán)系數(shù);j的取值范圍為0<j<n,n為第三類具有強相似性屬性的關(guān)鍵詞的數(shù)量。
當前主索引數(shù)據(jù)與第k條主索引數(shù)據(jù)相似度Vk的計算為公式3:
對患者主索引數(shù)據(jù)進行唯一性管理,需要以患者來院就診為觸發(fā)點,通過患者信息與HIS數(shù)據(jù)庫中患者主索引表的數(shù)據(jù)進行相似性計算實現(xiàn),并經(jīng)患者確認為本人數(shù)據(jù),患者主索引數(shù)據(jù)清洗流程如圖1所示。
圖1 患者主索引數(shù)據(jù)清洗流程圖
患者主索引數(shù)據(jù)的管理步驟為:①患者就診,獲取患者ID;②根據(jù)患者ID,檢索HIS數(shù)據(jù)庫的患者主索引表中當前患者主索引信息,患者ID為患者主索引表中的主鍵,具有唯一性,檢索結(jié)果不為空;③判斷當前患者主索引信息中是否具有唯一ID,如果沒有則跳到步驟“⑦”,否則如果唯一ID不為身份證號則跳到步驟“⑤”,否則如果唯一ID為有效的一代或二代身份證,則跳到步驟“④”進行分析處理;④如當前患者身份證號為15位一代身份證號碼,則轉(zhuǎn)換成18位二代身份證號碼,如當前患者身份證號為18位二代身份證號碼,則轉(zhuǎn)換成15位一代身份證號碼。將患者一、二代身份證號互轉(zhuǎn),便于獲取該患者的歷史主索引信息;⑤按照當前獲取的所有唯一ID檢索患者主索引表中的患者ID;⑥將當前患者唯一ID和檢索的患者ID,添加保存至患者身份主索引表中,該表是能夠確立患者身份唯一性的索引表,是患者主索引數(shù)據(jù)的索引表,主鍵由唯一ID和患者ID共同構(gòu)成主鍵;⑦檢索患者主索引表中的第二類具有排他性屬性的關(guān)鍵詞和第三類具有強相似性屬性的關(guān)鍵詞;⑧根據(jù)相似度計算公式計算當前患者主索引數(shù)據(jù)與其他主索引數(shù)據(jù)相似度V,剔除相似度小于預(yù)定閥值V0的數(shù)據(jù),并按照相似度V由大到小的順序?qū)χ魉饕斜砼判?;⑨就診患者確認排序的主索引列表中本人的信息;⑩將經(jīng)過就診患者確認過的患者ID添加保存至患者身份主索引表中,結(jié)束。患者身份主索引表結(jié)構(gòu)見表2。
表2 患者身份主索引表結(jié)構(gòu)
在HIS中,可根據(jù)患者身份主索引數(shù)據(jù),在門診或住院的醫(yī)生站、護士站或其他程序中,通過患者當前使用的患者ID檢索患者身份主索引表,獲取該患者的唯一身份ID,再通過唯一身份ID檢索獲取該患者所有使用過的患者ID,從而得到該患者任意時間軸上的歷史診療數(shù)據(jù)。
在患者正常就診的過程中,根據(jù)患者當前主索引信息中的關(guān)鍵詞,自動計算并過濾出與患者當前主索引信息高相似度的患者主索引列表,經(jīng)過患者確認保存至患者身份主索引表中,實現(xiàn)患者主索引歷史數(shù)據(jù)的有效管理?;颊呔驮\過程中根據(jù)患者唯一身份ID,可得出該患者曾經(jīng)使用過的患者ID,從而得到該患者的歷史診療數(shù)據(jù),提高患者歷史診療數(shù)據(jù)的可用性,為醫(yī)生提供更加完善的患者歷史診療數(shù)據(jù),提高患者就診效率,縮短患者就診流程。