□ 顏勇卿 YAN Yong-qing 徐軍 XU Jun 魯秀明 LU Xiu-ming
Objective To study the outpatient visit time and its influencing factors by the method of data science, and to explore the ways to improve the efficiency of outpatient visits. Methods All the records of outpatient services in 2019 in a tertiary specialized hospital were analyzed by python under Anaconda 1.9.7. p< 0.05 was considered statistically significant, and scikit-learn 0.22.1 was used for machine learning. Results The volume change among different periods within a day were statistically significant, but not among days within a week or months within a year. The time spent by the patients for outpatient visit did not change significantly in the above three time ranges. The time spent by the patients for outpatient visit was affected by several factors, including age (0.169), outpatient volume of the day (0.140),number of visits in the past year (0.127), and periods of visit (0.124). Conclusion The time spent for outpatient visit is affected by several factors. The efficiency of outpatient visits can be improved by optimizing the procedures of outpatient visits based on data science in the absence of large investment.
就診時間是影響門診服務滿意度的重要因素,是醫(yī)療機構整體管理水平、醫(yī)療質量及服務質量的重要體現(xiàn)[1],以往針對患者就診時間的研究多用隨機抽樣方法,醫(yī)院信息化發(fā)展之后,也有學者利用醫(yī)院信息平臺數(shù)據(jù)進行分析。隨著以大數(shù)據(jù)為代表的數(shù)據(jù)科學興起,各種方法及分析框架不斷涌現(xiàn),使對門診大數(shù)據(jù)的分析成為可能[2-3]。本研究選取某婦兒三甲醫(yī)院2019年全年的數(shù)據(jù),利用數(shù)據(jù)科學軟件和方法分析患者就診時間分布和影響因素,探索門診管理及流程進一步優(yōu)化的措施。
1.研究對象。以該院2019年全年門診兒童和成人患者為研究對象,數(shù)據(jù)來源為醫(yī)院信息化平臺數(shù)據(jù)庫,以數(shù)據(jù)庫中記錄的各時間節(jié)點作為時間序列(在各時間節(jié)點的耗時分析中去除需要預約且預約時間超過1天的特殊化驗和檢查,其余分析包括全部可用數(shù)據(jù)),因患者離院時間難以明確,研究中以患者單次就診的首次時間節(jié)點和末次時間節(jié)點差值(文中簡述為“整體時間”)間接反映單次就診總耗時。
2.研究方法。數(shù)據(jù)處理在Anaconda1.9.7下進行(編譯器python3.76;虛擬環(huán)境conda 4.83;開發(fā)環(huán)境Jupyter Notebook 6.03,數(shù)據(jù)清洗pandas1.02、numpy1.18.1;統(tǒng)計計算statsmodels0.11、scipy1.4.1;可視化Seaborn0.1,pyecharts1.71;機器學習scikit—learn0.22.1),以p<0.05作為具有統(tǒng)計學意義。
1.數(shù)據(jù)情況。共獲得原始數(shù)據(jù)2645915條,經過去重、去空得到有效數(shù)據(jù)2640200條,時間跨度從2019年1月1日—12月31日,其中小兒急診744865人次,小兒門診892386人次,成人急診75353人次,成人門診927596人次,所有門診記錄中提前預約的853830人次。
2.年齡分布。如圖1所示,小兒門急診患者在嬰兒期的最多,其次在幼兒期有較低的高峰,而成人門急診主要集中在育齡女性,成人急診在20歲以下有一高峰。
圖1 門診患者年齡分布
3.年齡組與疾病的關系。小兒按新生兒、嬰兒、幼兒、學齡前、青春期等分組,成人按年段分組,如圖2?;鶊D顯示各年齡段排名前五的疾病譜,各年齡組主要疾病組成各不相同。
圖2 門診不同年齡組患者前五種疾病
4.時間序列分析
4.1 就診人數(shù)時間序列分析
4.1.1 一年內各月份就診人數(shù)。1月、12月和7月患者人數(shù)最多,整體各月份患者數(shù)量變化不大(圓形分布[4],Rayleigh法,下同,Z=0.313,p=0.151,差異無統(tǒng)計學意義)。
4.1.2 一周內患者人數(shù)變化。以周日和周一略多于其他時間,差異無統(tǒng)計學意義(Z=0.371,p=0.224)。
4.1.3 一天內各時間段患者就診人數(shù)。如圖3所示,小兒急診明顯多于成人急診,且在9∶00~9∶59和19∶00~19∶59時間段呈雙峰分布,最低點位于23∶00~23∶59時間段,成人急診基本在7∶00~19∶59時間段內呈均勻分布。門診患者亦呈雙峰分布,上午就診患者高峰位于8∶00~8∶59和 9∶00~9∶59兩個時間段,下午高峰位于13∶00~13∶59和14∶00~14∶59兩個時間段,但是明顯低于上午,各時間段間差異有統(tǒng)計學意義(Z=0.271,p=0.048)。
圖3 門診一天內不同時間段就診人數(shù)變化
4.2 患者就診整體耗時的時間序列分析。常規(guī)的均值統(tǒng)計計算在樣本量大于5000時,輕微差異即能使p值小于0.01[5],本研究不同時間組間均存在統(tǒng)計學差異,且p<0.001。
4.2.1 一天內各時間段患者就診消耗的整體時間變化。如圖4所示,門診患者11∶00~11∶59時間段消耗的時間最長,下午逐漸下降。急診小兒凌晨2∶00~2∶59時間段是消耗時間的最高峰,次高峰也在11∶00~11∶59時間段,成人患者與小兒類似,但在8∶00~8∶59時間段有一高峰期。
圖4 患者一天內不同時段門診耗時
4.2.2 一周內各日患者就診消耗的整體時間變化。門診相對于急診變化較小,門急診均為周末消耗的整體時間較長。
4.2.3 年內每月就診整體時間變化。如圖5,門診就診整體時間變化較急診明顯平緩,小兒急診變化較為明顯,尤其冬季,整體時間明顯上升。
圖5 患者不同月份門診就診耗時
5.門診就診耗時的影響因素
5.1 從就診耗時的整體來看(圖6),耗時最短的是取藥等候時間,門急診和成人兒科普遍較好,最長的是兒科急診的從取號到繳費以及整體就診時間。
圖6 患者門急診各時間段耗時
5.2 不同患者特點的對比。門診與急診、成人與小兒、是否預約、醫(yī)保與自費間各消耗時間除成人與小兒門診“繳費到化驗”外,差異均有統(tǒng)計學意義。
5.3 患者年齡與消耗時間的相關性。成人組和小兒組相關性均存在,p<0.001,但相關程度較低(成人組各消耗時間r在-0.091~-0.020之間,小兒組r在-0.029~-0.009之間,spearman相關性)。
5.4 患者既往1年內就診次數(shù)與消耗時間的相關性。成人組和小兒組相關性均存在,p<0.001,成人組各消耗時間r在-0.129~-0.001之間,小兒組r在-0.023~0.020之間。
5.5 當天就診人數(shù)與消耗時間的相關性。成人組和小兒組相關性均存在,且呈正相關,p<0.001,成人組各消耗時間r在0.024~0.046之間,小兒組r在0.029~0.147之間。
6.監(jiān)督學習。利用機器學習的方法,對所有因素納入回歸的范圍,以“整體時間”為因變量(采取隨機森林的方法[6],測試集劃分0.3,隨機樹數(shù)量200,開啟袋外評估,有放回的采樣,內部節(jié)點分裂的最小樣本數(shù)2,葉節(jié)點最小樣本數(shù)1,不確定性計算采取基尼指數(shù)),模型擬合之后預測準確率僅為8.3%,納入模型的患者特點指標及其重要性指數(shù)分別為年齡(0.169)、當天就診人數(shù)(0.140)、既往一年就診次數(shù)(0.127)和就診時刻(0.124)。
數(shù)據(jù)科學是采用各種科學方法、處理過程、計算算法、系統(tǒng)體系從各種數(shù)據(jù)中提取和發(fā)現(xiàn)知識的一門交叉學科,通過研究不同數(shù)據(jù)類型、狀態(tài)和屬性及其變化規(guī)律揭示自然界和人類行為等現(xiàn)象背后的規(guī)律。數(shù)據(jù)科學采用了數(shù)學、統(tǒng)計學、信息科學和計算機科學等多個學科的技術和原理,去分析和理解數(shù)據(jù)中的實際現(xiàn)象[7]。數(shù)據(jù)科學的發(fā)展給處理大型的臨床數(shù)據(jù)帶來了極大的便利,避免了調查問卷等方法抽樣過程中產生的誤差[8-9]。國內的研究多側重于管理上的探討[10-12],實際應用的較少,本研究利用python語言對2019年全部數(shù)據(jù)進行大數(shù)據(jù)分析。
有學者通過大樣本的調研證實,門診患者在不同類型的醫(yī)院中候診時間與總體滿意度均呈負相關,候診時間越長,滿意度越低[13-14]。網(wǎng)絡化的預約掛號是近幾年興起的解決候診時間問題的重要測試,預約掛號最大限度地節(jié)省了患者時間[15],而就診過程中的輔助檢查預約等多種人性化服務,又有效縮短了患者就診間非醫(yī)等候時間[16]。但是在實際運行中,許多患者仍然把預約掛號停留在“掛上號”的階段,而并未按照預約的時間就診,通過圓形分布法計算得出一天內不同時間段患者就診人數(shù)仍存在集中的趨勢。
從兒科專業(yè)特點講,患兒語言表達能力弱,有的甚至沒有表達能力,病史采集困難,查體化驗等不配合[17],均可能造成門診耗時增加,但是本研究結果中雖然急診兒科耗時明顯高于成人,門診甚至低于成人,考慮其原因可能是兒科呼吸道疾病在冬季常聚集性的高發(fā),而這部分患者常在兒科急診就診,而對于門診的兒科患者,常由多名家屬陪同,便于分工合作,反而節(jié)省了時間,這也從一個側面反映除了疾病本身的原因外,門診流程等管理上的提高也能大量節(jié)省就診時間。
患者在門診消耗的時間受多種因素的影響,盡管采用了監(jiān)督學習建模回歸,但是預測成功率仍然較低,從研究結果得到比較重要的影響因素主要有4個:年齡、當天就診人數(shù)、既往一年就診次數(shù)、就診時刻,提示在流程方面改進可以從這幾個方面入手?;颊吣挲g與就診耗時呈較低程度的負相關,結合圖2考慮疾病譜在不同年齡的分布是其可能的原因,老年患者常為腫瘤等慢性疾病復查,流程熟悉,就診時間短,而在小兒,越小的小兒越不容易配合,年輕的成人患者耗時反而高于老年患者,這部分患者對手機微信等接受能力更強,通過手機等對就診流程作出進一步詳細的指導可能會有助于減少耗時。既往一年就診次數(shù)提示了患者對就診流程各科室地理位置的熟悉程度,提示在地理位置標識上可能仍然存在漏洞,今后可通過向患者進行問卷調查,網(wǎng)絡收集意見等等方法進一步了解哪些醫(yī)院設施的位置標識存在問題。結合對患者人數(shù)和就診耗時的時間序列分析,當天就診人數(shù)和就診時刻反映患者就診時仍有明顯集中的趨勢,除了加大宣教力度,指導患者按照預約單約定時間就診外,適當根據(jù)人流量的變化調整醫(yī)院分診臺、抽血窗口等的人手能減少患者等候時間,要更準確的預測人流變化和人手調配,TensorFlow等分布式深度學習框架可能提供更大的幫助[18-19]。