【摘要】目的探討腹腔鏡膽囊切除手術(shù)的效費比,并通過聚類分析及人工智能機器學(xué)習(xí)方法構(gòu)建預(yù)測模型。方法回顧性分析中山市人民醫(yī)院腹腔鏡膽囊切除術(shù)206例患者的臨床資料。將患者住院總費用、總住院時間、住院至手術(shù)時間、術(shù)后住院時間、術(shù)前止痛藥物應(yīng)用次數(shù)、術(shù)后止痛藥物應(yīng)用次數(shù)等維度作為效費比指標(biāo)進行聚類分析分類指標(biāo),分為三類,效費比優(yōu)、中、差;以CT炎癥情況、CT病灶情況、CT病灶部位、病理診斷、CA19-9、AFP、術(shù)前血糖、ALB、AST、ALT、PLT、HBG、RBC、WBC、CT距手術(shù)時間、傷口疼痛程度、手術(shù)時間、術(shù)前血壓、CT病灶大小、住院至手術(shù)時間、術(shù)前禁食時間等指標(biāo)作為變量,進行多分類logistic回歸分析及機器學(xué)習(xí)進行預(yù)測模型構(gòu)建,包括邏輯回歸、線性支持向量機、支持向量機、決策樹、隨機森林、K近鄰等分類器進行模型擬合。結(jié)果多分類logistic回歸分析顯示模型擬合卡方值為156.986,P<0.001,似然比ALB、WBC、CT距手術(shù)時間、住院至手術(shù)時間、高血壓、腎臟疾病、手術(shù)人員差異有統(tǒng)計學(xué)意義,P值分別為0.001、0.019、0.029、<0.001、0.005、0.027、<0.001,模型擬合分類總符合率為74.8%(即準(zhǔn)確率為0.748)。多層感知機模型K折驗證評分0.461,預(yù)測評分0.802;邏輯回歸模型K折驗證評分0.437,預(yù)測評分0.726;支持向量機模型K折驗證評分0.529,預(yù)測評分0.755;決策樹模型K折驗證評分0.462,預(yù)測評分0.585;隨機森林模型K折驗證評分0.529,預(yù)測評分0.726;K近鄰模型K折驗證評分0.388,預(yù)測評分0.623。結(jié)論分析腹腔鏡膽囊切除手術(shù)效費比中,機器學(xué)習(xí)建模可有效預(yù)測效費比指標(biāo),可用于術(shù)前評估,按效費比優(yōu)化醫(yī)療資源分配。
【關(guān)鍵詞】腹腔鏡膽囊切除手術(shù);效費比;聚類分析;人工智能;機器學(xué)習(xí)
中圖分類號:R657.4文獻標(biāo)志碼:ADOI:10.3969/j.issn.1003-1383.2024.08.009
Clustering analysis of cost-effectiveness ratio and construction of AI machine
learning predictive model for laparoscopic cholecystectomy
MA Yuai, ZHAO Jinyan, GONG Xueyi
(Department of General Surgery One, Zhongshan People's Hospital, Zhongshan 528403, Guangdong, China)
【Abstract】ObjectiveTo investigate the cost-effectiveness ratio (CER) of laparoscopic cholecystectomy and construct predictive model using clustering analysis and AI machine learning method. MethodsA retrospective analysis was conducted on clinical data from 206 patients who underwent laparoscopic cholecystectomy in Zhongshan People's Hospital. Total hospitalization cost, total hospitalization time, time from admission to surgery, postoperative hospitalization time, preoperative analgesic application frequency, and postoperative analgesic application frequency were served as cost-effectiveness ratio indicators, which were divided into three categories: excellent cost-effectiveness ratio, moderate cost-effectiveness ratio, and poor cost-effectiveness ratio. Variables such as CT inflammation, CT lesion condition, CT lesion location, pathological diagnosis, CA19-9, AFP, preoperative blood glucose, ALB, AST, ALT, PLT, HBG, RBC, WBC, time from CT to surgery, wound pain severity, surgery duration, preoperative blood pressure, CT lesion size, time from admission to surgery, and preoperative fasting time were used for multi-class logistic regression analysis and machine learning model construction. Models were fitted by classifiers included logistic regression, linear SVM, SVM, decision tree, random forest, and K-nearest neighbors. ResultsMulti-class logistic regression analysis showed that the fitted chi-square value of the model was 156.986, P<0.001. The likelihood ratios of ALB, WBC, CT to surgery time, hospitalization to surgery time, hypertension, kidney disease, and surgical personnel were statistically significant, and P values were 0.001, 0.019, 0.029, <0.001, 0.005, 0.027, <0.001, respectively. The overall conformity rate of the model fitting classification was 74.8% (i.e., the accuracy rate was 0.748). The K-fold validation score of multi-layer perceptron model was 0.461, and prediction score was 0.802; the K-fold validation score of logistic regression model was 0.437, and prediction score was 0.726; the K-fold validation score of the SVM model was 0.529, and prediction score was 0.755; the K-fold validation score of decision tree model was 0.462, and prediction score was 0.585; the K-fold validation score of random forest model was 0.529, and prediction score was 0.726; the K-fold validation score of K-nearest neighbors model was 0.388, and prediction score was 0.623. ConclusionMachine learning modeling can effectively predict cost-effectiveness indicators in the analysis of the cost-effectiveness ratio of laparoscopic cholecystectomy surgery, which can be used for preoperative evaluation and optimization of medical resource allocation based on cost-effectiveness ratio.
【Keywords】laparoscopic cholecystectomy; cost-effectiveness ratio(CER); clustering analysis; artificial intelligence; machine learning
本研究以“腹腔鏡膽囊切除效費比聚類分析及其機器學(xué)習(xí)預(yù)測模型構(gòu)建”為主題,致力于探討腹腔鏡膽囊切除手術(shù)的效費比,并通過聚類分析及機器學(xué)習(xí)方法構(gòu)建預(yù)測模型。目前,醫(yī)學(xué)研究中廣泛采用邏輯回歸作為一種統(tǒng)計模型,以觀察不同的臨床效果。應(yīng)用線性預(yù)測將臨床事件劃分為并發(fā)癥發(fā)生或不發(fā)生,腫瘤為良性還是惡性,患者治療結(jié)局是生存還是死亡[1]。而實際臨床工作中,某些指標(biāo)不能通過單一指標(biāo)進行衡量,如效費比、生活質(zhì)量等。而聚類分析是非監(jiān)督學(xué)習(xí)中的一種重要技術(shù),用于發(fā)現(xiàn)數(shù)據(jù)中的隱藏結(jié)構(gòu)和模式,而無需先驗知識或標(biāo)簽。在醫(yī)學(xué)方面,聚類分析可以將相似對象放入不同類別或子集,由此同一子集具有相似性質(zhì)[2]。腹腔鏡下膽囊切除術(shù)作為已在各層級醫(yī)院廣泛開展的手術(shù)方式,相關(guān)手術(shù)技術(shù)及難度、并發(fā)癥相關(guān)因素均有研究[3-5],而隨著該手術(shù)方式逐步開展日間手術(shù),有必要對實施該手術(shù)患者進行術(shù)前分類,對不宜行日間手術(shù)患者進行判別,以提高運轉(zhuǎn)效率,同時確保手術(shù)安全。而本研究從效費比角度對該手術(shù)進行研究,通過效費比分析為判別患者是否適合行日間手術(shù)提供參考。效費比在不同疾病治療過程中的衡量維度不同及關(guān)注點不同存在不同衡量標(biāo)準(zhǔn),有基于國家GDP投入及實際消耗作為衡量指標(biāo)[6],也有基于手術(shù)后費用、術(shù)者情況相關(guān)指標(biāo)作為衡量指標(biāo)等[1]。而本研究原本想直接以住院費用作為效費比最直接指標(biāo)進行切入,但考慮到疾病診療過程不能以住院費用進行簡單界定,且針對住院過程進行相關(guān)研究的文章較為少見,其中單一指標(biāo)較難全面反映患者在住院過程中的效費比,故選取患者更易于直接感受的客觀性指標(biāo),如住院總費用、總住院時間、住院至手術(shù)時間、手術(shù)時間、術(shù)后住院時間、術(shù)前止痛藥物應(yīng)用次數(shù)、術(shù)后止痛藥物應(yīng)用次數(shù)等多維度數(shù)據(jù)對手術(shù)效果進行聚類分析,效費比根據(jù)其聚類中心分為三類,即優(yōu)(效費比優(yōu)組)、中(效費比中組)、差(效費比差組),并通過人工智能機器學(xué)習(xí)方法構(gòu)建預(yù)測模型。機器學(xué)習(xí)預(yù)測模型的構(gòu)建有望為未來手術(shù)的規(guī)劃和成本控制提供有效的參考,推動醫(yī)療服務(wù)向更智能、精準(zhǔn)的方向發(fā)展。目前為止尚未見相關(guān)聚類分析加機器學(xué)習(xí)分類模型研究的報道。
ecbba68e54a51157580dfdb3dedbf344b00b327b8e2069f772b1a16394ad574a1資料與方法
1.1一般資料收集2018年7月至12月在廣東省中山市人民醫(yī)院行單純腹腔鏡下膽囊切除術(shù)患者284例。納入標(biāo)準(zhǔn):膽囊結(jié)石、膽囊息肉、膽囊腺肌癥、未進行其他手術(shù)操作的膽囊癌患者;排除標(biāo)準(zhǔn):本次入院合并其他手術(shù)治療、數(shù)據(jù)缺失、未進行術(shù)前CT檢查患者。按照上述標(biāo)準(zhǔn)篩選后總共206例患者的臨床資料納入研究,男93例,平均年齡52.5歲,女113例,平均年齡54.0歲。疾病類型:膽囊結(jié)石190例,膽囊息肉15例,膽囊癌1例。
1.2分組方法按照術(shù)后止痛藥物應(yīng)用次數(shù)等可反映住院效費比及患者直觀感受指標(biāo)作為聚類分析變量,進行效費比分類,通過SPSS及Vscode python開發(fā)平臺編程應(yīng)用KMeans方式進行聚類分析。
1.3引入相關(guān)自變量包括CT炎癥情況、CT病灶情況、CT病灶部位、病理診斷、CA19-9、AFP、術(shù)前血糖、ALB、AST、ALT、PLT、HBG、RBC、WBC、CT距手術(shù)時間、傷口疼痛程度、手術(shù)時間、術(shù)前血壓、CT病灶大小、住院至手術(shù)時間、術(shù)前禁食時間等指標(biāo)。
1.4研究方法
1.4.1機器學(xué)習(xí)簡介醫(yī)學(xué)臨床預(yù)測中的機器學(xué)習(xí)應(yīng)用范圍廣泛,包括疾病診斷、治療方案選擇、預(yù)后評估等多個方面[7-12]。在疾病診斷方面,機器學(xué)習(xí)模型可以利用醫(yī)學(xué)影像、生理指標(biāo)、基因組數(shù)據(jù)等多種醫(yī)學(xué)數(shù)據(jù)輔助醫(yī)生進行疾病的診斷。例如,卷積神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)模型可以識別和分類X射線、MRI、CT等影像,幫助醫(yī)生發(fā)現(xiàn)病變。在治療方案選擇方面,機器學(xué)習(xí)可以根據(jù)患者的個體特征、疾病特征以及治療效果數(shù)據(jù),為醫(yī)生提供個性化的治療方案建議。例如,基于患者的基因組數(shù)據(jù)和臨床特征,機器學(xué)習(xí)可以預(yù)測不同藥物對患者的治療反應(yīng),指導(dǎo)臨床用藥。在預(yù)后評估方面,機器學(xué)習(xí)可以利用患者的臨床數(shù)據(jù)預(yù)測疾病的發(fā)展趨勢和預(yù)后情況。例如,通過分析患者的臨床指標(biāo)、生理參數(shù)以及治療方案,機器學(xué)習(xí)可以預(yù)測患者的生存率、復(fù)發(fā)率等。在風(fēng)險評估方面,機器學(xué)習(xí)可以幫助醫(yī)生評估患者的風(fēng)險,包括手術(shù)風(fēng)險、藥物副作用風(fēng)險等。例如,在手術(shù)前根據(jù)患者的臨床數(shù)據(jù)和手術(shù)史,機器學(xué)習(xí)可以預(yù)測手術(shù)的并發(fā)癥風(fēng)險,幫助醫(yī)生制訂更安全的手術(shù)方案。在疾病預(yù)測方面,機器學(xué)習(xí)可以利用大規(guī)模的臨床數(shù)據(jù)發(fā)現(xiàn)潛在的疾病預(yù)測因子,并預(yù)測個體患病的風(fēng)險。例如,通過分析患者的生活方式、遺傳因素等,機器學(xué)習(xí)可以預(yù)測患者患某種疾病的可能性。機器學(xué)習(xí)在醫(yī)學(xué)臨床預(yù)測中具有廣泛的應(yīng)用前景,可以為醫(yī)生提供更準(zhǔn)確、個性化的診斷、治療和預(yù)后評估方案,有助于提高醫(yī)療水平和患者的治療效果。
1.4.2模型簡介建模方面采用了六種常見的分類器,簡介如下:(1)多層感知機(MLP)。多層感知機是一種人工神經(jīng)網(wǎng)絡(luò),由多個神經(jīng)元層組成,包括輸入層、隱藏層和輸出層。通過前向傳播和反向傳播算法進行訓(xùn)練,可解決復(fù)雜的非線性分類問題。(2)邏輯回歸(logistic regression)。邏輯回歸是一種線性分類模型,用于解決二分類問題。通過logistic函數(shù)將線性模型的輸出映射到[0,1]區(qū)間,表示樣本屬于某一類的概率。(3)支持向量機(support vector machine,SVM)。支持向量機是一種監(jiān)督學(xué)習(xí)算法,用于解決二分類和多分類問題。通過構(gòu)建最大間隔超平面來實現(xiàn)分類,引入核函數(shù)可處理非線性可分問題。(4)決策樹(decision tree)。決策樹是一種基于樹結(jié)構(gòu)的分類模型,通過一系列的決策節(jié)點將數(shù)據(jù)劃分到不同的類別,易于理解和解釋。(5)隨機森林(random forest)。隨機森林是一種集成學(xué)習(xí)算法,通過組合多個決策樹提高分類性能。在每棵決策樹的訓(xùn)練過程中引入隨機性,減少過擬合。(6)K近鄰 (K-nearest neighbors)。K近鄰是一種基于實例的學(xué)習(xí)算法,通過測量不同樣本之間的距離進行分類,簡單直觀但對數(shù)據(jù)特征的縮放敏感。
由于本研究例數(shù)有限,且分類后各類別存在不平衡情況,故數(shù)據(jù)建模時整合了SMOTE數(shù)據(jù)增強并進行了類別平衡。SMOTE數(shù)據(jù)增強的基本思想是在少數(shù)類樣本之間進行插值,生成新的合成樣本。具體步驟如下:對于每個少數(shù)類樣本,計算其與最近鄰的K個少數(shù)類樣本之間的距離。從K個最近鄰中隨機選擇一個樣本,并計算其與原始樣本之間的差值。將差值乘以隨機數(shù),然后加到原始樣本上,生成新的合成樣本。通過這種方式,SMOTE可以在特征空間中插值生成新的合成樣本,使得新樣本在少數(shù)類樣本之間平均分布。這有助于增加少數(shù)類樣本的多樣性,減少分類器對多數(shù)類樣本的過擬合。SMOTE的一些變體還包括Borderline-SMOTE和ADASYN(adaptive synthetic sampling)等,它們在選擇合成樣本和生成策略上略有不同,但基本原理相似??偟膩碚f,SMOTE是一種有效的數(shù)據(jù)增強技術(shù),能夠提高在類別不平衡問題下分類器的性能和泛化能力。在實際應(yīng)用中,需要根據(jù)具體情況選擇合適的參數(shù)和變體,以達(dá)到最佳的性能提升效果。因此本研究采取SMOTE數(shù)據(jù)增強及加入數(shù)據(jù)平衡后再進入模型進行訓(xùn)練。
本研究嘗試引入上述機器學(xué)習(xí)模型整合SMOTE數(shù)據(jù)增強及加入數(shù)據(jù)平衡對上述分類情況患者效費比進行預(yù)判,模型驗證應(yīng)用了K折驗證,K折交叉驗證(K-fold cross-validation)是一種常用的模型評估技術(shù),用于評估機器學(xué)習(xí)模型的性能和泛化能力。它通過將數(shù)據(jù)集劃分為K個大小相等的子集,然后進行K次模型訓(xùn)練和評估,每次使用其中一個子集作為驗證集,其余K-1個子集作為訓(xùn)練集,直到每個子集都被用作驗證集,并且每次訓(xùn)練和評估都使用了所有的數(shù)據(jù),保證了模型的有效性。
1.5統(tǒng)計學(xué)方法根據(jù)聚類分析最終將住院患者分為三類,并以此分類作為因變量進行SPSS多分類logistic回歸分析及人工智能機器學(xué)習(xí),包括邏輯回歸、線性支持向量機、非線性支持向量機、決策樹、隨機森林、K近鄰等分類器進行模型擬合。預(yù)測效能驗證應(yīng)用K折交叉驗證,并應(yīng)用混淆矩陣及ROC曲線進行說明。
2結(jié)果
2.1聚類分析本研究同時應(yīng)用SPSS及Vscode python開發(fā)界面兩種平臺以Kmeans法進行聚類分析,結(jié)果見表1。而選擇三類是根據(jù)多次擬合后,該分組最適合分類進行下一步統(tǒng)計學(xué)分析,根據(jù)其聚類中心該三類簡稱為優(yōu)(效費比優(yōu)組)、中(效費比中組)、差(效費比差組)。
2.2SPSS的多分類logistic回歸分析根據(jù)上述分類,將分類作為因變量,將CT炎癥情況、CT病灶情況、CT病灶部位、病理診斷、CA19-9、AFP、術(shù)前血糖、ALB、AST、ALT、PLT、HBG、RBC、WBC、CT距手術(shù)時間、傷口疼痛程度、手術(shù)時間、術(shù)前血壓、CT病灶大小、住院至手術(shù)時間、術(shù)前禁食時間等指標(biāo)作為自變量進行模型擬合。有效建模后預(yù)測效能進入表2與各機器學(xué)習(xí)模型對比。
F1分?jǐn)?shù)是分類模型性能的一個衡量指標(biāo),特別適用于類別不平衡的問題。它是精確率(precision)和召回率(recall)的調(diào)和平均數(shù)。Kappa值是用于衡量分類模型與隨機分類結(jié)果的一致性的統(tǒng)計量。它考慮了分類結(jié)果中的偶然一致性。當(dāng)我們對正類(例如欺詐檢測中的欺詐交易)的精確預(yù)測和召回同樣重要時,F(xiàn)1分?jǐn)?shù)是一個理想的指標(biāo)。Kappa值更適合在考慮類別頻率的情況下,評價分類模型的表現(xiàn),尤其是當(dāng)我們想要考慮偶然一致性時。本研究模型F1、Kappa值結(jié)果MLP為0.791、0.705;邏輯回歸為0.724、0.590;支持向量機為0.750、0.633;K近鄰為0.600、0.434;決策樹為0.590、0.379;隨機森林為0.728、0.590。其中MLP模型性能最佳。如表2所示。根據(jù)目前模型驗證結(jié)果,驗證得分并不高,估計與模型例數(shù)有關(guān),可進一步增加例數(shù)驗證。
2.3人工智能機器學(xué)習(xí)分類器模型擬合由于本研究例數(shù)有限,且分類后各類別存在不平衡情況,故分析時采用SMOTE數(shù)據(jù)增強并進行了類別平衡,并應(yīng)用混淆矩陣及ROC曲線進行說明。多層感知機模型訓(xùn)練評分1.0,預(yù)測評分0.802;邏輯回歸模型訓(xùn)練評分0.824,預(yù)測評分0.726;支持向量機模型訓(xùn)練評分0.951,預(yù)測評分0.755;決策樹模型訓(xùn)練評分1.0,預(yù)測評分0.585;隨機森林模型訓(xùn)練評分1.0,預(yù)測評分0.726;K近鄰模型訓(xùn)練評分0.788,預(yù)測評分0.623。而各模型對3分類預(yù)測準(zhǔn)確率AUC如表3所示。對比SPSS的多分類logistic回歸分析及人工智能機器學(xué)習(xí)分類器模型擬合?;煜仃嚺cROC曲線如表3、圖1,分別列舉了各模型混淆矩陣及ROC曲線情況。
2.4人工智能機器學(xué)習(xí)模型效能驗證本文對各模型進行了K折交叉驗證,使用 5 折交叉驗證,結(jié)果如下:(1)MLP(支持向量機)模型交叉驗證得分分別為0.5952381、0.51219512、0.56097561、0.41463415、0.2195122,平均得分為0.46051103368176544。(2)邏輯回歸交叉驗證得分分別為0.5、0.56097561、0.51219512、0.3902439、0.2195122,平均得分為0.4365853658536586。(3)支持向量機交叉驗證得分分別為0.61904762、0.56097561、0.51219512、0.51219512、0.43902439,平均得分為0.5286875725900116。(4)決策樹交叉驗證得分分別為0.4047619、0.3902439、0.41463415、0.3902439、0.34146341,平均得分為0.3882694541231127。(5)隨機森林交叉驗證得分分別為0.38095238、0.46341463、0.48780488、0.48780488、0.48780488,平均得分為0.46155632984901274。(6)K近鄰交叉驗證得分分別為0.57142857、0.53658537、0.63414634、0.46341463、0.43902439,平均得分為0.5289198606271777。
3討論
在以往各類研究中效費比作為討論結(jié)果時,因其涉及評價指標(biāo)如疾病、操作、手術(shù)或預(yù)后等情況不同,其評價方法各異。如OTIEKU等[1]對30天內(nèi)急性術(shù)區(qū)切口感染監(jiān)測效費比研究中,研究者采用可避免術(shù)區(qū)切口相關(guān)性并發(fā)癥風(fēng)險、患者費用及術(shù)者情況作為效費比相關(guān)衡量指標(biāo);而CHOI等[2]對手術(shù)治療特定年齡組連枷胸肋骨骨折患者進行了國家范圍內(nèi)的效費比分析,其主要應(yīng)用決策分析Markov模型(包含生命周期及美國人口等作為輸入指標(biāo))、質(zhì)量生命調(diào)整年限(quality-adjusted life years,QALYs)、花費、增量效費比進行分析;GEHRMAN等[6]在腹腔鏡及開放手術(shù)治療結(jié)直腸癌效費比分析中,應(yīng)用臨床效果、資源使用、單位花費及國家醫(yī)保覆蓋等作為效費比指標(biāo)進行分析。根據(jù)上述列舉可見不同項目的效費比分析,采用不同指標(biāo)進行具體分析。而本研究中膽囊切除手術(shù)疾病90%基本為良性疾病,且術(shù)后基本不影響日常生活,無法進行質(zhì)量生命調(diào)整年限統(tǒng)計,因為是單中心,大規(guī)模研究數(shù)據(jù)收集較困難。本研究以住院總費用、總住院時間、住院至手術(shù)時間、手術(shù)時間、術(shù)后住院時間、術(shù)前止痛藥物次數(shù)維度為效費比指標(biāo),原因如下:首先考慮效費比等模糊概念難以應(yīng)用單一指標(biāo)進行界定,其次從不同疾病就診情況不同角度考慮側(cè)重點不同(如醫(yī)院方面主要考慮總費用、病人周轉(zhuǎn)時間等運營指標(biāo),而患者滿意度方面除上述指標(biāo)外則會考慮術(shù)后自身感受情況,如:術(shù)后疼痛程度、術(shù)前檢查等待時間等)。因此,本研究只是提出上述方法以期更加有效地對界定相對困難的指標(biāo)進行有效量化分析。
本研究通過對206例患者的回顧性分析,我們采用了多層次的聚類分析,將患者分為三類,以探究不同效費比情況下的患者特征及臨床指標(biāo)。效費比在不同疾病治療過程中的衡量維度不同及關(guān)注點不同存在不同衡量標(biāo)準(zhǔn),前文有提到基于國家GDP投入及實際消耗作為衡量指標(biāo)[6],也有基于手術(shù)后費用、術(shù)者情況相關(guān)指標(biāo)作為衡量指標(biāo)[1]等不同情況。本文原本可直接以住院費用為效費比的最直接指標(biāo)進行切入,但考慮到疾病診療過程不能以住院費用進行簡單界定。且針對患者住院過程中效費比進行相關(guān)研究的文章較少,其中單一指標(biāo)較難全面反映患者在住院過程中的效費比,故選取患者更易于直接感受的客觀性指標(biāo)如總費用、總住院時間、住院至手術(shù)時間、術(shù)后住院時間、術(shù)前止痛藥物次數(shù)為效費比指標(biāo)。根據(jù)分類結(jié)果,大致可理解為費用由低到高,住院時間由短到長等以聚類分析進行較為客觀的分類,避免人為劃線導(dǎo)致主觀性因素影響。在引入相關(guān)自變量的過程中,我們綜合考慮了多項指標(biāo),包括CT炎癥情況、CT病灶情況、病理診斷等,以建立更全面的模型。通過多分類logistic回歸分析,我們發(fā)現(xiàn)模型擬合卡方值為156.986,P<0.001,其中ALB、WBC、CT距手術(shù)時間、住院至手術(shù)時間、高血壓、手術(shù)人員等指標(biāo)在模型中具有顯著性差異。模型的分類總符合率達(dá)到了74.8%,顯示了該方法在分類分析上的一定效果,同類研究[3-5,13]也可見,但應(yīng)用方法為常規(guī)方法,本文嘗試性機器學(xué)習(xí)進行擬合并進行了對比。
我們進一步采用了多種機器學(xué)習(xí)分類器進行模型擬合,包括MLP(多層感知機)、邏輯回歸、支持向量機、決策樹、隨機森林、K近鄰等。結(jié)果顯示,機器學(xué)習(xí)模型的擬合評分在預(yù)測各分類準(zhǔn)確性普遍高于傳統(tǒng)的SPSS多分類logistic回歸分析,其中SVM模型表現(xiàn)最佳,其預(yù)測分類準(zhǔn)確率(優(yōu)為0.860,中為0.920,差為1.0)明顯高于SPSS的多分類logistic回歸(優(yōu)為0.863,中0.615,差0.542)。根據(jù)上述結(jié)果SPSS對模型擬合結(jié)果總準(zhǔn)確率為74.8%,而機器學(xué)習(xí)采用的六種模型中,MLP、支持向量機模型擬合準(zhǔn)確度高于SPSS的多分類logistic回歸分析,而其余四種模型雖然準(zhǔn)確率低于多分類logistic回歸分析,但其對各類別預(yù)測效果可見,六種模型在效能差、效率中兩類預(yù)測效果均優(yōu)于SPSS的多分類logistic回歸分析。而比較兩種統(tǒng)計方法,SPSS的多分類logistic回歸分析預(yù)測包含了整個數(shù)據(jù)集,而不同于機器學(xué)習(xí)單獨分配測試組進行預(yù)測準(zhǔn)確率驗證,故機器學(xué)習(xí)在預(yù)測方面更加嚴(yán)謹(jǐn),因此從上述結(jié)果足以說明機器學(xué)習(xí)的模型擬合及預(yù)測均優(yōu)于傳統(tǒng)方法。其中MLP總體準(zhǔn)確率最佳,而SVM各分類預(yù)測準(zhǔn)確率最佳。這表明機器學(xué)習(xí)方法在預(yù)測模型構(gòu)建上具有較高的準(zhǔn)確性和可靠性。在此基礎(chǔ)上,本研究加入了K折驗證,并將K次評估指標(biāo)的平均值作為模型的性能評估結(jié)果。由此保證了建模有效性。結(jié)果顯示,機器學(xué)習(xí)模型對效能中和差組敏感度、特異度、AUC預(yù)測效果優(yōu)于傳統(tǒng)logistic回歸,而正是對中、差組預(yù)測準(zhǔn)確率較高有助于降低臨床風(fēng)險;但限于研究樣本量,目前尚缺乏其他醫(yī)院數(shù)據(jù)進行進一步驗證。
對比傳統(tǒng)SPSS分析與機器學(xué)習(xí)方法,機器學(xué)習(xí)方法采用了更全面的指標(biāo),并取得了更好的擬合效果。機器學(xué)習(xí)的優(yōu)越性在于其能夠處理多變量關(guān)系,更好地捕捉潛在的復(fù)雜模式??傮w而言,本研究采用的效費比聚類分析及機器學(xué)習(xí)方法在腹腔鏡膽囊切除手術(shù)中展現(xiàn)了潛在的應(yīng)用前景。通過深入挖掘患者數(shù)據(jù),我們能夠更好地理解手術(shù)效費比的差異,并建立可靠的預(yù)測模型,為臨床決策提供科學(xué)依據(jù)。機器學(xué)習(xí)方法的引入為未來醫(yī)療決策提供了更為智能、精準(zhǔn)的工具,推動著醫(yī)療服務(wù)向著更加科技化和個性化的方向發(fā)展。參考文獻[1] OTIEKU E, FENNY A P,ASANTE F A, et al. Cost-effectiveness analysis of an active 30-day surgical site infection surveillance at a tertiary hospital in Ghana:evidence from HAI-Ghana study[J]. BMJ Open,2022,12(1):e057468.
[2] CHOI J, MULANEY B, LAOHAVINIJ W, et al. Nationwide cost-effectiveness analysis of surgical stabilization of rib fractures by flail chest status and age groups[J]. J Trauma Acute Care Surg,2021,90(3):451-458.
[3] 崔洪濤,孫紅梅,趙洪強,等.急性結(jié)石性膽囊炎腹腔鏡膽囊切除術(shù)術(shù)前評分模型的建立[J].腹腔鏡外科雜志,2017,22(5):340-344.
[4] 張輝,李軍.腹腔鏡膽囊切除術(shù)難易度相關(guān)因素分析及其評分標(biāo)準(zhǔn)的初探[J].中國普通外科雜志,2011,20(8):793-796.
[5] 金鑫,馮利,趙國海,等.腹腔鏡膽囊切除術(shù)并發(fā)癥發(fā)生率及其影響因素[J].中國普通外科雜志,2013,22(8):1053-1056.
[6] GEHRMAN J, ANGENETE E, BJRHOLT I, et al. Cost-effectiveness analysis of laparoscopic and open surgery in routine Swedish care for colorectal cancer[J]. Surg Endosc,2020,34(10):4403-4412.
[7] HU Y Q, GONG X J, SHU L Q, et al. Understanding risk factors for postoperative mortality in neonates based on explainable machine learning technology[J]. J Pediatr Surg,2021,56(12):2165-2171.
[8] MONSALVE-TORRA A, RUIZ-FERNANDEZ D,MARIN-ALONSO O, et al. Using machine learning methods for predicting inhospital mortality in patients undergoing open repair of abdominal aortic aneurysm[J]. J Biomed Inform,2016,62:195-201.
[9] MEYER A, ZVERINSKI D, PFAHRINGER B, et al. Machine learning for real-time prediction of complications in critical care: a retrospective study[J]. Lancet Respir Med,2018,6(12):905-914.
[10] LI Y, CHEN M, LV H C, et al. A novel machine-learning algorithm for predicting mortality risk after hip fracture surgery[J]. Injury,2021,52(6):1487-1493.
[11] HERNANDEZ-SUAREZ D F, RANKA S, KIM Y, et al. Machine-learning-based in-hospital mortality prediction for transcatheter mitral valve repair in the United States[J]. Cardiovasc Revascularization Med,2021,22:22-28.
[12] COOPER J N, MINNECI P C, DEANS K J. Postoperative neonatal mortality prediction using superlearning[J]. J Surg Res,2018,221:311-319.
[13] 曹葆強,李敏,胡金龍,等.困難膽囊切除術(shù)對患者術(shù)中和術(shù)后并發(fā)癥的影響及其風(fēng)險預(yù)測模型的建立[J].天津醫(yī)藥,2020,48(10):974-978.
(收稿日期:2024-03-13修回日期:2024-07-10)
(編輯:潘明志)