国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于可得數(shù)據(jù)的乳腺癌患者靜脈血栓栓塞癥風險因素識別及預測模型構(gòu)建

2021-10-12 01:29:06任曉佳劉俊卿耿曉晴劉權(quán)宸張朋柱
關(guān)鍵詞:顯著性乳腺癌量表

任曉佳,劉俊卿,耿曉晴*,劉權(quán)宸,張朋柱

1上海交通大學安泰經(jīng)濟與管理學院,上海 200030;2天津醫(yī)科大學腫瘤醫(yī)院,國家腫瘤臨床醫(yī)學研究中心、天津市腫瘤防治重點實驗室、天津市惡性腫瘤臨床醫(yī)學研究中心,天津 300060

靜脈血栓栓塞癥(venous thromboembolism,VTE)包含深靜脈血栓形成(deep vein thrombosis,DVT)和肺血栓栓塞癥(pulmonary thromboembolism,PTE)兩種類型,是惡性腫瘤的并發(fā)癥之一,也是導致惡性腫瘤患者疾病進展的重要因素。在惡性腫瘤患者中,VTE 發(fā)病率超過1%,并隨腫瘤類型和病程的不同而變化[1-2]。研究表明,乳腺癌患者在確診VTE 后短期死亡率顯著上升[3]。同時,在VTE 患者中,乳腺癌患者占比較大[4]。因此,對乳腺癌患者進行VTE風險預測具有重要意義。

乳腺癌患者是否患VTE 與其個人因素(并發(fā)癥、血栓病史等)、腫瘤相關(guān)因素(大小、分期等)、治療相關(guān)因素(手術(shù)、化療等)、血液指標相關(guān)因素(血小板、白細胞等)及其他生物指標因素(D-二聚體等)有關(guān)[5]?;谶@些可能的風險因素,研究人員開發(fā)了適用于不同情形的VTE風險預測量表,主要包括:Caprini量表[6]、Padua量表[7],Autar量表[8],Wells量表[9]、RAP評分等。已有研究表明,Caprini量表在乳腺癌VTE 患者中的風險預測結(jié)果準確性較低[10-11]。Padua 量表主要適用于內(nèi)科患者的VTE 風險預測,由于其對VTE風險等級的劃分粒度較粗(低危和高危),在乳腺癌患者VTE 風險預測中的作用仍然十分有限。Autar 量表在骨科術(shù)后患者VTE 風險預測中的應(yīng)用效果較好[12],但在乳腺癌患者中的預測效果仍缺乏有效驗證。RAP量表則主要用于創(chuàng)傷患者的VTE風險預測,且需要更多的驗證研究[13]。

綜上,雖然目前研究人員針對不同情形開發(fā)了多類VTE風險預測量表,但這些量表由于缺乏進一步的有效性驗證,對于乳腺癌患者的適用性較低;其次,這些量表都是國外研究人員結(jié)合其國家醫(yī)療衛(wèi)生條件開發(fā)的,是否適用于我國醫(yī)療環(huán)境仍有待驗證;再次,這些量表中的指標繁多,現(xiàn)實情況下難以一次全面掌握,在VTE和非VTE患者中的顯著性更是鮮有學者研究。因此,本文針對現(xiàn)有研究的不足,利用多年積累的可得數(shù)據(jù),分析了現(xiàn)有風險因素在乳腺癌VTE 和乳腺癌非VTE 患者間的顯著性差異,并在此基礎(chǔ)上進一步構(gòu)建了針對乳腺癌患者的VTE風險預測模型。

1 資料和方法

1.1 資料

選取2017—2020 年天津醫(yī)科大學腫瘤醫(yī)院部分住院患者共計548 例,其中包含確診乳腺癌并同時確診VTE的VTE患者274例,確診乳腺癌且未確診VTE的非VTE患者274例。所有患者的數(shù)據(jù)均經(jīng)過脫敏處理。

由于患者每次住院并不一定會檢查所有的相關(guān)檢驗項目,因此,實際情況中想要獲取某一位患者的所有相關(guān)指標幾乎不可能。經(jīng)過前期復雜的數(shù)據(jù)預處理工作,可以提取出以下3個方面共計10個可得指標。包括人口統(tǒng)計學指標:年齡、體重、體重指數(shù)(body mass index,BMI);病史:是否患糖尿病、是否有手術(shù)史;血液指標:D-二聚體水平、脂蛋白、血漿蛋白C活性、血小板計數(shù)、C-反應(yīng)蛋白。其中是否患糖尿病、是否有手術(shù)史為序數(shù)變量,1代表否,2代表是。其余變量為連續(xù)數(shù)值型變量,其值代表該變量的具體數(shù)值。本研究中所用到的數(shù)據(jù)已經(jīng)全部經(jīng)過脫敏處理,形成無法辨認身份的實驗數(shù)據(jù)。同時,本研究對實驗數(shù)據(jù)進行了嚴格保密,不會用于研究外的其他用途。

1.2 方法

閱讀分析現(xiàn)有文獻,總結(jié)出可能影響乳腺癌患者是否患VTE的指標集合,并與目前醫(yī)院信息系統(tǒng)中的可得指標取并集,得到10個相關(guān)風險指標。采用SPSS 19.0 統(tǒng)計軟件進行數(shù)據(jù)分析。描述性統(tǒng)計分析給出樣本的中位數(shù)(四分位數(shù))[M(P25,P75)]、正常值區(qū)間。采用非參數(shù)檢驗(曼-惠特尼U檢驗)探索乳腺癌VTE 患者和非VTE 患者在各指標方面是否有顯著性差異,P<0.05 為差異具有統(tǒng)計學意義。采用Logistic回歸方法,以548例樣本中的500例作為訓練集,構(gòu)建乳腺癌患者VTE風險預測模型,并用剩余的48 例樣本組成的測試集測試模型的預測能力。同時,結(jié)合曼-惠特尼U檢驗得到的指標顯著性結(jié)果進行校驗和討論。

2 結(jié)果

2.1 乳腺癌患者VTE風險因素識別

對現(xiàn)有可得指標中可能的VTE 風險因素進行識別,探索乳腺癌VTE患者與非VTE患者在這10個指標方面是否具有顯著性差異,從而為進一步的預測模型構(gòu)建提供依據(jù)。首先,對10個指標中的連續(xù)數(shù)值型指標進行正態(tài)性檢驗,結(jié)果顯示被檢驗指標均不服從正態(tài)分布,不滿足參數(shù)檢驗的條件,也不宜采用均值、方差等描述。因此,從中位數(shù)(四分位數(shù))、正常值區(qū)間兩個角度描述各指標(表1)。采用同時適用于非正態(tài)分布變量及二分類變量的非參數(shù)檢驗(曼-惠特尼U檢驗)方法比較各指標在VTE患者與非VTE 患者間是否具有顯著性差異。將各指標按照正常值百分比由低到高排序,依次為:BMI(46.72%)、脂蛋白(54.56%)、D-二聚體水平(62.59%)、血小板計數(shù)(88.32%)、血漿蛋白C 活性(93.25%)、C-反應(yīng)蛋白(95.44%)。VTE 組及非VTE組各指標比較見表2。體重、是否有手術(shù)史、D-二聚體水平、脂蛋白、血漿蛋白C 活性、C-反應(yīng)蛋白指標在VTE 和非VTE 患者間差異有統(tǒng)計學意義(P<0.05,表2)。

表1 各指標描述性統(tǒng)計結(jié)果及正常值區(qū)間(n=548)

表2 兩組各指標非參數(shù)檢驗(曼-惠特尼U檢驗)結(jié)果

2.2 乳腺癌患者VTE風險預測模型構(gòu)建

基于提取出的10 個可得指標,利用Logistic 回歸構(gòu)建VTE風險預測模型。一方面,利用模型擬合系數(shù)的顯著性檢驗進一步驗證上述關(guān)于乳腺癌患者VTE 風險因素識別結(jié)果,另一方面,也可以利用Logistic 回歸模型良好的預測功能來對乳腺癌患者罹患VTE的風險進行預測,從而更好地協(xié)助醫(yī)生從乳腺癌患者中盡快識別潛在的VTE風險個體,完善患者的診治過程。

采用SPSS 19.0 統(tǒng)計軟件對500 個樣本組成的訓練集數(shù)據(jù)進行Logistic回歸分析,并選擇前向逐步回歸進行變量篩選。表3 顯示了Baseline 模型的預測結(jié)果。Baseline 擬合的是不包含任何自變量只有常數(shù)項的無效模型。在Baseline 模型中,總預測準確率為50.6%。

表3 Baseline模型預測結(jié)果 (n=500)

表4顯示了尚未納入模型方程的變量及其比分檢驗結(jié)果,所做的檢驗是分別將這些變量納入方程,檢驗方程的改變是否有統(tǒng)計學意義。在P<0.001的顯著性水平下,此檢驗結(jié)果有5個變量是顯著的。說明將是否有手術(shù)史、D-二聚體水平、脂蛋白、血漿蛋白C活性、C-反應(yīng)蛋白這5個變量分別納入方程,方程的改變是有統(tǒng)計學意義的,且總的統(tǒng)計量也有統(tǒng)計學意義。

表4 尚未納入模型方程的變量及其比分檢驗結(jié)果(n=500)

逐步向前回歸法是從表4中P值最小的變量開始,逐個將其納入模型,以模型的極大似然函數(shù)值最大為目標,以最后一步的入選變量作為最終結(jié)果。利用前向逐步回歸進行變量篩選,得到最終的回歸模型。其中,最終模型的H-L 檢驗P=0.192>0.05,反映出該模型的擬合結(jié)果較為理想(表5)。

表5 Logistic回歸結(jié)果 (n=500)

將48 個樣本組成的測試集數(shù)據(jù)代入擬合得到的最終模型中去,衡量模型的預測能力。當計算所得概率大于或等于0.5 時,即預測該患者患有VTE,否則預測該患者未患VTE。模型的預測結(jié)果如表6所示。在該測試集中,模型的預測結(jié)果較好,總準確率為72.92%,靈敏度為70.37%,特異度為76.20%。最后,再采用k 折交叉驗證的方式,取k=10,可以得到十折交叉驗證的平均準確率為75.36%,說明模型在現(xiàn)有數(shù)據(jù)集上的穩(wěn)健性較好,泛化能力較強。

表6 Logistic模型預測結(jié)果 (n=48)

3 討論

本研究中樣本年齡最小28 歲,最大為84 歲。因此,所選取的研究樣本年齡范圍分布較廣且主要人群為中年人(第一四分位數(shù)=49.00)。同時,根據(jù)WHO對于BMI的劃分標準,18.5~<25.0 kg/m2為正常范圍,BMI≥25 kg/m2為超重。由于BMI的第一四分位數(shù)為22.89 kg/m2,中位數(shù)為25.26 kg/m2,所以超過一半的樣本偏重。

非參數(shù)檢驗結(jié)果可以看出,就人口統(tǒng)計學指標來說,乳腺癌VTE 患者與非VTE 患者在年齡、BMI這兩個變量上的差異均不顯著,在體重上有顯著性差異。已有相關(guān)研究證明年齡、BMI 是晚期乳腺癌患者化療后發(fā)生DVT 的危險因素[14-15],而本文分析結(jié)果顯示VTE 患者和非VTE 患者在這些指標間并無差異。究其原因,可能是由于本研究的樣本選擇偏差造成的:雖然所選取的研究樣本年齡范圍分布較廣,但主要人群仍以中年人為主,這就使得VTE組和非VTE組間的年齡差距不大,從而導致分析結(jié)果不顯著。而從BMI 的中位數(shù)可以看出,樣本人群普遍偏重,因此,BMI的分析結(jié)果也不顯著。就病史相關(guān)指標來說,本文只統(tǒng)計了是否患糖尿病、是否有手術(shù)史這兩個指標。其中是否患糖尿病這一指標在兩組間并無顯著性差異,而是否有手術(shù)史在VTE 組和非VTE 組間具有顯著性差異。乳腺癌VTE患者與非VTE患者在血液指標方面(血小板計數(shù)除外)的差異均有統(tǒng)計學意義(P<0.001),與已有研究的部分結(jié)果一致[11,16]。這一方面說明血液檢驗非常重要,想要區(qū)別VTE 患者和非VTE 患者,最好的方式就是查看患者VTE 相關(guān)血液指標是否正常。另一方面也說明血小板計數(shù)在區(qū)別VTE 和非VTE 患者中的作用不大,可以不用作為風險預測模型的主要風險因素。

Logistic 回歸模型最終篩選出的危險因素有5 個。其中,變量系數(shù)的顯著性結(jié)果檢驗值小于0.05 說明對應(yīng)自變量的系數(shù)具有統(tǒng)計意義,對因變量(是否患有VTE)不同分類水平的變化有顯著影響。需要注意的是,雖然是否有手術(shù)史這一變量的系數(shù)檢驗結(jié)果并不顯著,但它仍然被納入了最終的回歸模型中,說明該變量對于模型的極大似然函數(shù)值有貢獻,對提升模型整體的預測精度有影響,因此仍然應(yīng)該被考慮作為風險因素之一被納入到預測模型中去。

本文基于可得數(shù)據(jù)對于乳腺癌患者可能的VTE風險因素進行了識別,并利用Logistic回歸構(gòu)建了乳腺癌患者VTE風險預測模型。研究結(jié)果表明,是否有手術(shù)史、D-二聚體水平、脂蛋白、血漿蛋白C活性、C-反應(yīng)蛋白是乳腺癌患者發(fā)生VTE的重要風險因素,基于這些風險因素構(gòu)建Logistic 回歸模型,十折交叉驗證的平均預測準確率為75.36%。本文的優(yōu)點主要有:①切合實際情況。本文所用研究數(shù)據(jù)所涵蓋的指標均為醫(yī)院中檢測的常用指標,檢測患者量較多,相比其他量表較易于得到,因而模型適用范圍較廣。②更好地適用于住院患者。雖然VTE 患者在年齡、BMI 等特征上與大眾群體有較大差異(VTE 患者多為中老年、體重較重人群),但醫(yī)院住院患者本身即存在年齡較大、較重等特征,因此不應(yīng)將年齡、BMI 等特征作為醫(yī)院內(nèi)VTE 風險預測的重要依據(jù),這與本文提出的模型結(jié)論一致。③預測模型的效果較好。本文認為乳腺癌患者發(fā)生VTE 的重要風險因素有手術(shù)史和相關(guān)血液指標等,這與主流研究的觀點相一致,而且模型預測準確率較高,對輔助臨床醫(yī)生診斷等有積極作用。

猜你喜歡
顯著性乳腺癌量表
絕經(jīng)了,是否就離乳腺癌越來越遠呢?
中老年保健(2022年6期)2022-08-19 01:41:48
乳腺癌是吃出來的嗎
基于顯著性權(quán)重融合的圖像拼接算法
電子制作(2019年24期)2019-02-23 13:22:26
胸大更容易得乳腺癌嗎
基于視覺顯著性的視頻差錯掩蓋算法
別逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
一種基于顯著性邊緣的運動模糊圖像復原方法
論商標固有顯著性的認定
三種抑郁量表應(yīng)用于精神分裂癥后抑郁的分析
初中生積極心理品質(zhì)量表的編制
心理學探新(2015年4期)2015-12-10 12:54:02
灵宝市| 牙克石市| 广河县| 华蓥市| 巫山县| 涪陵区| 保山市| 加查县| 红安县| 安图县| 石嘴山市| 清水县| 德阳市| 襄城县| 九龙县| 准格尔旗| 壤塘县| 札达县| 嘉义县| 四平市| 龙岩市| 龙南县| 虹口区| 黑山县| 花垣县| 平原县| 栾川县| 文化| 禄丰县| 凭祥市| 广丰县| 高阳县| 南宁市| 青田县| 比如县| 保康县| 红桥区| 会昌县| 辰溪县| 泸州市| 丹巴县|