仲建平, 王正兵, 張強(qiáng), 黃曉
(1.揚(yáng)州大學(xué)附屬醫(yī)院胃腸外科, 江蘇 揚(yáng)州 225012;2. 揚(yáng)州大學(xué)醫(yī)學(xué)院, 江蘇 揚(yáng)州 225009)
結(jié)直腸癌是世界上第三大常見(jiàn)惡性腫瘤, 其死亡率居于世界第二, 其中直腸癌約占所有結(jié)直腸惡性腫瘤的40%。近年直腸癌總發(fā)病率正在下降[1], 但與此同時(shí)年輕人群的直腸癌發(fā)病率卻不成比例地增加了[2,3], 目前直腸癌已經(jīng)成為年輕患者中最常見(jiàn)的結(jié)直腸惡性腫瘤[4]。研究顯示直腸癌患者總體生存正在改善, 但對(duì)年輕患者而言并非如此;自1970以來(lái), 年輕患者的直腸癌死亡率隨著時(shí)間的推移而持續(xù)增加[5,6]。由于這個(gè)患者群體呈現(xiàn)出病理分化等級(jí)差, 淋巴結(jié)轉(zhuǎn)移率高及總體分期相對(duì)比較晚等特點(diǎn), 因此這一人群的生存特點(diǎn)也與其他人群存在較大的不同, 有必要對(duì)這一人群?jiǎn)为?dú)分析其生存特點(diǎn)。并且相較于老年人群, 年輕人群一旦確診, 往往面臨著更長(zhǎng)的壽命損失, 對(duì)社會(huì)及經(jīng)濟(jì)方面造成更嚴(yán)重的影響[7,8]。因此, 為了進(jìn)一步探求這一人群的生存特征, 及早對(duì)高危人群進(jìn)行干預(yù), 我們使用SEER數(shù)據(jù)庫(kù)回顧性分析早發(fā)性直腸癌患者生存特征并構(gòu)建死亡風(fēng)險(xiǎn)預(yù)測(cè)模型。
選取SEER數(shù)據(jù)庫(kù)2010-2017年確診為直腸癌的患者共計(jì)24954例。提取變量包括年齡、性別、種族、確診年份、腫瘤原發(fā)部位、分化程度、病理類型、TNM分期、腫瘤大小、檢出淋巴結(jié)數(shù)(examined lymph node, ELN)、陽(yáng)性淋巴結(jié)數(shù)(positive lymph node, PLN)、腫瘤沉積、周圍神經(jīng)侵犯( peripheral nerve invasion, PNI)、婚姻狀況生存時(shí)間及生存狀態(tài)。
納入標(biāo)準(zhǔn):①診斷時(shí)間是2010-2017年;②病理確診為直腸腺癌, 并且為第一原發(fā)癌;③臨床資料完整;④確診時(shí)年齡在20~50歲。排除標(biāo)準(zhǔn):①患者預(yù)后資料不完整;②臨床資料不完整;③患者在一個(gè)月內(nèi)死亡;④排除多原發(fā)癌;⑤非腫瘤因素死亡。
在種族中, 美洲印第安人/阿拉斯加土著或亞洲/太平洋島民歸為其他人種。TNM分期使用AJCC第七版TNM分期;根據(jù)X-tile軟件選取LNR及腫瘤大小的最佳截?cái)嘀缔D(zhuǎn)化為分類變量。本研究是在簽署SEER數(shù)據(jù)使用協(xié)議的基礎(chǔ)上開(kāi)展。因SEER數(shù)據(jù)庫(kù)的數(shù)據(jù)均為匿名且消除過(guò)識(shí)別信息, 本研究不需要倫理委員會(huì)的批準(zhǔn)。
使用R語(yǔ)言工具提取人群基線數(shù)據(jù), 對(duì)變量進(jìn)行Cox單因素分析, 將單因素分析中有統(tǒng)計(jì)學(xué)意義的因素納入多因素Cox回歸分析, 確定早發(fā)性直腸癌預(yù)后的獨(dú)立影響因素。對(duì)變量進(jìn)行l(wèi)asso回歸, 壓縮變量個(gè)數(shù)構(gòu)建出精簡(jiǎn)的直腸癌列線圖預(yù)測(cè)模型。計(jì)算列線圖對(duì)應(yīng)的C指數(shù);計(jì)算每個(gè)病例的死亡風(fēng)險(xiǎn)評(píng)分, 繪制列線圖預(yù)測(cè)模型ROC曲線及校準(zhǔn)曲線評(píng)價(jià)其區(qū)分度、準(zhǔn)確度。所有統(tǒng)計(jì)分析采用R軟件4.1.3版本。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
(1)通過(guò)逐步篩選后納入(2010~2017年)4754例早發(fā)性直腸癌病人, 根據(jù)X-tile軟件選取腫瘤大小最佳截?cái)嘀禐椤?.5cm、>5.5cm;LNR最佳截?cái)嘀禐椤?.07、0.07~0.36、>0.36。患者的基本特征見(jiàn)表1。
(2)使用Cox單因素回歸進(jìn)行分析, 年齡、性別、種族、分化程度、病理類型、TNM分期、腫瘤沉積、PNI、CEA、腫瘤大小、淋巴結(jié)采集數(shù)、LNR、化療、婚姻狀態(tài)是早發(fā)性直腸癌患者死亡相關(guān)因素(表1);將單因素分析中有統(tǒng)計(jì)學(xué)意義的變量納入多因素分析, 多因素Cox逐步回歸分析顯示, 性別、分化程度、病理類型、TNM分期、腫瘤沉積、PNI、C E A、化療、腫瘤大小、淋巴結(jié)采集數(shù)、LNR、婚姻狀態(tài)是早發(fā)性直腸癌患者獨(dú)立危險(xiǎn)因素(表2)。
表2 COX多因素分析
(3)構(gòu)建早發(fā)性直腸癌患者腫瘤相關(guān)死亡風(fēng)險(xiǎn)列線圖:整合多因素分析結(jié)果中早發(fā)性直腸癌死亡風(fēng)險(xiǎn)因素, 由于變量數(shù)量較多, 使用lasso回歸壓縮變量數(shù)目, 經(jīng)壓縮后剩余變量為:分化程度、病理類型、T分期、M分期、LNR、腫瘤沉積、PNI。將壓縮后的變量整合, 構(gòu)建早發(fā)性直腸癌患者1, 3, 5年腫瘤相關(guān)死亡風(fēng)險(xiǎn)預(yù)測(cè)列線圖(圖1)。列線圖顯示, T分期對(duì)早發(fā)性直腸癌病人死亡風(fēng)險(xiǎn)影響最大, 其次是M分期、病理分化程度、LNR、病理類型、PNI, 影響最小的是腫瘤沉積。
圖1
計(jì)算模型的C指數(shù), 該列線圖的C指數(shù)為0.7 97(95%CI:0.7 83~0.811)。使用患者一年生存率R O C曲線下面積的0.83(95%CI:0.87-0.78), 三年生存ROC曲線下面積:0.84(95%CI:0.85-0.82), 五年生存:0.83(95%CI:0.84-0.81)。(圖2)表明良好的區(qū)分能力。校正曲線顯示預(yù)測(cè)模型具有良好的準(zhǔn)確性(圖3)。
圖2
圖3
結(jié)直腸癌是20-49歲人群的第二大發(fā)病癌癥和癌癥死亡原因, 近年來(lái)年輕人結(jié)直腸癌的發(fā)病率和死亡率在增加[9]。其中主要表現(xiàn)為直腸癌的增加[10], 相比之下結(jié)腸癌升高的比例卻并不明顯。近年來(lái)相關(guān)研究揭示了早發(fā)性直腸癌的多種危險(xiǎn)因素:全球飲食西化、紅肉消費(fèi)增加、應(yīng)激、抗生素、合成食用色素、久坐行為和腸道微生物群。然而, EORC發(fā)病率呈上升趨勢(shì)的根本原因仍然未知。這表明早發(fā)性直腸癌在發(fā)生發(fā)展上有其特殊之處。結(jié)腸和直腸除了在胚胎、解剖和生理上的差異外, 結(jié)腸癌和直腸癌在致癌方面似乎也不同。已有研究發(fā)現(xiàn)結(jié)腸癌和直腸癌之間存在不同的基因表達(dá)差異[11]。正因?yàn)榻Y(jié)腸癌與直腸癌諸多的不同之處, 因此我們并未像之前的研究將結(jié)直腸癌合并分析, 而是單獨(dú)分析早發(fā)性直腸癌這一特殊患者群體。EORC的癥狀出現(xiàn)晚, 容易出現(xiàn)診斷延誤, 腫瘤惡性程度高、分期晚、可切除性差及術(shù)后遠(yuǎn)處復(fù)發(fā)風(fēng)險(xiǎn)高, 病理類型中, 黏液腺癌和印戒細(xì)胞腺癌等惡性程度類型占比明顯增加, 印戒細(xì)胞癌占比可達(dá) 3%-13%[12]。
近年來(lái)直腸癌患者的治療在包括病理檢查、影像技術(shù)、新輔助治療和外科手術(shù)的進(jìn)步和標(biāo)準(zhǔn)化, 以及多學(xué)科決策的常規(guī)實(shí)施方法, 患者的生活質(zhì)量和長(zhǎng)期生存有了較大的提升。以往的關(guān)于早發(fā)性直腸癌預(yù)后的相關(guān)回顧性研究中已經(jīng)不太適用于如今患者生存預(yù)測(cè)。并且隨著腫瘤沉積與神經(jīng)脈管浸潤(rùn)等對(duì)患者生存影響的揭示, seer數(shù)據(jù)庫(kù)中也著手收錄了更多的臨床項(xiàng)目, 我們能夠獲得更多方面的資料內(nèi)容用于研究。在我們的研究中除了納入臨床病理等基本特征外, 還納入腫瘤沉積、PNI等變量, 并明確了它們?cè)贓ORC患者長(zhǎng)期生存中的獨(dú)立預(yù)測(cè)價(jià)值, 與以往的研究相比內(nèi)容更加豐富。在逐步多因素Cox回歸分析中, 性別、分化程度、病理類型、TNM分期、腫瘤沉積、PNI、CEA、化療、腫瘤大小、淋巴結(jié)采集數(shù)、LNR、婚姻狀態(tài)是早發(fā)性直腸癌患者獨(dú)立預(yù)后因素。在目前的國(guó)際指南中, 建議在結(jié)直腸癌切除術(shù)中淋巴結(jié)采集數(shù)為12枚或更高。較低的淋巴結(jié)采集數(shù)(小于12)與直腸癌預(yù)后意義存在爭(zhēng)議[13], 我們的研究顯示淋巴結(jié)采集數(shù)獨(dú)立地影響患者的預(yù)后, 這需要更多的臨床研究來(lái)闡明。
列線圖在一定程度上可以反映出患者的長(zhǎng)期生存情況, 為了使得列線圖更加簡(jiǎn)潔, 利于使用, 我們使用lasso回歸對(duì)變量進(jìn)行壓縮, 摒棄了一些對(duì)患者生存影響較小的變量, 剩余的變量為:分化程度、病理類型、T分期、M分期、LNR、腫瘤沉積、PNI, 將壓縮后的變量整合后構(gòu)建列線圖。使用ROC評(píng)估模型, 顯示構(gòu)建的列線圖模型具有良好的預(yù)測(cè)性能。列線圖顯示T分期對(duì)早發(fā)性直腸癌病人死亡風(fēng)險(xiǎn)影響最大, 其次是M分期、分化程度、LNR、病理類型、PNI, 影響最小的是腫瘤沉積。列線圖肯定了TNM分期在患者生存分析中的“基石”作用, 也反映出遠(yuǎn)處轉(zhuǎn)移是直腸癌治療失敗、患者長(zhǎng)期生存威脅的主要原因。輔助化療通常用于遠(yuǎn)處轉(zhuǎn)移的控制, 尤其是應(yīng)用于局部晚期直腸癌的治療。然而, 并非所有患者都能從輔助化療中受益, 特別是有些患者在治療后甚至可能會(huì)出現(xiàn)更差的結(jié)果, 但是關(guān)于輔助化療在直腸癌尤其是局部晚期直腸癌中的“不作為”行為的原因仍然存在爭(zhēng)論[14]。LNR自出現(xiàn)以來(lái)就受到臨床研究者的追捧, 是一項(xiàng)強(qiáng)有力的預(yù)測(cè)因素。在一項(xiàng)多中心回顧性研究中, LNR表現(xiàn)出比陽(yáng)性淋巴結(jié)總數(shù)更可靠的預(yù)后價(jià)值[15]。PNI是結(jié)直腸癌患者預(yù)后的獨(dú)立危險(xiǎn)因素, PNI與腫瘤分化程度,淋巴結(jié)轉(zhuǎn)移顯著相關(guān), 在預(yù)測(cè)患者預(yù)后方面發(fā)揮著重要作用[16]。我們的分析所涉及變量極易獲取, 并且模型表現(xiàn)出不俗的區(qū)分度, 貼近臨床實(shí)際工作需要。
與現(xiàn)有的預(yù)測(cè)模型相比, 我們的列線圖整合了更多的預(yù)測(cè)變量, 如腫瘤沉積和周圍神經(jīng)侵犯, 為EORC患者提供了全面的預(yù)測(cè)。此外, 我們通過(guò)X-tile軟件建立了一個(gè)具有最優(yōu)截?cái)嘀档娘L(fēng)險(xiǎn)分級(jí)系統(tǒng), 該系統(tǒng)更加精確和可靠。構(gòu)建的列線圖預(yù)測(cè)模型的準(zhǔn)確性由ROC曲線和C指數(shù)進(jìn)行驗(yàn)證, ROC曲線、C指數(shù)及校準(zhǔn)曲線顯示出模型預(yù)測(cè)早發(fā)性直腸癌年死亡風(fēng)險(xiǎn)較為精準(zhǔn)。
由于本研究是基于大數(shù)據(jù)庫(kù)的回顧性分析研究, 存在一些局限性, 比如在數(shù)據(jù)庫(kù)中未能提供詳細(xì)的化療方案和患者的生化指標(biāo)等信息, 不能將患者個(gè)體的特殊性納入考慮。但由于病例數(shù)的巨大, 個(gè)體差異造成的影響較小, 因此我們構(gòu)建的預(yù)測(cè)模型仍能夠在一定程度上預(yù)測(cè)早發(fā)性直腸癌死亡風(fēng)險(xiǎn), 后續(xù)的研究依舊需要大樣本臨床隊(duì)列研究或隨機(jī)對(duì)照試驗(yàn)驗(yàn)證。
我們構(gòu)建的列線圖模型顯示出很高的敏感性和準(zhǔn)確性, 能有效預(yù)測(cè)年輕直腸癌病人1, 3, 5年內(nèi)死亡風(fēng)險(xiǎn), 對(duì)早發(fā)性直腸癌的預(yù)后干預(yù)具有臨床指導(dǎo)意義, 是治療決策的潛在工具。
續(xù)表1
續(xù)表2