劉宇英,李艷紅,嚴岳,趙安世,羅琳娜,伍民慶,謝傳波
(中山大學腫瘤防治中心 華南腫瘤學國家重點實驗室 腫瘤醫(yī)學協(xié)同創(chuàng)新中心a.防癌體檢健康管理中心;b.腫瘤內(nèi)科,廣東 廣州510060)
結(jié)直腸癌是嚴重影響我國居民健康的惡性腫瘤之一,2018 年發(fā)布的全球腫瘤登記數(shù)據(jù)(Global Cancer Statistics, GLOBCAN)顯示我國2018 年共確診82.50 萬結(jié)直腸癌患者,70.1 萬人死于結(jié)直腸癌,分別占我國惡性腫瘤發(fā)病和死亡的11.3%和8.5%[1-2]。結(jié)直腸癌的預后與診斷時分期密切相關, 早期結(jié)直腸癌患者(I 期和ⅡA 期)的5 年生存率大于87%,中晚期結(jié)直腸癌患者的5 年生存率低于11%[3]。 因此,早期識別結(jié)直腸癌的高危個體, 并進行有針對性的干預是降低結(jié)直腸癌疾病負擔的關鍵。然而,我國目前尚未開展大型前瞻性的臨床研究篩選結(jié)直腸癌的高危因素。 美國前列腺、肺、結(jié)直腸及卵巢癌篩查研究(prostate,lung,colorectal,and ovarian dataset, PLCO)是美國國立衛(wèi)生研究院 (National Cancer Institute,NCI)開展的一項大型隨機對照臨床試驗,主要目的是評價前列腺癌、肺癌、結(jié)直腸癌等癌癥篩查方法的有效性。 該數(shù)據(jù)庫前瞻性的探索了各類危險因素與結(jié)直腸癌的關系, 為結(jié)直腸癌高危人群的篩選提供了高質(zhì)量數(shù)據(jù)來源。本研究利用PLCO 數(shù)據(jù)庫,建立結(jié)直腸癌發(fā)病預測列線圖, 為護理從業(yè)人員提供簡便、快捷的結(jié)直腸癌高危人群篩選工具。
2019 年3 月7 日, 由中山大學腫瘤防治中心1名腫瘤內(nèi)科學博士以課題的形式向PLCO 數(shù)據(jù)管理委員會提交PLCO 數(shù)據(jù)庫使用申請,2019 年4 月5日PLCO 數(shù)據(jù)管理委員會批準申請人及其所在團隊在2019 年4 月5 日—2022 年4 月5 日,可利用PLCO數(shù)據(jù)庫進行數(shù)據(jù)分析(項目批準號PLCO-459)。 本次研究是對申請到的PLCO 數(shù)據(jù)庫進行的再次分析。 PLCO 共納入155 000 名研究對象[4],并按照1∶1的比例隨機將研究對象分為對照組和干預組(每組各77 500 例)。PLCO 研究在選取研究對象時的納入標準如下:(1)年齡55~74 歲;(2)未診斷前列腺、肺、結(jié)直腸及卵巢癌;(3) 未做過上述器官的切除手術;(4)現(xiàn)階段未參加其他臨床試驗;(5)簽署知情同意書。 研究對象的隨訪截至時間為2009 年12 月31日,中位隨訪時間為12.4 年。 本研究在做數(shù)據(jù)分析時除要求結(jié)直腸癌診斷明確外, 未對研究對象進行額外排除。
2.1 調(diào)查工具
2.1.1 問卷調(diào)查 申請人及其所在團隊可使用PLCO 的基線數(shù)據(jù)庫、 膳食史問卷調(diào)查(Dietary History Questionnaire,DHQ)數(shù)據(jù)庫、補充問卷調(diào)查(Supplemental Questionnaire, SQX)數(shù)據(jù)庫、結(jié)直腸鏡分析數(shù)據(jù)庫進行科學研究。 以上數(shù)據(jù)庫均由PLCO 工作人員在研究的不同階段進行搜集。 在流行病與衛(wèi)生統(tǒng)計學專業(yè)人員的指導下, 由1 名博士研究生對以上數(shù)據(jù)庫進行清理和分析, 以保證數(shù)據(jù)準確性。 基線問卷調(diào)查庫的主要內(nèi)容包括社會人口學特征(年齡、性別、職業(yè)和民族等)、吸煙情況、腫瘤家族史、身高、體質(zhì)量、BMI、非甾體類抗炎藥物使用情況、女性生育史、個人疾病史、是否患有腫瘤等信息。 96.8%的研究對象完成了基線問卷調(diào)查, 其中81%的研究對象在入組1 個月內(nèi)完成基線問卷調(diào)查,96%的研究對象在入組的3 個月內(nèi)完成基線問卷調(diào)查。 膳食史問卷調(diào)查(Dietary History Questionnaire,DHQ),DHQ 主要包括飲酒、營養(yǎng)素攝入、食品添加劑攝入、血糖指數(shù)、肉類攝入情況、每日各類食物和飲料的攝入情況、每日各類食物和飲料的攝入頻率,共約77%的研究對象完成了DHQ 問卷調(diào)查。補充問卷調(diào)查(Supplemental Questionnaire, SQX),是對基線問卷信息的補充, 主要包括2 組研究對象的社會人口學狀態(tài)、疾病史和家族史、吸煙、藥物使用、體力活動及性別特征變量的情況, 共約104 000 名研究對象完成了補充問卷調(diào)查。
2.1.2 結(jié)直腸癌發(fā)病數(shù)據(jù)的獲取 參加PLCO 研究的填寫。 結(jié)直腸癌發(fā)病數(shù)據(jù)主要是PLCO 工作人員通過結(jié)直腸鏡檢查、自我報告、周期性查閱死亡登記系統(tǒng)3 種方式獲取。 分配入干預組的研究對象分別
在基線時、入組后3 年或5 年(1994 年10 月前干預組每隔3 年進行1 次結(jié)直腸鏡檢查,1995 年12 月后每5 年進行1 次結(jié)直腸鏡檢查) 分別進行1 次結(jié)直腸鏡檢查。 結(jié)直腸鏡檢查發(fā)現(xiàn)異常后則轉(zhuǎn)診到全科醫(yī)生診所進行結(jié)直腸鏡和組織病理學隨訪, 以確診是否患結(jié)直腸癌。 PLCO 研究人員還通過每年郵寄年度問卷(Annual Questionnaire)和定期查閱腫瘤登記系統(tǒng)的方式搜集干預組和對照組研究對象的腫瘤發(fā)病情況。本研究的研究人員,以結(jié)直腸鏡分析數(shù)據(jù)庫中是否確診為結(jié)直腸癌這一變量為依據(jù), 確定結(jié)直腸癌的發(fā)病情況。
2.2 統(tǒng)計分析 采用構(gòu)成比描述研究對象的社會人口學特征。 采用率描述不同特征人群的結(jié)直腸癌發(fā)病情況。對問卷中的變量進行清洗時,先后查驗原始變量與新生成變量的分布, 兩者分布數(shù)據(jù)核對準確確定為可用的新變量。 單因素Cox 比例風險回歸模型篩選結(jié)直腸癌的危險因素, 多因素Cox 比例風險回歸模型校正其他危險因素后進一步篩選結(jié)直腸癌的危險因素, 建立結(jié)直腸癌的預測列線圖, 采用Calibration plot 展示預測發(fā)病與實際觀測發(fā)病的一致程度。統(tǒng)計分析由SAS 9.3 和RStudio 統(tǒng)計分析軟件完成。 所有檢驗均為雙側(cè)檢驗,以P<0.05 為差異有統(tǒng)計學意義。 所有統(tǒng)計分析均咨詢中山大學公共衛(wèi)生學院流行病學教研室。
3.1 結(jié)直腸癌發(fā)病風險因素分析 共有148 027 例納入分析, 其中男性、 女性各占約50%; 年齡≤59歲、60~64 歲、65~69 歲和≥70 歲的研究對象分別占33.362%、30.693%、22.545%和13.400%;絕大多數(shù)研究對象為已婚(73.1%);吸煙方面,69 272 例研究對象報道從不吸煙,16 055 例正在吸煙,64 617 例研究對象已戒煙, 分別占總?cè)巳旱?6.199%、10.707%和43.094%。約10.335%的研究對象具有結(jié)直腸癌家族史(14 961 例)、6.8237%的研究對象(10 150 例)報道曾經(jīng)發(fā)現(xiàn)結(jié)直腸息肉。 表1 展示的是結(jié)直腸癌高危因素情況,發(fā)現(xiàn)與≤59 歲的研究對象相比,年齡在60~64 歲、65~69 歲和≥70 歲的研究對象結(jié)直腸癌的發(fā)病風險分別為其1.568 倍(95%CI=1.392~1.768)、2.092 倍(95%CI=1.854~2.361)和2.484 倍(95%CI=2.174~2.838)。 與女性相比,男性結(jié)直腸癌的發(fā)病風險增加(HR=1.430, 95%CI=1.313~1.559)。 此外,與從不吸煙者相比,吸煙(HR=1.422, 95%CI=1.242~1.632)或者曾經(jīng)吸煙者(HR=1.227, 95%CI=1.120~1.345)的結(jié)直腸癌發(fā)病風險增加;結(jié)直腸癌家族史、息肉史、紅肉攝入、糖尿病均顯著增加結(jié)直腸癌的發(fā)病風險而阿司匹林使用和規(guī)律結(jié)直腸癌篩查則會降低結(jié)直腸癌的發(fā)病風險。在校正了其他危險因素后,年齡、性別、吸煙、結(jié)直腸癌家族史、糖尿病依然是結(jié)直腸癌發(fā)病的高危因素,而息肉史則無統(tǒng)計學意義。
表1 研究對象一般情況描述及其與結(jié)直腸癌發(fā)病風險的關系
3.2 結(jié)直腸癌預測列線圖 圖1 展示的根據(jù)篩選出的危險因素建立的結(jié)直腸癌預測列線圖, 根據(jù)COX 回歸模型中各因素對因變量(是否發(fā)生結(jié)直腸癌)的貢獻大小,也就是回歸系數(shù)的大小轉(zhuǎn)換成風險得分:得分=回歸系數(shù)×(變量的全距)。 根據(jù)COX 回歸的系數(shù)計算出,<60 歲得分為0 分,60~64 歲得分為4.63 分,65~69 歲得分為8.36 分,≥70 歲得分為10 分;女性得分為0 分,男性得分為3.43 分;從不吸煙者得分為0 分,吸煙者得分為4.09 分,戒煙者得分為1.80 分; 無結(jié)直腸癌家族史者得分為0 分,患有結(jié)直腸癌家族史者得分為2.71 分;規(guī)律服用阿司匹林者得分為0 分,未規(guī)律服用者得分為1.71 分;規(guī)律結(jié)直腸癌篩查者得分為0 分, 未規(guī)律結(jié)直腸癌篩查者得分為2.10 分;無糖尿病者得分為0 分,患有結(jié)直腸癌家族史者得分為4.36 分。 此外,通過繪制預測值與實際值的校準圖,進行一致性測試,結(jié)果顯示該列線圖模型預測的10 年結(jié)直腸癌發(fā)病概率與實際觀測10 年結(jié)直腸癌發(fā)病概率相關性良好(見圖2), 該模型預測結(jié)直腸癌發(fā)生風險時的C-index 為0.626。
圖1 結(jié)直腸癌發(fā)病風險預測列線圖
圖2 結(jié)直腸癌發(fā)病風險校正曲線
4.1 建立了簡便、快捷的結(jié)直腸癌高危人群篩選預測列線圖 結(jié)直腸癌是嚴重影響我國居民壽命的疾病之一,早期篩查是降低其疾病負擔的關鍵。既往關于結(jié)直腸癌的預測列線圖多以預測預后為主[5],鮮有研究采用列線圖預測結(jié)直腸癌的發(fā)病。 本研究通過分析結(jié)直腸癌發(fā)病常見高危因素建立了結(jié)直腸癌預測列線圖, 并且納入結(jié)直腸癌預測列線圖模型的變量均為簡單易獲取的變量, 非常方便進行高危人群的篩查。研究結(jié)果對于篩選結(jié)直腸癌高危人群,并降低其疾病負擔具有一定的臨床意義。
哈佛癌癥風險工作小組基于生活方式和常規(guī)體檢資料建立了哈佛癌癥風險指數(shù)模型[6],來預測10年結(jié)腸癌發(fā)病風險, 納入模型的變量包括一級親屬結(jié)腸癌史,體質(zhì)指數(shù),篩查史(糞潛血試驗、結(jié)腸鏡檢查),阿司匹林使用史,炎性腸疾病史,葉酸攝入史,飲食(紅肉、蔬菜、水果、纖維、脂肪),吸煙,飲酒,身高,體力活動和雌激素替代治療史,哈佛指數(shù)模型在預測男性和女性結(jié)直腸癌發(fā)病風險的AUC 曲線下面積分別達到0.710 和0.670。 我國Cai 等[7]通過隊列研究在模型中納入性別、年齡、吸煙、糖尿病、綠色蔬菜、腌制食品、油炸食品和白肉攝入量建立了我國結(jié)直腸癌的預測模型,AUC 曲線下面積達到了0.74。 此外, 國內(nèi)Chen 等建立了包含5 個因素:年齡、性別、冠心病、雞蛋攝入、排便頻率的進展期結(jié)直腸癌風險預測模型,該模型預測結(jié)直腸癌的AUC 曲線下面積為0.75[8]。
既往建立的系列結(jié)直腸癌預測模型都具有良好的篩查效果,但是在臨床實踐中并不能直接應用。它們需要根據(jù)各因素的回歸系數(shù)計算得到發(fā)病概率然后再判定研究對象是否為高危人群。 而本研究建立的預測列線圖具有直觀、簡便易操作的優(yōu)點,方便護理工作者對結(jié)直腸癌高風險人群進行初步篩查。 本研究納入預測列線圖的各個因素均可通過簡單的問卷調(diào)查獲取, 因此更加增加了此模型在護理實踐中的實用性。
4.2 建立的預測列線圖在防癌體檢的預檢、分診中具有較高的應用價值 既往建立的系列結(jié)直腸癌預測模型都具有良好的篩查效果, 但是在臨床實踐中并不能直接應用。 它們需要根據(jù)各因素的回歸系數(shù)計算得到發(fā)病概率然后再判定研究對象是否為高危人群。而本研究建立的預測列線圖具有直觀、簡便易操作的優(yōu)點, 方便護理工作者對結(jié)直腸癌高風險人群進行初步篩查。 本研究納入預測列線圖的各個因素均可通過簡單的問卷調(diào)查獲取, 因此更加增加了此模型在護理實踐中的應用性。 國內(nèi)越來越多的防癌體檢健康管理中心開始開展人群篩查隊列研究,在建立篩查隊列時護理人員是問卷調(diào)查的主力,她們可以通過本研究建立的結(jié)直腸癌模型篩選結(jié)直腸癌高危人群,進行預檢、分診,協(xié)助體檢醫(yī)生對客人的發(fā)病風險進行評估。 例如,1 例60 歲的男性吸煙者患有2 型糖尿病且具有結(jié)直腸癌家族史但未行規(guī)律的結(jié)直腸鏡檢查,未規(guī)律服用阿司匹林,則其總風險得分為4.63+3.43+4.09+2.71+1.71+2.10+4.36=23分,對應列線圖該男性吸煙者5 年結(jié)直腸癌的發(fā)生風險約為2%,因此可評定為結(jié)直腸癌高風險。 護理人員可以將預測列線圖附在體檢報告中, 解釋預測列線圖的用法, 幫助不同生活習慣及臨床特征的客人了解其結(jié)直腸癌的發(fā)病風險。 本研究中心的護理人員采用該預測列線圖, 進行檢前腸癌風險人群的分診,在篩查過程中,大幅降低了開單醫(yī)生的咨詢工作量、提高了開單效率,在臨床應用中起到了良好的效果。
4.3 預測列線圖需要在更廣的人群中進行驗證本研究具有以下缺點:首先,本研究建立預測列線圖模型的數(shù)據(jù)來源于美國人群(絕大多數(shù)為白種人),盡管該模型在本研究單中心的臨床實踐中具有良好的應用效果, 但該模型是否適用于更廣泛的人群需要進一步驗證。 其次,PLCO 研究最后一輪數(shù)據(jù)的隨訪日期為2009 年底,距今已有十年。 無論是東方還是西方十年間的生活方式均發(fā)生了較大變化, 例如電子產(chǎn)品使用時間占日常生活時間的比重增加、體力活動減少。這些因素可能會影響模型的穩(wěn)定性。然而, 我國尚缺乏大型的隨機對照臨床研究的證據(jù)來前瞻性驗證和篩選結(jié)直腸癌的高危因素,PLCO 研究作為一項國際知名的大型前瞻性臨床研究, 其確證病因的能力較觀察性研究強, 因此本研究建立的模型用于體檢人群的預檢分診仍有一定的參考價值。