王 威,段曉冉,譚善娟,姚永成,吳逸明,吳擁軍
1)鄭州大學(xué)公共衛(wèi)生學(xué)院勞動(dòng)衛(wèi)生與職業(yè)病學(xué)教研室 鄭州450001 2)鄭州大學(xué)公共衛(wèi)生學(xué)院衛(wèi)生毒理學(xué)教研室 鄭州450001
#通訊作者,男,1968年1月生,博士,教授,研究方向:肺癌的早期診斷,E-mail:wuyongjun@zzu.edu.cn
目前無論是在經(jīng)濟(jì)發(fā)達(dá)還是發(fā)展中國家,肺癌已成為男性癌癥死亡的首要原因。在中國,肺癌居各類惡性腫瘤之首,發(fā)病率和病死率逐年上升,因早期無特異癥狀,且臨床缺乏有效早期診斷方法,大部分肺癌患者確診時(shí)已到中晚期,總體5 a 生存率大約只有15%[1-2]。因此,運(yùn)用分子生物學(xué)的方法檢測腫瘤發(fā)生過程中的早期分子標(biāo)志,從而發(fā)現(xiàn)癌前病變或早期癌變被認(rèn)為是肺癌早期診斷最具應(yīng)用前景的手段。大量研究[3-4]表明,p16、RASSF1A 和脆性組氨酸三聯(lián)體(fragile histidine traid,F(xiàn)HIT)等基因甲基化修飾引起的抑癌基因表達(dá)沉默在肺癌的發(fā)生發(fā)展中起著重要的作用。外周血DNA 端粒長度縮短亦可增加患肺癌的危險(xiǎn)性。該研究采用3 層拓?fù)浣Y(jié)構(gòu)的BP 神經(jīng)網(wǎng)絡(luò)算法,以上述4 項(xiàng)分子生物標(biāo)志為基礎(chǔ)建立肺癌的早期預(yù)警模型,為肺癌的早期診斷提供有效的方法。
1.1 研究對(duì)象和內(nèi)容 肺癌組的血標(biāo)本取自于2009年1月至2010年6月鄭州大學(xué)第一附屬醫(yī)院呼吸內(nèi)科和胸外科200例原發(fā)性肺癌患者(鱗癌87例,腺癌72例,小細(xì)胞肺癌33例,大細(xì)胞肺癌8例;臨床Ⅰ+Ⅱ期共55例,Ⅲ+Ⅳ期共145例);對(duì)照組的血標(biāo)本取自同期鄭州大學(xué)第一附屬醫(yī)院體檢科體檢的200例正常人(均未發(fā)現(xiàn)肺部或者其他器官的惡性腫瘤)。所有研究對(duì)象均知情同意。研究內(nèi)容包括年齡、性別、吸煙史(每天吸煙1 支且吸煙1 a以上視為吸煙者[5])和實(shí)驗(yàn)室檢測指標(biāo)。
1.2 主要儀器和試劑 PTC200 型PCR 擴(kuò)增儀(美國MJ Research 公司),EPS-350 電泳儀(瑞典Pharmaera-LKB 公司),Real-time PCR 儀MX3000P(美國Startagene 公司),全血基因組DNA 提取試劑盒(上海萊楓生物科技有限公司),引物(上海生工生物工程技術(shù)服務(wù)有限公司),GoTaq qPCR Master Mix(美國Promega 公司),甲基轉(zhuǎn)移酶(美國NEB 公司)。
1.3 實(shí)驗(yàn)室指標(biāo)的檢測 嚴(yán)格按照全血基因組DNA 提取試劑盒的操作步驟提取外周血基因組DNA。采用實(shí)時(shí)熒光定量甲基化特異PCR(realtime methylation specific PCR,qMSP)方法檢測p16、RASSF1A 和FHIT 基因的甲基化水平,參考文獻(xiàn)[6]計(jì)算樣本甲基化水平(甲基化率)。以GAPDH 作為內(nèi)參基因,用熒光定量PCR 法測定端粒相對(duì)長度[4,7]。
1.4 統(tǒng)計(jì)學(xué)處理 采用SPSS 12.0 處理數(shù)據(jù)。應(yīng)用兩獨(dú)立樣本秩和檢驗(yàn)比較2組甲基化率的差異,兩獨(dú)立樣本t 檢驗(yàn)比較2組患者年齡、端粒相對(duì)長度的差異,χ2檢驗(yàn)比較2組性別構(gòu)成和吸煙史的差異;檢驗(yàn)水準(zhǔn)α=0.05。
1.5 Fisher 判別分析模型的構(gòu)建 見文獻(xiàn)[4]。
1.6 神經(jīng)網(wǎng)絡(luò)模型構(gòu)建
1.6.1 數(shù)據(jù)的預(yù)處理 ①數(shù)據(jù)轉(zhuǎn)換:用SPSS Clementine 12.0 對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,根據(jù)神經(jīng)網(wǎng)絡(luò)模型中Sigmoid 傳遞函數(shù)的要求,選用最大最小法對(duì)數(shù)據(jù)進(jìn)行歸一化處理,以避免由于輸入和輸出數(shù)據(jù)之間的數(shù)量級(jí)別差異較大而造成較大的訓(xùn)練誤差。②數(shù)據(jù)分組:按3∶1 的比例將200例肺癌患者和200例正常對(duì)照分成75%的訓(xùn)練集(肺癌患者和正常對(duì)照各150例)和25%的預(yù)測集(肺癌患者和正常對(duì)照各50例)。
1.6.2 模型的建立 采用3 層拓?fù)浣Y(jié)構(gòu)的BP 神經(jīng)網(wǎng)絡(luò)算法,分別在SPSS Clementine 12.0(C-神經(jīng)網(wǎng)絡(luò))和Matlab 7.1(M-神經(jīng)網(wǎng)絡(luò))下進(jìn)行訓(xùn)練,BP算法的傳遞函數(shù)取在[0,1]內(nèi)連續(xù)的Sigmoid函數(shù)。
1.6.3 模型的評(píng)價(jià) 評(píng)價(jià)指標(biāo)包括靈敏度、特異度、準(zhǔn)確度、陽性預(yù)測值、陰性預(yù)測值及ROC 曲線下面積(AUC),AUC <0.5 表示無診斷意義,0.5~表示準(zhǔn)確度較低,0.7~表示準(zhǔn)確度較好,0.9~表示準(zhǔn)確度最好;用MedCalc V11.6.0.0 計(jì)算不同模型的AUC 及95%CI。
2.1 2組人群一般特征 見表1。
表1 肺癌組和正常對(duì)照組研究對(duì)象的一般特征
2.2 2組基因啟動(dòng)子甲基化水平及端粒相對(duì)長度的比較 見表2。肺癌組p16、RASSF1A 和FHIT 基因啟動(dòng)子甲基化水平高于正常對(duì)照組,端粒相對(duì)長度低于對(duì)照組。
表2 2組外周血p16、RASSF1A和FHIT 甲基化率(%)及端粒相對(duì)長度的比較
2.3 Fisher 判別分析模型和神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建見表3。
表3 各模型對(duì)訓(xùn)練集和預(yù)測集的分類結(jié)果
2.4 3 種模型的效果評(píng)估結(jié)果 見表4。Fisher 判別分析模型準(zhǔn)確度較低,而BP 神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確度較高,但是3 種模型AUC 及95%CI 重疊,說明模型的預(yù)測效果并無差異。
表4 3 種模型效果評(píng)估
已經(jīng)證實(shí),基因啟動(dòng)子異常甲基化是抑癌基因失活的一個(gè)重要表觀遺傳學(xué)機(jī)制,并且參與包括肺癌在內(nèi)的腫瘤的發(fā)生發(fā)展[8-9]。許多研究[10-11]結(jié)果均顯示p16、RASSF1A 和FHIT 基因的甲基化與肺癌相關(guān)。該研究也表明,肺癌組p16、RASSF1A 和FHIT 基因啟動(dòng)子甲基化水平均高于正常對(duì)照組。已有研究[12]證明p16 基因的啟動(dòng)子區(qū)CpG 島高甲基化是p16 基因在癌癥發(fā)生早期就失活的主要機(jī)制。該研究結(jié)果表明外周血p16 基因甲基化水平可以作為預(yù)測肺癌的一項(xiàng)重要腫瘤標(biāo)志。RASSF1A基因也是一個(gè)抑癌基因,主要是通過細(xì)胞周期蛋白的聚集而誘導(dǎo)細(xì)胞周期阻滯[13]。且已有研究[14-15]證實(shí)FHIT 基因啟動(dòng)子甲基化是該基因表達(dá)失活的主要機(jī)制,因此,檢測FHIT 基因啟動(dòng)子甲基化可能有助于肺癌早期診斷。
端粒是真核細(xì)胞中用于維持染色體完整性和穩(wěn)定性的線性染色體末端的非編碼DNA 的重復(fù)序列以及與之相連的端粒結(jié)合蛋白功能復(fù)合體[16]。課題組前期研究[16]發(fā)現(xiàn)肺癌組端粒長度要短于對(duì)照組,這與國外的研究[17-18]結(jié)果一致。這些結(jié)果提示外周血基因組DNA 端粒長度可以作為預(yù)測肺癌的一項(xiàng)重要的腫瘤標(biāo)志。
BP 神經(jīng)網(wǎng)絡(luò)模型是迄今為止應(yīng)用最廣泛的一種神經(jīng)網(wǎng)絡(luò)算法,在樣本的學(xué)習(xí)過程中強(qiáng)調(diào)對(duì)樣本的錯(cuò)分最小,即經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化。該研究精簡了納入的生物標(biāo)志,將4 種生物標(biāo)志納入神經(jīng)網(wǎng)絡(luò)模型中,在不同軟件環(huán)境下對(duì)肺癌進(jìn)行預(yù)測,準(zhǔn)確度達(dá)到76.0%和78.0%,而Fisher 判別分析,準(zhǔn)確度僅為67.0%。課題組前期采用腫瘤標(biāo)志聯(lián)合數(shù)據(jù)挖掘建立的模型對(duì)肺癌的預(yù)測準(zhǔn)確度都達(dá)到90% 以上[19]。該研究建立的模型準(zhǔn)確度低于前期研究模型,可能與樣本不同有關(guān),也可能與納入模型的生物標(biāo)志類型和數(shù)量不同有關(guān)。下一步需要用同一批標(biāo)本對(duì)不同生物標(biāo)志模型進(jìn)行比較,進(jìn)一步篩選生物標(biāo)志、優(yōu)化判別模型。
總之,該研究發(fā)現(xiàn)人外周血DNA 中 p16、RASSF1A、FHIT 基因啟動(dòng)子甲基化及端粒相對(duì)長度與肺癌有關(guān),首次應(yīng)用神經(jīng)網(wǎng)絡(luò)模型成功構(gòu)建了基于上述4 種生物標(biāo)志的肺癌判別模型。該研究結(jié)果具有較高的潛在應(yīng)用價(jià)值,如果能夠應(yīng)用于肺癌高危人群篩查,對(duì)肺癌的早期診斷、早期治療和疾病康復(fù)具有重要價(jià)值。
[1]Jemal A,Bray F,Center MM,et al.Global cancer statistics[J].CA Cancer J Clin,2011,61(2):69
[2]Siegel R,Ward E,Brawley O,et al.Cancer statistics,2011:the impact of eliminating socioeconomic and racial disparities on premature cancer deaths[J].CA Cancer J Clin,2011,61(4):212
[3]Hsu HS,Chen TP,Hung CH,et al.Characterization of a multiple epigenetic marker panel for lung cancer detection and risk assessment in plasma[J].Cancer,2007,110(9):2019
[4]魏小玲,譚善娟,何其棟,等.決策樹聯(lián)合生物標(biāo)志在肺癌輔助診斷中應(yīng)用[J].中國公共衛(wèi)生,2013,29(10):1479
[5]World Health Organization.Guidelines for controlling and monitoring the tobacco epidemic[M].Geneva:WHO,1998:200
[6]Lu L,Katsaros D,de la Longrais IA,et al.Hypermethylation of let-7a-3 in epithelial ovarian cancer is associated with low insulin-like growth factor-Ⅱexpression and favorable prognosis[J].Cancer Res,2007,67(21):10117
[7]王威,李智濤,祝寒松,等.煤焦瀝青煙提取物致人支氣管上皮細(xì)胞惡性轉(zhuǎn)化細(xì)胞端粒損傷研究[J].中國職業(yè)醫(yī)學(xué),2011,38(5):369
[8]Suzuki M,Yoshino I.Aberrant methylation in non-small cell lung cancer[J].Surg Today,2010,40(7):602
[9]Baylin SB,Ohm JE.Epigenetic gene silencing in cancer:a mechanism for early oncogenic pathway addiction?[J].Nat Rev Cancer,2006,6(2):107
[10]Zhang YW,Wang R,Song HZ,et al.Methylation of multiple genes as a candidate biomarker in non-small cell lung cancer[J].Cancer Lett,2011,303(1):21
[11]Liu Z,Li W,Lei Z,et al.CpG island methylator phenotype involving chromosome 3p confers an increased risk of nonsmall cell lung cancer[J].J Thorac Oncol,2010,5(6):790
[12]Deng D,Liu Z,Du Y.Epigenetic alterations as cancer diagnostic,prognostic,and predictive biomarkers[J].Adv Genet,2010,71:125
[13]Guo W,Dong Z,Chen Z,et al.Aberrant CpG island hypermethylation of RASSF1A in gastric cardia adenocarcinoma[J].Cancer Invest,2009,27(4):459
[14]Sozzi G,Veronese ML,Negrini M,et al.The FHIT gene 3p14.2 is abnormal in lung cancer[J].Cell,1996,85(1):17
[15]Zochbauer-Müller S,F(xiàn)ong KM,Maitra A,et al.5' CpG island methylation of the FHIT gene is correlated with loss of gene expression in lung and breast cancer[J].Cancer Res,2001,61(9):3581
[16]王娜,周舫,譚善娟,等.肺癌患者外周血白細(xì)胞端粒DNA相對(duì)長度檢測[J].鄭州大學(xué)學(xué)報(bào):醫(yī)學(xué)版,2012,47(4):445
[17]Jang JS,Choi YY,Lee WK,et al.Telomere length and the risk of lung cancer[J].Cancer Sci,2008,99(7):1385
[18]Hosgood HD 3rd,Cawthon R,He XZ,et al.Genetic variation in telomere maintenance genes,telomere length,and lung cancer susceptibility[J].Lung Cancer,2009,66(2):157
[19]馮斐斐,聶廣金,吳擁軍,等.基于6 項(xiàng)腫瘤標(biāo)志聯(lián)合檢測的3 種分類模型判別肺癌的對(duì)比分析[J].衛(wèi)生研究,2009,38(4):429