劉穎方子晗張雅琴王可,3
1 廣州市第一人民醫(yī)院(廣州 510180) 2 湖北文理學(xué)院基礎(chǔ)醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室(襄陽441053) 3 湖北文理學(xué)院附屬襄陽市中心醫(yī)院,臨床循證與轉(zhuǎn)化醫(yī)學(xué)中心(襄陽441053)
肺癌是世界上最常見的癌癥,也是癌癥死亡的最常見原因[1]。作為肺癌的主要類型之一,非小細胞肺癌約占肺癌病例的85%,非小細胞肺癌以肺腺癌居多[2]。目前因早期診斷工具及常見的腫瘤標志物對非小細胞肺癌不敏感,導(dǎo)致肺腺癌預(yù)后相對較差,5年生存率不足15%[3-4]。因此,為提升肺腺癌病人的預(yù)后生活質(zhì)量,探索與肺腺癌有關(guān)的生物標志物尤為重要。
表觀遺傳學(xué)改變與肺癌發(fā)病、病程加快相關(guān),DNA甲基化(DNA methylation)是導(dǎo)致表觀遺傳學(xué)改變的關(guān)鍵因素,在細胞功能調(diào)控和癌變過程中占據(jù)重要作用[5-7]。研究表明,DNA甲基化通過調(diào)控lncRNA的表達從而影響肺癌的預(yù)后[8]。腫瘤基因組圖譜(the cancer genome atlas,TCGA)含有大量腫瘤信息,為研究不同腫瘤共性、突變性、差異性情況提供機會[9]。本文從TCGA中選取肺腺癌甲基化數(shù)據(jù),篩選與其預(yù)后相關(guān)甲基化位點,并評估肺腺癌病人預(yù)后情況,初步探索DNA甲基化在肺腺癌發(fā)生發(fā)展中的作用。
本研究使用TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/)對數(shù)據(jù)進行篩選,包括肺腺癌mRNA表達數(shù)據(jù)、甲基化數(shù)據(jù)和臨床預(yù)后數(shù)據(jù)。2019年10月本研究在TCGA數(shù)據(jù)庫下載肺腺癌mRNA表達數(shù)據(jù)和甲基化數(shù)據(jù),其中具有癌組織和癌旁組織甲基化信息數(shù)據(jù)的合計26例,具有癌組織和癌旁組織mRNA表達數(shù)據(jù)的患者合計56例。經(jīng)過數(shù)據(jù)連接處理后,具有癌組織甲基化芯片數(shù)據(jù)和mRNA表達數(shù)據(jù)的病人合計455例,具有臨床預(yù)后信息和癌組織甲基化芯片數(shù)據(jù)的患者合計418例。
在對組學(xué)數(shù)據(jù)進行預(yù)處理后,篩選差異性甲基化位點和差異性mRNA表達的基因(錯誤發(fā)現(xiàn)率(false discovery rate, FDR)<0.05且差異倍數(shù)(fold change)>2或<0.5),并選擇甲基化、mRNA表達水平具有顯著性關(guān)聯(lián)的甲基化位點進行后續(xù)分析(P<0.05且R2>0.2)。共篩選出158個差異性甲基化位點。
將418例肺腺癌病人隨機分成兩組,一組為探索人群(251人,60%),一組為驗證人群(167人,40%)。在探索人群中采用最小絕對收斂和選擇算子(Least absolute shrinkage and selection operator, LASSO)篩選對肺腺癌風(fēng)險有影響的甲基化位點,并在驗證人群中對前期篩選出的甲基化位點進行結(jié)論驗證。
線性相關(guān)方法用于分析甲基化位點甲基化水平、肺腺癌之間的關(guān)聯(lián)性,非條件Logistic回歸模型評估甲基化位點與肺腺癌預(yù)后的關(guān)系。同時運用受試者工作特征曲線(receiver operating characteristic curve,ROC)分析評估甲基化位點對肺腺癌風(fēng)險的預(yù)測效果。
應(yīng)用GraPad Prism 5、SAS 9.4軟件、R 3.3.0軟件開展數(shù)據(jù)分析和繪圖。t檢驗比較兩樣本均數(shù)差異,P<0.05為有統(tǒng)計學(xué)差異。
圖1 本研究數(shù)據(jù)篩選流程圖
符合條件的肺腺癌病人共有418例。研究人群平均年齡(65.10±10.14)歲,術(shù)后化療病人152人(36.4%)、放療病人88人(21.1%),在隨訪結(jié)束時有102人死亡,占比24.4%。
將418例肺腺癌病人隨機分成兩組,一組為探索人群(251人,60%),一組為驗證人群(167人,40%)。在對數(shù)據(jù)進行預(yù)處理后,根據(jù)篩選標準,最后共有158個甲基化位點在癌和癌旁組織中具有顯著差異且與其所在基因mRNA表達顯著相關(guān)。圖2展示了使用LASSO回歸的分析結(jié)果,當模型最優(yōu)時,僅有cg19378330甲基化位點納入模型。cg19378330在TCGA數(shù)據(jù)庫的注釋信息顯示其所在基因為ABCC2。
圖2 LASSO回歸篩選與肺腺癌預(yù)后有關(guān)的甲基化位點
圖3 56例肺腺癌病例的癌組織和癌旁組織中前50個差異表達基因熱圖情況
圖3為前50個顯著性差異甲基化位點和基因無監(jiān)督聚類分析,結(jié)果顯示在肺腺癌病人的癌和癌旁組織中,甲基化位點的甲基化水平及所在基因mRNA表達水平有較大差異?;騁O(Gene ontology)富集性分析顯示,基因可以被分為23個功能聚類,其中有13個P<0.05的GO功能分類。主要參與G蛋白偶聯(lián)受體介導(dǎo)的信號通路、細胞生長負調(diào)控蛋白等蛋白調(diào)控功能,膜的生物發(fā)生、膜筏組織調(diào)控等細胞相關(guān)功能,以及影響粘著斑結(jié)構(gòu)功能等生物學(xué)過程(圖4)。
圖4 前50個差異甲基化位點基因GO分析結(jié)果
甲基化位點cg19378330的甲基化水平對肺腺癌死亡風(fēng)險的影響見表1和表2。結(jié)果顯示,在探索階段人群中,位點cg19378330甲基化水平增加,肺腺癌死亡風(fēng)險增高(OR=9.82, 95%CI=1.84~52.48)。甲基化位點水平高于中位數(shù)的患者,歸入高風(fēng)險組,甲基化位點低于中位數(shù)的為低風(fēng)險組。結(jié)果發(fā)現(xiàn)與低風(fēng)險組相比,高風(fēng)險組的死亡風(fēng)險比低風(fēng)險組增加了38%(OR=1.38, 95%CI=1.16~2.69)。在驗證人群中表現(xiàn)出相似結(jié)果。
表1 甲基化位點cg19378330的甲基化水平與肺腺癌之間的關(guān)系(探索人群)
表2 甲基化位點cg19378330的甲基化水平與肺腺癌之間的關(guān)系(驗證人群)
采用ROC曲線分析評估甲基化位點cg19378330對肺腺癌風(fēng)險的預(yù)測效果結(jié)果顯示,在探索階段人群中其ROC曲線下面積(area under the curve,AUC)的結(jié)果為0.80(0.73~0.88),靈敏度為86.2%。在驗證人群中,甲基化位點cg19378330的甲基化水平與肺腺癌風(fēng)險之間的關(guān)系更為顯著(表2)。與低風(fēng)險組肺腺癌病人相比,高風(fēng)險組病人的風(fēng)險明顯增加(OR=3.62, 95%CI=1.53~8.56)。ROC曲線分析顯示AUC為0.81(0.73~0.89),靈敏度為90.1%。甲基化位點cg19378330與其所在基因ABCC2 mRNA表達水平之間的關(guān)系見圖5。上述研究結(jié)果表明,甲基化位點cg19378330與肺腺癌具有較顯著的關(guān)聯(lián)性,且可以對肺腺癌的風(fēng)險進行有效的預(yù)測。
圖5 肺腺癌病人癌組織、癌旁組織中甲基化和基因mRNA表達水平
本文利用TCGA公共數(shù)據(jù)庫中肺腺癌有關(guān)數(shù)據(jù),篩選出1個甲基化位點(cg19378330)與肺腺癌風(fēng)險相關(guān)。依據(jù)甲基化位點中位數(shù)進行分組,高于甲基化位點水平中位數(shù)的,歸入高風(fēng)險組,低于甲基化位點中位數(shù)的為低風(fēng)險組,高風(fēng)險組死亡風(fēng)險是低風(fēng)險組的1.38倍。采用ROC曲線分析評估甲基化位點cg19378330對肺腺癌風(fēng)險的預(yù)測效果結(jié)果顯示,AUC為0.80,靈敏度為86.2%。且在驗證人群中表現(xiàn)出類似結(jié)果。提示甲基化位點cg19378330與肺腺癌具有較顯著的關(guān)聯(lián)性,且可以對肺腺癌的風(fēng)險進行有效的預(yù)測。
cg19378330位于10號染色體99840130-99840469的CpG島序列,為基因ABCC2的gene body區(qū)。ABCC2全稱為三磷酸腺苷結(jié)合盒轉(zhuǎn)運體C2(ATP-binding cassette transporters C2, ABCC2),是一種屬于ABC轉(zhuǎn)運體C亞家族的膜轉(zhuǎn)運蛋白[10, 11]。ABCC2可以激活三磷酸腺苷酶,在水解ATP獲取能量后將底物泵出,因此在藥物吸收、分布、排泄過程中發(fā)揮重要作用[12]。同時,ABCC2基因在人體內(nèi)存在著遺傳變異現(xiàn)象,其多態(tài)性可影響腫瘤細胞編碼蛋白的表達和功能[13]。有研究結(jié)果顯示,ABCC2的基因過表達及變異情況可以作為預(yù)測非小細胞肺癌預(yù)后情況的有效生物標志物,且ABCC2的基因表達水平與非小細胞肺癌病人的化療效果有關(guān)[14-15]。非小細胞肺癌最常使用鉑類化療,ABCC2蛋白轉(zhuǎn)移鉑類藥物與還原型谷胱甘肽的結(jié)合物,降低細胞內(nèi)藥物濃度從而使非小細胞肺癌病人產(chǎn)生耐藥,影響化療效果[16-18]。在肺腺癌病人中,cg19378330位點顯示為高甲基化狀態(tài),且與基因ABCC2的表達相關(guān),結(jié)果表明cg19378330可能通過調(diào)節(jié)自身甲基化狀態(tài)從而影響ABCC2基因的表達,進而影響肺腺癌的發(fā)病及預(yù)后。
本研究具有一定的創(chuàng)新性和科學(xué)價值。第一,在TCGA數(shù)據(jù)庫選擇有顯著性差異的與肺腺癌風(fēng)險相關(guān)的甲基化位點cg19378330,提出甲基化水平改變與肺腺癌風(fēng)險之間存在潛在關(guān)聯(lián)的研究假設(shè),國內(nèi)外未見此甲基化位點的類似報道;第二,通過對公共組學(xué)數(shù)據(jù)庫進行挖掘,證明甲基化位點與肺腺癌預(yù)后風(fēng)險的評估效果,研究結(jié)論可以為腫瘤的個性化治療提供新的探索方向。
綜上所述,通過TCGA數(shù)據(jù)庫挖掘,篩選出肺腺癌相關(guān)的特異性甲基化位點cg19378330,且甲基化位點cg19378330對肺腺癌病人的預(yù)后有較好預(yù)測價值,為肺腺癌預(yù)后提供更多可供選擇的標志物。