葉乃郗,何杰,李小燕,余覓,張維,孫建
(成都醫(yī)學(xué)院,四川 成都 610500 1 臨床醫(yī)學(xué)院; 2 第一附屬醫(yī)院呼吸與危重癥醫(yī)學(xué)科)
肺癌是一種高發(fā)病率和高病死率的惡性腫瘤,隨著環(huán)境污染和職業(yè)暴露的加劇、吸煙人群的增多、人口老齡化的進(jìn)展,肺癌病人的數(shù)量呈逐年上升的趨勢(shì)。中國(guó)每年預(yù)計(jì)新增肺癌病例約70萬,新增肺癌死亡病例約40萬,其中非小細(xì)胞肺癌約占肺癌總數(shù)的70%以上,且非小細(xì)胞肺癌中主要為肺腺癌,而肺腺癌病人5年生存率不到15%[1-2]。究其原因可能是肺腺癌起病比較隱匿,早期無特殊癥狀,部分病人確診時(shí)已經(jīng)發(fā)展至中期以后,失去了手術(shù)的機(jī)會(huì)。因此,早期確診和分子水平的研究有利于腫瘤的綜合治療和延長(zhǎng)病人的生存期。
隨著生物信息技術(shù)的發(fā)展和分子生物學(xué)設(shè)備的更新,肺癌在分子水平的發(fā)生發(fā)展機(jī)制得到深入研究。目前研究發(fā)現(xiàn),肺癌的發(fā)生發(fā)展及預(yù)后與多種基因的差異表達(dá)相關(guān)[3-4]。其中DNA聚合酶εB亞基(POLE2)基因以其獨(dú)特的超強(qiáng)分子突變表型,與多種腫瘤都有著密切的關(guān)系[5]。LI等[6]研究結(jié)果表明,POLE2在肺腺癌的發(fā)病機(jī)制中起著非常重要的調(diào)控作用,下調(diào)該基因的表達(dá)后,A549細(xì)胞增殖受到明顯抑制。因此,研究POLE2基因在肺腺癌中的表達(dá)情況,可能為臨床治療方案的選擇及預(yù)后評(píng)估提供可靠依據(jù)。但目前POLE2在肺腺癌和正常肺組織中的表達(dá)情況及其對(duì)預(yù)后的影響鮮有報(bào)道,且該基因在腫瘤中的生物學(xué)功能爭(zhēng)議較大,現(xiàn)仍沒有研究運(yùn)用多個(gè)腫瘤數(shù)據(jù)庫對(duì)POLE2在肺腺癌中的作用進(jìn)行綜合評(píng)價(jià)。故本研究利用多個(gè)腫瘤相關(guān)數(shù)據(jù)庫綜合分析POLE2在肺腺癌組織中的表達(dá)水平及其對(duì)病人生存預(yù)后的影響,分析肺腺癌組織中的POLE2表達(dá)相關(guān)基因并預(yù)測(cè)其潛在的生物學(xué)功能,為研究POLE2基因在肺腺癌發(fā)生發(fā)展過程和生存預(yù)后中的作用提供一定的生物學(xué)依據(jù)。
在GEPIA(Gene Expression Profiling interactive analysis)數(shù)據(jù)庫(http://gepia.cancer-pku.cn/detail.php)平臺(tái)上選擇“Single Gene Analysis”,在“Enter gene name”中輸入“POLE2”,在“Datasets Selection”中輸入“LUAD”,分析POLE2在不同腫瘤中的表達(dá)情況。利用Oncomine數(shù)據(jù)庫(http://www.oncomine.org)分析在不同肺腺癌數(shù)據(jù)集中POLE2的表達(dá)情況,其篩選條件如下:①Cancer Type為lung adenocarcinoma;②Gene為POLE2;③Data Type為mRNA;④Analysis Type為Cancer vs. Normal Analysis;⑤Oncomine 數(shù)據(jù)庫檢索結(jié)果的統(tǒng)計(jì)學(xué)納入條件為P<0.05,fold change>2,gene rank=top 10%。統(tǒng)一采用箱線圖對(duì)研究結(jié)果進(jìn)行描述。
Kaplan-Meier Plotter(https://kmplot.com/analysis)是一款操作簡(jiǎn)單的在線分析基因表達(dá)量與生存數(shù)據(jù)間關(guān)系的工具。利用Kaplan-Meier Plotter,以POLE2表達(dá)量前25%的病人為高表達(dá)組,后25%的病人為低表達(dá)組,分析兩組病人的總生存時(shí)間并繪制生存曲線。
利用cBioPortal數(shù)據(jù)庫(http://www.cbioportal.org/)以及LinkedOmics數(shù)據(jù)庫(http://www.linkedomics.org/login.php),共同分析TCGA(The Cancer Genome Atlas)子數(shù)據(jù)集LUAD(lung adenocarcinoma),以Pearson相關(guān)系數(shù)絕對(duì)值>0.6為篩選條件,獲取POLE2表達(dá)相關(guān)基因。用在線分析工具(http://www.bioinformatics.psb.ugent.be/webtools/Venn)做韋恩圖,并獲取兩者的交集。下載的TCGA數(shù)據(jù)的研究主要對(duì)象為L(zhǎng)UAD,其中具有RNA-seq測(cè)序數(shù)據(jù)的肺腺癌樣本517例。
先利用Enrichr數(shù)據(jù)庫(https://amp.pharm.mssm.edu/Enrichr/)對(duì)POLE2表達(dá)相關(guān)基因進(jìn)行GO分析和KEGG 信號(hào)通路分析,篩選條件為P<0.05。然后,利用STRING數(shù)據(jù)庫(http://string-db.org/)分析相關(guān)蛋白間的相互作用,在“Multiple proteins”窗口中輸入包括POLE2在內(nèi)的一系列與POLE2表達(dá)相關(guān)的基因,物種選擇“Human”,代表蛋白間相互作用強(qiáng)度的置信度選擇“medium confidence(0.400)”。
所用TIMER(Tumor Immune Estimation Resource)數(shù)據(jù)庫(https://cistrome.shinyapps.io/timer/)是由哈佛大學(xué)免疫信息學(xué)院建立的一個(gè)網(wǎng)站工具,它利用RNA-Seq表達(dá)譜數(shù)據(jù)檢測(cè)腫瘤組織中6種免疫細(xì)胞的浸潤(rùn)情況。分析設(shè)定條件如下:①Cancer為L(zhǎng)ung Adenocarcinoma;②Gene為POLE2;③ Correlation為Pearson。
使用SPSS 20.0軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。采用獨(dú)立樣本t檢驗(yàn)驗(yàn)證肺腺癌和癌旁正常肺組織POLE2mRNA的表達(dá)差異;用Pearson相關(guān)系數(shù)分析與POLE2相關(guān)的主要基因和浸潤(rùn)免疫細(xì)胞;采用Kaplan-Meier生存分析計(jì)算病人的生存率,并使用廣義log-rank檢驗(yàn)估計(jì)生存預(yù)后的差異。
GEPIA數(shù)據(jù)庫分析結(jié)果顯示,POLE2基因在宮頸腺癌、睪丸癌等癌組織中的表達(dá)升高,而在急性髓細(xì)胞樣白血病中則呈現(xiàn)出低表達(dá)趨勢(shì)(圖1A)。POLE2基因在LUAD中的表達(dá)水平明顯高于正常肺組織(|log2FC|=0.5,P<0.01)(圖1B)。Oncomine數(shù)據(jù)庫在線搜索共得到與POLE2表達(dá)相關(guān)的不同類型研究414項(xiàng),其中47項(xiàng)研究結(jié)果顯示POLE2表達(dá)水平差異有統(tǒng)計(jì)學(xué)意義,45項(xiàng)研究顯示表達(dá)增高,2項(xiàng)研究顯示表達(dá)降低(圖2A)。在Oncomine數(shù)據(jù)庫中進(jìn)行篩選,從建庫至今,總共得到5項(xiàng)關(guān)于正常肺組織和肺腺癌組織POLE2表達(dá)比較的實(shí)驗(yàn)研究,包含172例樣本,這5項(xiàng)研究還包含了大細(xì)胞肺癌、鱗癌與正常肺組織POLE2表達(dá)的比較[7-9]。5項(xiàng)研究結(jié)果顯示,POLE2在肺腺癌、肺鱗癌及大細(xì)胞肺癌中的表達(dá)量均顯著高于正常肺組織(t=17.53~35.88,P<0.01),其中肺腺癌POLE2表達(dá)量增高尤為突出(圖2B、C)。
A:POLE2在各種腫瘤組織和癌旁正常組織中的表達(dá)情況;B:POLE2在肺腺癌和正常肺組織中的表達(dá)差異,*P<0.01。
以POLE2表達(dá)量前25%的病人為高表達(dá)組(n=123),后25%的病人為低表達(dá)組(n=123),進(jìn)行Kaplan-Meier Plotter分析,結(jié)果顯示,相對(duì)于高表達(dá)組,低表達(dá)組肺腺癌病人總體生存時(shí)間更長(zhǎng)(χ2=9.134,P<0.01)。見圖3。
A:Oncomine數(shù)據(jù)庫中POLE2表達(dá)分布情況;B:POLE2在5項(xiàng)研究中的表達(dá)比較;C:POLE2在肺腺癌、肺鱗癌及大細(xì)胞肺癌中的差異表達(dá)。
圖3 POLE2表達(dá)水平與肺腺癌病人預(yù)后關(guān)系的生存曲線
利用cBioPortal數(shù)據(jù)庫和LinkedOmics數(shù)據(jù)庫分析TCGA中肺腺癌的數(shù)據(jù),共獲取37個(gè)與POLE2表達(dá)相關(guān)的基因(圖4)。利用Enrichr數(shù)據(jù)庫進(jìn)行GO分析,發(fā)現(xiàn)POLE2表達(dá)相關(guān)基因主要功能富集在DNA聚合酶的激活、DNA的復(fù)制和DNA的修復(fù)等生物學(xué)過程(圖5A)。KEGG 通路分析顯示,POLE2表達(dá)相關(guān)基因主要參與了堿基切除修復(fù)、DNA復(fù)制、核苷酸切除修復(fù)等信號(hào)通路過程(圖5B)。利用STRING數(shù)據(jù)庫進(jìn)行蛋白相互作用(PPI)網(wǎng)絡(luò)分析顯示,節(jié)點(diǎn)數(shù)為11,POLE2在細(xì)胞增殖等相關(guān)信號(hào)轉(zhuǎn)導(dǎo)通路中處于核心位置。根據(jù)MMC算法篩選潛在的相關(guān)基因,發(fā)現(xiàn)PRIM2、POLA1、POLA2、CDC45等基因與POLE2表達(dá)密切相關(guān)。見圖6。
圖4 POLE2表達(dá)相關(guān)基因篩選韋恩圖
A:POLE2表達(dá)相關(guān)基因GO分析;B:POLE2表達(dá)相關(guān)基因KEGG通路分析。
圖6 POLE2表達(dá)相關(guān)基因PPI網(wǎng)絡(luò)分析及關(guān)鍵基因預(yù)測(cè)
利用腫瘤免疫微環(huán)境TIMER數(shù)據(jù)庫分析顯示,POLE2基因在肺腺癌免疫微環(huán)境中與B細(xì)胞、CD4+T細(xì)胞、CD8+T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞、樹突狀細(xì)胞均無明顯相關(guān)性(partial.cor<0.3),提示POLE2基因可能與腫瘤免疫細(xì)胞浸潤(rùn)無關(guān)。見圖7。
圖7 POLE2表達(dá)與肺腺癌6種免疫細(xì)胞浸潤(rùn)的關(guān)系
非小細(xì)胞肺癌是肺癌中最常見的一種類型,包括肺鱗癌、肺腺癌、大細(xì)胞肺癌等,其中肺腺癌占絕大多數(shù),其發(fā)病與環(huán)境因素、職業(yè)暴露、遺傳因素等諸多因素相關(guān)[10]。大部分肺腺癌病人確診時(shí),可能已存在廣泛侵襲和淋巴結(jié)轉(zhuǎn)移,目前對(duì)于中晚期肺腺癌暫無切實(shí)有效的治療措施[11]。傳統(tǒng)治療方法有放療、化療、手術(shù)切除治療等,但這些方法并沒有使病人的預(yù)后得到明顯的改善[12]。隨著分子生物學(xué)技術(shù)的革新,基因靶向藥物和免疫治療成為了目前治療非小細(xì)胞肺癌的重要手段,并有效延長(zhǎng)了病人的生存期,提高了病人的生活質(zhì)量[13]。在肺癌分子水平的研究過程中,學(xué)者們發(fā)現(xiàn)肺腺癌是一種在分子水平上呈現(xiàn)出高度異質(zhì)性的慢性疾病,其發(fā)生發(fā)展是一個(gè)復(fù)雜的過程,涉及基因的異常表達(dá)、腫瘤微環(huán)境變化、腫瘤免疫細(xì)胞浸潤(rùn)、基因突變等,不同亞型肺腺癌的分子遺傳學(xué)和細(xì)胞內(nèi)信號(hào)通路可能完全不同,從而導(dǎo)致肺腺癌的治療反應(yīng)和臨床預(yù)后也不盡相同[14]。因此,深入研究肺腺癌的發(fā)生機(jī)制及預(yù)后相關(guān)的關(guān)鍵基因,對(duì)該病的臨床診斷、治療方案選擇、預(yù)后判斷具有重要價(jià)值。
POLE2基因是一種原癌基因,定位位于染色體14q22-q21上,分子量為59 000[15]。其主要功能是與人類DNA聚合酶ε其他兩個(gè)亞基(POLE3和POLE4)共同參與調(diào)控DNA的復(fù)制,催化DNA新鏈的合成,延長(zhǎng)DNA新鏈的活性,進(jìn)一步催化核酸外切酶區(qū)的校正活性等[16]。但該基因在腫瘤中的生物學(xué)功能目前仍不明確。李娜苗等[17]研究發(fā)現(xiàn),POLE2基因與肺癌A549細(xì)胞的增殖密切相關(guān),下調(diào)肺癌A549細(xì)胞POLE2基因的表達(dá),可以顯著抑制肺癌細(xì)胞的增殖。因此推測(cè)POLE2可能在肺腺癌中發(fā)揮著重要作用。
雖然POLE2基因在食管癌、直腸癌、乳癌以及肺癌組織中均有表達(dá)[18-19],但由于不同的研究實(shí)驗(yàn)條件不同,且單個(gè)研究樣本量相對(duì)較小,結(jié)論還有待于進(jìn)一步驗(yàn)證。本研究利用生物信息學(xué)技術(shù),通過GEPIA、Oncomine等多個(gè)公共數(shù)據(jù)庫中肺腺癌病人的基因表達(dá)譜和臨床信息來闡明POLE2在肺腺癌中的預(yù)后價(jià)值和潛在機(jī)制。利用GEPIA數(shù)據(jù)庫研究顯示,POLE2在包括肺腺癌在內(nèi)的多種腫瘤中高表達(dá)。Oncomine作為目前全世界最大的基因芯片數(shù)據(jù)庫研究平臺(tái),給廣大醫(yī)學(xué)研究者提供了不同腫瘤的基因芯片信息,綜合這些信息進(jìn)行分析,可以有效減少因樣本量較小導(dǎo)致的抽樣誤差,增加結(jié)論的可靠性。本研究在Oncomine數(shù)據(jù)庫中檢索出POLE2基因表達(dá)有關(guān)研究414項(xiàng),其中47項(xiàng)研究結(jié)果差異有統(tǒng)計(jì)學(xué)意義,45項(xiàng)研究顯示表達(dá)增高,2項(xiàng)研究顯示表達(dá)降低,總共包含172例研究樣本。符合篩選條件的研究有5項(xiàng),對(duì)其進(jìn)行薈萃分析,顯示POLE2基因差異表達(dá)中位數(shù)值排名為500.0,在肺腺癌中呈現(xiàn)高表達(dá)。Oncomine和GEPIA兩個(gè)數(shù)據(jù)庫相互驗(yàn)證結(jié)果表明,POLE2在肺腺癌中確實(shí)為高表達(dá),該結(jié)果與李娜苗等[17]的體外實(shí)驗(yàn)結(jié)果基本一致。分析其原因可能為,POLE2突變使得基因原本具有的校正功能缺失,大量堆積的偶然突變,抑制了Sp1元件的活性,使啟動(dòng)子活性不能得到完全激活,導(dǎo)致肺癌細(xì)胞生長(zhǎng)緩慢甚至死亡[20]。因此,POLE2基因?qū)τ诜蜗侔┎∪松骖A(yù)后的判斷有著重要意義。本研究Kaplan-Meier Plotter數(shù)據(jù)檢索結(jié)果也驗(yàn)證了POLE2表達(dá)水平的高低與肺腺癌病人的總生存期相關(guān),腫瘤組織POLE2基因表達(dá)水平高的病人總生存期比低表達(dá)組病人更短。HARTMANN等[21]的研究結(jié)果表明,在淋巴細(xì)胞腫瘤病人中,POLE2作為易感基因,其表達(dá)水平用于預(yù)測(cè)淋巴瘤病人的生存期也有重要價(jià)值。WU等[22]研究同樣得出相似的結(jié)論,即POLE2的高表達(dá)預(yù)示著肺鱗癌病人預(yù)后更差。導(dǎo)致這一現(xiàn)象的原因可能是,POLE2作為DNA復(fù)制、修復(fù)、重組和細(xì)胞周期控制的核心組分,主要涉及兩條有意義的通路,即堿基切除修復(fù)通路和核苷酸切除修復(fù)通路,通過調(diào)節(jié)這兩條通路中的上下游分子影響DNA復(fù)制、細(xì)胞的凋亡和增殖[23],從而影響病人的預(yù)后;其次,POLE2在肺腺癌中是一個(gè)癌基因,其致癌機(jī)制與POLE2高突變負(fù)荷和免疫檢查點(diǎn)相關(guān)基因的高表達(dá)有關(guān)[24]。本研究進(jìn)一步通過TIMER數(shù)據(jù)庫分析POLE2與免疫細(xì)胞的關(guān)系,結(jié)果顯示POLE2在肺腺癌免疫微環(huán)境中與B細(xì)胞、CD4+T細(xì)胞、CD8+T細(xì)胞、巨噬細(xì)胞、中性粒細(xì)胞及樹突狀細(xì)胞均無明顯相關(guān)性。提示POLE2基因可能與腫瘤免疫細(xì)胞浸潤(rùn)無關(guān)。推測(cè)其原因可能為POLE2的功能更多的是直接參與調(diào)控細(xì)胞的周期和增殖,而不是通過免疫細(xì)胞起作用。
因?yàn)楸狙芯亢Y選的基因芯片數(shù)據(jù)量大,樣本量較多,且方法異質(zhì)性較低,故本研究結(jié)果真實(shí)可靠。但由于樣本來源不同,可能會(huì)對(duì)最終結(jié)果造成一定的誤差;同時(shí),本研究結(jié)論缺乏獨(dú)立的體內(nèi)外實(shí)驗(yàn)驗(yàn)證,故需要后續(xù)實(shí)驗(yàn)加以確認(rèn)。
綜上所述,本研究通過深入挖掘以O(shè)ncomine為主的多個(gè)數(shù)據(jù)庫中POLE2基因芯片信息,證明POLE2基因在肺腺癌組織中呈現(xiàn)高表達(dá),且該基因高表達(dá)的肺腺癌病人總生存期更短。本研究結(jié)果可能為肺癌藥物的研發(fā)和肺癌病人的預(yù)后評(píng)估提供一定的生物學(xué)依據(jù)。
青島大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2022年1期