劉夢媛,鄭 翔,許永杰,王進京,馮姍姍,張志敏,吳明松,李學英
(1.遵義醫(yī)科大學 醫(yī)學遺傳學教研室,貴州 遵義 563099;2.貴州省人民醫(yī)院 檢驗科,貴州 貴陽 550002;3.遵義醫(yī)科大學附屬醫(yī)院 病理科,貴州 遵義 563099;4.遵義醫(yī)科大學 貴州省普通高等學??谇患膊⊙芯刻厣攸c實驗室暨遵義市口腔疾病研究重點實驗室,貴州 遵義 563006)
2018年全球癌癥統(tǒng)計數(shù)據(jù)顯示肺癌發(fā)病率居第二,死亡率居第一[1]。在我國,肺癌也是最主要的致死癌癥之一[2],嚴重威脅著人類的健康。肺癌分為非小細胞肺癌(Non-small cell lung cancer,NSCLC)和小細胞肺癌(Small cell lung cancer,SCLC),其中NSCLC約占肺癌的80%~85%,肺腺癌和肺鱗癌是NSCLC的兩種主要病理亞型,是肺癌相關死亡的主要原因之一。隨著手術、放療、化療等治療方法的進步,肺癌預后得到改善,但5年生存率仍不高[3-4]。因此,識別肺癌的潛在生物標志物,進一步探索肺癌發(fā)病的分子機制是一項緊迫而具有挑戰(zhàn)性的任務。本課題組前期研究發(fā)現(xiàn)ERGIC3異常高表達也促進非小細胞肺癌細胞增殖和遷移,但ERGIC3基因的作用機制及其與LUAD病理特征的相關性尚未研究。本研究旨在通過多個數(shù)據(jù)庫驗證ERGIC3在LUAD中的表達及其與腫瘤病理特征及預后的關系,為LUAD的預后及發(fā)展機制的研究提供新的思路。
內(nèi)質(zhì)網(wǎng)高爾基中間隔室蛋白3(Endoplasmic reticulum-Golgi intermediate compartment 3,ERGIC3)又稱Erv46、ERp43,定位于染色體20q11.22,包括14個外顯子。所編碼的蛋白質(zhì)的分子量為43.2kDa,是由 383個氨基酸殘基組成的II型跨膜蛋白,也是ERGIC膜蛋白家族成員之一,作為COPII囊泡的成分[5],介導分泌性蛋白從糙面內(nèi)質(zhì)網(wǎng)到順面高爾基網(wǎng)的運輸,還有助于新合成的蛋白質(zhì)的折疊、糖基化[6]。抑制ERGIC3表達可影響細胞生長和內(nèi)質(zhì)網(wǎng)應激誘導的細胞死亡[7-8]。此外,ERGIC3是一新的腫瘤相關基因,在多種腫瘤中異常高表達,可促進非小細胞肺癌[7,9-12]生長,且在肝癌[13]中異常高表達,但ERGIC3在肺腺癌中的作用機制及與生存預后的關系尚需進一步探索。眾所周知,腫瘤的發(fā)病機制極為復雜,高通量測序技術在復雜疾病中的應用具有獨特優(yōu)勢。尤其在腫瘤組織中,腫瘤細胞、免疫細胞和其它類型細胞之間,構(gòu)成了復雜的微環(huán)境,為腫瘤的發(fā)生發(fā)展、預防治療提供了重要的環(huán)境基礎。
癌癥基因組圖譜(The cancer genome atlas,TCGA)計劃通過基因芯片技術、高通量基因組測序,結(jié)合多維數(shù)據(jù)整合分析方法,將人類34種類型癌癥的基因表達水平及基因組變異圖譜繪制出來,獲得了海量數(shù)據(jù)。這些數(shù)據(jù)使對癌癥分子遺傳學的了解進程加快,為精準醫(yī)療和個體化治療奠定了堅實的基礎,開啟了癌癥研究的新時代[14-15],也極大地推動了生物信息學與醫(yī)學的相互發(fā)展。生物信息學是多學科交叉,以互聯(lián)網(wǎng)為媒介,數(shù)據(jù)庫為載體,收集、整理和分析DNA和蛋白質(zhì)等的學科,從分子層面揭示疾病潛在的作用方式和發(fā)生機制。通過生信分析篩選出與疾病相關的潛在基因、miRNA和信號通路等,為臨床上對該疾病的早期診斷和治療提供科學依據(jù)。因此,本研究基于TCGA公共數(shù)據(jù)集,利用生物信息學方法,挖掘ERGIC3在肺腺癌免疫微環(huán)境中的作用及其預后價值,以期為深入探索ERGIC3在肺腺癌中的作用機制提供依據(jù)。
1.1 ERGIC3表達水平分析 通過TIMER 1.0(http://timer.cistrome.org/)[16]識別ERGIC3在泛癌中的表達,UALCAN(http://ualcan.path.uab.edu/)用于評價ERGIC3在肺腺癌中的表達及與臨床病理信息的相關性。The Human Protein Atlas(HPA)(https://www.proteinatlas.org/)[17-18]被用來比較ERGIC3在LUAD及正常肺組織中的蛋白質(zhì)水平的表達差異。
1.2 生存預后分析 基于Kaplan-Meier plotter(https://kmplot.com/analysis/index.php?p=service&cancer=lung)按照默認參數(shù)對ERGIC3進行單因素生存分析。以總生存期(Overall survival,OS)、首次進展生存期(first progression,FP)和進展后生存期(Post-progression survival,PPS)為生存分析的指標。
1.3 蛋白互作和GO富集分析 使用 STRING(http://www.string-db.org)數(shù)據(jù)庫預測與ERGIC3相互作用的蛋白,并通過WEB-based GEneSeTAnaLysis Toolkit (WebGestalt)(http://www.webgestalt.org/)[19]網(wǎng)站對與ERGIC3互作的基因進行功能富集分析。
1.4 免疫浸潤分析 通過TIMER 1.0(http://timer.cistrome.org/)[16]檢測ERGIC3表達與LUAD中6種免疫細胞(B細胞、CD8+T細胞、CD4+T細胞、巨噬細胞、中性粒細胞和樹突狀細胞)的浸潤水平的相關性。
1.5 microRNA預測 應用TargetScan(http://www.targetscan.org/vert_72/)、starbase(https://starbase.sysu.edu.cn/)和miRDB(http://mirdb.org/)3個在線數(shù)據(jù)庫預測可能靶向ERGIC3的microRNA,并通過Venny2.1.0(https://bioinfogp.cnb.csic.es/tools/venny/index.html)對上述3個網(wǎng)站預測的microRNA取交集。
1.6 統(tǒng)計學分析 差異表達、蛋白網(wǎng)絡、免疫浸潤和microRNA預測等采用在線分析工具分析。生存數(shù)據(jù)采用log-rank檢驗,P<0.05認為差異有統(tǒng)計學意義。
2.1 ERGIC3在肺腺癌中顯著高表達 使用TIMER獲得ERGIC3在多種腫瘤中的差異表達結(jié)果,ERGIC3在LUAD中表達差異明顯(見圖1A)。應用UALCAN對TCGA的515個肺腺癌組織和59個對照肺組織樣本數(shù)據(jù)進行分析,發(fā)現(xiàn)ERGIC3在肺腺癌中的mRNA水平高表達,而在肺組織中低表達(P<0.05,見圖1B)。為驗證這一趨勢,檢測HPA免疫組織化學染色結(jié)果,可以看到ERGIC3在肺腺癌組織中染色強度多為中強陽性,而在正常肺組織中表達極弱或陰性(見圖1C)。從這些數(shù)據(jù)可以預測,ERGIC3的表達升高可能促進肺腺癌生長。
A:ERGIC3在泛癌中的表達水平;B:ERGIC3在肺腺癌中表達明顯增高; C:ERGIC3在LUAD組織和正常肺組織中的免疫組化分析結(jié)果。
2.2 ERGIC3表達與肺腺癌臨床病理特征的相關性 通過UALCAN分析ERGIC3的表達與肺腺癌臨床特征的相關性發(fā)現(xiàn),與正常組相比,ERGIC3在患者不同性別(見圖2A)、吸煙習慣(見圖2B)、年齡(見圖2C)和種族(見圖2D);各個分期(見圖2E);腫瘤不同組織學類型(見圖2F);轉(zhuǎn)移淋巴結(jié)(見圖2G)和TP53突變腫瘤組織中(見圖2H)均高表達。有趣的是,在煙齡小于15年的患者中ERGIC3的表達高于煙齡大于15年的患者(P<0.05), 在性別上,男女性患者腫瘤組織中ERGIC3表達量升高(P<0.05),男性高于女性(P<0.05)。而ERGIC3在不同年齡和種族等的肺腺癌組織表達無差異(P>0.05)。
A:ERGIC3在患者不同性別;B:吸煙習慣;C:年齡;D:種族;E:各個分期;F:腫瘤不同組織學類型;G:轉(zhuǎn)移淋巴結(jié);H:TP53突變腫瘤組織中的表達情況。
2.3 ERGIC3在肺腺癌中的預后價值 為了探討ERGIC3對肺腺癌生存期的影響,我們應用Kaplan-meier構(gòu)建模型,評估了ERGIC3在肺腺癌中的預后價值。結(jié)果顯示,ERGIC3的高表達水平與肺腺癌患者不良的總體生存率(n=1 927)有關,中位生存期約為75個月,5年生存率約為50%(見圖3A)。此外,ERGIC3高表達的肺腺癌患者首次進展生存期(n=982)(見圖3B)和進展后生存期(n=344)(見圖3C)相對于低表達的肺腺癌患者更短,中位生存期分別約為60個月和15個月,5年生存率分別約為50%和15%(見圖3B、C)。提示ERGIC3與肺腺癌的發(fā)生發(fā)展密切相關,且ERGIC3表達上調(diào)與肺腺癌患者預后不良相關。
A:ERGIC3高表達或低表達與總生存期;B:首次進展生存期;C:進展后生存期的關系。
2.4 ERGIC3的蛋白互作及可能的生物學功能 為了進一步研究肺腺癌中ERGIC3的潛在生物學功能,利用STRING數(shù)據(jù)庫鑒定到10個與ERGIC3相互作用的蛋白質(zhì),分別是ERGIC2、SEC13、SEC63、RER1、SURF4、MAGT1、GTPBP3、COG3、VPS45和PHF3(見圖4A)。篩選出與ERGIC3有互作關系的基因后,對基因相關的功能進行注釋,以條形圖形式集中展示了ERGIC3相關基因在GO的3個層次下富集條目的分布,分別是生物過程(見圖4B)、細胞組分(見圖4C)和分子功能(見圖4D)。這些基因在生物過程條目下主要富集在Localization、Metabolic process、Biological regulation、Cellular component organization和Response to stimulus(見圖4B)。在細胞組分條目中主要是Endomembrane system、Membrane、Endoplasmic reticulum、Golgi apparatus和Vesicle顯著富集(見圖4C),而在分子功能條目中主要是Protein binding、Transporter activity、Ion binding、Structural molecule activity和Nucleic acid binding是分組中的顯著富集項(見圖4D)。以上提示,ERGIC3參與的功能集中在分子合成、轉(zhuǎn)運、修飾、定位和細胞應激,這些細胞功能主要在細胞的內(nèi)膜系統(tǒng)中進行,說明ERGIC3相關基因在蛋白質(zhì)從內(nèi)質(zhì)網(wǎng)到高爾基復合體的運輸中發(fā)揮了重要作用。
A:ERGIC3的蛋白互作關系,網(wǎng)絡節(jié)點是蛋白質(zhì),邊表示蛋白質(zhì)之間的相互作用;B~D:與ERGIC3相關基因的GO功能富集分析。
2.5 ERGIC3差異表達與免疫浸潤的相關性分析 本課題組前期研究表明,ERGIC3在肝癌中是一個免疫相關基因,于是我們采用TIMER 1.0算法評估了ERGIC3表達量與肺腺癌中免疫細胞浸潤水平的相關性。結(jié)果顯示,ERGIC3的表達與腫瘤細胞純度呈微弱的正相關(r=0.18,P<0.05)。ERGIC3水平與CD8+T細胞浸潤水平(r=-0.164,P<0.05)、CD4+T細胞浸潤水平(r=-0.163,P<0.05)、巨噬細胞浸潤水平(r=-0.136,P<0.05)、嗜中性粒細胞浸潤水平(r=-0.223,P<0.05)和樹突狀細胞浸潤水平(r=-0.222,P<0.05)呈負相關。有趣的是,B 細胞浸潤水平(r=-0.086,P>0.05)與ERGIC3的表達無顯著相關性(見圖5)。
圖5 在肺腺癌中ERGIC3的表達與腫瘤純度和免疫細胞浸潤水平的相關性
2.6 以E RGIC3為靶點的microRNA預測 很多癌癥相關基因受microRNA調(diào)控,microRNA在腫瘤的發(fā)生發(fā)展中起到重要作用[20]。我們通過TargetScan、starbase和miRDB 3個網(wǎng)站預測與ERGIC3 mRNA 的3’-UTR相互作用的潛在microRNA。在TargetScan中鑒定出57個microRNA,starbase和miRDB分別預測到10個和6個microRNA。Venny2.1.0對上述3個網(wǎng)站預測的microRNA取交集,結(jié)果顯示,只有hsa-miR-4731-5p是TargetScan、starbase和miRDB的共同元素??梢姡珽RGIC3可能通過microRNA途徑調(diào)控肺腺癌細胞的病理生理學功能。
圖6 3種生物信息學算法預測的microRNA數(shù)量
ERGIC3是ERGIC膜蛋白家族成員之一,主要參與蛋白質(zhì)的囊泡運輸[5-6,8,21]。GO富集分析結(jié)果顯示ERGIC3相關基因主要富集在細胞內(nèi)膜系統(tǒng)、內(nèi)質(zhì)網(wǎng)、高爾基復合體和囊泡等方面,這與先前報道相符合。囊泡運輸對于細胞的生理過程至關重要, 其運輸障礙與腫瘤發(fā)生發(fā)展密切相關[22]。通過分析我們認為異常表達的ERGIC3可能通過調(diào)節(jié)蛋白質(zhì)如血管內(nèi)皮生長因子(Vascular endothelial growth factor,VEGF)[10]的細胞內(nèi)運輸來影響肺腺癌細胞增殖和遷移。我們通過大數(shù)據(jù)研究,新發(fā)現(xiàn)ERGIC3還參與到了肺腺癌免疫微環(huán)境的調(diào)控。
近年來,腫瘤免疫療法獲得了發(fā)展勢頭,通過增強T細胞活性來調(diào)節(jié)T細胞反應的藥物已經(jīng)在廣泛的實體腫瘤中顯示出了臨床療效[23]。免疫檢查點抑制劑如程序性細胞死亡蛋白1(Programmed cell death protein1,PD-1)/程序性細胞死亡蛋白配體1(Programmed cell death protein ligand1,PD-L1)抑制劑為肺癌、腎癌和其他類型的腫瘤帶來更多的生存獲益,并已被批準用于某些癌癥的治療[23]。為進一步闡明肺腺癌中ERGIC3的免疫功能,使用TIMER算法計算免疫細胞群的豐度,ERGIC3的表達水平與CD8+T細胞、CD4+T細胞、巨噬細胞、嗜中性粒細胞和樹突狀細胞呈負相關,而與B細胞無關。研究表明各種免疫細胞對肺癌細胞的生長均有顯著影響[24-25],比如M2型的巨噬細胞通過促進腫瘤血管形成參與腫瘤的增殖轉(zhuǎn)移等[26]。提示ERGIC3在LUAD發(fā)生發(fā)展的病理生理學中,其高表達抑制了上述免疫細胞進入腫瘤組織,從而抑制免疫細胞對腫瘤細胞的清除作用,進而調(diào)控腫瘤細胞的惡性生物學過程。
microRNA在轉(zhuǎn)錄后水平通過靶向不同的基因參與癌癥的發(fā)生和進展[20,27]。本研究借助TargetScan、starbase和miRDB及Venny2.1.0發(fā)現(xiàn)hsa-miR-4731-5p可能是以ERGIC3為靶點的新的microRNA。先前研究發(fā)現(xiàn)miR-490-3p通過靶向ERGIC3調(diào)節(jié)肝癌細胞生長和上皮向間質(zhì)轉(zhuǎn)化 (Epithelial-mesenchymal transition, EMT)[13],然而,并沒有發(fā)現(xiàn)miR-490-3p顯著影響NSCLC細胞中ERGIC3的表達[9],可見,ERGIC3在不同癌癥中的調(diào)控機制可能不同。此外,文獻表明miR-203a下調(diào)誘導NSCLC細胞中ERGIC3過表達[9]。hsa-miR-4731-5p[28],尤其是miR-203a[29]是潛在的肺腺癌的腫瘤標志物,可能為肺腺癌的早期診斷和預后評估增加新成員。
總之,該研究除了進一步證明ERGIC3在肺腺癌中高表達、與肺腺癌細胞的增殖轉(zhuǎn)移有關外,新發(fā)現(xiàn)為ERGIC3在肺腺癌的免疫調(diào)節(jié)中的潛在作用,以及與ERGIC3調(diào)控相關的microRNA在肺腺癌的發(fā)病機制與潛在預后生物標志物的開發(fā)具有重要意義。