張明慧,李彥姝
(中國醫(yī)科大學 1.臨床醫(yī)學系;2.生命科學學院分子細胞生物學教研室,教育部醫(yī)學細胞生物學重點實驗室暨衛(wèi)健委細胞生物學重點實驗室,沈陽 110122)
LMO2基因首次發(fā)現(xiàn)于急性T淋巴細胞白血?。╝cute T lymphoblastic leukemia,T-ALL)患者[1],作為核轉(zhuǎn)錄因子促進胚胎造血與血管的生成[2]。研究[3]表明,LMO2可在多種實體組織和腫瘤中的細胞質(zhì)和細胞核表達。LMO2蛋白僅由2個串聯(lián)的LIM結(jié)構(gòu)域組成,在LDB1、GATA1、TAL1和E47構(gòu)成的轉(zhuǎn)錄復合物中起橋梁作用[4]。乳腺癌是全世界女性癌癥死亡的主要原因[5],也是目前中國女性最常見的癌癥。2014年中國新增乳腺癌病例估計數(shù)約為28萬例,因乳腺癌死亡人數(shù)約為6.6萬[6]。
無論在正常的乳腺導管上皮還是乳腺癌細胞中,LMO2均主要表達在胞質(zhì)中。通過阻斷LIMK1介導的CFL1磷酸化,LMO2促進板狀足/絲足的組裝形成,進而增加基底型乳腺癌細胞的侵襲和轉(zhuǎn)移[7-8]。此外,LMO2通過與DVL-1/2蛋白結(jié)合,減弱Wnt信號通路中β-catenin激活,因此,LMO2在乳腺癌細胞中的表達下調(diào)可促進細胞增殖,減少凋亡[9]。
本研究通過生物信息學分析LMO2 在乳腺癌中的表達以及LMO2及其共表達基因在乳腺癌中的生物學作用,有望為臨床以LMO2基因為靶點的乳腺癌治療提供依據(jù)。
本研究數(shù)據(jù)來源于Oncomine數(shù)據(jù)(http://www.oncomine.org/resource),基因表達譜數(shù)據(jù)動態(tài)分析(gene expression profiling interactive analysis,GEPIA)數(shù)據(jù)庫(http://gepia.cancer-pku.cn),人類蛋白質(zhì)圖譜(human protein atlas,HPA)數(shù)據(jù)庫(http://www.proteinatlas.org/),KM plotter 數(shù)據(jù)庫(http://kmplot.com/analysis/),Coexpedia 數(shù)據(jù)庫(http://www.coexpedia.org/)和FunRich 3.1.3.軟件。
1.2.1 Oncomine數(shù)據(jù)庫:腫瘤基因芯片數(shù)據(jù)庫與集成數(shù)據(jù)挖掘平臺,包含65個基因表達數(shù)據(jù)集,可提供腫瘤和正常組織的基因差異表達分析[10]。篩選條件為(1)gene:LMO2;(2)cancer type:breast cancer;(3)data type:mRNA;(4)analysis type:cancer vs normal analysis;(5)臨界值設(shè)定為P< 0.01,fold change>2,gene rank=top10% 。
1.2.2 HPA數(shù)據(jù)庫:免疫組織化學數(shù)據(jù)的公共存儲庫,該數(shù)據(jù)庫測定了蛋白在正常組織、細胞以及腫瘤病理組織的表達。篩選條件為(1)search:LMO2;(2)type:tissue atlas:breast caner;(3)分別選擇“tissue”“pathology”,組織來源為“female organs:breast”。
1.2.3 GEPIA 數(shù)據(jù)庫:分析來自TCGA和GTEx的數(shù)據(jù),提供關(guān)鍵的交互式和可定制的功能,包括差異表達分析、剖面繪制、相關(guān)性分析、患者生存分析、相似基因檢測和降維分析[11],分析LMO2在乳腺癌與正常組織中表達的水平。篩選條件為(1)Expression DIY:Box plot;(2)gene:LMO2;(3)data selection:BRCA。其他設(shè)為默認值。
1.2.3.1LMO2基因在腫瘤組織中的表達差異分析(1)cancer type analysis:differential genes analysis;(2)dataset:BRCA;(3)differential methods:LIMMA。
1.2.3.2 相關(guān)性分析 篩選條件為(1)correlation analysis;(2)gene A:LMO2,gene B:GIMAP6、TGFBR2、LHFP、PTPRB、CAV1;(3)Dataset selection:BRCA Tumor。
1.2.4 KM plotter 數(shù)據(jù)庫:采用包括乳腺癌在內(nèi)多種癌癥的基因表達和生存數(shù)據(jù)構(gòu)建的在線數(shù)據(jù)庫,評估LMO2在乳腺癌患者中的預后價值。篩選條件為(1)選 擇:Breast cancer;(2)gene:LMO2;(3)Split patients by:Auto select best cutoff;(4)Survival:分 別選擇“OS”“PPS”“RFS”。
1.2.5 Coexpedia數(shù)據(jù)庫:通過功能關(guān)聯(lián)進行評估的共表達[12],對 LMO2進行在乳腺癌中的分子調(diào)控網(wǎng)絡(luò)分析。篩選條件為(1)Submit:Human LMO2;(2)MeSH incl.Neoplasms:Breast Neoplasms。
1.2.6 FunRich 3.1.3.軟件:進行基因注釋分析,分別顯示LMO2及共表達基因的細胞組成(cellular component,CC)、分子功能(molecular function,MF)、生物學過程(biological process,BP)、信號通路(biological pathway,BPA)。篩選條件:(1)Add dataset:輸入LMO2和通過Coexpedia獲得的Score>3 的14個基因;(2)gene enrichment:analysis:Cellular component、Molecular function、Biological process、Biological pathway;(3)臨界值設(shè)定為P< 0.05。
1.2.7 R包 clusterProfiler:用作LMO2及其共表達的關(guān)鍵基因京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。富集顯著性的閾值設(shè)定為P< 0.05。
采用數(shù)據(jù)庫默認的統(tǒng)計學分析方法。乳腺癌與正常乳腺組織中 LMO2表達的比較采用單因素方差分析;LMO2與其關(guān)鍵基因的表達相關(guān)性采用Pearson分析;Kaplan-Meier 法繪制生存曲線,LMO2高、低表達組生存率的比較采用 log-rank 檢驗。P<0.05 為差異有統(tǒng)計學意義。
對 Oncomine 數(shù)據(jù)庫進行檢索分析后共納入涉及LMO2基因相關(guān)性研究結(jié)果 453 項,挑選出高表達7項和低表達 41項差異有統(tǒng)計學意義的結(jié)果進一步分析。腦和中樞神經(jīng)系統(tǒng)腫瘤中高表達2項;乳腺癌中低表達4項;結(jié)直腸癌中低表達6項;食管癌中低表達2項;頭頸癌中低表達2項;白血病中低表達6項;肺癌中低表達14項;淋巴瘤中低表達2項;黑色素瘤中低表達2項。見圖1。
圖1 LMO2基因在多種腫瘤中的表達Fig.1 LMO2 gene expression in multiple tumors
在GEPIA 數(shù)據(jù)庫中對乳腺癌(1 197例),乳腺癌組織(1 085例)及正常組織(112例)在mRNA水平上的表達情況進行比較,結(jié)果表明,LMO2在乳腺癌組織中的轉(zhuǎn)錄水平明顯低于正常組織,且差異有統(tǒng)計學意義(P< 0.05)。見圖2。
圖2 LMO2基因表達水平在乳腺癌中明顯低于正常乳腺組織Fig.2 LMO2 gene expression levels are significantly lower in breast cancer than in normal breast tissue
HPA 數(shù)據(jù)庫中的免疫組化染色結(jié)果證實,LMO2蛋白在乳腺癌組織中的表達明顯低于正常乳腺組織。且乳腺癌患者病理組織中LMO2主要定位于細胞質(zhì)或細胞膜。見圖3。
圖3 乳腺癌中LMO2蛋白表達水平低于正常乳腺組織Fig.3 LMO2 protein expression levels are lower in breast cancer than in normal breast tissue
采用 KM plotter 數(shù)據(jù)庫評估LMO2的表達水平對腫瘤患者總生存期(overall survival,OS)的影響,提示低表達水平的LMO2 在乳腺癌中預示更差的總生存期(P=0.002 2)。進一步分析結(jié)果顯示,LMO2低表達同樣預示著乳腺癌患者更差的后進展生存期(post progression survival,PPS)(P=0.045)和 更差的無復發(fā)生存期(release free survival,RFS)(P<0.001)。見圖4。
圖4 LMO2在乳腺癌患者中的預后價值Fig.4 The prognostic value of LMO2 in breast cancer patients
本研究利用Coexpedia數(shù)據(jù)庫篩選出LMO2基因在乳腺癌中調(diào)控的分子調(diào)控網(wǎng)絡(luò),得到LMO2的共表達基因共47個。其中score> 3的共表達基因有14個:ADGRL4、GIMAP6、PECAM1、TGFBR2、MEF2C、CD93、S1PR1、LHFP、GMFG、A2M、LDB2、KCTD12、PTPRB和CAV1。見圖5 。
采用 Funrich軟件進行基因注釋分析,細胞組成方面,8個基因主要分布在細胞膜,基因占比57.14%(P< 0.010)。分子功能方面分別在受體信號蛋白絲氨酸/蘇氨酸激酶活性、補體活性、受體信號蛋白酪氨酸磷酸酶活性起著重要作用。生物學過程方面,7個基因在信號傳導方面起著重要作用,基因占比46.67%(P=0.028)。信號通路方面,可能參與轉(zhuǎn)化生長因子-β(transforming growth factor-β,TGF-β)受體信號轉(zhuǎn)導、激活蛋白-1(activator protein-1,AP-1)轉(zhuǎn)錄因子網(wǎng)絡(luò))、上皮-間質(zhì)轉(zhuǎn)換等多種通路。見表1~4。
表1 LMO2共表達基因的細胞組成Tab.1 Subcellular localization of LMO2 co-expressed genes
表2 LMO2共表達基因的分子功能Tab.2 Molecular functions of LMO2 co-expressed genes
表3 LMO2共表達基因的生物學過程Tab.3 Biological processes mediated by LMO2 co-expressed genes
表4 LMO2共表達基因的信號通路Tab.4 Biological pathways occupied by LMO2 co-expressed genes
為了驗證上述14個關(guān)鍵基因是否在乳腺癌中存在差異性表達,采用GEPIA進行差異基因篩選,篩選出在乳腺癌與正常組織之間有顯著差異表達的基因3 559個,見圖6。
圖5 LMO2在乳腺癌中的共表達分子網(wǎng)絡(luò)Fig.5 Network of LMO2 co-expressed molecules in breast cancer
14個基因中,表達顯著上調(diào)的基因為CAV1(FC=1.008,P< 0.001),表達顯著下調(diào)的基因有GIMAP6(FC=-1.142,P< 0.001)、TGFBR2(FC=-1.373,P<0.001)、LHFP(FC=-1.075,P< 0.001)和PTPRB(FC=-1.537,P< 0.001)。見表5。
表5 LMO2的關(guān)鍵基因在乳腺癌及正常組織中的表達水平Tab.5 Expression levels of LMO2 hub genes in breast cancer and normal tissues
通過GEPIA進一步相關(guān)性分析發(fā)現(xiàn),LMO2在mRNA的表達水平與GIMAP6、TGFBR2、LHFP、PTPRB和CAV1等基因的mRNA表達呈顯著正相關(guān),其相關(guān)性系數(shù)r分別為 0.51、0.46、0.52、0.48、0.43。見圖7。
對LMO2、GIMAP6、TGFBR2、LHFP、PTPRB和CAV1進行 KEGG通路富集分析,結(jié)果顯示,上述6個基因富集于黏附連接、腫瘤內(nèi)轉(zhuǎn)錄調(diào)控失調(diào)、細胞內(nèi)吞等通路。見圖8。
過去LMO2被認為在胚胎造血以及血管生成中起著重要作用,并通過不同的致癌機制驅(qū)動T-ALL形成[13]。在造血細胞和內(nèi)皮細胞中,LMO2主要分布在細胞核內(nèi),而在上皮細胞和實體瘤細胞中則分布在細胞質(zhì)內(nèi)[9]。無論是在細胞核還是細胞質(zhì)中,LMO2都發(fā)揮著復雜的功能。作為轉(zhuǎn)錄調(diào)節(jié)因子時,LMO2主要通過與多種轉(zhuǎn)錄因子相互作用并定位到DNA的結(jié)構(gòu)域上,參與下游靶基因的調(diào)控[14]。而存在于細胞質(zhì)時,LMO2作為癌基因或腫瘤抑制因子,與其他蛋白結(jié)合參與腫瘤的發(fā)病過程[15]。
圖6 染色體上乳腺癌差異性表達基因Fig.6 Differentially expressed genes in breast cancer mapped to chromosomes
圖7 LMO2與核心基因表達的相關(guān)性Fig.7 Correlation between LMO2 and expression of core genes
圖8 LMO2與核心基因的KEGG富集分析Fig.8 KEGG pathways enriched with LMO2 and core genes
本研究通過Oncomine分析LMO2在各腫瘤中的表達情況。在有統(tǒng)計學意義的4項乳腺癌的研究中,LMO2集中表達高、低均有報道,可能與乳腺癌的不同亞型及樣本量大小有關(guān)。利用GEPIA及HPA數(shù)據(jù)庫,發(fā)現(xiàn)LMO2在乳腺癌組織中轉(zhuǎn)錄水平及蛋白表達水平均低于正常組織。此外,低表達LMO2預示著乳腺癌患者更差的OS。這些進一步提示LMO2可能在乳腺癌的發(fā)病過程中作為腫瘤抑制因子發(fā)揮作用,同時可以作為預后指標預測乳腺癌患者生存。
為了清楚LMO2參與調(diào)控哪些分子生物學網(wǎng)絡(luò),采用 Coexpedia數(shù)據(jù)庫挖掘,并應(yīng)用FunRich 3.1.3.軟件著重分析score>3 的LMO2共表達基因,分析其中的分子功能和生物學過程作用。如ADGRL4、GIMAP6和PECAM等基因參與信號轉(zhuǎn)導通路的建立,TGFBR2參與細胞增殖的調(diào)節(jié),這些基因均可能在乳腺癌細胞增殖、侵襲、轉(zhuǎn)移過程中與LMO2基因發(fā)揮重要作用。
進一步探究這些與LMO2關(guān)系密切的基因在乳腺癌和正常人群中是否呈差異性表達,結(jié)果顯示,GIMAP6、TGFBR2、LHFP和PTPRB4個基因與LMO2相同,在乳腺癌中呈低表達,而CAV1基因則相反,呈高表達。其中GIMAP6、LHFP和CAV1參與上皮細胞向間質(zhì)細胞轉(zhuǎn)化(epithelial-mensenchymal transition,EMT),EMT是腫瘤發(fā)生發(fā)展的重要驅(qū)動因素,研究[16]已證明EMT的激活是產(chǎn)生癌癥干細胞的主要機制。此外,TGFBR2與CAV1共同參與 TGF-β受體信號通路,TGF-β在乳腺癌早期起增殖抑制和凋亡誘導作用,在晚期可促進腫瘤的侵襲[17]。相關(guān)性分析結(jié)果顯示,LMO2與GIMAP6、TGFBR2、LHFP、PTPRB和CAV1的表達均有明顯的相關(guān)性。KEGG分析表明,這些基因富集于黏附連接、腫瘤內(nèi)轉(zhuǎn)錄調(diào)控失調(diào)等通路,表明LMO2很可能與這些基因相互作用,共同參與乳腺癌的癌變、侵襲、轉(zhuǎn)移。
乳腺癌是一種多因素、異質(zhì)性疾病,需要臨床敏銳性和多學科的診斷和治療方法。本研究對多個腫瘤數(shù)據(jù)庫進行挖掘,明確了LMO2基因在乳腺癌中轉(zhuǎn)錄水平及蛋白表達水平均下降。通過生物信息分析學技術(shù)發(fā)掘在乳腺癌發(fā)病過程中有潛在研究價值的重要基因,以及乳腺癌與正常組織間的差異表達基因,并對這些關(guān)鍵基因進行細胞組成、分子功能、生物學過程及信號通路等方面的注釋,能夠為臨床上乳腺癌的治療提供新靶點。