李瑋瑋,朱 瑩
(1.惠州衛(wèi)生職業(yè)技術(shù)學(xué)院醫(yī)學(xué)技術(shù)系,廣東惠州 516025;2.南方醫(yī)科大學(xué)附屬東莞人民醫(yī)院病理科,廣東 東莞 523059)
乳腺癌是女性常見惡性腫瘤之一,占女性新發(fā)腫瘤的30%[1]。早期診斷和精準(zhǔn)治療策略雖然極大的改善了乳腺癌患者的整體預(yù)后,但在女性腫瘤患者中,乳腺癌死亡率仍排名第二[1]。乳腺癌具有獨(dú)特的分子病理學(xué)特征,其中雌激素受體(estrogen receptor,ER)、孕激素受體(progesterone receptor,PR)、人類表皮生長因子受體2(human epidermal growth factor receptor-2,HER-2)、Ki67 已為乳腺癌亞分類、患者精準(zhǔn)診療和預(yù)后評估提供了重要的信息,大大降低了患者的死亡率[2]。然而,鑒于腫瘤復(fù)發(fā)、轉(zhuǎn)移的出現(xiàn)以及精準(zhǔn)治療的迫切性,探尋新的生物標(biāo)志物成為當(dāng)前乳腺癌研究的主要方向之一。
MYB 家族包括MYB(C-Myb)、MYBL1(A-Myb)和MYBL2(B-Myb),每個家族成員識別共同的DNA 基序激活下游基因表達(dá),發(fā)揮重要的轉(zhuǎn)錄調(diào)控功能,但它們參與的調(diào)控機(jī)制和生物學(xué)功能卻有所區(qū)分[3-5]。創(chuàng)始者成員MYB是一種參與細(xì)胞增殖、分化的重要轉(zhuǎn)錄因子,它通過基因擴(kuò)增、染色體易位、轉(zhuǎn)錄活性增加等方式異常表達(dá),調(diào)控細(xì)胞增殖、分化、凋亡、DNA損傷等生物學(xué)功能,發(fā)揮致癌作用[4,6-8],促進(jìn)乳腺癌[6]、結(jié)直腸癌[9]、白血病[10]等惡性腫瘤發(fā)生發(fā)展。MYBL1通過基因重排形成融合基因(如MYBL1-NFIB)[7]或通過基因負(fù)調(diào)控片段(C-端結(jié)構(gòu)域)缺失的方式異常表達(dá)[11],促進(jìn)乳腺腺樣囊性癌[7]、兒童彌漫性低級別膠質(zhì)瘤[11]和淋巴細(xì)胞白血病[12]的發(fā)生和發(fā)展。MYBL2 是腫瘤細(xì)胞周期進(jìn)展、細(xì)胞存活和上皮細(xì)胞-間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT)的中心調(diào)控因子,影響細(xì)胞增殖、耐藥性以及腫瘤轉(zhuǎn)移等生物功能[5],其過表達(dá)常常與乳腺癌[5,13]、肺癌[14]、肝癌[15]等腫瘤不良預(yù)后相關(guān)。
近年來,基于大型數(shù)據(jù)庫分析生物標(biāo)志物已被腫瘤研究領(lǐng)域廣泛接受。盡管MYB家族在腫瘤發(fā)生發(fā)展過程中發(fā)揮重要作用,但每個家族成員在乳腺癌中的臨床價值仍未得到充分闡明。因此,本研究通過多個數(shù)據(jù)平臺綜合分析MYB家族在乳腺癌中的表達(dá)及預(yù)后價值,探究其對乳腺癌轉(zhuǎn)移復(fù)發(fā)的臨床意義。
Oncomine包含多種大型腫瘤基因芯片數(shù)據(jù)庫,用于分析多種腫瘤中基因轉(zhuǎn)錄水平變化(http://www.oncomine.org)[16]。本研究利用該數(shù)據(jù)庫對MYB 家族成員在乳腺癌和正常乳腺中的表達(dá)進(jìn)行比較。以改變倍數(shù)閾值>1.5,P<0.05被認(rèn)為差異具有統(tǒng)計(jì)學(xué)意義。
基因表達(dá)譜數(shù)據(jù)動態(tài)分析(gene expression profiling interactive analysis 2,GEPIA2)數(shù)據(jù)庫由北京大學(xué)研發(fā),用于分析腫瘤基因組圖譜(The Cancer Genome Atlas,TCGA)和基因型-組織表達(dá)(genotypetissues expression,GTEx)數(shù)據(jù)庫中不同腫瘤和正常組織樣本中的基因mRNA 表達(dá)(http://gepia2.cancer-pku.cn)[17]。本研究用于分析MYB家族基因在浸潤性乳腺癌(breast invasive carcinoma,BRCA)和正常乳腺組織中的表達(dá)。
TCGA 數(shù)據(jù)庫(https://cancergenome.nih.gov/)從分子水平上描述了2萬多例原發(fā)性腫瘤,并匹配了33種腫瘤對應(yīng)的正常樣本,包含測序數(shù)據(jù)和臨床樣本數(shù)據(jù)[18]。cBioPortal(https://www.cbioportal.org/)通過多功能可視化分析腫瘤樣本研究基因組數(shù)據(jù),實(shí)現(xiàn)復(fù)雜的腫瘤基因組和臨床特征的整合分析[19]。本研究利用該平臺BRCA數(shù)據(jù)庫(TCGA,F(xiàn)irehose Legacy)中1 108例患者的基因表達(dá)信息,其中含有突變、拷貝數(shù)變異和mRNA 表達(dá)數(shù)據(jù)的樣本量960 例,用于進(jìn)一步分析MYB 家族基因變異情況和篩選MYB 家族的共表達(dá)基因(co-expression genes)。設(shè)置Spearman 相關(guān)系數(shù)|R|≥0.6為共表達(dá)基因的篩選條件。
乳腺癌基因表達(dá)數(shù)據(jù)挖掘工具(Breast Cancer Gene-Expression Miner v4.4,bc-GenExMiner v4.4,http://bcgenex.centregauducheau.fr/BC-GEM)是一種乳腺癌基因表達(dá)數(shù)據(jù)挖掘工具,于2019 年12 月進(jìn)行數(shù)據(jù)更新[20-21]。它被用于分析MYB 家族基因的mRNA 表達(dá)水平與多項(xiàng)臨床病理參數(shù)之間的關(guān)系、Cox 分析和無轉(zhuǎn)移復(fù)發(fā)生存(metastatic relapse-free survival,MRFS)的預(yù)后評估。
用Kaplan-Meier Plotter(https://kmplot.com/analysis/)[22]在線分析3 951名乳腺癌患者中MYB家族基因表達(dá)的無復(fù)發(fā)生存(relapse-free survival,RFS)和進(jìn)展后生存(post progression survival,PPS)的預(yù)后價值。分別根據(jù)MYB家族基因中位表達(dá)水平將乳腺癌患者分為高表達(dá)和低表達(dá)兩組,選擇Jet Set 最佳探針集[23],Kaplan-Meier曲線評價RFS和PPS預(yù)后。
DAVID[24](https://david.ncifcrf.gov/)是一個整合生物信息數(shù)據(jù)庫,可提供大規(guī)?;蚧虻鞍琢斜硐到y(tǒng)綜合的生物功能注釋信息。采用DAVID 進(jìn)行MYBL2共表達(dá)基因GO(gene ontology)功能分析和KEGG(Kyoto Encyclopedia of Gene and Genomes)信號通路的富集分析。
Oncomine 分析P值和兩組計(jì)量數(shù)據(jù)比較采用Student'st檢驗(yàn)。利用GraphPad Prism 8 軟件繪圖。bc-GenExMiner v4.4 分析數(shù)據(jù)采用Welch 檢驗(yàn)、事后Dunnett-Tukey-Kramer 檢驗(yàn)、單因素和多因素Cox 分析。以P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
Oncomine 分析結(jié)果顯示,在乳腺癌、結(jié)直腸癌、胃癌等多個數(shù)據(jù)集中,其腫瘤組織的MYB家族基因表達(dá)高于相應(yīng)正常組織,見圖1。其中,MYB、MYBL1和MYBL2分別在17個、14個和15個數(shù)據(jù)集的乳腺癌組織中表達(dá)高于正常乳腺組織,差異具有統(tǒng)計(jì)學(xué)意義(P<0.05,圖1)。同時,MYB 家族基因在不同乳腺癌類型中呈現(xiàn)出高表達(dá),如浸潤性導(dǎo)管癌、浸潤性小葉癌和乳腺小管癌等,見表1。此外,利用GEPIA2分析結(jié)果顯示,1 085 例浸潤性乳腺癌組織中MYB 和MYBL2 mRNA表達(dá)高于291例正常乳腺組織,差異具有統(tǒng)計(jì)學(xué)意義(P<0.01,圖2A和2C),而MYBL1 mRNA表達(dá)的差異不明顯(圖2B)。
基于cBioPortal 分析乳腺癌數(shù)據(jù)集(TCGA,F(xiàn)irehose Legacy),結(jié)果顯示,其中960 例乳腺癌患者(microarray數(shù)據(jù))中MYB家族基因發(fā)生變異率為24.79%(238/960,圖3A)。MYB基因表達(dá)變異率為7.92%,其中mRNA 低表達(dá)占4.17%(40 例);MYBL1基因表達(dá)變異率為16.04%,主要表現(xiàn)為基因擴(kuò)增(占7.29%,70例)和mRNA 高表達(dá)(占6.35%,61 例);MYBL2基因表達(dá)變異率為7.08%,主要表現(xiàn)為mRNA 高表達(dá)(占3.85%,37 例)(圖3A,表2)。MYB、MYBL1和MYBL2基因在乳腺癌組織中突變率低,分別為1.15%、0.31%和0.42%(表2)。進(jìn)一步分析基因拷貝數(shù)變異(copynumber variation,CNV)與mRNA表達(dá)的關(guān)系,結(jié)果顯示隨著MYB家族基因CNV不斷增加(二倍體<輕度增加<擴(kuò)增),MYB mRNA 水平并未逐漸升高(圖3B),而MYBL1 和MYBL2 mRNA 表達(dá)不斷升高,差異具有統(tǒng)計(jì)學(xué)意義(P<0.01,圖3C和3D)。
圖1 MYB家族基因在多種腫瘤中的表達(dá)水平(Oncomine數(shù)據(jù)庫)
使用bcGenExMiner v4.4 在線分析MYB 家族基因mRNA 表達(dá)與乳腺癌患者不同臨床病理特征的相關(guān)性(表3)。結(jié)果表明,高齡患者組(>51 歲)MYB mRNA 表達(dá)升高,而MYBL1和MYBL2的表達(dá)降低(P<0.01)。淋巴結(jié)轉(zhuǎn)移陽性患者組中的MYBL2 表達(dá)升高(P=0.002),但MYB 和MYBL1 的表達(dá)無明顯差異。ER+、PR+患者組中,MYB 表達(dá)升高(P<0.01),而HER-2+、三陰性乳腺癌(triple negative breast cancer,TNBC)、基底細(xì)胞樣乳腺癌(basal-like breast carcinoma,BLBC)和P53 突變?nèi)橄侔┗颊咧校琈YB 表達(dá)降低(P<0.01)。MYBL1 在ER+、PR+、HER-2+乳腺癌患者組中表達(dá)降低,但其在TNBC、BLBC 和P53 突變?nèi)橄侔┗颊呓M中表達(dá)升高(P<0.01)。與MYB結(jié)果完全相反,MYBL2在ER+、PR+患者組中表達(dá)下降,而在HER-2+、TNBC、BLBC 和P53 突變?nèi)橄侔┗颊呓M中表達(dá)升高(P<0.001)。此外,Scarff-Bloom-Richardson(SBR)分級越高,乳腺癌患者M(jìn)YB 表達(dá)水平越低(P<0.01,圖4A),而MYBL1 和MYBL2 表達(dá)逐漸升高(P<0.01,圖4B 和4C)。
表1 Oncomine數(shù)據(jù)庫分析MYB家族在不同乳腺癌類型中表達(dá)的差異
圖2 MYB家族在BRCA和正常乳腺組織中的mRNA表達(dá)差異(GEPIA2)
表2 浸潤性乳腺癌中MYB家族基因變異類型分析
Kaplan-Meier Plotter 在線分析結(jié)果顯示,MYB 家族成員mRNA表達(dá)與乳腺癌患者的無復(fù)發(fā)生存(RFS)相關(guān)(P<0.01)。其中,MYB高表達(dá)乳腺癌患者的RFS 比其低表達(dá)患者的RFS 更長(圖5A)。而MYBL1和MYBL2高表達(dá)的乳腺癌患者RFS 顯著縮短(圖5B 和5C)。進(jìn)一步分析MYB 家族基因表達(dá)與乳腺癌患者進(jìn)展后生存(PPS)的相關(guān)性,結(jié)果顯示:MYB低表達(dá)和MYBL2高表達(dá)乳腺癌患者PPS 顯著縮短(圖5D 和5F),而MYBL1 表達(dá)與乳腺癌患者PPS 無明顯相關(guān)關(guān)系(圖5E)。此外,利用bc-GenExMiner v4.4 進(jìn)行單因素Cox分析在轉(zhuǎn)移復(fù)發(fā)乳腺癌患者中,不同淋巴結(jié)狀態(tài)(N,nodal status)和ER 狀態(tài)下,MYB 家族基因表達(dá)與預(yù)后的關(guān)系見表4。結(jié)果顯示,在混合表達(dá)狀態(tài)Nm/ERm或N+/ERm(mixed expression status,m)的轉(zhuǎn)移復(fù)發(fā)乳腺癌患者中,MYB高表達(dá)患者預(yù)后好(P<0.01);在Nm/ER+或N-/ER+的轉(zhuǎn)移復(fù)發(fā)乳腺癌患者中,MYBL1高表達(dá)患者預(yù)后差(P<0.05);而在不同淋巴結(jié)狀態(tài)下,ERm或ER+的轉(zhuǎn)移復(fù)發(fā)乳腺癌患者中,MYBL2高表達(dá)患者預(yù)后 差(P<0.01)。同 時,MYB表 達(dá) 降 低、MYBL1和MYBL2表達(dá)升高的乳腺癌患者均具有較短的無轉(zhuǎn)移復(fù)發(fā)生存(MRFS)(P<0.01,圖6)。但與乳腺癌經(jīng)典預(yù)后指標(biāo)諾丁漢預(yù)后指數(shù)(Nottingham prognostic index,NPI)和增殖評分進(jìn)行Cox多因素分析發(fā)現(xiàn),僅MYBL2能作為乳腺癌轉(zhuǎn)移復(fù)發(fā)的獨(dú)立預(yù)后因子(P<0.05,表5)。
圖3 浸潤性乳腺癌中MYB家族基因變異分析(cBioPortal)
表3 bc-GenExMiner DNA 微陣列數(shù)據(jù)庫分析MYB家族表達(dá)與乳腺癌患者臨床病理特征的關(guān)系
使用cBioPortal 在線分析BRCA 數(shù)據(jù)集(TCGA,F(xiàn)irehose Legacy)中MYB 家族共表達(dá)基因,獲得MYB共表達(dá)基因21 個,MYBL1共表達(dá)基因6 個,MYBL2共表達(dá)基因251個。隨后利用DAVID對MYBL2共表達(dá)基因進(jìn)行GO 功能注釋和KEGG 通路富集分析。GO 結(jié)果顯示,MYBL2共表達(dá)基因主要參與細(xì)胞分裂、有絲分裂核分裂、細(xì)胞核質(zhì)成分、蛋白結(jié)合、DNA復(fù)制等生物功能(圖7A)。KEGG 結(jié)果顯示,MYBL2共表達(dá)基因主要影響細(xì)胞周期信號通路(圖7B)。
圖4 MYB家族mRNA表達(dá)水平與乳腺癌患者SBR分級的關(guān)系(bc-GenExMiner v4.4 database)
圖5 MYB家族基因表達(dá)與乳腺癌患者無復(fù)發(fā)生存期(RFS)和進(jìn)展后生存期(PPS)的關(guān)系(Kaplan Meier-plotter數(shù)據(jù)庫)
圖6 MYB家族基因表達(dá)與乳腺癌患者無轉(zhuǎn)移復(fù)發(fā)生存(MRFS)的關(guān)系(bc-GenExMiner v4.4數(shù)據(jù)庫)
MYB家族是介導(dǎo)多種腫瘤發(fā)生發(fā)展的重要轉(zhuǎn)錄調(diào)控因子家族,它們通過調(diào)控腫瘤細(xì)胞增殖、凋亡、遷移和侵襲等生物學(xué)過程,促進(jìn)腫瘤惡性轉(zhuǎn)化,具有典型的癌基因特征[4-5,7,11]。隨著MYB家族在腫瘤研究中的不斷深入,MYB家族及其相互作用蛋白、下游靶基因被認(rèn)為是潛在的治療靶點(diǎn)[4-5,28]。因此,在本研究中我們首次利用生物信息學(xué)方法,對MYB家族成員在乳腺癌中的表達(dá)和預(yù)后價值進(jìn)行全面的分析,以期為乳腺癌發(fā)病機(jī)制和精準(zhǔn)診療提供有價值的信息。
表4 bc-GenExMiner DNA 微陣列數(shù)據(jù)庫中轉(zhuǎn)移復(fù)發(fā)性乳腺癌的MYB家族單因素Cox分析
表5 MYB家族表達(dá)與NPI和增殖指數(shù)Cox分析
圖7 乳腺癌中MYBL2共表達(dá)基因GO和KEGG富集分析(DAVID)
本研究結(jié)果顯示MYB家族成員在乳腺癌組織中表達(dá)高于正常乳腺組織。MYB 家族主要通過基因擴(kuò)增(MYBL1)、mRNA 轉(zhuǎn)錄增強(qiáng)(MYBL1、MYBL2)或減弱(MYB)方式,導(dǎo)致家族成員在乳腺癌中的異常表達(dá)。同時,MYB家族與乳腺癌分子分型相關(guān)。其中,MYB在ER+乳腺癌患者中表達(dá)升高,而在TNBC、BLBC 和P53突變?nèi)橄侔┗颊咧斜磉_(dá)降低,提示MYB高表達(dá)的乳腺癌患者腫瘤惡性程度較低。研究表明,MYB表達(dá)與ER+密切相關(guān)[29]。在ER+乳腺癌細(xì)胞中,ER 與雌激素結(jié)合, 募集正性轉(zhuǎn)錄延長因子b(positive transcription elongation factor b,PTEFB),磷酸化RNA聚合酶II,促進(jìn)MYB的轉(zhuǎn)錄活化[28-29]。因此,MYB 是雌激素/ER信號傳導(dǎo)的效應(yīng)因子,也是ER+細(xì)胞增殖和乳腺癌形成的必要因子[30]。與MYB結(jié)果相反,MYBL1和MYBL2在惡性程度較高的TNBC、BLBC和P53突變的乳腺癌中表達(dá)升高,并且MYBL2表達(dá)與淋巴結(jié)轉(zhuǎn)移相關(guān),進(jìn)一步提示MYBL2 高表達(dá)的乳腺癌更具侵襲性。MYBL2 作為乳腺癌21 基因復(fù)發(fā)評分(21-gene recurrence score,RS)的細(xì)胞增殖指標(biāo)之一,主要反映腫瘤細(xì)胞的生物學(xué)特性[31]。此外,MYBL2在TP53突變腫瘤中表達(dá)異常升高[32]。TP53 的突變造成p53-p21-DREAM復(fù)合物(Dimerization partner,RB-like proteins,E2Fs and MuvB core)對MYBL2轉(zhuǎn)錄抑制作用減弱,MYBL2 表達(dá)增強(qiáng),克服了由于DNA 損傷等細(xì)胞應(yīng)激條件下的細(xì)胞周期檢驗(yàn)點(diǎn)阻滯,促進(jìn)腫瘤細(xì)胞周期進(jìn)展和細(xì)胞存活[33-34]。同時,MYBL2 通過干擾DREAM復(fù)合物的裝配,并與MuvB (multi-vulva class B proteins)核心復(fù)合物相互作用形成更多的MMB(Myb-MuvB)復(fù)合物,促進(jìn)有絲分裂基因轉(zhuǎn)錄,導(dǎo)致腫瘤細(xì)胞周期基因表達(dá)程序失調(diào)[33]。
雖然乳腺癌診斷和治療水平不斷提高,但患者轉(zhuǎn)移復(fù)發(fā)的風(fēng)險依然很高,且大多數(shù)乳腺癌患者的死亡歸因于腫瘤轉(zhuǎn)移[35]。本研究分析結(jié)果顯示MYB低表達(dá)、MYBL1和MYBL2高表達(dá)乳腺癌患者RFS 縮短,患者轉(zhuǎn)移復(fù)發(fā)風(fēng)險增加。MYB 低表達(dá)和MYBL2 高表達(dá)乳腺癌患者PPS 縮短,預(yù)后較差。通過進(jìn)一步單因素和多因素校正分析,我們發(fā)現(xiàn)MYBL2能作為乳腺癌患者M(jìn)RFS 的獨(dú)立預(yù)后因子。Dedi?等[13]通過免疫組化分析證實(shí)MYBL2表達(dá)水平對乳腺癌患者總生存(OS)和無病生存(DFS)預(yù)后有顯著影響,可作為獨(dú)立預(yù)后因素。此外,MYBL2 在乳腺癌細(xì)胞中通過SNAIL 介導(dǎo)EMT 轉(zhuǎn)化和細(xì)胞侵襲,加速乳腺癌細(xì)胞轉(zhuǎn)移[36]。MYBL1在乳腺癌中尚缺乏系統(tǒng)研究,但在乳腺腺樣囊性癌中,MYB和MYBL1通過基因重排,形成MYBNFIB、MYBL1-NFIB融合基因,成為這種特殊類型乳腺癌的致癌驅(qū)動因子和診斷指標(biāo)[7-8]。
研究表明,MYBL2主要在G1晚期和S期表達(dá),是參與細(xì)胞周期進(jìn)展的重要調(diào)控因子[33]。在乳腺癌細(xì)胞中,由于基因擴(kuò)增或轉(zhuǎn)錄調(diào)控異常導(dǎo)致MYBL2 高表達(dá),形成的MMB 復(fù)合物直接轉(zhuǎn)錄調(diào)控中心紡錘體蛋白和有絲分裂驅(qū)動蛋白基因,促進(jìn)腫瘤細(xì)胞增殖和細(xì)胞存活[37]。同時,我們分析乳腺癌中MYBL2共表達(dá)基因,這些基因主要富集于細(xì)胞核質(zhì)和染色體著絲粒細(xì)胞成分,發(fā)揮蛋白結(jié)合分子功能,影響DNA復(fù)制、細(xì)胞周期G1/S轉(zhuǎn)化、有絲分裂等生物過程和細(xì)胞周期相關(guān)信號通路。
綜上所述,通過多平臺數(shù)據(jù)整合分析MYB家族成員在乳腺癌中的表達(dá)和預(yù)后價值,我們認(rèn)為乳腺癌具有典型的“MYB家族依賴型腫瘤”特征。MYB家族成員在乳腺癌中異常表達(dá),與乳腺癌分子分型相關(guān)。MYB低表達(dá)、MYBL1和MYBL2高表達(dá)患者乳腺癌復(fù)發(fā)、轉(zhuǎn)移風(fēng)險增加,預(yù)后差。這些結(jié)果揭示了MYB家族在乳腺癌惡性轉(zhuǎn)化中起著重要的作用。MYBL2主要通過調(diào)控細(xì)胞周期促進(jìn)乳腺癌細(xì)胞增殖,可作為乳腺癌潛在有效的診斷、預(yù)后預(yù)測的生物標(biāo)志物。這些認(rèn)識和發(fā)現(xiàn)將為臨床乳腺癌患者的管理提供參考,也為后續(xù)深入開展分子機(jī)制研究和藥物開發(fā)提供依據(jù)和方向。