曹家興 張 旺 劉九洋 吳高松
乳腺癌是世界范圍內(nèi)最常見的惡性腫瘤之一,也是女性癌性死亡的主要原因[1]。GLOBOCAN 2020年統(tǒng)計數(shù)據(jù)顯示,全球女性乳腺癌新發(fā)病例為226萬例,死亡病例為68萬例,分別占女性癌癥新發(fā)和死亡病例的24.5%和15.5%[2]。乳腺癌是一種高度異質(zhì)性疾病,基于分子表達差異可將其分為管腔上皮A型(Luminal A)、管腔上皮B型(Luminal B)、生長因子受體(HER-2)過表達型(HER-2 enriched)、基底型(basal-like breast cancer, BLBC)和正常乳腺樣型(normal-like)5種類型[3]。其中BLBC約占乳腺癌的15%,且具有發(fā)病年齡低、進展快、易轉(zhuǎn)移和預后差的特點[4]。此外,BLBC多表達基底細胞角蛋白CK5/17,而激素受體(hormone receptor,HR)、HER-2表達較低,故對內(nèi)分泌治療、HER-2靶向治療反應較差[4, 5]。因此,探索BLBC核心基因?qū)斫饽[瘤進展、尋找新的治療靶點至關重要。
加權基因共表達網(wǎng)絡分析(weighted correlation network analysis, WGCNA)是一種尋找高度相關的基因模塊并將模塊與性狀關聯(lián)的生物學方法,已廣泛用于篩選核心基因和治療靶點[6]。腫瘤免疫浸潤數(shù)據(jù)庫TIMER2.0基于6種算法探索基因表達與免疫浸潤的關系,為探索腫瘤免疫浸潤提供了新思路[7]?;贕SE78958構(gòu)建基因共表達網(wǎng)絡,篩選出在BLBC高表達并與生存相關的核心基因[8]。此外,利用多種生信工具分析了核心基因表達和免疫浸潤、免疫檢查點的相關性。探索BLBC預后相關的生物學標志物并分析其潛在機制將有助于靶向藥物的開發(fā)及提高患者的生存時間。
1.數(shù)據(jù)獲取與處理:首先,從基因表達數(shù)據(jù)庫(gene expression omnibus, GEO)下載GSE78958芯片數(shù)據(jù),GSE78958由GPL571 [HG-U133A_2] Affymetrix Human Genome U133A 2.0 Array測序完成。然后對芯片數(shù)據(jù)進行基因注釋以獲得基因表達譜。最后,根據(jù)基因表達差異按照標準差從大到小排序,并提取樣本中差異最大的前50%基因進行下一步分析。
2.加權基因共表達分析:利用Sangerbox在線網(wǎng)站中的“WGCNA”工具剔除離群基因和樣本并構(gòu)建無尺度共表達網(wǎng)絡,高度協(xié)同的基因被劃分為同一模塊[9]。然后將各個模塊與乳腺癌分型相關聯(lián)。選擇與BLBC相關性強的模塊繼續(xù)分析。
3.模塊基因功能富集分析:用R軟件包“clusterProfiler(version 3.14.3)”探索黑色模塊基因的生物學功能和信號通路。具體而言,設置P<0.01,并利用R包“ggplot 2”進一步篩選出前10個結(jié)果并對其進行可視化。
4.PPI網(wǎng)絡分析和核心基因的識別:為了進一步篩選核心基因,將黑色模塊基因上傳至STRING數(shù)據(jù)庫用于構(gòu)建PPI網(wǎng)絡[10]。然后,將評分(0.4的差異基因納入Cytoscape(v3.9.1)軟件進行分析,利用插件cytohubba基于度算法提取黑色模塊中差異最大的10%基因[11]。根據(jù)cytohubba分析結(jié)果,黑色模塊中共80個基因作為候選基因繼續(xù)分析。接下來,利用bc-GenExMiner對候選基因進行生存分析和表達分析,以P<0.05為差異有統(tǒng)計學意義[12]。
5.免疫細胞浸潤分析:TIMER2.0免疫相關模塊可探究BLBC乳腺癌核心基因表達與免疫細胞浸潤的相關性?!澳[瘤純度”是該分析中的主要混雜因素。由于大多數(shù)免疫細胞類型與腫瘤純度呈負相關,研究選擇了“純度調(diào)整”選項,該選項使用Spearman偏相關性檢驗進行分析。
6.腫瘤免疫相關分析:腫瘤和免疫系統(tǒng)相互作用在癌癥的發(fā)生、發(fā)展和治療中起著至關重要的作用。TISIDB是腫瘤免疫系統(tǒng)相互作用的集成儲存庫門戶,可探索中樞基因表達和免疫抑制劑、免疫刺激劑和MHC分子及趨化因子之間的相關性[13]。
7.構(gòu)建轉(zhuǎn)錄因子-核心基因調(diào)控網(wǎng)絡:為了探索調(diào)節(jié)中樞基因表達的轉(zhuǎn)錄因子(transcription factor, TF)并揭示它們的調(diào)節(jié)關系,借助Cytoscape插件iRegulon預測核心基因上游TF并構(gòu)建基于核心基因和TF的調(diào)控網(wǎng)絡。
1.共表達網(wǎng)絡的構(gòu)建和模塊的識別:對GSE78958進行基因注釋后,獲得424例乳腺癌患者表達數(shù)據(jù)和分子分型信息,其中Luminal A 226例,Luminal B 43例,Her-2過表達50例,BLBC 99例,normal-like 6例。提取方差較大的前50%(6717)基因進行WGCNA。通過平均連鎖聚類將具有相似表達模式的差異基因劃分為不同的模塊。選擇相關系數(shù)為0.87時的軟閾值5,設置模塊最小基因數(shù)為30,合并閾值為0.5。最終確定了14個模塊,其中灰色模塊是無法分配給任何的模塊基因集合。通過計算模塊與乳腺癌亞型的相關性,結(jié)果顯示黑色模塊與BLBC呈正相關且相關性最強(圖1)。因此,選擇黑色模塊作為BLBC的關鍵模塊進行下一步分析。
圖1 加權基因共表達分析
2.黑色模塊富集分析:接下來研究對黑色模塊基因進行GO(gene ontology)富集和KEGG(kyoto encyclopedia of genes and genomes)通路分析以探索其生物功能。就GO而言,生物過程(biological process, BP)主要富集于細胞周期、細胞分裂過程;細胞成分(cellular component, CC)多富集于染色質(zhì)、微管等區(qū)域,而分子功能(molecular function, MF)主要富集于核苷酸結(jié)合、酶結(jié)合等(圖2中A、B、C)。此外,KEGG通路結(jié)果表明黑色模塊基因通過細胞周期和腫瘤通路等發(fā)揮作用(圖2D)。
圖2 黑色模塊基因GO富集分析和KEGG通路分析圖
3.PPI網(wǎng)絡構(gòu)建及核心基因的識別:基于STRING數(shù)據(jù)庫和Cytoscape軟件,黑色模塊中總共891個基因被映射到PPI網(wǎng)絡中,包括812個節(jié)點和12050條邊。隨后,使用Cytoscape軟件中的cytohubba插件基于度排序,選擇PPI網(wǎng)絡中排名前10%的80個基因作為候選基因(圖3A)。為了進一步縮小范圍并驗證研究結(jié)果,使用bc-GenExMiner對候選基因進行生存分析和表達分析。結(jié)果表明,80個候選基因中7個與無病生存期(disease free survival, DFS)相關,僅ESPL1和CCNB2同時與BLBC總生存期(overall survival, OS)和DFS相關(圖3中B~E)。此外,表達分析表明,ESPL1和CCNB2在BLBC中表達高于其他分型(圖3中F、G)。研究還發(fā)現(xiàn),兩個核心基因在BLBC中的表達水平彼此呈正相關,這表明兩者存在潛在的共同調(diào)劑網(wǎng)絡(圖3H)。因此,以上結(jié)果表明,ESPL1和CCNB2可作為BLBC的核心基因。
圖3 核心基因的識別和驗證
4.核心基因免疫細胞浸潤分析:為了確定核心基因表達和腫瘤免疫細胞浸潤之間是否存在相關性,通過TIMER分析了BLBC多種免疫細胞的浸潤水平。在兩個核心基因的表達水平和Th2細胞、CD8+T細胞正相關,與腫瘤相關成纖維細胞、內(nèi)皮細胞呈負相關(圖4)。此外,TISIDB被用于檢測核心基因和免疫調(diào)節(jié)劑之間相互作用關系。ESPL1和CCNB2均與趨化因子(CCL7、CCL18、CXCL10)及免疫調(diào)節(jié)劑的表達呈正相關,包括免疫刺激因子(PVR、ULBP1)及MHC分子(TAP1、TAP2)和免疫抑制因子(LAG3),詳見圖5~圖7。
圖4 兩個核心基因表達水平與免疫細胞浸潤關系
圖6 乳腺癌中ESPL1的表達與免疫調(diào)節(jié)劑的關系
圖7 乳腺癌中CCNB2的表達與免疫調(diào)節(jié)劑的關系
5.核心基因上游轉(zhuǎn)錄調(diào)控網(wǎng)絡:最后,利用Cytoscape插件iRegulon構(gòu)建了基于核心基因和上游TF的轉(zhuǎn)錄調(diào)控網(wǎng)絡。共有56個TF參與了ESPL1和CCNB2的調(diào)節(jié)。值得注意的是,其中22個TF參與兩者的共同調(diào)控。關注共同TF有助于理解BLBC進展中的激活表達模式(圖8)。
圖8 上游轉(zhuǎn)錄因子與兩個核心基因調(diào)控網(wǎng)絡
由于缺乏有效的治療靶點,BLBC極易轉(zhuǎn)移和復發(fā),在所有亞型中預后最差[4, 5, 14]。目前BLBC的治療主要包括手術和放化療,迫切需要探索新的分子標志物和靶向藥物[14]。因此,本研究應用WGCNA、TIMER及TISDB等在線網(wǎng)站證實ESPL1和CCNB2在BLBC中高表達且與預后密切相關,并初步探索了兩者共同的潛在作用機制。
外紡錘體極體1(extra spindle poles-like 1, ESPL1)基因編碼的分離酶可切割姐妹染色體間的粘連蛋白RAD21促進染色體分離,此外,分離酶還參與 DNA損傷修復和包膜運輸過程[15,16]。ESPL1過表達導致基因突變和染色體錯誤分裂從而促使惡性腫瘤的發(fā)生[15,17]。近年來研究顯示,ESPL1與膠質(zhì)瘤、子宮內(nèi)膜癌的預后相關[16,18]。分離酶抑制物Sepins可通過非競爭性的方式抑制分離酶活性以及癌細胞生長、細胞遷移和傷口愈合[19]。
細胞周期蛋白2(cyclins B2, CCNB2)通過調(diào)節(jié)細胞周期蛋白依賴性激酶CDC2的活性調(diào)節(jié)有絲分裂G2/M周期轉(zhuǎn)變[20, 21]。CCNB2高表達與多種腫瘤的直徑、淋巴結(jié)轉(zhuǎn)移、遠處轉(zhuǎn)移及臨床分期呈顯著正相關[22]。此前研究證實,CCNB2過表達與多種惡性腫瘤的不良預后相關[23~25]。
有研究表明,細胞周期調(diào)控通路還與代謝重塑和免疫浸潤有關。筆者的分析結(jié)果也提示兩個核心基因表達與多種腫瘤免疫細胞浸潤呈正相關,包括Th2細胞、CD8+T細胞、巨噬細胞和調(diào)節(jié)性T細胞。此外,兩個核心基因轉(zhuǎn)錄表達水平均與趨化因子如CCL7、CCL10和CCL18呈正相關,其由腫瘤細胞分泌并將免疫細胞募集到腫瘤免疫微環(huán)境。免疫細胞成分很大程度上決定了微環(huán)境的炎性環(huán)境,并能調(diào)節(jié)腫瘤的進展。Th1/Th2比值升高提示著較好的預后,而Th2細胞升高與腫瘤轉(zhuǎn)移與較高的病死率有關[26]。Th2細胞可分泌IL-4、IL-5和IL-13促進腫瘤的轉(zhuǎn)移[27]。此外,Th2細胞還與腫瘤免疫逃逸相關[28]。相似的,調(diào)節(jié)性T細胞(regulatory cell,Treg)也可通過調(diào)節(jié)免疫監(jiān)視并抑制抗腫瘤免疫反應促進腫瘤進展[27]。Treg水平升高與乳腺癌腫瘤患者疾病進展和生存期縮短有關[29]??傊?兩個核心基因可能通過BLBC免疫細胞浸潤過程調(diào)控腫瘤的進展及預后。
上游調(diào)控網(wǎng)絡分析提示22種TF同時靶向調(diào)節(jié)兩個核心基因,其中大多數(shù)TF在乳腺癌中高表達。這些上調(diào)的TF可能通過激活兩個核心基因調(diào)控BLBC細胞周期及免疫反應。借助生物信息學,初步證實ESPL1和CCNB2是BLBC潛在預后和治療靶點。同時,兩個基因受共同的上游TF的調(diào)控并與BLBC患者免疫狀態(tài)相關。