曲 杰,林萍萍,呂喜英,吳練練,李青山*
(1.河北承德醫(yī)學(xué)院附屬醫(yī)院 腫瘤科,河北 承德 067000;2.武漢大學(xué)人民醫(yī)院 消化內(nèi)科,武漢 430060)
乳腺癌是女性最常見的惡性腫瘤,發(fā)病率逐年升高,嚴(yán)重威脅女性生命健康[1]。NOP56 核糖核蛋白(NOP56 ribonucleoprotein, NOP56)是一種核仁蛋白,是C/D盒小核仁核糖核酸復(fù)合物(snoRNPs)的重要組成部分,在60S核糖體亞基組裝中發(fā)揮關(guān)鍵作用,涉及rRNA前體的早中期加工[2](MIM#614154)。研究報(bào)道,NOP56表達(dá)受原癌基因c-Myc調(diào)控[3],同時(shí),NOP56也可調(diào)節(jié)c-Myc從而促進(jìn)Burkitt淋巴瘤生長[4]。NOP56可以與hPygo2蛋白結(jié)合,促進(jìn)人卵巢癌細(xì)胞生長[5]。在人乳腺癌細(xì)胞中,NOP56基因敲除后細(xì)胞集落形成能力和生長能力明顯降低[6]。然而,NOP56在人乳腺癌組織中的表達(dá)情況及臨床意義的大數(shù)據(jù)分析尚未見報(bào)道。
通過對美國生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)的基因表達(dá)綜合數(shù)據(jù)庫(Gene Expression Omnibus,GEO)[7]和美國國立健康中心(The National Institude of Health,NIH)的癌癥基因圖集數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA)[8]公共數(shù)據(jù)集進(jìn)行分析,探索NOP56在人乳腺癌組織中的表達(dá)及臨床病理關(guān)系,同時(shí)在K-M plotter 在線數(shù)據(jù)庫中研究NOP56的預(yù)后價(jià)值。進(jìn)一步利用String、GSEA數(shù)據(jù)庫,挖掘乳腺癌中與NOP56存在互相作用的蛋白網(wǎng)絡(luò),篩選與NOP56存在相互作用的基因并建立基因調(diào)控網(wǎng)絡(luò),WebGestalt數(shù)據(jù)庫尋找靶向藥物[9],為乳腺癌的分子機(jī)制研究提供新的切入點(diǎn)和同時(shí)進(jìn)一步探討臨床靶向藥物治療的分子機(jī)制。
從NCBI的GEO數(shù)據(jù)庫下載原始數(shù)據(jù),通過MAS5進(jìn)行標(biāo)準(zhǔn)化,乳腺癌組織登錄號為GSE42568、GSE15852、GSE10780和GSE45255。從TCGA數(shù)據(jù)庫下載原始數(shù)據(jù),通過RSEM標(biāo)準(zhǔn)化。納入的數(shù)據(jù)基本信息見表1。
表1 納入的4套乳腺癌基因芯片基本信息Table 1 Basic information of four GEO datasets of breast cancer
在數(shù)據(jù)集GSE15852中,通過配對樣本T檢驗(yàn)比較乳腺癌和配對癌旁組織NOP56表達(dá)差異。在數(shù)據(jù)集GSE42568和GSE10780中,通過非配對樣本T檢驗(yàn)比較乳腺癌和正常組織NOP56表達(dá)差異;在TCGA數(shù)據(jù)庫中,通過非配對樣本T檢驗(yàn)比較不同臨床病理分期的乳腺癌和配對癌旁組織NOP56表達(dá)差異;在TCGA數(shù)據(jù)庫中,通過非配對樣本T檢驗(yàn)比較不同臨床病理分期乳腺癌組織和配對癌旁組織NOP56表達(dá)差異。
TCGA數(shù)據(jù)集和GSE45255基因樣本量大且附帶臨床信息,利用此數(shù)據(jù)集進(jìn)行進(jìn)一步的相關(guān)性研究。其中臨床資料缺失的樣本被排除,根據(jù)表達(dá)譜數(shù)據(jù),對樣本的NOP56表達(dá)進(jìn)行由高到低排序,高于信號log2中位數(shù)的樣本作為高表達(dá)組,低于信號log2中位數(shù)的樣本作為低表達(dá)組。
利用在線數(shù)據(jù)庫Kaplan-Meier plotter (http://www. kmplot.com/breast) 獲得的3 951例乳腺癌患者信息,以NOP56表達(dá)中位值(Median) 將樣本分為低表達(dá)和高表達(dá)組,利用缺省設(shè)置,在線分析NOP56對乳腺癌患者總生存期和無病生存期的預(yù)后價(jià)值。
利用String(https://string-db.org)在線數(shù)據(jù)庫篩選人乳腺癌樣本中與NOP56存在互作關(guān)系的蛋白質(zhì)并且獲得互作蛋白網(wǎng)絡(luò)圖。通過R3.5軟件計(jì)算互作基因在分子功能、生物過程、細(xì)胞組分以及三者平均的語義相似性并繪制熱圖。利用GSEA3.0軟件對上述互作基因進(jìn)行富集分析。
利用WebGestalt(http://www.webgestalt.org)在線數(shù)據(jù)庫富集分析互作基因的靶向藥物。
生存分析采用Kaplan-Meier和log-rank檢驗(yàn)法。臨床病理參數(shù)相關(guān)性分析,組間比較采用χ2檢驗(yàn)及Fisher 確切概率法。以P< 0. 05 為差異有統(tǒng)計(jì)學(xué)意義。篩選共表達(dá)基因采用spearman和Pearson檢驗(yàn),spearman分?jǐn)?shù)和 Pearson分?jǐn)?shù)均大于0.3的基因被認(rèn)為有共表達(dá)關(guān)系。功能分析采用Fisher精確檢驗(yàn),P<0.05的功能集合被認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
在GEO數(shù)據(jù)庫的3個(gè)獨(dú)立數(shù)據(jù)集GSE42568、GSE15852和GSE10780中,與正常組織相比,NOP56在人乳腺癌組織中顯著高表達(dá)。在TCGA數(shù)據(jù)庫的數(shù)據(jù)集中,1 093例乳腺癌組織與112例正常組織相比,NOP56在人乳腺癌組織中顯著高表達(dá)(見圖1);不同臨床病理分期的乳腺癌組織與正常組織相比,NOP56均高表達(dá)(P< 0.001)(見表2)。
圖1 NOP56在人乳腺癌組織中高表達(dá)Fig.1 Overexpressed NOP56 in human breast cancer
數(shù)據(jù)來源分期P值TCGAStage I<0.001Stage II<0.001Stage III<0.001Stage IV<0.001
2.2.1 分析GSE45255 數(shù)據(jù)集中年齡、淋巴結(jié)轉(zhuǎn)移、雌激素受體(ER)狀態(tài)、孕激素受體
(PRG)狀態(tài)、人表皮生長因子受體2(HER2)狀態(tài)、組織學(xué)分級和腫瘤大小等臨床病理參數(shù)與NOP56表達(dá)高低的相關(guān)性。結(jié)果顯示,NOP56 高表
達(dá)在組織學(xué)分級為G3的腫瘤樣本中更常見,而在分化程度較高的G1、G2腫瘤樣本中,NOP56低表達(dá)更多見(P< 0.001),提示NOP56高表達(dá)與乳腺癌的進(jìn)展呈正相關(guān)。同時(shí),NOP56與乳腺癌HER2狀態(tài)相關(guān),在HER2狀態(tài)陽性的患者中高表達(dá)(P=0.019) 。NOP56的表達(dá)與年齡、淋巴結(jié)轉(zhuǎn)移、PRG狀態(tài)、ER狀態(tài)和腫瘤大小無顯著相關(guān)性(見表3)。
2.2.2 分析TCGA 數(shù)據(jù)集中年齡、淋巴結(jié)轉(zhuǎn)移、雌激素受體(ER)狀態(tài)、孕激素受體
(PRG)狀態(tài)、人表皮生長因子受體2(HER2)狀態(tài)和病理分期等臨床病理參數(shù)與NOP56表達(dá)高低的相關(guān)性。結(jié)果顯示, NOP56與乳腺癌HER2狀態(tài)、年齡、PRG狀態(tài)相關(guān),在HER2狀態(tài)陽性的患者中高表達(dá)( P=0.019) ,在年齡< 55歲的患者中高表達(dá)(P<0.001),在PRG陰性的患者中高表達(dá)(P<0.000 1)。NOP56的表達(dá)與年齡、淋巴結(jié)轉(zhuǎn)移和ER狀態(tài)無顯著相關(guān)性(見表4)。GEO數(shù)據(jù)庫與TCGA數(shù)據(jù)庫結(jié)果一致。
K-M plotter生存分析顯示,NOP56高表達(dá)患者的無進(jìn)展存活期(Disease free survival,DFS)和總存活期(Overall survival,OS)均明顯較低表達(dá)患者短(P< 0.001,見圖2)。這表明NOP56低表達(dá)與患者生存期縮短顯著相關(guān),NOP56可能成為預(yù)測乳腺癌的預(yù)后指標(biāo)(見圖2)。
表3 不同NOP56表達(dá)與GEO數(shù)據(jù)庫139例乳腺癌患者臨床病理參數(shù)的關(guān)系Table 3 Correlation between NOP56 expression and clinicopathological parameters in 139 patients with breast cancer
表4 不同NOP56表達(dá)與數(shù)據(jù)TCGA數(shù)據(jù)庫庫1 093例乳腺癌患者臨床病理參數(shù)的關(guān)系Table 4 Correlation between NOP56 expression and clinicopathological parameters in 1 093 patients with breast cancer in TCGA
圖2 NOP56表達(dá)水平與乳腺癌患者生存時(shí)間關(guān)系Fig.2 Correlation between NOP56 expression and the prognosis of breast cancer patients
String在線數(shù)據(jù)庫篩選人乳腺癌樣本中與 NOP56存在互作關(guān)系較強(qiáng)的基因10個(gè)。(見圖3(a)) R3.5進(jìn)行語義相似性分析(見圖3(b)、(c)、(d)、(e))
圖3 NOP56蛋白互作網(wǎng)絡(luò)以及共表達(dá)基因與NOP56分子功能、生物過程、細(xì)胞組分以及平均語義相似性Fig.3 Gene interaction network diagram of NOP56 and the molecular function,biological process,cellular component,and the mean semantic similarity between NOP56 and its co-expressed genes
利用GSEA數(shù)據(jù)庫對互作基因進(jìn)行富集分析,結(jié)果顯示這些基因主要富集在RNA加工,細(xì)胞分裂和DNA復(fù)制等與腫瘤發(fā)生發(fā)展關(guān)系密切的功能上(見圖4)。
圖4 NOP56共表達(dá)基因主要富集在RNA加工和細(xì)胞分裂等與腫瘤發(fā)生發(fā)展關(guān)系密切的功能上Fig.4 NOP56 co-expression genes are mainly enriched in the functions closely related to the tumor development such as RNA processing and cell division
WebGestalt網(wǎng)站分析顯示,以上互作基因靶向藥物有5種,其中互作基因作為靶基因最多的為放線菌素D(見表5)
表5 靶向基因藥物Table 5 Targeted gene drugs
乳腺癌的發(fā)生發(fā)展離不開異常的蛋白質(zhì)生物合成[6],而細(xì)胞中蛋白質(zhì)的合成需求與核糖體生物合成活性相協(xié)調(diào),當(dāng)某些關(guān)鍵的核糖體蛋白水平上調(diào)后,可通過調(diào)節(jié)其他蛋白的表達(dá)影響細(xì)胞生長代謝[10]。研究表明,核糖體生物合成速率增加促進(jìn)原癌基因Myc表達(dá),增加癌細(xì)胞增殖能力[8],同時(shí)可通過釋放MDM2蛋白降解抑癌基因p53[12]和pRb[13],增加癌癥患病風(fēng)險(xiǎn)。核糖體生物合成活躍可促進(jìn)乳腺癌細(xì)胞侵襲能力,增加乳腺癌惡性程度[14]。NOP56是小分子核仁核糖核蛋白(snoRNP)復(fù)合體的核心蛋白質(zhì)成員,直接對rRNA前體核糖部分進(jìn)行甲基化修飾,在核糖體生物合成中發(fā)揮重要作用[15]。NOP56突變可導(dǎo)致60S核糖體亞基裝配缺陷,rRNA加工受抑[15]。研究表明,NOP56可調(diào)節(jié)原癌基因c-Myc促進(jìn)Burkitt淋巴瘤細(xì)胞生長[4],同時(shí)可以與hPygo2蛋白結(jié)合,促進(jìn)卵巢癌細(xì)胞生長[5]。本研究通過生物信息學(xué)分析,首次在人乳腺癌組織中發(fā)現(xiàn)NOP56顯著高表達(dá),且NOP56高表達(dá)與乳腺癌不良臨床病理參數(shù)和預(yù)后相關(guān)。為進(jìn)一步揭示其作用機(jī)制,我們探索了乳腺癌中NOP56共表達(dá)基因、互作蛋白及其功能,并構(gòu)建蛋白互作網(wǎng)絡(luò)圖。
通過GEO和TCGA數(shù)據(jù)庫,我們首次發(fā)現(xiàn)NOP56在人乳腺癌中顯著高表達(dá)。在GSE45255中,數(shù)據(jù)顯示NOP56高表達(dá)患者乳腺癌分化程度低。這與已有的研究一致,Su H等人發(fā)現(xiàn)NOP56促進(jìn)人乳腺癌細(xì)胞集落形成能力和生長能力[6]。此外,我們發(fā)現(xiàn)NOP56在HER2陽性患者中高表達(dá)。HER2過表達(dá)與乳腺癌的發(fā)生、發(fā)展、侵襲和轉(zhuǎn)移密切相關(guān)[16]。HER2基因編碼酪氨酸激酶活性跨膜糖蛋白,與相應(yīng)配體結(jié)合導(dǎo)致胞內(nèi)酪氨酸激酶磷酸化,引起細(xì)胞生長、增殖相關(guān)信號通路如NF-κB等的連鎖反應(yīng),促進(jìn)細(xì)胞增殖分化[17]。HER2陽性乳腺癌細(xì)胞c-Myc表達(dá)水平高,敲低HER2基因后c-Myc表達(dá)降低[18],而c-Myc可直接促進(jìn)NOP56表達(dá)[3]。這說明乳腺癌中HER2可能通過激活細(xì)胞生長增殖相關(guān)信號通路上調(diào)c-Myc等原癌基因從而促進(jìn)NOP56表達(dá)。我們進(jìn)一步利用在線數(shù)據(jù)庫K-M plotter,對3 951例乳腺癌患者進(jìn)行預(yù)后分析,發(fā)現(xiàn)NOP56高表達(dá)乳腺癌患者生存期顯著降低。乳腺癌組織中NOP56表達(dá)水平,或許可以作為乳腺癌患者新的檢測指標(biāo)和遠(yuǎn)期預(yù)后評價(jià)指標(biāo),但還需大樣本的臨床數(shù)據(jù)進(jìn)一步驗(yàn)證。
為了進(jìn)一步理解乳腺癌中NOP56異常表達(dá)的機(jī)制,篩選出NOP56最顯著的互作基因10個(gè)。單一的基因異常往往伴隨下游基因的連鎖異常反應(yīng),這是多種癌癥相關(guān)基因異常促進(jìn)癌癥發(fā)展的重要原因之一。功能分析顯示,NOP56共表達(dá)基因主要參與RNA加工,細(xì)胞分裂和DNA復(fù)制等與腫瘤發(fā)生發(fā)展關(guān)系密切的功能。這些結(jié)果與現(xiàn)有的實(shí)驗(yàn)結(jié)果一致,Victoria H.等[5]發(fā)現(xiàn)NOP56 基因過表達(dá)后,Burkitt淋巴瘤細(xì)胞的增殖明顯加快;Yuichi J.等[19]發(fā)現(xiàn)在乳腺癌上皮細(xì)胞中Nop56促進(jìn)細(xì)胞周期G1期縮短,是細(xì)胞周期進(jìn)程的重要介質(zhì)。研究證明NOP56共表達(dá)網(wǎng)絡(luò)的準(zhǔn)確性,提示NOP56可能通過影響這些共表達(dá)基因來發(fā)揮其促癌作用。
最后,我們篩選出了NOP56互作基因富集的靶向藥物,選取了富集基因最多的放線菌素類中的放線菌素D。放線菌素D(更生霉素)是第一種顯示出具有抗腫瘤活性的抗生素,是臨床上廣泛使用的抗腫瘤藥物,現(xiàn)在常用于各種小兒腫瘤,如腎母細(xì)胞瘤,橫紋肌肉瘤和尤因氏肉瘤的治療[20-22]。放線菌素D是一種DNA嵌入劑,它更偏向于富含GC的DNA序列[ 23 ]。Perry RP等人發(fā)現(xiàn)低濃度的放線菌素D可以破壞核糖體正常的生物過程,最終導(dǎo)致細(xì)胞周期停滯和細(xì)胞凋亡[ 23-25]。Das T等人研究發(fā)現(xiàn)放線菌素D可以下調(diào)SOX2表達(dá),從而誘導(dǎo)乳腺癌干細(xì)胞死亡[26]。通過這些研究我們可以假設(shè),放線菌素D通過靶向作用于NOP56以及其互作基因達(dá)到對乳腺癌的治療作用,放線菌素D的治療作用可能與NOP56的表達(dá)量相關(guān),而這些假設(shè)還需要進(jìn)一步的實(shí)驗(yàn)以及臨床驗(yàn)證。
綜上所述,利用公共數(shù)據(jù)庫證明乳腺癌組織中NOP56高表達(dá),NOP56促進(jìn)腫瘤分化,在HER陽性患者中表達(dá)量高,且與乳腺癌患者的不良預(yù)后密切相關(guān)。機(jī)制上,我們研究了乳腺癌中NOP56共表達(dá)基因,其功能主要為RNA加工,細(xì)胞分裂和DNA復(fù)制等與腫瘤發(fā)生發(fā)展關(guān)系密切的功能,并構(gòu)建基因互作網(wǎng)絡(luò)圖,發(fā)現(xiàn)互作基因靶向藥物明顯富集在放線菌素D上。系統(tǒng)地研究了NOP56在乳腺癌中的表達(dá)與臨床預(yù)后、臨床病理狀態(tài)以及組織學(xué)分級的關(guān)系,探討了分子機(jī)制以及與臨床靶向藥物的關(guān)系,為乳腺癌防治提供潛在的新的預(yù)測指標(biāo),完善了臨床靶向藥物使用的分子機(jī)制。