霍勵耘,魏英城,譚文亮,商昌珍,陳亞進
原發(fā)性肝癌是全球第六大常見惡性腫瘤和第二大癌癥相關(guān)死亡原因[1]。由于早期肝癌缺乏典型的臨床癥狀,大多數(shù)肝癌患者在確診時往往已進展至晚期,錯失了手術(shù)治療的最佳時機[2]。近年來,雖然以手術(shù)切除為主的綜合治療方法取得了一定的進展,但是肝癌患者的整體療效和預(yù)后仍不理想[3]。因此,尋找新的早期診斷標(biāo)志物以及治療靶點對改善肝癌患者的預(yù)后具有重要的研究價值。
蛋白質(zhì)復(fù)合體家族被稱為染色體結(jié)構(gòu)維持家族(structural maintenance of chromosome,SMC),家族成員主要包含SMC1、SMC2、SMC3、SMC4、SMC5和SMC6,通過形成異源二聚體參與維持染色體的穩(wěn)定性[4-6]。SMC 基因家族已被報道在多種腫瘤的發(fā)生和發(fā)展中起重要作用。而在肝癌的研究中,目前僅有少量研究報道SMC 基因家族部分成員與肝癌的發(fā)生發(fā)展相關(guān)[7,8],SMC 基因家族在肝癌中的具體的作用機制仍需進一步的研究探索。在本研究中,我們通過提取公共數(shù)據(jù)庫中的肝癌相關(guān)的轉(zhuǎn)錄組數(shù)據(jù)以及臨床數(shù)據(jù)進行分析,對SMC 基因家族表達進行了全面的生物信息學(xué)分析,并探討了SMC基因家族在肝癌患者中的診斷和預(yù)后價值,為后續(xù)進一步深入探索SMC 基因家族參與調(diào)控肝癌進展的具體分子機制提供了基礎(chǔ)。
UALCAN 數(shù)據(jù)庫是一個便捷的交互式數(shù)據(jù)庫網(wǎng)站,用于對TCGA 基因表達數(shù)據(jù)進行深入分析[9]。在我們的研究中,我們使用UALCAN 數(shù)據(jù)庫的“表達分析”模塊和肝癌數(shù)據(jù)集獲得了SMC 基因家族在肝癌和正常肝組織中的表達數(shù)據(jù)。同時,我們還利用UALCAN 數(shù)據(jù)庫探究了SMC 基因家族在肝癌的各個分期中的表達差異。Studentt檢驗被用于數(shù)據(jù)的統(tǒng)計學(xué)檢驗。當(dāng)P值小于0.05被認(rèn)為差異有統(tǒng)計學(xué)意義。
Human Protein Atlas 數(shù)據(jù)庫中包含了正常組織和癌組織中的免疫組織化學(xué)和免疫熒光表達數(shù)據(jù)[10]。在本研究中,Human Protein Atlas 為我們提供了正常肝組織和肝癌組織中SMC 基因家族蛋白的免疫組織化學(xué)染色圖像。
GEPIA 數(shù)據(jù)庫是一個基于 TCGA 和 GTEx 的RNA 測序數(shù)據(jù)的在線數(shù)據(jù)挖掘數(shù)據(jù)庫[11]。我們運用GEPIA 分析了SMC 基因家族在肝癌患者中的生存曲線,其中SMC 基因家族高表達組以75%為界限,SMC 低表達組以25%為界限,并以P值<0.05為差異顯著性標(biāo)準(zhǔn)。
分析通過UALCAN 數(shù)據(jù)庫探討SMC 基因家族在肝癌和正常組織中的表達。從圖1 所示的SMC 基因家族轉(zhuǎn)錄水平的箱式圖來看,所有的SMC 基因家族成員,包括 SMC1A、SMC1B、SMC2、SMC3、SMC4、SMC5 和 SMC6 均顯示在肝癌組織中的高表達,且差異均具有統(tǒng)計學(xué)意義(它們的P值依次為<1E-12、3.17E-09、1.62E-12、1.62E-12、<1E-12、6.03E-05和1.62E-12)。接下來,為了研究SMC基因家族在肝癌組織中的蛋白水平,我們通過Human Protein Atlas 數(shù)據(jù)庫展示了SMC 家族蛋白在肝癌和正常肝組織中的表達差異。如圖2 所示,SMC1A、SMC2、SMC3、SMC4、SMC6 在肝癌組織中的表達高于正常肝組織,而SMC1B 和SMC5在肝癌組織和正常組織中未見明顯差異。
圖1 SMCs 在肝癌和癌旁組織中的轉(zhuǎn)錄水平差異(UALCAN 數(shù)據(jù)庫) ****為P<0.0001
在探究SMC 基因家族在肝癌中的表達模式后,進一步提出設(shè)想:SMC 基因家族的轉(zhuǎn)錄表達水平是否與肝癌的分期和有關(guān)。為了尋找答案,我們分析了UALCAN 開源數(shù)據(jù)庫的數(shù)據(jù),此數(shù)據(jù)庫是以TCGA 數(shù)據(jù)庫為基礎(chǔ)。如圖3 所示,SMC1A、SMC1B、SMC2、SMC3、SMC4、SMC5 和SMC6 在Ⅲ期肝癌患者中的表達顯著高于Ⅰ期肝癌患者(經(jīng)統(tǒng)計學(xué)檢驗,P值依次為 0.0010、0.0223、0.0002、0.0053、0.0012、0.0239 和 0.0042)。SMC1A 和SMC2在2 期肝癌患者中的表達顯著高于Ⅲ期肝癌患者(P值分別為 0.0180 和 0.0209),而 SMC5 在Ⅱ期肝癌患者中的表達水平卻低于Ⅰ期肝癌患者。另外,SMC1B、SMC3、SMC4 和 SMC6 的轉(zhuǎn)錄水平在Ⅰ期和Ⅱ期肝癌患者的差異無統(tǒng)計學(xué)意義。可見SMC 基因家族的表達水平與肝癌的分期有密切的關(guān)系。
圖2 SMCs 在肝癌組織和正常肝組織中的代表性免疫組織化學(xué)圖像(Human Protein Atlas 數(shù)據(jù)庫)比例尺:200 μm
圖3 SMCs 在肝癌不同分期之間的轉(zhuǎn)錄水平差異(UALCAN 數(shù)據(jù)庫) 注:ns 為P>0.05;*為P<0.05;**為P<0.01;***為P<0.001
為進一步了解SMC 基因家族表達水平與肝癌患者的總生存期(overall survival,OS)和無瘤生存期(disease free survival,DFS)的相關(guān)性,通過在線分析工具(GEPIA)分析TCGA 數(shù)據(jù)庫中肝癌患者的表達譜和臨床資料。如圖4 所示,筆者將基因高、低表達水平的界限設(shè)置為總體水平的75%以上或總體水平的25%以下。結(jié)果顯示,在肝癌患者中,SMC2、SMC3、SMC4 和 SMC6 高表達與患者的OS 呈負(fù)相關(guān),其表達水平越高,患者的OS越短(Kaplan-Meier 生存分析,Log Rank 檢驗,P值依次為 0.011、0.011、0.002 和 0.006)。而 SMC1A、SMC2、SMC4 和 SMC6 高表達與患者的 DFS 呈負(fù)相關(guān),其表達水平越高,患者的DFS 越短(Kaplan-Meier 生存分析,Log Rank 檢驗,P值依次為 0.038、0.002、0.040 和0.028)。但是,SMC1B 和 SMC5 的表達水平與患者的OS 和DFS 無明顯統(tǒng)計學(xué)差異(Kaplan-Meier 生存分析,Log Rank 檢驗,P值依次為0.32、0.23、0.44 和0.059,結(jié)果未展示)。
圖4 SMCs 的轉(zhuǎn)錄水平在肝癌預(yù)后判斷中的價值(GEPIA 數(shù)據(jù)庫) 肝癌患者中SMC2/3/4/6 高表達組的總生存期OS 低于低表達組,P<0.05;SMC1A/2/4/6 高表達組的無瘤生存期DFS 低于低表達組,P<0.05(SMC1A 的結(jié)果未完全展示)
SMC 家族成員的6 個基因通過形成異源二聚體與細(xì)胞內(nèi)的其他蛋白結(jié)合形成SMC 蛋白復(fù)合物,主要包括:粘附素(SMC1/3)、凝聚素(SMC2/4)和SMC5/6 復(fù)合體。SMC 復(fù)合體通過調(diào)控染色單體凝聚、DNA 復(fù)制和修復(fù),以及減數(shù)分裂中的同源染色體配對等功能,從而參與調(diào)控細(xì)胞核內(nèi)基因組的穩(wěn)定性和動態(tài)平衡[5,6]。
既往的研究顯示SMC 基因家族在多種惡性腫瘤中高表達且與患者的預(yù)后密切相關(guān)。有研究顯示SMC1A 在多種腫瘤組織中高表達,參與調(diào)控腫瘤細(xì)胞增殖、細(xì)胞周期和細(xì)胞遷移等功能[12,13]。SMC2 基因突變與結(jié)腸癌和胰腺癌中微衛(wèi)星不穩(wěn)定特性密切相關(guān)[14,15]。在肺癌相關(guān)的研究中,通過下調(diào)SMC3、SMC5 和SMC6 的表達可以抑制肺癌的進展[16]。此外,也有研究表明SMC4 對卵巢癌的早期診斷有一定的應(yīng)用價值[17],而另一項研究表明SMC4 可通過P53 信號通路參與調(diào)控染色體穩(wěn)定性從而促進乳腺癌進展[18]。而在肝癌研究領(lǐng)域,SMC 基因家族相關(guān)的研究報道較少。Zhang 等[7]研究發(fā)現(xiàn)SMC1A 在肝癌組織中高表達且磷酸化的SMC1A 可促進肝癌細(xì)胞的惡性增殖。而關(guān)于SMC 家族的其它成員在肝癌中的表達及臨床價值,仍有待進一步深入探索。本研究通過深入、全面的生物信息學(xué)分析,證實SMC 基因家族在肝癌組織中普遍高表達,而且與肝癌患者的生存預(yù)后密切相關(guān)。在本研究中,通過分析UALCAN 數(shù)據(jù)庫和Human Protein Atlas 數(shù)據(jù)庫,我們發(fā)現(xiàn)SMC 基因家族成員在肝癌組織比在正常肝組織中的表達更高。進一步通過分析SMC 基因家族與肝癌患者的臨床分期相關(guān)性,結(jié)果也提示SMC1A 和SMC2在Ⅱ期肝癌患者的組織表達明顯要高于Ⅰ期肝癌患者,Ⅲ期肝癌患者中SMC 家族成員的表達普遍比Ⅰ期肝癌患者高,這部分結(jié)果充分說明SMC 家族與肝癌患者的惡性進展過程密切相關(guān)。
為了進一步探索SMC 家族在肝癌組織中的表達與患者生存預(yù)后的相關(guān)性,筆者通過分析TCGA數(shù)據(jù)庫中肝癌相關(guān)的數(shù)據(jù),結(jié)果顯示SMC1B 和SMC5 基因的表達水平與患者的生存預(yù)后分析無明顯統(tǒng)計學(xué)差異,它們作為肝癌患者預(yù)后的評價仍需進一步的臨床樣本驗證。而SMC2、SMC4 和SMC6 基因高表達的肝癌患者總生存期以及無疾病進展生存期均明顯較差,此外,SMC3 和SMC1A高表達的患者往往生存預(yù)后較差且腫瘤容易早期復(fù)發(fā)。這些結(jié)果提示SMC1A、SMC2、SMC3、SMC4和SMC6 基因高表達與肝癌患者預(yù)后不良呈正相關(guān),可以作為肝癌患者預(yù)后的預(yù)測因素。
綜上所述,該研究對SMC 基因家族和肝癌患者進行了全面的生物信息學(xué)分析并發(fā)現(xiàn)SMC 基因家族在肝癌組織中高表達且與肝癌患者的臨床分期、疾病進展以及生存預(yù)后密切相關(guān)。但是,由于生物信息學(xué)分析的局限性,關(guān)于SMC 基因家族在肝癌中的功能以及相關(guān)的分子機制需要進一步的臨床樣本檢測和細(xì)胞以及動物實驗進行深入的研究探索。