羅 倩,詹雪冰,董芳媛,孫恩濤,王書翰,陳 冰
(1.皖南醫(yī)學院病理教研室,安徽 蕪湖 241002; 2.皖南醫(yī)學院檢驗學院)
胃癌(Gastric cancer, GC)是全球第五大最常見惡性腫瘤,其致死率在所有腫瘤中排名第三[1]。手術(shù)是胃癌患者的主要治療手段,在過去的幾年里診斷和治療有所進步,但由于大部分患者發(fā)病初期無明顯癥狀,就診時已進入中晚期,并且超過半數(shù)的胃癌根治術(shù)術(shù)后會有復發(fā)或伴有遠處轉(zhuǎn)移,胃癌患者總體5年生存率低于30%[2]。因此,分子標記物異常表達的檢測可能為胃癌患者早期診斷和預后的判斷提供有效的參考。
細胞分裂周期相關(guān)蛋白(cell division cycle-associated,CDCA)家族有8個成員,即CDCA1(NUF2)、CDCA2、CDCA3、CDCA4、CDCA5、CDCA6(CBX2)、CDCA7、CDCA8。CDCAs基因在生命過程中發(fā)揮著重要作用,細胞分裂過程中的失調(diào)可能導致惡性腫瘤[3]。據(jù)報道,CDCA1的缺失抑制了CD103的抗腫瘤活性,降低了黑色素瘤的檢查點反應,促進了黑色素瘤的發(fā)生和轉(zhuǎn)移[4]。CDCA2通過調(diào)控PI3K/AKT通路,影響結(jié)直腸癌細胞體內(nèi)外的增殖[5]。CDCA3作為miR-145-5的靶基因,參與調(diào)控結(jié)直腸癌的增殖、轉(zhuǎn)移和上皮細胞-間充質(zhì)轉(zhuǎn)化[6]。CDCA4是Nrf2信號通路的下游基因,在MCF-7/ADM人乳腺癌細胞系中調(diào)控細胞增殖和凋亡[7]。CDCA5通過調(diào)節(jié)線粒體介導的凋亡、細胞周期調(diào)節(jié)和PI3k/AKT/mTOR通路激活,在膀胱癌中發(fā)揮腫瘤啟動子的作用[8]。CDCA6和CDCA7的異常表達在前列腺癌、乳腺癌、腎透明細胞癌和食管癌中被發(fā)現(xiàn)[9-10]。CDCA8的表達可被KIF18B激活,進而影響胰腺導管腺癌的增殖[11]。以上說明CDCAs基因在腫瘤的發(fā)生發(fā)展過程中扮演著重要的角色。
本研究利用Oncomine數(shù)據(jù)庫分析CDCAs基因在胃癌中的表達水平,利用GEPIA數(shù)據(jù)庫驗證CDCAs基因在胃癌中的表達水平,結(jié)合Kaplan-Meier Plotter數(shù)據(jù)庫的臨床信息分析CDCA基因家族成員在胃癌中的預后結(jié)果;利用STRING數(shù)據(jù)庫構(gòu)建CDCAs基因的蛋白質(zhì)互作網(wǎng)絡,并得到與CDCA基因家族共表達的基因;利用metascape數(shù)據(jù)庫將CDCAs基因及其共表達基因的功能信息進行整合,研究其潛在的作用機制。以上生物信息學分析結(jié)果有望為尋找胃癌有效的預后標志物提供新思路。
1.1Oncomine數(shù)據(jù)庫分析 本研究利用Oncomine數(shù)據(jù)庫(https://www.oncomine.org/)分析正常胃組織和胃癌組織。設定篩選條件:(1)gene:CDCA1、CDCA2、CDCA3、CDCA4、CDCA5、CDCA6、CDCA7、CDCA8;(2)fold change >2,P<0.05,gene rank = top 10%。
1.2GEPIA數(shù)據(jù)庫分析 GEPIA數(shù)據(jù)庫(http://gepia.cancer-pku.cn/)可利用TCGA和GTEx直接進行CDCAs基因的表達分析。設置限定條件:|Log2FC|Cutoff: 1,P值 Cutoff: 0.05。
1.3Kaplan-Meier Plotter數(shù)據(jù)庫分析 Kaplan-Meier Plotter(https://kmplot.com/analysis)數(shù)據(jù)庫采用Kaplan-Meier法對多種腫瘤患者的生存資料進行預后分析。篩選條件如下:(1)cancer:gastric cancer;(2)gene symbol:CDCA1、CDCA2、CDCA3、CDCA4、CDCA5、CDCA6、CDCA7、CDCA8;(3)Split patients by: best cutoff;(4)survival:OS。在進行總生存期(overall survival,OS)分析的同時,計算危險比(hazard radio,HR)、95%置信區(qū)間(confidence interval,CI)及LongrankP<0.05檢驗差異,LogrankP<0.05差異有統(tǒng)計學意義。
1.4STRING數(shù)據(jù)庫分析 STRING數(shù)據(jù)庫(https://string-db.org/)是一個在線搜索已知的蛋白質(zhì)互作關(guān)系的數(shù)據(jù)庫,本研究于2020年12月28日訪問STRING數(shù)據(jù)庫11.0版。選擇Multiple Proteins板塊,條件設置為:(1)List Of Names: CDCA1、CDCA2、CDCA3、CDCA4、CDCA5、CDCA6、CDCA7、CDCA8;(2)Organism: Homo sapiens;(3)minimum required interaction score: medium confidence(0.400)。
1.5metascape數(shù)據(jù)庫分析 metascape數(shù)據(jù)庫(http://metascape.org)整合了GO和KEGG等多個數(shù)據(jù)資源,可完成通路富集和相關(guān)基因的蛋白質(zhì)網(wǎng)絡分析等。條件設置為:(1)Multiple Gene List: CDCA1、CDCA2、CDCA3、CDCA4、CDCA5、CDCA6、CDCA7、CDCA8;(2)Input as species and Analysis as species: H.sapiens。最后進行通路富集分析。
2.1Oncomine數(shù)據(jù)庫中胃癌患者CDCA基因的表達情況 Oncomine數(shù)據(jù)庫結(jié)果顯示:CDCA1、CDCA2、CDCA3、CDCA4、CDCA5、CDCA6、CDCA7、CDCA8在胃癌組織中顯著升高(圖1)。分析三個數(shù)據(jù)集“Cui Gastric”,“Derrico Gastric”和“Cho Gastric”,得到CDCA基因家族在胃癌組織和正常組織的差異表達分析結(jié)果(表1)。
表1 不同類型胃癌與正常肺組織之間CDCA轉(zhuǎn)錄水平的表達差異顯著
圖1 CDCA在不同腫瘤中的轉(zhuǎn)錄水平表達
2.2GEPIA數(shù)據(jù)庫中胃癌患者CDCA基因的表達情況 結(jié)果顯示,CDCA1、CDCA2、CDCA3、CDCA4、CDCA5、CDCA6、CDCA7、CDCA8的表達水平在胃癌組織中相對于在正常組織中上調(diào)(腫瘤樣本:n=408,正常樣本:n=211,P<0.05)(圖2)。
圖2 CDCA基因家族在胃癌組織和正常組織中的表達
2.3Kaplan-Meier Plotter數(shù)據(jù)庫中CDCA基因家族在胃癌組織中的表達與患者臨床病理資料的生存分析 結(jié)果顯示,CDCA1、CDCA2、CDCA3、CDA4、CDCA5、CDCA7、CDCA8的表達高低與預后相關(guān)。以HER2(+)/(-)和不同臨床分期為前提條件進行生存分析,CDCA1、CDCA2、CDCA3、CDCA5、CDCA7、CDCA8基因高表達胃癌患者的總生存期較低表達胃癌患者的總生存期顯著延長,而CDCA4基因低表達胃癌患者預后更好(圖3)。見表2、3。
圖3 胃癌患者CDCA基因家族的OS分析
表2 CDCA基因家族表達與胃癌患者HER2(-)/(+)的相關(guān)性
2.4STRING數(shù)據(jù)庫中胃癌患者CDCA基因的通路富集分析 結(jié)果顯示,CDCAs基因在胃癌中呈正相關(guān)的共表達基因為:CDCA2、CDCA7、CDCA4、CDCA1(NUF2)、CDCA3、CDCA6(CBX2)、CDCA8、CDCA5、NDC80、SPC25、BIRC5、BUB1、AURKB、CDC20、INCENP、SPC24、CCNB1和CENPE,作用評分均大于0.99(圖4a、4b)。
表3 CDCA基因家族表達與胃癌患者分期的相關(guān)性
圖4a CDCAs基因基于STRING數(shù)據(jù)庫的蛋白質(zhì)互作分析
圖4b CDCAs基因基于STRING數(shù)據(jù)庫的基因共表達分析
2.5metascape數(shù)據(jù)庫中胃癌患者CDCA基因的功能預測 結(jié)果顯示,CDCA基因的改變影響了以下幾個過程:(1)R-HAS-2500257: 分辨姐妹染色單體粘連;(2)M129: PID PLK1通路;(3)M14: PID AURORA B通路;(4)CORUM:127: NDC80著絲點復合體;(5)GO:0030261: 染色體凝縮;(6)GO:0140013: 減數(shù)分裂(圖5a、5b和5c)。
圖5 CDCAs基因的功能以及與CDCAs基因改變顯著相關(guān)的功能
近年來有研究表明CDCA基因家族可能有助于腫瘤的發(fā)展[12],但目前較少有胃癌中CDCA基因家族的表達情況和預后分析的相關(guān)報道。細胞周期異常調(diào)節(jié)所介導的細胞轉(zhuǎn)化和不受控制的細胞生長為腫瘤的增殖提供了有利條件,因此腫瘤的發(fā)生發(fā)展離不開細胞分裂[13]。值得注意的是CDCA基因家族部分家族成員在腫瘤中高表達,具有調(diào)節(jié)腫瘤細胞周期、促進腫瘤細胞增殖、減少腫瘤細胞凋亡的作用,導致預后不良[14]。本研究利用Oncomine數(shù)據(jù)庫和GEPIA數(shù)據(jù)庫進行分析,均提示CDCA基因家族8個成員的mRNA在胃癌組織中呈高表達,說明CDCA基因家族成員可能在胃癌的發(fā)生發(fā)展中起著一定的作用。
有報道CDCA基因家族的一些成員可能在乳腺癌、肺腺癌和胰腺癌中上調(diào),這些基因的高表達水平被認為是這些腫瘤生存的不良預測因素[12]。本研究利用Kaplan-Meier Plotter數(shù)據(jù)庫進行生存分析,結(jié)果表明除CDCA6基因差異無統(tǒng)計學意義,CDCA基因家族另外7個成員中,CDCA1、CDCA2、CDCA3、CDCA5、CDCA7、CDCA8的高表達與胃癌患者的總生存期延長有關(guān),CDCA4在胃癌中的高表達,與胃癌患者的總生存期減少有關(guān)。本研究以HER2(+)/(-)和不同臨床分期為前提條件進行分析,CDCA4基因表達下調(diào),CDCA1、CDCA2、CDCA3、CDCA5、CDCA7、CDCA8基因表達部分上調(diào)。已有報道胃癌HER2狀態(tài)和胃癌的預后有一定的相關(guān)性[15]。值得注意的是,本研究中以HER2(+)/(-)和不同臨床分期為前提條件的結(jié)果與胃癌患者總生存期結(jié)果相比結(jié)果有差異,說明CDCA基因家族基因在胃癌組織中的表達情況可能與HER2通路有關(guān),還需進一步研究證實。另外,本研究CDCA6基因的mRNA在胃癌組織中的表達高于正常組織,但其表達水平對胃癌患者生存期無明顯影響,推測可能CDCA6的功能主要作用在于腫瘤的發(fā)生,對胃癌患者后期影響較小。
此外,為探討CDCA基因家族成員影響胃癌預后的機制,本研究利用STRING數(shù)據(jù)庫和metascape數(shù)據(jù)庫進行了KEGG和GO的分析,找出CDCAs基因表達和突變頻率最高的連鎖基因與胃癌預后的關(guān)系,結(jié)果是CDCAs基因改變會影響以下途徑:(1)R-HAS-2500257: 分辨姐妹染色單體粘連;(2)M129: PID PLK1通路;(3)M14: PID AURORA B通路;(4)CORUM:127: NDC80著絲點復合體;(5)GO:0030261: 染色體凝縮;(6)GO:0140013: 減數(shù)分裂。凝縮后的染色體包含兩個姊妹染色單體,兩單體由著絲粒連接。研究發(fā)現(xiàn),PLK1是有絲分裂激酶信號的主要調(diào)節(jié)者和協(xié)調(diào)者,而AURORA B就是有絲分裂激酶成員之一[16]。PLK1通過調(diào)節(jié)AURORA B的活性確定著絲粒的身份,AURORA B激酶通過磷酸化著絲粒上的NDC80蛋白,調(diào)控NDC80寡聚化作用來糾正錯誤的微管-動粒連接,動粒與微管正確連接的前提是姐妹染色單體的正常粘連[16-18]。本研究推測CDCAs基因及其突變頻率最高的連鎖基因可能通過調(diào)控PID PLK1和PID AURORA B信號通路影響NDC80著絲點復合體,進而干擾動粒與微管的連接影響姐妹染色單體粘連,最終影響染色體的穩(wěn)定性,使腫瘤細胞的生長失控。因此,對CDCAs基因表達的調(diào)控,有望通過調(diào)節(jié)上述信號通路影響染色體的穩(wěn)定性,將胃癌細胞阻滯在有絲分裂期,使胃癌細胞發(fā)生凋亡,進而影響胃癌的發(fā)生發(fā)展。
綜上所述,本研究利用生物信息學,探討CDCAs基因的表達水平與胃癌發(fā)生發(fā)展的關(guān)系,提示CDCAs基因表達水平可能與胃癌的預后相關(guān)。篩選CDCAs基因在胃癌中的共表達基因然后進行GO和KEGG富集分析,探討了其可能在胃癌發(fā)生發(fā)展中的機制。目前,檢測CDCAs基因的異常表達可能為胃癌患者早期診斷和預后提供新思路,并可能為胃癌的預后診療提供新的方法和新的理論依據(jù)。同時,深入研究CDCA基因家族成員在腫瘤的發(fā)生發(fā)展也為研究其他胃腸道腫瘤提供新的思路和方向。