張?chǎng)魏?,張濤元,?俏,祝擷英,曹三成,吳 爽
(1.日照心臟病醫(yī)院,山東日照 276800;2.西安交通大學(xué)附屬兒童醫(yī)院,西安 710003)
肝癌是世界范圍內(nèi)最常見(jiàn)的癌癥之一,在消化系統(tǒng)腫瘤中,死亡率占第 3 位,且與發(fā)達(dá)國(guó)家相比,肝癌在發(fā)展中國(guó)家的發(fā)病率和死亡率更高[1]。已有證據(jù)顯示,包括cyclin D1(CCND1)[1],表皮生長(zhǎng)因子受體(EGFR)、c-myc 在內(nèi)的基因異常表達(dá)以及Ras 基因[3]、腫瘤抑制基因的突變表達(dá)參與了肝癌的發(fā)生發(fā)展過(guò)程。然而,由于早期缺乏有效的診斷方法,在疾病的發(fā)展階段,肝癌的死亡率仍然很高。因此,揭示肝癌致癌、癌癥轉(zhuǎn)移及肝癌復(fù)發(fā)等分子機(jī)制,對(duì)研發(fā)有效的診斷和治療方法而言,是十分重要且迫切的。
在過(guò)去的幾十年里,微陣列技術(shù)和生物信息技術(shù)已被廣泛用于鑒定基因組表達(dá)水平的改變[4],幫助我們識(shí)別肝癌相關(guān)的差異表達(dá)基因和相關(guān)信號(hào)通路。然而單一芯片分析的假陽(yáng)性率較高,難以獲得可靠的結(jié)果。本研究從基因表達(dá)綜合數(shù)據(jù)庫(kù)GEO 中下載三個(gè)芯片微陣列數(shù)據(jù)集,從而獲得更可靠的正常肝組織與肝癌組織之間的差異表達(dá)基因,探究更多與肝癌發(fā)生轉(zhuǎn)化相關(guān)的分子標(biāo)志物。
1.1 材料 利用基因表達(dá)綜合數(shù)據(jù)庫(kù)GEO[5],在GPL570 檢測(cè)平臺(tái)下,檢索三組人源性肝細(xì)胞肝癌的基因芯片,芯片信息為Affymetrix Human Genome U133 Plus 2.0 Array,編號(hào)分別為GSE88839[6](肝癌組織3 例、正常肝組織35 例)、GSE101685[7](肝癌組織8 例、正常肝組織324 例)、GSE112790[8](肝癌組織15 例、正常肝組織3183例)。
1.2 方法與統(tǒng)計(jì)學(xué)分析
1.2.1 差異表達(dá)基因的篩選:利用在線分析工具GEO2R 對(duì)三組芯片的差異表達(dá)基因進(jìn)行篩選,當(dāng)LogFC(foldchange)>1.5,P<0.05 時(shí),基因表達(dá)差異具有統(tǒng)計(jì)學(xué)意義。利用韋恩對(duì)三組差異基因取交集,獲得共同差異表達(dá)基因。
1.2.2 差異表達(dá)基因的富集分析:將差異表達(dá)基因載入DAVID 數(shù)據(jù)庫(kù)[9]進(jìn)行富集分析,以人源基因?yàn)楸尘斑M(jìn)行生物學(xué)功能注釋及KEGG 信號(hào)通路的富集。P<0.05 時(shí)差異具有統(tǒng)計(jì)學(xué)意義。
1.2.3 PPI 網(wǎng)絡(luò)構(gòu)建與關(guān)鍵模塊的基因分析:利用STRING[10]數(shù)據(jù)庫(kù),獲取差異表達(dá)基因的PPI 網(wǎng)絡(luò)數(shù)據(jù),用Cytoscape[11]軟件可視化PPI 網(wǎng)絡(luò),利用MCODE 插件,根據(jù)網(wǎng)絡(luò)中蛋白作用關(guān)系,確定核心基因。MCODE 設(shè)置如下:MCODE scores>5, degree cut-off=2, node score cut-off=0.2, Max depth=100 and k-score=2。利用UCSC[12]癌基因數(shù)據(jù)庫(kù)對(duì)核心基因繪制層次聚類熱圖。
1.2.4 關(guān)鍵基因的臨床數(shù)據(jù)分析:利用 Kaplan Meier-Plotter(http://kmplot.com/analysis/)網(wǎng)站,分析核心基因?qū)Ω伟┗颊呖偵媛实挠绊?。根?jù)核心基因表達(dá)值的中位數(shù),將肝癌患者分為高表達(dá)組和低表達(dá)組兩組,計(jì)算危險(xiǎn)比(HR)、 95%置信區(qū)間及P 值,并繪制生存曲線。利用UALCAN 數(shù)據(jù)庫(kù),分析關(guān)鍵基因的mRNA 表達(dá)情況與肝癌患者的癌癥分期和腫瘤分級(jí)之間的相關(guān)性,T 檢驗(yàn)進(jìn)行數(shù)據(jù)處理,且P <0.05 時(shí)差異具有統(tǒng)計(jì)學(xué)意義。
2.1 篩選差異表達(dá)基因 見(jiàn)圖1。將三組芯片數(shù)據(jù)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后獲得共同差異基因74 個(gè),其中GSE88839 共有差異基因301 個(gè),GSE101685共有差異基因1189 個(gè),GSE112790 共有差異基因1109 個(gè)。
圖1 肝癌差異表達(dá)基因的韋恩圖
2.2 GO 富集分析 見(jiàn)表1。GO 富集結(jié)果表明:上述74 個(gè)差異表達(dá)基因主要參與細(xì)胞外間隙、細(xì)胞外小體、氧化還原等生物過(guò)程。
2.3 KEGG Pathway 富集分析見(jiàn)表2。KEGG Pathway 富集分析顯示:差異基因主要參與代謝途徑、癌癥中的轉(zhuǎn)錄失調(diào)、p53 信號(hào)通路及氨基酸合成等相關(guān)通路。
2.4 PPI 網(wǎng)絡(luò)構(gòu)建及核心基因篩選 去除游離的蛋白后,共得到了由 70 個(gè)點(diǎn),213 條邊構(gòu)成的PPI網(wǎng)絡(luò),見(jiàn)圖 2A。用Cytoscape 軟件的MCODE 插件,獲取由15 個(gè)點(diǎn),102 條邊構(gòu)成的相互作用程度最高的核心基因PPI 網(wǎng)絡(luò),見(jiàn)圖2B,15 個(gè)點(diǎn)的基因名分別為:ECT2, DTL, PBK, TOP2A, CDKN3,NCAPG, ANLN, HMMR, RRM2, RACGAP1,KIF20A, BUB1B, CCNA2, TYMS, ZWINT。UCSC數(shù)據(jù)庫(kù)對(duì)這15 個(gè)核心基因進(jìn)行層次聚類,發(fā)現(xiàn)這15 個(gè)基因在正常肝組織中低表達(dá),在大部分肝癌組織中高表達(dá),見(jiàn)圖2C。
2.5 預(yù)后價(jià)值分析 見(jiàn)圖3。利用Kaplan Meier-Plotter 對(duì)15 個(gè)核心差異表達(dá)基因與肝癌患者的預(yù)后進(jìn)行分析。結(jié)果顯示:ANLN(HR=2.14,95%CI:1.49~3.08,P=2.6E-05),ECT2(HR=2.09,95%CI:1.48~2.97,P=2.3E-05),HMMR(HR=2.29,95%CI:1.62~3.34,P=1.3E-06),KIF20A(HR=2.33,95%CI:1.63~3.32,P=1.8E-06),NCAPG(HR=2.19,95%CI:1.54~3.13,P=8.8E-06),PBK(HR=2.24,95%CI:1.5~3.34,P=4.8E-05),RACGAP1(HR=2.24,95%CI:1.44~3.5,P=2.7E-04),ZWINT(HR=2.36,95%CI:1.66~3.35,P=8.5E-07)的高表達(dá)與肝癌患者較差的總生存率存在相關(guān)性。
圖2 PPI 網(wǎng)絡(luò)構(gòu)建及關(guān)鍵基因篩
表1 肝癌差異基因的GO 富集分析
表2 肝癌差異基因的KEGG Pathway 富集分析
圖3 ANLN, ECT2, HMMR, KIF20A, NCAPG, PBK, RACGAP1, ZWINT 在肝癌中的預(yù)后價(jià)值
2.6 核心差異表達(dá)基因與肝癌患者臨床病理參數(shù)的相關(guān)性 見(jiàn)圖4。分析上述8 個(gè)基因與肝癌患者臨床病理參數(shù)的相關(guān)性,結(jié)果顯示與正常肝組織相比, ECT2, KIF20A, PBK, RACGAP1 和ZWINT 的mRNA 水平在不同的肝癌分級(jí)、分期中明顯升高,且差異具有統(tǒng)計(jì)學(xué)意義(P<0.05)。
肝癌是世界第五大惡性腫瘤,其發(fā)病率在近年來(lái)呈現(xiàn)上升趨勢(shì)[13]。肝癌的主要病因包括慢性病毒性肝炎、酒精性肝病、黃曲霉毒素中毒及與之相關(guān)的基因突變、細(xì)胞損傷等[2]。細(xì)胞周期蛋白D1(CCND 1), c-myc 或ras 的突變、cyclind 2(CCDN 2)啟動(dòng)子的高度甲基化以及p53 或p21 的異常表達(dá)已被證實(shí)與肝癌有關(guān)[14-15]。由于這些基因?qū)Ω伟┰缙谠\斷并不適用,因此迫切需要發(fā)現(xiàn)新肝癌診斷和治療的生物標(biāo)志物。
本文以生物信息學(xué)分析方法為基礎(chǔ),利用GEO 數(shù)據(jù)庫(kù)中的三組肝癌芯片數(shù)據(jù),共篩選出79個(gè)與正常肝組織具有表達(dá)差異的肝癌基因。 GO 和KEGG 富集分析顯示,差異表達(dá)基因與細(xì)胞外間隙、細(xì)胞外小體、氧化還原、代謝途徑、癌癥中的轉(zhuǎn)錄失調(diào)、p53 信號(hào)通路及氨基酸合成等生物過(guò)程密切相關(guān),提示肝癌組織中,細(xì)胞異常增殖,且細(xì)胞凋亡失?!,F(xiàn)已證實(shí)[16]p53 通路參與了肝癌的發(fā)生,抑癌基因p53 與細(xì)胞生長(zhǎng)、分化以及細(xì)胞凋亡的調(diào)控密切相關(guān)。 因此p53 信號(hào)通路異常,可促使肝癌細(xì)胞惡性增殖、抑制凋亡。同時(shí)本文中差異基因所聚焦的氧化還原、代謝途徑等生物過(guò)程與肝癌患者的肝功能紊亂癥狀一致。對(duì)本研究共發(fā)現(xiàn)與8 個(gè)基因與肝癌患者總生存率相關(guān),5 個(gè)基因與肝癌患者的臨床病理相關(guān),對(duì)這些基因進(jìn)行文獻(xiàn)挖掘,證實(shí)這些基因與肝癌的發(fā)生、發(fā)展及其預(yù)后關(guān)系密切。ECT2 在肝再生過(guò)程中以細(xì)胞周期依賴的方式表達(dá),并被認(rèn)為在調(diào)節(jié)胞質(zhì)分裂中起著重要作用。有文獻(xiàn)表明ECT2 的表達(dá)可能是包括乳腺癌、肺癌在內(nèi)的多種癌癥發(fā)生、發(fā)展的主要原因之一,且ECT 2 的高表達(dá)可以作為預(yù)測(cè)預(yù)后不良的獨(dú)立因素[17]。KIF20A 是胞質(zhì)分裂的重要調(diào)節(jié)因子,已有大量隊(duì)列研究表明,KIF20A 在肝癌組織中的異常表達(dá),與其較差的總生存率密切相關(guān)[18]。PDZ 結(jié)合激酶(PBK)的大量表達(dá)常與肝癌患者預(yù)后不良相關(guān),PBK 能通過(guò)ETV 4-uPAR 信號(hào)通路促進(jìn)腫瘤的侵襲和遷移,有望成為肝癌轉(zhuǎn)移的診斷標(biāo)志物和治療靶點(diǎn)[18]。RABGAP 家族蛋白通過(guò)使RAB 蛋白失活來(lái)調(diào)節(jié)細(xì)胞功能,如細(xì)胞骨架重塑、囊泡運(yùn)輸和細(xì)胞遷移等[20],RACGAP 1 與TPR 協(xié)同作用,通過(guò)降低Hippo 和YAP 通路的激活和促進(jìn)胞質(zhì)分裂,促進(jìn)肝癌細(xì)胞的增殖[21]。ZWINT 在有絲分裂檢查點(diǎn)中起著重要作用,可以保證染色體在子代細(xì)胞間平均分配。據(jù)報(bào)道,ZWINT 與包括乳腺癌、前列腺癌和肺癌等在內(nèi)的十幾種癌癥密切相關(guān),且ZWINT是肝癌術(shù)后患者預(yù)后不良的獨(dú)立預(yù)測(cè)指標(biāo)[22]。
綜上,本研究應(yīng)用生物信息學(xué)分析了肝細(xì)胞肝癌的基因芯片數(shù)據(jù)。希望能夠深入了解肝癌發(fā)生、發(fā)展的分子機(jī)制,為肝癌的臨床檢測(cè)、治療提供新的潛在生物標(biāo)志物。但是,由于缺乏有效的分子生物學(xué)實(shí)驗(yàn),對(duì)這些基因在肝癌組織中的功能進(jìn)行分析驗(yàn)證,因此本研究是局限的。盡管如此,本研究仍有助于更深入地了解肝癌的分子機(jī)制,并指導(dǎo)后續(xù)的分子生物學(xué)實(shí)驗(yàn)。
現(xiàn)代檢驗(yàn)醫(yī)學(xué)雜志2020年4期