陳偉男 李建春 劉陽(yáng) 張艷明 張海宇
原發(fā)性肝癌是起源于肝臟上皮或間葉組織的消化系統(tǒng)常見(jiàn)惡性腫瘤,具有高發(fā)病率和病死率[1]。近年來(lái),靶向治療和免疫治療等獲得突破性進(jìn)展[2]并成為研究熱點(diǎn)[3]。本研究將通過(guò)分析現(xiàn)有肝細(xì)胞肝癌測(cè)序數(shù)據(jù),進(jìn)一步分析該腫瘤異質(zhì)性,發(fā)現(xiàn)其可能存在的不同亞型以及亞型的腫瘤演進(jìn)機(jī)制,為肝細(xì)胞肝癌新的診療方法和治療策略的開(kāi)發(fā)提供理論支持。
1.1 數(shù)據(jù)下載及整理 肝細(xì)胞肝癌樣本來(lái)自TCGA 數(shù)據(jù)庫(kù)(https://portal.gdc.cancer.gov/),包含肝細(xì)胞肝癌的mRNA 表達(dá)數(shù)據(jù)和拷貝數(shù)變異數(shù)據(jù)。該數(shù)據(jù)庫(kù)包含374 例肝細(xì)胞肝癌樣本mRNA 表達(dá)數(shù)據(jù)和378 例肝細(xì)胞肝癌樣本拷貝數(shù)變異數(shù)據(jù)。所納入所有數(shù)據(jù)均符合TCGA 的出版指南。采用R 軟件(v 4.0.0)中DESeq2包對(duì)mRNA 表達(dá)數(shù)據(jù)進(jìn)行歸一化分析,基于中位數(shù)絕對(duì)偏差(MAD)選擇前3000 個(gè)可變性最高的編碼基因納入后續(xù)分析。
1.2 數(shù)據(jù)分析(1)肝細(xì)胞肝癌樣本數(shù)據(jù)聚類分析:采用R 軟件中NMF 包對(duì)肝細(xì)胞肝癌樣本進(jìn)行無(wú)監(jiān)督聚類。使用默認(rèn)參數(shù)的隨機(jī)選取值,開(kāi)始循環(huán)計(jì)算50次,以確定最佳等級(jí)參數(shù),然后使用最佳等級(jí)參數(shù)循環(huán)計(jì)算300 次以獲得最終的NMF 聚類分組方案。隨后采用主成分分析(principal component analysis,PCA)降維,提取NMF 分組信息對(duì)樣本進(jìn)行標(biāo)記,評(píng)估聚類分組結(jié)果的一致性。(2)免疫成分分析:采用R 軟件中GSEABase 包,對(duì)樣本進(jìn)行肝細(xì)胞肝癌mRNA 數(shù)據(jù)行ssGSEA 分析,分析腫瘤樣品的免疫成分,計(jì)算每個(gè)樣本每種免疫細(xì)胞的構(gòu)成。使用R 軟件中ESTIMATE 包默認(rèn)參數(shù)從表達(dá)矩陣中評(píng)估免疫評(píng)分和腫瘤純度。(3)篩選DEG 構(gòu)建PPI 網(wǎng)絡(luò):采用R 軟件中的limma 包篩選差異表達(dá)基因,通過(guò)t檢驗(yàn)分析NMF1 和NMF2 兩組間的基因表達(dá),以│log FC │≥2 和P<0.01 為篩選標(biāo)準(zhǔn)。使用R 軟件中的ggplot2 包繪制差異表達(dá)基因火山圖。VENN 網(wǎng)站(http://bioinformatics.psb.ugent.be/webtools/Venn/)繪制維恩圖。采用STRING(https://string-db.org/)平臺(tái)分析差異基因的蛋白信息。將蛋白互作網(wǎng)絡(luò)導(dǎo)圖cytoscape 軟件(v 3.6.1),采用cytoHubba 插件計(jì)算差異基因之間連通性權(quán)重得分,選定得分最高的基因?yàn)楹诵幕?,且采用MOCODE 插件篩選首要模塊。(4)生物學(xué)功能分析:將差異表達(dá)基因上傳至DAVID 數(shù)據(jù)庫(kù)(https://david.ncifcrf.gov/)進(jìn)行生物學(xué)功能注釋分析。采用GO(gene ontology)和KEGG(Kyoto Encyclopedia of Genes and Genomes)分析將差異表達(dá)基因富集于基因功能、細(xì)胞成分以及生物學(xué)過(guò)程和信號(hào)通路等。(5)拷貝數(shù)變異分析:采用GenePattern 平臺(tái)(https://cloud.genepattern.org/gp/pages/index.jsf)的GISTIC 分析模塊分析肝細(xì)胞肝癌樣品的拷貝數(shù)變異情況。參考基因組設(shè)置為人類hg38(human genome38)版本。每個(gè)探針標(biāo)記位點(diǎn)的擴(kuò)增或缺失G-score 評(píng)分情況,反映該位點(diǎn)的變異深度和頻率[4]。
1.3 統(tǒng)計(jì)學(xué)方法 采用R 軟件。符合正態(tài)分布的計(jì)量資料以()表示,兩組間比較采用t檢驗(yàn);多組間比較采用單因素方差分析(ANOVA);計(jì)數(shù)資料采用秩和檢驗(yàn)。Benjamini-Hochberg 分析用于多次檢驗(yàn)后的校正。P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
2.1 肝細(xì)胞肝癌分子亞型的劃分 將肝細(xì)胞肝癌患者mRNA 數(shù)據(jù)通過(guò)NMF 聚類分析,可將患者明顯分為兩個(gè)不同亞組NMF1組和NMF2組(見(jiàn)圖1A)。隨后PCA分析將不同亞組患者樣本信息標(biāo)記著色,觀察其在空間分布狀態(tài),可見(jiàn)兩個(gè)亞組有明顯分界(見(jiàn)圖1B)。
圖1 肝細(xì)胞肝癌分子亞型劃分
2.2 不同亞型免疫成分的分析 與NMF2組比較,NMF1組免疫評(píng)分更高而腫瘤純度更低,CON組免疫評(píng)分最高,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)(見(jiàn)圖2A、2C、表1)。在HLA 相關(guān)基因及免疫檢查點(diǎn)基因(CD274、BTLA、ICOS、IDO1、LAG-3 和TIM-3)的表達(dá)水平在三組間也顯著不同,CON組表達(dá)水平最高,而NMF2組最低,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)(見(jiàn)圖2B、2D,表1)。NMF1組和NMF2組免疫細(xì)胞組成也不同,尤其幼稚B 細(xì)胞、M0 巨噬細(xì)胞、M2 巨噬細(xì)胞和單核細(xì)胞等(見(jiàn)圖2E)。免疫評(píng)分及浸潤(rùn)情況與腫瘤純度為負(fù)相關(guān)。
圖2 A.ssGSEA免疫評(píng)分熱圖;B.HLA相關(guān)基因表達(dá)水平對(duì)比;C.免疫評(píng)分及腫瘤純度對(duì)比;D.免疫檢查點(diǎn)基因表達(dá)量對(duì)比;E.免疫細(xì)胞浸潤(rùn)對(duì)比
表1 免疫相關(guān)評(píng)分及基因表達(dá)
2.3 差異表達(dá)基因的篩選以及蛋白網(wǎng)絡(luò)的構(gòu)建 本研究分別篩選所有肝細(xì)胞肝癌樣本、NMF1組樣本、NMF2組樣本與正常CON組樣本間的差異表達(dá)基因。并通過(guò)VEEN 分析,篩選其共同差異表達(dá)基因和特征性差異表達(dá)基因(見(jiàn)圖3A)。共發(fā)現(xiàn)810 個(gè)基因始終在肝細(xì)胞肝癌樣本中差異表達(dá),包括FAM83D、TRIP13、ANLN、GTSE1、CDCA3 等;有768 個(gè)基因僅在NMF1組中差異表達(dá),包括SERPINC1、AHSG、APOA1、AFP、IGFBP1 等;有283 個(gè)基因僅在NMF2組中差異表達(dá),包括IL6、IL10、CXCL8、CCL2、CXCL1 等(見(jiàn)圖3B、表2)。通過(guò)STING 數(shù)據(jù)庫(kù)構(gòu)建不同分組差異表達(dá)基因的相互作用網(wǎng)絡(luò),并根據(jù)基因權(quán)重篩選出各分組核心基因見(jiàn)圖3C。
圖3 A.各組差異表達(dá)基因火山圖;B.VEEN圖;C.各組PPI網(wǎng)絡(luò),分別為全部樣本中810個(gè)差異表達(dá)基因網(wǎng)絡(luò)、NMF1中768個(gè)特征差異表達(dá)基因網(wǎng)絡(luò)、NMF2中283個(gè)特征差異表達(dá)基因網(wǎng)絡(luò)
表2 PPI網(wǎng)絡(luò)權(quán)重前10的基因
2.4 生物學(xué)功能注釋 對(duì)肝細(xì)胞肝癌始終差異表達(dá)基因、NMF1組特征差異表達(dá)基因和NMF2組特征差異表達(dá)基因進(jìn)行GO 和KEGG 生物信息注釋分析。結(jié)果發(fā)現(xiàn),肝細(xì)胞肝癌始終在細(xì)胞分裂、有絲分裂核分裂、染色體端粒、細(xì)胞周期和P53 信號(hào)通路等發(fā)生異常改變。NMF1組主要為代謝通路、藥物代謝、碳代謝、氨基酸代謝和PPAR 信號(hào)通路等發(fā)生改變;NMF2組的改變主要在細(xì)胞因子受體相互作用、NOD 樣受體信號(hào)通路、蛋白消化和吸收等(見(jiàn)圖4A-C)。NMF1組NMF2組成分改變存在區(qū)別,表明兩組腫瘤異質(zhì)性明顯。通過(guò)不同分組差異表達(dá)基因的相互作用網(wǎng)絡(luò)分析,篩選出其首要模塊,并對(duì)模塊基因行功能通路富集分析,結(jié)果顯示肝細(xì)胞肝癌首要模塊基因富集于有絲分裂和分裂、細(xì)胞分裂和姐妹染色單體凝聚;NMF1 首要模塊基因富集于細(xì)胞外空隙、胞外區(qū)和外泌體;NMF2 首要模塊與信號(hào)轉(zhuǎn)導(dǎo)、趨化因子調(diào)節(jié)信號(hào)通路和趨化因子活化相關(guān)(見(jiàn)表3)。
圖4 A~C.各組差異表達(dá)基因GOKEGG富集的生物學(xué)功能;D~E.肝細(xì)胞肝癌拷貝數(shù)變異情況
表3 差異表達(dá)基因PPI模塊功能通路富集
2.5 拷貝數(shù)變異分析 通過(guò)GISTIC 分析肝細(xì)胞肝癌患者中的拷貝數(shù)變異情況。共發(fā)現(xiàn)108966 個(gè)CNV 缺失和114190 個(gè)CNV 擴(kuò)增,發(fā)生拷貝數(shù)顯著改變的基因有2042 個(gè),其中NMF1組有35 個(gè)特征差異表達(dá)基因,包 括PEBP4、DIRAS1、KISS1R、LEF1-AS1、RHCE等;NMF2組有20 個(gè)特征差異表達(dá)基因,包括DUSP5、VWA2、TLX1、ZFPM2-AS1、EFNA5(見(jiàn) 圖4D-E、表4)。NMF1組和NMF2組共有的拷貝數(shù)變異位點(diǎn)有20p13、5q11.2、17q21.2、1p13.3 和1p36.1 等。NMF1組與NMF2組拷貝數(shù)變異位點(diǎn)比較,NMF1組特征性拷貝數(shù)變異較明顯的位點(diǎn)為4q13.2,NMF2組特征性拷貝數(shù)變異較明顯的位點(diǎn)為1p31.1、3q29、6p21.32、8p11.22和17p11.2(見(jiàn)圖5)。
圖5 A~B.NMF1組肝細(xì)胞肝癌患者拷貝數(shù)變異情況;C~D.NMF2組患者肝細(xì)胞肝癌拷貝數(shù)變異情況
表4 受拷貝數(shù)變異顯著影響的DEG
本研究通過(guò)分析肝細(xì)胞肝癌的mRNA 測(cè)序數(shù)據(jù)探究肝細(xì)胞肝癌內(nèi)部的異質(zhì)性,并根據(jù)對(duì)不同分組差異表達(dá)基因生物學(xué)功能富集分析,探討肝細(xì)胞肝癌分子機(jī)制。研究結(jié)果表明,肝細(xì)胞肝癌始終在細(xì)胞分裂、有絲分裂核分裂、染色體端粒、細(xì)胞周期和P53 信號(hào)通路等顯著異常改變。端粒是染色體末端上的DNA 蛋白質(zhì)復(fù)合體,呈現(xiàn)為G-四倍體,在腫瘤的發(fā)生中發(fā)揮重要作用[5]。細(xì)胞由于端粒酶活化而獲得無(wú)限增殖能力已在包括肝細(xì)胞肝癌的多種癌癥中被證實(shí),其機(jī)制是端粒維持端粒在細(xì)胞分裂過(guò)程中長(zhǎng)度的穩(wěn)定性實(shí)現(xiàn)的[6]。
肝細(xì)胞肝癌患者mRNA 數(shù)據(jù)通過(guò)NMF 聚類分析,可分為NMF1 和NMF2 兩個(gè)亞型,其中NMF1組功能信號(hào)通路改變主要為代謝通路、藥物代謝、碳代謝、氨基酸代謝和PPAR 信號(hào)通路等;NMF2組的功能信號(hào)通路改變主要在細(xì)胞因子受體相互作用、NOD 樣受體信號(hào)通路、蛋白消化和吸收等。癌癥的演進(jìn)和代謝關(guān)系密切,細(xì)胞代謝改變是癌癥發(fā)生導(dǎo)致的結(jié)果也可反作用促進(jìn)癌癥進(jìn)展[7]。NOD 樣受體在固有免疫應(yīng)答中具有重要意義,尤其在監(jiān)測(cè)細(xì)胞內(nèi)微環(huán)境、調(diào)節(jié)免疫和清除病原體方面[8]。WANG 等發(fā)現(xiàn)NOD2 和NLRX1 基因的表達(dá)水平與肝細(xì)胞肝癌預(yù)后顯著相關(guān)[9],提示NOD 樣受體通路可作為NMF2 型肝細(xì)胞肝癌患者預(yù)后評(píng)價(jià)。
本研究通過(guò)分析NMF1 和NMF2 型肝細(xì)胞肝癌,發(fā)現(xiàn)NMF1 型肝細(xì)胞肝癌相較于NMF2 型免疫評(píng)分更高,免疫浸潤(rùn)水平更高,腫瘤純度更低。此外,NMF1 型在免疫評(píng)分和免疫細(xì)胞組成上更接近于正常肝細(xì)胞。然而,差異表達(dá)分析和拷貝數(shù)變異結(jié)果表明,NMF2 型肝細(xì)胞肝癌差異表達(dá)基因少,且傾向更少CNV 發(fā)生,基因組更穩(wěn)定。綜上所述,NMF1 型肝細(xì)胞肝癌腫瘤純度低、免疫評(píng)分高、免疫浸潤(rùn)水平高且惡性程度低,可能對(duì)免疫治療反應(yīng)性更好。