(北京市海淀醫(yī)院 普通外科,北京 100080)
肝內(nèi)膽管癌(intrahepatic cholangiocarcinoma,ICC)是起源于二級膽管及其以上肝內(nèi)膽管分支上皮細(xì)胞的惡性腫瘤,也稱為肝內(nèi)膽管細(xì)胞癌,其發(fā)病率在原發(fā)性肝癌中僅次于肝細(xì)胞癌,占肝臟惡性腫瘤的5%~10%[1]。ICC具有淋巴結(jié)轉(zhuǎn)移、血管神經(jīng)侵犯、肝外轉(zhuǎn)移、術(shù)后較早復(fù)發(fā)等特點(diǎn),患者總體預(yù)后極差[2]。研究表明根治性手術(shù)是目前唯一可能治愈ICC的治療方式[3],但由于缺乏有效的早期篩查指標(biāo),大部分患者發(fā)現(xiàn)時已處于臨床進(jìn)展期,失去根治性治療機(jī)會。因此尋找具有高特異性和敏感性的分子標(biāo)志物對ICC輔助診斷和判斷預(yù)后具有重要意義。本研究擬基于通過下載TCGA數(shù)據(jù)庫相關(guān)基因數(shù)據(jù),經(jīng)edgeR包分析差異表達(dá)基因,并用“survival”函數(shù)包進(jìn)行生存曲線分析,尋找可能與ICC預(yù)后相關(guān)的基因,為ICC患者的預(yù)后判斷提供數(shù)據(jù)支持。
下載TCGA數(shù)據(jù)庫中33例ICC組織和8例癌旁組織中的RNA-seq表達(dá)矩陣數(shù)據(jù)和其配套的臨床資料信息,并整理成R軟件(版本3.5.2)可以識別的數(shù)據(jù)格式。
利用edgeR包對整理好的數(shù)據(jù)表達(dá)矩陣進(jìn)行基因差異分析(|log2 Fold Change|>1,P<0.05)。
對篩選得到的差異基因進(jìn)行單因素Cox回歸生存分析(P<0.05),進(jìn)一步利用“survival”函數(shù)包的Kaplan-Meier法對已篩選的差異基因進(jìn)行生存分析,并繪制生存曲線(P<0.01),選取有意義基因。對單因素Cox回歸分析得到的相關(guān)基因進(jìn)行多因素逐步回歸分析,構(gòu)建預(yù)測肝內(nèi)膽管細(xì)胞癌患者預(yù)后風(fēng)險(xiǎn)的多因素Cox模型:風(fēng)險(xiǎn)值(risk score)=expmRNA1×βmRNA1+expmRNA2×βmRNA2+…+expmRNAn×βmRNAn(exp:基因表達(dá)水平;β:多因素Cox回歸分析的回歸系數(shù)),并繪制森林圖。將所有肝內(nèi)膽管細(xì)胞癌患者風(fēng)險(xiǎn)值的中位值設(shè)為閾值,根據(jù)此閾值將患者劃分為高風(fēng)險(xiǎn)組和低分險(xiǎn)組,用Kaplan-Meier法繪制生存曲線,并進(jìn)行Log-rank檢驗(yàn)(P<0.01)。通過多因素Cox回歸分析,進(jìn)一步檢驗(yàn)這些基因?qū)Ω蝺?nèi)膽管細(xì)胞癌患者的預(yù)后價值。
通過在線數(shù)據(jù)庫DAVID(版本6.8)對識別的差異基因進(jìn)行通路富集分析。繪制京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)圖表。
利用edgeR包對整理好的數(shù)據(jù)表達(dá)矩陣進(jìn)行基因差異分析篩選(篩選標(biāo)準(zhǔn)為|log2 Fold Change|>1,P<0.05)。共篩選出6 617個差異基因,其中高表達(dá)組4 094個,低表達(dá)組2 523個。
通過單因素Cox回歸對篩選得到的差異基因進(jìn)行生存分析(P<0.05),利用“survival”函數(shù)包,對篩選的差異基因進(jìn)行生存分析,繪制并選取生存曲線(P<0.01)。分析發(fā)現(xiàn),UCN2、CST1、PROS1、SLC35E4、PEMT五個基因可能對ICC患者預(yù)后存在顯著影響(圖1)。對該5個基因進(jìn)行單因素回歸分析(表1),并以CST1、PEMT、PROS1基因構(gòu)建ICC患者預(yù)后風(fēng)險(xiǎn)多因素Cox模型(表2),風(fēng)險(xiǎn)值=(PEMT×0.8)+(PROS1×0.47)+(CST1×0.23)。繪制森林圖(圖2)和ROC曲線(圖3)。根據(jù)風(fēng)險(xiǎn)模型,可得到所有ICC患者的風(fēng)險(xiǎn)值,并將所有患者風(fēng)險(xiǎn)值的中位值設(shè)為閾值,根據(jù)此閾值將患者區(qū)分為高風(fēng)險(xiǎn)組和低分險(xiǎn)組,用Kaplan-Meier法繪制生存曲線(圖4)。結(jié)果顯示,CST1、PEMT、PROS1構(gòu)建的風(fēng)險(xiǎn)模型中高低風(fēng)險(xiǎn)組患者的預(yù)后存在統(tǒng)計(jì)學(xué)差異。
通過在線數(shù)據(jù)庫DAVID(版本6.8)對“edgeR”R包篩選差異基因分析主要信號通路,繪制KEGG圖(見圖5)。因差異基因數(shù)量巨大,選取差異基因?yàn)楦弑磉_(dá)組前100個,低表達(dá)組前100個。KEGG顯示差異基因主要富集于化學(xué)物致癌作用、藥物代謝-細(xì)胞色素P450系統(tǒng)、細(xì)胞色素P450對異生物質(zhì)的代謝影響、視黃醇的代謝等通路。
圖1 UCN2、CST1、PROS1、SLC35E4、PEMT基因ICC患者生存曲線(P<0.01)。
表1 單因素回歸分析結(jié)果
表2 多因素回歸分析結(jié)果
圖2 CST1、PEMT、PROS1基因多因素Cox回歸風(fēng)險(xiǎn)模型
目前已有關(guān)于膽管癌預(yù)后基因篩查的文獻(xiàn),但與本研究使用分析方法不同,其結(jié)果內(nèi)包含本研究中CST1和SLC35E4基因。在已知報(bào)道中,CST1通過加權(quán)基因共表達(dá)網(wǎng)絡(luò)(Wgcna)分析癌癥基因組圖譜中膽管癌患者的mRNA測序數(shù)據(jù)和臨床信息,得到預(yù)測基因表達(dá)間的內(nèi)在關(guān)系,顯示CST1與膽管癌病理分期、組織學(xué)分級和肝功能相關(guān),影響膽管癌患者的整體生存時間,與膽管癌患者的進(jìn)展和預(yù)后有關(guān)[4]。SLC35E4亦是從癌癥基因組(TCGA)數(shù)據(jù)庫獲得相應(yīng)信息,選出差異基因后構(gòu)建CERNA網(wǎng)絡(luò),預(yù)測該基因潛在的調(diào)控功能[5]。本研究數(shù)據(jù)雖來自TCGA數(shù)據(jù)庫,但對差異基因使用單因素Cox和多因素Cox回歸分析來識別預(yù)后生存顯著相關(guān)的特征RNA,構(gòu)建患者預(yù)后生存風(fēng)險(xiǎn)模型。采用Kaplan-Meier法、ROC曲線評估特征RNA預(yù)測患者預(yù)后的準(zhǔn)確性,所篩選特征RNA基因?qū)CC患者預(yù)后判斷可能更加準(zhǔn)確可靠。
圖3 CST1、PEMT、PROS1基因風(fēng)險(xiǎn)模型ROC曲線
圖4 CST1、PEMT、PROS1基因風(fēng)險(xiǎn)模型生存曲線
圖5 KEGG通路富集結(jié)果
本研究選取TCGA數(shù)據(jù)庫中的33例ICC組織以及8例癌旁組織的RNA-seq矩陣數(shù)據(jù)及配套臨床數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。應(yīng)用edgeR方法取得差異表達(dá)基因。通過KEGG信號通路富集結(jié)果顯示,這些基因主要集中在化學(xué)物致癌、藥物代謝-細(xì)胞色素P450及細(xì)胞色素P450對異生物質(zhì)的代謝影響、視黃醇的代謝等通路,這些通路與腫瘤發(fā)生關(guān)聯(lián)。據(jù)文獻(xiàn)顯示,化學(xué)物1,2-二氯丙烷和二氯甲烷均與ICC的發(fā)生發(fā)展有關(guān)[6-7],已被國際癌癥研究機(jī)構(gòu)(IARC)列為致癌物;細(xì)胞色素P450酶可以催化多種內(nèi)源性物質(zhì)和外源性物質(zhì)在體內(nèi)的I相代謝反應(yīng),與腫瘤易感性有著密切聯(lián)系[8]。吡考他胺和紫杉醇等藥物抑制肝細(xì)胞癌可能與視黃醇代謝通路相關(guān)[9]。
ICC是肝膽外科常見的惡性腫瘤,發(fā)病率僅次于肝細(xì)胞癌,目前病因和分子機(jī)制尚不清楚。本研究顯示,化學(xué)物致癌作用、藥物代謝-細(xì)胞色素P450系統(tǒng)、細(xì)胞色素P450對異生物質(zhì)代謝影響、視黃醇代謝等通路富集到基因較多。本研究分析發(fā)現(xiàn)5個與ICC預(yù)后相關(guān)的基因,在腫瘤發(fā)生、發(fā)展中發(fā)揮著重要的作用。去除以往發(fā)現(xiàn)與ICC密切相關(guān)的CST1和SLC35E4外,UCN2、PROS1、PEMT3個基因與ICC的相關(guān)研究未見報(bào)道。
有研究顯示,嵌合體7A1-UCN2可能參與喉癌腫瘤干細(xì)胞的轉(zhuǎn)化,促進(jìn)喉癌上皮間充質(zhì)的轉(zhuǎn)變,與患者預(yù)后差相關(guān)[10]。在構(gòu)建的前列腺癌小鼠模型中,UCN2抑制細(xì)胞凋亡,參與了前列腺腫瘤發(fā)生和進(jìn)展[11],提示此基因具有腫瘤促進(jìn)作用。本研究顯示,UCN2在ICC中明顯高表達(dá),但UCN2在肝膽管癌中的作用尚無報(bào)道,具體作用機(jī)制尚需進(jìn)一步實(shí)驗(yàn)證實(shí)。
PROS1可通過引導(dǎo)TAM受體抑制先天細(xì)胞的激活,以及促進(jìn)組織修復(fù)和清除凋亡細(xì)胞來恢復(fù)組織功能,參與腫瘤的發(fā)生和發(fā)展。配體蛋白S1(PROS1)參與激活TAM受體,而TAM受體Tyro3、Axl、Mertk是多向表達(dá)的受體,幾乎由腫瘤微環(huán)境的所有細(xì)胞表達(dá),具有促癌和免疫抑制的功能,在癌癥中經(jīng)常過度表達(dá)[12]。腫瘤分泌的PROS1抑制巨噬細(xì)胞M1極化以降低抗腫瘤免疫反應(yīng)[13],促進(jìn)腫瘤的發(fā)展。結(jié)合本研究推測PROS1可能通過腫瘤微環(huán)境及免疫應(yīng)答等促進(jìn)ICC的發(fā)生。
PEMT在肝癌細(xì)胞系中過表達(dá)能夠下調(diào)PI3K/AKT通路,誘導(dǎo)肝癌細(xì)胞凋亡[14],抑制肝癌的發(fā)生,但PEMT主要是影響肝細(xì)胞癌,對于ICC影響不明顯。研究顯示,在缺乏多種耐藥蛋白2(ABCB4)的小鼠模型中,缺失PEMT基因可以減輕肝損傷[15]。本研究顯示,在ICC組,PEMT明顯高表達(dá),可能與增加膽汁淤積及肝損傷,引發(fā)ICC相關(guān)。
綜上所述,通過TCGA數(shù)據(jù)分析,我們發(fā)現(xiàn)了與ICC發(fā)生、發(fā)展關(guān)系密切的5個差異基因,分別是UCN2、CST1、PROS1、SLC35E4、PEMT,可能成為ICC早期診斷和預(yù)后判斷的分子標(biāo)志物,為ICC患者的進(jìn)一步治療提供新的參考。本研究尚存在一些不足,由于TCGA中ICC病例樣本量的限制,干擾了結(jié)果的可靠性和準(zhǔn)確性,需要后續(xù)擴(kuò)大樣本量數(shù)據(jù)進(jìn)一步驗(yàn)證。