肖琪,嚴樹麗,詹珊珊
廣東江門中醫(yī)藥職業(yè)學院醫(yī)學技術學院,廣東江門 529000
肝細胞癌的治療一直是難點,對于早期肝細胞癌患者,手術、局部破壞性治療和肝移植是非常有效的治療手段,但手術治療后的復發(fā)是個主要問題,肝細胞癌5 年復發(fā)率超過70%。在很多情況下,肝細胞癌經常在晚期才被診斷出來,許多晚期患者不適合手術根治性治療,傳統(tǒng)的全身化療也收效甚微[1-3]。目前,晚期患者可以口服多激酶抑制劑索拉菲尼進行治療,但只對不到1/3 的患者有很好的療效,并且在治療后的6 個月內會出現(xiàn)明顯的耐藥性。隨著長期使用索拉菲尼還會出現(xiàn)額外的問題,如藥物毒性問題等。近年來,許多科研工作者發(fā)現(xiàn)免疫系統(tǒng)對于腫瘤的發(fā)生發(fā)展具有重要影響[4-6],各種針對癌癥的免疫治療手段層出不窮,如PD-1抗體治療、CAR-T 技術的應用等,但目前這些方法均有其局限性和不良反應,因此迫切需要研發(fā)新型藥物來與傳統(tǒng)藥物配合使用,才能更好地解決這些問題,因此本文選取2019 年6 月、2019 年8 月、2013年4 月上傳到GEO 數(shù)據(jù)庫中的測序數(shù)據(jù),利用生物信息學技術分析肝細胞癌的免疫學機制,為藥物研發(fā)提供理論基礎?,F(xiàn)報道如下。
在基因表達綜合(Gene Expression Omnibus,GEO)數(shù)據(jù)庫中獲得肝細胞癌數(shù)據(jù)表達芯片GSE101685、 GSE101728、 GSE46408, 其 中GSE101685 包含正常組織10 例,肝癌組織24 例;GSE101728 包含正常組織7 例,肝癌組織7 例;GSE46408 包含正常組織6 例,肝癌組織6 例。
GEO2R 在線分析工具依托R 語言limma 程序包對基因芯片進行分析,利用GEO2R (https://www.ncbi.nlm.nih.gov/geo/geo2r/)對3 個基因組表達譜芯片進行分析,以|LogFC>1|、矯正P<0.05 為篩選標準,得到每組芯片的差異基因(differentially expressed genes, DEGs)。為了篩選掉假陽性結果,利用網絡分析平臺(https://www.omicstudio.cn/tool)將3 組芯片的差異基因取交集,獲得共差異基因(co-DEGs)。
利用DAVID(https://david.ncifcrf.gov/)在線分析共差異基因,將共差異基因進行基因本體論(gene ontology, GO)和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes, KEGG)通路分析。
利用STRING 數(shù)據(jù)庫對共差異基因所編碼蛋白之間的相互作用關系進行分析。將得到的co-DEGs 上傳到STRING(https://cn.string-db.org/)數(shù)據(jù)庫,以可信度>0.9 為篩選條件,構建蛋白互作網絡,導出結果后,利用Cytoscape 軟件對蛋白互作網絡進行可視化處理,采用Cyto Hubba 插件計算蛋白節(jié)點并進行評分,取評分前20 位的基因再次進行互作分析,將排名前10 位的基因定義為關鍵基因(hub基因)。
利用GEPIA 網站對篩選后的6 個hub 基因進行生存分析。打開GEPIA 后,選擇“Expression Analysis”模塊,點擊“Survival Analysis”,輸入基因名稱,選擇進行總生存率分析或無病生存率分析,選擇肝癌,即得到基因表達對肝癌患者生存率的影響。
利用TIMER2.0 數(shù)據(jù)庫對6 個hub 基因進行免疫評估。TIMER2.0(http://timer.comp-genomics.org/)數(shù)據(jù)庫提供免疫相關(immune association)、癌癥探索(cancer exploration)和免疫評估(immune estimation)分析。利用TIMER2.0 的免疫相關評價模塊分別對6 個hub 基因與肝癌組織免疫浸潤情況進行相關性分析。
通過GEO2R 的分析篩選,獲得3 組肝細胞癌表達譜芯片差異表達火山圖,其中橫坐標負值代表下調基因,正值代表上調基因。通過GEO2R 的分析篩選,根據(jù)|LogFC>1|、矯正P<0.05 為篩選標準,得到GSE101685 數(shù)據(jù)集DEGs 2 600 個,GSE101728 數(shù)據(jù)集DEGs 4 359 個,GSE46408 DEGs 4 604 個,以韋恩圖取交集獲得共差異基因(co-DEGs)798 個,見圖1。
圖1 差異基因的篩選
通過DAVID 數(shù)據(jù)庫對798 個共差異基因進行GO 分析,結果顯示,這些基因主要參與芳香族氨基酸代謝過程,胞內氨基酸代謝過程,細胞對異物的刺激反應等生物過程。同時差異基因主要富集于稠密染色體、著絲粒區(qū)域以及有絲分裂紡錘體等區(qū)域,參與的分子功能主要有花生四烯酸環(huán)氧合酶活性、氨基轉移酶活性的調節(jié)等。KEGG 富集分析顯示,共差異基因主要參與的代謝通路包括細胞周期循環(huán)、補體和凝血級聯(lián)反應、丁酸代謝等通路,見圖2。
圖2 差異表達基因的GO 富集分析和KEGG 通路分析
通過STRING 數(shù)據(jù)庫構建蛋白質相互作用網絡及Cytoscape 軟件Cytocubba 插件計算關鍵節(jié)點蛋白,得到degree 前20 的基因,將20 個基因再次構建相互作用網絡,將排名前10 位的基因定義為影響肝細胞癌發(fā)生發(fā)展的關鍵基因,按照排序分別為CDK1、CCNA2、CCNB1、CDC20、TOP2A、BUB1、KIF11、CCNB2、MAD2L1、ASPM,見圖3,經TCGA 數(shù)據(jù)庫及HPA 數(shù)據(jù)庫驗證后,篩選得到CDK1、CCNA2、CCNB1、CDC20、TOP2A 和KIF11 這6 個關鍵基因,見圖4。
圖3 差異基因的PPI 互作網絡分析及核心基因篩選
圖4 核心基因在肝癌組織與正常組織中蛋白水平表達量
利用GEPIA 網站進行肝細胞癌的預后分析,結果顯示,6 個hub 基因高表達均會降低患者的總生存率及無病生存率,其中CDC20 在總生存率中的風險比(hazard ratio, HR)值最大,為2.3,而CCNB1 在無病生存率中的HR 值最大,為2,見圖5。
圖5 核心基因的生存分析曲線
為了研究6 個hub 基因高表達導致肝癌患者預后不良的原因,利用TIMER2.0 數(shù)據(jù)庫分析hub 基因與不同免疫細胞數(shù)量的相關性,結果顯示,hub 基因與大部分T 淋巴細胞呈負相關,但與CD4+Th2 細胞呈明顯正相關(P<0.001)。hub 基因與中性粒細胞、樹突狀細胞及M1 型巨噬細胞相關性較低,與原始巨噬細胞、NK 細胞呈負相關,但與腫瘤相關成纖維細胞呈明顯正相關(P<0.001),見圖6。
圖6 核心基因與免疫細胞浸潤相關性分析
對于肝癌的治療,早期肝癌可以選擇的方法有很多,如手術、破壞性治療等,但由于肝細胞癌的特點,其被早期診斷的可能性并不高,而對于晚期肝癌,主要的治療手段是讓患者服用索拉菲尼[7-9],索拉菲尼作為抗肝癌的一線藥物,治療效果顯著,但目前已經發(fā)現(xiàn)許多患者對索拉菲尼有耐藥現(xiàn)象[10],其耐藥機制也逐漸被發(fā)現(xiàn)。所以急需開發(fā)治療晚期肝癌的新型藥物,對索拉菲尼進行補充,甚至取代索拉菲尼對肝細胞癌患者進行治療,近些年腫瘤免疫藥物研發(fā)產業(yè)蓬勃發(fā)展,產生了許多針對肝細胞癌的免疫治療藥物,但依然存在治療效果不確切、治療范圍有限、具有明顯不良反應等缺點,因此本文也通過分析肝細胞癌相關免疫機制來進一步為免疫藥物的研發(fā)提供理論基礎。
本研究利用GO 分析、KEGG 分析、STRING 數(shù)據(jù)庫分析以以及核心基因計算等手段發(fā)現(xiàn)CDK1、CCNA2、CCNB1、CDC20、TOP2A 和KIF11 這6 個基因對于肝細胞癌的發(fā)生發(fā)展可能具有明顯促進作用。腫瘤微環(huán)境是指腫瘤的發(fā)生發(fā)展過程影響其生長、轉移等性狀的環(huán)境因素,包括代謝、分泌、免疫、結構的改變,其中腫瘤周圍的免疫環(huán)境至關重要,腫瘤可以通過免疫逃逸來躲避免疫細胞的殺傷[11-13],找到腫瘤免疫逃逸的機制及重要靶點蛋白對于研發(fā)抗腫瘤藥物至關重要。本研究發(fā)現(xiàn)6 個核心基因會導致患者預后不良,通過對核心基因及不同免疫細胞的相關性分析發(fā)現(xiàn),核心基因與大部分T 淋巴細胞、NK 細胞呈負相關,已有研究表明,CD8+T 細胞、NK 細胞對腫瘤起到殺傷作用,是主要抑制腫瘤的免疫效應細胞[14],這可能是肝細胞癌免疫逃逸的原因之一。本研究結果顯示,所有的核心基因與CD4+的Th2 細胞呈現(xiàn)出明顯的強烈的正相關,有文獻表明,當Th2 在腫瘤免疫微環(huán)境中占主要部分時,會促進腫瘤的進展、轉移和一定的耐藥性[15]。另外,有文章報道,腫瘤細胞可以通過刺激胸腺基質淋巴細胞生成素表達促進原始輔助T 細胞分化為Th2 細胞,進而促進腫瘤細胞的增殖[16]。白細胞介素-4 是Th2 分化的必要細胞因子,同時Th2 也會再次分泌白細胞介素-4 進行正反饋,但免疫細胞上的白細胞介素-4 和白細胞介素-4 受體結合會導致Th2 細胞內STAT6 磷酸化、核易位核GATA3 轉錄因子的表達,導致Th2 細胞因子的分泌,最終可以促進腫瘤細胞的生長和轉移[17]。以上文獻均說明,Th2 可能會促進腫瘤細胞的發(fā)生和發(fā)展。本研究發(fā)現(xiàn),CDK1 等6 個蛋白與Th2 腫瘤浸潤呈強相關性,這6 個核心基因導致肝細胞癌患者預后不良的原因可能是通過介導腫瘤細胞周圍免疫微環(huán)境的變化,促進腫瘤細胞的免疫逃逸,導致患者生存率降低。目前,報道6 種核心基因與Th2 細胞相關的研究較少,已有研究者證明CCNA2 在腫瘤中與Th2 呈正相關[18];CCNB1 沒有報道過在腫瘤患者中與Th2 細胞之間的關系,但可能在COVID-19 感染過程中與Th2 細胞關系比較密切[18];TOP2A在肝癌中與Th2 細胞呈正相關關系[19],然而,并沒有確切的研究表明CCNA2、TOP2A 是如何調節(jié)Th2細胞的,同時對于CDK1、CCNB1、CDC20、KIF11 這4個基因與Th2 細胞的關系的研究本研究尚屬首次,但基因發(fā)揮作用的具體機制還不明確,需要進行后續(xù)的生物學實驗研究驗證。
綜上所述,本研究基于GEO 及TCGA 等網絡數(shù)據(jù)庫篩選肝細胞癌發(fā)生發(fā)展的關鍵蛋白,分析其促癌機制,為后續(xù)肝細胞癌的機制研究及藥物研發(fā)奠定理論基礎。