王軍軍 方雪芬 林秋燕
1.福建省立金山醫(yī)院檢驗科,福建福州 350028;2.福建醫(yī)科大學附屬協(xié)和醫(yī)院消化內(nèi)科,福建福州 350001
原發(fā)性肝癌是全球第六大常見的惡性腫瘤,是腫瘤相關死亡的第三大原因,僅次于肺癌和結(jié)直腸癌。原發(fā)性肝癌根據(jù)病理類型分為肝細胞癌(hepatocellular carcinoma,HCC)、 肝內(nèi)膽管癌以及混合型, 其中HCC 占75%~85%。肝癌起病隱匿,很多首次確診的病人往往錯過手術(shù)切除治療的最佳時機,建立肝癌早期的診斷模型,對接受早期治療尤為重要。目前,常用的診斷肝癌血清學標志物敏感度和特異度有限,迫切需要探索診斷效能高、 評估預后價值好的腫瘤標志物。現(xiàn)有藥物療效一般,副作用大,總體的5年生存率低,因此開發(fā)新的分子靶向治療藥物與免疫檢查點抑制劑藥物尤為重要。本研究通過分析癌癥基因圖譜(the cancer genome atlas,TCGA) 數(shù)據(jù)庫肝癌數(shù)據(jù)集,尋找有價值的預測肝癌發(fā)生的相關基因,為探索新的分子靶向藥物提供數(shù)據(jù)支持,為提高肝癌的診療水平提供新的思路。
進入TCGA 數(shù)據(jù)庫(https://portal.gdc.cancer.gov/),點擊“Repository”,“file”選擇“Transpcriptome profilling、HTSeq FPKM”,“case”下選擇“Liver and intrahepatic bile ducts、TCGA LIHC、Adenomas and adenocarcinomas”可篩選出一項424 例肝細胞癌轉(zhuǎn)錄組數(shù)據(jù)集,下載肝癌數(shù)據(jù)集mRNA 表達信息的RNASeq 數(shù)據(jù)及相應的臨床資料。本研究共納入397 例組織并分成兩組:HCC 組[共347 例,其中男236 例,女111 例;平均年齡(58.67±13.83)歲]與正常癌旁組[共50 例,其中男28 例,女22 例;平均年齡(61.68±16.12)歲]。同時根據(jù)已下載肝癌數(shù)據(jù)集的臨床分期資料將HCC 組中的347 例分為4 組:Stage Ⅰ(171 例)、Stage Ⅱ(86例)、StageⅢ(85 例)、Stage Ⅳ(5 例)。納入標準:根據(jù)篩選條件進行限定檢索所得的數(shù)據(jù)。排除標準:臨床數(shù)據(jù)和預后數(shù)據(jù)缺失病例。
應用R 語言整理肝癌數(shù)據(jù)集中Ephrin A1~5(EFNA1~5)mRNA 表達量, 并將得到的mRNA 表達量矩陣數(shù)據(jù)進行對數(shù)轉(zhuǎn)換, 比較EFNA1~5 mRNA 表達量在肝癌組與正常癌旁組之間的表達差異。進一步根據(jù)肝癌分期Stage Ⅰ~Ⅳ進行分組, 比較其在StageⅠ~Ⅳ組與正常癌旁組之間的表達差異。
應用受試者工作特征曲線(receiver operating characteristic curve,ROC)分析單項EFNA1~5 mRNA 預測肝癌發(fā)生及肝癌分期Stage Ⅰ~Ⅳ的價值。同時以是否為肝癌患者或者處于肝癌分期Stage Ⅰ~Ⅳ為因變量,以EFNA1~5 mRNA 表達量為自變量,進行二分類logistic 回歸分析,建立多項Ephrin As(EFNAs)聯(lián)合預測指標,采用ROC 曲線分析其預測肝癌發(fā)生及肝癌分期Stage Ⅰ~Ⅳ的價值。ROC 曲線檢驗診斷價值指標標準為:AUC 值>0.90 表示診斷性能較高,0.71~0.90 表示有一定診斷性,0.50~0.70 表示診斷性能較差。
HCC 組EFNA1、EFNA3、EFNA4 mRNA 表達水平高于正常癌旁組,HCC 組EFNA2、EFNA5 mRNA表達水平低于正常癌旁組,差異有統(tǒng)計學意義(P<0.01)(圖1)。
圖1 EFNA1~EFNA5 mRNA 在正常癌旁組與HCC 組的表達差異分析
HCC Stage Ⅰ~Ⅳ組EFNA1、EFNA3、EFNA4 mRNA 表達水平高于正常癌旁組,HCC Stage Ⅱ、 Ⅳ組EFNA2 mRNA 表達水平低于正常癌旁組, 差異有統(tǒng)計學意義(P<0.01);HCC Stage Ⅰ、Ⅲ組的EFNA2 mRNA 表達水平與正常癌旁組比較, 差異無統(tǒng)計學意義(P>0.05);HCC Stage Ⅰ~Ⅲ組的EFNA5 mRNA 表達水平低于正常癌旁組,差異有統(tǒng)計學意義(P<0.01);HCC Stage Ⅳ組的EFNA5 mRNA 表達水平與正常癌旁組比較,差異無統(tǒng)計學意義(P>0.05)(圖2)。
圖2 EFNA1~EFNA5 mRNA 在正常組與HCC Stage Ⅰ~Ⅳ組的表達差異
2.3.1 單項EFNAs mRNA 預測肝癌發(fā)生的價值 ROC曲線分析顯示,EFNA1、EFNA3、EFNA4、EFNA5 mRNA 表達水平單項預測肝癌發(fā)生的AUC 分別0.712、0.854、0.910、0709 (P<0.01);EFNA2 mRNA 表達水平預測肝癌發(fā)生的AUC 為0.547(P>0.05)(圖3)。
2.3.2 多項EFNAs mRNA 聯(lián)合預測肝癌發(fā)生的價值為進一步控制EFNA1~5 mRNA 表達量各因素干擾與肝癌發(fā)生的關系,以是否診斷為肝癌為因變量(正常為0,診斷為肝癌為1),以EFNA1~5 mRNA 表達量為自變量(連續(xù)變量無需賦值),進行多因素logistic 回歸分析。結(jié)果顯示,EFNA3、EFNA4 mRNA 表達量是肝癌發(fā)生的獨立危險因素(P<0.01)(表1)。將回歸分析模型預值(即EFNA3、EFNA4 聯(lián)合檢測)作為一個新變量與EFNA1~5 mRNA 表達量共同進行ROC 曲線分析,結(jié)果顯示,聯(lián)合預測肝癌發(fā)生的效能、敏感度、特異度均比單項EFNAs 高(表2,圖3)。
圖3 EFNA1~5 mRNA 預測肝癌發(fā)生的ROC 曲線
表1 EFNA1~5 mRNA 預測肝癌發(fā)生的多因素logistic 回歸分析
表2 EFNA1~5 mRNA 預測肝癌發(fā)生的價值
2.3.3 單項及多項EFNAs mRNA 聯(lián)合預測肝癌各臨床分期的價值 ROC 曲線分析顯示, 單項EFNA1、EFNA3、EFNA4、EFNA5 mRNA 表 達 量 在 肝 癌 進 展Stage Ⅰ~Ⅳ均有一定的預測能力;單項EFNA2 mRNA表達量在肝癌進展Stage Ⅱ、 Ⅳ有一定的預測能力(P<0.01)(表3)。為進一步控制各因素干擾與肝癌各個分期的關系, 分別以是否為診斷肝癌Stage Ⅰ~Ⅳ為因變量(正常為0,診斷為肝癌Stage Ⅰ~Ⅳ為1),EFNA1~5 mRNA 表達量為自變量(連續(xù)變量無需賦值),進行多因素logistic 回歸分析。結(jié)果顯示,EFNA3、EFNA4 mRNA 表達量為肝癌進展Stage Ⅰ~Ⅲ的獨立危險因素,EFNA1 mRNA 表達量是肝癌進展Stage Ⅱ的獨立危險因素(P<0.05)。將回歸分析模型預值(即EFNA1、EFNA3、EFNA4 聯(lián)合檢測) 作為一個新變量與EFNA1~5 mRNA 表達量共同進行ROC 曲線分析,結(jié)果顯示, 聯(lián)合預測均比單項EFNAs mRNA 預測效能高,且敏感度、特異度更高(P<0.01)(表3~4,圖4)。因肝癌Stage Ⅳ組病例僅有5 例,不符合logistic 回歸分析的要求,故無法建立多項EFNAs mRNA 表達量在肝癌Stage Ⅳ聯(lián)合預測指標。
圖4 EFNA1~5 mRNA 預測肝癌Stage Ⅰ~Ⅳ分期的ROC 曲線
表3 肝癌分期Stage Ⅰ~Ⅳ的二元logistic 回歸分析
產(chǎn)生促紅細胞生成素的肝癌細胞受體(erythropoietin-producing hepatoma,Eph) 屬于已知最大的受體酪氨酸激酶大家族,其在生理及病理過程中發(fā)揮著重要作用。在人類中發(fā)現(xiàn)了總共14 個Eph 受體,基于氨基酸序列同源性、錨定方式和相對結(jié)合親和力不同,分為EphA 和EphB 兩種亞型;Ephrin 配體均為細胞膜結(jié)合蛋白, 包含五種糖基磷脂酰肌醇(glycosylphosphatidylinositol,GPI)方式錨定于細胞膜的EF-NA1~5 和三種單跨膜糖蛋白形式的Ephrin B1~3(EFNB1~3)亞型。Ephrin 配體與Eph 受體結(jié)合沒有特異性,一種受體或者配體可以與多種配體和受體相結(jié)合。目前大量的生物信息學分析表明,多種Eph 受體及其Ephrin 配體在乳腺癌、胃癌、非小細胞癌、結(jié)直腸癌、腎癌等腫瘤中表達,且生存分析提示預后不良。有研究指出,Eph 受體及Ephrin 配體相互作用,激活包括Src、RHOA、RAC1、CDC42、STAT3、PIK3/Akt 等信號通路,參與腫瘤的血管新生、侵襲、轉(zhuǎn)移過程。研究顯示,EFNA1 在多種肝癌細胞系中與甲胎蛋白表達量呈現(xiàn)正相關,推測其在肝癌的發(fā)生及侵襲進展發(fā)揮著重要作用。有學者通過蛋白芯片檢測發(fā)現(xiàn),EFNA1 mRNA 表達量是肝癌獨立的預后因子,其可能是評估肝癌患者術(shù)后復發(fā)的一項很有價值的指標。EFNA2 在肝癌細胞株及肝癌組織,尤其是侵犯門靜脈系統(tǒng)的病例中,蛋白表達水平較高,其可能通過Rac1/Akt/NF-kappaB 信號通路抑制肝癌細胞凋亡,促進肝癌轉(zhuǎn)移。EFNA3 可能與缺氧環(huán)境誘導乳腺癌轉(zhuǎn)移的機制有關。有學者通過構(gòu)建人源腫瘤異種移植模型, 制備EFNA4 抗體的靶向DNA 破壞藥物,可以特異性地逆轉(zhuǎn)三陰性乳腺癌和卵巢癌。也有學者提出,miR-96、miR-182 可能作為致癌因子,通過結(jié)合EFNA5 mRNA 3'UTR 抑制其蛋白表達, 促進肝癌細胞增殖、遷徙轉(zhuǎn)移。EFNA5 在多種腫瘤中低表達, 且高表達EFNA5 的肝癌患者有更好的總生存率和無病生存率,EFNA5 可作為判斷肝癌術(shù)后預后的重要標志物。因此,Eph 受體及Ephrin 配體被認為是非常有前途的腫瘤診斷及藥物治療靶標分子。
表4 ROC 曲線評估EFNA1~5 mRNA 預測肝癌各臨床分期的價值
本研究基于TCGA 數(shù)據(jù)庫, 分析肝癌數(shù)據(jù)集中EFNAs mRNA 的表達量, 并結(jié)合數(shù)據(jù)集的臨床分期數(shù)據(jù),進一步分析肝癌各個臨床分期組與正常癌旁對照組之間的差異表達。研究結(jié)果顯示,HCC 組的EFNA1、EFNA3、EFNA4 mRNA 表達量高于正常癌旁組, 而EFNA2、EFNA5 mRNA 表達量低于正常癌旁組,差異有統(tǒng)計學意義(P<0.01)。有研究顯示,EFNA4表達水平升高與黑色素瘤患者的生存率下降有關,EFNA4 的增強與黑色素瘤的進展有關。有學者利用Oncomine 數(shù)據(jù)庫和GEPIA 數(shù)據(jù)庫研究發(fā)現(xiàn), 肺腺癌中EFNA3 表達上調(diào)與較差的臨床預后有關, 通過收集臨床標本進行免疫組化實驗驗證EFNA3 的表達量及臨床價值, 同時通過細胞實驗證明EFNA3 可以提高肺腺癌細胞增殖和糖酵解能力,免疫浸潤分析提示EFNA3 與多個免疫治療生物標志物有關。這些研究都預示著EFNA3、EFNA4 在腫瘤發(fā)生及進展中的重要作用。本研究經(jīng)logistic 回歸分析, 篩選EFNA1~5 mRNA 表達量作為肝癌發(fā)生的相關因素, 結(jié)果顯示,EFNA3、EFNA4 mRNA 是肝癌發(fā)生的獨立危險因素(P<0.05), 同時建立多項EFNAs 聯(lián)合預測肝癌發(fā)生的模型。ROC 曲線分析結(jié)果顯示, 單項及多項聯(lián)合EFNAs mRNA 在肝癌的發(fā)生和各臨床分期均有較好的預測價值, 且多項EFNAs 聯(lián)合預測指標有更好的預測效能。本研究按肝癌臨床分期進行分組,與正常組比較分析發(fā)現(xiàn),EFNA3、EFNA4 mRNA 聯(lián)合預測指標在肝癌Stage Ⅰ、Ⅱ、Ⅲ分組的預測效能明顯優(yōu)于單項EFNAs 的預測能力,其AUC 值均在0.9 以上(P<0.01),但肝癌組Stage Ⅳ納入病例數(shù)量達不到logistic回歸分析統(tǒng)計要求, 無法進行EFNAs mRNA 聯(lián)合預測模型構(gòu)建。
綜上所述,本研究推斷EFNA3、EFNA4 在肝癌的發(fā)生及疾病進展中發(fā)揮著重要的作用,其具體機制值得深入研究,其可能為今后肝癌早期診斷、預后判斷以及靶向治療提供新方法、 新策略。本研究僅基于TCGA 數(shù)據(jù)庫結(jié)合已知的臨床數(shù)據(jù)資料,進行生物信息學分析,結(jié)果有一定的局限性,其中因納入統(tǒng)計的肝癌Stage Ⅳ病例較少,因此后續(xù)研究工作可以選擇更大的肝癌數(shù)據(jù)集進行驗證,并收集一定數(shù)量的臨床病例進行研究。