陳雅靜,張桐瑋,周 俊,陳舒曼,蒲仕明*
(1.廣西師范大學(xué) 生命科學(xué)學(xué)院, 廣西 桂林 541006;2.廣西高校干細(xì)胞與醫(yī)藥生物技術(shù)重點實驗室(廣西師范大學(xué)),廣西 桂林 541004;3.廣西師范大學(xué) 生物醫(yī)學(xué)研究中心,廣西 桂林 541004;4. 廣西珍稀瀕危動物生態(tài)學(xué) 重點實驗室(廣西師范大學(xué)), 廣西 桂林 541006)
惡性黑色素瘤是最具侵襲性的癌癥之一,其發(fā)病率呈不斷增加趨勢[1-2]。近年來,黑色素瘤相關(guān)研究進(jìn)展很快,例如Nivolumab作為一種抗PD-1抗體,有助于提高對癌細(xì)胞的免疫反應(yīng),已被FDA批準(zhǔn)用于治療晚期黑色素瘤[3]。其他免疫療法,例如monalizumab——一種增強NK細(xì)胞和CD8+T細(xì)胞活性的人源化抗NKG2A抗體,也在開發(fā)中[4]。盡管使用了包括靶向療法和免疫療法在內(nèi)的不同治療方法,但黑色素瘤患者的預(yù)后仍較差。
目前,已報道了多個指導(dǎo)黑色素瘤個體化治療的預(yù)后模型[5]。研究表明,腫瘤厚度與患者存活率之間存在極高的相關(guān)性[6]。早期識別、積極治療潰瘍和密切隨訪對于黑色素瘤的預(yù)防和改善預(yù)后至關(guān)重要[7]。有無前哨淋巴結(jié)轉(zhuǎn)移是臨床Ⅰ期和Ⅱ期黑色素瘤中的獨立預(yù)后因素[8]。然而,這些根據(jù)患者臨床特征,包括腫瘤的厚度、是否伴隨潰瘍和原發(fā)腫瘤的部位等基于組織學(xué)特征構(gòu)建的預(yù)后模型并不能很好地預(yù)測每個個體的腫瘤預(yù)后[9-10]。
近年來,眾多研究相繼發(fā)現(xiàn)了一系列與黑色素瘤預(yù)后相關(guān)的分子標(biāo)志,例如特異基因的異常表達(dá)(包括蛋白質(zhì)和mRNA水平)與非編碼lncRNA和miRNA等。許多研究還發(fā)現(xiàn)調(diào)節(jié)因子m6A通過調(diào)節(jié)lncRNA來影響癌癥的進(jìn)展和預(yù)后[11]。例如,一些lncRNAs可以區(qū)分黑色素瘤的亞型并預(yù)測其生存情況。過表達(dá)的lncRNA HCP5還可以在體外降低黑色素瘤細(xì)胞惡變的概率,這可能與RARRES3上調(diào)有關(guān)[12];血清微miRNA作為黑色素瘤復(fù)發(fā)的生物標(biāo)志物[13]。然而,僅使用一種生物標(biāo)志物來預(yù)測患者預(yù)后的敏感性和特異性并不能達(dá)到理想效果,使用多種蛋白質(zhì)生物標(biāo)志物的預(yù)后模型將在黑色素瘤患者的診斷和預(yù)后中顯示出巨大的潛力。
TCPA(the cancer proteome atlas,https:∥www.tcpaportal.org/)是一個患者腫瘤樣本的蛋白質(zhì)組學(xué)數(shù)據(jù)庫,TCGA(the cancer tenome atlas,https:∥portal.gdc.cancer.gov/)則是癌癥患者的臨床特征數(shù)據(jù)庫。近來,許多研究人員對這2個數(shù)據(jù)庫進(jìn)行聯(lián)合分析,建立了不同腫瘤的蛋白質(zhì)預(yù)后模型,發(fā)現(xiàn)可以很好地預(yù)測腫瘤患者的預(yù)后。Fang等[14]利用Kaplan-Meier生存分析、單變量和多變量Cox分析,建立了肺鱗狀細(xì)胞癌(LUSCC)患者的預(yù)后預(yù)測模型。根據(jù)風(fēng)險模型中每個蛋白質(zhì)的系數(shù)計算出每個患者的風(fēng)險值,能有效預(yù)測LUSCC患者的預(yù)后。 Tian等[15]通過利用TCPA、GEO(gene expression omnibus)和TCGA獲得了成人腎上腺皮質(zhì)癌(adrenocortical carcinoma,ACC)患者的RPPA數(shù)據(jù)、基因表達(dá)譜和臨床信息,并結(jié)合上海癌癥中心免疫組合數(shù)據(jù)庫數(shù)據(jù),建立綜合預(yù)后相關(guān)蛋白質(zhì)(IPRPs)模型。該預(yù)后模型在多隊列中顯示出比其他生物標(biāo)志物(Ki-67、β-catenin等)更強的預(yù)測價值,提示了利用TCPA和TCGA等數(shù)據(jù)庫建立的疾病預(yù)后模型,對腫瘤相關(guān)蛋白質(zhì)風(fēng)險與腫瘤治療預(yù)后具有較好的指導(dǎo)意義。本文通過TCPA和TCGA這2個數(shù)據(jù)庫建立一個基于11種蛋白質(zhì)表達(dá)數(shù)據(jù)的蛋白質(zhì)預(yù)后模型,并通過B16黑色素瘤細(xì)胞系開展相關(guān)試驗,對部分蛋白質(zhì)的風(fēng)險相關(guān)性進(jìn)行驗證。該模型的建立擬為黑色素瘤患者的預(yù)后判斷提供參考。
黑色素瘤蛋白質(zhì)表達(dá)的數(shù)據(jù)集TCGA-SKCM-L4于2020年3月23日從TCPA下載,該數(shù)據(jù)集由354個樣本組成。與之相關(guān)的臨床特征數(shù)據(jù)從TCGA下載,并選擇TCGA和TCGA-SKCM選項。該數(shù)據(jù)集由344個樣本組成,包含各種臨床特征的信息,包括生存狀態(tài)(0=存活,1=死亡)、生存時間(d)、年齡、性別、分級和TNM分期。
本文使用R語言生存包中Kaplan-Meier(KM)和Cox比例風(fēng)險分析統(tǒng)計方法,確定蛋白質(zhì)表達(dá)與黑色素瘤預(yù)后的關(guān)系。簡單地說,根據(jù)蛋白質(zhì)中位表達(dá)水平將樣本分為低表達(dá)組和高表達(dá)組。比較低表達(dá)組和高表達(dá)組的生存狀態(tài)和生存時間,用KM統(tǒng)計方法計算P值,P<0.05被視為有統(tǒng)計學(xué)意義。采用Cox法計算P值,P<0.05,差異有統(tǒng)計學(xué)意義。使用Cox方法計算危險比(HR)和P值,并用于生成火山圖,使用ggplot2和ggrepel軟件包將數(shù)據(jù)繪制在圖表上。HR值>1的蛋白質(zhì)被認(rèn)為與高風(fēng)險相關(guān),HR值<1的蛋白質(zhì)被認(rèn)為與低風(fēng)險相關(guān)。
采用多因素Cox分析,以生存狀態(tài)和生存時間為因變量,以蛋白質(zhì)表達(dá)為自變量,生成基于蛋白質(zhì)的預(yù)后模型。采用雙向步驟對模型作進(jìn)一步優(yōu)化。利用11種蛋白質(zhì)及其系數(shù)建立預(yù)測模型。隨后,使用這種預(yù)后模型計算所有患者的風(fēng)險評分和中位風(fēng)險評分,并將患者分組:患者風(fēng)險評分大于中位風(fēng)險評分的為高危組,其余患者為低危組[16-17]。
使用survival和survminer軟件包進(jìn)行基于預(yù)后模型中的11種蛋白質(zhì)的蛋白質(zhì)生存分析。計算中位蛋白質(zhì)表達(dá)量,將蛋白質(zhì)水平高于中位的患者歸為高表達(dá)組,其余患者分為低表達(dá)組;比較高、低表達(dá)組的生存狀態(tài)和存活時間,使用每個患者的風(fēng)險評分進(jìn)行風(fēng)險生存分析,并比較高危和低?;颊叩纳鏍顟B(tài)和生存時間。
風(fēng)險分析是通過對患者的風(fēng)險評分進(jìn)行排序而實現(xiàn)[18]。按照排序,將每個患者的蛋白質(zhì)表達(dá)情況和生存狀態(tài)顯示在熱圖中。生存包用于單因素Cox和多因素Cox模型的單因素和多因素獨立預(yù)后分析,這些因素對生存狀態(tài)和時間的影響用HR值和P值顯示,并使用森林圖進(jìn)行可視化。
采用生存ROC軟件包繪制ROC曲線。基于KM分析,使用危險度評分和其他因素來預(yù)測生存狀態(tài)和時間,估計時間為1 a。隨后,計算假陽性率和真陽性率,繪制ROC曲線,計算AUC值。蛋白質(zhì)共表達(dá)分析采用相關(guān)性檢驗,以預(yù)測與模型中蛋白質(zhì)共表達(dá)的其他蛋白質(zhì)。相關(guān)系數(shù)和P值濾波器分別為0.4和0.001。對滿足過濾條件的蛋白質(zhì)進(jìn)行保存并繪制相關(guān)圖。使用ggplot2和ggalluvial繪制桑基圖,以顯示蛋白質(zhì)與預(yù)后模型中蛋白質(zhì)之間的相關(guān)性。
使用添加10%胎牛血清的RPMI-1640進(jìn)行B16黑色素瘤細(xì)胞培養(yǎng)。GATA6和X1433ZETA過表達(dá)慢病毒購自南京Abmgood公司,并使用MOI為10的比例進(jìn)行慢病毒感染。在熒光顯微鏡下監(jiān)測GFP的表達(dá),確定基因轉(zhuǎn)移效率。
細(xì)胞遷移實驗如文獻(xiàn)[19]所述。將感染GATA6、X1433ZETA或?qū)φ章《镜募?xì)胞接種到含有聚乙烯吡咯烷酮涂層的聚碳酸酯過濾器(8 μm孔徑)的24孔小室中,并評估其遷移能力。小室下方的孔中加入添加0.1%BSA的RPMI-1640培養(yǎng)基,將細(xì)胞(無血清)接種到小室。培養(yǎng)24 h后,固定小室下方的細(xì)胞,用結(jié)晶紫染色。
細(xì)胞凋亡檢測方法如文獻(xiàn)[20]所述。先重懸細(xì)胞,隨后用5 μL Annexin-V和5 μL PI孵育15 min(避光)。流式細(xì)胞術(shù)分析各組凋亡早期細(xì)胞(Annexin V+/PI-)和晚期細(xì)胞(Annexin V+/PI+)的比例。
腫瘤生長分析如文獻(xiàn)[21]所述。將1.5×106個GATA6或X1433ZETA過表達(dá)的B16黑色素瘤癌細(xì)胞注射到6~8周齡的雌性C57BL/6J小鼠皮下。一周后,每隔一天用游標(biāo)卡尺測量腫瘤體積,計算公式為:體積=0.5×寬2×長。
使用Kaplan-Meier (KM)和Cox(比例風(fēng)險模型)生存包分析與黑色素瘤預(yù)后相關(guān)的蛋白質(zhì),樣本分組為高表達(dá)或低表達(dá)(相對于中位表達(dá))。比較低表達(dá)組和高表達(dá)組的生存時間和狀態(tài)。計算P值和HR值,HR值>1表明與高危相關(guān),HR值<1表明與低風(fēng)險相關(guān),用P值和HR值繪制火山圖。如圖1所示,與黑色素瘤預(yù)后相關(guān)的蛋白質(zhì)有52個,其中蛋白質(zhì)高表達(dá)和低表達(dá)的患者預(yù)后有顯著差異(P<0.05為顯著差異,有統(tǒng)計學(xué)意義)。
圖1 黑色素瘤預(yù)后相關(guān)蛋白質(zhì)的火山圖Fig. 1 Volcano map of melanoma prognosis-related proteins
采用生存包中多因素Cox分析構(gòu)建蛋白質(zhì)預(yù)后模型,鑒定出11個蛋白質(zhì)及其系數(shù)(表1),其中GATA6、P27、S6、CD20的系數(shù)較小,X1433ZETA、P21、YAP的系數(shù)較大,表明GATA6與低風(fēng)險相關(guān),X1433ZETA與高風(fēng)險相關(guān)。
表1 黑色素瘤預(yù)后相關(guān)蛋白質(zhì)及其系數(shù)Tab. 1 Melanoma prognosis-related proteins and their coefficients
患者風(fēng)險評分計算方法:風(fēng)險評分=∑[表達(dá)(蛋白)×系數(shù)]。根據(jù)每個患者的風(fēng)險評分以及中位風(fēng)險評分,將患者分為高風(fēng)險組或低風(fēng)險組。通過比較蛋白質(zhì)表達(dá)水平高的患者和表達(dá)水平低的患者的預(yù)后,該模型的有效性得到了驗證。圖2顯示:LCK、P27、S6、SRC_pY416、CD20、CD49B和GATA6與低風(fēng)險相關(guān),因為這些蛋白質(zhì)水平高的患者預(yù)后較好;CKIT、P21、YAP和X1433ZETA與高危相關(guān),這些蛋白質(zhì)表達(dá)水平高的患者預(yù)后較差。
圖2 黑色素瘤預(yù)后與11種預(yù)后模型蛋白質(zhì)表達(dá)的關(guān)系Fig. 2 Prognosis of melanoma in relation to protein expression in 11 prognostic models
首先,為檢驗?zāi)P偷挠行?,本文進(jìn)行了風(fēng)險分析,結(jié)果如圖3所示:風(fēng)險評分高的患者預(yù)后較差。低風(fēng)險評分患者的5年生存率大于75%,而高風(fēng)險評分患者的5年生存率低于50%(P=5.49×10-6)。這顯示了該模型的可靠性。
圖3 黑色素瘤預(yù)后與風(fēng)險評分的關(guān)系Fig. 3 Prognosis of melanoma in relation to risk score
接下來,使用這個模型分析每個病人的預(yù)后。如圖4所示,根據(jù)風(fēng)險評分對患者進(jìn)行排序,風(fēng)險評分的增加與死亡的增加相關(guān)。此外,這11種蛋白在低?;颊吆透呶;颊咧械谋磉_(dá)存在顯著差異。高危相關(guān)蛋白CKIT、P21、X1433ZETA在高危評分患者中高表達(dá),而低危相關(guān)蛋白LCK、P27、S6、SRC_pY416、CD20、GATA6主要在低危評分患者中表達(dá)。
然后,我們使用單因素Cox和多因素Cox模型進(jìn)行單因素和多因素獨立預(yù)后分析,以確定預(yù)后相關(guān)因素。在單因素獨立預(yù)后模型中,腫瘤分期、TNM分型、風(fēng)險評分與預(yù)后相關(guān)(P<0.05)。而在多因素獨立預(yù)后分析中,風(fēng)險評分和TNM分型與黑色素瘤預(yù)后相關(guān);風(fēng)險評分的HR值為1.759(1.329~2.328),大于其他因素。采用ROC曲線分析進(jìn)行預(yù)測效率評價,風(fēng)險評分的AUC得分最大,為0.761分(圖4c),說明風(fēng)險評分相對于其他特征因素是更好的預(yù)測因子。
圖4 單因素和多因素獨立預(yù)后分析及與黑色素瘤預(yù)后相關(guān)因素的ROC曲線Fig. 4 Univariate and multifactorial independent prognostic analyses and ROC curves of factors associated with melanoma prognosis
因為這11種蛋白質(zhì)不是分泌蛋白質(zhì),它們的水平只能在腫瘤組織中測量,因此,我們作進(jìn)一步分析,以確定是否有分泌蛋白質(zhì)與這11個蛋白質(zhì)共表達(dá)。為了避免共表達(dá)蛋白質(zhì)過多,相關(guān)系數(shù)和P值過濾分別設(shè)置為0.4和0.001。上述過濾條件鑒定出了與11個模型蛋白質(zhì)共表達(dá)的65個蛋白質(zhì),與11個模型蛋白質(zhì)高度相關(guān)的分泌蛋白質(zhì)有4個,詳見圖5。
圖5 通過相關(guān)分析鑒定了與預(yù)后模型共表達(dá)的4個分泌蛋白質(zhì)Fig. 5 Four secreted proteins co-expressed with the prognostic model were identified by correlation analysis
?;鶊D(圖6)顯示了蛋白質(zhì)共表達(dá)模式。其中GATA6與最多的蛋白質(zhì)共表達(dá),而X1433ZETA僅與PEA15共表達(dá)。
左側(cè)為預(yù)后模型里的蛋白質(zhì),右側(cè)是與模型蛋白質(zhì)共表達(dá)的蛋白質(zhì)。有最多共表達(dá)蛋白質(zhì)的是GATA6,X1433ZETA僅與PEA15共表達(dá)圖6 共表達(dá)蛋白質(zhì)與預(yù)后模型蛋白質(zhì)的相關(guān)性Fig. 6 Correlation of co-expressed proteins with prognostic model proteins
為了驗證GATA6和X1433ZETA蛋白質(zhì)的作用,采用慢病毒感染方法在B16黑色素瘤細(xì)胞中過表達(dá)GATA6和X1433ZETA,然后檢測細(xì)胞凋亡和細(xì)胞遷移。結(jié)果顯示,過表達(dá)GATA6可顯著誘導(dǎo)細(xì)胞凋亡,而X1433ZETA過表達(dá)對細(xì)胞凋亡無影響;過表達(dá)X1433ZETA可促進(jìn)細(xì)胞遷移,但過表達(dá)GATA6可抑制細(xì)胞遷移(圖7)。
圖7 GATA6和X1433ZETA過表達(dá)對B16黑色素瘤細(xì)胞凋亡和遷移的影響Fig. 7 Effect of GATA6 and X1433ZETA overexpression on apoptosis and migration of B16 melanoma cells
我們使用X1433ZETA和GATA6過表達(dá)細(xì)胞建立了黑色素瘤皮下異種移植小鼠模型,發(fā)現(xiàn)X1433ZETA過表達(dá)可以促進(jìn)腫瘤生長,GATA6過表達(dá)則抑制腫瘤生長。同時,與對照組相比較,X1433ZETA過表達(dá)縮短小鼠存活時間,而GATA6過表達(dá)則會延長小鼠的存活時間。結(jié)果詳見圖8。
圖8 GATA6和X1433ZETA過表達(dá)對B16黑色素瘤小鼠腫瘤生長曲線及存活率的影響Fig. 8 Effect of GATA6 and X1433ZETA overexpression on tumor growth curve and survival rate in B16 melanoma mice
本文建立了一個基于11種蛋白質(zhì)表達(dá)水平的預(yù)后模型,并用來計算每個患者的風(fēng)險評分。分析表明,與低風(fēng)險評分患者相比,高風(fēng)險評分患者預(yù)后明顯較差。多因素獨立預(yù)后分析顯示,風(fēng)險評分與黑色素瘤預(yù)后相關(guān)。ROC曲線分析顯示,風(fēng)險評分AUC值為0.761,表明風(fēng)險評分優(yōu)于年齡、腫瘤分期、TNM分型等其他預(yù)后指標(biāo)。通過相關(guān)性分析,本文鑒定了多個與模型蛋白質(zhì)共表達(dá)的分泌蛋白質(zhì)。體外和體內(nèi)驗證實驗表明,與高風(fēng)險相關(guān)的X1433ZETA過表達(dá)促進(jìn)腫瘤生長,而與低風(fēng)險相關(guān)的GATA6過表達(dá)抑制腫瘤生長。據(jù)估計,全球黑色素瘤發(fā)病率在過去20年中翻了一番,其發(fā)病率被認(rèn)為高于任何其他類型的癌癥(3.1%/年)[22-23]。鑒于其高死亡率,需要一種有效的黑色素瘤預(yù)后模型來改善預(yù)后。
本文預(yù)后模型包括11種蛋白質(zhì),其中LCK、P27、S6、SRC_pY416、CD20和GATA6在預(yù)后較好的患者中高表達(dá),提示這些蛋白質(zhì)與低風(fēng)險相關(guān)。這些結(jié)果與之前的研究結(jié)果一致,例如,Deepak等[24]發(fā)現(xiàn)GATA6是一個星形細(xì)胞瘤腫瘤抑制基因。對于高風(fēng)險蛋白質(zhì)CKIT、P21、X1433ZETA,相關(guān)研究也提示這些蛋白質(zhì)與較差的預(yù)后相關(guān)。例如CKIT在某些癌癥的發(fā)生中起至關(guān)重要的作用,抑制CKIT激酶活性可以成為癌癥治療的靶點[25]。這些結(jié)果表明,本文模型與文獻(xiàn)[24-25]的研究結(jié)果一致,模型是可靠的。
為了驗證該模型,進(jìn)行了單因素和多因素獨立預(yù)后分析,結(jié)果顯示風(fēng)險評分較高的患者預(yù)后明顯較低。此外,使用多因素獨立預(yù)后分析發(fā)現(xiàn)風(fēng)險評分與黑色素瘤預(yù)后相關(guān)。有研究報道了黑色素瘤的預(yù)后模型,例如,一些預(yù)后模型是根據(jù)患者臨床特征建立的,包括腫瘤厚度、有無潰瘍和原發(fā)腫瘤的位置[15]。然而這些模型沒有考慮蛋白質(zhì)表達(dá),所以這些模式無法代表患者的分子生物學(xué)特征。同時,與疾病分級或TNM分期這些用于預(yù)后分析的模型相比,我們的風(fēng)險評分AUC值高于TNM分期或分級(圖4),因而,本文所建立模型的預(yù)測能力優(yōu)于現(xiàn)有的基于TNM分期或疾病分級的預(yù)后模型。
蛋白質(zhì)預(yù)后模型是近些年開發(fā)的一種新的預(yù)后模型,其特點是可以用每個患者的某些蛋白質(zhì)的表達(dá)量來預(yù)測患者的預(yù)后,而非基于患者的臨床特征。因為基于數(shù)據(jù)庫,我們可以獲取每個患者上萬種蛋白質(zhì)的表達(dá)量,從中可以挑選若干跟預(yù)后顯著相關(guān)的蛋白質(zhì)來建立預(yù)后模型,與傳統(tǒng)的基于TNM分期等模型相比,更好地代表了每個患者的腫瘤細(xì)胞分子生物學(xué)特征,在更深入的分子層次建立患者的預(yù)后模型,有更好的預(yù)測能力。本文研究中,比較了本文模型與TNM分期等在預(yù)后預(yù)測中的價值,發(fā)現(xiàn)蛋白質(zhì)預(yù)后模型明顯優(yōu)于傳統(tǒng)的基于臨床特征的模型。正是基于上述優(yōu)點,蛋白質(zhì)預(yù)后模型已廣泛用于腫瘤患者的預(yù)后預(yù)測[26]。因此,本文模型比過去的模型更有優(yōu)勢。相關(guān)性分析發(fā)現(xiàn),本文模型中有多個蛋白質(zhì)與這11個蛋白質(zhì)共表達(dá)。應(yīng)用嚴(yán)格的相關(guān)系數(shù)和P值過濾(0.4和0.001)鑒定出許多分泌蛋白質(zhì)與11個模型蛋白質(zhì)共表達(dá)。當(dāng)無法獲得腫瘤組織時,這些分泌蛋白質(zhì)可能特別重要,因為它們可以作為11種模型蛋白質(zhì)的替代品來預(yù)測患者的預(yù)后。
綜上所述,我們得到了一種基于蛋白質(zhì)的黑色素瘤預(yù)后模型,該模型比基于患者臨床特征的傳統(tǒng)預(yù)后模型表現(xiàn)更好,這有助于人們找到一個更優(yōu)的個體化治療方案。