莊勝,花奇凱,2*,趙勁民*
(1.廣西醫(yī)科大學生物醫(yī)藥協(xié)同創(chuàng)新中心,廣西 南寧;2.廣西醫(yī)科大學第一附屬醫(yī)院,廣西 南寧)
神經(jīng)膠質(zhì)瘤,也稱為膠質(zhì)細胞瘤,是最常見的原發(fā)性中樞神經(jīng)系統(tǒng)腫瘤,幾乎占原發(fā)性惡性腦腫瘤的80%。它們來自神經(jīng)膠質(zhì)細胞,即中樞神經(jīng)系統(tǒng)的神經(jīng)上皮支持細胞。惡性神經(jīng)膠質(zhì)細胞瘤具有彌散性和侵潤性生長的特點,同時具有極強的血管生成能力,再加上其對放療和化療的內(nèi)在抗性,導(dǎo)致了這些腫瘤治療困難[1]。盡管進行了積極的手術(shù),放療和化療,多形膠質(zhì)母細胞瘤的中位生存期仍然只維持在12-15 個月。因此,迫切需要開發(fā)新的預(yù)后生物標記物和有效的治療靶向標記物,以更好的對神經(jīng)膠質(zhì)瘤患者進行危險分層和更加科學的進行治療選擇。
STK3,也稱為MST2,它的中文翻譯為絲氨酸/ 蘇氨酸激酶,在人類中是由蛋白編碼基因STK3 基因編碼的。STK3 是一種由促凋亡分子激活的絲氨酸/蘇氨酸蛋白激酶,表明其編碼的蛋白具有抑制生長的功能,它是河馬(Hippo) 信號通路中控制細胞增殖,細胞凋亡的中央核心酶之一[2,3]。研究顯示,STK3 在腫瘤疾病中有重要作用,例如,STK3 可通過失活YAP 致癌基因來抑制肺癌和肝癌的的腫瘤發(fā)生[4-6]。在60 例肉瘤標本中12 例(20%)檢測到MST2 啟動子甲基化[7]。然而,STK3 在神經(jīng)膠質(zhì)瘤中的作用仍未闡明。
近年來,隨著組學、生物信息學的蓬勃發(fā)展,帶來了海量的腫瘤生物醫(yī)學數(shù)據(jù),如基因,甲基化,蛋白質(zhì)組學,拷貝數(shù)等數(shù)據(jù),這些數(shù)據(jù)的不斷出現(xiàn),給腫瘤的診斷和治療迎來了新的挑戰(zhàn)和機遇,也給廣大科研研究人員提供了大量公開的可利用的數(shù)據(jù)進行研究。
本研究通過中國腦膠質(zhì)瘤基因組圖譜數(shù)據(jù)庫(CGGA)的兩個獨立轉(zhuǎn)錄組數(shù)據(jù)集,研究了STK3 基因表達對神經(jīng)膠質(zhì)瘤預(yù)后的影響以及分析了STK3 基因與不同臨床特征之間的關(guān)系。
本研究是基于公共數(shù)據(jù)庫中國腦膠質(zhì)瘤癌癥基因圖譜計劃的數(shù)據(jù)的研究,在數(shù)據(jù)下載頁面,本研究下載了兩個獨立批次的神經(jīng)膠質(zhì)瘤數(shù)據(jù),分別是mRNAseq693 數(shù)據(jù)集和mRNAseq325 數(shù)據(jù)集。另外還獲取了兩個數(shù)據(jù)集對應(yīng)的臨床信息。
對同時包含有mRNA 測序信息和對應(yīng)完整臨床信息的病例予以保留,無mRNA 測序信息或?qū)?yīng)完整臨床信息的病例予以剔除。完整臨床信息包括:生存時間、生存狀態(tài)、性別、年齡、放療、化療、IDH 突變情況、1p19q 丟失狀態(tài)、WHO 分級、復(fù)發(fā)狀態(tài)、組織學類型共11 個變量。根據(jù)納入和排除標準對兩個數(shù)據(jù)集處理后,mRNAseq693 數(shù)據(jù)集共納入489 例神經(jīng)膠質(zhì)瘤病例,剔除204 例無完整臨床信息的神經(jīng)膠質(zhì)瘤病例;mRNAseq325 數(shù)據(jù)集共納入284 例神經(jīng)膠質(zhì)瘤病例,剔除41 例無完整臨床信息的神經(jīng)膠質(zhì)瘤病例。分別將處理后的mRNAseq693 和mRNAseq325 數(shù)據(jù)集定義為:發(fā)現(xiàn)隊列和驗證隊列。
目前,已發(fā)表文獻中,對于某基因的表達水平進行分組最常用的截斷點是中位值。因此,我們以STK3 基因表達量的中位值作為截斷點進行劃分,高于中位值的神經(jīng)膠質(zhì)瘤病例分為高表達組,低于中位值的病例分為低表達組。對STK3 高低表達組的病例進行統(tǒng)計學分析(Wilcoxon 秩和檢驗)并繪圖展示。
本研究利用R 語言軟件(版本:v.3.5.0)完成所有的統(tǒng)計分析及相應(yīng)的圖片繪制。在發(fā)現(xiàn)隊列中,采用非參數(shù)檢驗——秩和檢驗的方法:如Wilcoxon 秩和檢驗或Kruskal-Wallis 檢驗對STK3 基因高低表達組和其他9 個臨床變量(性別、年齡、放療、化療、IDH突變情況、1p19q 丟失狀態(tài)、WHO 分級、復(fù)發(fā)狀態(tài)、組織學類型)進行統(tǒng)計學分析,分析STK3 基因與其他臨床病例參數(shù)的關(guān)系。采用K-M 生存分析和log-Rank 檢驗比較STK3 基因高表達組和低表達組神經(jīng)膠質(zhì)瘤病例的預(yù)后。采用單因素COX 回歸分析和多因素COX 回歸分析明確STK3 基因是否是神經(jīng)膠質(zhì)瘤患者獨立的預(yù)后因素。采用接受者操作特性曲線(ROC)和曲線下面積(AUC)分析和評價STK3 基因作為預(yù)后因素的特異性和敏感性。上述統(tǒng)計分析在驗證隊列中也進行分析,以驗證STK3 基因的作用是否一致。
基于STK3 基因的高低表達量,我們定義了STK3 基因高表達組和STK3 低表達組兩個表型。為了了解這兩個表型預(yù)后差異存在的可能原因,本研究利用基因集富集分析[8,9],分析了高低表型在京都基因與基因組百科全書(KEGG)通路上的富集情況。
以下兩個三線表展示了發(fā)現(xiàn)隊列和驗證隊列神經(jīng)膠質(zhì)瘤患者的臨床病理參數(shù)。
表1 發(fā)現(xiàn)隊列的臨床病理特征
表2 驗證隊列的臨床病理特征
本研究比較了在兩個不同的隊列中STK3 基因高低表達組的差異情況,發(fā)現(xiàn)在兩個隊列中,STK3 基因高低表達組存在統(tǒng)計學差異(P<0.05),見圖1。
在發(fā)現(xiàn)隊列中,STK3 基因與放療、化療、IDH 突變情況、1p19q 丟失狀態(tài)、WHO 分級、組織學類型共6 個臨床病理特征相關(guān)(P<0.05);在驗證隊列中發(fā)現(xiàn),STK3 基因與年齡、化療、IDH 突變情況、1p19q 丟失狀態(tài)、WHO 分級、組織學類型共6 個臨床病理特征相關(guān)(P<0.05)。見圖2、3。
圖1 發(fā)現(xiàn)隊列和驗證隊列中STK3 基因高低表達組的差異情況
圖2 發(fā)現(xiàn)隊列中神經(jīng)膠質(zhì)瘤患者STK3 基因表達與臨床病理特征的關(guān)系
圖3 驗證隊列中神經(jīng)膠質(zhì)瘤患者STK3 基因表達與臨床病理特征的關(guān)系
圖4 發(fā)現(xiàn)隊列和驗證隊列的生存曲線
圖5
圖6 發(fā)現(xiàn)隊列和驗證隊列的ROC 曲線
在發(fā)現(xiàn)隊列中進行K-M 生存分析,可以發(fā)現(xiàn)STK3 基因高低表達組具有顯著的預(yù)后差異,差異具有統(tǒng)計學意義(log-Rank 檢驗,P<0.05)。高表達組具有較差的預(yù)后,低表達組具有較好的預(yù)后。同樣,在驗證隊列中可以觀察到同樣的現(xiàn)象。見圖4。
納入STK3 基因、性別、年齡、放療、化療、IDH 突變情況、1p19q 丟失狀態(tài)、WHO 分級、復(fù)發(fā)狀態(tài)、組織學類型共10 個變量進行單因素和多因素COX 回歸。單因素COX 回歸結(jié)果顯示,在發(fā)現(xiàn)隊列中,除性別和放療這兩個變量外,STK3 基因、年齡、化療、IDH 突變情況、1p19q 丟失狀態(tài)、WHO 分級、復(fù)發(fā)狀態(tài)、組織學類型共8 個變量與總生存率相關(guān)(P<0.05);在驗證隊列中,除性別這一個變量外,STK3 基因、年齡、放療、化療、IDH 突變情況、1p19q丟失狀態(tài)、WHO 分級、復(fù)發(fā)狀態(tài)、組織學類型共8 個變量與總生存率相關(guān)(P<0.05)。多因素COX 回歸結(jié)果顯示,在發(fā)現(xiàn)隊列中,STK3 基因、年齡、化療、IDH 突變情況、1p19q 丟失狀態(tài)、WHO 分級、復(fù)發(fā)狀態(tài)共7 個因素是獨立的預(yù)后因素;在驗證隊列中,STK3基因、化療、1p19q 丟失狀態(tài)、WHO 分級、復(fù)發(fā)狀態(tài)、組織學類型共6 個因素是獨立的預(yù)后因素。見圖5。
在發(fā)現(xiàn)隊列中,STK3 基因的ROC 曲線及AUC 值顯示:1 年生 存 率AUC 值:0.612,3 年 生 存 率AUC 值:0.674,5 年 生 存 率AUC 值:0.692。在驗證隊列中,STK3 基因的ROC 曲線及AUC 值顯示:1 年生存率AUC 值:0.629,3 年生存率AUC 值:0.726,5 年生存率AUC 值:0.780。見圖6。
以發(fā)現(xiàn)隊列的基因表達數(shù)據(jù)作為基準文件進行GSEA 分析,GSEA 富集分析結(jié)果顯示,STK3 高表達表型與低表達表型相比,高表達表型主要富集了癌癥相關(guān)通路以及自噬,白細胞遷徙等途徑。見圖7。
圖7 GSEA 富集分析結(jié)果
本研究展示了基于人群的神經(jīng)膠質(zhì)瘤患者隊列中的STK3 基因的表達情況。STK3 基因低表達與更長的總生存率顯著相關(guān)。在對臨床病理參數(shù)(包括性別、年齡、放療、化療、IDH 突變情況、1p19q 丟失狀態(tài)、WHO 分級、復(fù)發(fā)狀態(tài)、組織學類型)進行多變量調(diào)整后,可以發(fā)現(xiàn)STK3 基因表達與神經(jīng)膠質(zhì)瘤患者的總生存率之間的關(guān)聯(lián)仍然很顯著。另外,驗證隊列的分析同樣證實了上述結(jié)果。因此,STK3 基因在神經(jīng)膠質(zhì)瘤中的表達是獨立于當前的預(yù)后因素的。
STK3 是一種存在細胞質(zhì)和細胞核的蛋白激酶,能與多種腫瘤相關(guān)蛋白相互作用,研究表明,原癌基因產(chǎn)物RAF1 和STK3 相互作用能阻止STK3 自身的二聚化和磷酸化,因為RAF1 可作用于STK3 的180 位蘇氨酸位點,而STK3 的完整活性需要同源二聚體結(jié)構(gòu)以及180 位蘇氨酸自身磷酸化。另外,STK3 可與NOREI,SAV1,RASSFI,NKX2-1 相互作用,可使STK3 發(fā)揮酶激活或磷酸化的功能[10-13]。STK3 在不同腫瘤類型中可發(fā)揮不同作用,一方面,STK3 可通過失活YAP 致癌基因來抑制肝癌和肺癌的腫瘤發(fā)生[4,5];另一方面,有研究報道顯示,在急性白血病細胞系中,敲低STK3可導(dǎo)致導(dǎo)致急性白血病細胞系和原代細胞凋亡[14]。
目前還沒有研究探討STK3 與神經(jīng)膠質(zhì)瘤預(yù)后的關(guān)系。本研究發(fā)現(xiàn)患者之間在mRNA 水平上表達的STK3 差異很大,并且與預(yù)后密切相關(guān)。本研究表明,STK3 的表達是神經(jīng)膠質(zhì)瘤的一個獨立預(yù)后因素,這一結(jié)果可以在一組獨立的數(shù)據(jù)集中得到驗證。
基于基因集富集分析的方法為了解STK3 的假定功能和作用提供了一些有趣的發(fā)現(xiàn),當然這些發(fā)現(xiàn)需要在進一步的實驗研究中加以證明。本研究發(fā)現(xiàn)STK3 似乎在以下領(lǐng)域發(fā)揮其主要功能:腫瘤相關(guān)通路途徑及過程。這也與STK3 目前文獻報道的功能相互吻合。
綜上所訴,本研究是描述STK3 在神經(jīng)膠質(zhì)瘤患者中預(yù)后作用的第一項研究。對于神經(jīng)膠質(zhì)瘤患者而言,STK3 基因是一個有潛力的預(yù)后生物標志物。然而,STK3 基因在神經(jīng)膠質(zhì)瘤中的功能作用仍有待進一步研究。