郭丹丹,楊梅,龍丹,徐麗,張陽春,張春林
(遵義醫(yī)科大學(xué)附屬醫(yī)院 耳鼻咽喉科,貴州 遵義 563000)
頭頸鱗狀細(xì)胞癌(鱗癌)是一種常見的惡性腫瘤,全球發(fā)病率排第六[1]。吸煙以及飲酒是公認(rèn)的頭頸鱗癌的致癌危險(xiǎn)因素[2]。近些年證實(shí)人乳頭狀瘤病毒(human papilloma virus,HPV)感染是頭頸鱗癌的獨(dú)立危險(xiǎn)因素,流行病學(xué)研究發(fā)現(xiàn)HPV相關(guān)的頭頸鱗癌的發(fā)病率逐年升高[3]。與HPV(-)頭頸鱗癌相比,HPV(+)頭頸鱗癌具有淋巴結(jié)轉(zhuǎn)移早,分期較晚,但對(duì)放化療敏感,臨床預(yù)后良好的特點(diǎn),其機(jī)制目前尚未完全明確,可能與HPV(+)頭頸鱗癌具有獨(dú)特的致癌及調(diào)控機(jī)制有關(guān)[4]。此外,臨床上尚無針對(duì)HPV(+)頭頸鱗癌特有的基因靶點(diǎn)治療。因此,本研究通過對(duì)HPV(+)及HPV(-)的頭頸鱗癌基因芯片組織進(jìn)行差異分析,篩選出HPV相關(guān)頭頸鱗癌的特異性基因及相關(guān)通路,使用Cbioportal和癌癥基因組圖譜(the cancer genome atlas,TCGA)檢驗(yàn)特異基因表達(dá)趨勢(shì)以及頭頸鱗癌生存預(yù)后的相關(guān)性為進(jìn)一步的機(jī)制研究提供參考。
從GEO高通量基因芯片數(shù)據(jù)庫(kù)中下載芯片數(shù)據(jù)集,進(jìn)行芯片篩選,目標(biāo)芯片入選標(biāo)準(zhǔn):①患者頭頸鱗癌標(biāo)本,排除細(xì)胞株及動(dòng)物;②入選芯片具有HPV檢測(cè)信息;③需為基因表達(dá)芯片,各探針具有歸一化的表達(dá)值;④需復(fù)核芯片質(zhì)量。本研究使用的芯片數(shù)據(jù)集,編號(hào)是GSE39366,GSE52088。
京都基因和基因組(kyoto encyclopedia of genes and genomes, KEGG)數(shù)據(jù)庫(kù)是一個(gè)可系統(tǒng)分析基因產(chǎn)物在細(xì)胞中的代謝途徑以及產(chǎn)物功能的數(shù)據(jù)庫(kù),可用于系統(tǒng)分析基因組、生物通路、疾病、化學(xué)物質(zhì)等,通過DAVID 生物信息資源數(shù)據(jù)庫(kù)對(duì)差異基因進(jìn)行信號(hào)通路分析和基因本體分析,并從生物學(xué)功能、細(xì)胞中的定位對(duì)基因產(chǎn)物進(jìn)行標(biāo)準(zhǔn)化描述,對(duì)差異表達(dá)基因的生物學(xué)進(jìn)程、細(xì)胞組成及分子功能進(jìn)行基因本體分析,并對(duì)富集的信號(hào)通路(P<0.01)進(jìn)行分析。
對(duì)兩個(gè)數(shù)據(jù)集的芯片分別進(jìn)行數(shù)據(jù)下載以及差異基因篩選,利用在線工具GEO高通量基因芯片數(shù)據(jù)庫(kù)中2R分析各個(gè)芯片。以結(jié)合差異倍數(shù)進(jìn)行綜合篩選,以矯正后的P<0.01且|log差異倍數(shù)|≥ 2為標(biāo)準(zhǔn)篩選差異表達(dá)基因,并將探針標(biāo)準(zhǔn)化為基因名稱,篩選出共同差異基因。
通過在線分析工具STRING 11.0,以及Cytoscape3.8.0軟件篩選關(guān)鍵基因。以蛋白節(jié)點(diǎn)存在關(guān)聯(lián)作用的蛋白個(gè)數(shù)為度值,通過網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)關(guān)聯(lián)積分值,獲得整個(gè)網(wǎng)絡(luò)中可能形成的蛋白質(zhì)簇和關(guān)鍵節(jié)點(diǎn)蛋白,并在Cytoscape中進(jìn)行可視化分析。最終篩選特異基因并對(duì)其進(jìn)行分析。
TCGA數(shù)據(jù)庫(kù)以及表達(dá)趨勢(shì)驗(yàn)證:通過UALCAN檢索頭頸鱗癌相關(guān)數(shù)據(jù),獲得來源于TCGA的正常組織44例,癌組織318例。進(jìn)一步驗(yàn)證特異基因在TCGA數(shù)據(jù)庫(kù)中HPV(+)頭頸鱗癌(n=80)和HPV(-)頭頸鱗癌(n=434)兩個(gè)亞組瘤體組織與正常組織間的表達(dá)差異。
GEO高通量基因芯片數(shù)據(jù)庫(kù)中篩選及芯片質(zhì)量分析,選定GSE39366、GSE52088兩個(gè)符合入選標(biāo)準(zhǔn)的芯片系列,對(duì)其Matrix文件所提供的患者相關(guān)信息進(jìn)行分析,共納入390例患者,GSE39366共保留了138例樣本。基本信息見表1。檢索并獲得來源于TCGA的正常組織44例,癌組織318例?;颊呋拘畔⒁姳?。
通過DAVID 6.8生物信息資源數(shù)據(jù)庫(kù)對(duì)差異基因(表1)以及特異基因(表2)在KEGG數(shù)據(jù)庫(kù)中富集的信號(hào)通路進(jìn)行分析,通路富集與基因本體分析的結(jié)果詳見圖1、2。細(xì)胞成分分析主要富集在細(xì)胞外區(qū)域,分子變化功能顯示與生長(zhǎng)因子活性相關(guān)。
圖1 通過DAVID 生物信息資源數(shù)據(jù)庫(kù)對(duì)差異基因進(jìn)行KEGG通路富集以及GO分析生物學(xué)進(jìn)程、細(xì)胞組成及分子功能
表1 患者基本信息(GSE39366) (例)
表2 患者基本信息(TCGA-頭頸鱗癌) (例)
556個(gè)差異基因,從數(shù)據(jù)集GSE52088中篩選出305個(gè)差異基因,GSE39366中篩選出251個(gè)差異基因。進(jìn)一步從中篩選出42個(gè)差異基因,數(shù)據(jù)集的重疊部分包含42個(gè)基因(圖3A),其中17個(gè)下調(diào)的基因和25個(gè)上調(diào)基因。
使用 STRING 11.0 對(duì)差異表達(dá)基因構(gòu)建了蛋白互作用網(wǎng)絡(luò)圖(圖3B),從中共獲得17個(gè)關(guān)鍵基因。其中上調(diào)基因12個(gè),下調(diào)基因5個(gè)。
通過 Cytoscape 軟件進(jìn)行關(guān)鍵基因可視化分析(圖3C,P<0.01),從關(guān)鍵基因中篩選特異基因,共有4個(gè)基因被鑒定為度≥4的特異基因。該可視化分析圖具有29個(gè)節(jié)點(diǎn)和20個(gè)邊緣,可反映與節(jié)點(diǎn)相關(guān)聯(lián)的邊的條數(shù)關(guān)聯(lián)度(平均節(jié)點(diǎn)度:1.38,平均聚類系數(shù):0.383;P<0.01)各基因狀態(tài)如表3所示。
表3 篩選出的特異基因度值
圖2 通過DAVID生物信息資源數(shù)據(jù)庫(kù)對(duì)特異基因進(jìn)行KEGG通路富集以及GO分析生物學(xué)進(jìn)程、細(xì)胞組成及分子功能
圖3 使用STRING 11.0對(duì)差異表達(dá)基因構(gòu)建了蛋白互作用網(wǎng)絡(luò)圖
通過UCSC癌癥瀏覽器構(gòu)建特異基因的分層聚類,層次聚類顯示它們?cè)陬^頸部鱗癌樣本與非癌樣品中的表達(dá)差異(圖4、5)。根據(jù)cBioPortal的整體生存數(shù)據(jù)繪制Kaplan-Meier曲線。結(jié)果顯示IL-6、MMP1、CD44、CXCL1高表達(dá)組患者的總體生存率(overall survival rate,OS)、無病生存率(disease-free survival,DFS)較低(圖6)。其中,IL-6、CD44高表達(dá)組患者的OS、DFS與低表達(dá)組患者比較,差異具有統(tǒng)計(jì)學(xué)意義(P<0.01);MMP1以及CXCL1高表達(dá)組患者的OS、DFS與低表達(dá)組患者比較,差異無統(tǒng)計(jì)學(xué)意義(P>0.01)。
圖4 使用UCSC癌癥瀏覽器構(gòu)建特異基因的分層聚類
圖5 IL-6
圖6 頭頸部鱗癌患者(n=318)中特異基因IL-6
近年來HPV相關(guān)的頭頸鱗癌的發(fā)病率升高,且呈年輕化趨勢(shì)[5],既往研究表明感染HPV是HPV(+)頭頸鱗癌致病的獨(dú)立危險(xiǎn)因素[6],然而HPV(+)頭頸鱗癌的致癌及調(diào)控機(jī)制目前尚未完全明確。有學(xué)者認(rèn)為[7]E6、E7蛋白在HPV增殖過程中起關(guān)鍵作用。E6能與細(xì)胞內(nèi)相關(guān)蛋白形成復(fù)合物,特異性結(jié)合P53使其降解,引起細(xì)胞無限增值。E7蛋白可結(jié)合視網(wǎng)膜母細(xì)胞瘤蛋白(Rb),導(dǎo)致細(xì)胞周期失控,因此檢測(cè)HPV-DNA是診斷HPV相關(guān)頭頸鱗癌的重要途徑?,F(xiàn)有多種方法可用來診斷HPV(+)頭頸鱗癌,包括聚合酶鏈反應(yīng)檢測(cè)HPV-DNA或RNA,原位雜交檢測(cè)HPV-DNA,免疫組化法檢測(cè)HPV的癌基因E6/E7或P16蛋白等,HPV檢測(cè)方法多種多樣,目前尚無統(tǒng)一、公認(rèn)的方法。Hashmi Atif等研究表明[8]P16可作為HPV相關(guān)頭頸鱗癌診斷以及預(yù)后標(biāo)記物。但P16蛋白的檢測(cè)大多采用免疫組化法,所需樣本量大,其靈敏度根據(jù)染色方法的選擇而異,僅能進(jìn)行半定量分析。李雅冬等[9]采用基因芯片技術(shù)檢測(cè)頭頸部鱗癌中的HPV-DNA序列,進(jìn)而定性定量分析基因序列及表達(dá)譜,篩選基因標(biāo)記進(jìn)而診斷頭頸鱗癌。然而國(guó)內(nèi)對(duì)于HPV(+)頭頸鱗癌基因標(biāo)記物報(bào)道較少,HPV(+)頭頸鱗癌基因靶向藥物未見報(bào)道,因此本研究篩選出HPV(+)頭頸鱗癌特異基因具有重要的臨床以及社會(huì)價(jià)值。
既往研究已有利用生物信息學(xué)方法篩選HPV相關(guān)頭頸鱗癌關(guān)鍵基因[10],張軼雯等[11]學(xué)者通過生物信息學(xué)方法篩選出HPV(+)口咽癌特征基因以及這些基因參與的Wnt、PI3K-Akt信號(hào)通路,但并未闡述HPV相關(guān)頭頸鱗癌特征基因的研究方法,本研究通過篩選HPV(+)頭頸鱗癌特征基因以及這些基因參與的生物學(xué)過程和關(guān)鍵通路并篩選出HPV(+)頭頸鱗癌的特異性基因IL-6、CXCL1、MMP1、CD44。這些基因主要位于核周區(qū)域,主要參與細(xì)胞周期調(diào)控、NOD樣受體信號(hào)通路、TNF信號(hào)通路。已有研究表明NOD介導(dǎo)的信號(hào)通路可促進(jìn)頭頸鱗癌的發(fā)展[12],腫瘤壞死因子(tumor necrosis factor, TNF)通路可誘導(dǎo)頭頸鱗癌細(xì)胞凋亡和細(xì)胞存活[13],本研究中基因本體分析表明IL-6主要參與細(xì)胞增殖的調(diào)節(jié)[14](G1/S期、G2/M有絲分裂周期),CD44主要參與基因表達(dá)的調(diào)控[15],MMP1主要參與蛋白磷酸化的負(fù)調(diào)控[16],提示這些基因可能參與調(diào)控HPV(+)頭頸鱗癌的發(fā)生發(fā)展過程。而特異基因富集于TNF信號(hào)通路途徑,NOD樣受體信號(hào)通路等,NOD1、NOD2通過激活核轉(zhuǎn)錄因子-κB(nuclear transcription factor-κB, NF-κB)信號(hào)通路誘導(dǎo)細(xì)胞產(chǎn)生促炎性因子和細(xì)胞因子,包括IL-6、IL-8、CXCL1、CXCL2等,TNF-α可通過激活NF-κB誘導(dǎo)MMPs基因的表達(dá),調(diào)控細(xì)胞凋亡過程,因此,NOD樣受體信號(hào)通路、TNF信號(hào)通路作為此次研究的關(guān)鍵通路,可能與特異基因IL-6、CXCL1共同調(diào)控HPV相關(guān)頭頸鱗癌發(fā)生發(fā)展以及腫瘤侵襲過程。
Kumar等[17]研究表明頭頸鱗癌中IL-6的調(diào)節(jié)與HPV感染有關(guān),但未闡明IL-6在HPV(+) 頭頸鱗癌發(fā)展及侵襲中的作用。Jian 等[18]研究發(fā)現(xiàn)頭頸鱗癌中IL-6高表達(dá)者預(yù)后不良,然而IL-6與HPV相關(guān)的頭頸鱗癌機(jī)制尚不明確。IL-6于口腔鱗狀細(xì)胞癌中的報(bào)道較多,IL-6家族成員中的OSM (oncostatin M,OSM)可促進(jìn)HPV(+)口腔鱗狀細(xì)胞癌發(fā)生發(fā)展[18],本研究中IL-6在特異基因里度值與差異性表達(dá)程度均最高,提示IL-6可能對(duì)HPV(+)頭頸鱗癌的腫瘤進(jìn)展起促進(jìn)作用,然而其在不同亞組瘤體組織中的作用機(jī)制仍未確定。
此外,HPV(+)頭頸鱗癌患者對(duì)放化療敏感性性比HPV(-)頭頸鱗癌患者高,且本課題組前期研究已證實(shí)HPV(+)頭頸細(xì)胞株對(duì)放化療敏感性高于HPV(-)細(xì)胞株[19],但是導(dǎo)致這種敏感性增加的機(jī)制尚不清楚,可能與IL-6產(chǎn)生有關(guān)。HPV可促進(jìn)腫瘤細(xì)胞分泌IL-6,從而增加敏感性[20]。已有證據(jù)表明IL-6介導(dǎo)的 JAK / STAT3途徑可促進(jìn)細(xì)胞增殖及血管生成,淋巴結(jié)轉(zhuǎn)移,可能成為治療頭頸部鱗癌的潛在有用靶點(diǎn)[21],故IL-6有望成為HPV(+)頭頸鱗癌的靶點(diǎn)藥物。
既往研究表明MMP1與頭頸鱗癌的DFS顯著相關(guān)[22],且高表達(dá)組的預(yù)后顯著差于低表達(dá)組。但MMP1與HPV(+)頭頸鱗癌致病機(jī)制尚不清楚[23],已有研究報(bào)道MMPs作為乳腺癌[24]等惡性腫瘤靶向治療的合適靶點(diǎn),MMP1是MMPs基因家族成員,提示MMP1可能成為治療HPV(+)頭頸鱗癌的潛在藥物靶點(diǎn)。同時(shí),本研究結(jié)果表明CD44的表達(dá)與頭頸鱗癌的DFS呈負(fù)相關(guān),但MMP1及CXCL1與腫瘤的預(yù)后無顯著相關(guān)性,這種差異可能與患者年齡、性別、職業(yè)暴露因素以及腫瘤的分期、分型、淋巴結(jié)轉(zhuǎn)移程度、腫瘤浸潤(rùn)深度有關(guān)[25],已有學(xué)者揭示CD44可以作為頭頸鱗癌潛在分子標(biāo)記物[26],其在喉癌浸潤(rùn)轉(zhuǎn)移中有重要作用,CD44介導(dǎo)的信號(hào)通路可能為抑制HPV(+)頭頸鱗癌細(xì)胞中的順鉑耐藥性提供新的藥物靶點(diǎn)[27]。已有文獻(xiàn)報(bào)道CXCL1在口腔鱗癌基質(zhì)細(xì)胞中高表且與口腔鱗癌不良預(yù)后有關(guān)[28],故有望作為頭頸鱗癌診斷預(yù)后的標(biāo)志,但與頭頸鱗癌發(fā)生發(fā)展相關(guān)機(jī)制尚不明確[29]。
綜上,本研究篩選的特異基因中,雖然IL-6、CXCL1、MMP1、CD44在頭頸鱗癌中已有報(bào)道,但在HPV相關(guān)頭頸鱗癌中的研究較少,IL-6、CD44有望成為治療HPV(+)頭頸鱗癌的關(guān)鍵靶點(diǎn),而MMP1及CXCL1可能作為診斷及預(yù)后的標(biāo)志物。本研究在GEO數(shù)據(jù)庫(kù)中篩選了與HPV狀態(tài)相關(guān)的兩個(gè)數(shù)據(jù)集,由于芯片系統(tǒng)檢測(cè)的局限性,cDNA間可能存在相同或相似序列,可出現(xiàn)交叉雜交影響分析結(jié)果,往往需要Northen印跡、RT-PCR等實(shí)驗(yàn)在臨床樣本中驗(yàn)證。然而,IL-6、CXCL1、MMP1、CD44與頭頸鱗癌及HPV的關(guān)系未見明確報(bào)道,但可作為潛在的生物學(xué)標(biāo)志物進(jìn)一步挖掘研究。