王東 劉國(guó)新 董作青 楊中軍 陳健
[摘要]目的?通過(guò)生物信息學(xué)分析,篩選舌鱗狀細(xì)胞癌(鱗癌)組織和正常組織差異表達(dá)基因(DEGs),篩選關(guān)鍵基因,為進(jìn)一步的研究提供參考。方法?從公共基因表達(dá)數(shù)據(jù)庫(kù)(GEO)下載舌鱗癌芯片數(shù)據(jù),利用R語(yǔ)言L(fǎng)imma程序包篩選DEGs,利用韋恩圖篩選不同數(shù)據(jù)集的共同DEGs,對(duì)共同DEGs進(jìn)行GO和KEGG富集分析、蛋白相互作用網(wǎng)絡(luò)分析及網(wǎng)絡(luò)關(guān)鍵基因生存分析。結(jié)果?篩選出不同數(shù)據(jù)集的共同DEGs 297個(gè),這些基因參與血管新生、細(xì)胞黏附、氧化還原等過(guò)程,并參與細(xì)胞外基質(zhì)受體相互作用通路、黏著斑通路、小細(xì)胞肺癌通路、Toll樣受體信號(hào)通路和代謝通路,與舌鱗癌的發(fā)生發(fā)展密切相關(guān)。同時(shí)篩選出THBS1、CRP、HMMR、TFPI2、SDS、ANLN等6個(gè)關(guān)鍵基因,其表達(dá)上調(diào),與頭頸部鱗癌病人的預(yù)后顯著相關(guān)。結(jié)論?篩選出的關(guān)鍵基因有助于加深對(duì)舌鱗癌發(fā)生發(fā)展分子機(jī)制的理解,同時(shí)可為后續(xù)的臨床研究提供一定的理論依據(jù)。
[關(guān)鍵詞]舌腫瘤;癌,鱗狀細(xì)胞;寡核苷酸序列分析;計(jì)算生物學(xué);數(shù)據(jù)挖掘
[中圖分類(lèi)號(hào)]R739.86
[文獻(xiàn)標(biāo)志碼]A
[文章編號(hào)]?2096-5532(2019)05-0505-05
doi:10.11712/jms201905001
[開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)]
舌癌是口腔頜面部常見(jiàn)的惡性腫瘤之一,近年來(lái)其發(fā)病率有所上升。雖然現(xiàn)階段以手術(shù)為主的綜合治療取得了一定的效果,但是舌癌易轉(zhuǎn)移,手術(shù)切除難度大,術(shù)后易復(fù)發(fā),手術(shù)常常造成病人語(yǔ)言、進(jìn)食、呼吸等功能的障礙和顏面的畸形[1-2]。目前舌癌的發(fā)病機(jī)制尚未明確。因此,在分子層面上揭示舌癌的發(fā)病機(jī)制,篩選舌癌發(fā)生發(fā)展的關(guān)鍵基因,可能為舌癌的防治提供重要的靶點(diǎn)和標(biāo)志物?;蛐酒且环N高通量獲取生物信息的技術(shù),能高效檢測(cè)并分析腫瘤組織和正常組織差異表達(dá)基因(DEGs)[3]。本研究擬通過(guò)分析基因表達(dá)數(shù)據(jù)庫(kù)(GEO)提供的舌鱗狀細(xì)胞癌(簡(jiǎn)稱(chēng)鱗癌)相關(guān)基因芯片數(shù)據(jù),篩選DEGs,并對(duì)DEGs進(jìn)行功能富集分析,構(gòu)建蛋白相互作用網(wǎng)絡(luò),同時(shí)對(duì)關(guān)鍵基因進(jìn)行生存分析,為進(jìn)一步在分子水平研究舌鱗癌的發(fā)生發(fā)展機(jī)制,為舌鱗癌的診斷和治療提供一定的理論依據(jù)?,F(xiàn)將結(jié)果報(bào)告如下。
1?資料和方法
1.1?數(shù)據(jù)檢索
在GEO(https://www.ncbi.nlm.nih.gov/geo)中檢索“tongue cancer”,下載舌鱗癌基因芯片數(shù)據(jù)。每個(gè)數(shù)據(jù)集均需符合以下條件:①實(shí)驗(yàn)用人舌鱗癌組織和正常組織進(jìn)行比較;②數(shù)據(jù)集來(lái)自全基因組 RNA 表達(dá)芯片。
1.2?獲得DEGs
應(yīng)用R語(yǔ)言(https://www.r-project.org/)對(duì)基因芯片原始數(shù)據(jù)進(jìn)行注釋和過(guò)濾,用Bioconductor(http://bioconductor.org/)提供的RMA算法對(duì)各原始芯片數(shù)據(jù)進(jìn)行背景校正及歸一化等預(yù)處理。采用Limma程序包對(duì)腫瘤組織和正常組織樣本的基因表達(dá)值進(jìn)行比對(duì),以表達(dá)倍數(shù)變化值的對(duì)數(shù)值(log2FC)絕對(duì)值>1且調(diào)整后P<0.05為閾值,獲得各數(shù)據(jù)集的DEGs。采用韋恩圖(http://bioinformatics.psb.ugent.be/webtools/Venn/)的方法獲取各數(shù)據(jù)集的共同DEGs。
1.3?GO和KEGG富集分析
利用DAVID 6.8數(shù)據(jù)庫(kù)(https://david.ncifcrf.gov/)對(duì)各數(shù)據(jù)集的共同DEGs進(jìn)行GO分析和KEGG分析。
1.4?蛋白相互作用網(wǎng)絡(luò)分析
利用STRING 11.0數(shù)據(jù)庫(kù)(https://string-db.org/)對(duì)各數(shù)據(jù)集共同DEGs編碼蛋白的相互作用進(jìn)行網(wǎng)絡(luò)分析。應(yīng)用Cytoscape_v3.6.1軟件插件Cytohubba尋找蛋白相互作用網(wǎng)絡(luò)中與舌鱗癌發(fā)生發(fā)展相關(guān)的關(guān)鍵基因。
1.5?關(guān)鍵基因生存分析
利用KM plotter網(wǎng)上分析工具(http://kmplot.com/analysis/)分析DEGs表達(dá)與頭頸部鱗癌病人生存期的相關(guān)性,評(píng)價(jià)通過(guò)生物信息學(xué)方法找到的關(guān)鍵基因?qū)膊☆A(yù)后的預(yù)測(cè)能力。登錄KM plotter網(wǎng)站,輸入基因名稱(chēng),選擇疾病類(lèi)別,樣本數(shù)設(shè)為499,cut off值設(shè)為median,繪制生存曲線(xiàn),篩選有顯著統(tǒng)計(jì)學(xué)意義的結(jié)果。統(tǒng)計(jì)學(xué)處理的結(jié)果以P<0.05表示差異有統(tǒng)計(jì)學(xué)意義。
2?結(jié)果
2.1?數(shù)據(jù)庫(kù)檢索
共檢索到3個(gè)數(shù)據(jù)集(GSE31056、GSE78060、GSE34105),其中GSE31056數(shù)據(jù)集包含24個(gè)正常樣本和24個(gè)腫瘤樣本;GSE78060數(shù)據(jù)集包含4個(gè)正常樣本和26個(gè)腫瘤樣本;GSE34105數(shù)據(jù)集包含16個(gè)正常樣本和62個(gè)腫瘤樣本。
2.2?DEGs分析
GSE31056、GSE78060和GSE34105基因芯片數(shù)據(jù)集分別篩選出DEGs為2 193、4 727和3 099個(gè)(圖1A~C)。為了減少DEGs篩選結(jié)果的假陽(yáng)性率,采用韋恩圖取交集的方法確定3個(gè)數(shù)據(jù)集的共同DEGs為297個(gè)(圖1D)。
2.3?共同DEGs的GO和KEGG分析
GO分析包括生物學(xué)過(guò)程(BP)、細(xì)胞組分(CC)和分子功能(MF)3部分。DEGs的BP主要富集于血管新生、細(xì)胞黏附、氧化還原過(guò)程、正向調(diào)控轉(zhuǎn)錄RNA聚合酶Ⅱ啟動(dòng)子;CC主要富集于朊蛋白細(xì)胞外基質(zhì)、細(xì)胞外間隙、細(xì)胞外泌體、細(xì)胞外組分、細(xì)胞表面;MF主要富集于金屬內(nèi)肽酶活化、RNA聚合酶Ⅱ轉(zhuǎn)錄因子活性、序列特異性DNA結(jié)合、血紅蛋白結(jié)合、蛋白結(jié)合。KEGG分析顯示,通路主要富集于細(xì)胞外基質(zhì)受體相互作用通路、黏著斑通路、小細(xì)胞肺癌通路、Toll樣受體信號(hào)通路和代謝通路。見(jiàn)表1。
2.4?蛋白相互作用網(wǎng)絡(luò)分析
設(shè)置最低要求的相互作用分?jǐn)?shù)為0.4,得到297個(gè)共同DEGs編碼蛋白的相互作用關(guān)系圖(圖2)。采用 Cytoscape_v3.6.1 軟件的插件MCODE對(duì)該蛋白相互作用網(wǎng)絡(luò)進(jìn)行分析,得到了由34個(gè)共同DEGs構(gòu)成的核心模塊(圖3)。對(duì)該核心模塊進(jìn)行GO和KEGG分析,發(fā)現(xiàn)其參與的重要BP主要是細(xì)胞黏附、正向調(diào)控基因表達(dá)作用,參與的主要信號(hào)通路有代謝和PI3K-Akt信號(hào)通路等。利用 Cytoscape_v3.6.1 軟件插件 cytohubba,采用Degree算法得到25個(gè)在共同DEGs編碼蛋白相互作用網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)基因(圖4)。
2.5?生存分析
利用KM plotter網(wǎng)上分析工具分析關(guān)鍵基因表達(dá)與頭頸部鱗癌病人生存期的相關(guān)性,結(jié)果顯示,THBS1(HR=1.19~2.42,P<0.01)、CRP(HR=1.70~2.03,P<0.01)、HMMR(HR=1.10~1.88,P<0.01)、TFPI2(HR=1.00~1.73,P<0.05)、SDS(HR=1.03~1.80,P<0.05)、ANLN(HR=1.03~1.79,P<0.05)基因的表達(dá)與頭頸部鱗癌病人的預(yù)后顯著相關(guān),這6個(gè)關(guān)鍵基因表達(dá)越高,病人預(yù)后越差(圖5)。
3?討論
本研究對(duì)GEO中檢索到的3個(gè)舌鱗癌相關(guān)基因芯片數(shù)據(jù)集進(jìn)行DEGs篩選,并對(duì)DEGs功能進(jìn)行富集分析,構(gòu)建蛋白相互作用網(wǎng)絡(luò)分析關(guān)鍵基因表達(dá)與頭頸部鱗癌病人生存期的相關(guān)性,最終篩選出6個(gè)與舌鱗癌發(fā)生發(fā)展密切相關(guān)的關(guān)鍵基因。
THBS1是血小板反應(yīng)蛋白家族中第一個(gè)被識(shí)別的蛋白,在腫瘤微環(huán)境中起重要作用。THBS1最開(kāi)始是作為細(xì)胞黏附蛋白而被人們所關(guān)注,很多研究發(fā)現(xiàn)THBS1可以在不同種群的多種細(xì)胞中調(diào)節(jié)細(xì)胞黏附[4]。最近的研究發(fā)現(xiàn),THBS1表達(dá)上調(diào)可以增強(qiáng)腫瘤侵襲及轉(zhuǎn)移,在乳癌中,THBS1FAK信號(hào)通路與Hippo信號(hào)通路交互作用來(lái)調(diào)控YAP相關(guān)的腫瘤侵襲。鑒于其在腫瘤進(jìn)展中的重要作用,THBS1有望成為腫瘤治療的靶點(diǎn)[5]。
CRP即C反應(yīng)蛋白,是肝臟產(chǎn)生的血液檢查炎性標(biāo)志物,在炎癥狀態(tài)時(shí)表達(dá)升高,在宿主防御感染過(guò)程中起到關(guān)鍵作用[6]。PETRZYK等[7]研究表明,在結(jié)直腸癌中,肥胖相關(guān)的慢性炎癥可以通過(guò)活化JAK/STAT、MAPK、PI3K、mTOR等信號(hào)通路來(lái)誘導(dǎo)腫瘤細(xì)胞增殖、侵襲和轉(zhuǎn)移。還有研究結(jié)果表明,炎癥狀態(tài)和血漿CRP升高對(duì)多種腫瘤產(chǎn)生影響,炎性標(biāo)志物表達(dá)與結(jié)直腸癌病人轉(zhuǎn)移生存率呈負(fù)相關(guān)[8]。
HMMR是細(xì)胞外基質(zhì)的主要成分,可以調(diào)節(jié)細(xì)胞運(yùn)動(dòng)和細(xì)胞周期[9]。STEVENS等[10]報(bào)道,在原發(fā)性肺腺癌中HMMR呈高表達(dá)。WANG等[11]報(bào)道,在乳癌中RHAMM呈過(guò)表達(dá),RHAMM高表達(dá)與較差預(yù)后評(píng)估值相一致。HMMR參與了調(diào)節(jié)腫瘤細(xì)胞生長(zhǎng)、侵襲和轉(zhuǎn)移,其高表達(dá)提示腫瘤病理分期更差、預(yù)后更差。
TFPI2的生物學(xué)功能尚沒(méi)有完全確定。有學(xué)者認(rèn)為T(mén)FPI2作為視網(wǎng)膜色素上皮細(xì)胞和血管平滑肌細(xì)胞的有絲分裂原來(lái)發(fā)揮作用[12-13]。在癌癥生物學(xué)背景下,關(guān)于TFPI2的研究主要集中在其蛋白酶抑制劑活性上。TFPI2結(jié)構(gòu)中包含3個(gè)串聯(lián)重復(fù)Kunitz-type蛋白酶抑制域[14]。由于能廣泛抑制絲氨酸蛋白酶(包括纖溶酶、胰蛋白酶、糜蛋白酶),TFPI2可以在調(diào)節(jié)細(xì)胞外基質(zhì)重塑中發(fā)揮關(guān)鍵作用[14]。通過(guò)廣泛抑制蛋白酶,TFPI2可以保護(hù)細(xì)胞外基質(zhì)免受降解,從而抵抗腫瘤侵襲和轉(zhuǎn)移。相關(guān)研究表明,TFPI2過(guò)表達(dá)可以抑制肺癌、前列腺癌、胰腺癌等多種腫瘤細(xì)胞生長(zhǎng)和侵襲。TFPI2還被發(fā)現(xiàn)可以誘導(dǎo)凋亡,抑制血管新生。因此,TFPI2被認(rèn)為是一個(gè)抑癌因子。后來(lái)有研究發(fā)現(xiàn),TFPI2在鱗癌細(xì)胞及組織中專(zhuān)一性過(guò)表達(dá),與其他類(lèi)型的卵巢癌相比,卵巢鱗癌在Ⅰ期的診治率很高[15]。本研究舌鱗癌組織中的TFPI2也同樣是表達(dá)上調(diào),對(duì)病人的預(yù)后產(chǎn)生影響。
SDS具有將絲氨酸轉(zhuǎn)化為丙酮酸的作用,廣泛分布于細(xì)菌、真菌、動(dòng)植物的器官中[16]。參與氨基酸代謝的酶一般有兩種或多種異構(gòu)體,而其中一種異構(gòu)體會(huì)在腫瘤細(xì)胞中表達(dá)。雖然cSDS基因在腫瘤細(xì)胞中轉(zhuǎn)錄表達(dá),很少翻譯為蛋白,但是其在腫瘤細(xì)胞中的表達(dá)仍有很重要的生理意義[17]。
ANLN是編碼蛋白基因,在大腦、胎盤(pán)、睪丸中的表達(dá)水平較高,在心臟、腎臟、肝臟、肺臟、胰腺、前列腺、脾臟中的表達(dá)水平較低[18]。研究結(jié)果表明,ANLN在多種腫瘤中呈高表達(dá),如乳癌、結(jié)直腸癌、肝癌、胰腺癌等[19]。ANLN高表達(dá)是結(jié)直腸癌、胃癌、乳癌、頭頸癌預(yù)后不良的因素[20]。
本研究采用生物信息學(xué)的方法分析了舌鱗癌DEGs的相關(guān)數(shù)據(jù),篩選了其相關(guān)的MF和信號(hào)通路,使我們更深入地了解了舌鱗癌潛在分子發(fā)生發(fā)展機(jī)制,并為進(jìn)一步的實(shí)驗(yàn)研究提供了理論依據(jù)。
[參考文獻(xiàn)]
[1]SPIOTTO M T, JEFFERSON G, WENIG B, et al. Diffe-rences in survival with surgery and postoperative radiotherapy compared with definitive chemoradiotherapy for oral cavity cancer a national cancer database analysis[J]. JAMA Otola-ryngology Head & Neck Surgery, 2017,143(7):691-699.
[2]CHANG J H, WU C C, YUAN K S, et al. Locoregionally recurrent head and neck squamous cell carcinoma:incidence, survival, prognostic factors, and treatment outcomes[J]. Oncotarget, 2017,8(33):55600-55612.
[3]YOU Lukuan, ZHENG Xuan, HU Yi. Bioinformatics analysis of potential crucial genes in lung squamous cell cancer[J]. Acad J Chin PLA Med Sch, 2018,39(10):903-909.
[4]HUANG Tingting, SUN Li, YUAN Xianglin, et al. Thrombospondin-1 is a multifaceted player in tumor progression[J]. Oncotarget, 2017,8(48):84546-84558.
[5]SHEN Jie, CAO Beibei, WANG Yatao, et al. Hippo component YAP promotes focal adhesion and tumour aggressiveness via transcriptionally activating THBS1/FAK signalling in breast cancer[J]. Journal of Experimental & Clinical Cancer Research, 2018,37:175.
[6]BLACK S, KUSHNER I, SAMOLS D. C-reactive protein[J]. J Biol Chem, 2004,279(47):48487-48490.
[7]PIETRZYK L, TORRES A, MACIEJEWSKI R. Obese-rela-ted chronic low-grade inflammation in promotion of colorectal cancer development[J]. Asian Pac J Cancer, 2015,16(10):4161-4168.
[8]HEIKKIL K, EBRAHIM S, LAWLOR D A. A systematic review of the association between circulating concentrations of C reactive protein and cancer[J]. Journal of Epidemiology and Community Health, 2007,61(9):824-833.
[9]SOHR S, ENGELAND K. RHAMM is differentially expressed in the cell cycle and down-regulated by the tumor suppressor p53[J]. Cell Cycle, 2008,7(21):3448-3460.
[10]STEVENS L E, CHEUNG W K, ADUA S J, et al. Extracellular matrix receptor expression in subtypes of lung adenocarcinoma potentiates outgrowth of micrometastases[J]. Cancer Research, 2017,77(8):1905-1917.
[11]WANG C, THOR A D, MOORE D H. The overexpression of RHAMM, a hyaluronan-binding protein that regulates ras signaling, correlates with overexpression of mitogen-activated protein kinase and is a significant parameterin breast cancer progression[J]. Clinical Cancer Research, 1998,4(3):567-576.
[12]SHINODA E, YUI Y, HATTORI R, et al. Tissue factor pathway inhibitor-2 is a novel mitogen for vascular smooth muscle cells[J]. Journal of Biological Chemistry, 1999,274(9):5379-5384.
[13]TANAKA Y, UTSUMI J, MATSUI M. Purification, mole-cular cloning, and expression of a novel growth-promoting factor for retinal pigment epithelial cells, REF-1/TFPI-2[J]. Invest Ophthalmol Visual Sci, 2004,45(1):245-252.
[14]BAJAJ S, BIRKTOFT J, STEER A. Structure and biology of tissue factor pathway inhibitor[J]. Thromb Haemost, 2001,86(4):959-972.
[15]ARAKAWA N, MIYAGI E, NOMURA A. Secretome-based identification of TFPI2, a novel serum biomarker for detection of ovarian clear cell adenocarcinoma[J]. Journal of Proteome Research, 2013,12(10):4340-4350.
[16]HIROFUMI O, TOMOHARU G, MIKIO N. Structure and function relationships of serine dehydratases from various sources[J]. Trends Comp Biochem Physiol, 2000,6:1-19.
[17]HIROFUMI O, TOMOHARU G, MIKIO N. Enzymatic and biochemical properties of a novel human serine dehydratase isoform[J]. Biochimica Et Biophysica Acta, 2006,1764(5):961-967.
[18]OEGEMA K, SAVOIAN M S, MITCHISON T J. Functional analysis of a human homologue of the drosophila actin binding protein anillin suggests a role in cytokinesis[J]. Journal of Cell Biology, 2000,150(3):539-552.
[19]ZHOU Weibing, WANG Zhan, SHEN Ni, et al. Knockdown of ANLN by lentivirus inhibits cell growth and migration in human breast cancer[J]. Molecular and Cellular Biochemistry, 2015,398(1/2):11-19.
[20]XIA Leilei, SU Xiaoling, SHEN Jizi. ANLN functions as a key candidate gene in cervical cancer as determined by integra-ted bioinformatic analysis[J]. Cancer Management and Research, 2018,10:663-670.
(本文編輯?馬偉平)