秦思, 黃舒婷, 溫炬,2, 李華潤(rùn),2, 鄭曉歡,2, 鄭榮昌,2, 李婷,2
(廣東省第二人民醫(yī)院 1.皮膚性病科,3.全科醫(yī)學(xué)科,廣東 廣州 510317;2.南方醫(yī)科大學(xué)第二臨床醫(yī)學(xué)院,廣東 廣州 510282)
光化性角化病(actinic keratosis, AK)作為一種癌前病變,可發(fā)展為侵襲性鱗狀細(xì)胞癌(cutaneous squamous cell carcinoma, cSCC),因此所有的AK都應(yīng)予以積極治療,并且建議定期隨訪。AK和cSCC均是角質(zhì)細(xì)胞異常的皮損,在臨床表現(xiàn)上較難鑒別。目前在生物信息學(xué)的提示下,已有多種方法通過(guò)對(duì)特異性生物標(biāo)志物的檢測(cè)幫助確診和鑒別以上兩種疾病[1]。Azimi等[2]運(yùn)用生物信息學(xué)分析發(fā)現(xiàn)AK和cSCC病變與細(xì)胞凋亡程序的衰減有關(guān)。針對(duì)AK的二期臨床試驗(yàn)也使用到了新分子相關(guān)的藥物,如促凋亡藥物(VDA-1102、SR-T100、Oleogel-S10、ICVT、依氟鳥(niǎo)氨酸)、免疫調(diào)節(jié)劑(異維甲酸、維甲酸)和化學(xué)預(yù)防藥物(煙酰胺、紫蘇醇、T4N5脂質(zhì)體)等[3]。但由于相關(guān)的副作用和昂貴的費(fèi)用,患者對(duì)這些治療的接受度和依從性通常較差,因此,開(kāi)發(fā)新的藥物和治療方法尤為重要。本研究通過(guò)生物信息學(xué)方法探究AK在進(jìn)展為cSCC的過(guò)程中起到重要作用的關(guān)鍵基因和通路,為針對(duì)AK尋找新的治療方法和預(yù)防其向cSCC進(jìn)展提供理論參考和研究方向。
從美國(guó)國(guó)立生物技術(shù)信息中心(national center for biotechnology information,NCBI) GEO(gene expression omnibus) 數(shù)據(jù)庫(kù)獲取兩個(gè)含有AK皮膚組織以及cSCC組織的數(shù)據(jù)集(GSE32979和GSE45216)。數(shù)據(jù)集GSE32979是基于GPL6102 Illumina human-6 v2.0 expression beadchip平臺(tái),由Hameetman等[4]上傳,包含了13個(gè)AK組織以及13個(gè)cSCC組織。數(shù)據(jù)集GSE45216是基于GPL570 [HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array平臺(tái),由Lambert等[5]上傳,包含了10個(gè)AK組織以及30個(gè)cSCC組織。通過(guò)GEO中在線分析工具GEO2R整合、分析及下載數(shù)據(jù),以.txt格式儲(chǔ)存。
將芯片數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、匯總、提取表達(dá)矩陣等處理。以P<0.05,基因表達(dá)中差異倍數(shù)|log2FC|>1為標(biāo)準(zhǔn)篩選差異基因(differentially expressed genes, DEGs),繪制韋恩圖、火山圖以及熱圖。
通過(guò)在線基因功能分析工具The Database for Annotation, Visualization and Integrated Discovery (DAVID)數(shù)據(jù)庫(kù)(https://david.ncifcrf.gov/)分析差異基因表達(dá)富集的功能以及通路,以P<0.05作為具有顯著性意義的標(biāo)準(zhǔn)篩選生物過(guò)程(biological process, BP)、分子功能(molecular function, MF)、細(xì)胞成分(cellular components, CC)及Kyoto encyclopedia of genes and genomes (KEGG)通路的富集分析結(jié)果。
運(yùn)用STRING在線工具(https://string-db.org)分析DEGs對(duì)應(yīng)的蛋白,并構(gòu)建PPI蛋白互作網(wǎng)絡(luò)圖,篩選功能蛋白。再用Cytoscape軟件分析、整合候選基因,MCODE插件篩選出重要的基因相關(guān)性最高的互作模塊。
研究共對(duì)比了23個(gè)AK組織和43個(gè)cSCC組織的基因芯片,運(yùn)用GEO2R在線工具,在GSE45216和GSE32979中分別篩選出了54 676和48 702個(gè)差異基因。通過(guò)特定條件(P<0.05,|log2FC|>1)篩選后,GSE45216篩出246個(gè)上調(diào)差異基因和159個(gè)下調(diào)差異基因。GSE32979篩出398個(gè)上調(diào)差異基因和530個(gè)下調(diào)差異基因,見(jiàn)圖1。取兩個(gè)數(shù)據(jù)集的交集(圖2),其中75個(gè)候選差異基因由40個(gè)共表達(dá)的上調(diào)差異基因和35個(gè)共表達(dá)的下調(diào)差異基因組成,詳見(jiàn)表1。熱圖(圖3)中包含了GSE32979中最為顯著的40個(gè)共表達(dá)差異基因。
圖1 火山圖(綠點(diǎn)代表下調(diào)差異基因,紅點(diǎn)代表上調(diào)差異基因)Fig.1 Volcano plot for two GEO profiles(Green dots represent down-regulated differential genes,red dots represent up-regulated differential genes).
圖2 兩個(gè)GEO芯片序列的共表達(dá)差異基因Fig.2 Co-differentially expressed genes of two GEO profiles.
表1 兩個(gè)GEO數(shù)據(jù)集芯片中75個(gè)共表達(dá)的差異基因(候選差異基因)Tab.1 75 co-differentialy expressed genes of two GEO profiles(candidate differential genes)
圖3 GSE32979熱圖Fig.3 Heatmap of data in GEO profile GSE32979.
使用P<0.05的標(biāo)準(zhǔn)過(guò)濾75個(gè)候選基因GO富集分析的結(jié)果如圖4所示。候選基因主要富集的細(xì)胞成分為:細(xì)胞外間隙、外泌體、黏著斑、皺褶、細(xì)胞外基質(zhì);主要富集的生物進(jìn)程為:血管再生、纖維蛋白溶解、雄激素受體信號(hào)通路、內(nèi)肽酶活性的負(fù)調(diào)控、受體介導(dǎo)的內(nèi)吞作用的正調(diào)控;主要富集的分子功能為:鈣離子結(jié)合、鈣依賴性蛋白結(jié)合、表皮生長(zhǎng)因子受體結(jié)合、絲氨酸型內(nèi)肽酶抑制劑的活性、GTP酶的活性。
圖4 候選基因在三個(gè)功能組的GO富集分析Fig.4 GO enrichment analysis of candidate genes among three functional groups.
KEGG分析發(fā)現(xiàn)75個(gè)共表達(dá)的差異基因主要富集的前5位通路分別為:黏著斑通路(通路ID:has04510,基因:ACTB, ITGA5, ACTN1, SHC1,LAMC2), 肥厚型心肌病(通路ID: has05410, 基因:ACTB, ITGA5, TPM4), 上皮細(xì)胞的細(xì)菌入侵(通路ID: has05100, 基因:ACTB, ITGA5, SHC1),擴(kuò)張型心肌病(通路ID: has05414, 基因:ACTB, ITGA5, TPM4)和阿米巴病(通路ID: has05146, 基因:SERPINB1, ACTN1, LAMC2),其中黏著斑通路富集情況最顯著(P<0.05),見(jiàn)圖5。
圖5 候選基因的KEGG通路富集分析Fig.5 KEGG pathway enrichment of candidate genes.
將75個(gè)候選基因用STRING數(shù)據(jù)庫(kù)分析并繪制PPI網(wǎng)絡(luò)圖,篩選出80個(gè)蛋白節(jié)點(diǎn),98條邊,富集P值為3.28e-13。采用Cytoscape軟件中MCODE插件對(duì)PPI網(wǎng)絡(luò)進(jìn)行分析,篩選出Degree值最高的2個(gè)模塊(表2)以及10個(gè)樞紐基因(SERPINE1、ACTN1、ITGA5、MMP1、CXCL1、PLAUR、GRB2、MMP10、TSG101、VPS37B),樞紐基因的各功能見(jiàn)表3。圖6為MCODE得分最高的模塊1展示圖。其中橢圓形中基因名稱為模塊1中的樞紐基因,藍(lán)色代表上調(diào)基因,黃色代表下調(diào)基因。
本研究通過(guò)對(duì)GEO數(shù)據(jù)庫(kù)中的基因表達(dá)譜數(shù)據(jù)集GSE32979和GSE45216中的AK組織和cSCC組織進(jìn)行分析,獲得了40個(gè)共表達(dá)上調(diào)差異基因和35個(gè)共表達(dá)下調(diào)差異基因作為研究的候選基因;同時(shí)構(gòu)建了這些候選基因的蛋白互作網(wǎng)絡(luò),通過(guò)degree的標(biāo)準(zhǔn)篩選了前10個(gè)樞紐基因,意味著這些樞紐基因很可能在AK向cSCC發(fā)展的過(guò)程中起著重要的作用。
表2 Degree值最高的2個(gè)PPI模塊細(xì)節(jié)
表3 Degree值最高的10個(gè)樞紐基因細(xì)節(jié)
圖6 蛋白質(zhì)相互作用網(wǎng)絡(luò)中模塊1樞紐節(jié)點(diǎn)Fig.6 Cluster 1 and Hub genes in the PPI network.
GO分析結(jié)果表明,這些候選基因主要富集在細(xì)胞外間隙、外泌體、黏著斑、細(xì)胞外基質(zhì)、皺褶等細(xì)胞成分中,具備有鈣離子結(jié)合、表皮生長(zhǎng)因子受體結(jié)合、鈣依賴性蛋白結(jié)合、絲氨酸型內(nèi)肽酶抑制劑的活性、GTP酶活性的分子功能,參與了血管再生、內(nèi)肽酶活性的負(fù)調(diào)控、受體介導(dǎo)的內(nèi)吞作用的正調(diào)控、纖維蛋白溶解、雄激素受體信號(hào)通路等生物進(jìn)程,這些生物進(jìn)程都影響著AK向cSCC發(fā)展。KEGG分析結(jié)果顯示,差異基因主要富集的通路為黏著斑、肥厚型心肌病、上皮細(xì)胞的細(xì)菌入侵、擴(kuò)張性心肌病、阿米巴病通路,其中黏著斑通路最具有顯著性,且包含ACTB、ITGA5、ACTN1、SHC1和LAMC2。其中ACTN1被認(rèn)為是將肌動(dòng)蛋白固定在多種細(xì)胞內(nèi)結(jié)構(gòu)上的蛋白,參與調(diào)節(jié)細(xì)胞粘附[6]。有研究表明,ACTN1水平的升高可以促進(jìn)細(xì)胞的遷移和極性的喪失,ACTN1的沉默可延長(zhǎng)腫瘤患者生存時(shí)間[7]。ITGA5、 LAMC2也有介導(dǎo)細(xì)胞的附著遷移和進(jìn)入組織的功能。PPI網(wǎng)絡(luò)分析得到的模塊1及10個(gè)樞紐基因主要富集在信號(hào)受體結(jié)合、蛋白酶結(jié)合、鈣離子結(jié)合等分子功能范圍內(nèi),與候選基因所顯示的GO富集情況相互佐證。
絲氨酸蛋白酶抑制劑E(serpin peptidase inhibitor clade E,serpin E)1,也稱纖溶酶原激活物抑制劑1,主要功能是下調(diào)纖維蛋白溶解。Azimi等[8]研究發(fā)現(xiàn),與AK相比,cSCC中SERPINA1含量有差異,它參與細(xì)胞外基質(zhì)的粘附/去粘附平衡及降解過(guò)程,影響腫瘤細(xì)胞遷移及擴(kuò)散[9]。有研究表明,SERPINE1和基質(zhì)金屬蛋白酶1(matrix metalloproteinase 1,MMP1)在頭頸鱗狀細(xì)胞癌中表達(dá)明顯上調(diào)[10],這種上調(diào)可以保護(hù)頭頸癌細(xì)胞免于順鉑治療后的細(xì)胞凋亡,可能與腫瘤的復(fù)發(fā)有一定關(guān)系,并與腫瘤的預(yù)后不良和轉(zhuǎn)移風(fēng)險(xiǎn)相關(guān)[11-12]。MMPs是與腫瘤發(fā)生相關(guān)的最重要的蛋白酶家族,MMP1、MMP10可以裂解或降解不同的膠原蛋白,近年來(lái)也有相關(guān)研究證明,以上兩個(gè)基因在調(diào)控鱗狀細(xì)胞癌的腫瘤微環(huán)境中發(fā)揮重要作用[13]。此外,還有生長(zhǎng)因子受體結(jié)合蛋白2(growth factor receptor bound protein 2,GRB2),在細(xì)胞表面生長(zhǎng)因子受體和Ras信號(hào)通路之間提供關(guān)鍵連接的適配器蛋白。已有研究表明通過(guò)抑制GRB2活性,可以抑制鱗狀細(xì)胞癌中癌細(xì)胞的增殖和侵襲[14]。因此在預(yù)防AK向cSCC發(fā)展的進(jìn)程中,SERPINE1、MMP1、MMP10、GRB2可能可以作為新的預(yù)防和治療靶點(diǎn)。
纖溶酶原激活劑尿激酶受體(plasminogen activator kinase receptor plaur,PLAUR)是一種糖基磷脂酰肌醇錨定的膜蛋白[15],與細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)相關(guān)。目前已有研究表明,抑制PLAUR可降低各種癌癥的腫瘤生長(zhǎng)、侵襲、血管生成和轉(zhuǎn)移[16-17]??扇苄訮LAUR已被確定為前列腺癌[18]、乳腺癌[19]、卵巢癌[20]等多種腫瘤的血漿生物標(biāo)志物。成纖維細(xì)胞分泌蛋白趨化因子CXCL1被證明參與了癌細(xì)胞的轉(zhuǎn)化、生長(zhǎng)和侵襲且具有腫瘤特異性[15]。腫瘤易感基因101(TSG101),是囊泡轉(zhuǎn)運(yùn)過(guò)程的調(diào)節(jié)因子。多項(xiàng)研究表明TSG101沉默會(huì)導(dǎo)致乳腺癌和前列腺癌細(xì)胞生長(zhǎng)停滯和細(xì)胞死亡[21],而其過(guò)度表達(dá)可發(fā)揮致癌作用[22],同時(shí)還在化療耐藥中起著關(guān)鍵作用[23]。因此,有關(guān)AK向cSCC發(fā)展機(jī)制的研究中,PLAUR、CXCL1、TSG101或可作為研究靶點(diǎn)。
綜上所述,本研究篩選出來(lái)的75個(gè)候選基因主要通過(guò)黏著斑通路參與了AK向cSCC發(fā)展的機(jī)制,其中的10個(gè)樞紐基因更有利于進(jìn)一步理解其過(guò)程。本研究為探究AK向cSCC發(fā)展的機(jī)制提供了新的依據(jù),為預(yù)防AK惡變進(jìn)行治療干預(yù)尋找潛在的新生物靶點(diǎn)提供了理論基礎(chǔ)。但本研究中數(shù)據(jù)分析可能因?yàn)閿?shù)據(jù)平臺(tái)的不同存在一定的異質(zhì)性,后期仍需要進(jìn)一步的分子生物學(xué)實(shí)驗(yàn)進(jìn)行臨床驗(yàn)證。