姚健楠 高天博 段 凌 劉 健 蔣玉良 安廣宇 葛 洋*
(1.首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院腫瘤科,北京100020; 2.首都醫(yī)科大學(xué)附屬北京朝陽醫(yī)院醫(yī)學(xué)研究中心,北京 100020)
結(jié)直腸癌是全球第3位常見的惡性腫瘤,在腫瘤相關(guān)死亡病因中位于第3位[1]。雖然近年來在結(jié)直腸癌預(yù)防、早期篩查和治療方面取得了一定進(jìn)展,但對(duì)于病因和發(fā)病機(jī)制仍然知之甚少[2-3]。多項(xiàng)研究[4-6]顯示異常O-型糖基化與結(jié)直腸癌有關(guān)。筆者前期研究[7-9]表明:結(jié)直腸癌中異常O-型糖基化的發(fā)生促進(jìn)腫瘤形成并調(diào)節(jié)惡性表型,所合成的截短的O-聚糖-Tn抗原,可通過激活上皮-間質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition, EMT)促進(jìn)結(jié)直腸癌的轉(zhuǎn)移[9]。前期一系列細(xì)胞表型及動(dòng)物模型實(shí)驗(yàn)均證實(shí)異常O-型糖基化促進(jìn)結(jié)腸癌發(fā)生發(fā)展,而修復(fù)異常O-型糖基化可明顯降低惡性生物學(xué)行為能力[7-9]。O-型糖基化是一種常見且重要的翻譯后修飾[10-11]。O-聚糖可通過調(diào)節(jié)蛋白質(zhì)的結(jié)構(gòu)、穩(wěn)定性及功能在許多生理和病理過程中發(fā)揮不同的作用[11-14]。黏蛋白型O聚糖是O-型糖蛋白的主要亞群,在消化道黏膜上皮中起屏障作用[13, 15-17],研究[18-19]證實(shí),Core 1型O-聚糖表達(dá)缺失會(huì)導(dǎo)致小鼠自發(fā)性結(jié)腸炎相關(guān)腫瘤發(fā)生。異常O-型糖基化表達(dá)Tn抗原而非正常合成的T抗原,因此Tn抗原表達(dá)是異常O-型糖基化的標(biāo)志[20]。正常O-型糖基化必需T合酶催化及其特異性分子伴侶Cosmc[14, 20-21],因此T合酶或Cosmc的分子突變、功能異常均會(huì)導(dǎo)致O-型糖基化異常并阻礙O-型糖蛋白合成[22]。在結(jié)直腸癌中,許多基因mRNA表達(dá)有著預(yù)測預(yù)后及療效的重要價(jià)值[23-25],然而應(yīng)用現(xiàn)有轉(zhuǎn)錄組學(xué)數(shù)據(jù)庫卻無法得到由O-型糖基化直接調(diào)控的基因和通路。
本研究選用人結(jié)腸癌LS174T Tn(+)細(xì)胞系作為親本細(xì)胞,該細(xì)胞T-合酶的分子伴侶Cosmc基因突變導(dǎo)致了異常O-型糖基化發(fā)生,以Tn抗原陽性表達(dá)為分子標(biāo)志。此前筆者已通過Cosmc質(zhì)粒轉(zhuǎn)染技術(shù)構(gòu)建了Cosmc穩(wěn)定轉(zhuǎn)染細(xì)胞系LS174T Tn(+)+wtCosmc,恢復(fù)了Cosmc正常表達(dá),原本異常受阻的O-型糖基化過程得到糾正,Tn抗原不表達(dá)。與此同時(shí)作為對(duì)照組,穩(wěn)定轉(zhuǎn)染空白質(zhì)粒的細(xì)胞系LS174T Tn(+)+Con的Tn抗原仍表達(dá)[8]。為探索O-型糖基化這一經(jīng)典的翻譯后修飾過程能否調(diào)控相關(guān)基因表達(dá),本研究應(yīng)用Agilent mRNA表達(dá)譜基因芯片技術(shù),檢測了LS174T Tn(+)+wtCosmc細(xì)胞和LS174T Tn(+)+Con細(xì)胞基因表達(dá)譜。數(shù)據(jù)經(jīng)質(zhì)檢及標(biāo)準(zhǔn)化后,針對(duì)差異性表達(dá)基因(differentially expressed genes,DEGs)進(jìn)行非監(jiān)督層次聚類、基因本體(gene ontology,GO)分析和京都基因與基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路富集,使之定位在相關(guān)生物學(xué)過程和細(xì)胞通路上,并通過蛋白網(wǎng)絡(luò)數(shù)據(jù)庫分析其相互作用,探討結(jié)直腸癌進(jìn)展的分子機(jī)制并提供新的治療靶點(diǎn)。
人結(jié)直腸癌細(xì)胞系LS174T(Tn陽性)由Emory大學(xué)Tongzhong Ju教授(美國亞特蘭大)贈(zèng)予。以DEME完全培養(yǎng)基[10%(體積分?jǐn)?shù))FBS和1%(質(zhì)量分?jǐn)?shù))青鏈霉素]在37 ℃、5%(體積分?jǐn)?shù)) CO2培養(yǎng)箱中進(jìn)行培養(yǎng)。以人野生型Cosmc基因表達(dá)載體(GV367-EGFP-Cosmc,上海吉?jiǎng)P公司)穩(wěn)定轉(zhuǎn)染LS174 Tn陽性細(xì)胞作為實(shí)驗(yàn)組[LS174T Tn(+)+wtCosmc],同時(shí)用空白載體(GV367-EGFP-Mock,上海吉?jiǎng)P公司)穩(wěn)定轉(zhuǎn)染細(xì)胞作為對(duì)照組[LS174T Tn(+)+Con]。
基因芯片檢測及數(shù)據(jù)分析流程如圖1。
圖1 基因芯片檢測及數(shù)據(jù)分析流程圖
使用TRIzol(Invitrogen公司,美國)提取細(xì)胞總RNA,用NanoDrop ND-2000(Thermo Scientific公司,美國)定量,經(jīng)Agilent Bioanalyzer 2100(Agilent Technologies公司,美國)檢測樣品總RNA的完整性。
確認(rèn)所提取的樣本總RNA(每個(gè)細(xì)胞3組重復(fù),共6個(gè)樣本)質(zhì)檢合格后,按照Agilent SurePrint G3 Human Gene Expression v2(上海歐易公司)芯片標(biāo)準(zhǔn)流程,將總RNA反轉(zhuǎn)錄成雙鏈cDNA,用Cyanine-3-CTP(Cy3)標(biāo)記堿基合成cRNA,再將cRNA與芯片雜交。洗脫后應(yīng)用Agilent Scanner G2505C(Agilent Technologies公司,美國)掃描芯片,得到原始圖像。
采用Feature Extraction軟件(version 10.7.1.1, Agilent Technologies公司,美國)處理芯片原始圖像,提取原始數(shù)據(jù),將每個(gè)芯片的原始數(shù)據(jù)導(dǎo)入Genespring軟件(version 13.1, Agilent Technologies公司,美國),對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(得到原始信號(hào)值、標(biāo)準(zhǔn)化信號(hào)值、檢出情況及詳細(xì)注釋信息)和分析處理。
圖2 DEGs篩選
應(yīng)用t檢驗(yàn)對(duì)實(shí)驗(yàn)組LS174T Tn(+)+wtCosmc和對(duì)照組LS174T Tn(+)+Con的標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行兩兩比較:將過濾得到的具有生物學(xué)重復(fù)的全部差異基因繪制出火山圖(volcano plot)。將P值用錯(cuò)誤發(fā)現(xiàn)率 (false discovery rate,F(xiàn)DR) 來校正多重測試的差異。篩選標(biāo)準(zhǔn)為上調(diào)或下調(diào)倍數(shù)變化(fold change, FC)絕對(duì)值≥ 2.0且FDRP值≤ 0.05。應(yīng)用R語言對(duì)差異基因進(jìn)行聚類,繪制熱圖。
對(duì)篩選得到的DEGs通過Wegstalt 在線分析平臺(tái)(http://www.webgestalt.org/)用基因通路富集(gene set enrichment analysis, GESA)方法進(jìn)行GO富集分析和KEGG通路分析,分別排列出最密切的正相關(guān)和負(fù)相關(guān)的20條信號(hào)通路。
應(yīng)用在線工具STRING(https://string-db.org/)對(duì)差異性表達(dá)基因所表達(dá)的蛋白之間可能存在的相互作用加以探索,并繪制出蛋白-蛋白互作網(wǎng)絡(luò)示意圖(protein-protein interaction network, PPI)。
如前所述,通過Agilent mRNA表達(dá)譜基因芯片檢測技術(shù)得到了實(shí)驗(yàn)組及對(duì)照組的基因表達(dá)譜數(shù)據(jù),在兩組的表達(dá)譜基因芯片標(biāo)準(zhǔn)化數(shù)據(jù)的差異比較中,將全部有生物學(xué)重復(fù)數(shù)據(jù)(即應(yīng)用t檢驗(yàn)得到的)的基因繪制出火山圖(圖2A),從中篩選出差異性表達(dá)基因譜。對(duì)于不存在生物學(xué)重復(fù)樣本的數(shù)據(jù),則僅利用FC值篩選,標(biāo)準(zhǔn)為FC絕對(duì)值≥2.0。本研究得到表達(dá)上調(diào)基因502個(gè),表達(dá)下調(diào)基因972個(gè),即差異基因共計(jì)1 474個(gè),差異性表達(dá)基因譜以熱圖的形式展示(圖2B)。
為對(duì)差異性表達(dá)基因所影響的生物學(xué)功能進(jìn)行描述,本研究對(duì)上述差異性表達(dá)基因譜所包含的1 474個(gè)基因進(jìn)行了GO富集分析,包括所參與的生物學(xué)過程(biological process, BP)、在細(xì)胞中的定位(cellular component, CC)及分子功能(molecular function, MF)。圖3列出正負(fù)相關(guān)最密切的20個(gè)重要結(jié)果,為研究重點(diǎn)。在BP中,可富集到:①有絲分裂細(xì)胞周期負(fù)反饋;②細(xì)胞周期G1/S期轉(zhuǎn)變調(diào)節(jié);③蛋白質(zhì)分解代謝、自磷酸化等過程的調(diào)控等。在CC中,差異性表達(dá)基因主要富集到細(xì)胞質(zhì)膜及胞外基質(zhì)組分上。MF中:①調(diào)節(jié)蛋白質(zhì)酪氨酸激酶活性;②mRNA結(jié)合、組蛋白結(jié)合;③SMAD蛋白聯(lián)結(jié);④RNA聚合酶Ⅱ轉(zhuǎn)錄因子結(jié)合;⑤細(xì)胞黏附分子結(jié)合、核苷酸結(jié)合等功能。
圖3 GO富集分析結(jié)果
圖4 對(duì)差異性表達(dá)基因進(jìn)行KEGG Pathway富集結(jié)果
應(yīng)用KEGG數(shù)據(jù)庫對(duì)DEGs進(jìn)行了GESA,根據(jù)每個(gè)Pathway條目中差異性表達(dá)基因富集結(jié)果中最密切正負(fù)相關(guān)的20位Pathway條目繪制出條形圖,圖4示:DEGs(O-型糖基化相關(guān)基因譜)主要被富集在以下相關(guān)Pathway上:①腫瘤轉(zhuǎn)錄失調(diào);②環(huán)磷酸腺苷(cyclic adenosine monophosphate,cAMP)信號(hào)通路;③絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號(hào)通路;④轉(zhuǎn)化生長因子-β(transforming growth factor-β, TGF-β)信號(hào)通路;⑤T細(xì)胞受體信號(hào)通路;⑥胞外基質(zhì)受體相互作用;⑦自然殺傷細(xì)胞介導(dǎo)的細(xì)胞毒性反應(yīng);⑧白細(xì)胞穿透內(nèi)皮細(xì)胞發(fā)生遷移等。
為進(jìn)一步探索O-型糖基化相關(guān)基因譜與腫瘤發(fā)生可能存在的關(guān)系及分子機(jī)制,筆者又應(yīng)用R語言heatplot軟件包將差異性表達(dá)基因富集經(jīng)典通路結(jié)果以熱圖形式展示(圖5)??梢姡篛-型糖基化與磷脂酰肌醇-3激酶(phosphatidylinositol 3-kinase,PI3K)、 TGF-β和Wnt三條腫瘤信號(hào)通路密切相關(guān)。
為研究DEGs翻譯得到的各種蛋白間的相互作用,筆者應(yīng)用在線STRING軟件(https://string-db.org/,V9.0)對(duì)差異性表達(dá)基因譜進(jìn)行了蛋白網(wǎng)絡(luò)分析。將全部DEGs名稱上傳至STRING數(shù)據(jù)庫,得到差異性表達(dá)基因譜中編碼基因可翻譯合成的蛋白之間的相互作用關(guān)系(圖6),可看到黏蛋白家族MUC1、MUC4、MUC17等之間的相互作用關(guān)系存在較高的置信度(Confidence≥0.9)。
圖6 差異性表達(dá)基因合成的蛋白之間的相互關(guān)系網(wǎng)絡(luò)
結(jié)直腸癌是一種常見的惡性腫瘤,具有一定的復(fù)發(fā)風(fēng)險(xiǎn)和轉(zhuǎn)移潛能[26-27]。 盡管近十年來結(jié)直腸癌的放射治療(以下簡稱放療)、化學(xué)藥物治療(以下簡稱化療)和靶向治療等方面均取得新進(jìn)展,但發(fā)生率和病死率仍居高不下[28-30]。現(xiàn)如今基因組學(xué)在結(jié)直腸癌的診斷和治療中發(fā)揮著越來越重要的作用[31],但人們對(duì)個(gè)體遺傳改變及其潛在機(jī)制仍然知之甚少。因此尋找關(guān)鍵基因和信號(hào)通路有助于發(fā)現(xiàn)疾病的診治靶點(diǎn)。O-型糖基化是重要的翻譯后修飾過程,已被證實(shí)與結(jié)直腸癌的發(fā)生發(fā)展密切相關(guān)[7-9, 14, 18]。因此由O-型糖基化引起的分子事件和生物學(xué)功能改變值得充分研究。
本研究通過基因表達(dá)譜芯片檢測技術(shù)篩選得到1 474個(gè)DEGs,包括502個(gè)上調(diào)基因和972個(gè)下調(diào)基因,它們可被視作O-型糖基化直接相關(guān)基因。通過GO富集可知,DEGs主要調(diào)控細(xì)胞外基質(zhì)組織和生長因子活性等生物過程。KEGG富集顯示DEGs主要富集于多種與腫瘤相關(guān)的途徑,如PI3K、TGF-β和Wnt信號(hào)通路。據(jù)報(bào)道[32-35]這3種經(jīng)典信號(hào)通路在結(jié)直腸癌中促進(jìn)了不同的生理過程。Wnt通路通過影響細(xì)胞生長、增生和分化等生命活動(dòng)參與結(jié)直腸癌的發(fā)生和發(fā)展,該通路的過度激活將導(dǎo)致腸道病變,Wnt通路的異常激活是導(dǎo)致結(jié)直腸癌發(fā)生、發(fā)展的主要原因,且參與了EMT,促進(jìn)了腫瘤的進(jìn)展和轉(zhuǎn)移。同樣,TGF-β超家族分子通過跨膜受體和胞質(zhì)內(nèi)信號(hào)轉(zhuǎn)導(dǎo)分子Smad進(jìn)行信號(hào)轉(zhuǎn)導(dǎo),調(diào)節(jié)細(xì)胞的增生、分化和凋亡。許多生長因子和激素通過其受體激活PI3K,PI3K可以使肌醇環(huán)上的3位羥基磷酸化,磷酸化的肌醇脂可招募和激活許多信號(hào)通路分子,促進(jìn)細(xì)胞增生、細(xì)胞遷移和細(xì)胞存活。研究[33]證明 TGF-β 和 PI3K信號(hào)通路共同參與調(diào)節(jié)細(xì)胞的增生、凋亡以及遷移等過程,且TGF-β能夠誘導(dǎo)EMT表型使得腫瘤更具有侵襲和轉(zhuǎn)移能力。因此抑制上述3個(gè)經(jīng)典通路中的相關(guān)成員可為治療結(jié)直腸癌提供新的潛在通路靶點(diǎn)。然而,與其他基因表達(dá)譜數(shù)據(jù)分析共有的瓶頸[36-38]為,關(guān)鍵基因和與O-型糖基化直接密切相關(guān)的下游通路無法精確定位,仍需進(jìn)一步研究探索。在蛋白網(wǎng)絡(luò)分析結(jié)果中,黏蛋白家族MUC1、MUC4、MUC17等之間的相互作用關(guān)系存在較高的置信度。其中,MUC4可作用于上皮細(xì)胞增生、分化并誘導(dǎo)ERBB2特異性磷酸化[39]。趨化因子受體CXCR4以及其他G蛋白耦聯(lián)受體家族CXCL1、GPSM1、DRD4、DRD2等同樣是介導(dǎo)腫瘤血管形成、轉(zhuǎn)移、活化的關(guān)鍵分子[40]。以上關(guān)鍵基因均可作為后續(xù)研究腫瘤O-型糖基化修飾分子機(jī)制的重要靶點(diǎn)。
O-型糖基化是一種翻譯后修飾過程[14, 41],就基因轉(zhuǎn)錄組學(xué)水平而言,O-型糖基化并不會(huì)直接影響基因轉(zhuǎn)錄水平。DEGs的出現(xiàn)可能是由于異常合成O-型糖基化蛋白導(dǎo)致負(fù)反饋機(jī)制發(fā)生,此外,異常O-型糖基化導(dǎo)致關(guān)鍵分子失活,可能干擾其他基因核酸合成過程,但這些假設(shè)尚不明確,仍待進(jìn)一步探討。
本研究是首次使用轉(zhuǎn)錄組學(xué)技術(shù)預(yù)測O-型糖基化相關(guān)DEGs的研究,通過對(duì)芯片數(shù)據(jù)的篩選和分析,獲得的DEGs為受O-型糖基化調(diào)控的下游基因,它們所對(duì)應(yīng)富集的信號(hào)通路和生物學(xué)功能都是我們后續(xù)研究所需密切關(guān)注的目標(biāo)。