汪圣毅,張永紅,閆亞飛,李旭升,程 彥,李永翔
化療(chemotherapy,CTx)可控制非治愈因素,改善無法手術(shù)切除胃癌患者的預(yù)后[1],可降低循環(huán)腫瘤細(xì)胞數(shù),降低淋巴結(jié)、局部和腹膜的復(fù)發(fā),附加藥物可逆轉(zhuǎn)免疫細(xì)胞的功能,抑制胃癌細(xì)胞的增殖遷移[2]。但CTx亦使癌細(xì)胞發(fā)生適應(yīng)性改變,產(chǎn)生耐受或抵抗,與癌細(xì)胞基因表達(dá)和相關(guān)通路的變化有關(guān)。外周髓磷脂蛋白22(peripheral myelin protein 22,PMP22)與CTx抵抗、腫瘤發(fā)生有關(guān)[3],PMP22表達(dá)干預(yù)可致下游基因表達(dá)變化[4],其上調(diào)與胃癌細(xì)胞抵抗順鉑的作用有關(guān)[5],但其下游機(jī)制尚不明確。生物信息學(xué)方法可揭示疾病基因模塊和網(wǎng)絡(luò),應(yīng)用廣泛[6]。該研究采用生物信息學(xué)方法,比較短發(fā)夾核糖核酸敲減和未敲減PMP22的下游差異表達(dá)基因(defferentially expressed genes, DEGs),分析其相關(guān)通路,為胃癌CTx抵抗的分子機(jī)制研究提供參考。
1.1 細(xì)胞、試劑、平臺(tái)基因表達(dá)數(shù)據(jù)庫(gene expression omnibus,GEO)GSE(基因表達(dá)數(shù)據(jù)庫系列,GEO series)94714胃癌細(xì)胞系MGC-803、慢病毒載體(plasmid lentiviral vector,pLKO.1)購自中科院細(xì)胞所。PMP22的短發(fā)夾核糖核酸(short hairpin RNA,shRNA)共2個(gè),shRNA1: CCAAACTCAAACC AAACCAAA,shRNA2:CGGTGTCATCTATGTGATCT T,Lipofectamine 3000(美國Invitrogen公司)將含有shRNA1、shRNA2的慢病毒轉(zhuǎn)染至293T細(xì)胞擴(kuò)增,轉(zhuǎn)染篩選MGC-803,美國安捷倫公司芯片平臺(tái)測試基因表達(dá)譜[5]。
1.2 表達(dá)譜數(shù)據(jù)PMP22敲減和未敲減組的差異基因表達(dá)譜,取自美國國立生物技術(shù)信息中心(national center for biotechnology information,NCBI)的GEO(https://www.ncbi.nlm.nih.gov/geo),由Cai et al[5]提交,樣本為:1:數(shù)據(jù)庫樣本(GEO sample, GSM)GSM2481329;2:GSM2481330;3:GSM2481331;4:GSM2481332;5:GSM2481333;6:GSM2481334,1~3為A組,PMP22_shRNA2敲減PMP22基因的表達(dá),4~6為B組,未抑制PMP22基因的表達(dá)。
1.3 差異基因數(shù)據(jù)庫R語言(GEO to R, GEO2R)(https://www.ncbi.nlm.nih.gov/geo/geo2r/?acc=GSE94714)定義A、B組別,美國國家標(biāo)準(zhǔn)學(xué)會(huì)(American national standards institute,ANSI)格式保存所有差異基因至.txt文件,導(dǎo)入Excel 2016篩選,篩選條件:① 校正P<0.01;② 倍數(shù)變化(fold change,F(xiàn)C)值≥10或≤-10,計(jì)算logFC:log2(A/B)=log2(A)-log2(B),分別為±3.321 928。
1.4 富集和通路分析差異基因于注釋、可視化和綜合發(fā)現(xiàn)數(shù)據(jù)庫(database for annotation, visualization and integrated discovery,DAVID)網(wǎng)站(https://david.ncifcrf.gov/),分析基因本體(gene ontology,GO)的生物過程(biological process,BP)、分子功能(molecular function,MF)、細(xì)胞組分(cellular component,CC),分析京都基因和基因組百科全書(kyotoencyclopedia of genes and genomes,KEGG)的通路。選BP、MF、CC中P值最小的前6位,繪制復(fù)合條圖。KEGG結(jié)果繪制泡泡圖。
1.5 蛋白質(zhì)相互作用DAVID轉(zhuǎn)換基因名為官方基因標(biāo)識(shí),文本正則表達(dá)式截取基因名稱,導(dǎo)入互作基因檢索工具(search tool for the retrieval of interacting genes,STRING)數(shù)據(jù)庫(http://string-db.org/),Homo Sapiens獲蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)的網(wǎng)絡(luò)。數(shù)據(jù)導(dǎo)入Cytoscape 3.6.1,分子復(fù)合檢測(molecular complex detection,MCODE)插件行模塊分析,單一模塊中的基因?qū)隓AVID 6.8行通路分析。
1.6 關(guān)鍵基因篩選PPI數(shù)據(jù)導(dǎo)入Cytoscape 3.6.1,CytoHubba插件篩選關(guān)鍵基因,用最大集團(tuán)中心性(maximal clique centrality,MCC)的拓?fù)渌惴ā?/p>
1.7 癌癥藥物敏感性基因組學(xué)數(shù)據(jù)庫驗(yàn)證logFC絕對(duì)值由高到低排序,前10位的基因和MCC算法獲得的關(guān)鍵基因,導(dǎo)入癌癥藥物敏感性基因組學(xué)(genomics of drug sensitivity in cancer,GDSC)數(shù)據(jù)庫,分析與胃癌CTx敏感性的關(guān)聯(lián)性。
1.8 統(tǒng)計(jì)學(xué)處理差異表達(dá)基因(DEGs)為GEO中R語言limma包完成分析,數(shù)據(jù)矩陣線性擬合,本雅米尼·霍赫貝格錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)校正。
2.1 樣本數(shù)據(jù)特征數(shù)據(jù)歸一化的中位數(shù)均為5.4,均數(shù)為6.21,中位數(shù)位于同一水平,標(biāo)準(zhǔn)化特征良好,見圖1。
圖1 樣本基因表達(dá)數(shù)據(jù)的歸一化結(jié)果
1:GSM2481329;2:GSM2481330;3:GSM2481331;4:GSM2481332;5:GSM2481333;6:GSM2481334
2.2 差異基因GEO2R結(jié)果獲34 183個(gè)與GEO ID對(duì)應(yīng)的序列。AdjustedP<0.01,logFC=3.321 928,篩選到368個(gè)對(duì)應(yīng)的ID,刪除無基因庫登錄號(hào)(gene bank accession number,GB_ACC)的30行。GB_ACC轉(zhuǎn)換基因名,獲315個(gè)DAVID IDs,Excel查重刪除1個(gè)重復(fù),vlookup函數(shù)將基因名對(duì)應(yīng)至差異篩選表,找回logFC值,countif函數(shù)計(jì)算獲上調(diào)基因283個(gè),下調(diào)31個(gè)。logFC絕對(duì)值最大的前10位見表1。
表1 logFC絕對(duì)值前10位的差異表達(dá)基因
EEF1A1:真核翻譯延長因子1α1;HSP:熱休克蛋白;ITGB1:整合素亞單位β1;SLC3A2:印記基因家族3成員2;KDM1A:賴氨酸脫乙基酶1A
2.3 GO和KEGG分析富集到BP、MF、CC的基因分別有271、277、283個(gè),為注釋基因的86.3%、88.2%、90.1%,140個(gè)基因(44.6%)參與KEGG通路。BP、MF、CC中P值最小的前6位,換算成-log10(P值)為縱坐標(biāo),橫坐標(biāo)各分類的基因計(jì)數(shù)為右側(cè)y軸繪圖,見圖2。CC中富集在核、膜、核質(zhì)、細(xì)胞外外泌體、細(xì)胞黏著連接、蛋白復(fù)合體等的基因差異顯著,見圖2A;BP中參與細(xì)胞-細(xì)胞黏附過程的基因P值最低,參與基因數(shù)為19,見圖2B;MF中P值最低的為多聚腺嘌呤核糖核苷酸結(jié)合,參與基因數(shù)目最多的為蛋白質(zhì)結(jié)合,見圖2C。富集前5位的通路為細(xì)胞周期、氨基酸的生物合成、無翅型整合位點(diǎn)家族(wingless-type integration site family, Wnt)、轉(zhuǎn)化生長因子β、半胱氨酸和蛋氨酸代謝通路,見圖2D。
2.4 蛋白質(zhì)相互作用PPI數(shù)據(jù)導(dǎo)入Cytoscape,MCODE聚類,節(jié)點(diǎn)連接度(degree)值=2,節(jié)點(diǎn)(node)評(píng)分值=0.2,k-分(core)=2,最大深度(max.depth)=100,獲11個(gè)模塊,評(píng)分前4的模塊4個(gè),評(píng)分分別為9、7、5、4.909,Node數(shù)目分別為9、7、7、12,邊(Edge)數(shù)目分別為36、21、15、27,見圖3。單個(gè)模塊中的基因行通路分析,主要與剪接體、泛素介導(dǎo)的蛋白水解共2個(gè)KEGG(P<0.01)和3個(gè)反應(yīng)組(REACTOME)(P<0.05)通路關(guān)聯(lián),見表2。
表2 PPI網(wǎng)絡(luò)模塊中的基因富集通路
R-HSA:反應(yīng)組人類通路標(biāo)識(shí)碼
2.5 PPI中的關(guān)鍵基因MCC算法計(jì)算前10個(gè)關(guān)鍵基因?yàn)椋弘幕滨.悩?gòu)酶E(peptidylprolyl isomerase E,PPIE)、不均一核核糖核蛋白A1(heterogeneous nuclear ribonucleoprotein A1,HNRNPA1)、Y盒結(jié)合蛋白1(Y-box binding protein 1,YBX1)、不均一核核糖核蛋白K(heterogeneous nuclear ribonucleoprotein K,HNRNPK)、不均一核核糖核蛋白A2B1(heterogeneous nuclear ribonucleoprotein A2/B1,HNRNPA2B1)、死亡盒解旋酶9(DExH-Box helicase 9,DHX9)、U6小核糖核酸相關(guān)Sm樣蛋白(U6 snRNA-associated sm-like protein,LSM4)、小核核糖核蛋白多肽N(small nuclear ribonucleoprotein polypeptide N,SNRPN)、多聚谷氨酰胺結(jié)合蛋白1(polyglutamine binding protein 1,PQBP1)、熱休克蛋白90α家族A類成員1(heat shock protein 90 alpha family class a member 1,HSP90AA1),評(píng)分分別為41 970、40 395、40 372、40 352、40 346、40 341、40 324、40 324、40 321、2 336,顏色排序見圖4。
圖2 基因本體(GO)分析
圖3 PPI網(wǎng)絡(luò)的聚類模塊
A:評(píng)分第1的9節(jié)點(diǎn)網(wǎng)絡(luò)結(jié)構(gòu);B:評(píng)分第2的7節(jié)點(diǎn)網(wǎng)絡(luò)結(jié)構(gòu);C:評(píng)分第3的7節(jié)點(diǎn)網(wǎng)絡(luò)結(jié)構(gòu);D:評(píng)分第4的12節(jié)點(diǎn)網(wǎng)絡(luò)結(jié)構(gòu)
圖4 MCC算法的關(guān)鍵基因及其相互作用關(guān)系
2.6 差異和關(guān)鍵基因與藥物敏感性的關(guān)系GDSC分析顯示,富含腺嘌呤胸腺嘧啶蛋白質(zhì)1A交互域(AT-rich interactive domain-containing protein 1A,ARID1A)基因突變與胃腺癌對(duì)CTx藥物的敏感性有關(guān),順鉑作用ARID1A突變的胃癌細(xì)胞,半抑制濃度(half maximal inhibitory concentration,IC50)值升高(P=0.050 016);卵巢癌、結(jié)直腸腺癌ARID1A基因突變時(shí),順鉑作用的IC50值降低,P值分別為0.005、0.047,見圖5。DHX9基因突變與多種癌細(xì)胞的藥物敏感性有關(guān),但未見與胃腺癌藥物敏感性的關(guān)聯(lián)。其他top 10差異基因和MCC篩選的關(guān)鍵基因尚無GDSC數(shù)據(jù)庫資料。
PMP22下游基因主要富集在細(xì)胞核、膜、核質(zhì)、胞外外泌體、黏著連接、蛋白復(fù)合體等成分,參與細(xì)胞-細(xì)胞黏附過程、多聚腺嘌呤核糖核苷酸結(jié)合、蛋白質(zhì)結(jié)合,參與細(xì)胞周期、氨基酸生物合成、Wnt和轉(zhuǎn)化生長因子β、半胱氨酸蛋氨酸代謝等通路。PPI網(wǎng)絡(luò)模塊主要通過剪接體、泛素介導(dǎo)的蛋白水解、熱休克因子1活化、軸突導(dǎo)向因子3A p21活化激酶依賴性軸突排斥、肌動(dòng)蛋白動(dòng)力調(diào)節(jié)形成吞噬杯、縫隙連接等通路發(fā)揮作用,與PPIE、ARID1A等有關(guān)。
PMP22敲減后ARID1A上調(diào),順鉑敏感性增強(qiáng),與ARID1A陽性表達(dá)胃癌患者無病生存率提高[7]的結(jié)果一致。GDSC分析見胃癌細(xì)胞順鉑敏感性與ARID1A突變的關(guān)聯(lián)P值略大于0.05,可能與突變組的樣本量少有關(guān)。DHX9突變與胃腺癌以外的其他多種癌細(xì)胞的順鉑敏感性有關(guān)。Top10差異基因、關(guān)鍵基因中的其他基因,GDSC未見記錄,可能是PMP22下游尚未明確的新基因。
GO和KEGG分析顯示,外泌體、細(xì)胞黏著粘附、蛋白質(zhì)結(jié)合功能均與PMP22相關(guān)CTx敏感性有關(guān)。外泌體傳遞miR-155至敏感細(xì)胞介導(dǎo)乳腺癌的CTx抵抗[8]。外泌體合成分泌抑制使去勢抵抗的前列腺癌細(xì)胞的CTx敏感性增強(qiáng)。細(xì)胞黏著連接因E-cadherin丟失而崩解,腫瘤細(xì)胞會(huì)避開失巢凋亡,CTx抵抗性增強(qiáng)[9]。細(xì)胞黏附生物過程的基因P值最小,表明與CTx抵抗顯著關(guān)聯(lián)。細(xì)胞間黏附分子-1中和抗體減少Jurkat細(xì)胞與間充質(zhì)干細(xì)胞的黏附,減少細(xì)胞間線粒體轉(zhuǎn)運(yùn),使Jurkat細(xì)胞的CTx敏感性增強(qiáng)[10]。分子功能中的蛋白質(zhì)結(jié)合功能,通過結(jié)合互作調(diào)節(jié)CTx敏感性。分化抗原133與磷脂酰肌醇3激酶 (phosphatidylinositide 3-kinases,PI3K)PI3K-p85的直接作用可活化PI3K/PKB(蛋白激酶B)通路,導(dǎo)致胃癌細(xì)胞的多種藥物抵抗[11]。通路方面,胃癌細(xì)胞CTx抵抗與Wnt通路的關(guān)聯(lián)性已有報(bào)告[12],與本文的KEGG分析結(jié)果相似,其余未見文獻(xiàn)報(bào)道的通路,如泛素化降解與胃癌CTx抵抗的關(guān)系,是未來研究的方向。
圖5 ARID1A基因突變與順鉑敏感性的關(guān)系
PPI網(wǎng)絡(luò)以系統(tǒng)視角揭示CTx抵抗的機(jī)制,本研究構(gòu)建的PPI網(wǎng)絡(luò)中提取4個(gè)亞模塊,獲10個(gè)關(guān)鍵基因,其中的DHX9、應(yīng)激誘導(dǎo)磷蛋白1(STIP1)基因突變與CTx抵抗或敏感性關(guān)聯(lián),GDSC得到驗(yàn)證,尚無驗(yàn)證的可能是CTx抵抗相關(guān)新基因。PPI模塊涉及的剪接體、泛素介導(dǎo)蛋白水解通路與骨肉瘤[13]、結(jié)直腸癌的發(fā)生發(fā)展相關(guān)聯(lián)[14],睡美人轉(zhuǎn)座子突變研究[15]顯示,泛素介導(dǎo)蛋白水解和細(xì)胞黏著連接也是胃癌中的失控通路。
本研究顯示了PMP22下游參與CTx抵抗的網(wǎng)絡(luò)成員,作為胃癌CTx抵抗的基因標(biāo)志,為CTx抵抗精準(zhǔn)治療的靶點(diǎn)研究提供了參考。