王少薇,楊鈺萌,解昕軼,李俊杰,張榮強
(1.陜西中醫(yī)藥大學(xué)第二臨床醫(yī)學(xué)院,陜西咸陽 712046;2.陜西中醫(yī)藥大學(xué)公共衛(wèi)生學(xué)院,陜西咸陽 712046)
新型冠狀病毒肺炎(coronavirus disease 2019,COVID-19)是由新型冠狀病毒(SARS-CoV-2)感染所致,可通過呼吸道飛沫和氣溶膠途徑傳播,人群普遍易感,傳播速度較快[1]。根據(jù)流行病學(xué)調(diào)查研究發(fā)現(xiàn),COVID-19傳播途徑較多,疫情有可能會發(fā)生第二次的暴發(fā),因此抗擊新冠疫情并未取得全面勝利,仍需嚴(yán)防。
臨床實踐表明,COVID-19重型患者多在發(fā)病1周后,因病毒侵入人體肺上皮細(xì)胞,出現(xiàn)胸悶、呼吸困難等癥狀,甚至進展為急性呼吸窘迫綜合征。另有研究表明,SARS-CoV-2感染肺泡上皮2型細(xì)胞(AT2s),導(dǎo)致肺損傷和氣體交換障礙[2]。病理學(xué)研究發(fā)現(xiàn),COVID-19患者肺部主要為彌漫性肺損傷(diffuse alveolar damage,DAD),且僅在肺部發(fā)現(xiàn)了SARS-CoV-2核酸陽性[3]。由此表明,SARS-CoV-2在侵入人體后,最易并持續(xù)損害肺組織上皮細(xì)胞,保護COVID-19患者的肺組織是首要任務(wù)。但目前對于SARS-CoV-2侵及肺組織的致病機制尚不明確,需要進行更加深入的研究。因此,大數(shù)據(jù)背景下針對SARS-CoV-2最先侵入的肺上皮細(xì)胞中差異表達(dá)基因的基因組學(xué)研究具有重要意義。
本研究采用GEO公共數(shù)據(jù)庫(Gene Expression Omnibus,GEO)的數(shù)據(jù)集GSE160435,篩選肺上皮細(xì)胞感染SARS-CoV-2的差異表達(dá)基因,通過富集分析詮釋其生物學(xué)功能,利用Network Analyst在線軟件建立蛋白互作網(wǎng)絡(luò)(protein-protein interactions network,PPI)等,探討SARS-CoV-2感染對肺上皮細(xì)胞的潛在影響機制,為制定預(yù)防、診斷和治療措施提供新思路。
1.1 資料來源以“COVID-19”為關(guān)鍵詞檢索GEO Datasets公共數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)獲得由Yao、Mulay和Stripp提交更新的數(shù)據(jù)集GSE160435。該數(shù)據(jù)集由GPL24676 Illumina NovaSeq 6000(Homo sapiens)和GPL29320 Illumina NovaSeq 6000(Homo sapiens;severe acute respiratory)兩個平臺檢測,共檢測60 663個基因,包含10個樣本,分別為COVID感染組(n=5)和MOCK對照組(n=5)。
1.2 樣品處理首先將SARS-CoV-2轉(zhuǎn)染從原代肺AT2細(xì)胞產(chǎn)生的類肺上皮細(xì)胞,然后使用氯仿-異丙醇乙醇法提取轉(zhuǎn)染后的肺上皮細(xì)胞和Mock對照組肺上皮細(xì)胞的總RNA,隨后進行基因文庫構(gòu)建,測序后獲得數(shù)據(jù)集GSE160435。
1.3 數(shù)據(jù)預(yù)處理將下載的數(shù)據(jù)集GSE160435上傳至Network Analyst在線軟件(http://www.networ?kanalyst.ca/),刪除錯誤值或可疑值;隨后采用Log2CPM(Log2-counts per million)對測序數(shù)據(jù)進行歸一化處理,確保后續(xù)分析結(jié)果的準(zhǔn)確性和可靠性。
1.4 差異表達(dá)基因的篩選將預(yù)處理后的數(shù)據(jù)利用Limma法,以AdjustedP<0.05,Log2Fold Change>2為參數(shù)進行差異表達(dá)基因分析,篩選SARS-CoV-2感染人肺上皮細(xì)胞后差異表達(dá)基因(differential ex?pression genes,DEGs)。
1.5 基因功能(GO)和信號通路(KEGG)富集分析把篩選后的DEGs上傳至在線軟件STRING(https://string-db.org/),調(diào)節(jié)信度(Confidence)至0.7,進行GO富集分析,包括生物學(xué)過程(biological process,BP)、分子功能(molecular function,MF)和細(xì)胞學(xué)組分(cellular component,CC),同時進行KEGG信號通路富集分析。
1.6 PPI Network的建立與分析利用STRING數(shù)據(jù)庫對DEGs建立PPI網(wǎng)絡(luò),為了獲得核心PPI網(wǎng)絡(luò),首先選擇Minimum Network,然后將Between?ness Filter調(diào)節(jié)為50,獲取最終的PPI網(wǎng)絡(luò)。最后采用Cytoscape(www.cytoscape.org/3.7.2)對其進行可視化,獲得PPI交互作用網(wǎng)絡(luò)。
1.7肺組織特異性DEGs之PPI交互作用分析本研究進一步選用數(shù)據(jù)庫TCSBN Database建立肺組織特異性DEGs的PPI交互網(wǎng)絡(luò),可視化后獲得肺組織特異性的DEGs蛋白交互網(wǎng)絡(luò)。
1.8 MicroRNA-DEG交互作用分析上傳DEGs至Network Analyst中,采用儲存庫RegNetwork Repository建 立MicroRNA-DEG交 互 作用網(wǎng)絡(luò);調(diào)節(jié)節(jié)點參數(shù)后,獲得其核心網(wǎng)絡(luò),并利用Cytoscape進行可視化。
1.9 轉(zhuǎn)錄因子(transcription factor,TF)-DEG交互作用分析本研究利用Network Analyst和ENCODE數(shù)據(jù)庫,適宜調(diào)節(jié)節(jié)點參數(shù),建立TF-DEG調(diào)控網(wǎng)絡(luò),分析TF對DEGs的調(diào)控作用。
1.10 環(huán)境化學(xué)物對DEG的調(diào)節(jié)作用分析本研究采用CTD(Comparative Toxicogenomics Database)數(shù)據(jù)庫探索環(huán)境化學(xué)物對DEGs的調(diào)節(jié)作用,采用Cytoscape進行可視化,建立Chemicals-DEG調(diào)控網(wǎng)絡(luò)。
2.1 數(shù)據(jù)的預(yù)處理將數(shù)據(jù)進行標(biāo)準(zhǔn)化處理后,各樣本基因表達(dá)數(shù)據(jù)均數(shù)基本穩(wěn)定,分布密度基本一致,顯示數(shù)據(jù)質(zhì)量良好、可靠,可進行下一步分析(圖1)。
圖1數(shù)據(jù)預(yù)處理前各樣本基因表達(dá)數(shù)據(jù)的箱式圖(A)和分布密度曲線(C);數(shù)據(jù)預(yù)處理后各樣本基因表達(dá)數(shù)據(jù)的箱式圖(B)和分布密度曲線(D)Fig.1 Box plots(A)and distribution density curves(C)of gene expression data of each sample before data preprocess?ing;Box plots(B)and distribution density curves(D)of gene expression data of each sample after data preprocessing
2.2 差異表達(dá)基因的篩選篩選共發(fā)現(xiàn)324個DEGs,其 中 上 調(diào)112個(34.57%),下 調(diào)212個(65.43%)。前20位差異表達(dá)基因信息見表1。DEGs分析的火山圖見圖2A,上調(diào)和下調(diào)最明顯的6個基因在COVID組和MOCK組的表達(dá)情況見圖2中B~G。
圖2 差異表達(dá)基因的火山圖(A)及前6個基因的表達(dá)變化(B~G)Fig.2 Volcanic plot of DEGs(A)and expression of the top 6 DEGs(B-G)
表1 前20位差異表達(dá)基因信息Tab.1 Details of the top 20 DEGs
2.3 KEGG信號通路富集分析富集分析結(jié)果顯示,DEGs主要參與:病毒相關(guān)的防御反應(yīng)等生物學(xué)過程;發(fā)揮與信號受體結(jié)合等分子功能;參與組成細(xì)胞外圍、胞外間隙、細(xì)胞外基質(zhì)等;主要涉及蛋白質(zhì)消化與吸收、甲型流感、人乳頭瘤病毒感染、丙型肝炎、視黃醇代謝及ECM-受體相互作用等信號通路(表2,圖3)。
表2 Top 10 KEGG信號通路富集分析結(jié)果Tab.2 KEGG signaling pathway enrichment results of differentially expressed genes
2.4 DEGs解碼蛋白PPI網(wǎng)絡(luò)DEGs的 解 碼 蛋 白PPI網(wǎng)絡(luò)由36節(jié)點組成,上調(diào)蛋白6個,下調(diào)蛋白11個,預(yù)測蛋白19個(圖4A);肺組織特異性PPI網(wǎng)絡(luò)由42節(jié)點組成,上調(diào)蛋白8個,下調(diào)蛋白12個,預(yù)測蛋白19個(圖4B)。綜合分析可知,其中PDGFRB和KIT(Degree cutoff>5)與其他蛋白的相互作用密切,若刪除這兩個蛋白,整個網(wǎng)絡(luò)不僅穩(wěn)定性降低,并且變得散亂。因此,PDGFRB和KIT為PPI網(wǎng)絡(luò)的重要核心節(jié)點。
圖4 DEGs相關(guān)PPI網(wǎng)絡(luò)(紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因,綠色代表與DEGs有交互作用的預(yù)測基因)Fig.4 DEGs-related PPI network(Red represents up-regulated genes,blue represents down-regulated genes,and green represents predicted genes that interact with DEGs)
圖3差異表達(dá)基因的Top 10 GO富集分析結(jié)果Fig.3 Top10 GO enrichment analysis results of differentially expressed genes
2.5 microRNA-DEG交互作用分析根據(jù)microRNADEG交互作用網(wǎng)絡(luò)顯示,有9個microRNA與DEGs之間存在著交互作用,其中hsa-miR-340與9個DEGs存 在 靶 向作用關(guān) 系,has-miR-9與8個DEGs存在靶向作用關(guān)系;BNC2與7個microRNA存在靶向作用關(guān)系,SGCD與6個microRNA存在靶向作用關(guān)系(圖5)。
圖5 microRNA-DEG調(diào)控網(wǎng)絡(luò)(紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因,黃色代表microRNA,綠色代表與DEGs有交互作用的預(yù)測基因)Fig.5 microRNA-DEG regulatory network(Red represents up-regulated genes,blue represents down-regulated genes,and yellow represents microRNA,green represents predicted genes that interact with DEGs)
2.6 TF-DEG交互作用分析TF對DEGs調(diào)控作用分析結(jié)果顯示,19個DEGs受14種轉(zhuǎn)錄因子的調(diào)節(jié)。其中轉(zhuǎn)錄因子ZBTB7A對13個DEGs有調(diào)節(jié)作用,EZH2、SIN3A和KLF9對12個DEGs有 調(diào) 節(jié) 作用;HOXB4、ISG15受10個TF的調(diào)控(圖6)。
圖6 TF-DEG調(diào)控網(wǎng)絡(luò)(紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因,綠色代表與DEGs有交互作用的TF)Fig.6 TF-DEG regulation network(Red represents up-regu?lated genes,blue represents down-regulated genes,and green represents TF that interact with DEGs)
2.7 環(huán)境化學(xué)物對DEG調(diào)控作用分析Chemicals-DEG調(diào)控網(wǎng)絡(luò)顯示:鎳(nickel)、雌二醇(estradiol)、丙戊酸(valproic acid)等16種環(huán)境化學(xué)物對14個DEGs產(chǎn)生著特異的影響與調(diào)控作用,其中雌二醇、丙戊酸對14個DEGs均 產(chǎn)生影響;TNFRSF12 A可受曲 古菌素A(trichostatin A)、維甲酸(retinoic acid)、環(huán)孢素(cyclosporine)等15種環(huán)境化學(xué)物的影響;ANXA3、ISG15和IFI6可受維甲酸、環(huán)孢素、雌二醇等14種化學(xué)物的影響(圖7)。
圖7 環(huán)境化學(xué)物-DEG調(diào)控網(wǎng)絡(luò)(紅色代表上調(diào)基因,藍(lán)色代表下調(diào)基因,綠色代表與DEGs有交互作用的化學(xué)物)Fig.7 Environment chemical-DEG regulation network(Red represents up-regulated genes,blue represents down-regu?lated genes,and green represents chemicals that interact with DEGs)
在COVID-19疫情下如何有效應(yīng)對成為世界各國首要的任務(wù)之一和研究熱點與難點。本研究采用生物信息學(xué)技術(shù)基于肺上皮細(xì)胞的測序數(shù)據(jù),進行深入探索和分析,篩選出肺上皮細(xì)胞感染SARS-CoV-2后的差異表達(dá)基因324個,以MMP9基因上調(diào)、PLP?PR4基因下調(diào)最為明顯。MMP9的主要功能是降解和重塑細(xì)胞外基質(zhì)(extracellular matris,ECM)的動態(tài)平衡,分解呼吸道和肺內(nèi)的結(jié)構(gòu)復(fù)合物如ECM和基底膜。MMP9表達(dá)過度,能直接影響ECM降解作用、組織重塑和炎癥反應(yīng)[4]。本研究結(jié)果提示,CXCL11參與急性肺功能損害的發(fā)病過程,其表達(dá)與矽肺纖維化的發(fā)生發(fā)展有關(guān)[5-6]。研究發(fā)現(xiàn),PLPPR4的主要功能是催化許多生物活性脂質(zhì)介質(zhì)的脫磷化,調(diào)節(jié)各種細(xì)胞功能。LIU等[7]研究發(fā)現(xiàn),PRELP是一種能提高中性粒細(xì)胞的吞噬殺傷活性從而防止細(xì)菌黏附到肺上皮細(xì)胞的新型天然免疫抗菌成分。目前雖然尚無針對MMP9、CXCL11、PLPPR4和PRELP參與肺組織上皮細(xì)胞的抗病毒免疫調(diào)節(jié)機制的研究報道,本研究的探索發(fā)現(xiàn)為后續(xù)的研究提供了參考。
富集分析結(jié)果發(fā)現(xiàn),DEGs主要參與組成胞外間隙、細(xì)胞外基質(zhì)等細(xì)胞成分,誘導(dǎo)對病毒相關(guān)的防御反應(yīng),并涉及了甲型流感、ECM-受體相關(guān)的信號通路。以上結(jié)果提示,SARS-CoV-2感染可能首先對肺上皮細(xì)胞的外基質(zhì)產(chǎn)生一定的破壞作用而影響肺部的正常功能。PPI的分析發(fā)現(xiàn),PDGFRB和KIT是網(wǎng)絡(luò)的關(guān)鍵成員。PDGFRB中文名稱為血小板源性生長因子受體-β,其在人體中發(fā)揮的主要作用是刺激成纖維細(xì)胞、內(nèi)皮細(xì)胞的增殖。KIT的主要功能是抑制細(xì)胞凋亡。由此推測,PDGFRB和KIT可能在抑制肺上皮細(xì)胞凋亡、促進其增殖方面發(fā)揮作用。
microRNA是一類內(nèi)源性RNA小分子,能在轉(zhuǎn)錄后水平調(diào)控基因的表達(dá),主要作為基因表達(dá)的負(fù)性調(diào)控因 子[8],發(fā)現(xiàn)hsa-miR-340對9個DEGs發(fā)揮了 一定的調(diào)節(jié)作用。趙連忠等[9]研究表明,在甲型流感和其他RNA病毒感染后,hsa-miR-340被降低調(diào)節(jié),意味著宿主細(xì)胞消耗hsa-miR-340是抗病毒防御的重要內(nèi)容。張博威等[10]還發(fā)現(xiàn),hsa-miR-340表達(dá)使T24細(xì)胞的凋亡顯著增加。劉榮鳳等[11]研究提示,hsa-miR-9通過靶向調(diào)控ZEB2從而抑制小細(xì)胞肺癌細(xì)胞的生物學(xué)行為。以上結(jié)果提示,microRNA在病毒侵入人體后通過發(fā)揮一定的生物學(xué)功能參與機體的免疫過程,但本研究篩選出的microRNA與被SARS-CoV-2感染的肺組織上皮細(xì)胞之間的研究涉及較少,在后續(xù)的研究中仍需進一步探討。
TF對基因的表達(dá)起抑制或增強的作用。本研究發(fā) 現(xiàn),ZBTB7A、EZH2、SIN3A和KLF9與DEGs之間交互作用復(fù)雜,關(guān)系密切。GENG等[12]證明,ZBTB7A在UCC中明顯降低調(diào)節(jié)作用,在調(diào)節(jié)免疫細(xì)胞滲透方面起著至關(guān)重要的作用。REDONDO等[13]發(fā)現(xiàn),ZBTB7A可激活或抑制特定細(xì)胞系分化所需的代謝程序,并控制關(guān)鍵通路。EZH2通過抑制染色質(zhì)中的靶基因促進細(xì)胞增殖、凋亡和衰老,在細(xì)胞周期、有絲分裂和DNA修復(fù)中發(fā)揮重要作用,在免疫細(xì)胞(T細(xì)胞、NK細(xì)胞、巨噬細(xì)胞等)中起決定性作用[14-16]。SIN3A是指導(dǎo)細(xì)胞分化、存活和功能的旁同源轉(zhuǎn)錄協(xié)同調(diào)節(jié)因子[17]。
本研究還發(fā)現(xiàn),鎳、雌二醇、丙戊酸、曲古菌素A、維甲酸、環(huán)孢素等對DEGs可產(chǎn)生影響。已有研究表明,曲古霉素A影響線粒體凋亡信號和細(xì)胞周期相關(guān)調(diào)控通路相關(guān)因素的表達(dá),從而抑制細(xì)胞增殖和分化,促進細(xì)胞凋亡[18-19]。含有游離二氧化硅(Silicon Dioxide)的粉塵進入人的肺部后,引起肺巨噬細(xì)胞壞死,導(dǎo)致肺組織纖維化,影響肺的呼吸活動。維甲酸主要影響骨的生長和促進上皮細(xì)胞增生、分化、角質(zhì)溶解等代謝作用。DEY[20]研究發(fā)現(xiàn),Tretinoin作為潛在的SARS-CoV-2 E蛋白離子通道阻滯劑和病毒組裝抑制劑的可能性,這可能是治療冠狀病毒的重要治療策略。GáLVEZ等[21]認(rèn)為,對于COVID-19患者,環(huán)孢素A(Cyclosporine-A)可作為類固醇治療的輔助治療可改善預(yù)后和降低死亡率,主要適用于中、重度患者。以上的研究結(jié)果提示,環(huán)境化學(xué)物對人體肺組織上皮細(xì)胞的影響有利有弊,趨利避害有利于改善COV?ID-19患者的療效。本研究結(jié)果與上述研究證據(jù)基本一致,并為上述證據(jù)補充了一定的分子水平依據(jù)。
綜上所述,COVID-19患者肺組織上皮細(xì)胞的基因表達(dá)譜發(fā)生了顯著變化。PDGFRB、KIT、MMP9等蛋白或基因可能在肺組織的防御免疫機制中發(fā)揮著重要作用;鎳、雌二醇和維甲酸等可能影響肺上皮細(xì)胞的正常生理功能和病理反應(yīng)。本研究為SARSCoV-2對肺上皮細(xì)胞致病機制的研究和制定預(yù)防、診斷和治療措施提供了新的思路。