倪喆鑫 畢艷麗 孫帥 程雯 俞超芹
子宮內(nèi)膜異位癥是一種雌激素依賴性疾病,其特征是子宮內(nèi)膜基質(zhì)細胞與腺細胞在子宮被覆粘膜及子宮肌層以外部位種植生長,影響著10~15%的育齡婦女[1]?;颊咴馐苤煌潭鹊挠绊懀缤唇?jīng)、月經(jīng)紊亂、不孕等,也會造成不良妊娠結(jié)局的發(fā)生[2-3]。卵巢子宮內(nèi)膜異位癥由于內(nèi)膜組織在卵巢部位種植生長導致,通常以囊腫形式存在并對卵巢功能存在不利影響[4]。雖然該病的病理診斷已經(jīng)明確,但發(fā)病機制仍存在爭議,可能與遺傳、表觀遺傳、環(huán)境因素和免疫功能紊亂等多種因素有關[5]。
在該病眾多發(fā)病機制學說中,經(jīng)血逆流學說最為廣泛接受。隨著月經(jīng)血逆流,內(nèi)膜組織碎片會沿著子宮-輸卵管-腹腔方向前進,在特定部位特定條件下種植生長[6]。在這一過程中,組織細胞間的黏附作用極為重要。為此,本研究擬從Gene Expression Omnibus數(shù)據(jù)庫(GEO)中挖掘卵巢內(nèi)異癥病灶組織差異表達基因,聚焦黏附相關差異基因,從基因差異角度出發(fā),探討經(jīng)血逆流學說中內(nèi)膜組織黏附種植的可行性與現(xiàn)實性。
1.基因芯片的選取以及差異基因的篩選:研究利用美國國立生物技術信息中心(National Biotechnology Information Center, NCBI)的Gene Expression Omnibus (GEO)數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo/)進行基因數(shù)據(jù)的搜索與篩選。選擇檢索式為((ovary endometriosis) OR (ovarian endometriosis)) AND "Homo sapiens"[porgn:__txid9606],搜索限定條件為Expression profiling by array,tissue。搜索時間為2019年10月8日。利用GEO的R語言分析工具GEO2R進行分析,利用變化倍數(shù)(fold changes,F(xiàn)C)判定基因差異大小,取logFC絕對值>2,多次試驗調(diào)整后的P(adj.P)<0.05的基因,得到兩組相關差異基因與數(shù)據(jù)。利用value distribution軟件計算所選樣本的值數(shù)據(jù)分布,以顯示值數(shù)據(jù)是否在樣本中居中,從而適合交叉比較。
2.差異基因生物學功能及KEGG通路分析:將得到的差異基因去重,并刪除無對應Gene symbol的基因片段后,利用功能注釋生物信息學芯片分析技術(Functional Annotation Bioinformatics Microarray Analysis,DAVID)(https://david.ncifcrf.gov/)對所有差異基因進行ID轉(zhuǎn)換。利用Functional Annotation Tool對所有差異基因進行GO(gene ontology)生物學過程富集分析和KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析,找出最顯著富集的功能注釋。基因富集程度用EASE評分(修正Fisher精確檢驗P值)表示,范圍從0到1。修正Fisher精確檢驗P值等于0表示完全富集。通常P值≤0.05,在注釋類別中被認為是非常豐富的。
3.黏附相關基因篩選與通路圖制作:在GO生物學過程富集以及KEGG通路富集分析的基礎上篩選出黏附相關基因,利用文氏圖在線工具(http://bioinfogp.cnb.csic.es/tools/venny/index.html)篩選出兩部分共同基因。利用GEO2R分析這些基因在每個樣本中的表達情況,然后用在線KEGG 數(shù)據(jù)庫(http://www.kegg.jp/kegg/pathway.html)找出密切相關的通路。
1.差異基因篩選:共檢索到12篇相關文獻,通過PubMed數(shù)據(jù)庫逐一閱讀后,最終納入研究涉及GEO平臺為GPL571,實驗組為GSE25628,卵巢異位內(nèi)異癥病灶組織樣本7個(設為OEM組),正常內(nèi)膜組織樣本6個(設為CON組)。所選樣本值數(shù)據(jù)在樣本中居中,適合交叉比較(圖1)。經(jīng)篩選后,在OEM樣本中符合logFC絕對值>2,adj.P<0.05的上調(diào)基因有247個,下調(diào)基因有321個。
圖1 所選樣本值數(shù)據(jù)分布圖Figure 1 Data distribution of selected sample values
2.差異基因生物學過程及通路富集分析:運用在線生物學信息注釋數(shù)據(jù)庫DAVID,對上述差異基因進行GO生物學過程富集分析,其中細胞粘附、血管生成、炎癥反應等35個生物學過程顯著富集(表1)。對上述差異基因進行KEGG信號通路富集注釋,共得到13條有顯著富集的KEGG通路,主要包括血管平滑肌收縮、局灶性粘連和細胞粘附分子等(表2)。
表1 差異表達基因生物學過程富集分析結(jié)果Table 1 Results of Gene Ontology analysis on differentially expressed genes
表2 差異表達基因相關KEGG通路分析結(jié)果Table 2 Results of KEGG pathway analysis on differentially expressed genes
3.細胞黏附相關基因及KEGG通路:GO生物學過程富集分析發(fā)現(xiàn)細胞黏附(cell adhesion)涉及差異基因數(shù)目最多(7.7%),而在KEGG通路富集分析中局灶性粘連(Focal adhesion)相關基因最多(3.0%)。將兩部分相關基因羅列分析,利用文氏圖在線工具篩選發(fā)現(xiàn)THBS1、VWF、THBS2等8個基因(排除名稱轉(zhuǎn)換過程中相同基因)在兩種黏附相關分析過程中均涉及。通過GEO2R在線分析發(fā)現(xiàn),卵巢內(nèi)異癥病灶組織中THBS1、VWF、THBS2、COMP、COL5A1、COL6A2和ITGA7顯著上調(diào),而ITGB8顯著下調(diào)(圖2)。在此基礎上,對這8個基因進一步用KEGG 數(shù)據(jù)庫工具明確相關通路情況,發(fā)現(xiàn)與細胞外基質(zhì)受體相互作用(ECM-receptor interaction)、局灶性粘連(Focal adhesion)和PI3K-Akt 信號通路(PI3K-Akt signaling pathway)這3條通路密切相關。
圖2 黏附相關基因在各樣本中表達情況Figure 2 Expression degree of adhesion genes in each sample
本研究通過現(xiàn)有數(shù)據(jù)挖掘發(fā)現(xiàn),卵巢內(nèi)異癥病灶組織中表達差異顯著的基因較多(568個)。利用GO生物學過程富集分析篩選顯著差異生物學過程35個;利用KEGG通路富集分析篩選出顯著差異通路13條。在此基礎上,進一步綜合兩種分析結(jié)果,篩選出黏附密切相關基因8個,分別為THBS1、THBS2、VWF、COMP、COL5A1、COL6A2、ITGA7和ITGB8。
THBS1別名TSP、THBS、TSP1、TSP-1,其編碼的蛋白質(zhì)是一種粘附性糖蛋白,可通過CD36-和CD47-介導的一氧化氮(NO)信號抑制以及調(diào)節(jié)血管內(nèi)皮細胞生長因子(VEGF)[7]的活性和生物利用度,直接抑制血管生成。THBS2與THBS1共有80%的蛋白質(zhì)序列,但THBS2是一種控制內(nèi)皮細胞凋亡增殖平衡的基質(zhì)細胞蛋白,與腫瘤血管生成有關[8]。THBS2通過直接影響內(nèi)皮細胞的遷移、增殖、存活和凋亡以及拮抗VEGF活性來抑制血管生成[9]。在內(nèi)膜組織成功黏附特定部位后,需要新生血管來維持。在這一過程中,血管生成這一生物過程尤為重要。本研究中卵巢內(nèi)異癥病灶已具備豐富的血管提供營養(yǎng)支持,而THBS1和THBS2上調(diào)可認為是機體抑制病灶血管生成的自我調(diào)節(jié)過程。在內(nèi)異癥診斷方面,監(jiān)測THBS1和THBS2編碼蛋白水平增高程度也許能夠成為一種判斷內(nèi)異癥病情程度的有效輔助手段。
VWF別名VWD、F8VWF,能夠編碼一種參與止血的糖蛋白,在血小板與血管損傷部位的粘附和血液中各種蛋白質(zhì)的轉(zhuǎn)運中發(fā)揮作用[10],更是正常血管生成的關鍵調(diào)節(jié)因子[11]卵巢內(nèi)異癥病灶存在周期性出血的疾病特征,伴隨著局部病灶血管的破壞與再生。VWF上調(diào)提示病灶內(nèi)血管生成活動活躍,VWF在促進卵巢內(nèi)異癥發(fā)生發(fā)展過程中起著重要作用。
COMP別名MED、EDM1、EPD1、TSP5、PSACH、THBS5,編碼的蛋白是一種非膠原細胞外基質(zhì)蛋白,屬于基質(zhì)金屬蛋白酶的一種,可降解細胞外基質(zhì)的成分[12],有研究顯示結(jié)腸癌組織中COMP的表達水平明顯高于癌旁正常組織,并通過激活PI3K/Akt/mTOR/p70S6K通路部分促進結(jié)腸癌細胞增殖[13]。本次研究發(fā)現(xiàn),卵巢內(nèi)異癥病灶中COMP顯著上調(diào),這可能與COMP編碼蛋白加大對內(nèi)膜基質(zhì)細胞外基質(zhì)破壞作用,促進內(nèi)異灶生長密切相關。此外,COMP編碼的蛋白很可能通過激活異位基質(zhì)細胞PI3K/Akt通路,從而促進該種細胞增殖。
V型膠原蛋白的α1鏈是由COL5A1編碼[14]。V型膠原蛋白占到總膠原含量的1%到5%之間,能夠影響膠原原纖維形成和直徑[15],從而影響非軟骨結(jié)締組織的構(gòu)成[16]。COL6A2編碼VI型膠原的三個α鏈中的一個,而VI型膠原是一種在大多數(shù)結(jié)締組織中發(fā)現(xiàn)的珠狀纖維膠原,可與多種細胞膜和細胞外基質(zhì)蛋白相互作用[17]。這兩種基因在病灶中都顯示上調(diào),并可能在逆流的內(nèi)膜組織碎片中也存在上調(diào),促進了組織碎片的局部黏附,在構(gòu)成和維持病灶起了很大作用。
整合素是由α鏈和β鏈組成的異二聚體膜蛋白,介導廣泛的細胞-細胞和細胞-基質(zhì)相互作用,從而在細胞遷移、形態(tài)發(fā)育、分化和轉(zhuǎn)移中發(fā)揮作用[18]。ITGA7編碼的蛋白質(zhì)屬于整合素α鏈家族而ITGB8編碼的蛋白質(zhì)是整合素β鏈家族的一員。在研究中發(fā)現(xiàn),雖然ITGA7與ITGB8同屬于整合素相關基因,卻在卵巢內(nèi)異癥病灶組織中成相反的變化。鑒于研究的是已經(jīng)形成并穩(wěn)固的內(nèi)異灶,推測在一定程度上ITGA7可能與病灶形成后的維持相關,而ITGB8可能與病灶早期的黏附相關。
由于目前卵巢內(nèi)異癥組織與正常內(nèi)膜組織的基因芯片數(shù)據(jù)較少,本次研究納入的數(shù)據(jù)有限,并受限于該基因芯片的完成時間較早,可能存在諸多不足。但本次研究在一定程度上表明,上述8個黏附相關基因在內(nèi)異癥形成和發(fā)展過程中起著重要作用。本次研究只討論了黏附相關基因,而上文提示有顯著性差異基因多達幾百個,涉及生理生化的方方面面,這需要在下一步研究中繼續(xù)挖掘與分析。但值得注意的是,本研究從生物信息學角度探究了隨經(jīng)血逆流內(nèi)膜組織黏附種植發(fā)展成為卵巢內(nèi)異癥的可能性,為經(jīng)血逆流學說提供了基因角度證據(jù),對內(nèi)異癥的臨床和基礎研究具有一定積極意義。