国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

羊水游離RNA中神經(jīng)發(fā)育關(guān)鍵基因分析*

2022-01-19 06:33楊樹(shù)法閆有圣陰赪宏
關(guān)鍵詞:共表達(dá)特異性關(guān)鍵

楊樹(shù)法,劉 妍,秦 朗,閆有圣,陰赪宏

首都醫(yī)科大學(xué)附屬北京婦產(chǎn)醫(yī)院/北京婦幼保健院,北京 100026

Rett綜合征、胼胝體發(fā)育異常、孤獨(dú)癥以及多動(dòng)癥等神經(jīng)發(fā)育障礙是常見(jiàn)的先天出生缺陷,嚴(yán)重影響患兒及其家庭生活質(zhì)量,給社會(huì)帶來(lái)了沉重的經(jīng)濟(jì)負(fù)擔(dān)[1-4]。產(chǎn)前診斷是預(yù)防神經(jīng)發(fā)育障礙出生缺陷的主要手段。隨著分子生物技術(shù)的發(fā)展,熒光原位雜交技術(shù)、熒光定量PCR、芯片檢測(cè)以及二代測(cè)序等技術(shù)陸續(xù)應(yīng)用于產(chǎn)前診斷,更多類型的染色體微缺失/重復(fù)、點(diǎn)突變等基因組變異信息被檢出。基因組變異與臨床表型間的復(fù)雜聯(lián)系,使得高通量檢測(cè)報(bào)告的臨床解讀面臨巨大挑戰(zhàn),以美國(guó)醫(yī)學(xué)遺傳學(xué)和基因組學(xué)學(xué)會(huì)為代表的多種專業(yè)委員會(huì)建立了多種遺傳變異的評(píng)價(jià)系統(tǒng)[5-6],將突變分為致病性、可疑致病性、致病性未明、可疑良性以及良性等。這些評(píng)價(jià)系統(tǒng)多以兒童和成人的臨床資料為基礎(chǔ)發(fā)展而來(lái)。與出生后可以廣泛獲取患兒臨床資料相比,在產(chǎn)前診斷中可獲取的胎兒臨床信息極其有限;B超作為最大的獲取源,可獲取的胎兒資料遠(yuǎn)遠(yuǎn)少于成人;另外,實(shí)驗(yàn)室檢查和物理診斷資料基本缺失。這些都導(dǎo)致了在產(chǎn)前診斷中基因組變異的臨床解讀更具有挑戰(zhàn)性。產(chǎn)前診斷中,存在1%~2%的致病性未明突變[7],因此,獲取更多胎兒發(fā)育信息,協(xié)助判定胎兒發(fā)育情況,成為產(chǎn)前診斷中亟待解決的問(wèn)題。羊水是產(chǎn)前診斷中最易獲取的胎兒附屬物,先前研究表明,羊水游離RNA(AfcfRNA)包含與胎兒多種組織發(fā)育相關(guān)的基因表達(dá)信息[8-10]。但是,AfcfRNA中基因來(lái)源于胎兒多個(gè)組織,加之神經(jīng)系統(tǒng)發(fā)育涉及多個(gè)過(guò)程,這都加大了從AfcfRNA中獲取神經(jīng)系統(tǒng)發(fā)育信息的難度。因此,本研究分析了孕中期正常AfcfRNA轉(zhuǎn)錄組,結(jié)合基因共表達(dá)網(wǎng)絡(luò)分析和組織特異性基因分析,試圖從AfcfRNA轉(zhuǎn)錄組中提取神經(jīng)系統(tǒng)發(fā)育相關(guān)的關(guān)鍵基因,為AfcfRNA轉(zhuǎn)錄組在產(chǎn)前診斷中應(yīng)用奠定基礎(chǔ)。

1 資料與方法

1.1一般資料 以孕中期正常胎兒的羊水為研究對(duì)象,從Gene Expression Omnibus數(shù)據(jù)庫(kù)中下載正常胎兒AfcfRNA的芯片檢測(cè)結(jié)果。納入標(biāo)準(zhǔn):(1)核型分析結(jié)果正常;(2)單胎妊娠;(3)羊水采集時(shí)間為孕中期(孕13~27周);(4)檢測(cè)平臺(tái)為Affymetrix Human Genome U133 Plus 2.0芯片。排除標(biāo)準(zhǔn):(1)染色體核型結(jié)果異常;(2)胎兒B超檢查結(jié)果異常。按照納入標(biāo)準(zhǔn)和排除標(biāo)準(zhǔn)分別從GSE101141[11]、GSE16176[12]、GSE25634[13]、GSE33168[14]、GSE47394[15]、GSE48521[16]、GSE49893[17]及GSE58435[18]中獲取56例孕中期AfcfRNA轉(zhuǎn)錄組的檢測(cè)結(jié)果。

1.2方法

1.2.1神經(jīng)組織特異性基因的定義 正常組織的基因表達(dá)量數(shù)據(jù)來(lái)源于Human Protein Atlas數(shù)據(jù)庫(kù)[19],下載基因表達(dá)數(shù)據(jù)表(https://www.proteinatlas.org/download/rna_tissue_consensus.tsv.zip)到本地。統(tǒng)計(jì)該數(shù)據(jù)庫(kù)所包括的組織和基因種類,將基因在神經(jīng)組織中的表達(dá)量高于該基因在所有組織中表達(dá)量均值的10倍以上者,定義為神經(jīng)組織特異性基因。

1.2.2共表達(dá)網(wǎng)絡(luò)分析 使用Oligo v1.54.1軟件包讀取芯片原始結(jié)果,并對(duì)結(jié)果進(jìn)行背景校正、歸一化,獲取基因表達(dá)量數(shù)據(jù)[20]。Oligo是用于分析寡核苷酸芯片的軟件包,可用于處理Affymetrix和NimbleGen芯片結(jié)果。批次效應(yīng)[21]的去除借助SVA包,SVA包通過(guò)確定和建立代理變量去除高通量數(shù)據(jù)中的批間差異和其他無(wú)關(guān)變異。利用加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA) 軟件包[22]進(jìn)行基因共表達(dá)網(wǎng)絡(luò)分析,軟閾值設(shè)為12,最小類的數(shù)量設(shè)為25。篩選得到的基因共表達(dá)模塊用顏色表示。

1.2.3基因功能富集分析 編寫(xiě)R腳本從共表達(dá)模塊中選取神經(jīng)組織特異性基因,建立神經(jīng)組織特異的共表達(dá)模塊,利用ClusterProfiler軟件包分別對(duì)每個(gè)神經(jīng)組織特異共表達(dá)模塊中的基因進(jìn)行GO(gene ontology)功能富集分析[23],ClusterProfiler軟件包可以對(duì)基因和基因集進(jìn)行多種功能富集分析(GO、KEGG及GSEA等)。用Benjamini-Hochberg方法對(duì)P值進(jìn)行調(diào)整,以調(diào)整的P值(Padj)<0.05為差異有統(tǒng)計(jì)學(xué)意義。

1.2.4蛋白共表達(dá)網(wǎng)絡(luò)分析 共表達(dá)模塊中的關(guān)鍵基因的篩選,以從STRING數(shù)據(jù)庫(kù)(https://stringdb-static.org/download/protein.links.v11.0/9606.protein.links.v11.0.txt.gz)下載的蛋白間相互作用數(shù)據(jù)為基礎(chǔ)[24],編寫(xiě)R語(yǔ)言腳本,建立基因間相互作用關(guān)系,將結(jié)合力設(shè)為900,統(tǒng)計(jì)每個(gè)基因的連接度。連接度為基因間相互作用的表示形式,連接度越高表示基因與其他基因存在更多的相互作用關(guān)系,其所處的位置越關(guān)鍵,研究中將連接度大于15(即與15個(gè)以上的基因存在蛋白間相互作用)的基因作為關(guān)鍵基因。

1.3數(shù)據(jù)分析軟件環(huán)境 數(shù)據(jù)的分析和處理借助R語(yǔ)言完成。基因不同命名系統(tǒng)間的轉(zhuǎn)換使用HGU133Plus2.db軟件包,HGU133Plus2.db是對(duì)Affymetrix Human Genome U133 Plus 2.0 Array進(jìn)行注釋的軟件包,包含了探針和不同基因命名系統(tǒng)間的對(duì)應(yīng)關(guān)系。蛋白間相互作用數(shù)據(jù)的制圖使用Igraph軟件包,Igraph軟件具有對(duì)網(wǎng)絡(luò)進(jìn)行分析和可視化的功能。其他數(shù)據(jù)繪圖借用Ggplot2軟件包,Ggplot2是基于圖形繪制語(yǔ)法而設(shè)計(jì)的用于將數(shù)據(jù)可視化的軟件。變異系數(shù)(CV)=正常AfcfRNA基因表達(dá)量的標(biāo)準(zhǔn)差/正常AfcfRNA基因表達(dá)量的均值×100%。

2 結(jié) 果

2.1正常AfcfRNA中基因共表達(dá)模塊建立 研究中共使用56例孕中期AfcfRNA芯片檢測(cè)結(jié)果,芯片檢測(cè)結(jié)果經(jīng)背景校正、歸一化和去除批次效應(yīng)后,不同樣本間具有相似的均值和標(biāo)準(zhǔn)差,樣本間具有可比性(圖1A)。利用WGCNA建立檢測(cè)基因的共表達(dá)關(guān)系,利用動(dòng)態(tài)樹(shù)形剪切算法共建立27個(gè)共表達(dá)模塊,模塊名稱用顏色表示(藍(lán)綠色、藍(lán)色、棕色、黃色、綠色、紅色、黑色、洋紅色、粉紅色、紫色、鮭肉色、棕褐色、黃綠色、午夜藍(lán)色、淡青色、青綠色、灰色60、淺綠色、淺黃色、寶藍(lán)色、深粉藍(lán)色、深灰色、暗紅色、深綠色、橘黃色、深橙色、白色),各共表達(dá)模塊中基因的數(shù)量如圖1B所示。不具有共表達(dá)關(guān)系的基因分類到灰色模塊中。

注:A表示56例AfcfRNA芯片檢測(cè)結(jié)果背景校正、歸一化和批次校正結(jié)果;B表示各共表達(dá)模塊中基因數(shù)量。圖1 正常AfcfRNA基因共表達(dá)模塊的建立

2.2神經(jīng)組織特異性基因共表達(dá)模塊的功能富集分析 Human Protein Atlas數(shù)據(jù)庫(kù)中神經(jīng)系統(tǒng)組織包括大腦皮質(zhì)、胼胝體、海馬結(jié)構(gòu)、下丘腦、杏仁核、中腦、嗅覺(jué)區(qū)、垂體、腦橋和延髓、脊髓、基底神經(jīng)節(jié)、黑質(zhì)、丘腦以及小腦等組織。利用表達(dá)量高于整體表達(dá)量10倍的標(biāo)準(zhǔn),共篩選得到832個(gè)神經(jīng)組織特異性基因。分別將27個(gè)共表達(dá)模塊中的基因與832個(gè)神經(jīng)組織特異性基因取交集,獲取神經(jīng)組織特異基因的共表達(dá)模塊。在獲取神經(jīng)組織特異性共表達(dá)模塊的基礎(chǔ)上,分別對(duì)共表達(dá)模塊中的基因進(jìn)行GO分析。在藍(lán)色、棕色、藍(lán)綠色以及黃色模塊中集中富集到神經(jīng)功能相關(guān)的GO術(shù)語(yǔ)(GO term),見(jiàn)圖2。這些術(shù)語(yǔ)涉及前腦發(fā)育、神經(jīng)突觸組裝和功能、神經(jīng)遞質(zhì)釋放過(guò)程、軸突發(fā)生以及學(xué)習(xí)和記憶過(guò)程等神經(jīng)系統(tǒng)功能的多個(gè)方面。

注:A、B、C、D分別為藍(lán)色、棕色、藍(lán)綠色以及黃色模塊中神經(jīng)組織特異性共表達(dá)模塊內(nèi)基因的GO分析結(jié)果;橫軸為富集到術(shù)語(yǔ)的模塊內(nèi)基因的數(shù)量,條圖顏色深淺表示Padj大小(Padj<0.05為差異有統(tǒng)計(jì)學(xué)意義),縱軸為富集到的GO術(shù)語(yǔ)。圖2 神經(jīng)組織特異性共表達(dá)模塊功能富集分析

2.3神經(jīng)組織特異性共表達(dá)模塊的關(guān)鍵基因 將藍(lán)色、棕色、藍(lán)綠色以及黃色共表達(dá)模塊內(nèi)的神經(jīng)組織特異性基因利用STRING數(shù)據(jù)庫(kù),分析他們間的相互作用關(guān)系,尋找各個(gè)模塊中具有高連接度的關(guān)鍵基因。共篩選到27個(gè)關(guān)鍵基因,分析芯片中各基因表達(dá)量均值,計(jì)算得到27個(gè)基因表達(dá)量的P25為3.09,CV的P50為14.09%。將基因表達(dá)量均值低于27個(gè)基因表達(dá)量P25的關(guān)鍵基因刪除,共發(fā)現(xiàn)17個(gè)關(guān)鍵基因,藍(lán)色模塊中3個(gè)(SLC18A3、TACR3、SYT2),棕色模塊中6個(gè)(SSTR5、STX1A、SNAP25、GHSR、SSTR4、GABBR2),藍(lán)綠色模塊中5個(gè)(DRD2、SLC32A1、GNG3、OPN4、PENK),黃色模塊中3個(gè)(RAB3A、HCRT、GRM5)。關(guān)鍵基因的模塊來(lái)源、連接度、基因平均表達(dá)量及CV見(jiàn)表1。

表1 關(guān)鍵基因信息統(tǒng)計(jì)表

續(xù)表1 關(guān)鍵基因信息統(tǒng)計(jì)表

3 討 論

羊水是產(chǎn)前診斷中最安全且最易獲取的胎兒附屬物,先前研究表明羊水中含有來(lái)源于胎兒多種組織的AfcfRNA,這些基因的變化與胎兒發(fā)育密切相關(guān)[8-9],通過(guò)分析AfcfRNA中基因變化為監(jiān)測(cè)胎兒發(fā)育提供了可能。但是,AfcfRNA中基因來(lái)源和各系統(tǒng)發(fā)育過(guò)程的復(fù)雜性,極大地增加了從AfcfRNA中獲取各系統(tǒng)發(fā)育信息的難度。與單個(gè)基因的變化相比,基因集的變化更具穩(wěn)定性,能夠降低單基因變化的噪聲污染;同時(shí)組織和器官的發(fā)育涉及多種基因的相互和共同作用。WGCNA基于多個(gè)樣品表達(dá)數(shù)據(jù),通過(guò)計(jì)算基因間的相關(guān)性,利用剪切算法將具有相同表達(dá)模式的基因歸為同一表達(dá)模塊。本課題組利用WGCNA,將AfcfRNA中的基因分為27個(gè)具有共表達(dá)關(guān)系的模塊(圖1B),不具有共表達(dá)關(guān)系的基因被過(guò)濾到灰色模塊中。

Human Protein Atlas數(shù)據(jù)庫(kù)中包含了已知基因在正常人體大部分組織的表達(dá)量數(shù)據(jù)。在建立基因間共表達(dá)關(guān)系模塊的基礎(chǔ)上,利用Human Protein Atlas數(shù)據(jù)庫(kù)篩選并建立了神經(jīng)組織特異的基因共表達(dá)網(wǎng)絡(luò)[19]。這些神經(jīng)組織特異的共表達(dá)模塊內(nèi)的基因參與神經(jīng)系統(tǒng)主要的生物學(xué)過(guò)程(神經(jīng)遞質(zhì)傳遞、神經(jīng)組織發(fā)生、學(xué)習(xí)和認(rèn)知等)。這些結(jié)果表明,研究中建立的基因共表達(dá)網(wǎng)絡(luò)與神經(jīng)系統(tǒng)功能密切相關(guān)(圖2)。

STRING數(shù)據(jù)庫(kù)中存儲(chǔ)了蛋白-蛋白間相互作用的數(shù)據(jù),利用蛋白-蛋白間相互作用數(shù)據(jù)可以構(gòu)建篩查到的基因的相互作用網(wǎng)絡(luò)。與其他基因具有更多聯(lián)系的基因是共表達(dá)網(wǎng)絡(luò)的關(guān)鍵基因,是該網(wǎng)絡(luò)功能的集中體現(xiàn)。研究中利用STRING[24]數(shù)據(jù)庫(kù)對(duì)WGCNA建立的網(wǎng)絡(luò)進(jìn)行了篩選,選取了每個(gè)網(wǎng)絡(luò)中的關(guān)鍵基因。在藍(lán)色模塊中得到3個(gè)關(guān)鍵基因(SLC18A3、TACR3、SYT2),通過(guò)基因富集分析發(fā)現(xiàn),該模塊中基因主要與突觸后膜電位、神經(jīng)遞質(zhì)傳導(dǎo)以及突觸組裝的突觸功能有關(guān)(圖2A)。前人研究表明,SLC18A3囊泡乙酰膽堿通道,其缺陷可以導(dǎo)致先天性肌無(wú)力綜合征[25];TACR3編碼速激肽受體3,廣泛表達(dá)于神經(jīng)系統(tǒng),并參與情緒障礙、疼痛、學(xué)習(xí)和記憶缺陷、神經(jīng)系統(tǒng)發(fā)育等神經(jīng)生理和病理過(guò)程[26];SYT2編碼突觸結(jié)合蛋白,SYT2的缺陷與突觸前先天性肌無(wú)力綜合征有關(guān)[27],并且在髓母細(xì)胞瘤的發(fā)生發(fā)展中起關(guān)鍵作用[28]。

棕色模塊有6個(gè)關(guān)鍵基因(SSTR5、STX1A、SNAP25、GHSR、SSTR4、GABBR2)。其中,SSTR5和SSTR4是生長(zhǎng)激素抑素受體,廣泛分布在大腦、下丘腦、外周神經(jīng)系統(tǒng)、胰腺等多種組織[29],是實(shí)體瘤潛在的藥物作用靶點(diǎn)[30];STX1A編碼突觸結(jié)合蛋白1A,與兒童多動(dòng)癥[31]有關(guān),JNK2與STX1A間相互作用參與N-甲基-D-天門(mén)冬氨酸誘發(fā)的谷氨酸釋放[32];SNAP25是漢族人孤獨(dú)癥的候選基因[33],參與神經(jīng)信息傳遞[34];GHSR是生長(zhǎng)激素促分泌素受體,其甲基化狀態(tài)與腫瘤的發(fā)生密切相關(guān)[35];GABBR2是γ-氨基丁酸受體2,參與多種神經(jīng)遞質(zhì)傳遞過(guò)程。這些基因廣泛參與了神經(jīng)信號(hào)傳導(dǎo)的多個(gè)過(guò)程。

在藍(lán)綠色模塊中得到5個(gè)關(guān)鍵基因:DRD2、SLC32A1、GNG3、OPN4、PENK。DRD2是多巴胺受體,其多態(tài)性與精神疾病和藥物依賴密切相關(guān)[36-37];SLC32A1是囊泡γ-氨基丁酸轉(zhuǎn)運(yùn)體成員,其可能參與了γ-氨基丁酸和乙酰膽堿囊泡釋放[38];GNG3是多形性成膠質(zhì)細(xì)胞瘤發(fā)生和發(fā)展過(guò)程中的關(guān)鍵基因[39-40];OPN4是黑素蛋白基因,其功能與睡眠和清醒有關(guān)[41];PENK是腦啡肽原,其水平降低與亨廷頓氏舞蹈病的癥狀的嚴(yán)重程度密切相關(guān)[42]。

在黃色模塊中得到3個(gè)關(guān)鍵基因:RAB3A、HCRT、GRM5。RAB3A是Ras樣GTP酶[43],參與激素釋放、神經(jīng)遞質(zhì)釋放以及細(xì)胞膜循環(huán)等多個(gè)過(guò)程[44];HCRT為下丘腦神經(jīng)肽前體;GRM5為谷氨酸受體。這些基因與機(jī)體的學(xué)習(xí)和記憶功能密切相關(guān)。

胎兒發(fā)育是多個(gè)基因協(xié)同表達(dá)的結(jié)果,AfcfRNA中基因的變化是胎兒發(fā)育情況的綜合表現(xiàn)。胎兒發(fā)育異常會(huì)導(dǎo)致AfcfRNA中的基因表達(dá)量變化,AfcfRNA中存在能夠檢測(cè)胎兒發(fā)育情況的標(biāo)志物。本課題組認(rèn)為潛在標(biāo)志物應(yīng)具備如下3個(gè)特點(diǎn):(1)組織特異性表達(dá)基因。通過(guò)選擇特異性基因可以在一定程度上排除其他組織發(fā)育對(duì)基因表達(dá)變化的影響。(2)穩(wěn)定表達(dá)基因。對(duì)于芯片檢測(cè),該穩(wěn)定性表現(xiàn)為較高的表達(dá)量和較低的CV;本研究中, 基因平均表達(dá)量的P25為3.09,CV的P50為14.09%,筆者使用了3.09和14.09%分別作為二者的臨界值,但這是存在爭(zhēng)議的,需要更多的實(shí)驗(yàn)證實(shí)。(3)起關(guān)鍵作用的基因。這些基因能夠同多個(gè)基因協(xié)同作用,在基因調(diào)控和組織發(fā)育中起到關(guān)鍵作用,組織的異常發(fā)育也經(jīng)常與關(guān)鍵基因的變化密切相關(guān)?;谏厦娴目紤]筆者設(shè)計(jì)了關(guān)鍵基因的挖掘方法:基因組織特異性分析、基因表達(dá)量和變異分析以及共表達(dá)網(wǎng)絡(luò)和關(guān)鍵基因分析。同時(shí)要說(shuō)明的是,研究中使用的56例正常羊水標(biāo)本是指核型分析和B超檢查正常的標(biāo)本,絕大部分胎兒為發(fā)育正常的胎兒,基于這些標(biāo)本篩選得到的基因通過(guò)文獻(xiàn)檢索證實(shí)與神經(jīng)系統(tǒng)功能和神經(jīng)發(fā)育異常密切相關(guān),但能否作為檢測(cè)神經(jīng)發(fā)育異常的標(biāo)志物尚需要進(jìn)一步實(shí)驗(yàn)驗(yàn)證,這些基因表達(dá)的變化可能與這些基因突變有關(guān),也可能由于其他基因的表達(dá)異常導(dǎo)致。

綜上所述,本研究通過(guò)對(duì)孕中期AfcfRNA轉(zhuǎn)錄組進(jìn)行共表達(dá)網(wǎng)絡(luò)分析和組織特異性分析,獲得了神經(jīng)系統(tǒng)發(fā)育密切相關(guān)的并且具有共表達(dá)關(guān)系的關(guān)鍵基因。這些關(guān)鍵基因來(lái)源的共表達(dá)網(wǎng)絡(luò)模塊與神經(jīng)系統(tǒng)功能密切相關(guān),其異常與神經(jīng)系統(tǒng)相關(guān)疾病密切相關(guān),可作為潛在的產(chǎn)前診斷中監(jiān)測(cè)神經(jīng)系統(tǒng)發(fā)育異常的標(biāo)志物。

猜你喜歡
共表達(dá)特異性關(guān)鍵
CT聯(lián)合CA199、CA50檢測(cè)用于胰腺癌診斷的敏感性與特異性探討
硝酸甘油,用對(duì)是關(guān)鍵
SO2引起巨峰葡萄采后落粒的共表達(dá)網(wǎng)絡(luò)和轉(zhuǎn)錄調(diào)控分析
保靖苗族龍紋飾的藝術(shù)特異性與文化基因
老年慢性非特異性腰痛綜合康復(fù)治療效果分析
UdhA和博伊丁假絲酵母xylI基因共表達(dá)對(duì)木糖醇發(fā)酵的影響
血清鐵蛋白、IL-6和前列腺特異性抗原聯(lián)合檢測(cè)在前列腺癌診斷中的應(yīng)用
高考考好是關(guān)鍵
高世代回交玉米矮稈種質(zhì)的轉(zhuǎn)錄組分析
兩種半纖維素酶在畢赤酵母中的共表達(dá)