国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進(jìn)RankComp的個(gè)體化差異表達(dá)基因識(shí)別算法

2021-09-09 00:57:20楊書新陳良泊
關(guān)鍵詞:效能閾值通路

楊書新, 陳良泊

(江西理工大學(xué)信息工程學(xué)院,江西 贛州341000)

0 引 言

基因的選擇性表達(dá)與生物的生命調(diào)控息息相關(guān),研究疾病樣本中基因的差異表達(dá)有助于揭示疾病相關(guān)的生物學(xué)機(jī)制[1]?,F(xiàn)有的許多算法如:T-test[2]、SAM[3]、edgeR[4]和DEseq[5]被提 出 用 于 在 群 體 層 面 上鑒別不同病理生理?xiàng)l件或不同實(shí)驗(yàn)條件下的差異表達(dá)基因(Differential Expression Gene,DEG)。由于群體水平的差異表達(dá)基因忽略了疾病的異質(zhì)性,不能提供患者特異性的差異表達(dá)信息,故而無法回答許多具有生物學(xué)意義的問題[6]。例如,Tomlins等發(fā)現(xiàn)一些基因只在特定一些疾病樣本而不是在所有的疾病樣本中出現(xiàn)失調(diào)[7]。無獨(dú)有偶,Zhou等在乳腺癌差異表達(dá)研究中發(fā)現(xiàn),在雌激素受體陽性的乳腺癌樣本中,一部分差異表達(dá)基因的失調(diào)方向與其在雌激素受體陰性的乳腺癌樣本中的失調(diào)方向相反[8]。在個(gè)體層面識(shí)別差異表達(dá)基因是實(shí)現(xiàn)精準(zhǔn)醫(yī)療的基本步驟,有助于更好地理解疾病特異性的生物學(xué)機(jī)制并促進(jìn)個(gè)性化治療策略的發(fā)展[9]。隨著精準(zhǔn)醫(yī)療概念的普及,研究熱點(diǎn)逐漸轉(zhuǎn)向個(gè)體化基因差異表達(dá)分析。離群度(Outlying Degree,OD)[10-11]、Zscore和其改進(jìn)Rscore[12]等算法被提出用于識(shí)別個(gè)體化差異表達(dá)基因。不過這些算法對(duì)批次效應(yīng)很敏感,也缺乏統(tǒng)計(jì)學(xué)控制。為解決該問題,Wang等提出基于相對(duì)表達(dá)豐度排秩(Relative Expression Orderings,REO)的RankComp算法[13]。RankComp通過比較每個(gè)疾病樣本中基因?qū)Φ腞EO和正常樣本中REO高度穩(wěn)定的基因?qū)碜R(shí)別個(gè)體水平的差異表達(dá)基因。由于沒有直接使用基因表達(dá)值,RankComp獨(dú)立于批次效應(yīng)。經(jīng)研究發(fā)現(xiàn),RankComp存在統(tǒng)計(jì)效能低的問題。Richard等提出另一種基于相對(duì)表達(dá)豐度排秩的算法PenDA[14],聲稱在個(gè)體化基因差異表達(dá)分析中效率很高。但是PenDA的結(jié)果依賴于兩個(gè)人工參數(shù),缺乏統(tǒng)計(jì)學(xué)控制。同時(shí)本文研究發(fā)現(xiàn),PenDA在數(shù)據(jù)清洗過程中會(huì)刪除潛在差異表達(dá)基因,造成生物信息丟失。

為解決以上問題,本文對(duì)RankComp算法進(jìn)行改進(jìn),提出RankComp+算法,并在兩個(gè)仿真數(shù)據(jù)實(shí)驗(yàn)和一個(gè)真實(shí)的肺癌基因表達(dá)數(shù)據(jù)集實(shí)驗(yàn)中檢測(cè)個(gè)體化差異表達(dá)基因,評(píng)估了RankComp+的性能。結(jié)果表明,RankComp+仿真數(shù)據(jù)實(shí)驗(yàn)和真實(shí)肺癌配對(duì)樣本數(shù)據(jù)中的表現(xiàn)都優(yōu)于RankComp和PenDA。此外,為進(jìn)一步評(píng)估RankComp+算法得出結(jié)果的可靠性,本文將RankComp+算法應(yīng)用于數(shù)據(jù)具有單邊性的缺血性心肌病(Ischemic Cardiomyopathy,ICM)數(shù)據(jù)中,對(duì)得到的差異表達(dá)基因進(jìn)行功能富集分析,得到了與ICM相關(guān)的一些新的生物學(xué)通路,驗(yàn)證了RankComp+算法得出的結(jié)果具有生物學(xué)意義。

1 相關(guān)定義

1.1 個(gè)體化差異表達(dá)基因

差異表達(dá)基因一般來說有兩個(gè)定義。其一,若一個(gè)給定的基因i由于處于不同條件下(如環(huán)境壓力、時(shí)間等)表達(dá)水平出現(xiàn)顯著性差異,則將基因i定義為差異表達(dá)基因。其二,在不同條件因素下,因基因突變或者甲基化等結(jié)構(gòu)發(fā)生變化而導(dǎo)致差異的基因被定義為差異表達(dá)基因。在一般情況下,使用較多的是第一種定義,例如,基因i在正常樣本中表達(dá)量為GiN,經(jīng)觀察發(fā)現(xiàn)其在疾病樣本中的表達(dá)量為GiD,若經(jīng)過實(shí)驗(yàn)驗(yàn)證,發(fā)現(xiàn)GiN和GiD之間具有顯著差異,則認(rèn)為基因i發(fā)生了差異表達(dá)并將其定義為差異表達(dá)基因。

1.2 相對(duì)表達(dá)豐度排秩

相對(duì)表達(dá)豐度排秩 (Relative Expression Orderings,REO)是存在于基因?qū)χ袃苫蛑g的一種相互關(guān)系,由Wang等[13]首先提出。給定一個(gè)基因?qū)包含基因i和基因j,則p的REO有且僅有兩種可能,Gi>Gj以及Gi

圖1 相對(duì)表達(dá)豐度排秩示意

2 RankComp+算法

為提高RankComp算法的整體效能,RankComp+算法對(duì)其進(jìn)行了兩處改進(jìn)。其一,在穩(wěn)定對(duì)篩選部分,對(duì)高度穩(wěn)定策略的閾值選取進(jìn)行了調(diào)整;其二,在消除伙伴基因差異表達(dá)的影響部分,增加了迭代過程,從而使伙伴基因差異表達(dá)的影響消除更徹底。RankComp+算法可分為四個(gè)步驟,其算法流程圖如圖2所示。

圖2 RankComp+算法差異表達(dá)基因識(shí)別流程

其中,n表示樣本總數(shù);I(x)表示滿足x條件的基因?qū)€(gè)數(shù)。RankComp算法在篩選穩(wěn)定對(duì)時(shí)使用高度穩(wěn)定策略,將閾值設(shè)置為99%。本文研究認(rèn)為該閾值設(shè)置過于嚴(yán)苛,容易造成算法統(tǒng)計(jì)效能低下的問題。在對(duì)高度穩(wěn)定95%、高度穩(wěn)定99%和累計(jì)二項(xiàng)分布三種穩(wěn)定對(duì)閾值實(shí)驗(yàn)驗(yàn)證后(詳見3.4節(jié)),本文將穩(wěn)定對(duì)閾值定為高度穩(wěn)定95%。

步驟二,根據(jù)篩選出來的穩(wěn)定基因?qū)?,在給定的疾病樣本中找出逆轉(zhuǎn)基因?qū)?。逆轉(zhuǎn)基因?qū)Χx為與穩(wěn)定基因?qū)χ械腞EO相比,在疾病樣本中REO發(fā)生改變的基因?qū)Α=o定基因i、基因j,根據(jù)REO的兩種不同情況Gi>Gj和GiGj→GiGj,其示意圖如圖3所示。

圖3 兩種逆轉(zhuǎn)對(duì)模式示意

步驟三,差異表達(dá)基因的判定。差異表達(dá)基因的判定原理為,當(dāng)一個(gè)基因?qū)Φ腞EO發(fā)生逆轉(zhuǎn)時(shí),兩個(gè)基因至少有一個(gè)發(fā)生了差異表達(dá)。根據(jù)該原理,如果控制與待判定基因的伙伴基因的失調(diào)對(duì)待判定基因的影響,便可以通過基因?qū)Φ腞EO來判斷待判定基因是否發(fā)生差異表達(dá)。對(duì)于基因i,在控制其伙伴基因j(i≠j)情況下,逆轉(zhuǎn)模式Gi>Gj→GiGj支持基因i差異表達(dá)上調(diào)。對(duì)于疾病樣本k中某一特定的基因i,如果顯著多的逆轉(zhuǎn)基因?qū)χС只騣差異表達(dá)上調(diào),那么基因i則被判斷為差異上調(diào);反之,如果顯著多的逆轉(zhuǎn)基因?qū)χС只騣差異表達(dá)下調(diào)i則被判斷為差異下調(diào)。

在穩(wěn)定基因?qū)χ?,統(tǒng)計(jì)REO模式為Gi>Gj的基因?qū)?shù)目,記為a;REO模式為GiGj→GiGj的逆轉(zhuǎn)對(duì)數(shù)目,記為d。得到a、b、c、d后可以構(gòu)建如表1所列的四格表。

表1 差異表達(dá)判定四格表

設(shè)置零假設(shè)為a/b=(a-c+d)/(b-d+c),使用Fisher精確檢驗(yàn)對(duì)表1所列四格表進(jìn)行檢驗(yàn),得到p值。若p值小于0.05,則說明支持i差異表達(dá)上調(diào)的基因?qū)τ谥С只騣差異表達(dá)下調(diào)的基因?qū)?shù)目有顯著差異。通過支持基因i差異表達(dá)上、下調(diào)的數(shù)目c與d的大小即可判定基因i的差異表達(dá)方向。若c>d,說明基因i差異表達(dá)下調(diào),反之若c

步驟四,伙伴基因差異表達(dá)影響的消除。RankComp算法在所有的基因都經(jīng)過一次Fisher精確檢驗(yàn)之后,為了消除伙伴基因的差異表達(dá)對(duì)待判定基因的影響,從穩(wěn)定基因?qū)湍孓D(zhuǎn)基因?qū)χ腥コ谝淮蜦isher精確檢驗(yàn)中被判定為差異表達(dá)基因的相關(guān)基因?qū)Γ〕龊笤俅螆?zhí)行Fisher精確檢驗(yàn),以第二次篩選出來的DEG列表作為最終DEG。

本文研究認(rèn)為,RankComp算法對(duì)于伙伴基因差異表達(dá)的影響消除不夠徹底,第二次篩選出來的DEG相關(guān)基因?qū)θ匀淮嬖谟诜€(wěn)定對(duì)、逆轉(zhuǎn)對(duì)中。為徹底消除伙伴基因差異表達(dá)的影響,RankComp+算法在RankComp算法基礎(chǔ)上,添加迭代過程。每次得出DEG列表,都去除穩(wěn)定對(duì)、逆轉(zhuǎn)對(duì)中與這些DEG相關(guān)的基因?qū)Γ钡角耙淮魏秃笠淮蔚玫降腄EG列表一致,才將最后得到的DEG列表作為最后DEG結(jié)果。

黨支部制定了驛站管理制度、服務(wù)群眾工作制度、坐班工作制度等,安排機(jī)關(guān)正式黨員作為工作人員到驛站開展服務(wù),先后開展了入戶幫扶度夏收、環(huán)衛(wèi)一線送清涼、濕地公園除雜草、城管執(zhí)法體驗(yàn)日等主題活動(dòng),拉近了群眾和黨員的距離,讓群眾時(shí)刻感受到黨組織、黨員就在身邊。

3 實(shí)驗(yàn)與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)

本研究中使用的所有數(shù)據(jù)集均從Gene Expression Omnibus(GEO)[15]下載。如表2所列,收集到的肺癌組織的正常樣本用來篩選正常條件下具有穩(wěn)定REO的基因?qū)?。其中,GSE27262包含來自同一患者的配對(duì)癌癥-正常樣本的表達(dá)數(shù)據(jù),本文選擇從該數(shù)據(jù)集中配對(duì)樣本分析的基因失調(diào)方向作為金標(biāo)準(zhǔn)用于在肺癌數(shù)據(jù)驗(yàn)證實(shí)驗(yàn)中的性能評(píng)估。本文數(shù)據(jù)的產(chǎn)生平臺(tái)主要有兩種,Affymetrix平臺(tái)和Illumina微陣列平臺(tái),不同平臺(tái)的數(shù)據(jù)預(yù)處理方式不同。對(duì)于使用Affymetrix平臺(tái)(HG-U133 Plus2.0)生成的微陣列數(shù)據(jù)集,原始數(shù)據(jù)(.CEL文件)從GEO獲取并使用RMA算法進(jìn)行處理。對(duì)于Illumina微陣列平臺(tái),由于預(yù)處理流程相較Affymetrix平臺(tái)復(fù)雜且缺乏比較好的開源分析工具,本文直接從GEO獲取處理后的數(shù)據(jù)。

表2 方法驗(yàn)證實(shí)驗(yàn)數(shù)據(jù)

3.2 算法評(píng)價(jià)指標(biāo)

通過將RankComp+應(yīng)用于兩個(gè)仿真實(shí)驗(yàn)和一個(gè)配對(duì)樣本實(shí)驗(yàn)中,對(duì)RankComp+的性能進(jìn)行了評(píng)估。為了使對(duì)比效果更為客觀,仿真實(shí)驗(yàn)采取兩種不同策略,其一參考了RankComp算法中設(shè)計(jì)的仿真策略,其二則采用了PenDA算法中設(shè)計(jì)的仿真策略。

兩種仿真實(shí)驗(yàn)均基于正常的肺部數(shù)據(jù),重復(fù)執(zhí)行1 000次以避免相對(duì)誤差。在仿真實(shí)驗(yàn)中,靈敏度、特異度和F-score被用來評(píng)估方法的性能。靈敏度計(jì)算為所有差異表達(dá)基因中正確識(shí)別的差異表達(dá)基因的比例,而特異度則是所有非差異表達(dá)基因中正確識(shí)別的非差異表達(dá)基因的比例。F-score得分是通過靈敏度和特異度如公式(3)計(jì)算的統(tǒng)計(jì)量。

由于在肺組織配對(duì)樣本數(shù)據(jù)中確切的差異表達(dá)基因無法獲得,本文將成對(duì)樣本中觀察到的失調(diào)方向變化作為金標(biāo)準(zhǔn)。通過正確識(shí)別的DEG數(shù)目與識(shí)別的DEG總數(shù)的比值計(jì)算出的一致性評(píng)分能夠反映算法識(shí)別DEG的準(zhǔn)確性。而識(shí)別出的DEG數(shù)量與基因半數(shù)的比值反映算法的統(tǒng)計(jì)效能。為綜合考慮準(zhǔn)確性與統(tǒng)計(jì)效能,本文提出總體性能(Overall Power,OP)指標(biāo)對(duì)RankComp+、PenDA和RankComp在肺癌配對(duì)樣本數(shù)據(jù)中的表現(xiàn)進(jìn)行評(píng)價(jià),OP的計(jì)算方式如式(4)、式(5)所示。

其中,k指的是某一疾病樣本;RDEG(k)表示在樣本k中別出的DEG數(shù)量與基因總數(shù)的比值;Consistency(k)表示算法在樣本k中的一致性評(píng)分。

3.3 算法參數(shù)確定

為確定適合的RankComp+穩(wěn)定對(duì)閾值,本文對(duì)常用的高度穩(wěn)定策略95%、高度穩(wěn)定策略99%以及累計(jì)二項(xiàng)分布策略三種穩(wěn)定對(duì)閾值在配對(duì)樣本數(shù)據(jù)集GSE27262中進(jìn)行了驗(yàn)證,驗(yàn)證結(jié)果如表3所列。

表3 RankComp+穩(wěn)定對(duì)閾值選取實(shí)驗(yàn)結(jié)果

由表3可看出,在高度穩(wěn)定99%策略下RankComp+算法的一致性指數(shù)很高,但是找出的差異表達(dá)基因數(shù)目很少;而累計(jì)二項(xiàng)分布則恰恰相反,找出的差異表達(dá)基因數(shù)目很多,一致性指數(shù)卻十分低。為平衡算法的準(zhǔn)確性和統(tǒng)計(jì)效能,使得算法既能兼顧“找準(zhǔn)”又能兼顧“找全”,本文使用高度穩(wěn)定95%作為RankComp+的穩(wěn)定對(duì)閾值。

3.4 仿真數(shù)據(jù)實(shí)驗(yàn)

本研究在兩個(gè)仿真實(shí)驗(yàn)中評(píng)估了RankComp+在個(gè)體化差異表達(dá)基因識(shí)別中的性能。在RankComp策略仿真實(shí)驗(yàn)中,首先隨機(jī)提取GSE19804的10個(gè)正常樣本作為初始樣本。然后,通過隨機(jī)設(shè)置在-2和2之間的倍數(shù)變化(log2FC)對(duì)其表達(dá)值進(jìn)行改變來隨機(jī)生成上調(diào)和下調(diào)的基因。本文通過RankComp策略仿真生成了兩個(gè)數(shù)據(jù)集,一個(gè)具有3 000個(gè)上調(diào)基因和3 000個(gè)下調(diào)基因,另一個(gè)具有1 500個(gè)上調(diào)基因和1 500個(gè)下調(diào)基因。PenDA策略仿真實(shí)驗(yàn)是使用R語言penda包中的方法penda::complex_simulation生成,隨機(jī)抽取GSE19804的10個(gè)正常樣本和10個(gè)腫瘤樣本作為輸入數(shù)據(jù)。生成參數(shù)根據(jù)penda包的說明設(shè)置為size_grp=10,quant=0.05。兩次仿真都進(jìn)行了1 000次以減少相對(duì)誤差。為了更好地比較它們的性能,本文將RankComp和PenDA也應(yīng)用在仿真實(shí)驗(yàn)中。

在RankComp策略仿真實(shí)驗(yàn)中,207個(gè)具有20 572個(gè)基因的肺組織正常樣本被用來識(shí)別穩(wěn)定基因?qū)Γ?55 273 015個(gè)穩(wěn)定基因?qū)Ρ籖ankComp+篩選出來。同時(shí),由于篩選穩(wěn)定對(duì)的閾值不同,RankComp尋找出133 582 941個(gè)穩(wěn)定基因?qū)τ糜谄銬EG檢測(cè)。各算法在RankComp策略仿真實(shí)驗(yàn)中的結(jié)果如圖4、圖5所示。

圖4 生成6 000差異基因的RankComp策略仿真實(shí)驗(yàn)結(jié)果

圖5 生成3 000差異基因的RankComp策略仿真實(shí)驗(yàn)結(jié)果

圖4 展示了4種算法在具有3 000上調(diào)以及3 000下調(diào)的RankComp策略仿真數(shù)據(jù)集中的表現(xiàn),從中可以看出RankComp+的表現(xiàn)(F-score平均0.776)優(yōu)于其他兩種方法,由于PenDA算法在執(zhí)行數(shù)據(jù)清洗的過程中排除的基因包含仿真出來的差異表達(dá)基因,因此PenDA在模擬中顯示出較低靈敏度(平均0.618),盡管PenDA在特異度方面表現(xiàn)很好(平均0.971),但低靈敏度導(dǎo)致其F-score較低(平均0.73)。RankComp的表現(xiàn)在某種程度上類似于PenDA,其特異度為平均0.728,而靈敏度平均只有0.550,這導(dǎo)致其F-score較低(平均0.623)。在具有1 500上調(diào)基因和1 500下調(diào)基因的RankComp策略仿真實(shí)驗(yàn)中也可以看到類似的結(jié)果(圖5)。

對(duì)于PenDA策略仿真實(shí)驗(yàn),本文在總共17 816個(gè)基因中對(duì)10個(gè)疾病樣本平均仿真了3 122個(gè)DEG。使用與RankComp策略仿真實(shí)驗(yàn)一樣的207個(gè)肺組織正常樣本,RankComp+提取了109 163 986個(gè)穩(wěn)定基因?qū)Γ鳵ankComp獲得了90 366 703個(gè)穩(wěn)定基因?qū)ψ鳛槠銬EG檢測(cè)的背景列表。各算法在PenDA策略仿真實(shí)驗(yàn)中的表現(xiàn)如圖6所示。

從圖6中可以看出,在這些算法中,RankComp的F-score最高(平均0.867),盡管其特異度低于PenDA的特異度(平均0.918 vs.平均0.963),但其較高的靈敏度(平均0.824)導(dǎo)致其F-score比PenDA更好(平均0.867 vs.平均0.857)。值得注意的是,包括RankComp在內(nèi)的所有算法在PenDA策略仿真實(shí)驗(yàn)中均顯示出高特異度。與RankComp策略仿真實(shí)驗(yàn)相似,RankComp的靈敏度(平均0.514)較差,導(dǎo)致其F-score很低(平均0.668)。

圖6 PenDA策略仿真實(shí)驗(yàn)結(jié)果

總體而言,RankComp+在RankComp策略仿真實(shí)驗(yàn)和PenDA策略仿真實(shí)驗(yàn)中的總體表現(xiàn)良好,優(yōu)于其余算法。

3.5 肺癌配對(duì)樣本數(shù)據(jù)實(shí)驗(yàn)

為了進(jìn)一步研究算法的效能,RankComp+、RankComp和PenDA被應(yīng)用肺癌配對(duì)樣本數(shù)據(jù)集GSE27262中。表2中描述的肺組織正常樣本被用于篩選穩(wěn)定基因?qū)?。值得注意的是,為了排除GSE27262數(shù)據(jù)集中正常樣本對(duì)于結(jié)果判定的影響,GSE27262中的正常樣本不納入穩(wěn)定對(duì)選擇步驟。實(shí)驗(yàn)結(jié)果如圖7所示。

圖7 肺癌配對(duì)樣本數(shù)據(jù)集中的表現(xiàn)

肺癌配對(duì)樣本實(shí)驗(yàn)結(jié)果顯示,在所有參與比較的方法中,PenDA的一致性最高(平均0.993),但其DEG數(shù)最低(平均491.16),表明盡管PenDA方法雖然具有較高的準(zhǔn)確性,其統(tǒng)計(jì)效能卻很低,這導(dǎo)致PenDA算法的總體效能很低。RankComp方法也缺乏統(tǒng)計(jì)效能,其平均DEG平均數(shù)目?jī)H為1 485。RankComp+的一致性得分雖然略低于RankComp和PenDA(平均0.935vs.0.973,0.935vs.0.993),但DEG數(shù)卻高得多,達(dá)到平均4 597.36,致使其總體效能高于RankComp、PenDA算法,表明對(duì)RankComp+算法而言,準(zhǔn)確性和統(tǒng)計(jì)效能達(dá)到了很好的平衡。

3.6 缺血性心肌病數(shù)據(jù)實(shí)驗(yàn)

缺血性心肌?。↖schemic Cardiomyopathy,ICM)是向心臟供血的冠狀動(dòng)脈變窄而引起的一類心肌病,是心臟猝死的主要原因之一。ICM發(fā)病率的逐年增加使其對(duì)人類健康造成的危害更加嚴(yán)重。缺血性心肌病的數(shù)據(jù)屬于一類“單邊數(shù)據(jù)”,由于疾病特性影響,幾乎不太可能獲取到同一個(gè)體的配對(duì)樣本,這導(dǎo)致需要依賴配對(duì)樣本進(jìn)行分析的各種差異基因識(shí)別方法無法應(yīng)用于缺血性心肌病的差異表達(dá)分析。本文將RankComp+算法應(yīng)用于ICM數(shù)據(jù)集,通過對(duì)兩方法檢測(cè)出的差異表達(dá)基因的功能富集分析,尋找可能與ICM相關(guān)的生物學(xué)通路。

從RankComp+結(jié)果中提取的DEG的數(shù)目為659。通過對(duì)這659個(gè)DEG的富集分析,可能與ICM相關(guān)的3條GO通路和10條KEGG通路被識(shí)別出來。GO和KEGG分析結(jié)果分別如圖8、圖9所示。

圖8 Rank Comp+算法GO通路富集結(jié)果

圖9 RankComp+算法KEGG通路富集結(jié)果

GO分析顯示這659個(gè)DEG顯著富集于structural constituent of ribosome、S100 protein binding及cadherin binding通路,顯著性水平p<0.05。同時(shí),這些DEG在KEGG富集分析中富集到Proteasome、Ribosome、Epstein-Barr virus infection、Amyotrophic lateral sclerosis、Spinocerebellar ataxia等通路。值得注意的是在GO通路富集和KEGG通路富集分析中均發(fā)現(xiàn)與核糖體(ribosome)相關(guān)的通路被富集,核糖體相關(guān)通路可能與ICM的發(fā)病有較高相關(guān)性。

4 結(jié) 論

本文針對(duì)現(xiàn)有個(gè)體化差異表達(dá)基因識(shí)別算法存在的統(tǒng)計(jì)效能不足等問題,通過對(duì)RankComp算法進(jìn)行改進(jìn),提出RankComp+算法。在兩種不同策略的仿真實(shí)驗(yàn)和肺癌配對(duì)樣本實(shí)驗(yàn)中的實(shí)驗(yàn)結(jié)果表明RankComp+算法能夠穩(wěn)定地找出疾病樣本中的差異表達(dá)基因。在進(jìn)一步將RankComp+算法應(yīng)用于缺血性心肌病數(shù)據(jù)的實(shí)驗(yàn)中,通過對(duì)RankComp+算法識(shí)別的差異表達(dá)基因進(jìn)行通路富集分析,與缺血性心肌病相關(guān)的新生物學(xué)通路被識(shí)別出來,說明RankComp+算法識(shí)別的差異表達(dá)基因具有生物學(xué)意義。綜上所述,RankComp+算法能夠有效應(yīng)用于個(gè)體化基因差異表達(dá)分析并為疾病的機(jī)理研究提供新的信息。

猜你喜歡
效能閾值通路
遷移探究 發(fā)揮效能
同時(shí)多層擴(kuò)散成像對(duì)胰腺病變的診斷效能
充分激發(fā)“以工代賑”的最大效能
小波閾值去噪在深小孔鉆削聲發(fā)射信號(hào)處理中的應(yīng)用
基于自適應(yīng)閾值和連通域的隧道裂縫提取
比值遙感蝕變信息提取及閾值確定(插圖)
河北遙感(2017年2期)2017-08-07 14:49:00
室內(nèi)表面平均氡析出率閾值探討
Kisspeptin/GPR54信號(hào)通路促使性早熟形成的作用觀察
proBDNF-p75NTR通路抑制C6細(xì)胞增殖
唐代前后期交通運(yùn)輸效能對(duì)比分析
隆昌县| 娱乐| 郸城县| 治县。| 聊城市| 临猗县| 阿勒泰市| 永胜县| 临沂市| 尼勒克县| 佳木斯市| 梓潼县| 塔河县| 沭阳县| 潞西市| 苗栗县| 巴青县| 杂多县| 沙河市| 辽中县| 扶余县| 台安县| 永登县| 凤庆县| 楚雄市| 远安县| 安图县| 凯里市| 鹿邑县| 乌兰浩特市| 砀山县| 丹寨县| 正镶白旗| 班玛县| 凤台县| 威远县| 兴和县| 胶州市| 孟州市| 长沙市| 广宁县|