孔 薇,張 娜,楊 旸,牟曉陽(yáng)
(1.上海海事大學(xué) 信息工程學(xué)院,上海 201306;2.美國(guó)羅文大學(xué) 醫(yī)藥研究中心,新澤西 08028)
阿爾茨海默(Alzheimer disease,簡(jiǎn)稱(chēng)AD)是以進(jìn)行性認(rèn)知障礙和記憶力損害為主的中樞神經(jīng)系統(tǒng)退行性病變,病人逐漸喪失生活自理能力,給家庭和社會(huì)帶來(lái)沉重的負(fù)擔(dān).AD起病隱匿且發(fā)病機(jī)制復(fù)雜,基因信號(hào)傳導(dǎo)通路及調(diào)控關(guān)系難以構(gòu)建[1].大量的臨床病理報(bào)告顯示,Aβ沉積所形成的神經(jīng)炎斑塊是AD病理主要特征之一.AD老年斑病變中可觀察到幾十種與炎癥有關(guān)的蛋白質(zhì);T淋巴細(xì)胞、小膠質(zhì)細(xì)胞和星狀細(xì)胞發(fā)揮著類(lèi)炎癥免疫細(xì)胞和巨噬細(xì)胞的作用.因此,炎癥反應(yīng)在AD發(fā)病機(jī)制中起著重要作用,基于炎癥反應(yīng)的功能模塊及信號(hào)傳導(dǎo)通路構(gòu)建將為AD致病機(jī)制的研究提供有益的途徑.
目前基因調(diào)控網(wǎng)絡(luò)的構(gòu)建主要基于基因表達(dá)數(shù)據(jù),但基因表達(dá)數(shù)據(jù)具有基因數(shù)目多、樣本過(guò)少、高噪聲且信息變量隱藏很難分析的特點(diǎn),這種不平衡造成大多數(shù)經(jīng)典模式識(shí)別和機(jī)器學(xué)習(xí)方法不能被直接應(yīng)用,直接導(dǎo)致構(gòu)建基因調(diào)控網(wǎng)絡(luò)的精度不夠[2].近年來(lái),很多學(xué)者在不同程度上提出了整合基因表達(dá)數(shù)據(jù)集以及融合其他數(shù)據(jù)源的方法.如整合不同平臺(tái)下基因表達(dá)數(shù)據(jù)、結(jié)合Chip-chip數(shù)據(jù)、基因敲除數(shù)據(jù)、蛋白質(zhì)相互作用等,用于構(gòu)建基因調(diào)控網(wǎng)絡(luò)、基因生物標(biāo)志物的探尋等[3-6].其中,PPI數(shù)據(jù)所表示的網(wǎng)絡(luò)結(jié)構(gòu)可代表不同的生物過(guò)程或信號(hào)通路,能為基因功能和網(wǎng)絡(luò)的研究提供豐富的相互作用信息,尤其是對(duì)應(yīng)于序列相似性比較大的基因.因此,結(jié)合PPI數(shù)據(jù)可以彌補(bǔ)基因表達(dá)數(shù)據(jù)的不足,提高網(wǎng)絡(luò)的精度.作者利用PPI數(shù)據(jù)所提供的生物網(wǎng)絡(luò)及功能的模塊性,與AD基因表達(dá)數(shù)據(jù)相結(jié)合構(gòu)建基于炎癥反應(yīng)的AD功能模塊網(wǎng)絡(luò).
同時(shí),除了人腦海馬(hippocampus,簡(jiǎn)稱(chēng)HIP)區(qū)組織樣本以外,內(nèi)嗅皮質(zhì)(entorhinal cortex,簡(jiǎn)稱(chēng)EC)區(qū)、顳中回(media temporal gyrus,簡(jiǎn)稱(chēng) MTG)區(qū)、后扣帶回皮質(zhì)(posterior cingulate,簡(jiǎn)稱(chēng)PC)區(qū)、額上回(superior frontal gyrus,簡(jiǎn)稱(chēng)SFG)區(qū)及視覺(jué)皮層(primary visual cortex,簡(jiǎn)稱(chēng)VCX)區(qū)均與記憶和空間定位等密切相關(guān),并在AD中均有病理改變,因此,文中作者利用AD患者6個(gè)腦區(qū)域基因表達(dá)數(shù)據(jù)采用Heinz算法與PPI數(shù)據(jù)結(jié)合,提取顯著子網(wǎng)絡(luò);提出模擬退火算法預(yù)測(cè)和優(yōu)化網(wǎng)絡(luò)中的相互作用;最后通過(guò)基因功能分析對(duì)特征基因進(jìn)行分類(lèi),并結(jié)合PPI網(wǎng)絡(luò)構(gòu)建基于炎癥反應(yīng)的功能模塊,并構(gòu)建鈣離子作用機(jī)制的網(wǎng)絡(luò)模塊,為深入了解AD內(nèi)部發(fā)病機(jī)制提供重要線索.
作者在總的PPI網(wǎng)絡(luò)中提取出擾動(dòng)性更大的節(jié)點(diǎn)基因且節(jié)點(diǎn)之間的相互作用都比較強(qiáng)的子網(wǎng)絡(luò),并且在加權(quán)網(wǎng)絡(luò)中采用最大權(quán)重的方法提取子網(wǎng).網(wǎng)絡(luò)的加權(quán)包括邊權(quán)和點(diǎn)權(quán),即網(wǎng)絡(luò)得分函數(shù)的邊得分和點(diǎn)得分.邊得分代表兩個(gè)節(jié)點(diǎn)基因的相關(guān)性[7];點(diǎn)得分代表該基因差異表達(dá)程度[8].
根據(jù)觀測(cè)的基因數(shù)據(jù)計(jì)算的原始p值可以認(rèn)為有信號(hào)和噪聲混合組成[9].在零假設(shè)條件下,p值的信號(hào)成分服從B(a,1)分布,a為擬合參數(shù).其概率密度函數(shù)為
噪聲服從B(1,1)分布,β為形狀參數(shù),當(dāng)α和β都為1時(shí),即B(1,1)=U(0,1),即可以看作噪聲服從均勻分布.對(duì)于得分函數(shù)分母則為1,公式如下
很顯然,a→1表示信號(hào)成分的密度是收斂于背景模型.因此,每個(gè)基因的得分將收斂于0,尤其是較低的p值將會(huì)給定一個(gè)零得分.
再者,對(duì)于擬合參數(shù)a和參數(shù)x有,證明了該得分函數(shù)結(jié)合了參數(shù)a和x.類(lèi)似于一個(gè)經(jīng)典假設(shè)檢驗(yàn),定義一個(gè)特定的顯著性水平即一個(gè)能把信號(hào)和噪聲分開(kāi)的閾值.混合模型允許估計(jì)錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,簡(jiǎn)稱(chēng)FDR)值的大小,估計(jì)出的閾值大小可以控制正得分的節(jié)點(diǎn)個(gè)數(shù).然后,可以推導(dǎo)出一個(gè)調(diào)整的似然比得分,點(diǎn)得分函數(shù)為
其中:x是基因表達(dá)數(shù)據(jù)的統(tǒng)計(jì)p值;a是均勻混合模型的形狀參數(shù)的最大似然估計(jì)值;τ是閾值,它控制著正得分節(jié)點(diǎn)的個(gè)數(shù),繼而決定著提取出的子網(wǎng)絡(luò)的大小.根據(jù)觀測(cè)數(shù)據(jù)求取的p值是信號(hào)和噪聲的混合.信號(hào)服從均勻分布,噪聲服從正態(tài)分布,p值分布可以表示為
因此,p值通過(guò)β-均勻混合(beta-uniform mixture model,簡(jiǎn)稱(chēng)BUM)模型可以很好地分離噪聲[1].
PPI網(wǎng)絡(luò)中相互作用的強(qiáng)度是不同的,并且兩個(gè)節(jié)點(diǎn)之間的相互作用有促進(jìn)和抑制之分.皮爾森相關(guān)系數(shù)符合相互作用的特點(diǎn),皮爾森相關(guān)系數(shù)值代表強(qiáng)度大小,正負(fù)代表作用的方向.節(jié)點(diǎn)的標(biāo)準(zhǔn)差可以反映兩節(jié)點(diǎn)之間的差異性.文中邊得分的大小代表相互作用強(qiáng)度值,正負(fù)代表促進(jìn)或抑制作用.定義邊得分函數(shù)為
其中:X、Y表示兩個(gè)節(jié)點(diǎn)基因;e代表網(wǎng)絡(luò)中的相互作用;cov(x,y)是變量X、Y的協(xié)方差;corr(X,Y)是基因X、Y表達(dá)值的皮爾森相關(guān)系數(shù);std(X)、std(Y)是基因表達(dá)值的標(biāo)準(zhǔn)差,體現(xiàn)基因的差異性.網(wǎng)絡(luò)G的得分定義為
此時(shí)T會(huì)受到網(wǎng)絡(luò)中邊的數(shù)據(jù)的影響.在子網(wǎng)絡(luò)對(duì)研究條件無(wú)響應(yīng)的前提下,網(wǎng)絡(luò)中的相互作用對(duì)之間是隨機(jī)相關(guān)的[7].可以認(rèn)為網(wǎng)絡(luò)的標(biāo)準(zhǔn)得分不會(huì)受到節(jié)點(diǎn)之間的連接結(jié)構(gòu)的影響.因此,定義網(wǎng)絡(luò)的邊得分函數(shù)為
其中:avgk是網(wǎng)絡(luò)中邊得分的平均值;stdk是邊得分的標(biāo)準(zhǔn)差.
基于點(diǎn)得分的網(wǎng)絡(luò)識(shí)別算法(Heinz)的理論模型屬于斯坦納樹(shù)問(wèn)題(Steiner-tree),主要是根據(jù)prize-collecting Steiner樹(shù)問(wèn)題和數(shù)學(xué)規(guī)劃法求解[1],該文是在一個(gè)有正負(fù)得分的網(wǎng)絡(luò)中尋找得分最大的相關(guān)子網(wǎng)絡(luò).
存在一個(gè)無(wú)向加權(quán)網(wǎng)絡(luò)G=(V,E,c,q),其中q表示頂點(diǎn)利潤(rùn),q:V→R≥0;c表示邊消費(fèi),c:E→R≥0.作者在網(wǎng)絡(luò)G中尋找最大加權(quán)子網(wǎng)T,即T=(VT,ET)∈G(VT?V,ET?E),并且網(wǎng)絡(luò)的總得分最大,即滿足公式,在網(wǎng)絡(luò)G中,w表示網(wǎng)絡(luò)的點(diǎn)權(quán)重,w′表示所有頂點(diǎn)中最小的權(quán)重值,并且令網(wǎng)絡(luò)中所有的邊權(quán)重都為w′.因此q(v)=W(v)-w′,c(e)=-w′.網(wǎng)絡(luò)T得分q(T)可以表示為
因?yàn)門(mén)是一棵樹(shù),所以網(wǎng)絡(luò)T得分為
算法詳細(xì)敘述參見(jiàn)R-BioNet程序包[10].
模擬退火算法是一種應(yīng)用非常廣泛的智能優(yōu)化算法[11].生物網(wǎng)絡(luò)的功能模塊化分析本質(zhì)上是一個(gè)大規(guī)模組合優(yōu)化問(wèn)題,而模擬退火是解決大規(guī)模組合優(yōu)化問(wèn)題的有效近似算法,并且具有跳出局部?jī)?yōu)化的優(yōu)點(diǎn).Guo等[7]通過(guò)把該算法運(yùn)用到人類(lèi)前列腺癌數(shù)據(jù)集和酵母菌細(xì)胞循環(huán)數(shù)據(jù)集,證明了它能夠有效地捕捉到網(wǎng)絡(luò)中的相互作用.因此可以采用該算法優(yōu)化網(wǎng)絡(luò).
選用Gene Expression Omnibus(GEO)數(shù)據(jù)庫(kù)的GSE5281數(shù)據(jù)集[12],其包含6個(gè)腦區(qū)共有161個(gè)樣本,分為對(duì)照樣本(CD)和患病樣本(AD).內(nèi)嗅皮層(EC)區(qū)有13個(gè)CD和10個(gè)AD;海馬 (HIP)區(qū)有13個(gè)CD和10個(gè)AD;中間顳回 (MTG)區(qū)有12個(gè)CD和16個(gè)AD;后扣帶回皮質(zhì) (PC)區(qū)有13個(gè)CD和9個(gè)AD;主要視覺(jué)皮層 (VCX)區(qū)有12個(gè)CD和19個(gè)AD;額上回(SFG)區(qū)有11個(gè)CD和23個(gè)AD.Human Protein Reference Database(HPRD)數(shù)據(jù)庫(kù)的人類(lèi)PPI數(shù)據(jù)[13]包含36 504個(gè)相互作用及9 386個(gè)節(jié)點(diǎn)基因.
根據(jù)觀測(cè)基因表達(dá)值求取的p值包含信號(hào)和噪聲.運(yùn)用貝葉斯方法和BUM模型對(duì)觀測(cè)p值進(jìn)行線性擬合分離信號(hào)和噪聲[14],提高差異分析和節(jié)點(diǎn)得分的準(zhǔn)確性.緊接著對(duì)基因表達(dá)數(shù)據(jù)進(jìn)行基因注釋和方差分析.以上操作為該文的數(shù)據(jù)預(yù)處理.
每個(gè)腦區(qū)進(jìn)行預(yù)處理后提取的基因分別與PPI網(wǎng)絡(luò)依據(jù)基因ID號(hào)進(jìn)行匹配,提取最大網(wǎng)絡(luò)并去除基因的自相互作用.經(jīng)預(yù)處理后每個(gè)腦區(qū)初步選出6 100~6 400個(gè)基因.圖1為SFG腦區(qū)BUM模型效果圖.
圖1a中,直方圖顯示了觀察p值在擬合模型(曲線)下與預(yù)期密度具良好的一致性,圖中橫線代表觀測(cè)數(shù)據(jù)的p值的噪聲在擬合模型下為均勻模型.圖1b中,在模型下觀測(cè)p值的分布與實(shí)際p值能夠良好地?cái)M合.
實(shí)驗(yàn)證明FDR越大,正得分基因的數(shù)目越多.基于高錯(cuò)誤發(fā)現(xiàn)率的廣泛擾動(dòng)使識(shí)別核心擾動(dòng)非常困難.為了得到6個(gè)腦區(qū)的正得分基因數(shù)目較小便于分析核心擾動(dòng),作者決定在不同大腦區(qū)域采用不同的FDR臨界值.經(jīng)過(guò)多次實(shí)踐,作者針對(duì)每個(gè)腦區(qū)最后選擇MTG、EC、HIP、PC、SFG、VCX分別對(duì)應(yīng)的FDR值為0.000 7、0.004、0.008、0.01、0.06、0.09,計(jì)算網(wǎng)絡(luò)中的節(jié)點(diǎn)得分和邊得分.運(yùn)用 Heinz算法提取出每個(gè)腦區(qū)的點(diǎn)權(quán)最大得分子網(wǎng).使用模擬退火算法優(yōu)化網(wǎng)絡(luò),設(shè)定閾值為0.8.實(shí)現(xiàn)向子網(wǎng)中添加強(qiáng)度超過(guò)設(shè)定閾值、去除強(qiáng)度小于閾值的相互作用,獲取最終的顯著擾動(dòng)子網(wǎng).
通過(guò)分析節(jié)點(diǎn)的p值和邊得分,每個(gè)腦區(qū)的顯著擾動(dòng)子網(wǎng)中節(jié)點(diǎn)的差異性很大,基因之間的相互作用很強(qiáng).并且每個(gè)腦區(qū)的擾動(dòng)子網(wǎng)之間存在著明顯的重疊.網(wǎng)絡(luò)中節(jié)點(diǎn)基因連通度的大小反映了該基因在網(wǎng)絡(luò)中的重要程度,選取前50個(gè)基因作為特征基因,共提取出206個(gè)特征基因.
為了證實(shí)提取的特征基因與AD的相關(guān)性,作者利用目前應(yīng)用較為廣泛的DAVID[15]在線工具對(duì)提取的206個(gè)顯著基因賦予Gene Ontology注釋?zhuān)⑦M(jìn)行功能分析和分類(lèi).其中,APP和GAPDH是已知與AD相關(guān)的基因;16個(gè)基因參與NF-κB信號(hào)通路;23個(gè)基因與線粒體功能障礙有關(guān),其中4個(gè)基因參與KEGG的AD信號(hào)通路;81個(gè)基因與神經(jīng)組織有關(guān);35個(gè)基因參與鈣離子作用過(guò)程;33個(gè)基因參與炎癥免疫反應(yīng);90個(gè)基因參與乙酰化過(guò)程.其中,線粒體功能紊亂會(huì)導(dǎo)致ATP合成降低,造成ATP損耗障礙,可誘發(fā)興奮性氨基酸增加,如谷氨酸、門(mén)冬氨酸等,它們對(duì)神經(jīng)元具有強(qiáng)烈的興奮和神經(jīng)毒性作用,最終導(dǎo)致神經(jīng)元死亡.
為進(jìn)一步驗(yàn)證特征基因與AD的相關(guān)性,作者通過(guò)對(duì)特征基因進(jìn)行KEGG傳導(dǎo)通路分析,總共有57個(gè)基因參與了與AD相關(guān)的重要信號(hào)通路,主要包括MAPK信號(hào)通路、Wnt信號(hào)通路、胰島素信號(hào)通路等.
TGF-β信號(hào)通路對(duì)mRNA-106b有直接調(diào)控作用.mRNA-106b表達(dá)降低可以使TGF-β表達(dá)升高.Dab2通過(guò)調(diào)節(jié)TGF-β1/SMADs信號(hào)通路,可以減少淀粉樣β蛋白沉積、減輕炎癥反應(yīng)和海馬神經(jīng)元的缺失,發(fā)揮了對(duì)阿爾茨海默病海馬神經(jīng)元的保護(hù)作用.所以Dab2基因有可能作為藥物研究的靶點(diǎn).
Wnt信號(hào)通路則可以直接作用于Fz受體,激活DVL和JUN激酶等.Fz受體會(huì)與三聚體G蛋白相互作用增加細(xì)胞內(nèi)的Ca2+濃度.因此Wnt信號(hào)通路與下文的鈣離子作用機(jī)制有密切的聯(lián)系.同時(shí),Wnt通路還可以通過(guò)DVL與NIC的直接作用拮抗Notch通路.Notch通路與NF-κB通路有密切的關(guān)系.Notch信號(hào)通路中的Notch受體能夠調(diào)節(jié)細(xì)胞的分化,并且已經(jīng)有研究發(fā)現(xiàn)Notch1可以在周?chē)窠?jīng)系統(tǒng)中誘導(dǎo)神經(jīng)膠質(zhì)細(xì)胞產(chǎn)生.
胰島素信號(hào)通路異常則與大腦氧化應(yīng)激反應(yīng)有關(guān),大腦長(zhǎng)時(shí)間處于缺氧狀態(tài)也會(huì)造成神經(jīng)元死亡.經(jīng)過(guò)分析以上幾種通路都參與了AD的發(fā)生和發(fā)展過(guò)程,與AD的發(fā)病都有密切關(guān)系.這也進(jìn)一步證實(shí),文中提取的特征基因與AD都有著密切的關(guān)系,可為生物學(xué)研究提供更有價(jià)值的信息.
AD的特征性病理主要為細(xì)胞外間隙的Aβ蛋白和細(xì)胞內(nèi)多聚tau蛋白的沉積.β淀粉樣蛋白的細(xì)胞外沉積與強(qiáng)烈的炎癥反應(yīng)密切相關(guān),分子生物學(xué)研究也普遍認(rèn)為神經(jīng)炎癥是AD發(fā)病的罪魁禍?zhǔn)祝?6].作者提取了大量與免疫和炎癥反應(yīng)密切相關(guān)的過(guò)表達(dá)基因,證實(shí)了AD的產(chǎn)生和發(fā)展與炎癥反應(yīng)密切相關(guān).為進(jìn)一步在網(wǎng)絡(luò)中分析所提取的特征基因,結(jié)合39個(gè)已知的AD相關(guān)基因,進(jìn)行功能分類(lèi)進(jìn)而構(gòu)建炎癥模塊子網(wǎng).圖2所示為該文算法提取的炎癥反應(yīng)相關(guān)基因構(gòu)建的炎癥功能模塊網(wǎng)絡(luò).
圖2中,菱形節(jié)點(diǎn)為已知與AD相關(guān)的基因,圓節(jié)點(diǎn)為提取的特征基因.基因之間的相互作用非常清晰,已知基因與特征基因之間共同調(diào)控著細(xì)胞的炎癥反應(yīng).特征基因自身的模塊性較好.圖2中可看出APP、MAPK1/3等基因在網(wǎng)絡(luò)中占據(jù)著重要的作用.CASP3/6/8以及APOE等基因都與APP存在直接相互作用.IKBKB基因與TNFRSF1A基因和CASP8基因存在直接相互作用關(guān)系,同時(shí)IKBKB還參與NF-κB傳導(dǎo)通路作用,CASP8和NF-κB與炎癥反應(yīng)密切相關(guān).APP基因的突變可使Aβ蛋白沉積增加,繼而引起繼發(fā)性的炎癥反應(yīng).Aβ蛋白沉積的增加能增加炎癥因子NF-κB蛋白的失常表達(dá)造成神經(jīng)細(xì)胞死亡.MAPK能被白細(xì)胞介素3(IL-3)等多種炎性因子激活,對(duì)炎癥的發(fā)生、發(fā)展起重要調(diào)控作用[17].MAPK激酶在AD體內(nèi)參與誘導(dǎo)tau蛋白的過(guò)度磷酸化,繼而導(dǎo)致AD發(fā)生.網(wǎng)絡(luò)中CASP3/8,MAPK1/3等基因與BCL-2有直接作用關(guān)系.
近年來(lái),鈣平衡失調(diào)作為AD重要致病因素的觀點(diǎn)已被許多學(xué)者認(rèn)同.鈣離子濃度的變化會(huì)促進(jìn)老年斑和神經(jīng)元纖維纏結(jié)的生成.作者提取大量與鈣離子代謝密切相關(guān)的顯著基因及傳導(dǎo)通路.利用這些提取的與鈣離子有關(guān)的基因構(gòu)建的鈣離子作用機(jī)制的模塊網(wǎng)絡(luò)如圖3所示.
由圖3可看出PRKCA、BCL-2等基因在網(wǎng)絡(luò)中占有重要的作用.文中所提取的鈣結(jié)合蛋白基因有S100A1、S100B、CALB1、鈣調(diào)蛋白基因CALM3、蛋白質(zhì)磷酸酶基因PPP3CA.S100B是腦內(nèi)特異蛋白[18],通過(guò)ATP2AZ基因與BCL-2基因相互作用.大腦受到損傷后,星型膠質(zhì)細(xì)胞增殖和異?;罨⑶裔尫糯罅康难装Y因子,促使大腦炎癥發(fā)生,同時(shí)導(dǎo)致大量的S100B蛋白的生成,高濃度的S100B蛋白對(duì)中樞神經(jīng)系統(tǒng)具有毒性作用,促使神經(jīng)細(xì)胞死亡,促進(jìn)炎癥的發(fā)生,因此鈣平衡失調(diào)與炎癥反應(yīng)存在密切的關(guān)系.
有研究表明,鈣離子機(jī)制也可通過(guò)其他途徑造成AD.早老素基因突變、線粒體功能紊亂等引發(fā)細(xì)胞內(nèi)鈣穩(wěn)態(tài)的紊亂,導(dǎo)致Ca2+濃度增加[17].Ca2+濃度上升會(huì)與鈣結(jié)合蛋白尤其是鈣調(diào)蛋白結(jié)合,激活CaMK2D編碼的CaMKII以及PRKCA編碼的PKC等蛋白激酶,造成蛋白激酶活性失衡.CaMKII表達(dá)增加會(huì)損傷突觸和神經(jīng)元,釋放出的CaMKII發(fā)生集聚并沉積,誘導(dǎo)或加速Aβ的形成,Aβ可誘發(fā)廣泛大腦炎癥反應(yīng)并且促使炎癥因子過(guò)表達(dá).PKC可以催化tau蛋白發(fā)生磷酸化,致使tau蛋白過(guò)度磷酸化.Ca2+通過(guò)鈣調(diào)蛋白等下游信號(hào)使過(guò)度磷酸化的tau蛋白形成雙螺旋纖維絲,進(jìn)而形成NFT.再者,Aβ可以改變神經(jīng)細(xì)胞和線粒體的離子通透性,造成神經(jīng)細(xì)胞內(nèi)Ca2+平衡的失調(diào),繼而形成惡性循環(huán),最終造成AD.
同一問(wèn)題的多源數(shù)據(jù)的分析是對(duì)基因的生物學(xué)信息的整合,較好地彌補(bǔ)了基因表達(dá)數(shù)據(jù)自身的不足.作者通過(guò)運(yùn)用Heinz算法結(jié)合AD 6個(gè)腦區(qū)基因數(shù)據(jù)和PPI數(shù)據(jù),提高了基因調(diào)控網(wǎng)絡(luò)預(yù)測(cè)和構(gòu)建的精度和準(zhǔn)確性.運(yùn)用邊權(quán)算法預(yù)測(cè)基因之間的強(qiáng)相互作用具有顯著效果,不僅能提取出已知與AD相關(guān)的基因APP和GAPDH,同時(shí),通過(guò)炎癥模塊子網(wǎng)和鈣離子模塊子網(wǎng)的構(gòu)建給出了AD顯著基因之間的相互作用關(guān)系,深入探索和分析了炎癥及鈣離子反應(yīng)等在AD發(fā)病機(jī)制中所起的重要作用,為AD致病機(jī)制的分子生物學(xué)實(shí)驗(yàn)和深入研究提供了有益的途徑和方向.
[1]Dittrich M T,Klau G W,Rosenwald A.Identifying functional modules in protein-protein interaction networks:an integrated exact approach[J].Bioinformatics,2008,24(13):223-231.
[2]Wei K,Cui D B,Mou X Y.Using network component analysis to dissect dynamic expression of gene and network structure in Alzheimer’s disease[J].ICBEB,2013,32(4):418-425.
[3]Cheng C,Shen K,Song C,et al.Ratio adjustment and calibration scheme for gene-wise normalization to enhance microarray inter-study prediction[J].Bioinformatics,2009,25(13):1655-1661.
[4]江麗華,李亦學(xué),劉琪.綜合Chip-chip數(shù)據(jù)、基因敲除數(shù)據(jù)和表達(dá)譜數(shù)據(jù)構(gòu)建基因調(diào)控網(wǎng)絡(luò)[J].生物化學(xué)與生物物理進(jìn)展,2010,37(9):996-1005.
[5]謝建明.基于表達(dá)數(shù)據(jù)和基因組信息分析基因調(diào)控的方法學(xué)研究[D].東南大學(xué)生物醫(yī)學(xué)工程學(xué)院,2009.
[6]Wang Y C,Chen B S.A network-based biomarker approach for molecular investigation and diagnosis of lung cancer[J].BMC Medical Genomics,2011,4(2):2-15.
[7]Guo Z,Li Y J.Edge-based scoring and searching method for identifying condition responsive protein-protein interaction sub-network[J].Bioinformatics,2009,25(12):2121-2128.
[8]Liang D,Han G,F(xiàn)eng X.Concerted perturbation observed in a Hub network in Alzheimer’s disease[J].PLoS ONE,2012,7(7):e40498.
[9]Pounds S,Morris S W.Estimating the occurrence of false positives and falsenegatives in microarray studies by approximating and partitioning the empirical distribution ofp-values[J].Bioinformatics,2003,19(10):1236-1242.
[10]Beisser D,Klau G W,Dandekar T.BioNet:an R-Package for the functional analysis of biological networks[J].Bioinformatics,2010,26(8):1129-1130.
[11]Ding D W,Wu P,Yang X H.Application of simulated annealing algorithm to biological network research[J].Computers and Applied Chemistry,2011,28(10):1032-1034.
[12]Keshava Prasad T S,Goel R,Kandasamy K.Human protein reference database—2009[J].Nucleic Acids Res,2009,37(Database issue):767-772.
[13]Gao X,Tang X C.The early sign of neurodegenerative disease:mitochondrial dysfunction[J].Chinese Bulletin of Life Sciences,2006,18(2):138-144.
[14]Smyth G K.Linear models and empirical bayes methods for assessing differential expression in microarray experiments[J].Statistical Applications in Genetics and Molecular Biology,2004,3(1):Article3.
[15]Huang D W,Sherman B T,Lempicki R A.Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources[J].Nature Protocols,2009,4(1):44-57.
[16]李麗喜,章素芳,張?chǎng)?阿爾茨海默病小鼠大腦和脊髓自噬變化的研究[J].上海交通大學(xué)學(xué)報(bào),2012,32(5):536-542.
[17]Mann D M,Pickering-Brown S M,Takeuchi A,et al.Amyloid angiopathy and variability in amyloid beta deposition is etermined by mutation position in presenilin-1-linked Alzheimer’s disease[J].Am J Pathol,2001,158(6):2165-2175.
[18]Loquai C,Müller-Brenne T,Grabbe S.Serum S100Blevels correlate with clinical benefit in a metastatic melanoma patient treated by CTLA-4blockade:a case report[J].Onkologie,2013,36 (10):578-581.