李佳 陳亮
摘 要:從神經(jīng)元幾何形態(tài)特征的角度考慮,對(duì)神經(jīng)元進(jìn)行分類(lèi)。由于神經(jīng)元的幾何形態(tài)復(fù)雜多樣,直接用于分類(lèi)會(huì)使得算法運(yùn)行時(shí)間長(zhǎng)、分類(lèi)精度低。采用稀疏主成分分析法提取神經(jīng)元的主要特征,不僅能實(shí)現(xiàn)幾何特征的降維,減小分類(lèi)難度,而且提取出的主成分部分載荷為0,使得主成分更具解釋能力。依據(jù)主要特征,采用極限學(xué)習(xí)機(jī)算法對(duì)神經(jīng)元進(jìn)行分類(lèi)。實(shí)驗(yàn)結(jié)果表明,該分類(lèi)模型具有較高的運(yùn)行效率和分類(lèi)精度,能夠?qū)ι窠?jīng)元實(shí)現(xiàn)有效分類(lèi)。
關(guān)鍵詞:神經(jīng)元;幾何形態(tài)特征;稀疏主成分分析;極限學(xué)習(xí)機(jī)
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.15913/j.cnki.kjycx.2017.03.013
神經(jīng)元,又被稱(chēng)為神經(jīng)原或神經(jīng)細(xì)胞,是構(gòu)成神經(jīng)系統(tǒng)結(jié)構(gòu)和功能的基本單位。神經(jīng)元形態(tài)和功能多種多樣,但在結(jié)構(gòu)上大致可以分成細(xì)胞體和突起兩部分。突起又分軸突和樹(shù)突。神經(jīng)元有接受、整合和傳遞信息的功能。一般就長(zhǎng)軸突神經(jīng)元而言,樹(shù)突和胞體接受從其他神經(jīng)元傳來(lái)的信息,并進(jìn)行整合,
然后通過(guò)軸突將信息傳遞給另一些神經(jīng)元或效應(yīng)器。大腦是生物體內(nèi)結(jié)構(gòu)和功能最復(fù)雜的組織,其中包含上千億個(gè)神經(jīng)元,了解人腦對(duì)于當(dāng)前的科學(xué)研究來(lái)說(shuō)是一項(xiàng)巨大的挑戰(zhàn)。傳統(tǒng)的細(xì)胞生物學(xué)相關(guān)的實(shí)驗(yàn)室研究對(duì)于解決人腦對(duì)復(fù)雜信息的獲取、處理、加工和高級(jí)認(rèn)知功能的機(jī)制非常有限。人類(lèi)腦計(jì)劃(Human Brain Project,HBP)致力于開(kāi)發(fā)現(xiàn)代化的信息工具,為全世界的神經(jīng)信息學(xué)數(shù)據(jù)庫(kù)建立共同的標(biāo)準(zhǔn),加速人類(lèi)對(duì)大腦的認(rèn)識(shí)。
作為大腦構(gòu)造的基本單位,神經(jīng)元的結(jié)構(gòu)和功能包含很多因素,其中,神經(jīng)元的幾何形態(tài)特征和電學(xué)物理特性是兩個(gè)重要方面。電學(xué)特性包含神經(jīng)元不同的電位發(fā)放模式;幾何形態(tài)特征主要包含接受信息的樹(shù)突、處理信息的胞體和傳出信息的軸突三部分。鑒于樹(shù)突、軸突的生長(zhǎng)變化,神經(jīng)元的幾何形態(tài)千變?nèi)f化。電學(xué)特性和空間形態(tài)等多個(gè)因素一起綜合體現(xiàn)了神經(jīng)元的信息傳遞功能。要想加深對(duì)大腦的研究,應(yīng)先認(rèn)識(shí)神經(jīng)元的特性,實(shí)現(xiàn)神經(jīng)元的分類(lèi)。
神經(jīng)元的分類(lèi)有多種方法,常以神經(jīng)元突起的數(shù)目、功能和所釋放的遞質(zhì)進(jìn)行分類(lèi)。根據(jù)神經(jīng)元突起的數(shù)目可以分為假單極神經(jīng)元、雙極神經(jīng)元和多極神經(jīng)元;根據(jù)神經(jīng)元的功能,
可將其分為感覺(jué)神經(jīng)元、運(yùn)動(dòng)神經(jīng)元和中間神元;按照釋放的遞質(zhì)的不同,可將其分為膽堿能神經(jīng)元、胺能神經(jīng)元、氨基酸能神經(jīng)元和肽能神經(jīng)元。
本文基于神經(jīng)元的幾何形態(tài),利用神經(jīng)元的空間幾何特征,通過(guò)稀疏主成分分析和極限學(xué)習(xí)機(jī)建立神經(jīng)元的分類(lèi)模型,提出神經(jīng)元的一個(gè)空間形態(tài)分類(lèi)方法,并將神經(jīng)元根據(jù)幾何形態(tài)進(jìn)行了較為準(zhǔn)確的分類(lèi)。
1 稀疏主成分分析
神經(jīng)元的形態(tài)復(fù)雜多變,大量的參數(shù)從不同的角度刻畫(huà)了
神經(jīng)元的形態(tài)特征。此外,在實(shí)際研究中,對(duì)象的特征不會(huì)直
觀顯示出來(lái),而需要從中提取。為了全面表示對(duì)象,在特征提取的過(guò)程中,可能盡量選擇比較多的特征變量,以防對(duì)象特征的丟失。這就容易出現(xiàn)2種情況:①為了避免遺漏重要信息而選擇盡可能多的特征;②隨著特征的增多增加了問(wèn)題的復(fù)雜性,同時(shí),造成信息的大量重疊。鑒于此,需要合理處理并提取數(shù)據(jù),在盡可能代替原始變量的所有信息的同時(shí),還要求減少處理后的變量數(shù)。
主成分分析是一種廣泛應(yīng)用于工程學(xué)、生物學(xué)和社會(huì)科學(xué)等領(lǐng)域的數(shù)據(jù)處理與統(tǒng)計(jì)降維的方法,它可以將原來(lái)變量重新組合成一組新的互相無(wú)關(guān)的幾個(gè)綜合變量。然而,主成分分析存在一些不足之處,由于每一個(gè)主成分都是其他原始變量的線(xiàn)性組合,也就是說(shuō)主成分依賴(lài)于所有原始變量,因此,很多時(shí)候主成分難以作出解釋。用主成分分析處理某些實(shí)際問(wèn)題時(shí),往往只能給出數(shù)據(jù)的統(tǒng)計(jì)、解釋?zhuān)茈y給出對(duì)應(yīng)的實(shí)際意義的解釋。
Zou.H提出了一種新的方法——稀疏主成分分析。該方法將主成分的求解問(wèn)題轉(zhuǎn)化為L(zhǎng)ASSO(Least absolute shrinkage and selection operator)回歸問(wèn)題,因此,稀疏主成分的求解就有效轉(zhuǎn)化為線(xiàn)性模型的變量選擇問(wèn)題。在此基礎(chǔ)上,引入彈性網(wǎng)(E-lasticNet)懲罰結(jié)構(gòu),提出了稀疏主成分分析方法。其計(jì)算步驟如下。
3 實(shí)驗(yàn)與分析
本文使用的神經(jīng)元數(shù)據(jù)來(lái)自于Neuronmorpho.Org網(wǎng)站。根據(jù)神經(jīng)元的特征描述,選取神經(jīng)元的胞體表面積、干的數(shù)目、分叉的數(shù)目等20個(gè)空間幾何特征量,采用稀疏主成分分析法對(duì)數(shù)據(jù)進(jìn)行降維處理,研究神經(jīng)元的分類(lèi)。
表1為神經(jīng)元的20個(gè)幾何特征參數(shù)的含義及計(jì)算方法。
選取7類(lèi)神經(jīng)元的空間幾何數(shù)據(jù)記為數(shù)據(jù)集D,共選取98個(gè)樣本進(jìn)行實(shí)驗(yàn)。其中,70個(gè)樣本為訓(xùn)練集Dtr,28個(gè)樣本為測(cè)試集Dte,用于訓(xùn)練ELM網(wǎng)絡(luò)。具體實(shí)驗(yàn)步驟如下:①數(shù)據(jù)預(yù)處理,對(duì)數(shù)據(jù)集D進(jìn)行標(biāo)準(zhǔn)化處理;②利用稀疏主成分分析對(duì)數(shù)據(jù)進(jìn)行降維,提取主要特征;③ELM訓(xùn)練,給定訓(xùn)練樣本集的特征向量xi和類(lèi)別標(biāo)簽ti,設(shè)置隱層結(jié)點(diǎn)的個(gè)數(shù)N0,ELM隨機(jī)產(chǎn)生輸入權(quán)值wi和偏值bi,求解輸出權(quán)值;④ELM測(cè)試,輸入未知樣本的特征向量,利用ELM訓(xùn)練時(shí)求解得到的輸出權(quán)值矩陣β構(gòu)建分類(lèi)模型。
表2給出了稀疏主成分的分析結(jié)果,前4個(gè)稀疏主成分的累計(jì)貢獻(xiàn)率超過(guò)70%,因此,神經(jīng)元的20個(gè)形態(tài)特征可以用4個(gè)主成分來(lái)表示。從幾何形態(tài)的意義上分析,4個(gè)主成分表征了神經(jīng)元的4個(gè)方面,即:①第一主成分SPC1反映了胞體的表面積、寬度、高度、深度、長(zhǎng)度、表面積和體積7個(gè)特征,表征了神經(jīng)元的空間形態(tài)的幾何輪廓信息;②第二主成分SPC2反映了分叉數(shù)目、分支數(shù)目、分支級(jí)數(shù)、破碎程度、非對(duì)稱(chēng)分化5個(gè)特征,表征了神經(jīng)元空間形態(tài)的分支分叉的相關(guān)信息;③第三主成分SPC3反映了干的數(shù)目、直徑、羅爾比率、局部分叉角和遠(yuǎn)端分叉角5個(gè)特征,表征了神經(jīng)元空間形態(tài)的房室和分叉角度的相關(guān)信息;④第四主成分SPC4反映了歐式距離、路徑距離、壓縮比3個(gè)特征,表征了神經(jīng)元空間形態(tài)的伸縮性。
為了驗(yàn)證提出的神經(jīng)元形態(tài)分類(lèi)方法的有效性,對(duì)比極限學(xué)習(xí)機(jī)、支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)的性能,結(jié)果如表3所示。其中,支持向量機(jī)采用libsvm工具箱,BP神經(jīng)網(wǎng)絡(luò)采用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱。由表3可知,極限學(xué)習(xí)機(jī)的分類(lèi)精度與支持向量機(jī)有微小的差距,但是,訓(xùn)練速度遠(yuǎn)快于支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)。支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)耗時(shí)比較長(zhǎng),如果訓(xùn)練樣本較大,則二者的訓(xùn)練會(huì)非常緩慢;極限學(xué)習(xí)機(jī)只要給定合適的隱層結(jié)點(diǎn)數(shù)目,就能獲得良好的分類(lèi)性能,并一次求得全局最優(yōu)解,泛化性能好于BP神經(jīng)網(wǎng)絡(luò)。
4 結(jié)論
從神經(jīng)元的空間幾何形態(tài)出發(fā),利用稀疏主成分分析法對(duì)神經(jīng)元的幾何特征進(jìn)行降維,通過(guò)原變量的少數(shù)幾個(gè)線(xiàn)性組合來(lái)解釋原變量的絕大多數(shù)信息,大大減少了分析時(shí)變量的維數(shù),增強(qiáng)了主成分的可解釋性,為后續(xù)分類(lèi)奠定了良好的基礎(chǔ)。在稀疏主成分分析的基礎(chǔ)上,采用ELM算法對(duì)神經(jīng)元分類(lèi),實(shí)驗(yàn)結(jié)果表明,ELM算法的分類(lèi)精度比較高,相比于支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度更快,能夠?qū)ι窠?jīng)元進(jìn)行有效分類(lèi)。
參考文獻(xiàn)
[1]Shepherd G M,Mirsky J S,Healy M D,et al.The Human Brain Project:neuroinformatics tools for integrating,searching and modeling multidisciplinary neuroscience data.Trends in Neurosciences,1998,21(11):460.
[2]Jiang R,Liu Q,Liu Q,et al.A proposal for the morphological classification and nomenclature of neurons. Neural Regeneration Research,2011,6(25):1925-1930.
[3]Wang T,Liao D.Neuronal morphology classification based on SVM.International Conference on Computer Science and Service System.IEEE,2011:3344-3347.
[4]尚小晶,劉小梅,李成鳳,等.神經(jīng)元的幾何形態(tài)分類(lèi)[J].吉林大學(xué)學(xué)報(bào)(信息科學(xué)版),2011,29(3):237-244.