国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卟啉傳感器陣列系統(tǒng)的肺癌標(biāo)志物識(shí)別算法*

2017-04-12 11:08:37羅小剛張承丹侯長(zhǎng)軍霍丹群雷靳燦
傳感器與微系統(tǒng) 2017年4期
關(guān)鍵詞:敏感點(diǎn)標(biāo)志性差值

羅小剛, 張承丹, 侯長(zhǎng)軍, 霍丹群, 楊 眉, 雷靳燦

(重慶大學(xué) 生物工程學(xué)院,重慶 400030)

計(jì)算與測(cè)試

基于卟啉傳感器陣列系統(tǒng)的肺癌標(biāo)志物識(shí)別算法*

羅小剛, 張承丹, 侯長(zhǎng)軍, 霍丹群, 楊 眉, 雷靳燦

(重慶大學(xué) 生物工程學(xué)院,重慶 400030)

卟啉傳感器陣列系統(tǒng)可以檢測(cè)肺癌呼出氣體中特定的標(biāo)志性氣體,不同標(biāo)志性氣體檢測(cè)輸出的差值圖譜不一樣。介紹了一種結(jié)合反向傳播(BP)神經(jīng)網(wǎng)絡(luò)和主成分分析(PCA)的肺癌標(biāo)志性氣體種類識(shí)別算法,并將其應(yīng)用在卟啉傳感器陣列系統(tǒng)中。通過(guò)計(jì)算卟啉傳感器陣列中各點(diǎn)的主成分得分選出敏感點(diǎn),保留各氣體敏感點(diǎn)的值,并組成識(shí)別模板作為BP神經(jīng)網(wǎng)絡(luò)的輸入層,達(dá)到去除冗余數(shù)據(jù)的目的。通過(guò)實(shí)驗(yàn)對(duì)比聚類分析結(jié)果、未降維數(shù)據(jù)的BP神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果及已經(jīng)PCA降維后的數(shù)據(jù)作為輸入的BP神經(jīng)網(wǎng)絡(luò)識(shí)別結(jié)果,證明提出的算法可以更加精確地識(shí)別不同的肺癌標(biāo)志性氣體。

卟啉傳感器陣列; 肺癌呼出標(biāo)志物; 氣體識(shí)別; 神經(jīng)網(wǎng)絡(luò); 主成分得分

0 引 言

隨著空氣環(huán)境的不斷惡化,沙塵暴、霧霾天氣出現(xiàn)增多,肺癌已經(jīng)成為一種常見的癌癥疾病[1]。肺癌在早期階段被確診并積極進(jìn)行切除治療可以提高患者的生存機(jī)率,而目前臨床上缺乏無(wú)創(chuàng)、低成本、快速的肺癌檢測(cè)設(shè)備[2]。由卟啉及其衍生物等氣敏材料構(gòu)建的陣列傳感器可以實(shí)現(xiàn)氣體可視化檢測(cè),這種檢測(cè)技術(shù)在通過(guò)呼吸氣體篩查早期肺癌的研究中得到了成功的應(yīng)用[3]。

氣體傳感器陣列系統(tǒng)中的識(shí)別算法有:聚類分析、判別分析、主元分析(PCA)、人工神經(jīng)網(wǎng)絡(luò)等。其中,聚類分析[4,5]是卟啉傳感陣列系統(tǒng)中常用氣體種類識(shí)別算法。由于肺癌標(biāo)志性氣體與卟啉傳感器陣列之間的交叉性響應(yīng),輸出的差值圖譜數(shù)據(jù)維數(shù)較高,簡(jiǎn)單的數(shù)據(jù)分類方法并不能很好地識(shí)別不同肺癌標(biāo)志性氣體。需要設(shè)計(jì)一種較為精確、智能的標(biāo)志性氣體種類識(shí)別算法,以保證卟啉傳感陣列系統(tǒng)對(duì)肺癌標(biāo)志性氣體具有較高的識(shí)別率。

本文提出了一種結(jié)合PCA與BP神經(jīng)網(wǎng)絡(luò)的肺癌標(biāo)志性氣體種類識(shí)別算法。BP神經(jīng)網(wǎng)絡(luò)的分類精度高,對(duì)噪聲數(shù)據(jù)不敏感,但是過(guò)量冗余數(shù)據(jù)易造成神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)度,需要對(duì)其輸入數(shù)據(jù)進(jìn)行去冗處理。本文通過(guò)分別計(jì)算3種肺癌標(biāo)志性氣體多次平行實(shí)驗(yàn)中所有卟啉點(diǎn)的PCA得分并排序,挑選出得分為正的點(diǎn)作為敏感點(diǎn),只保留敏感點(diǎn)的特征值作為BP神經(jīng)網(wǎng)絡(luò)的輸入,而非敏感點(diǎn)的值作為冗余數(shù)據(jù)舍去。這樣不僅減輕了網(wǎng)絡(luò)的訓(xùn)練負(fù)擔(dān),而且提高了識(shí)別的精度。

1 算法原理

PCA設(shè)法將原來(lái)眾多具有一定相關(guān)性的指標(biāo)重新組合成一組新的互相無(wú)關(guān)的綜合指標(biāo),不僅在盡可能保留原有信息的基礎(chǔ)上代替原來(lái)的指標(biāo),且具有最大的方差[6]。PCA的數(shù)學(xué)模型

(1)

簡(jiǎn)寫為

Fi=a1iZX1+…+apiZXp,i=1,2,…,p

(2)

對(duì)于原始變量的單個(gè)元素來(lái)說(shuō),每個(gè)主成分得分由式(2)計(jì)算得到,反映了它的所有指標(biāo)與這個(gè)主成分的相關(guān)程度,得分越高則越相關(guān)。分值為正表示高于平均水平,分值為負(fù)表示低于平均水平。在所有主成分中,由于第一主成分保留的綜合信息最多,因此其得分最能體現(xiàn)單個(gè)元素在所有指標(biāo)中的貢獻(xiàn)。

差值圖譜的差值向量是進(jìn)行肺癌標(biāo)志性氣體種類識(shí)別的數(shù)據(jù)根據(jù)。從理論上說(shuō),只有敏感點(diǎn)的RGB差值是決定標(biāo)志性氣體種類的關(guān)鍵。只保留敏感點(diǎn)的RGB差值,差值向量的維度將會(huì)大幅度下降。在實(shí)驗(yàn)樣本的平行樣本中差值圖譜敏感點(diǎn)出現(xiàn)差異,很難直接通過(guò)觀察差值圖譜確定所有敏感點(diǎn)的位置。本文利用PCA方法,將每種氣體的特征向量數(shù)據(jù)混合起來(lái),以每個(gè)卟啉點(diǎn)在所有樣本中的RGB差值作為指標(biāo)進(jìn)行主成分提取,并計(jì)算第一主成分得分。以得分的高低來(lái)衡量每個(gè)卟啉點(diǎn)在每個(gè)樣本中的貢獻(xiàn)。由于敏感點(diǎn)的RGB值變化比其他點(diǎn)大,其主成分綜合得分往往較大。

PCA的步驟如下:1)計(jì)算協(xié)方差矩陣;2)求解協(xié)方差矩陣的方程,得到p個(gè)特征根;3)計(jì)算方差貢獻(xiàn)率,得到第一主成分;4)根據(jù)式(2)計(jì)算第一主成分得分;5)將得分按降序排列,選擇得分高的卟啉點(diǎn)作為敏感點(diǎn)。

2 實(shí) 驗(yàn)

2.1 實(shí)驗(yàn)裝置

卟啉傳感陣列系統(tǒng)的核心是6×6的傳感器陣列,該傳感陣列由實(shí)驗(yàn)篩選出的36種金屬卟啉或卟啉衍生物等氣敏材料構(gòu)成,金屬卟啉與不同肺癌標(biāo)志性氣體接觸時(shí)會(huì)產(chǎn)生不一樣的顏色變化[7],而與同一種肺癌標(biāo)志性氣體的產(chǎn)生的顏色變化相同。卟啉傳感陣列系統(tǒng)流程框圖如圖1所示。

圖1 氣體檢測(cè)系統(tǒng)框圖

系統(tǒng)上電后,肺癌標(biāo)志性氣體在氣泵的作用下傳送到反應(yīng)氣室內(nèi),氣體在反應(yīng)氣室中與卟啉傳感陣列接觸反應(yīng),打開LED燈,圖像傳感器采集反應(yīng)前后陣列圖像,同時(shí)溫濕度傳感器檢測(cè)反應(yīng)條件。圖像傳感器將采集的圖像上傳到PC中的上位機(jī)軟件中,經(jīng)過(guò)圖像處理后得到卟啉陣列單元與氣體接觸前后的顏色變化信息,生成差值圖譜。

一幅差值圖譜表示傳感陣列中各個(gè)卟啉單元與氣體反應(yīng)后的顏色變化信息,即36個(gè)陣列點(diǎn)的RGB分量的差值。

ΔRGB=ΔR1,ΔG1,ΔB1,…,ΔRi,ΔGi,ΔBi,…,ΔR36,

ΔG36,ΔB36

(3)

式中 ΔRGB為差值圖譜的數(shù)據(jù)向量,ΔRi,ΔGi,ΔBi分別為第i個(gè)卟啉點(diǎn)的紅色、綠色、藍(lán)色分量變化差值,i=1,2,…,36。

2.2 實(shí)驗(yàn)氣體

本文通過(guò)卟啉傳感陣列系統(tǒng)對(duì)3種呼出氣體中肺癌標(biāo)志性氣體[8.9]進(jìn)行檢測(cè),3種氣體分別為苯乙烯、乙二胺和對(duì)二甲苯,每種氣體進(jìn)行4次實(shí)驗(yàn)。圖2中 (a)~(d)為苯乙烯平行實(shí)驗(yàn)的差值圖譜,(c)~(h)為乙二胺平行實(shí)驗(yàn)的差值圖譜,(i)~(m)為對(duì)二甲苯平行實(shí)驗(yàn)的差值圖譜。

圖2 3種肺癌標(biāo)志性氣體差值圖譜

3 識(shí)別結(jié)果與討論

3.1 聚類分析

本次實(shí)驗(yàn)中,選擇3組肺癌標(biāo)志性氣體共12個(gè)樣本差值圖譜數(shù)據(jù)作為聚類分析的數(shù)據(jù)源,差值圖譜中的原始數(shù)據(jù)是每個(gè)卟啉單元的顏色變化值,由ΔR,ΔG,ΔB三個(gè)分量表示。本文利用式(4)計(jì)算得到每個(gè)陣列點(diǎn)的三個(gè)顏色分量的歐氏距離d,綜合陣列單元的顏色變化信息

(4)

差值圖譜原始數(shù)據(jù)經(jīng)過(guò)式(4)數(shù)據(jù)預(yù)處理后,組成一個(gè)12×36的向量,作為歐氏距離聚類的輸入。為了方便區(qū)分,對(duì)3種標(biāo)志性氣體的每個(gè)樣本進(jìn)行編號(hào),分別以氣體英文名稱的簡(jiǎn)寫和樣本序號(hào)的格式命名,比如苯乙烯的第一個(gè)樣本命名為Sty1,乙二胺的第一個(gè)樣本命名為Eth1,對(duì)二甲苯的第一個(gè)樣本命名為Par1。本文利用SPSSInc18.0軟件的系統(tǒng)聚類功能對(duì)12個(gè)樣本數(shù)據(jù)進(jìn)行歐氏距離聚類。

圖3 聚類分析結(jié)果

由聚類的結(jié)果可以看出:乙二胺的第一個(gè)樣本(Eth1)與苯乙烯歸為一類,對(duì)二甲苯的第二個(gè)樣本(Par2)與乙二胺歸為一類,只有苯乙烯的4個(gè)平行樣本正確歸為一類。聚類分析以樣本差值圖譜中各個(gè)顏色變量的距離進(jìn)行分類,對(duì)肺癌標(biāo)志性氣體的區(qū)分效果不是很理想。

3.2 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練與識(shí)別

BP神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的自組織、自適應(yīng)和分類計(jì)算功能,采用BP神經(jīng)網(wǎng)絡(luò)對(duì)肺癌標(biāo)志性氣體進(jìn)行識(shí)別,首先需要設(shè)定網(wǎng)絡(luò)結(jié)構(gòu)、隱含層節(jié)點(diǎn)數(shù)的選擇、激勵(lì)函數(shù)的選取、權(quán)值的優(yōu)化、網(wǎng)絡(luò)誤差等。本文設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)為36(即差值圖譜經(jīng)過(guò)預(yù)處理后的向量值),輸出節(jié)點(diǎn)數(shù)為1(即每種氣體的分類號(hào))。根據(jù)文獻(xiàn)[10]中所提的隱含層數(shù)經(jīng)驗(yàn)公式,選擇隱含層數(shù)為8。訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu)如圖4。

圖4 BP訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu)

本文選擇3種肺癌標(biāo)志性氣體的8個(gè)差值圖譜樣本,組成一個(gè)24×36的向量作為訓(xùn)練樣本。輸出為每種氣體的分類號(hào),苯乙烯為1,乙二胺為2,對(duì)二甲苯為3。以Matlab 2010為算法實(shí)現(xiàn)平臺(tái),對(duì)設(shè)計(jì)的網(wǎng)絡(luò)進(jìn)行訓(xùn)練識(shí)別。本次訓(xùn)練的學(xué)習(xí)率為0.01,訓(xùn)練誤差為0.000 04。在經(jīng)過(guò)6次迭代后BP神經(jīng)網(wǎng)絡(luò)達(dá)到訓(xùn)練誤差如圖5。

圖5 BP訓(xùn)練網(wǎng)絡(luò)訓(xùn)練性能曲線

采用設(shè)計(jì)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對(duì)圖2中所示的3種氣體的12個(gè)樣本進(jìn)行識(shí)別,識(shí)別結(jié)果如圖6所示。

圖6 BP網(wǎng)絡(luò)輸出結(jié)果

BP的識(shí)別結(jié)果可以看出,BP神經(jīng)網(wǎng)絡(luò)能區(qū)分12個(gè)肺癌標(biāo)志性氣體樣本的種類,但是苯乙烯的第二個(gè)樣本的識(shí)別差異最大。對(duì)比聚類分析的結(jié)果,BP神經(jīng)網(wǎng)絡(luò)識(shí)別優(yōu)于聚類分析對(duì)肺癌標(biāo)志性氣體的識(shí)別。

3.3 PCA計(jì)算主成分得分

本文根據(jù)前述的PCA步驟和式(2)計(jì)算得到每個(gè)卟啉點(diǎn)的第一主成分得分。首先對(duì)卟啉點(diǎn)進(jìn)行編號(hào),編號(hào)序列按照卟啉傳感器陣列排列,自左向右,自下向上分別為1~36號(hào)。苯乙烯乙二胺和對(duì)二甲苯根據(jù)同樣的步驟進(jìn)行處理。3種氣體的各卟啉點(diǎn)得分如圖7所示。

圖7 3種氣體的各卟啉點(diǎn)得分

卟啉點(diǎn)的得分越高,表示其對(duì)綜合信息(即在每個(gè)樣本中的顏色變化)的貢獻(xiàn)越大。

同樣選擇前述24個(gè)樣本作為BP網(wǎng)絡(luò)的訓(xùn)練向量,24個(gè)氣體樣本只保留表1所示相應(yīng)氣體的敏感點(diǎn)編號(hào)的RGB差值,以苯乙烯為例,BP網(wǎng)絡(luò)的訓(xùn)練向量的維度從24×36降為24×8。12個(gè)識(shí)別樣本的數(shù)據(jù)也按照氣體PCA降維后敏感點(diǎn)的RGB差值作為識(shí)別向量。識(shí)別結(jié)果圖8。

本文將PCA降維前后BP神經(jīng)網(wǎng)絡(luò)的識(shí)別結(jié)果與期望輸出的差值稱為識(shí)別誤差,它可以體現(xiàn)識(shí)別效果的好壞。輸出誤差越小,表示識(shí)別的準(zhǔn)確度越高,對(duì)肺癌標(biāo)志性氣體種類的誤識(shí)別可能性就會(huì)相應(yīng)減小。由表2可知,輸入數(shù)據(jù)未降維時(shí)BP網(wǎng)絡(luò)輸出的識(shí)別誤差平均值為0.073 99,最大誤差為0.165 0;降維后的BP網(wǎng)絡(luò)輸出的識(shí)別誤差是0.025 5,最大誤差為0.061 9。可見,利用PCA得分結(jié)合BP神經(jīng)網(wǎng)絡(luò)的氣體種類識(shí)別算法篩除了冗余數(shù)據(jù),提高了識(shí)別精度。

表1 3種氣體的敏感點(diǎn)模板

圖8 PCA數(shù)據(jù)降維后BP網(wǎng)絡(luò)輸出結(jié)果

表2 數(shù)據(jù)降維前后的BP網(wǎng)絡(luò)識(shí)別輸出與預(yù)期輸出對(duì)比

4 結(jié) 論

通過(guò)對(duì)本文的實(shí)驗(yàn)結(jié)果進(jìn)行分析, BP神經(jīng)網(wǎng)絡(luò)對(duì)肺癌標(biāo)志性氣體的識(shí)別效果優(yōu)于聚類分析,BP神經(jīng)網(wǎng)絡(luò)具有更高的準(zhǔn)確性。通過(guò)計(jì)算PCA得分選出敏感點(diǎn),只保留敏感點(diǎn)的RGB差值作為輸入,篩除了冗余數(shù)據(jù),降低了BP神經(jīng)網(wǎng)絡(luò)的計(jì)算量,從而降低了BP神經(jīng)網(wǎng)絡(luò)的識(shí)別誤差,提高了識(shí)別精度。對(duì)于卟啉傳感陣列系統(tǒng)對(duì)標(biāo)志性氣體的檢測(cè)結(jié)果,本文提出的算法,可以很好地區(qū)分不同肺癌標(biāo)志性氣體的種類。

[1] Dales R,Liu L,Wheeler A J,et al.Quality of indoor resi-dential air and health[J].Canadian Medical Association Journal,2008,179(2):147-52.

[2] 韓 瑤,王茂筠,梁宗安.呼出氣揮發(fā)性有機(jī)物檢測(cè)在肺癌診斷與治療中的研究與應(yīng)用[J].中國(guó)呼吸與危重監(jiān)護(hù)雜志,2015(2):222-224.

[3] Suslick B A,Feng L,Suslick K S.Discrimination of complex mixtures by a colorimetric sensor array:Coffee aromas[J].Analytical Chemistry,2010,82(5):2067-2073.

[4] Liang F,Christopher J M,Jonathan W K,et al.Colorimetric sensor array for determination and identification of toxic industrial chemicals[J].Anal Chem,2010,82(22):9433-9440.

[5] Sung H L,Liang F,Jonathan W K,et al.An optoelectronic nose for detection of toxic gases[J].Nat Chem,2009,13(1):562-567.

[6] Shirsat M D,Sarkar T,Kakoullis J,et al.Porphyrin functiona-lized single-walled carbon nanotube chemiresistive sensor arrays for VOCs[J].Journal of Physical Chemistry:C,2012,116(5):3845-3850.

[7] Herve Abdi,Lynne J Williams.Principal component analysis[J].Wiley Interdisciplinary Reviews:Computational Statistics,2010,4(2):433-459.

[8] Phillips M,Gleeson K,Hughes J M B,et al.Volatile organic compounds in breath as markers of lung cancer:A cross sectional study[J].Lancet,1999,353(9168):1930-1933.

[9] Michael P,Nasser A,Austin J H M,et al.Prediction of lung can-cer using volatile biomarkers in breath[J].Cancer Biomarkers,2007,3(2):95-109.

[10] 沈花玉,王兆霞,高成耀,等.BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的確定[J].天津理工大學(xué)學(xué)報(bào),2008,24(5):13-15.

Recognition algorithm for lung cancer markers based on porphyrin sensor array system*

LUO Xiao-gang, ZHANG Cheng-dan, HOU Chang-jun, HUO Dan-qun, YANG Mei, LEI Jin-can

(School of Bioengineering,Chongqing University,Chongqing 400030,China)

Porphyrin sensor array system can detect lung cancer specific markers in exhaled gases,output vary from marker to marker.A pattern recognition algorithm based on backpropagation(BP)neural network and principal component analysis(PCA)is proposed and is applied in porphrin chemical sensor array integrated system.The sensitive points is selected by calculating principal component scores in porphyrin sensor array,and reserve value of each gas sensitive points,and template of recognition is formed as the input layer of the BP neural network to achieve the goal of removing redundant data.Comparing with the result of clustering analysis and BP neural network identification without reducing dimension and data after reducing dimension as input,the result of the proposed algorithm can identify precisely for lung cancer specific markers.

porphyrin sensor array; exhaled lung cancer markers; gas recognition; neural network; principal component scores

10.13873/J.1000—9787(2017)04—0134—04

2016—04—21

國(guó)家科技支撐計(jì)劃資助項(xiàng)目(2012BAI19B03);國(guó)家自然科學(xué)基金資助項(xiàng)目(81271930,81171414);中國(guó)博士后科學(xué)基金面上資助項(xiàng)目(2015M582522);重慶市博士后科研項(xiàng)目特別資助項(xiàng)目(Xm2015051);重慶大學(xué)大型儀器設(shè)備開放基金資助項(xiàng)目

TP 212

B

1000—9787(2017)04—0134—04

羅小剛(1974-),男,副教授,碩士生導(dǎo)師,主要從事生物醫(yī)學(xué)傳感器、生物醫(yī)學(xué)儀器方面的研究工作。

猜你喜歡
敏感點(diǎn)標(biāo)志性差值
差值法巧求剛體轉(zhuǎn)動(dòng)慣量
“熊出沒(méi),注意”的由來(lái)
NURBS插補(bǔ)中相鄰敏感點(diǎn)區(qū)域速度軌跡規(guī)劃研究
屠呦呦入圍“20世紀(jì)最具標(biāo)志性人物”
-等度連續(xù)點(diǎn)及-敏感點(diǎn)
枳殼及其炮制品色差值與化學(xué)成分的相關(guān)性
中成藥(2017年6期)2017-06-13 07:30:35
伊朗遭“標(biāo)志性攻擊”震動(dòng)中東
奧運(yùn)舉辦城市及其標(biāo)志性建筑
一種基于加速不平衡功率快速估算的切機(jī)敏感點(diǎn)搜尋方法研究
地鐵冷卻塔消聲處理項(xiàng)目在實(shí)施過(guò)程中的若干問(wèn)題研究
启东市| 巴林右旗| 合肥市| 襄垣县| 梁河县| 定陶县| 顺昌县| 黔西县| 左贡县| 满洲里市| 绥江县| 温宿县| 新野县| 云阳县| 洛浦县| 朝阳县| 柳河县| 齐齐哈尔市| 广南县| 礼泉县| 夏邑县| 长春市| 莎车县| 宜阳县| 方正县| 桑日县| 唐河县| 南和县| 镇远县| 肥城市| 乐清市| 镇原县| 阳信县| 滦南县| 城口县| 平乡县| 江都市| 始兴县| 黔西县| 左贡县| 平乐县|