周 進, 婁小平,2, 張文昌,2, 劉 鋒,2
(1.北京信息科技大學 光電測試技術北京市重點實驗室,北京 100192;2.北京信息科技大學 光電信息與儀器北京市工程研究中心,北京 100192)
?
流式細胞儀脈沖補償恢復算法研究
周 進1, 婁小平1,2, 張文昌1,2, 劉 鋒1,2
(1.北京信息科技大學 光電測試技術北京市重點實驗室,北京 100192;2.北京信息科技大學 光電信息與儀器北京市工程研究中心,北京 100192)
流式細胞儀數(shù)據(jù)采集過程中,觸發(fā)閾值的設定導致脈沖信號信息完整性的缺失,從而造成后續(xù)脈沖參數(shù)提取誤差增大;針對以上問題,根據(jù)流式細胞儀脈沖信號類高斯特性,利用MATLAB分別采用斜線法、高斯擬合法、拋物線法以及灰色預測法對閾值以下的脈沖缺失信息進行補償恢復;同時,分別對4種方法補償恢復后的脈沖進行脈沖峰值、脈寬、脈沖面積3個參數(shù)的提取,并進行誤差比對;仿真結(jié)果表明,觸發(fā)閾值的設定主要對脈寬及脈沖面積產(chǎn)生影響;灰色預測法的脈沖補償恢復誤差最小,可用于流式細胞儀底層在線脈沖補償恢復。
流式細胞儀;信號預測;高斯脈沖;脈沖補償
流式細胞儀是融合流體動力學、激光技術、電子工程、計算機技術和單克隆抗體染色技術為一體的新型高科技儀器。利用單一或多路激光,照射形成的單細胞流中的細胞,通過采集激發(fā)出來的熒光信息或(和)散射光信號進行參數(shù)提取和分析,進而對細胞(人體)的健康狀態(tài)進行診斷。在細胞生物學、細胞周期動力學、免疫學、血液學及腫瘤學等領域具有廣泛的應用。細胞中激發(fā)出來的熒光通過光電轉(zhuǎn)換、模擬放大、模數(shù)轉(zhuǎn)換,最終成為數(shù)字信號。數(shù)據(jù)采集過程中脈沖信號參數(shù)提取準確性將直接影響整機檢測精度[1-4]。
數(shù)據(jù)采集過程中,為了去除一些雜散噪聲而設定一個觸發(fā)閾值,觸發(fā)閾值不為零導致脈沖信號閾值以下的信息缺失,目前國內(nèi)外主要用矩形補償?shù)姆椒▽θ笔У男畔⑦M行恢復,矩形補償?shù)膶挾葹殚撝蹬c脈沖信號的相交長度,高度為閾值的大小。然而用此矩形對脈沖信號進行補償只是對缺失信息進行大致恢復,信號恢復精度較低,影響參數(shù)提取中的脈沖面積和脈沖寬度等參數(shù),進而造成流式細胞儀變異系數(shù)(coefficient of variable, CV)增大[5-10]。
本文借助MATLAB仿真工具,利用疊加了隨機噪聲的高斯信號模擬實際流式細胞儀采集到的數(shù)字信號,分別使用斜線法、高斯擬合法、拋物線法以及灰色預測法對閾值以下的脈沖信號進行補償恢復,之后對補償恢復后的脈沖信號進行參數(shù)提取并進行誤差對比分析。
經(jīng)熒光染料標記的細胞在激光的照射下激發(fā)出特征熒光及散射光,對特定光信號進行測量并對表征細胞特征的脈沖參數(shù)進行提取,最終根據(jù)脈沖參數(shù)進行統(tǒng)計學分析及健康狀態(tài)診斷。其中,數(shù)據(jù)采集過程主要是接收前向散射光(forward scatter, FS)、側(cè)向散射光(side scatter, SS)及各路熒光信號(fluorescence, FLn),通過光電轉(zhuǎn)換形成電脈沖信號,并對表征細胞特征的脈沖參數(shù)(峰值、寬度及面積)進行快速提取[4]。
由于光電轉(zhuǎn)換之后的電脈沖信號帶有所檢測光脈沖信號的特征,故通過提取電脈沖信號中的參數(shù)(主要有脈沖峰值、脈沖面積和脈沖寬度)即可得到表征細胞脈沖的狀態(tài)信息。電信號參數(shù)提取的準確性及實時性將直接影響到儀器的性能指標以及醫(yī)療上進行診斷的準確性。脈沖信號及相應參數(shù)定義如圖1所示。
圖1 脈沖參數(shù)示意圖
圖1中的閾值實際中用作ADC的觸發(fā)電壓,當采集到的脈沖信號電壓超過閾值時,ADC開始進行模/數(shù)轉(zhuǎn)換。設定閾值既可以減小由于模數(shù)轉(zhuǎn)換芯片工作在邊界轉(zhuǎn)換狀態(tài)下引入較大的轉(zhuǎn)換誤差,也可以避免由細胞碎片及其它雜散噪聲等引起的微小脈沖干擾,但同時也會導致信號信息的缺失,使得對脈沖面積及脈沖寬度的提取出現(xiàn)偏差。閾值設定對脈沖參數(shù)提取的影響如圖2所示。
圖2 閾值對脈沖參數(shù)提取的影響
在圖2中,當不進行脈沖補償恢復時,采集到的信號只有閾值之上的數(shù)據(jù),此時,只能通過利用A2表示脈沖面積,L1表征脈沖寬度。
傳統(tǒng)的矩形脈沖恢復方法直接利用L1為寬,Th為高的矩形做補償。補償后,A2+A3表示脈沖面積、L1表示脈沖寬度。從圖中可以看出,矩形恢復算法相較于不進行脈沖恢復,可以將脈沖面積進行部分恢復,但無法對A1及A4進行恢復,若閾值設置較高則對面積的提取存在比較大的缺失。此外,矩形恢復算法使脈沖寬度L2得不到補償。
在流式細胞儀中,熒光和散射光在激光照射下,其產(chǎn)生的脈沖信號具有類高斯特性,故采用疊加了隨機噪聲的高斯信號對其進行表征。
閾值之上的數(shù)據(jù)可以用序列y表示:
(1)
式(1)中,x為表示熒光分布的高斯脈沖序列,r為疊加的隨機噪聲序列,y={y(1),y(2),…,y(n)}。
結(jié)合現(xiàn)在普遍使用且處理方式較為簡單的方法,對比了以下幾種補償方式:斜線法、高斯擬合法、拋物線法以及灰色預測法。其中,前3種方法均使用最小二乘法進行曲線擬合并完成預測,灰色預測方法則利用已知的數(shù)據(jù)構(gòu)建模型對序列進行逐個預測,并通過預測值不斷更新模型。上述方法均采用局部預測模型。
(2)
(3)
f=A0+A1x+A2x2
(4)
(5)
其中,公式(2)為斜線法(取m=1)和拋物線法(取m=2)的模型,公式(3)為高斯擬合法的模型。
通過對公式(3)兩邊取對數(shù)運算,得到等式(4),則將高斯擬合法構(gòu)建成為曲線擬合模型。最終3種方法均可通過求解得到類似公式(5)的一個矩陣,求得相應系數(shù),從而得到預測曲線[5-8]。
取序列(1)中y的兩端N項序列作為灰色預測模型的原始數(shù)據(jù)(以臨近右端閾值的N個序列作為恢復模型為例)Y0:
(6)
對Y0進行一次累加,生成序列G0:
(7)
根據(jù)序列(7)的緊鄰均值生成序列S0:
(8)
建立所需的一階微分方程
(9)
將微分方程(9)用矩陣表示:
(10)
(11)
(12)
通過求解白化微分方程(12),得到灰色微分式(9)的解為:
(13)
(14)
在處理過程中,斜線法、高斯擬合法和拋物線法都是利用閾值之下的數(shù)據(jù)具有變化趨勢平緩、向兩邊逐漸變?nèi)踮呌诹愕奶攸c,依照最小二乘法擬合出相應的變化曲線,最終利用曲線進行閾值之下的曲線恢復,得到所需的脈沖補償參數(shù)。
上述3種方法在進行脈沖補償?shù)倪^程中,利用閾值邊界兩端的數(shù)據(jù)進行處理。在處理過程中,如果選取較大的閾值,則閾值之下兩端數(shù)據(jù)變化較大,使得通過邊界兩端的數(shù)據(jù)進行預測導致較大的誤差;而如果選取較小的閾值,則采集了較多的接近零的數(shù)據(jù),這部分的數(shù)值在利用模數(shù)轉(zhuǎn)換時,接近模數(shù)轉(zhuǎn)換器的轉(zhuǎn)換極限,且閾值選取過小會使得一些雜散噪聲進入到轉(zhuǎn)換中,轉(zhuǎn)換之后的數(shù)值也會有較大的誤差。在實際應用中,由于采集到的細胞所攜帶的信息量不同,所體現(xiàn)出來的熒光強度不同,所以固定一個閾值會使得對不同的信號而言有過大或過小的可能,而動態(tài)調(diào)節(jié)在快速處理中,實時性要求極高,目前還不利于實現(xiàn)動態(tài)調(diào)節(jié)閾值。因此在細胞變動大的情況下,會使得閾值選取不恰當,這3種方法都不能提供較強的抗擾動能力。
為了提高抗擾動能力,選用灰色預測的方法。通過對閾值邊界以上的前N個值進行計算,預測出下一個點的值,最后利用這N+1個數(shù)據(jù),舍棄掉第一個數(shù)據(jù),組成一個新的N個數(shù)據(jù)組,通過這新的N個數(shù)據(jù),再進行下一個數(shù)的預測,依次預測出閾值以下的數(shù)據(jù)。最后利用預測出來的數(shù)進行更加精準的參數(shù)計算。
利用灰色預測算法的優(yōu)點是抗擾動能力強,計算較為簡便,準確度高;缺點是計算量相對復雜,消耗時間相對較多。
基于以上理論,利用MATLAB搭建仿真系統(tǒng)。
對高斯脈沖信號疊加隨機噪聲,并對最終的脈沖信號進行S-G濾波處理。對處理過后的脈沖信號進行閾值截斷。利用上述方法,分別對該脈沖閾值以下的數(shù)據(jù)進行恢復處理,并計算3個參數(shù):峰值(P)、脈寬(L)和面積(S)。3個參數(shù)的計算方法一致,分別采取如下的計算方式得到參數(shù)值:
假定擬合之后的高斯脈沖序列為y(i),其中i=1,2,3,…,n。
(15)
L=k2-k1+1
(16)
(17)
式(15)~(17)中,max表示取到最大值點的序列號,P表示所求峰值;L表示所求脈寬,其中k1,k2分別表示在取定有效高斯脈沖的情況下,脈沖左右兩端的序列值;S表示所求面積,在高頻采樣情況下,用分段直角梯形累加和來表示該段的積分面積是可行的。
利用上述3個參數(shù)的計算方法,分別對用不同恢復方法所得參數(shù)進行計算,得到表1所示的數(shù)據(jù)。
表中各行所對應的值為該種方法與真值(取P=1.89V,L=3.00μs,S=139.00)的差值,Th為設定的閾值大小。
通過分析表1中數(shù)據(jù),可以得出:
(1)進行補償能夠大大減少計算脈寬和面積帶來的誤差,而在這些補償方法中,矩形補償所帶來的準確性最小,灰色預測法穩(wěn)定性高,能達到很理想的補償效果。
(2)除灰色預測方法外,其他方法受閾值設定的影響因素都很大。
(3)這些補償方法中,閾值選取合適,對于這幾種方法能夠都能夠提高恢復信號的準確性。因此,在實際檢測過程中,為進一步滿足在線測量時的時效性,選取適當?shù)拈撝?,通過對比表1中第一組和第四組可知,利用斜線法替換矩形補償也能達到接近灰色預測的準確性效果。在考慮準確性和時效性兩方面選用斜線法能得到較大的平衡。
本文針對流式細胞儀信號參數(shù)提取研究了補償算法,利用仿真實驗進行了理論驗證,通過對比實驗,驗證了信號恢復的必要性以及提高信號恢復準確性的方法。通過該實驗,得出了利用灰色預測方法可以顯著提高參數(shù)準確性的結(jié)論,并且在充分考慮快速檢測的基礎上,利用斜線法也能達到優(yōu)于矩形補償?shù)脑诰€優(yōu)化效果。依靠灰色預測方法,提高參數(shù)提取的準確性,為醫(yī)學上利用完整數(shù)據(jù)離線分析、進行二次確診提供更加有力的診斷依據(jù)。通過本次實驗,可以驗證所提補償方法的有效性。本文設計的恢復方法也將進一步運用于硬件設計,優(yōu)化硬件電路的參數(shù)提取算法。
表1 仿真方法結(jié)果誤差比對表
[1]OrmerodMG.Investigatingtherelationshipbetweenthecellcycleandapoptosisusingflowcytometry[J].J.Immunol.Methods,2002,265:73-80.
[2]SincockSA,RobinsonJP.Flowcytometricanalysisofmicroorganisms[J].MethodsCellBiol.,2001,64:511-537.
[3] 趙書濤,武曉東,王 策,等. 流式細胞儀的原理、應用及最新進展[J]. 現(xiàn)代生物醫(yī)學進展,2011,22:4378-4381.
[4] 王 輝,高 穎.應用流式細胞儀的常見問題及解決對策[J].現(xiàn)代儀器,2012(1):64-65.
[5] 陳良波,鄭亞青. 基于最小二乘法的曲線擬合研究[J].無錫職業(yè)技術學院學報,2012(5):52-55.
[6] 肖無云,魏義祥,艾憲蕓.多道脈沖幅度分析中的數(shù)字基線估計方法[J].核電子學與探測技術,2005(6):35-38.
[7] 張繼龍,甄蜀春,曹 鵬,等. 實驗數(shù)據(jù)的曲線擬合方法及其應用[J].測試技術學報,2003(3):255-257.
[8] 陳 光,任志良,孫海柱.最小二乘曲線擬合及Matlab實現(xiàn)[J]. 兵工自動化,2005(3):107-108.
[9] 曾 波,劉思峰,方志耕,等.灰色組合預測模型及其應用[J]. 中國管理科學,2009(5):150-155.
[10] 王中宇,孟 浩,付繼華.表面綜合形貌誤差的灰色分離方法[J].儀器儀表學報,2008,29(9):1810-1815.
Study of Multiple Algorithms about Pulse Compensation
Zhou Jin1, Lou Xiaoping1,2, Zhang Wenchang1,2, Liu Feng1,2
(1.Beijing Key Laboratory of Optoelectronic Measurement Technology, Beijing information Science and Technology University, Beijing 100192,China; 2.Beijing Engineering Research Center for optoelectronic information and instrument,Beijing Information Science and Technology University,Beijing 100192,China)
In flow cytometer (FCM) researching field, pulse parameters (width, peak, area, etc.) extraction plays important role for particle information post-processing. According to principle of the flow cytometer, special circuit is designed to collect the pulses, and the threshold is used to trigger effective signal catching and parameters calculating. The measurement accuracy is affected by the information missing below system threshold. In order to improve system performance, pulse predicting algorithms are introduced in this paper. Three parameters by recovering are extracted and compared with the parameters of the signal obtained before the restoration.
FCM; signal predicting; Gaussian pulse; pulse compensation
2015-10-03;
2015-10-29。
北京市屬高等學校創(chuàng)新團隊建設與教師職業(yè)發(fā)展計劃項目(IDHT20130518);長江學者和創(chuàng)新團隊發(fā)展計劃資助(IRT1212); 北京市教委科研計劃項目(KM201511232006)。
周 進(1990-),男,江西新余人,碩士研究生,主要從事生物醫(yī)療檢測技術及儀器方向的研究。
1671-4598(2016)03-0244-04
10.16526/j.cnki.11-4762/tp.2016.03.067
TP274
A