楊瑋婕, 徐建瑜
(寧波大學 信息科學與工程學院,浙江 寧波 315211)
?
基于改進型AdaBoost網絡模型的斑馬魚胚胎血管識別
楊瑋婕, 徐建瑜
(寧波大學 信息科學與工程學院,浙江 寧波 315211)
基于圖像特征與改進型AdaBoost網絡模型,對斑馬魚節(jié)間血管的識別進行了研究。對3組斑馬魚胚胎熒光圖像訓練集的節(jié)間血管進行正負樣本選取,使用Haar-like特征圖提取圖像特征,通過AdaBoost網絡模型對所提取的特征訓練形成級聯(lián)分類器,根據(jù)識別效果,調整改進網絡的系數(shù)得到改進型級聯(lián)分類器,最終實現(xiàn)了節(jié)間血管的精確識別和統(tǒng)計。實驗結果表明:對于節(jié)間血管提取的準確率和識全率分別達到了93.8 %和91.1 %,說明該算法檢測準確率高,對不同組別圖像均有穩(wěn)定的檢測效果。
節(jié)間血管識別; 斑馬魚; AdaBoost; 特征提取
對于藥物試驗效果的判斷,常依據(jù)斑馬魚胚胎發(fā)育完好的節(jié)間血管根數(shù)[1]。在如今批量化的實驗需求之下,自動化分析斑馬魚實驗圖像成為研究熱點之一[2]。因此,通過圖像特征自動提取并計算出斑馬魚節(jié)間血管根數(shù),具有很重要的實用意義。
現(xiàn)有的圖像目標提取算法很多,其中成熟運用的研究有以下幾種:1)基于平均間距提取肌間骨算法[3],通過設定圖像中目標的平均間距和目標間隔參數(shù),提取圖像目標,算法的執(zhí)行效率高;2)方向梯度直方圖結合主成分分析(principal component analysis,PCA)組成的聯(lián)探測器檢測圖像中的血紅細胞[4],可以有效地將圖像中識別目標與類似識別目標的其余前景物體分開;3)基于“支持向量機(support vector machine,SVM)+Gabor小波”人臉檢測系統(tǒng),算法先降維去除重復信息,用人臉與濾波器卷積提取特征,具有較高的識別率[5]。上述方法由于提取目標目的和圖像限制的原因,僅適用于單個或者少量目標的提取,而對于斑馬魚節(jié)間血管的提取,一幅圖片中提取目標數(shù)量較多,要求不僅能準確地提取目標,還要盡可能地將所有目標都提取出來。
本文通過結合Haar-like特征提取和改進型AdaBoost算法,提取熒光斑馬魚胚胎圖像中的節(jié)間血管,選取了不同實驗條件下獲取的圖像作為測試集,以識別的準確率和目標的識全率作為判斷算法性能的依據(jù)。
基于Haar-like特征圖提取特征結合改進型AdaBoost神經網絡的目標血管識別算法,流程如圖1。
首先,針對斑馬魚胚胎熒光圖像序列進行隨機篩選,選出訓練樣本和測試樣本;接著根據(jù)節(jié)間血管進行正、負樣本選??;然后使用Haar-like特征圖提取樣本特征,再通過改進型AdaBoost神經網絡對所提取的特征訓練形成級聯(lián)分類器;之后使用分類器對測試圖像實現(xiàn)目標識別,并根據(jù)識別結果判斷分類器分類效果是否滿意,若不滿意,則調整AdaBoost的改進系數(shù)k直至識別效果達到滿意;最后自動統(tǒng)計識別出的節(jié)間血管數(shù)量。
2.1 Haar-like特征圖[6~8]
使用如圖2所示矩形特征圖描述斑馬魚胚胎熒光圖像特征,其中Haar-like矩形特征的特征值根據(jù)白色矩形像素和與黑色矩形像素和之差得到[9]。
圖2 矩形特征圖
2.2 使用特征圖計算像素值
圖像黑色像素計算方法如下:1)計算圖像的積分圖,其中圖像每一點的像素值用i(x,y)表示,每一個像素點的像素值用I(x,y)表示,通過式(1)可計算得到I(x,y)
(1)
對圖像的行和列進行循環(huán)累加計算可以得出待檢測圖像的積分圖值。2)使用積分圖計算Haar特征值,由式(2),式(3)對行和列累加
s(x,y)=s(x,y-1)+i(x,y)
(2)
I(x,y)=I(x,y-1)+s(x,y)
(3)
式(2)中的域s(x,y)為列積分,點(x,y)的值不包含在s(x,y)中,待檢測圖像初始條件為s(x,-1)=0,I(-1,y)=0。
通常,從樣本中提取的Haar-like特征的規(guī)模巨大,因此,使用Haar-like樣本特征檢測節(jié)間血管的主要問題是使用有效特征學習分類功能。選擇一種機器學習方法通過不斷訓練,根據(jù)特征的作用進行權重賦值,可以解決上述問題。
AdaBoost分類算法可以整合弱分類器BP神經網絡的分類結果,并根據(jù)結果賦予不同權重實現(xiàn)更好的分類效果。具有最主要的有2個優(yōu)勢:1)訓練的錯誤率上界,隨著迭代次數(shù)的增加,會逐漸下降;2)即使訓練次數(shù)再多,也不會出現(xiàn)過擬合的問題。AdaBoost算法原理的過程可以由圖3表示。
圖3 AdaBoost工作原理
傳統(tǒng)的AdaBoost方法[10~12]每輪迭代均會對權值進行調整,增加分類正確的分類器權值,減小錯誤分類的權值[13],但這種更新規(guī)則對一些不常見樣本,訓練時會分配比較大的權重而產生過配現(xiàn)象[14]。根據(jù)AdaBoost算法的原理,對權值更新規(guī)則以及弱分類器的加權參數(shù)進行了改進:首先在每一輪的訓練過程中定義一個閾值0,同時依據(jù)樣本是否錯分和當前狀態(tài)的權值是否大于0來更新樣本的權值,從而極大程度地避免過配現(xiàn)象。最后根據(jù)式(4)、式(5)進行優(yōu)化改進[15]
(4)
(5)
式中 r為所有被正確識別的弱分類器樣本權重之和;ker為r的增函數(shù);εt為第t次迭代的錯誤率。通過不斷調整k的值改變弱分類器權重比例,從而更好地訓練特征分類器。
本文使用OpenCV庫對基于改進AdaBoost方法進行實驗,并對結果分析研究?;诟倪M型AdaBoost的斑馬魚節(jié)間血管提取過程分為2個步驟:1)樣本的訓練;2)對加載的分類器進行檢測?;玖鞒倘鐖D4所示。
圖4 測試圖像節(jié)間血管的分類流程
5.1 實驗數(shù)據(jù)采集
實驗所使用的斑馬魚胚胎圖像由杭州環(huán)特生物科技有限公司提供。共對3組斑馬魚圖像進行了測試,分別為對照組、溶劑組以及陽性藥物組。每組分別有100張圖像,共計300張,不同處理組別斑馬魚胚胎圖如圖5所示。在每組圖像中隨機取出80張用于截取正、負樣本訓練分類器,余下20張用于目標識別算法測試。
節(jié)間血管與非血管部分識別過程為,截取圖中完整的血管部分作為正樣本,同時截取圖片其余部分作為負樣本,正、負樣本圖片大小盡量保持相近。在實驗過程中共截取了460組正樣本和1 360組負樣本,圖6為部分正、負樣本截取結果示例。研究過程中,為減少數(shù)據(jù)量并保證輸入圖像的細節(jié)信息,將正、負樣本圖像統(tǒng)一通過插值計算轉換為20×50的圖像。
圖5 3種不同處理組別斑馬魚圖像
圖6 正、負樣本截取結果
5.2 算法測試
通過Haar-like特征圖提取數(shù)據(jù)集給定的20像素×50像素樣本,得到圖像正、負樣本特征的總數(shù)量為392 019。
經過特征提取后,使用AdaBoost特征分類器對特征進行訓練,得出一個由不同權重弱分類器組合得到的強分類器。使用分類器分別對3組實驗組,每組20幅圖像,共60幅斑馬魚胚胎熒光圖像加載檢測,圖7為3個組別中隨機一組的檢測結果。
圖7 斑馬魚胚胎圖像節(jié)間血管提取結果
為了更好地判斷提取結果,定義了以下2種比率:
1)準確率,被標定的血管中真正的節(jié)間血管數(shù)量與算法認為血管總數(shù)量之比;
2)識全率,被標定的血管中真正的節(jié)間血管數(shù)量與圖中斑馬魚節(jié)間本身的血管總數(shù)的比例。
實驗自動計數(shù)結果分別為24,20和5,與識別結果一致。實驗中發(fā)現(xiàn),根據(jù)改進算法調節(jié)參數(shù)值時,會出現(xiàn)檢測的準確率和識全率無法同時得到滿足的情況,所以,為了保證算法的穩(wěn)健性和魯棒性,往往要均衡考慮兩方面的效果而進行各自的舍棄,得到兩個方面均較為理想的結果。
5.3 識別效果對比分析
本文通過對比文獻[3]提出的方向梯度直方圖特征描述結合級聯(lián)探測器,以及文獻[16]提出的基于小波和PCA特征融合分類檢測算法,對同樣的測試圖像序列進行節(jié)間血管的提取計數(shù)。3種算法處理結果如表1。
表1 本文算法與其他算法對比 %
通過表1可以得出:本文算法在2種判斷算法的指標均表現(xiàn)優(yōu)異,達到了兩者兼顧的效果。但是由于實驗圖像數(shù)量的原因,訓練特征不足,3種算法均未能達到極高的準確率以及識全率。實際應用中,一次實驗往往可得到上千甚至上萬的實驗結果圖像,因此,本文的算法具有極強的應用意義,原因如下:1)隨著圖像數(shù)量的增多,可提取的特征隨之增多,則識別準確性必然會提高;2)由于數(shù)量龐大,對于每幅圖的識別準確性要求不會非??量?,只需能達到不同組別之間的定性分析,從而判斷藥物對斑馬魚胚胎的影響即可。
提出了一種基于Haar-like特征檢測和改進型AdaBoost分類器提取斑馬魚胚胎熒光圖像的節(jié)間血管算法。針對圖像提取目標,將目標部分認定為正樣本,其余部分劃分為負樣本,選擇以像素級特征提取方案,即Haar-like特征圖算法提取圖像特征,使用改進型AdaBoost分類算法調節(jié)參數(shù)閾值對批量檢測圖片進行加載檢測,并對提取的目標即節(jié)間血管進行計數(shù)。實驗結果表明:算法識別精度高,且識全率也得到了足夠的保證,有很強的應用價值。但算法本身仍有待深入改進的空間,例如,本文只針對同一方向拍攝的斑馬魚圖像,若圖像方向不確定時效果是否仍然良好,或者如果圖中出現(xiàn)多條魚時,算法是否依然有效,針對這些問題,今后將做更進一步的研究工作。
[1] 趙 洋,顏妙虹,白殊同,等.過山楓有效成分南蛇藤素和扁蒴藤素對斑馬魚節(jié)間血管生成的抑制作用研究[J].中藥新藥與臨床藥理,2013,24(6):537-540.
[2] 彭蘊茹,韋英杰,等.基于斑馬魚模型的藥物毒性研究進展與中藥毒性研究新策略[J].中草藥,2017,48 (1):17-30.
[3] 費曉行.斑馬魚肌間骨的自動提取[D].南京:南京理工大學,2009.
[4] Zhang Z,Ong L L S,Fang K,et al.Image classification of unlabeled malaria parasites in red blood cells[C]∥2016 IEEE 38th Annual International Conference of the Engineering in Medicine and Biology Society,IEEE,2016:3981-3984.
[5] 葉 超.基于Gabor小波和SVM的人臉識別算法研究[D].太原:中北大學,2014.
[6] Papageorgiou C P,Oren M,Poggio T.A general framework for object detection[C]∥1998 Sixth International Conference on IEEE Computer Vision,1998:555-562.
[7] Lienhart R,Maydt J.An extended set of Haar-like features for rapid object detection[C]∥ 2002 Proceedings of International Conference on Image Processing,IEEE,2002:1.
[8] Liao S,Jain A K,Li S Z.A fast and accurate unconstrained face detector[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2016,38(2):211-223.
[9] Zheng L,He X,Samali B,et al.An algorithm for accuracy enhancement of license plate recognition[J].Journal of Computer & System Sciences,2013,79(2):245-255.
[10] 嚴 玥,嚴 實,楊永斌,等.Adaboost集成BP神經網絡在火電廠SO2濃度檢測中的應用[J].傳感器與微系統(tǒng),2016,35(9):148-151.
[11] Kong K K,Hong K S.Design of coupled strong classifiers in AdaBoost framework and its application to pedestrian detection [J].Pattern Recognition Letters,2015,68:63-69.
[12] 徐 前,趙德安,趙建波.基于改進的AdaBoost算法的人臉檢測與定位[J].傳感器與微系統(tǒng),2010,29(1):94-97.
[13] 糜元根,陳丹馳,季 鵬.基于幾何特征與新Haar特征的人臉檢測算法[J].傳感器與微系統(tǒng),2017,36(2):154-157.
[14] 劉曉芳,夏哲雷,王孝衛(wèi).AdaBoost人臉檢測算法的改進[J].電視技術,2014,38(15):213-216.
[15] 王 毅,王創(chuàng)新,盧 進,等.基于HSV模型和改進AdaBoost算法的車牌檢測[J].電子科技,2015,28(2):107-111.
[16] 葉 超,姚竹亭.基于小波變換的人臉識別方法[J].電子世界,2014(4):201-202.
徐建瑜,女,通訊作者,碩士,副教授,碩士生導師,主要從事圖像處理方面的研究工作,E—mail:xujianyu@nbu.edu.cn。
Recognition of blood vessels in image of zebrafish embryo based on improved AdaBoost network model
YANG Wei-jie, XU Jian-yu
(College of Information Science and Engineering,Ningbo University,Ningbo 315211,China)
Based on image feature and improved AdaBoost network model,recognition of zebrafish interstitial blood vessels of is studied.Positive and negative samples are selected from training set of three zebrafish embryo fluorescence image groups,and Haar-like feature maps are used to extract features.According to the recognition effect,adjust the coefficient of the improved network to obtain the improved cascade classifier.Accurate identification and statistics of the interstitial blood vessels are obtained.Experimental results show that the accuracy and efficiency of interstitial blood vessels extraction are 93.8 % and 91.1 % respectively,which indicates that the algorithm has high detection accuracy rate and has stable detection effect on different image groups.
interstitial blood vessels recognition; zebrafish; improved AdaBoost; feature extraction
10.13873/J.1000—9787(2017)08—0141—04
2017—06—27
TP 391.41
A
1000—9787(2017)08—0141—04
楊瑋婕(1993 -),女,碩士研究生,主要研究方向為生物圖像處理,E—mail:yangwejie416@163.com。