黃安貽,吳 帥,胡舜迪,聞路紅,陳安琪,繆東升
(1.武漢理工大學 機電工程學院,湖北 武漢 430070; 2.寧波大學 高等技術(shù)研究院,浙江 寧波 315211)
極體是卵母細胞減數(shù)分裂形成的一個小細胞[1]。在卵胞漿內(nèi)單精子顯微注射[2]、核移植[3]、植入前遺傳學診斷[4]等顯微注射應用技術(shù)中,末端效應器與卵母細胞接觸前需要將極體調(diào)整到合適位置,以提高實驗成功率[5]。隨著自動化顯微注射系統(tǒng)的逐漸發(fā)展,自動識別極體、快速實現(xiàn)極體定向已經(jīng)成為目前自動化顯微注射中的迫切需求和研究熱點。由于在倒置顯微鏡下細胞次級結(jié)構(gòu)不明顯、尺寸較小并且圖像中常存在噪聲等原因,增加了極體識別的難度,因此國內(nèi)外科研人員展開了積極研究[6]?;谔荻燃訖?quán)Hough變換的極體檢測方法完成了卵母細胞及其極體的檢測和定位,但檢出率較低,檢測時間長[7,8]。采用Otsu算法分割細胞圖像并結(jié)合橢圓擬合方法,能識別部分極體,但該方法忽略了細胞形變,難以應對極體不明顯情形[9]。將支持向量機、卷積神經(jīng)網(wǎng)絡等機器學習方法引入極體識別中,一定程度上提升了對極體不明顯情形的識別準確率,但該類算法需要大量數(shù)據(jù)樣本進行模型訓練,通用性與實時性受到了限制[10,11]。
針對現(xiàn)有方法難以有效解決極體不明顯時準確識別的問題,本文提出了基于角點檢測和自適應圓形掩膜的深凹點搜索方法。根據(jù)極體與卵母細胞尺寸差異大,在粘連位置形成明顯凹點的圖像原理,快速搜索卵母細胞與極體粘連形成的深凹點區(qū)域,提高極體不明顯情形下識別準確率的同時,保障極體識別實時處理的需求。
卵母細胞圖像獲取時易受到設(shè)備精度、光照不均勻、培養(yǎng)液雜質(zhì)等因素的影響,通常存在噪聲干擾、邊緣模糊的缺陷。傳統(tǒng)的邊緣檢測方法檢測的邊緣信息豐富,難以將噪聲和細胞邊緣較好區(qū)分開。因此,結(jié)合Otsu算法[12]和數(shù)學形態(tài)學操作[13]進行輪廓提取,利用Otsu算法自適應確定最佳分割閾值的優(yōu)勢,分割細胞與背景圖像,同時形態(tài)學操作能夠處理分割圖像中通常存在的細小輪廓分支、斑點噪聲以及輪廓不閉合等缺陷,有效提取細胞輪廓。
首先利用Otsu算法,自適應選取閾值進行圖像分割,獲得細胞二值圖像;然后通過閉操作、孔洞填充、開操作等數(shù)學形態(tài)學方法對Otsu閾值分割圖像進行處理,解決分割圖像中存在的缺陷;最后通過提取最大連通域來獲得細胞邊緣輪廓。輪廓提取流程如圖1所示。
圖1 輪廓提取流程
輪廓提取具體過程描述如下:
(1)Otsu閾值分割:以類間方差最大化為目標選取最優(yōu)分割閾值[12],將原始圖像劃分為背景部分和細胞部分兩類,獲取細胞二值圖像;
(2)閉操作:由于閾值分割圖像中有時存在細胞邊緣輪廓斷裂的情形,先對閾值分割圖像進行膨脹操作,連接斷裂邊緣,再進行腐蝕操作,以保持細胞邊緣輪廓精度,最終獲得具有連續(xù)邊緣輪廓的細胞圖像;
(3)孔洞填充:細胞內(nèi)部結(jié)構(gòu)比較復雜,對閉操作過后的圖像進行迭代膨脹,填充細胞區(qū)域,消除細胞輪廓內(nèi)部的噪聲干擾,同時確保后續(xù)進行開操作時不會完全腐蝕邊緣輪廓;
(4)開操作:細胞邊緣輪廓往往存在細小分支和毛刺,對孔洞填充后的圖像先進行腐蝕操作,消除細小輪廓分支和斑點噪聲,再進行膨脹操作,以保持細胞邊緣輪廓精度,獲得具有平滑邊緣的細胞輪廓圖像;
(5)提取最大連通域:提取形態(tài)學處理后圖像中的最大連通區(qū)域,剔除其余噪聲干擾,得到細胞邊緣輪廓。
輪廓提取效果如圖2所示,其中圖2(a)中較大的細胞為卵母細胞,而卵母細胞輪廓上的較小細胞即極體。
圖2 輪廓提取效果
選取合適的特征對提升檢測速度和準確率至關(guān)重要。通過觀察發(fā)現(xiàn),由于極體與卵母細胞尺寸差異較大,即使在極體不明顯情形下,在粘連位置也存在明顯的深凹點區(qū)域,因此尋找并定位目標深凹點,可以成為識別極體的有力判據(jù)。由于極體位置在顯微視野中是隨機出現(xiàn),因此在實際應用中顯微圖像內(nèi)的極體可見區(qū)域與方位都會呈現(xiàn)不同狀態(tài)。如圖3所示,是顯微圖像中極體明顯、極體不完全可見和極體較小3種不同實際情形的示例圖。極體明顯情形指的是極體在圖像中明顯可見,如圖3(a)所示;通常極體與卵母細胞重合度較高時,會導致極體大部分區(qū)域不在圖像平面內(nèi),使得極體不完全可見,如圖3(b)所示。此外,極體過小會導致圖像中極體區(qū)域太小,使得極體不明顯,如圖3(c)所示。本文將圖3(b)和圖3(c)兩類情形統(tǒng)一歸為極體不明顯情形。
圖3 極體不同情形示例
凹點檢測的主要流程為:首先通過角點檢測算法對輪廓上潛在凹點進行粗略估計,預選出一組候選點集合,其中包含了細胞輪廓本身角點和極體與卵母細胞粘連形成的凹點;然后利用圓形掩膜和凹凸特征參數(shù)對符合條件的候選點進行篩選,從候選點集合中剔除非凹點和淺凹點,只保留深凹點;最后根據(jù)深凹點的數(shù)目判斷極體是否存在,根據(jù)深凹點的位置實現(xiàn)極體定位與定向。
候選角點檢測是在輪廓提取后的二值圖像上進行的,目的是從輪廓像素點中初步篩選出潛在的凹點。研究學者提出了很多有效的角點檢測方法,其中Shi-Tomasi算法[14]是基于Harris角點檢測算法[15]的一種改進方法,能較好保留強角點,對噪聲不敏感,快速且穩(wěn)定?;谝陨蟽?yōu)勢,本文采用Shi-Tomasi算法獲取一組候選點集合U,作為凹點檢測的初步檢測結(jié)果。該算法基于局部矩形窗口γ在各個方向微小移動前后的平均強度變化不同來檢測角點。由于Shi-Tomasi 算法檢測到的角點有時不在輪廓上而是位于輪廓附近,本文采用輪廓上與其距離最近的像素點確定為候選點。
本節(jié)檢測到的候選點集合U中包含兩類像素點:細胞輪廓本身角點和極體與卵母細胞粘連形成的凹點,其中細胞輪廓本身角點中包又含有凸點和凹點。在兩類候選角點中,細胞輪廓本身的凹點和凸點屬于不明顯的角點,邊緣輪廓模糊或噪聲干擾都可能導致提取的細胞輪廓中出現(xiàn)較小的凹凸起伏,候選點檢測成功地檢測了這些角點;而極體與卵母細胞由于大小差異明顯,粘連處形成的凹點具有轉(zhuǎn)折明顯、凹點尖銳的特點,屬于明顯的深凹點[16]。考慮到噪聲干擾、細胞輪廓起伏等因素對角點檢測帶來的影響,確保候選點集合中包含極體與卵母細胞形成的深凹點,候選點數(shù)目設(shè)定為10。
從候選點集合中,準確區(qū)分輪廓本身角點(凸點與淺凹點)和深凹點,篩選出卵母細胞與極體形成的深凹點,是本文極體識別過程的關(guān)鍵所在。雖然研究人員對凹點檢測有著積極的探索,但大多數(shù)方法只能判別目標點的凹凸性,難以有效區(qū)分深凹點和淺凹點[17]。利用圓形掩膜方法[18]能夠有效檢測粘連細胞形成的凹點區(qū)域,因此本文設(shè)計了一種基于圓形掩膜的深凹點檢測方法,并對掩膜半徑自適應選取和閾值設(shè)計進行了研究,通過該方法獲取候選點的凹凸特征參數(shù)描述候選點的凹凸特性,篩選出滿足約束條件的深凹點,從而獲得極體識別結(jié)果。
基于圓形掩膜進行深凹點檢測,首先需要以輪廓上的像素點為中心構(gòu)建圓形掩膜,然后計算掩膜在細胞區(qū)域和背景區(qū)域的面積差異,進而判斷像素點的凹凸特性。如圖4所示是基于圓形掩膜進行深凹點檢測的示意圖,以Shi-Tomasi算法檢測到的候選點Qi為中心,像素長度R為半徑,構(gòu)建圓形掩膜,掩膜內(nèi)屬于背景圖像的面積記為S0(即圖中陰影區(qū)域面積),掩膜內(nèi)屬于細胞圖像的面積記為S1。從圖4中可見,S0和S1的差異一定程度上反映了候選點的凹凸特性。對于輪廓上的深凹點(如圖4中的Q1和Q2),其S0值較小,S1值較大,S0和S1的差異較大,而對于輪廓上本身角點(圖中Q1和Q2以外的其它候選點),S0和S1的差異變得很小,并且S0大于S1時可判斷為凸點,S0小于S1時可判斷為凹點。由于本文極體識別的關(guān)鍵是判別輪廓本身角點與深凹點,因此對輪廓本身的淺凹點和凸點不做嚴格區(qū)分。
圖4 基于圓形掩膜的深凹點檢測
實際應用中,通過統(tǒng)計陰影區(qū)域的像素點數(shù)目,獲取陰影區(qū)域面積S0,關(guān)于S0的求和函數(shù)表示為
(1)
其中,C表示圓形掩膜區(qū)域, (x,y) 表示圖像坐標系中像素點坐標,在掩膜與背景圖像交集內(nèi)f(x,y) 為1,在掩膜與細胞圖像交集內(nèi)f(x,y) 為0。
由于圓形掩膜區(qū)域的面積為πR2,所以S1可表示為
(2)
為了描述輪廓上像素點的凹凸特性,本文通過面積比定義了凹凸特征參數(shù)η,表示為
η=S1/S0
(3)
對于R確定的圓形掩膜,η值越接近于1,表示S0和S1的面積差異越小,Qi是輪廓本身角點的概率越大;η值越大,表示S0越小,S1越大,Qi的輪廓上深凹點的概率越大。
遍歷集合U中的候選點,若候選點Qi對應的凹凸特征參數(shù)滿足式(4)的約束條件,即η值大于一定的閾值,則判斷Qi為輪廓上深凹點,繼續(xù)保留在集合中;反之,若Qi對應的凹凸特征參數(shù)不滿足式(4)的約束條件,則判斷Qi為輪廓本身角點(淺凹點或凸點),此時,將Qi從候選點集合中剔除
η(Qi)>Tcorr
(4)
其中,Tcorr為閾值。
圓形掩膜的半徑R取值是成敗的關(guān)鍵因素,R過大可能導致掩膜與輪廓的兩交點分別落在極體的兩側(cè),檢測不到目標深凹點,而R過小則η值的計算非常容易受到輪廓起伏的影響,降低識別的準確度。本文根據(jù)檢測的候選角點自適應確定圓形掩膜的半徑R,首先尋找候選點集合U中最近點對(歐氏距離);在圖像坐標系中,然后計算最近點對的歐氏距離dmin;由于半徑R以像素為單位,取dmin/2的整數(shù)部分作為半徑R的自適應值。這樣很大程度上避免受到噪聲的干擾影響,同時又確保了掩膜與輪廓的兩交點不越過極體而造成漏檢問題。R的計算公式為
(5)
其中,d(p,q) 表示集合U中候選點p和q的歐式距離。
選取合適的閾值Tcorr對于區(qū)分輪廓本身角點和輪廓上深凹點至關(guān)重要,閾值過大可能會導致深凹點被誤判為輪廓角點,造成深凹點的漏檢問題,而閾值較小可能會導致輪廓本身角點被誤判為深凹點,篩選到不真實的深凹點。為獲取合適的閾值,首先提取了15個極體明顯情形和15個極體不明顯情形時的細胞輪廓,計算并統(tǒng)計輪廓本身角點、極體明顯時輪廓上深凹點、極體不明顯時輪廓上深凹點各30個樣本點的η值。如圖5所示,是3類樣本點的η值分布圖。其中,輪廓本身角點的η值在區(qū)間[0.87,1.15]內(nèi)分布,極體明顯時輪廓上深凹點的η值在區(qū)間[1.98,2.88]內(nèi)分布,極體不明顯時輪廓上深凹點的η值在區(qū)間[1.43,3]內(nèi)分布。由圖可見,雖然極體不明顯時深凹點η值比極體明顯時整體有所降低,但兩類輪廓上深凹點和輪廓本身角點之間能夠通過單一閾值完全區(qū)分開。當閾值取[1.15,1.43]區(qū)間內(nèi)任意數(shù)值時,能夠完全區(qū)分輪廓上深凹點和輪廓本身角點,為了提升容錯率,本文取輪廓本身角點中η最大值1.15和深凹點中η最小值1.43的中值作為最佳閾值,Tcorr=1.29。
圖5 輪廓上不同像素點類型的η值分布
通過候選角點檢測與深凹點篩選,候選點集合U中滿足式(4)約束條件的點被檢測為細胞輪廓上的深凹點,被保留在最終的集合U中,表示為A1,A2,…,An。n是最終檢測的深凹點數(shù)目,對于圖像平面內(nèi)存在極體的情形,細胞輪廓上極體與卵母細胞形成兩個深凹點,n應該為2;對于圖像平面內(nèi)不存在極體的情形,細胞輪廓上無深凹點,n應該為0;如果n為其它數(shù)字,則認為凹點是誤判,這可能是由于細胞輪廓的起伏或者噪聲引起的。
最后根據(jù)輪廓上檢測到的深凹點數(shù)目及位置,可以判斷極體存在與否,并對極體進行定位、定向:
(1)如圖6(a)情形:當輪廓中無檢測的深凹點時,取輪廓的像素中心O1位置作為卵母細胞的中心,此時判斷極體不在圖像平面內(nèi)。
(2)如圖6(b)情形:當輪廓中有Q1、Q2兩個深凹點時,選取兩凹點的連線Q1Q2作為卵母細胞與極體的分割線,取長輪廓和短輪廓(包含分割線)的中心位置O1和O2分別作為卵母細胞與極體的中心,由卵母細胞中心指向極體中心即為極體相對卵母細胞的方向。
圖6 卵母細胞和極體定位定向
實驗中,圖像數(shù)據(jù)集來源于實驗室自主搭建的顯微注射系統(tǒng),利用標準的倒置顯微鏡(Nikon ECLIPSE Ti)和CCD相機(Watec WAT-221S)獲取所需的卵母細胞圖像數(shù)據(jù)集,圖像像素大小為640×480。算法測試時,取包含卵母細胞的200×200像素窗口進行計算。算法集成開發(fā)環(huán)境選擇的是Spyder,編程語言采用Python 3.6。
極體識別過程中,首先對采集的卵母細胞圖像進行Otsu閾值分割和形態(tài)學操作,提取細胞輪廓;然后通過角點檢測算法預選一組候選點集合;再利用設(shè)計的自適應圓形掩膜和凹凸特征參數(shù)從候選點集合中剔除凸點與淺凹點,篩選出卵母細胞與極體粘連形成的深凹點;最后根據(jù)深凹點確定極體位置,以及極體相對于卵母細胞的方向。
本文首先對卵母細胞極體不可見、極體明顯、極體不明顯、噪聲干擾、極體方位不一等不同類型的細胞圖像進行了算法測試,主要是驗證算法的有效性和魯棒性,實驗結(jié)果如圖7所示。第一行為測試所用到的原始圖像,其中,第1幅圖極體不在圖像平面內(nèi),第2幅圖極體較為明顯,第3幅圖極體不明顯,第4幅圖噪聲干擾嚴重。第二行為使用Otsu閾值分割結(jié)合形態(tài)學操作的輪廓提取結(jié)果。第三行為最終的極體識別結(jié)果,其中,箭頭方向由細胞中心指向極體中心,代表了極體相對于卵母細胞的方位。從圖中可看出,本文算法在極體不可見、極體明顯、極體不明顯、噪聲干擾等不同實際情形下都具有準確的極體識別結(jié)果,并且極體位于不同方位時均能準確識別,驗證了該方法的有效性與魯棒性。
圖7 不同類型圖像的極體識別結(jié)果
為了測試本文方法的識別準確率,對300張卵母細胞圖像進行測試實驗。在300張圖像中,有100張圖像極體不在圖像平面內(nèi),100張圖像極體明顯,100張圖像極體不明顯。極體識別準確的定義為:如果極體在圖像中不可見,則認為“極體不在圖像平面內(nèi)”的識別結(jié)果是準確的;如果極體在圖像中可見,識別結(jié)果中極體相對于卵母細胞的方向與真實方向一致則認為識別是準確的。測試中,算法準確識別了288張圖像,平均準確率可達96%,即使在極體不明顯狀態(tài),識別準確率也能達到92%。在12個錯誤識別樣本中,4個錯誤識別極體位置,8個誤判為極體不存在。極體識別統(tǒng)計結(jié)果見表1。
為了進一步驗證本文方法的有效性,從不同角度對文獻[7-11]中現(xiàn)有的極體識別方法進行了比較,分別對極體檢測的準確率、測試樣本數(shù)、極體不明顯情形有效性、是否需要模型訓練4個方面進行對比分析,統(tǒng)計結(jié)果見表2。
表1 極體識別準確率
表2 不同方法極體識別比較
表2中展示了不同方法的對比結(jié)果。其中準確率與測試樣本數(shù)是指測試集上方法的準確性和測試集大??;極體不明顯情形有效性是指該方法能否克服極體不明顯的實際情形;模型訓練是指算法實現(xiàn)過程中是否需要大量數(shù)據(jù)樣本進行模型訓練??梢钥闯觯诓唤档妥R別準確率的條件下,只有文獻[11]方法和本文方法能有效克服極體不明顯情形時的極體識別問題,較比與文獻[11]方法,本文方法無需大量數(shù)據(jù)樣本進行模型訓練,更適合于實際的實驗與應用。
為了進一步說明本文方法對極體不明顯情形時的識別有效性,在同一實驗條件下,將本文方法與文獻[9]中極體識別方法進行對比實驗,分析兩種方法在極體較為明顯和極體不明顯兩種不同實際情形下的識別結(jié)果。實驗中,取極體不明顯、極體明顯兩種不同情形的卵母細胞圖像各100張作為測試樣本。計算兩種方法對不同測試樣本進行極體識別的準確率,并記錄識別過程所消耗的時間。統(tǒng)計結(jié)果見表3。
表3 兩種方法極體識別比較
由兩種方法的檢測結(jié)果可見,對于極體較為明顯的情形,本文方法和文獻[9]方法都能達到較高的準確率。但是對于極體不明顯的情形,文獻[9]方法的準確率只有48%,而本文方法依然可以達到92%的準確率,明顯優(yōu)于對比文獻的方法,能有效應對極體不明顯情形的識別。這是因為對比文獻的方法基于卵母細胞的理想球面特性進行極體識別,對細胞輪廓的起伏變化非常敏感,在極體不明顯情形下,放大了噪聲干擾、細胞形變等帶來的輪廓起伏干擾,容易造成誤判和漏檢等情形,從而使得準確率低。在時間損耗上,本文方法與文獻[9]方法都達到了0.1 s級的快速檢測效果,具備較好的實時性。
本文提出了一種基于凹點檢測的極體識別方法。根據(jù)卵母細胞與極體尺寸差異明顯、交界處形成深凹點的特征,搜索細胞輪廓上的深凹點,快速識別極體,驗證了凹點檢測可應用于極體識別研究。針對深凹點檢測,設(shè)計了自適應圓形掩膜和凹凸特征參數(shù),篩選卵母細胞與極體粘連形成的深凹點。不同于傳統(tǒng)方法,本文方法在極體不明顯情形下依然能保持良好的識別準確率,且算法耗時少,更適合應用于細胞自動化顯微注射實時操作。由于該方法在細胞離焦程度大時難以有效提取輪廓,導致細胞離焦時的極體識別準確率低。因此,解決細胞離焦狀態(tài)下的輪廓提取問題將是未來的研究重點。