楊洋
(深圳市華漢偉業(yè)科技有限公司,廣東 深圳 518000)
機(jī)器視覺作為自動化系統(tǒng)中的“眼睛”和“大腦”,在推動智能制造向智能化、柔性化發(fā)展中起著重要作用。當(dāng)前,機(jī)器視覺主要有測量、定位、識別、表面質(zhì)量檢測四大應(yīng)用場景。光學(xué)測量作為實現(xiàn)非接觸式測量的關(guān)鍵技術(shù)和手段,在自動化生產(chǎn)過程中起著重要作用。在平面測量中,點、線、圓和矩形等作為常用的設(shè)計要素和基本幾何基元,解決上述基本幾何基元的精確估計,是實現(xiàn)精確尺寸估計關(guān)鍵技術(shù)。
圖像中的幾何測量是圖像分析和理解的重要內(nèi)容,也是機(jī)器視覺的基礎(chǔ)技術(shù)之一。為了滿足裝配、測量、品質(zhì)分類等場景的要求,很多時候需要從圖像中提取感興趣的幾何形狀,如直線、圓、橢圓、矩形等,并對它們進(jìn)行分析和計算,如求取它們的位置、方向、尺寸、面積、周長等參數(shù)?;谳喞木匦螖M合方法主要存在以下兩方面的問題:①圖像輪廓的提取不一定準(zhǔn)確,可能會受到噪聲、遮擋、光照等因素的影響,導(dǎo)致輪廓不完整或不規(guī)則,從而影響矩形擬合的效果;②矩形擬合不一定穩(wěn)定,可能會受到輪廓點分布不均勻或離群點的影響,導(dǎo)致矩形擬合結(jié)果與目標(biāo)不一致或有較大誤差。
為了解決上述問題,本文提出了一種基于距離加權(quán)的矩形擬合算法,通過引入一個加權(quán)函數(shù)來給不同距離的點分配不同的權(quán)重,從而降低噪聲和異常值的影響,提高擬合精度和魯棒性。加權(quán)函數(shù),給距離近的點更高的權(quán)重,給距離遠(yuǎn)的點更低的權(quán)重,如Gauss、Huber、Tukey 等加權(quán)方法。
本文首先介紹了基于距離加權(quán)的矩形擬合方法的原理和步驟,然后通過實驗驗證了該方法在不同類型和條件下的圖像上的有效性和優(yōu)越性,并與其他常用的矩形擬合方法進(jìn)行了比較和分析。最后,總結(jié)了本文的主要工作和創(chuàng)新點,并指出了未來需要改進(jìn)和完善的方面。
矩形擬合是一種常用的圖像處理技術(shù),矩形擬合的基本思想是根據(jù)一組點集(xi,yi),根據(jù)預(yù)測值和真實值的誤差的平方和最小的原則,完成矩形參數(shù)的估計,從而實現(xiàn)目標(biāo)檢測、識別或測量等功能。矩形是由相互正交和平行的四條直線構(gòu)成的,因此很多直線擬合的方法,可以用來解決矩形擬合的問題。常用的直線擬合的方法有霍夫直線檢測[1-2]、最小二乘直線擬合[3-5]、RANSAC直線擬合[6-8]等。本節(jié)首先介紹基于直線一般方程的最小二乘參數(shù)估計方法,然后結(jié)合聚類方法闡述點集劃分的方法,最后給出矩形擬合的基本步驟和原理闡述。
直線的一般表示形式為ax+by+c=0,其中a2+b2=1。設(shè)輸入的點的坐標(biāo)為(xi,yi)(i=1,2,…,n),根據(jù)最小二乘原理,可以建立目標(biāo)函數(shù)為
輸入的坐標(biāo)是一個數(shù)組集合,由于矩形擬合需要獲得每條直線對應(yīng)的點的坐標(biāo),因此需要對數(shù)據(jù)點進(jìn)行劃分。本文坐標(biāo)點分割的流程為:
1)根據(jù)輪廓點,獲取凸多邊形表示;
2)獲取凸多邊形中距離最遠(yuǎn)的兩個點,確定為矩形對角線的兩個點;
3)根據(jù)所述矩形對角線的兩個點,確定矩形的另外兩個點,確定方法為從剩余的輪廓點或凸多邊形剩余的點中,尋找與所述矩形對角線的兩個點分別形成的直線的夾角與90 度的差最小的像素點,以作為矩形中剩余的點。通過以下公式來尋找矩形中剩余的點:
4)將對尋找到的像素點進(jìn)行位置校正,以使得校正后的像素點與所述矩形對角線的兩個點分別形成的直線的夾角呈90°,可以通過以下公式來校正,以獲得剩余的兩個點:
5)計算各輪廓點與所述初始矩形四邊條的距離,根據(jù)距離,將輪廓點分割到與四邊條中最短距離的那一邊,以將輪廓點分割為四組,每邊對應(yīng)一組。
本文提出了一種基于距離加權(quán)的矩形擬合算法,它通過引入一個加權(quán)函數(shù),給距離近的點更高的權(quán)重,給距離遠(yuǎn)的點更低的權(quán)重,從而降低噪聲點對擬合結(jié)果的影響。對于矩形的四條直線可以分別表示為
由于通過2.2 節(jié)已經(jīng)把輸入的邊緣數(shù)據(jù)點分割為四條直線對應(yīng)的數(shù)據(jù)點的集合,可以建立約束目標(biāo)函數(shù)為
權(quán)重初始化為,對a、b、c、d、e、f和λ分別求偏導(dǎo)數(shù),并令其偏導(dǎo)數(shù)等于0,可以獲得參數(shù)a、b的初始解。后續(xù)可以根據(jù)Gauss-Newton 方法進(jìn)行迭代計算,獲得a、b最終解。a,b取值后,可以獲得矩形的4 個點的坐標(biāo)為
對于權(quán)重參數(shù),常用的有三種:Gauss、Huber、Tukey,這三個權(quán)重函數(shù)的應(yīng)用效果都很好。Huber 權(quán)重定義表示為
Tukey 權(quán)重定義表示為
式中,τ為削峰因子,δ表示點到對應(yīng)直線的距離。這些點的權(quán)重在0~1 之間滑動變化,越接近理想擬合直線的點,所獲得的權(quán)重越大,否則權(quán)重越小或者等于0。對于閾值τ的選擇,通常經(jīng)過距離的標(biāo)準(zhǔn)差近似估計獲得。標(biāo)準(zhǔn)差的近似可以根據(jù)下式獲得[10]:
本文對6 個不同大小、不同旋轉(zhuǎn)角度的矩形進(jìn)行測試,獲得Least Square、Huber 和Tukey 三種情況下的矩形擬合結(jié)果,獲得擬合的矩形的中心(xc,yc)、主軸角度θ、主軸長L1和次軸長L2,Huber、Tukey 迭代次數(shù)為10 次。測試結(jié)果數(shù)據(jù)見表1。
表1 測試結(jié)果數(shù)據(jù)
輸入的圖像數(shù)據(jù)自上而下,自左向右,依次為工件1~工件6,不同算法的檢測結(jié)果如圖1 所示。
圖1 輸入圖像及不同算法檢測結(jié)果
傳統(tǒng)的方法通過提取點的坐標(biāo),通過直線擬合獲得擬合的矩形信息。本文將2 個正方形進(jìn)行擬合測試,測試結(jié)果表明本文方法的兩個矩形的邊長的差距更小,具有更好的擬合效果,測試結(jié)果如圖2 所示,紅色為傳統(tǒng)方法的計算結(jié)果,綠色為本文計算結(jié)果,測試數(shù)據(jù)見表2。
圖2 對比測試結(jié)果圖
表2 對比測試結(jié)果數(shù)據(jù)
本文提出了一種基于距離加權(quán)的矩形擬合算法,通過引入一個加權(quán)函數(shù),給距離近的點更高的權(quán)重,給距離遠(yuǎn)的點更低的權(quán)重,從而降低噪聲點對擬合結(jié)果的影響。通過幾何相似性,對輸入的數(shù)據(jù)點進(jìn)行分割,劃分為四組直線數(shù)據(jù),將矩形參數(shù)的回歸轉(zhuǎn)化為基于直線參數(shù)的回歸,最后利用最小二乘法求解矩形模型的參數(shù),利用了矩陣運算和迭代優(yōu)化的方法,提高了算法的效率和收斂性。在機(jī)器視覺、智能制造等領(lǐng)域,可以利用矩形擬合來識別物體的位置、姿態(tài)、尺寸等信息,從而實現(xiàn)精準(zhǔn)的控制和優(yōu)化,具有很好的應(yīng)用和落地前景。
矩形擬合在智能制造領(lǐng)域有廣泛的應(yīng)用場景,如在半導(dǎo)體、3C 電子制造、新能源等領(lǐng)域,成為解決測量工藝節(jié)點的關(guān)鍵技術(shù)。主要應(yīng)用:半導(dǎo)體中掩膜板、Wafer晶圓的寬度、高度測量等;新能源領(lǐng)域中極片尺寸測量、極片清洗槽寬度測量等;3C 電子制造業(yè)中,手機(jī)面板、中框、背板等尺寸測量。