朱澤宇
【摘?要】伴隨著智能化時(shí)代的到來(lái),人工智能技術(shù)與傳感技術(shù)獲得了空前的進(jìn)步與發(fā)展,與傳統(tǒng)的人工作業(yè)相比,機(jī)器生產(chǎn)不僅生產(chǎn)量穩(wěn)定,而且生產(chǎn)效率高,可以節(jié)省大量的生產(chǎn)成本。針對(duì)以往人工打菜分配不均、效率低下等多種問(wèn)題,對(duì)基于機(jī)器視覺(jué)的菜品智能識(shí)別技術(shù)進(jìn)行研究就顯得尤為重要。本文基于機(jī)器視覺(jué)技術(shù),結(jié)合傳統(tǒng)圖像識(shí)別技術(shù),提出了一種新型的菜品智能識(shí)別技術(shù),可以有效的代替以往通過(guò)人眼來(lái)實(shí)現(xiàn)對(duì)菜品的識(shí)別。
【關(guān)鍵詞】機(jī)器視覺(jué);菜品;智能識(shí)別技術(shù)
一、基于機(jī)器視覺(jué)的菜品智能識(shí)別系統(tǒng)的總體設(shè)計(jì)
首先,要在該系統(tǒng)中根據(jù)消費(fèi)者的需求來(lái)選擇適合消費(fèi)者的飯量,然后通過(guò)打飯機(jī)窗口來(lái)實(shí)現(xiàn)自動(dòng)打飯,在經(jīng)過(guò)打飯程序后,消費(fèi)者的餐盤(pán)會(huì)通過(guò)輸送機(jī)傳遞至工位,然后餐盤(pán)隨著該輸送機(jī)運(yùn)動(dòng)[1]。其次,消費(fèi)者在點(diǎn)菜窗口對(duì)菜品或者套餐進(jìn)行選擇,然后完成支付,負(fù)責(zé)整個(gè)菜品識(shí)別智能系統(tǒng)中則會(huì)對(duì)消費(fèi)者的相關(guān)信息進(jìn)行收集與顯示,并提示消費(fèi)者到取菜窗口等待自己的餐盤(pán)到位。最后,在餐盤(pán)送至取菜口時(shí),則取菜口的窗戶(hù)顯示屏?xí)鶕?jù)該餐盤(pán)的流水來(lái)提示餐盤(pán)已到位。消費(fèi)者根據(jù)自己的用餐流水號(hào)來(lái)取走餐盤(pán)。如果某到達(dá)取菜口的餐盤(pán)沒(méi)有被及時(shí)取走,則會(huì)通過(guò)輸送機(jī)的出口將其排放到立式餐盤(pán)存儲(chǔ)機(jī)上,這樣,用戶(hù)則可以根據(jù)自己實(shí)際情況來(lái)及時(shí)取走餐盤(pán),不會(huì)影響后續(xù)其他乘客需求。
為保證本次基于機(jī)器視覺(jué)的菜品智能識(shí)別系統(tǒng)設(shè)計(jì)后得到有效應(yīng)用,規(guī)定該系統(tǒng)的定位精度誤差控制在5毫米以?xún)?nèi),每次抓取食物重量不得超過(guò)0.3千克,食物的抓取精度不得小于0.01千克。在抓取食物過(guò)程中,要求40—60秒之內(nèi),將三個(gè)菜品抓取到飯盤(pán)上。本系統(tǒng)中所使用的所有機(jī)器設(shè)計(jì)都符合相關(guān)的食品衛(wèi)生要求,達(dá)到《國(guó)標(biāo)GB19891-2005機(jī)械安全機(jī)械設(shè)計(jì)》的衛(wèi)生要求的相關(guān)要求規(guī)范。菜品識(shí)別系統(tǒng)中要求菜品種類(lèi)不得低于10種;為保證該系統(tǒng)實(shí)物抓取效果的安全高效衛(wèi)生,還設(shè)置報(bào)警裝置,通過(guò)視覺(jué)檢測(cè)系統(tǒng),對(duì)所抓取菜品進(jìn)行檢測(cè),如果菜盤(pán)中菜品數(shù)量過(guò)少,無(wú)法及時(shí)對(duì)其菜品實(shí)現(xiàn)智能識(shí)別與檢測(cè),則報(bào)警裝置會(huì)發(fā)出警報(bào),并提醒對(duì)實(shí)驗(yàn)菜品區(qū)域補(bǔ)充菜盤(pán)與菜品。
二、機(jī)器視覺(jué)模塊硬件選型
在設(shè)計(jì)菜品智能識(shí)別系統(tǒng)的總體視覺(jué)方案過(guò)程中還需要加強(qiáng)系統(tǒng)需求分許,并選擇合適的硬件選型?;跈C(jī)器視覺(jué)的菜品智能識(shí)別系統(tǒng)設(shè)計(jì)中,為保證各項(xiàng)功能要求與技術(shù)要求達(dá)到標(biāo)準(zhǔn),通過(guò)對(duì)視覺(jué)模塊各個(gè)部分的標(biāo)準(zhǔn)以及系統(tǒng)實(shí)際需求進(jìn)行綜合分析確定,選擇工業(yè)相機(jī)的型號(hào)為Basler acA3800-10gc,其像素為1000W,然后搭配的工業(yè)相機(jī)鏡頭型號(hào)為Basler Lens C125-0418-5M F1.8 f4mm,應(yīng)用光源型號(hào)為OPT-RI0090的奧普特公司的90°前向照射的環(huán)形LED白色光源。只有搭建起一套完善的菜品圖像識(shí)別體系,應(yīng)用合適的機(jī)器視覺(jué)系統(tǒng),才能保證所采集到的菜品成像信息識(shí)別的準(zhǔn)確性、可靠性,在后續(xù)的研究中,還要持續(xù)改進(jìn)與完善詩(shī)句模塊硬件選型的精準(zhǔn)性[2]。
三、應(yīng)用基于YOLOv3模型的菜品智能識(shí)別與目標(biāo)檢測(cè)
基于機(jī)器視覺(jué)的菜品智能識(shí)別技術(shù),其最根本的目的就是為了要根據(jù)用戶(hù)需求智能識(shí)別菜品,并根據(jù)用戶(hù)需求提供所需菜品,因此,就必須要應(yīng)用基于YOLOv3模型的菜品智能識(shí)別與目標(biāo)檢測(cè)。通過(guò)目標(biāo)檢測(cè)來(lái)對(duì)菜品智能識(shí)別中的特定目標(biāo)的所在區(qū)域進(jìn)行識(shí)別,應(yīng)用基于YOLOv3模型的菜品智能識(shí)別與目標(biāo)檢測(cè)需要滿(mǎn)足目標(biāo)分類(lèi)與目標(biāo)定位兩個(gè)功能需求。其中目標(biāo)分類(lèi)就是要根據(jù)計(jì)算機(jī)識(shí)別與判斷圖片中的物體其所屬的分類(lèi)與檢測(cè)結(jié)果的置信率;目標(biāo)定位功能則主要對(duì)對(duì)圖片中的特定目標(biāo)的所在區(qū)域、位置進(jìn)行確定與標(biāo)記[3]。在整個(gè)智能菜品識(shí)別系統(tǒng)中,最關(guān)鍵的環(huán)節(jié)就是要對(duì)已經(jīng)制作完成的菜品進(jìn)行識(shí)別。通過(guò)菜品智能識(shí)別系統(tǒng)中的菜品識(shí)別系統(tǒng)可以實(shí)現(xiàn)識(shí)別菜品類(lèi)別與菜品位置的目的,然后將該目標(biāo)菜品圖像通過(guò)位置坐標(biāo)傳遞到機(jī)械手系統(tǒng),然后應(yīng)用機(jī)械手來(lái)分揀菜品,從而完成菜品智能識(shí)別操作。
如果應(yīng)用傳統(tǒng)的目標(biāo)檢測(cè)算法,則在選擇區(qū)域的時(shí)候,需要定位檢測(cè)目標(biāo)的區(qū)域,由于目標(biāo)的形狀及位置存在明顯的不確定性特征,應(yīng)用傳統(tǒng)目標(biāo)檢測(cè)算法,往往會(huì)通過(guò)滑動(dòng)窗口策略來(lái)遍覽圖像,往往會(huì)導(dǎo)致冗余運(yùn)算多,且會(huì)對(duì)檢測(cè)速度產(chǎn)生嚴(yán)重影響,甚至花費(fèi)較長(zhǎng)時(shí)間仍舊也無(wú)法準(zhǔn)確獲得該不確定圖像的具體區(qū)域。通過(guò)應(yīng)用SSD(single shot multibox detector)、YOLO為代表的目標(biāo)檢測(cè)法,該檢測(cè)方法將整個(gè)目標(biāo)檢測(cè)任務(wù)看作是回歸問(wèn)題進(jìn)行處理,從而實(shí)現(xiàn)了由端到端的處理,可以直接將模型預(yù)測(cè)結(jié)果輸出,不僅檢測(cè)速度快,且能夠?qū)崿F(xiàn)實(shí)時(shí)識(shí)別的目的。YOLO目標(biāo)檢測(cè)法是一種基于回歸思想的目標(biāo)檢測(cè)算法,截至目前為止,該檢測(cè)算法已經(jīng)衍生出YOLOv2和YOLOv3版本。YOLOv3目標(biāo)檢測(cè)技術(shù)的檢測(cè)數(shù)量有效提升,且檢測(cè)準(zhǔn)確率及小目標(biāo)檢測(cè)顯著提升[4]??梢哉f(shuō),在當(dāng)前的菜品智能識(shí)別技術(shù)中YOLOv3是最適用的目標(biāo)檢測(cè)算法。
通過(guò)對(duì)基于實(shí)時(shí)目標(biāo)檢測(cè)模型YOLOv3目標(biāo)檢測(cè)算法進(jìn)行改進(jìn),使菜品智能識(shí)別技術(shù)更加完善。首先,通過(guò)應(yīng)用k-means聚類(lèi)算法可以實(shí)現(xiàn)對(duì)待識(shí)別菜品的驗(yàn)框聚類(lèi),則可以使該待識(shí)別菜品的形狀更加接近與識(shí)別目標(biāo)。通過(guò)對(duì)其中9組的識(shí)別目標(biāo)的驗(yàn)框類(lèi)聚,從而將待識(shí)別目標(biāo)的IoU 提升至89%以上。
針對(duì)待識(shí)別目標(biāo)的特點(diǎn),對(duì)其網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,并將多尺度預(yù)測(cè)中小尺度與中尺度的預(yù)測(cè)步驟一處,只對(duì)大尺度特征途進(jìn)行預(yù)測(cè),從而有效提升檢測(cè)的精度、速度。
通過(guò)應(yīng)用批再標(biāo)準(zhǔn)化算法來(lái)處理模型數(shù)據(jù),從而改善網(wǎng)絡(luò)的訓(xùn)練過(guò)程,針對(duì)一些訓(xùn)練樣本批次較小或訓(xùn)練樣本不獨(dú)立同分布條件的情況下,對(duì)網(wǎng)絡(luò)的手鏈過(guò)程加速,并提升檢測(cè)精度。
結(jié)束語(yǔ):
總而言之,在當(dāng)前的基于機(jī)器視覺(jué)的菜品智能設(shè)計(jì)中,還存在一定的技術(shù)難點(diǎn),還需要實(shí)現(xiàn)機(jī)器視覺(jué)的智能識(shí)別技術(shù)與傳統(tǒng)圖像識(shí)別技術(shù)、深度學(xué)習(xí)圖像識(shí)別技術(shù)的有機(jī)結(jié)合,從而設(shè)計(jì)出完善的菜品智能識(shí)別系統(tǒng)。通過(guò)應(yīng)用圖像處理技術(shù),可以對(duì)已經(jīng)拍攝的圖像進(jìn)行處理,并實(shí)現(xiàn)對(duì)菜品區(qū)域的監(jiān)測(cè)定位,對(duì)菜品的種類(lèi)、菜品所在的區(qū)域進(jìn)行檢測(cè),在未來(lái)的研究中仍然需要對(duì)該菜品智能識(shí)別技術(shù)的實(shí)時(shí)性、準(zhǔn)確性進(jìn)行深入的研究。
參考文獻(xiàn):
[1]李振,廖同慶,馮青春,等.基于機(jī)器視覺(jué)的蔬菜種子活力指數(shù)檢測(cè)算法研究及系統(tǒng)實(shí)現(xiàn)[J]. 浙江農(nóng)業(yè)學(xué)報(bào),2015,27(12):2218-2224.
[2]陶沙,何敏.基于機(jī)器視覺(jué)的智能制造系統(tǒng)圖像識(shí)別技術(shù)研究[J].洛陽(yáng)理工學(xué)院學(xué)報(bào)(自然科學(xué)版),2019.
(作者單位:荊楚理工學(xué)院)