国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SSD神經(jīng)網(wǎng)絡(luò)的圖像目標物體檢測

2021-11-02 06:03王君洋葉傳奇朱炳旭
無線互聯(lián)科技 2021年17期
關(guān)鍵詞:熊貓物體預(yù)測

王君洋,葉傳奇,朱炳旭

(河南科技大學 軟件學院,河南 洛陽 471003)

0 引言

目標檢測為我們的生活提供了極大的便利,受到越來越多人的重視。目標檢測算法主要分三類,第一類是傳統(tǒng)的目標檢測算法:Cascade+HOG,DPM+Haar,SVM。第二類是候選框+深度學習分類:R-CNN,F(xiàn)ast R-CNN,F(xiàn)aster R-CNN等。第三類則是基于深度學習的回歸方法:YOLO,SSD,DenseBox等。其中SSD算法在保留了速度和精度的同時還有比較好的準確率和性能。SSD包含大量的網(wǎng)絡(luò)模型,其不同點主要在于被檢測圖像的大小不一樣。本文主要研究圖像識別領(lǐng)域TensorFlow的應(yīng)用。

1 TensorFlow框架

TensorFlow是一個用于數(shù)值計算的開源框架,主要采用數(shù)據(jù)流圖。TensorFlow是人工智能領(lǐng)域處理分析的主要工具,同時也是一個用于機器學習和深度學習的開源平臺。在深度學習領(lǐng)域,TensorFlow經(jīng)常被用于自然語言處理、語音識別以及圖像識別等。

1.1 TensorFlow的特點

TensorFlow具有極大的靈動性、移植性,能夠自動求取微分、支持多語言、性能高度改良。

1.2 TensorFlow Object Detection API庫

TensorFlow Object Detection API庫的目的是創(chuàng)建一個在單個圖像中精確定位和識別多個事物的機器學習模型。這個API是基于Tensorflow構(gòu)造的開源框架,不僅有利于在目標檢測的模型中構(gòu)建、訓(xùn)練和部署,同時在處理物體檢測問題中也可以使用。而在一個畫面幀中檢測許多不同物體的過程就是物體檢測過程,因此可以將其運用在熊貓這個數(shù)據(jù)模型中。

2 SSD算法

YOLO回歸的概念和Faster-RCNN中的Anchor機制被結(jié)合在SSD中。為了維持YOLO快速的特性,同時確保保留在窗口預(yù)測過程中Faster-RCNN算法比較精準的性能,可以利用全圖多尺度區(qū)域在各個地方進行回歸滿足需求。SSD主要被用于不同尺度的特征圖中,預(yù)測一些Default Bounding Boxes的類別和坐標的偏移量等,通過采用卷積核的方式來實現(xiàn)。

2.1 SSD結(jié)構(gòu)模型

以VGG-16為基礎(chǔ),使用VGG的前5個卷積,后面增加從CONV6開始的5個卷積結(jié)構(gòu),輸入圖片規(guī)格為300×300。

2.2 SSD流程

Faster R-CNN的anchorbox和被引入SSD中的Defalut Box的預(yù)設(shè)目標預(yù)選框機制十分相似。不同點主要在于使用PriorBox層在不同尺度featuremap所有特征點上,過程如圖1所示。

圖1 SSD原理過程

2.3 選取默認框

通常多尺度的方式被SSD在實現(xiàn)目標檢測中使用。如果n層特征圖在模型檢測中使用,那么就可以確定第k個特征圖默認框的占比是:;特征層默認框占輸入圖像的最小比重是Smin,通常取0.2;占輸入圖像的最大比重則是Smax,通常取0.9[1]。

2.4 損失

網(wǎng)絡(luò)輸出預(yù)測的predict box與ground truth回歸變換之間的損失計算,置信度采用Softmax,位置回歸則采用Smooth L1。訓(xùn)練中,為了提高預(yù)測框類別的置信度,可以通過減小損失函數(shù)值來實現(xiàn),同時提高預(yù)測框位置可信度。每次迭代都將迭代的結(jié)果返回給模型,模型接收返回的信息后,通過返回的信息進行修改繼續(xù)訓(xùn)練。通過提升模型的目標檢測能力,訓(xùn)練出所需要的最佳的圖像識別模型。

3 實驗準備及過程

3.1 數(shù)據(jù)集的創(chuàng)建與處理

從網(wǎng)絡(luò)中下載500張中等大小的熊貓照片保存在“images”目錄下。下載的不同角度和形狀的熊貓照片可以被用來訓(xùn)練所需要的預(yù)測模型。經(jīng)過一段時間的大量訓(xùn)練,模型預(yù)測結(jié)果的精確度得到了提高。為了讓系統(tǒng)知道學習訓(xùn)練和識別的實際物體是邊界框內(nèi)的物體,可以在獲取圖像數(shù)據(jù)后,沿著模型后期將要預(yù)測的物體畫邊界框,用Labelme進行標記。在標記完成之后,會得到一個目錄和存儲每張圖面邊界框的xml文件[2]。

3.2 劃分和創(chuàng)建新的數(shù)據(jù)集

將從網(wǎng)絡(luò)中下載的數(shù)據(jù)集劃分為訓(xùn)練集和測試集兩大類。模型向訓(xùn)練部分添加大約80%的圖片和它的描述圖像邊界框的xml文件,向測試部分添加大約20%的圖片和它的xml文件[3]。為了使TensorFlow可以順利讀取xml文件中的數(shù)據(jù),將xml文件的格式修改為Tfrecord格式,存放在新的數(shù)據(jù)集中。

3.3 運用SSD識別物體過程

讀取本地測試圖片,preprocess_input以及保存圖像像素值(顯示需要);模型預(yù)測結(jié)果,得到7 308個priorbox;進行非最大抑制算法處理;SSD300模型輸入以及加載參數(shù)。

4 結(jié)語

物體檢測改善了人們?nèi)粘I畹捏w驗,已經(jīng)成為當今社會研究的一個熱點技術(shù)。本文基于SSD算法,設(shè)計實現(xiàn)了圖像神經(jīng)網(wǎng)絡(luò)檢測模型,并且將其應(yīng)用到熊貓的圖片識別中。多次實驗中的一個預(yù)測結(jié)果如圖2所示,成功標記出熊貓的概率為87.3%。在20測試數(shù)據(jù)集的測試中,18測試集的測試結(jié)果準確率在90%以上,表明該模型檢測結(jié)果的準確率較高。

圖2 識別熊貓

猜你喜歡
熊貓物體預(yù)測
無可預(yù)測
選修2-2期中考試預(yù)測卷(A卷)
選修2-2期中考試預(yù)測卷(B卷)
我愛“熊貓”
萌萌噠熊貓等
我與熊貓的二十年
懸浮的雞蛋
邻水| 石狮市| 汉寿县| 沧源| 桂阳县| 遂溪县| 吕梁市| 吴江市| 漾濞| 屏东市| 潍坊市| 遂宁市| 屏山县| 托里县| 保定市| 常熟市| 东宁县| 新营市| 定边县| 奎屯市| 隆昌县| 鱼台县| 孙吴县| 古浪县| 湘乡市| 饶河县| 红河县| 明光市| 玉门市| 内丘县| 临安市| 清丰县| 伊宁市| 保德县| 长汀县| 新邵县| 石林| 紫云| 龙胜| 惠水县| 共和县|