国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種微型昆蟲圖像智能識別方法

2020-07-02 01:46:18羅桂蘭郝鴻俊潘小雄
大理大學學報 2020年6期
關鍵詞:超平面圖像識別種類

羅桂蘭,王 熙,郝鴻俊,張 梅,潘小雄

(大理大學數(shù)學與計算機學院,云南大理 671003)

在洱海濕地昆蟲群落普適生境網(wǎng)絡生態(tài)行為研究中,發(fā)現(xiàn)洱海濕地昆蟲大多都是鞘翅目、雙翅目、半翅目、鱗翅目、革翅目、直翅目、膜翅目、纓翅目、脈翅目、蜚蠊目等〔1〕,這些昆蟲種類都具有形態(tài)微小、難以肉眼識別的特點〔2〕,本文為解決昆蟲種類的快速高效分類識別,設計了一種微型昆蟲圖像智能識別方法。

近年來,計算機研究者更傾向于設計昆蟲圖像識別相關的算法〔3-5〕,但對其實際應用的關注較少,這使得昆蟲圖像識別技術仍停留在實驗室中,不能真正被昆蟲研究者所使用〔6〕。為此,本文試圖借助當今智能移動終端,利用其方便性和智能信息處理的優(yōu)勢,使研究人員能夠更方便、更高效地對采集到的昆蟲進行實時分類識別。

目前國內(nèi)外在移動終端平臺上進行昆蟲圖像識別的案例較多〔7-8〕。Loarie 和他的研究團隊開發(fā)了“INaturalist”,其圖像樣本來自于社區(qū),可辨認蝴蝶種類的準確率為78%〔9〕;越南的“Happimoji”開發(fā)者開發(fā)了名為“Insect Identifier”的系統(tǒng),可以在沒有互聯(lián)網(wǎng)的狀態(tài)下實時識別圖像和相機中的昆蟲〔10〕。

從目前的市場份額來看,移動終端上主要有兩種操作系統(tǒng):谷歌開發(fā)的Android 系統(tǒng)和蘋果開發(fā)的IOS 系統(tǒng)。安卓的硬件設備種類繁多,系統(tǒng)版本分散度高,不同廠家對設備做了很多改動,開發(fā)和維護成本都很大。然而,IOS 設備由于其封閉源代碼特性和蘋果對系統(tǒng)版本一致性的控制,易于開發(fā)和維護〔11〕。因此,本文選擇IOS 平臺進行昆蟲圖像識別。

研究發(fā)現(xiàn),當前機器學習算法對圖像的智能識別更有效。其中,支持向量機(support vector machine,SVM)是一種廣義線性分類器,通過監(jiān)督學習對數(shù)據(jù)進行分類,在線學習速度快,泛化能力強〔12〕。在引入核函數(shù)后,SVM 有效地解決了高階非線性問題,廣泛應用于人類圖像識別、文本分類、手寫識別、生物信息學識別等領域〔13〕。AdaBoost(adaptive boosting)是一種迭代算法,其核心思想是針對同一個訓練集訓練不同的弱分類器,然后把這些弱分類器集合起來,構成一個更強的分類器。AdaBoost 在使用權值分類器后,有效地提高了算法的組合性能和搜索效率,在區(qū)域圖像檢索、手寫數(shù)字識別等領域得到了廣泛的應用〔14〕。因此,本文基于SVMAdaBoost 機器學習模型和IOS 的模型視圖控制器(model view controller,MVC)設計模式,提出了一種微型昆蟲圖像智能識別(intelligent recognition of micro-insect image,IR-MII)方法,并選擇蘋果的核心機器學習(machine learning,ML)框架〔15〕對昆蟲圖像進行學習訓練,實現(xiàn)濕地微型昆蟲圖像分類識別。

1 微型昆蟲圖像智能識別原理

1.1 設計思想首先,選擇SVM 弱分類器作為AdaBoost的基分類器,對昆蟲圖像進行識別和分類。

其次,采用AdaBoost 迭代算法進行分類學習和訓練〔16〕。在每次迭代中,需要確保生成的子SVM 分類器的差異是相同的,并且每個子分類器的輸入大小是相同的。同時,所用的數(shù)據(jù)也包含在先前分類器給出的錯誤分類樣本的訓練集中。

最后,將所有子SVM 分類器按照加權投票法進行組合,生成最終的強分類器,用于昆蟲種類識別。

1.2 基分類器設計基分類器的設計是在多維空間中找到一個分類超平面,對空間中的點進行分類〔17〕。其設計內(nèi)容包括分類超平面的結構和判別函數(shù)的設計。

分類超平面由空間中的多個離散點表示,這些離散點映射到高維,以便盡可能擴大屬性之間的間隔,以便新的測試集可以映射到相同的空間,通過判斷它在空間中的位置,可以預測它屬于哪個類別。

假設有訓練樣本集為{( )xi,yi,i=1,2,…,s},可被某超平面

正確地分開。其中,i 為樣本數(shù);s為樣本容量;xi是第i 個昆蟲種類樣本,在空間中表示坐標原點到超平面任意點的向量;yi是xi的歸一化昆蟲種類標識,且yi∈{ }

-1,1,yi≥0表示正樣本,yi<0 表 示 負 樣本;b是標量,代表空間中平面與原點的距離;ω是權重向量,代表昆蟲種類的比例,空間上的超平面法向量。法向量的大小是從坐標原點到分離超平面的距離。最優(yōu)分類超平面是指兩種昆蟲種類離最近采樣點距離最大的位置。如圖1 所示,Z對應昆蟲種類最優(yōu)分類超平面。

圖1 昆蟲種類最優(yōu)分類超平面圖

圖1 中的圓圈和方框代表不同的昆蟲種類。直線Z1和Z2分別與分類直線Z 平行,Z1與Z2之間的距離稱為昆蟲種類的分類間隔。Z分離出兩種不同的昆蟲種類,并最大化分類間隔。若滿足

則該平面就是最優(yōu)分類超平面〔18〕。

基于最優(yōu)分類超平面就可通過判別函數(shù)進行昆蟲種類分類。為了構造一個判別函數(shù)來確定昆蟲樣本的類別,引入了核函數(shù)的概念。核函數(shù)定義為空間中的點與中心點之間的歐氏距離,是一個單調函數(shù)。距離越大,對應的函數(shù)值越小。適當?shù)暮丝梢栽诓辉黾佑嬎銖碗s度的情況下完成非線性變換的線性分類。由于本文的數(shù)據(jù)是離散點,且變化不大,因此采用了高斯徑向基核函數(shù)〔19〕

其中,x為所有昆蟲種類,δ表示函數(shù)的寬度,用來控制函數(shù)徑向的作用范圍。由核函數(shù)構造的判別函數(shù)為

其中,βi為拉格朗日乘子,且βi=1,2,…,s,即為求解最優(yōu)值對應的約束系數(shù)。

1.3 強分類器設計SVM-AdaBoost 的融合使得在每次迭代過程中都會選取一個基分類器,同時,通過基分類器,根據(jù)每次迭代中數(shù)據(jù)分類的正確性或誤差對樣本中的值進行加權〔20〕。SVM-AdaBoost 組合而成的強分類器實現(xiàn)步驟如下。

第一步:確定昆蟲種類樣本的初始訓練集

第二步:定義基分類器初始權重

第三步:循環(huán)迭代,進行分類學習與訓練。

2)在訓練集Gt上利用SVM 分類算法訓練生成一個基分類器ht( xi),與 標簽yi對比,當取得本次分類的加權錯誤率

3)如果ηt(i )>0.5,則令T=t-1退出循環(huán)。

4)如果ηt(i )≤0.5,則令基分類器權重為

5)更新分配樣本權值為

其中Δt是歸一化因子,它基于每次迭代后的當前樣本分布ωt(i )來改變樣本集中錯誤分類的樣本的權重,以形成新的樣本分布ωt+1(i),便于下次迭代使用。

6)經(jīng)過t次迭代后,最終的強分類器輸出為

2 昆蟲智能識別程序的設計

2.1 昆蟲圖像樣本庫創(chuàng)建將大理市洱海濕地昆蟲標本6 000 張圖像分為訓練和測試兩類。兩個分類集都包含相同的10 個目和對應的27 個科。表1列出了洱海濕地的昆蟲種類。

表1 洱海濕地昆蟲種類

2.2 系統(tǒng)功能接口設計本文采用MVC 設計模式和Swift 語言編寫了拍攝和選擇照片、顯示識別結果、顯示昆蟲圖像和控制圖像方向的功能。系統(tǒng)用戶界面包含3個主要功能模塊:第一,昆蟲圖像顯示區(qū)用于顯示當前選定的昆蟲圖像;第二,拍照并選擇圖片按鈕,選擇要識別的昆蟲圖片或要拍攝的昆蟲圖片;第三,圖像識別和相關信息顯示區(qū)域用于顯示被識別昆蟲的科,并給出兩個最有可能的結果。系統(tǒng)功能界面如圖2所示。

圖2 系統(tǒng)功能界面

2.3 圖片獲取方法昆蟲圖像的采集首先看相機是否可用。如果相機不可用,則在選擇圖像時將直接從相冊中顯示;如果相機可用,則可選擇拍照或從相冊獲取圖像。該圖像將作為識別功能函數(shù)的輸入。

2.4 模型學習訓練本文核心機器學習模型訓練時的硬件環(huán)境為MacBook系列Air(2017),軟件環(huán)境為MacOS 10.14.2 Beta(18C31g),Xcode 10.1(10B61)。

創(chuàng)建核心機器學習模型的主要操作流程為:首先,安裝Xcode 測試版,登錄到在蘋果開發(fā)者網(wǎng)站上的個人賬戶,下載后安裝。其次,需要在Xcode軟件中創(chuàng)建一個新的空白“playground”文件。然后,需要點擊MacOS 選項并選擇Blank 項,接下來,輸入“playground”的名稱并單擊“create”完成“playground”文件的創(chuàng)建。最后,刪除“playground”文件中已有的代碼,將自定義編寫的SVM-AdaBoost 機器學習模型代碼輸入到新建的“playground”文件中。之后,可以導入昆蟲圖像訓練樣本開始模型訓練。模型訓練完成后,將測試樣本導入到“Drop images to begin testing”中,對測試樣本進行測試。測試完成后,模型將以mlmodel格式保存為文件。

如果模型訓練的準確性不理想,可以進一步篩選訓練樣本,以去除不合適的樣本。或者通過逐漸增加最大迭代次數(shù),例如將默認值10 更改為20,可以找到精度更高的參數(shù)?;蛘咄ㄟ^減少最大迭代次數(shù),以抑制訓練過程中的過度擬合。

2.5 圖像分類與識別昆蟲圖像分類識別的過程如下:首先,將采集到的昆蟲圖像作為輸入;其次,利用訓練后的模型對圖像進行分類和識別處理。此時,圖像轉換為IOS 系統(tǒng)獨有的“KCV Pixel Format Type_32bgra”格式,圖像像素轉換為299*299。如果圖像處理失敗,昆蟲識別軟件將顯示識別失敗的提示;如果圖像處理成功,則識別圖像。如果在識別過程中出現(xiàn)錯誤,將顯示識別錯誤;如果識別成功,將顯示識別昆蟲圖像。識別結果中僅僅顯示識別可信度為第一和第二的昆蟲科類別。昆蟲圖像分類識別流程如圖3所示。

圖3 昆蟲圖像分類識別流程

3 性能測試與識別效果分析

3.1 性能測試該軟件系統(tǒng)的真實測試環(huán)境基于iPhone6 的IOS 12.1,需要MacOS 10.14、Xcode 和開發(fā)人員賬戶。

3.1.1 性能定義 可靠性指系統(tǒng)在一定時間和一定條件下,無故障完成昆蟲圖像識別功能的能力或可能性。

本文在給定的圖像識別測試時間內(nèi),對系統(tǒng)的閃退、無響應和崩潰現(xiàn)象進行了評估。閃退指進入識別系統(tǒng)后迅速回到桌面,各項功能無法使用。無響應指可以進入系統(tǒng),但是在測試各種功能時,系統(tǒng)不會給出任何反饋。崩潰是指可以進入系統(tǒng),但在測試各種功能時,有錯誤或系統(tǒng)突然關機〔21〕。

實時性定義為在規(guī)定時間內(nèi)系統(tǒng)能夠進行昆蟲圖像識別的能力。

3.1.2 可靠性測試 首先,使用數(shù)據(jù)線將iPhone6與搭載MacOS 10.14 的計算機連接。其次,需打開Xcode,在調試設備下選擇iPhone。然后,需單擊開始按鈕,在iPhone6中打開設置,在Generic中選擇描述文件,然后在Developer APP 中選擇賬戶。再次,需點擊信任,退出設置,然后點擊Xcode中的開始按鈕,識別系統(tǒng)就可以安裝在iPhone6 中了。最后,需打開應用,依次測試拍照、選擇圖片、識別結果顯示、圖像顯示等功能,看是否可以正常運行。

通過100 次試驗,結果表明,系統(tǒng)沒有閃退、無響應、崩潰等現(xiàn)象,保證了系統(tǒng)的可靠性。

3.1.3 實時性測試 本文通過軟件調試計算了系統(tǒng)的啟動時間和圖像識別時間?!跋到y(tǒng)初始化”和“圖像選擇函數(shù)”之間的時間間隔被定義為啟動時間;“圖像選擇函數(shù)”和“識別結果”之間的時間間隔定義為圖像識別時間。

通過100 次的測試,結果顯示系統(tǒng)平均啟動時間為0.59 s,平均識別時間1.23 s,滿足了系統(tǒng)秒級實時性。

3.2 昆蟲圖像識別效果評價設昆蟲圖像測試樣本的目標分為正類和負類。定義以下參數(shù):預測為負類的負樣本數(shù)為TN(true negative),預測為正類的負樣本數(shù)為FN(false negative),預測為正類的正樣本數(shù)為TP(true positive),預測為負類的正樣本數(shù)為FP(false positive)。評價指標分別是準確率(accuracy)、精確度(precision)和回調率(recall)〔22〕。準確率考察總體27個科的識別效果,而精確度和回調率考察各個科的識別效果。

準確率定義為正確預測的樣本數(shù)量與昆蟲圖像總數(shù)的比例。公式為

精確度定義為所有預測為某類昆蟲的樣本中真正屬于該類昆蟲的樣本數(shù)所占的比例。公式為

回調率定義為某類昆蟲樣本中被正確預測的樣本數(shù)所占的比例。公式為

目前,27 個昆蟲科的識別準確率已達90.81%。表2 列出了平均精確度和平均回調率兩個評價指標,圖4顯示了識別結果的示例。

圖4 識別結果示例

表2 不同昆蟲科的精確度和回調率

4 結論

針對洱海濕地昆蟲分類識別難問題,本文提出了一種微型昆蟲圖像智能識別方法,該方法通過在IOS 移動平臺的軟件實現(xiàn),用核心機器學習模型對昆蟲樣本圖像做了學習與訓練,目前軟件系統(tǒng)能識別27 個昆蟲科。在真機應用測試中發(fā)現(xiàn)識別準確率達到了91%左右,精確度和回調率達到了92%左右。性能測試結果滿足了微型昆蟲圖像識別的可靠性和實時性要求。該研究結果為洱海濕地昆蟲研究提供了智能化信息處理技術支持。但是目前所能識別的昆蟲種類仍然不足,還需要大量圖片學習和訓練,識別準確率還有待進一步提高。

隨著5G 時代的到來,移動智能終端設備在全球的應用范圍日益廣泛,伴隨機器學習技術的飛速發(fā)展,移動終端的昆蟲智能分類與識別將成為一種趨勢。

猜你喜歡
超平面圖像識別種類
全純曲線的例外超平面
涉及分擔超平面的正規(guī)定則
基于Resnet-50的貓狗圖像識別
電子制作(2019年16期)2019-09-27 09:34:50
高速公路圖像識別技術應用探討
以較低截斷重數(shù)分擔超平面的亞純映射的唯一性問題
圖像識別在物聯(lián)網(wǎng)上的應用
電子制作(2018年19期)2018-11-14 02:37:04
種類豐富的酒具
收藏界(2018年1期)2018-10-10 05:23:08
圖像識別在水質檢測中的應用
電子制作(2018年14期)2018-08-21 01:38:16
消防車種類知多少
鏡頭像差的種類
宁陕县| 田东县| 霍城县| 吕梁市| 四会市| 辽源市| 府谷县| 吉林省| 耿马| 梁山县| 咸宁市| 公安县| 溆浦县| 延安市| 疏勒县| 华亭县| 汽车| 怀安县| 迁西县| 镇远县| 武穴市| 高邮市| 天气| 太康县| 靖宇县| 楚雄市| 青岛市| 孝义市| 宁明县| 喀什市| 抚松县| 平乐县| 阿合奇县| 曲阜市| 五寨县| 泉州市| 南江县| 开远市| 耒阳市| 龙岩市| 乌海市|