国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

Internet環(huán)境下在線圖像標(biāo)注軟件的設(shè)計與實現(xiàn)

2016-05-14 04:04李夢縈宋海玉岳青宇何炳金侯建新李俊華
中國高新技術(shù)企業(yè) 2016年5期
關(guān)鍵詞:網(wǎng)絡(luò)環(huán)境

李夢縈 宋海玉 岳青宇 何炳金 侯建新 李俊華

摘要:文章旨在利用現(xiàn)有的圖像標(biāo)注模型,開發(fā)一個能夠為用戶提供自動圖像標(biāo)注服務(wù)的軟件。為了使用戶能夠方便、即時地使用本軟件,軟件被設(shè)計為可以在網(wǎng)絡(luò)環(huán)境中運行、訪問的軟件。通過對比當(dāng)前主流的圖像自動標(biāo)注模型,文章選取著名的多重伯努利相關(guān)模型作為基礎(chǔ)標(biāo)注模型,并針對多重伯努利模型的一些不足進行了改進。

關(guān)鍵詞:圖像標(biāo)注模型;網(wǎng)絡(luò)環(huán)境;多重伯努利模型;相關(guān)模型;Internet環(huán)境 文獻標(biāo)識碼:A

中圖分類號:TP317 文章編號:1009-2374(2016)05-0013-02 DOI:10.13535/j.cnki.11-4406/n.2016.05.007

近年來,隨著電子技術(shù)和多媒體的興盛,數(shù)碼產(chǎn)品變得普及,互聯(lián)網(wǎng)上可存取的圖像數(shù)據(jù)正在以爆炸性的速度增長。在這種情況下,圖像數(shù)據(jù)每日以指數(shù)速度增長,如何方便快捷地查詢圖像逐漸成了對圖像數(shù)據(jù)庫進行有效管理的問題之一。為了更好地利用這些圖像資源,20世紀(jì)70年代末出現(xiàn)了圖像數(shù)據(jù)庫管理系統(tǒng)。該系統(tǒng)以人的手工標(biāo)注作為基礎(chǔ),但事實證明人工標(biāo)注存在著諸多問題,因此20世紀(jì)90年代末出現(xiàn)了自動圖像標(biāo)注的研究。圖像自動標(biāo)注技術(shù)的應(yīng)用前景非常廣泛,針對于普通用戶,它可以提供更人性化的以Web圖像檢索為基礎(chǔ)的圖像檢索服務(wù),提供圖像數(shù)據(jù)管理、分類、索引等便捷的功能。針對于一些應(yīng)用平臺,圖像自動標(biāo)注技術(shù)也會發(fā)揮巨大的作用,例如建立和管理數(shù)字圖書館。數(shù)字化設(shè)備正在變得越來越普及,圖書館逐漸開始把已有的館藏書籍轉(zhuǎn)化成數(shù)字圖像數(shù)據(jù),存儲和索引數(shù)量巨大的圖像數(shù)據(jù)可以依靠圖像標(biāo)注的現(xiàn)有研究技術(shù)來完成。

1 多重伯努利模型

在多重伯努利模型中,參與圖像標(biāo)注運算的數(shù)據(jù)是一個手工標(biāo)注的圖像數(shù)據(jù)集。使用T來代表這個手工標(biāo)注的圖像數(shù)據(jù)集,數(shù)據(jù)集T中每幅圖像都具有一定數(shù)量的標(biāo)注詞,使用V來代表數(shù)據(jù)集T中所有標(biāo)注詞的一個標(biāo)注關(guān)鍵字集合。假設(shè)圖像J是數(shù)據(jù)集T中的一幅圖像,那么圖像J的區(qū)域特征可以表示為:rJ={r1,r2,…,rn},rJ是圖像J的特征集合,n表示圖像J被分割的區(qū)域個數(shù),也代表圖像J的特征向量個數(shù)。圖像J的標(biāo)注詞可以表示為wJ={0,1}V,wJ表示圖像J的標(biāo)注詞集合,wJ是標(biāo)注詞集合V的一個子集,0和1代表圖像J中是否含有該標(biāo)注詞。假設(shè)一幅待標(biāo)注圖像A,那么綜合上述可以得到待標(biāo)注圖像A的圖像區(qū)域特征可以表示為:rA={g1,g2,…,gnA},wB是標(biāo)注詞集合V中的一個隨機子集,對于待標(biāo)注圖像A中出現(xiàn)詞匯wB的概率可以使用rA和wB的聯(lián)合概率P(rA,wB)來表示。圖像標(biāo)注的大致步驟:對于一幅待標(biāo)注圖像A,計算圖像A的每個區(qū)域與訓(xùn)練集T中每幅圖像J的條件概率,然后把圖像A的n個區(qū)域與圖像J的條件概率乘積,以乘積后的結(jié)果作為圖像A與圖像J的特征相似度。然后使用兩幅圖像的特征相似度乘以圖像J與標(biāo)注詞wB的多重伯努利概率,至此便得到了標(biāo)注詞wB出現(xiàn)在待標(biāo)注圖像A中的概率,但是為了這種訓(xùn)練方法的偶然性,需要使用訓(xùn)練集T中的所有圖像重復(fù)上述的計算過程,最后使用訓(xùn)練集T中所有圖像的計算結(jié)果做平均值處理,以平均值作為wB與A聯(lián)合概率。計算公式如下:

根據(jù)式(1)的計算結(jié)果,可以得到A和V中標(biāo)注詞匯的聯(lián)合概率,取聯(lián)合概率最大的前5個詞匯作為圖像A的標(biāo)注結(jié)果。計算公式如下所示:

2 軟件系統(tǒng)模塊設(shè)計與實現(xiàn)

2.1 軟件模塊劃分

系統(tǒng)設(shè)計了兩個模塊:圖像自動標(biāo)注功能模塊和圖像檢索功能模塊。其中圖像自動標(biāo)注功能模塊是軟件系統(tǒng)的主要功能。圖像檢索功能模塊為提供輔助性的功能模塊。

2.2 圖像標(biāo)注功能模塊設(shè)計與實現(xiàn)

圖像標(biāo)注是解決海量圖像數(shù)據(jù)組織管理的關(guān)鍵技術(shù)之一,伴隨著圖像自動標(biāo)注技術(shù)的發(fā)展,大量的人力和物力被投入到圖像自動標(biāo)注技術(shù)的研究,涌現(xiàn)出了很多優(yōu)秀的圖像標(biāo)注算法。本文通過著名的圖像標(biāo)注算法MBRM算法,來完成軟件中的圖像標(biāo)注功能。

由于本文設(shè)計的是一個在網(wǎng)絡(luò)環(huán)境中運行的在線圖像標(biāo)注軟件,圖像標(biāo)注功能模塊應(yīng)具有如下的三個功能:(1)可以通過用戶身邊的客戶端電腦使用瀏覽器訪問本軟件;(2)可以上傳喜好的圖像進行標(biāo)注;(3)標(biāo)注用戶上傳的圖像,在界面上向用戶提示標(biāo)注結(jié)果。

圖像自動標(biāo)注模塊的具體實現(xiàn)主要分為兩個方面:一方面是圖像自動標(biāo)注的模型算法,本文使用的模型算法為MBRM模型;另一方面是圖像的底層特征的選取和特征的提取方法。

圖像的視覺特征分為兩種:第一種,通用視覺特征。它一般用于描述圖像中的一些共有特征,與圖像的具體類型和內(nèi)容無關(guān),其主要內(nèi)容有紋理特征、顏色特征和形狀特征。另一種為領(lǐng)域相關(guān)特征,它是建立在圖像內(nèi)容的一些先驗知識上,與具體應(yīng)用有緊密聯(lián)系,例如人臉識別等。在本文中,我們只考慮使用通用的視覺特征。在通用特征中,我們選取顏色和紋理兩種類型的特征。

2.3 圖像檢索功能模塊設(shè)計與實現(xiàn)

圖像檢索功能模塊分成兩個部分:基于文本的圖像檢索和基于圖像內(nèi)容的圖像檢索。

(1)基于文本的圖像檢索。本文中基于文本的圖像檢索根據(jù)圖像標(biāo)注模塊得到的圖像數(shù)據(jù)進行檢索,以圖像標(biāo)注結(jié)果中的標(biāo)注詞作為關(guān)鍵字。檢索時,根據(jù)數(shù)據(jù)集中已有的關(guān)鍵字匹配,返回通過匹配的圖像。(2)基于內(nèi)容的圖像檢索?;趦?nèi)容的圖像檢索允許輸入一幅圖像,以查找具有相同或者相似內(nèi)容的其他圖像,它是計算機視覺領(lǐng)域中的重要研究分支。在基于內(nèi)容的圖像檢索主要依賴于兩個關(guān)鍵技術(shù):圖像特征提取和圖像匹配算法。本文中基于內(nèi)容的圖像檢索中的特征提取方法使用著名詞袋方法(Bag-Of-Words,BOW),BOW的大體思想是通過對現(xiàn)有圖像的分類,對提取的圖像特征進行聚類,將聚類得到的質(zhì)心作為BOW詞典中的詞,構(gòu)建BOW詞典。通過BOW的詞典來計算圖像的特征。

圖像檢索的匹配算法中,由于通過BOW提取的圖像特征向量中的數(shù)值比較離散,本文采用街區(qū)距離作為圖像的匹配算法。街區(qū)距離是數(shù)學(xué)模型中,計算空間中點到點距離的一種有效方法,距離越小,說明圖像越相近。圖像匹配完成后,對訓(xùn)練集中所有圖像的距離進行排序。取前500幅最相近的圖像返回。

3 結(jié)語

本文嘗試使用現(xiàn)有的圖像標(biāo)注技術(shù)來完成一個方便快捷的圖像標(biāo)注軟件,并希望能夠收集一些圖像數(shù)據(jù),為圖像標(biāo)注技術(shù)發(fā)展提供參考。但是由于受到了技術(shù)發(fā)展的限制,本文中設(shè)計的軟件還存在很多的不足,今后的技術(shù)發(fā)展中,圖像自動標(biāo)注軟件的開發(fā)是一個長期的發(fā)展目標(biāo)。

參考文獻

[1] 伊懷彬.基于語義的圖像多概念標(biāo)注[D].蘇州大學(xué),2009.

[2] Y.G.Jiang,C.W.Ngo,and J.Yang.Towards optimal bag-of-features for object categorization and semantic video retrieval.In ACM CIVR,2007.

[3] 陳戀.基于圖像文檔模型的圖像語義自動標(biāo)注[D].復(fù)旦大學(xué),2007.

作者簡介:李夢縈(1995-),女,河北唐山人,大連民族大學(xué)計算機科學(xué)與工程學(xué)院學(xué)生;宋海玉(1971-),男,河南安陽人,大連民族大學(xué)計算機科學(xué)與工程學(xué)院副教授,碩士研究生導(dǎo)師,博士,研究方向:圖像理解、計算機視覺;岳青宇(1991-),男,黑龍江尚志人,創(chuàng)世比特(北京)科技有限公司軟件工程師。

(責(zé)任編輯:周 瓊)

猜你喜歡
網(wǎng)絡(luò)環(huán)境
網(wǎng)絡(luò)環(huán)境對藝術(shù)類大學(xué)生的影響和對策
網(wǎng)絡(luò)環(huán)境下高職英語課程多維度評價方式研究
網(wǎng)絡(luò)環(huán)境下高校思想政治教育創(chuàng)新路徑探討
網(wǎng)絡(luò)環(huán)境下中職計算機教學(xué)的探析
網(wǎng)絡(luò)環(huán)境下大學(xué)生自主學(xué)習(xí)能力培養(yǎng)策略
基于網(wǎng)絡(luò)環(huán)境視角的學(xué)校圖書管理問題研究
試論高校圖書館在網(wǎng)絡(luò)環(huán)境沖擊下的人文建設(shè)
網(wǎng)絡(luò)環(huán)境下的大學(xué)生道德與法治教育淺析
網(wǎng)絡(luò)環(huán)境下的商務(wù)英語課程資源庫的建設(shè)研究
網(wǎng)絡(luò)視域下初中作文教學(xué)初探