国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于雙模語(yǔ)義空間的圖像標(biāo)注

2017-12-21 00:04曹瑛
關(guān)鍵詞:關(guān)聯(lián)語(yǔ)義特征

曹瑛

摘要:本文著眼于圖像底層視覺(jué)和文本標(biāo)簽這兩種模態(tài)信息,探討基于雙模語(yǔ)義空間的圖像標(biāo)注技術(shù)。將視覺(jué)特征與文本標(biāo)注表示為同一對(duì)象的兩種視圖方式,考慮兩個(gè)特征空間之間的語(yǔ)義對(duì)偶關(guān)系,在雙模主題構(gòu)成的對(duì)稱空間上構(gòu)建一個(gè)非概率主題標(biāo)注模型,為圖像標(biāo)注研究提供新思路和理論依據(jù)。

關(guān)鍵詞:圖像標(biāo)注;雙模;語(yǔ)義

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)10-0098-01

隨著網(wǎng)絡(luò)多媒體數(shù)據(jù)的劇增,圖片正呈爆炸式增長(zhǎng),人們?nèi)绾螐暮A康膱D像中找到自己想要的圖像是當(dāng)前研究的熱點(diǎn)。如果能將圖片用若干文本進(jìn)行標(biāo)注,就能將圖像的檢索問(wèn)題轉(zhuǎn)換成更為成熟的文本檢索問(wèn)題來(lái)處理,所以實(shí)現(xiàn)圖像語(yǔ)義檢索的關(guān)鍵便是自動(dòng)圖像標(biāo)注技術(shù),即給未知圖像添加能描述其內(nèi)容的文本關(guān)鍵詞的方法。

1 自動(dòng)標(biāo)注常用算法

圖像自動(dòng)標(biāo)注方法大概可以分成兩類:有監(jiān)督分類的方法和關(guān)聯(lián)建模的方法。其中有監(jiān)督分類的方法是將各個(gè)語(yǔ)義類別看作獨(dú)立的概念,為每個(gè)語(yǔ)義類別建立單獨(dú)的分類器[3]。新進(jìn)一幅圖片,通過(guò)計(jì)算視覺(jué)特征相似度,將相應(yīng)的文本關(guān)鍵詞傳播給新圖片。

關(guān)聯(lián)模型這類方法利用現(xiàn)有的已標(biāo)注好的圖像數(shù)據(jù)集,試圖在無(wú)監(jiān)督的基礎(chǔ)上學(xué)習(xí)圖像的視覺(jué)特征和文本關(guān)鍵詞之間的關(guān)聯(lián),再將這種關(guān)聯(lián)應(yīng)用于未標(biāo)注的新圖像,通過(guò)統(tǒng)計(jì)推理來(lái)預(yù)測(cè)新圖像的語(yǔ)義信息。

借助有標(biāo)注的圖像訓(xùn)練集,運(yùn)用無(wú)監(jiān)督學(xué)習(xí)的方法對(duì)圖像視覺(jué)特征和標(biāo)簽關(guān)鍵詞之間的語(yǔ)義關(guān)聯(lián)進(jìn)行建模,對(duì)于新的未標(biāo)注圖像,通過(guò)這種關(guān)聯(lián)再進(jìn)行統(tǒng)計(jì)推理得到標(biāo)注詞匯。這種基于概率關(guān)聯(lián)的模型方法最早提出的有機(jī)器翻譯模型、跨媒體相關(guān)模型、對(duì)偶跨媒體相關(guān)模型[2]。近年來(lái)LDA模型[3]取得了更好的成效,首先在圖像的視覺(jué)特征空間和文本特征空間分別生成潛在主題,選擇一個(gè)子集形成混合的LDA模型來(lái)實(shí)現(xiàn)語(yǔ)義標(biāo)注。基于概率的PLSA-MIXED模型[4],則是將視覺(jué)特征和文本特征串聯(lián)組合成一個(gè)混合的特征空間,完成基于潛在語(yǔ)義分析的圖像標(biāo)注。PLSA-FUSION模型[5]則是通過(guò)分別建立視覺(jué)潛在語(yǔ)義空間和文本潛在語(yǔ)義空間,然后采用動(dòng)態(tài)自適應(yīng)的方法進(jìn)行融合,形成它們共同的潛在主題空間。

這些提取圖像不同模態(tài)潛在主題的統(tǒng)計(jì)模型在圖像標(biāo)注領(lǐng)域已取得成功的應(yīng)用,但是在這些基于PLSA的圖像標(biāo)注模型中,既沒(méi)有考慮文本關(guān)鍵詞之間的語(yǔ)義關(guān)聯(lián),也沒(méi)有考慮視覺(jué)特征之間的語(yǔ)義關(guān)聯(lián),如果能將這兩種因素都進(jìn)行考慮,必然會(huì)提升圖像標(biāo)注的性能。

本文著力于構(gòu)建一個(gè)語(yǔ)義空間能夠很好的反映圖像與圖像、標(biāo)注與標(biāo)注、圖像與標(biāo)注之間的語(yǔ)義對(duì)應(yīng)關(guān)系,提出基于雙模語(yǔ)義空間的圖像標(biāo)注技術(shù)。首先將視覺(jué)特征與文本標(biāo)注表示為同一對(duì)象的兩種視圖方式,運(yùn)用偏最小二乘(PLS)的多元統(tǒng)計(jì)分析理論,考慮兩個(gè)特征空間之間的語(yǔ)義對(duì)偶關(guān)系,抽取得到雙模態(tài)共有語(yǔ)義信息,在雙模主題構(gòu)成的對(duì)稱空間上構(gòu)建一個(gè)非概率主題標(biāo)注模型,為圖像標(biāo)注研究提供新思路和理論依據(jù)。

2 雙模語(yǔ)義的圖像標(biāo)注

我們擬在數(shù)據(jù)集上,將視覺(jué)特征與對(duì)應(yīng)的標(biāo)注看成是從同一表示層面描述相同對(duì)象形成的不同視圖,提取同一對(duì)象在各表示層面上的語(yǔ)義表示,綜合考慮圖像與圖像、標(biāo)注與標(biāo)注、圖像與標(biāo)注之間的語(yǔ)義對(duì)應(yīng)關(guān)系,構(gòu)建雙模態(tài)的潛在語(yǔ)義主題空間。圖像集中的m幅圖像的兩種模態(tài)特征分別表示為視覺(jué)特征和文本特征,使用偏最小二乘(PLS)從數(shù)據(jù)集中為圖像視覺(jué)特征和標(biāo)簽文本特征抽取對(duì)偶主題空間,通過(guò)模型化語(yǔ)義相關(guān)性的統(tǒng)計(jì)依賴關(guān)系來(lái)建立雙模主題的語(yǔ)義對(duì)應(yīng)關(guān)系。圖像投影到雙模主題空間計(jì)算圖像與圖像的相似度,標(biāo)注與標(biāo)注的相似度進(jìn)一步改善圖像的標(biāo)注。

新來(lái)一幅未標(biāo)注圖像,視覺(jué)特征表示為

,經(jīng)變換得到:

(1)

其中,,然后根據(jù)訓(xùn)練得到的ξi,按照下面的公式,遞推出未標(biāo)注圖像在視覺(jué)主題空間的投影向量:

(2)

(3)

其中,pk是回歸系數(shù),tk0是中間變量,最終圖像的標(biāo)注屬性可以這樣計(jì)算出來(lái):

(4)

可以看到矩陣y方便的表示圖像的標(biāo)簽屬性,而對(duì)于每一幅待標(biāo)注圖像最終得到預(yù)測(cè)向量,它的每個(gè)分量代表對(duì)應(yīng)標(biāo)簽的預(yù)測(cè)結(jié)果,預(yù)測(cè)結(jié)果越接近,分配該標(biāo)簽關(guān)鍵詞的可能性越大。我們通過(guò)對(duì)每一個(gè)標(biāo)簽關(guān)鍵詞預(yù)設(shè)一個(gè)闡值來(lái)判斷它是否作為圖像的標(biāo)注信息。

參考文獻(xiàn)

[1]Blei DM, Jordan MI. Modeling annotated data. In: Proc. of the 26th Intl ACM SIGIR Conf. on Research and Development in Information Retrieval. New York: ACM Press, 2003. 127-134.

[2]Jeon J, Lavrenko V, Manmatha R. Automatic image annotation and retrieval using cross-media relevance models. In: Proc. of the 26th Intl ACM SIGIR Conf. on Research and Development in Information Retrieval. New York: ACM Press, 2013. 119-126.

[3]Lavrenko V, Manmatha R, Jeon J. A model for learning the semantics of pictures. In: Thrun S, Saul LK, Scholkopf B, eds. Advances in Neural Information Processing Systems 16. Cambridge: MIT Press, 2004. 553-560.

[4]Monay F, Gatica-Perez D. Modeling semantic aspects for cross-media image indexing. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2009,29(10):1802-1817.

[5]李志欣,施智平,李志清, 史忠植. 融合語(yǔ)義主題的圖像自動(dòng)標(biāo).Journal of Software,2011,22(4):801-812endprint

猜你喜歡
關(guān)聯(lián)語(yǔ)義特征
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
語(yǔ)言與語(yǔ)義
如何表達(dá)“特征”
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
不忠誠(chéng)的四個(gè)特征
奇趣搭配
抓住特征巧觀察
智趣
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語(yǔ)義模糊
德格县| 报价| 营山县| 阿拉尔市| 元朗区| 富民县| 义马市| 奉化市| 宜宾市| 西藏| 枣庄市| 通江县| 高雄市| 青浦区| 辉县市| 孟州市| 茌平县| 汨罗市| 札达县| 子长县| 麻江县| 岑巩县| 黎平县| 利川市| 济南市| 张家港市| 东海县| 陵川县| 山阳县| 湘乡市| 平湖市| 武山县| 隆安县| 承德县| 峨眉山市| 通州市| 延长县| 抚松县| 武平县| 安吉县| 平阳县|