国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于圖像特征細(xì)化的海量數(shù)據(jù)挖掘系統(tǒng)設(shè)計與實現(xiàn)

2017-01-19 14:55:45林凌許然
現(xiàn)代電子技術(shù) 2016年24期

林凌 許然

摘 要: 傳統(tǒng)基于圖像內(nèi)容的圖像數(shù)據(jù)挖掘算法,對海量圖像特征的分類效率低,對圖像數(shù)據(jù)的挖掘準(zhǔn)確率受樣本數(shù)量影響較大。因此,提出一種基于圖像特征細(xì)化的海量數(shù)據(jù)挖掘系統(tǒng),其中的人機界面可賦予系統(tǒng)較高的交互性。圖像搜索引擎能夠智能地從互聯(lián)網(wǎng)海量的圖像數(shù)據(jù)中,采集有價值圖像數(shù)據(jù)和特征。圖像預(yù)處理模塊對圖像格式進(jìn)行變換,完成圖像噪聲因素的過濾等操作,并對采集圖像特征進(jìn)行細(xì)化。數(shù)據(jù)挖掘模塊依據(jù)采集的圖像特征細(xì)化結(jié)果塑造CMQL語句,從圖像數(shù)據(jù)庫中挖掘出有價值的圖像數(shù)據(jù)。系統(tǒng)實現(xiàn)部分給出了數(shù)據(jù)挖掘查詢語言CMQL進(jìn)行圖像數(shù)據(jù)的挖掘過程。實驗結(jié)果表明,所設(shè)計系統(tǒng)具有較高的查準(zhǔn)率和查全率。

關(guān)鍵詞: 圖像特征細(xì)化; 海量數(shù)據(jù)挖掘; 圖像數(shù)據(jù)挖掘; 圖像噪聲過濾

中圖分類號: TN911.73?34; TP311 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2016)24?0113?03

Design and implementation of mass data mining system based on

image feature refinement

LIN Ling1, XU Ran2

(1. Fujian Institute of Education, Fuzhou 350025, China; 2. Zhejiang Sci?Tech University, Hangzhou 310018, China)

Abstract: The traditional image data mining algorithm based on image content has low classification efficiency of the mass image features, and high influence on the image data mining accuracy affected by the sample quantity. Therefore, a mass data mining system based on image feature refinement is proposed, in which the man?machine interface endows the system with the high interactivity. The image search engine can intelligently collect the valuable image data and features in mass Internet image data. The image preprocessing module is used to transform the image format, complete the image filtering of noise factors, and refine the acquired image features. The data mining module is used to model the CMQL statements according to the collected image feature refinement results, and mine the valuable image data in the image database. The image data mining process performed with the data mining query language CMQL is given in the system implementation section. The experimental results show that the system has high precision ratio and recall ratio.

Keywords: image feature refinement; mass data mining; image data mining; image noise filtering

隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展和計算機性能的不斷增強,不同行業(yè)對圖像應(yīng)用的不斷增加,導(dǎo)致監(jiān)視相機、醫(yī)療影像系統(tǒng)、衛(wèi)星遙感系統(tǒng)等圖像采集部件的應(yīng)用領(lǐng)域逐漸擴大。而這些部件采用圖像挖掘技術(shù)對采集的數(shù)據(jù)進(jìn)行自主分析,從中挖掘出有價值的圖像數(shù)據(jù)的需要也逐漸增加[1?3]。

傳統(tǒng)基于圖像內(nèi)容的圖像數(shù)據(jù)挖掘算法,對海量圖像特征的分類效率低,對圖像數(shù)據(jù)的挖掘準(zhǔn)確率受樣本數(shù)量影響較高。因此,尋求有效的海量圖像數(shù)據(jù)挖掘算法,具有重要的應(yīng)用意義[4?6]。

1 海量數(shù)據(jù)挖掘系統(tǒng)設(shè)計與實現(xiàn)

1.1 系統(tǒng)總體結(jié)構(gòu)

基于圖像特征細(xì)化的圖像檢索,通過數(shù)據(jù)庫保存圖像數(shù)據(jù),并且對圖像的顏色、紋理、形狀等特征進(jìn)行細(xì)化,進(jìn)而完成圖像數(shù)據(jù)的挖掘。塑造基于圖像特征細(xì)化的海量圖像數(shù)據(jù)挖掘系統(tǒng),系統(tǒng)總體結(jié)構(gòu)如圖1所示。

該系統(tǒng)包括人機界面、圖像檢索引擎、圖像數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)挖掘模塊、數(shù)據(jù)庫系統(tǒng)和知識庫系統(tǒng)。

1.2 人機界面設(shè)計

僅靠數(shù)據(jù)挖掘系統(tǒng)自身挖掘圖像數(shù)據(jù),容易形成大量用戶不關(guān)心的模式。因此,需要用戶通過交互方式,參與到具體的數(shù)據(jù)挖掘。設(shè)計的人機界面結(jié)構(gòu)如圖2所示。

檢索模塊用于完成圖像的檢索,用戶采用瀏覽器給出圖像特征,進(jìn)而產(chǎn)生對應(yīng)的圖像檢索申請。智能代理是一個動態(tài)的檢索接口,若用戶未在當(dāng)前的數(shù)據(jù)庫中檢索到有價值圖像數(shù)據(jù),則智能代理存儲用戶申請,采用圖像獲取系統(tǒng)自主在網(wǎng)絡(luò)中進(jìn)行檢索,并且將檢索結(jié)果反饋給用戶。

1.3 圖像搜索引擎設(shè)計

圖像搜索引擎的結(jié)構(gòu)見圖3,其可在網(wǎng)上采集圖像,并對圖像進(jìn)行相似性運算,執(zhí)行用戶圖像數(shù)據(jù)檢索需求。

1.4 數(shù)據(jù)挖掘模塊設(shè)計

數(shù)據(jù)挖掘模塊是系統(tǒng)的關(guān)鍵,系統(tǒng)通過模塊化方法,將圖像數(shù)據(jù)挖掘部分的不同功能設(shè)計成規(guī)范的組件,并且依據(jù)相應(yīng)的組裝規(guī)則和約束條件,塑造成完整的圖像數(shù)據(jù)挖掘模塊,其結(jié)構(gòu)如圖4所示。

2 實驗分析

通過實驗驗證本文設(shè)計的基于圖像特征細(xì)化的海量數(shù)據(jù)挖掘系統(tǒng)的性能。實驗采用圖像檢索引擎,分別輸入bird,bike,car,flower,plane關(guān)鍵詞,并將待檢索圖像中的前50幅圖像存儲到機器硬盤內(nèi),并且分別設(shè)對應(yīng)的圖像庫。

實驗1采用bird圖像庫,并采集顏色特征和形狀特征,采用基于圖像內(nèi)容的挖掘系統(tǒng)和本文挖掘系統(tǒng)對圖像進(jìn)行分類挖掘。具體的挖掘結(jié)果如表1、表2所示。

從表1中的數(shù)據(jù)可以看出,相對于基于圖像內(nèi)容的挖掘系統(tǒng),本文挖掘系統(tǒng)的查準(zhǔn)率和查全率都較高,說明通過采集圖像顏色特征,并利用本文挖掘方法可提高海量圖像數(shù)據(jù)的查全率和查準(zhǔn)率。從表2中的數(shù)據(jù)可以看出,本文系統(tǒng)進(jìn)行挖掘的查準(zhǔn)率和查全率都高于傳統(tǒng)系統(tǒng),說明通過采集圖像形狀特征,采用本文提出的關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行挖掘,具有較高的查全率、查準(zhǔn)率。

實驗2針對bird圖像庫、bike圖像庫、car圖像庫、flower圖像庫,從中采集形狀特征,并進(jìn)行細(xì)化,分別采用基于圖像內(nèi)容的挖掘系統(tǒng)和本文挖掘系統(tǒng)對圖像數(shù)據(jù)進(jìn)行挖掘,具體的挖掘結(jié)果分別如表3、表4所示。

實驗3采用4個實驗圖像庫,并從中采集形狀特征,再分別采用基于圖像內(nèi)容的挖掘系統(tǒng)和本文挖掘系統(tǒng),對實驗圖像庫進(jìn)行挖掘。結(jié)果分別見表5和表6。

表5 基于圖像內(nèi)容系統(tǒng)進(jìn)行形狀特征采集圖像庫的挖掘結(jié)果

對比分析表5和表6可以看出,采用本文挖掘系統(tǒng)進(jìn)行挖掘,能夠大幅度提高查準(zhǔn)率。相對于基于圖像內(nèi)容的挖掘系統(tǒng),本文挖掘系統(tǒng)能夠更加準(zhǔn)確地挖掘到正確圖像,具有較高的應(yīng)用價值。

3 結(jié) 論

本文設(shè)計一種基于圖像特征細(xì)化的海量數(shù)據(jù)挖掘系統(tǒng),其中的人機界面能夠賦予系統(tǒng)較高的交互性。圖像搜索引擎能夠智能地從互聯(lián)網(wǎng)海量的圖像數(shù)據(jù)中,采集有價值的圖像數(shù)據(jù)和特征。圖像預(yù)處理模塊對圖像格式進(jìn)行變換,完成圖像噪聲因素的過濾等操作,并對采集圖像特征進(jìn)行細(xì)化。數(shù)據(jù)挖掘模塊依據(jù)采集的圖像特征細(xì)化結(jié)果塑造CMQL語句,從圖像數(shù)據(jù)庫中挖掘出有價值的圖像數(shù)據(jù)。系統(tǒng)實現(xiàn)部分給出了數(shù)據(jù)挖掘查詢語言CMQL進(jìn)行圖像數(shù)據(jù)挖掘的過程。實驗結(jié)果表明,所設(shè)計系統(tǒng)具有較高的查準(zhǔn)率和查全率。

表6 本文挖掘系統(tǒng)進(jìn)行形狀特征采集圖像庫的挖掘結(jié)果

參考文獻(xiàn)

[1] 王紅斌,陳揚,高雅,等.基于數(shù)據(jù)挖掘的預(yù)警技術(shù)在一體化輸電設(shè)備監(jiān)測中的應(yīng)用研究[J].電網(wǎng)與清潔能源,2014,30(1):55?58.

[2] 李正,康立源,范驍輝.中藥制藥過程數(shù)據(jù)集成、數(shù)據(jù)挖掘與可視化技術(shù)研究[J].中國中藥雜志,2014,39(15):2989?2992.

[3] 蘇曉青,黃翔,王俊.蒸發(fā)式冷凝冷水機組在數(shù)據(jù)中心的應(yīng)用分析[J].西安工程大學(xué)學(xué)報,2016,30(1):37?42.

[4] 李德仁,張良培,夏桂松.遙感大數(shù)據(jù)自動分析與數(shù)據(jù)挖掘[J].測繪學(xué)報,2014,43(12):1211?1216.

[5] 吳嘉瑞,唐仕歡,郭位先,等.基于數(shù)據(jù)挖掘的名老中醫(yī)經(jīng)驗傳承研究述評[J].中國中藥雜志,2014,39(4):614?617.

[6] 朱利鵬,陸超,孫元章,等.基于數(shù)據(jù)挖掘的區(qū)域暫態(tài)電壓穩(wěn)定評估[J].電網(wǎng)技術(shù),2015,39(4):1026?1032.

[7] 張翔,徐洪平,安雪巖,等.液體火箭發(fā)動機穩(wěn)態(tài)運行故障數(shù)據(jù)聚類分析研究[J].火箭推進(jìn),2015(2):118?122.

洛川县| 宜黄县| 大方县| 商都县| 咸丰县| 兴义市| 南阳市| 吴堡县| 长垣县| 宁远县| SHOW| 大田县| 湄潭县| 宁安市| 札达县| 抚远县| 乌拉特中旗| 梁平县| 稻城县| 广宁县| 团风县| 武夷山市| 泸溪县| 北票市| 盐池县| 瓦房店市| 安新县| 永德县| 保靖县| 司法| 灵石县| 翁源县| 营口市| 琼中| 五指山市| 长子县| 新乡市| 西峡县| 清新县| 义马市| 上林县|