国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)數(shù)據(jù)挖掘方法及技術(shù)分析

2016-11-14 00:15:25吳華芹柳靜
電腦知識(shí)與技術(shù) 2016年24期

吳華芹 柳靜

摘要:網(wǎng)絡(luò)數(shù)據(jù)挖掘旨在從網(wǎng)絡(luò)數(shù)據(jù)源中提取隱含的知識(shí),借助傳統(tǒng)的數(shù)據(jù)挖掘方法很難實(shí)現(xiàn)。網(wǎng)絡(luò)數(shù)據(jù)挖掘注重事物之間的屬性及聯(lián)系,通過(guò)無(wú)數(shù)個(gè)體數(shù)據(jù)的分析和特殊算法的使用,實(shí)現(xiàn)模型的可視化和連接趨勢(shì)。網(wǎng)絡(luò)數(shù)據(jù)挖掘方法是傳統(tǒng)數(shù)據(jù)挖掘方法的補(bǔ)充,可以很好地解決復(fù)雜的自然屬性組成的問(wèn)題。該文提出了社交網(wǎng)絡(luò)數(shù)據(jù)挖掘的方法與技術(shù),提出了相關(guān)數(shù)據(jù)分析及模型設(shè)計(jì)。

關(guān)鍵詞:網(wǎng)絡(luò)數(shù)據(jù)挖掘;Harr特征;AdaBoost分類

中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)24-0013-02

隨著信息技術(shù)的迅猛發(fā)展,人類社會(huì)大步邁入了網(wǎng)絡(luò)時(shí)代,網(wǎng)絡(luò)數(shù)據(jù)挖掘已成為數(shù)據(jù)挖掘中的一個(gè)重要研究課題。網(wǎng)絡(luò)數(shù)據(jù)挖掘注重事物之間的屬性及聯(lián)系,通過(guò)無(wú)數(shù)個(gè)體數(shù)據(jù)的分析和特殊算法的使用,實(shí)現(xiàn)模型的可視化和連接趨勢(shì)。運(yùn)用網(wǎng)絡(luò)數(shù)據(jù)挖掘可以很好地解決復(fù)雜的自然屬性組成的問(wèn)題。

1 數(shù)據(jù)挖掘技術(shù)

1.1概念

數(shù)據(jù)挖掘就是借助程序管理對(duì)海量數(shù)據(jù)進(jìn)行分析歸納匯總。其挖掘程序依次為應(yīng)用界面層、應(yīng)用服務(wù)層和數(shù)據(jù)庫(kù)層。三層結(jié)構(gòu)緊密聯(lián)系,互相配合完成數(shù)據(jù)挖掘任務(wù)。用戶要進(jìn)行數(shù)據(jù)挖掘,需要應(yīng)用界面層的請(qǐng)求響應(yīng),請(qǐng)求信息反映到應(yīng)用服務(wù)層后,得到允許才可以進(jìn)入數(shù)據(jù)庫(kù)訪問(wèn),提取相關(guān)數(shù)據(jù)并進(jìn)行分析。數(shù)據(jù)挖掘可以有效地對(duì)數(shù)據(jù)進(jìn)行整理與分析,使之規(guī)范化與合理化,方便匯總與管理,提高了相關(guān)數(shù)據(jù)的安全性與有序性,提高了管理效率與管理水平。

1.2傳統(tǒng)數(shù)據(jù)挖掘

1.3網(wǎng)絡(luò)數(shù)據(jù)挖掘

網(wǎng)絡(luò)數(shù)據(jù)挖掘是個(gè)新生事物,籠統(tǒng)地講析太過(guò)抽象,所以我們就以社交網(wǎng)站為例來(lái)探析下網(wǎng)絡(luò)數(shù)據(jù)挖掘。微博誕生也不過(guò)數(shù)年光景,就以之為例。微博是大家熟知的社交網(wǎng)站,通過(guò)社交網(wǎng)站的數(shù)據(jù)挖掘的管理流程,就可窺一斑而見(jiàn)全豹,對(duì)整個(gè)網(wǎng)絡(luò)數(shù)據(jù)挖掘的方法與技術(shù)就都可以融會(huì)貫通了。我們可以舉個(gè)例子,譬如應(yīng)用面向?qū)ο蟮南到y(tǒng)分析方法與設(shè)計(jì)等等。

2 網(wǎng)絡(luò)數(shù)據(jù)挖掘方法

2.1構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘體系

網(wǎng)絡(luò)技術(shù)的快速發(fā)展,對(duì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行海選分析及綜合提供了便利。以社交網(wǎng)站為例,如果要進(jìn)行相關(guān)信息的數(shù)據(jù)挖掘,實(shí)現(xiàn)高質(zhì)量與高效率,就要通過(guò)對(duì)海量數(shù)據(jù)的處理與整合,使用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)及數(shù)據(jù)挖掘技術(shù)是個(gè)不錯(cuò)的選擇。為最大限度節(jié)約時(shí)間及減少運(yùn)行成本,構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)挖掘體系是至關(guān)重要的。一般體系結(jié)構(gòu)如下圖所示(圖2)。構(gòu)建了數(shù)據(jù)倉(cāng)庫(kù)體系,可以高效對(duì)數(shù)據(jù)進(jìn)行管理與匯總,對(duì)相關(guān)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,最后得出自己需要的信息。

2.2 網(wǎng)絡(luò)數(shù)據(jù)挖掘分析

2.2.1 圖像內(nèi)容的信息挖掘

網(wǎng)絡(luò)用戶很多喜歡上傳分享一些照片、視頻等圖像內(nèi)容,對(duì)這類信息如何進(jìn)行挖掘呢?人們一般運(yùn)用積分圖加速Harr特征來(lái)進(jìn)行信息提取。

Harr特征一般分為邊緣特征、斜線特征、中心特征和對(duì)角線特征四個(gè)類別。將這些特征融合在一起就可以形成新的特征模板。新的特征模板內(nèi)都有白色與黑色區(qū)域,其特征值為白色像素減去黑色像素的差。

3 小結(jié)

網(wǎng)絡(luò)數(shù)據(jù)挖掘是個(gè)技術(shù)性很強(qiáng)的全新課題,需要在實(shí)際電腦操作中進(jìn)行不斷學(xué)習(xí)與實(shí)踐。本文只是簡(jiǎn)單介紹了一些常用的方法與技術(shù),由于篇幅有限,對(duì)具體操作也只是做了簡(jiǎn)單介紹,希望能為廣大朋友牽線搭橋,拋磚引玉,為今后在實(shí)際運(yùn)用中做個(gè)指導(dǎo)。

參考文獻(xiàn):

[1] 林秀琴.一種改進(jìn)的Snort系統(tǒng)模型[J].電腦知識(shí)與技術(shù),2011(13).

[2] 付雄.基于分布式智能代理的反網(wǎng)絡(luò)洗錢技術(shù)研究[J].計(jì)算機(jī)工程與科學(xué),2011(7).

[3] 孫燕花,李杰,李建.基于CURE算法的網(wǎng)絡(luò)用戶行為分析[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011(9).

[4] 劉夢(mèng)超,肖基毅,陳榮,等.數(shù)據(jù)挖掘在用戶上網(wǎng)行為分析中的應(yīng)用研究[J].電腦知識(shí)與技術(shù),2012(31).

晋江市| 灵寿县| 乳山市| 汶川县| 新安县| 荆门市| 三门县| 涿州市| 淅川县| 陵川县| 五大连池市| 综艺| 汶上县| 广元市| 台东县| 陵川县| 平陆县| 阿鲁科尔沁旗| 凤冈县| 连州市| 井冈山市| 玉山县| 长葛市| 阿鲁科尔沁旗| 封丘县| 合肥市| 庄河市| 阳城县| 临桂县| 枝江市| 晋中市| 申扎县| 建瓯市| 个旧市| 呼玛县| 三门峡市| 巴林右旗| 日照市| 永德县| 临泽县| 东台市|