国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分布式圖聚類及其在電子商務(wù)數(shù)據(jù)挖掘中的應(yīng)用

2015-06-24 11:18趙穎
電腦知識(shí)與技術(shù) 2015年2期
關(guān)鍵詞:數(shù)據(jù)挖掘

趙穎

摘要:在科技發(fā)達(dá)的今天,網(wǎng)絡(luò)信息技術(shù)日漸進(jìn)步。電子商務(wù)發(fā)展迅猛,收到了許多國(guó)家的重視與青睞。分布式圖聚類是與之相聯(lián)系的事情的內(nèi)部與外部事件進(jìn)行連接,形成分布式分析圖。而數(shù)據(jù)挖掘是根究我們對(duì)已知的客戶資料,包括客戶的家庭信息,錢財(cái)狀況,情感屬性等等進(jìn)行數(shù)據(jù)中和,從而達(dá)到想要從中了解到的真實(shí)狀況。根據(jù)想要在電子商務(wù)上推出的一系列產(chǎn)品中做出更適合大眾想要,更受大眾喜愛(ài)的產(chǎn)品。在電子商務(wù)數(shù)據(jù)挖掘中,電子商家網(wǎng)站還可以從中獲得靈感,制作出更被社會(huì)所欣賞的東西。電子商務(wù)挖掘中的分布式圖聚類是受很多個(gè)國(guó)家的電子商務(wù)所青睞的數(shù)據(jù)反饋信息的一個(gè)研究方法。在電子商務(wù)數(shù)據(jù)挖掘中有很多問(wèn)題,比如說(shuō)客戶的人數(shù)眾多,無(wú)法正確完整的分析,再或者是商品的種類復(fù)雜等等。雖然數(shù)據(jù)挖掘在大多數(shù)情況下都是用電腦完成的,但是也有一定的局限。很難正確的分析出客戶與商家的正確的聯(lián)系。該文主要介紹的是分布式圖聚類在其電子商務(wù)數(shù)據(jù)挖掘的應(yīng)用。分布式圖聚類是相對(duì)于一般圖聚類的來(lái)說(shuō)它是比較清晰可觀地反映出數(shù)據(jù)之間的聯(lián)系的一種圖聚類,也是目前來(lái)說(shuō)應(yīng)用比較廣的圖聚類。

關(guān)鍵詞:數(shù)據(jù)挖掘;圖聚類;分布式圖聚類

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)02-0014-02

分布式圖聚類在電子商務(wù)數(shù)據(jù)挖掘中的應(yīng)用是十分廣泛的。國(guó)家在網(wǎng)上購(gòu)物的數(shù)量逐漸加大,網(wǎng)上商城的競(jìng)爭(zhēng)力也逐漸地加大,各個(gè)網(wǎng)站都會(huì)使出渾身解數(shù)去驚醒電子商務(wù)數(shù)據(jù)挖掘,來(lái)為商家提供有力的資料來(lái)幫助自己進(jìn)行商業(yè)上的改進(jìn)和整編。但是隨著購(gòu)物的數(shù)據(jù)的加大,分析數(shù)據(jù)的信息難度就越來(lái)越大,以往的數(shù)據(jù)類已經(jīng)滿足不了商家們對(duì)數(shù)據(jù)分析的要求,圖聚類的產(chǎn)生補(bǔ)充了數(shù)據(jù)類的不足,圖聚類解決了數(shù)據(jù)龐大的問(wèn)題,可以說(shuō)是電子商務(wù)發(fā)掘的進(jìn)步。其中,最為代表性的就是分布式圖聚類。在我們國(guó)家的網(wǎng)上商城比如說(shuō);淘寶、天貓、京東、聚美優(yōu)品、蘇寧易購(gòu)等個(gè)大知名網(wǎng)站,據(jù)網(wǎng)上的商家們都會(huì)對(duì)電子商務(wù)數(shù)據(jù)進(jìn)行挖掘與研究,同時(shí),使用分布式圖聚類方法的網(wǎng)站不在少數(shù)。分布式圖聚類它解決了數(shù)據(jù)量大難以正確的評(píng)估、從而導(dǎo)致計(jì)算失誤的發(fā)生。經(jīng)過(guò)許多次的實(shí)驗(yàn),我們發(fā)現(xiàn)分布式圖聚類是非常穩(wěn)定與安全的。分布式圖聚類的產(chǎn)生促進(jìn)了電子商務(wù)數(shù)據(jù)挖掘的發(fā)展,在對(duì)數(shù)據(jù)的穩(wěn)定性與安全性中也有了很大的進(jìn)步。

1 分布式圖聚類的應(yīng)用

分布式圖聚類的應(yīng)用在我國(guó)可以說(shuō)是被廣泛地應(yīng)用,由于它自身的優(yōu)點(diǎn)和好處所以備受廣大商家采用。分布式圖聚類的特點(diǎn)主要是針對(duì)相對(duì)較大的規(guī)模的數(shù)據(jù)進(jìn)行分析和處理,這是傳統(tǒng)聚圖類無(wú)法做到的。它既能省去很多商家因?yàn)橛?jì)算數(shù)據(jù)而產(chǎn)生的極大的成本,還能保證我們所得到的數(shù)據(jù)的真實(shí)和準(zhǔn)確。分布式圖聚類的發(fā)現(xiàn)與應(yīng)用可以說(shuō)是電子商務(wù)數(shù)據(jù)挖掘中的一個(gè)進(jìn)步與提高。

1)什么是分布式圖聚類

我們可以知道在科技日益發(fā)展的今天,越來(lái)越多的人在熟用電腦并在網(wǎng)上購(gòu)物,進(jìn)行交易。隨著數(shù)量的日益增加,網(wǎng)上商城的電子商務(wù)數(shù)據(jù)挖掘就愈來(lái)愈難,原來(lái)傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)方式很快就跟不上節(jié)奏,所以適合大規(guī)模的分布時(shí)局圖類孕育而生。分布式圖聚類是大量數(shù)據(jù)集中的一套編碼,編集的一套電子程序。他的規(guī)模之大可以把數(shù)百臺(tái)或數(shù)千臺(tái)電腦聯(lián)系在一起進(jìn)行計(jì)算和研究。分布式圖聚類的優(yōu)點(diǎn)是可以進(jìn)行大規(guī)模的數(shù)據(jù)計(jì)算。

2)電子商務(wù)的數(shù)據(jù)挖掘

電子商務(wù)的數(shù)據(jù)挖掘是在網(wǎng)絡(luò)當(dāng)中存在的網(wǎng)絡(luò)商家在真實(shí)的交易中保存下來(lái)的數(shù)據(jù),然后把這些數(shù)據(jù)變成數(shù)據(jù)庫(kù)。商家要把存留下來(lái)的數(shù)據(jù)庫(kù)進(jìn)行計(jì)算,整理,然后挖掘出對(duì)商家有利的信息。商家再根據(jù)數(shù)據(jù)的顯示進(jìn)行一系列的變動(dòng)和調(diào)整,根據(jù)數(shù)據(jù)反映客戶的需要,擴(kuò)寬自己的市場(chǎng)。聚類分析就是研究數(shù)據(jù)挖掘后的一個(gè)技術(shù)性的研究。分析會(huì)根據(jù)商家的真實(shí)存在的問(wèn)題進(jìn)行數(shù)據(jù)上的計(jì)算和研究,這種方法備受商家的歡迎,同時(shí)也滿足了商家對(duì)科學(xué)的研究自己市場(chǎng)的一種需求。雖然數(shù)據(jù)挖掘等工作進(jìn)行十分的順暢,但是,社會(huì)是高速的發(fā)展的,更多的問(wèn)題也會(huì)頻頻的出現(xiàn)?,F(xiàn)如今,網(wǎng)絡(luò)商城的日益豐富,出現(xiàn)了各種各樣形式的商城,競(jìng)爭(zhēng)十分激烈。商家如何把自己的數(shù)據(jù)庫(kù)進(jìn)行嚴(yán)格的分類和整合,如何更加詳細(xì)的反映出客戶的反映,是現(xiàn)在電子商務(wù)數(shù)據(jù)發(fā)掘的重中之重。

3)圖聚類算法的種類

圖聚類算法的種類十分的多,下面我們簡(jiǎn)單地介紹幾個(gè)圖聚類算法的種類;

第一,譜聚類,它是類似于矩形的一種分類圖形。它是通過(guò)分割矩形的方法來(lái)進(jìn)行對(duì)比與研究。譜聚類的研究主要是如何才能做到把主題矩形劃分成最佳的狀態(tài),來(lái)進(jìn)行分析。譜聚類是很有研究性的一個(gè)聚類法。比如說(shuō),我們想構(gòu)建的這一個(gè)矩形是通過(guò)什么根據(jù)來(lái)創(chuàng)建的、又或者是我們有如何通過(guò)數(shù)據(jù)研究進(jìn)行劃分這個(gè)矩形等等一系列的問(wèn)題都值得我們?nèi)パ芯刻剿鳌?/p>

第二,基于密度的聚類,它是一個(gè)使用消耗特別大的一個(gè)聚類法?;诿芏阮惥?,顧名思義它是通過(guò)數(shù)據(jù)的密度來(lái)驚醒的圖聚類。這種算法的好處是,之前不用任何的計(jì)算或是安排,直接進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)。

第三,位置敏感哈希聚類算法,它是通過(guò)數(shù)據(jù)的相識(shí)度較高,或是鄰近的數(shù)據(jù)進(jìn)行計(jì)算。通過(guò)計(jì)算,我們會(huì)更加清晰地看出相似的結(jié)論,這種方法相對(duì)于基于密度的聚類的算法節(jié)約成本,也能清楚地反映問(wèn)題,但是也要因人而異。

雖然有許多這種聚類圖,但是也要因事而異。而且要注意的是,每一種聚類圖的算法是不同的,所以,他得出的理論也可能是不一樣的。我們要仔細(xì)的分析,那些數(shù)據(jù)需要哪種聚類圖會(huì)更加的合適等等。就比如說(shuō),我們需要知道客戶在購(gòu)買時(shí)更加傾向于購(gòu)買哪類的商品比較多一些,再或者說(shuō)是客戶對(duì)商品的評(píng)價(jià)進(jìn)行統(tǒng)計(jì)等等,我們要選者不同的方法,不能一條路走下去,要懂得變通。要知道只有適合的才是最好的。

2 分布式圖聚類在電子商務(wù)數(shù)據(jù)研究發(fā)掘中的應(yīng)用

電子商務(wù)數(shù)據(jù)發(fā)掘研究是極其復(fù)雜的,而分布式圖聚類并不是唯一的研究總結(jié)數(shù)據(jù)的方法。但分布式圖聚類是十分重要的方式。隨著電子網(wǎng)絡(luò)的迅速發(fā)展,網(wǎng)上購(gòu)物的客戶越來(lái)越多,數(shù)據(jù)庫(kù)的儲(chǔ)備量逐漸地加大。電子商務(wù)數(shù)據(jù)研究發(fā)掘呈現(xiàn)越來(lái)越難的趨勢(shì)。這些客戶的數(shù)量要比想象中的要大得多,而且,計(jì)算起來(lái)十分的復(fù)雜。電子計(jì)算已經(jīng)跟不上那么龐大的數(shù)量。傳統(tǒng)的計(jì)算法存在的缺點(diǎn)主要是不能計(jì)算數(shù)量龐大的數(shù)據(jù)庫(kù),而且計(jì)算的事件上加大了時(shí)間和精力,也就是效率不高。還有就是,面對(duì)相對(duì)較大的數(shù)據(jù)根本做不出處理,他的實(shí)用性并不是很高,不能做出我們所期望的數(shù)據(jù)。這就出現(xiàn)了這樣的一個(gè)問(wèn)題,怎樣才能把熟練龐大的數(shù)據(jù)庫(kù)計(jì)算起來(lái),從而更加準(zhǔn)確的進(jìn)行商務(wù)數(shù)據(jù)的挖掘。

由于數(shù)據(jù)挖掘的需要,圖聚類應(yīng)運(yùn)而生。圖聚類的計(jì)算法十分的多樣化,相對(duì)于數(shù)據(jù)聚類算法來(lái)說(shuō)大大地提升了效率,節(jié)省了時(shí)間。同時(shí),面對(duì)數(shù)量龐大的數(shù)據(jù)庫(kù)的時(shí)候也能運(yùn)行,不像以往的計(jì)算法那樣。圖聚類可以說(shuō)是現(xiàn)在相對(duì)較好的計(jì)算方法,也是符合許多網(wǎng)絡(luò)商家的需要。圖聚類分很多種類型,其中我們說(shuō)的就是分布式圖聚類在電子商務(wù)中的數(shù)據(jù)挖掘中的應(yīng)用。對(duì)于圖聚類來(lái)說(shuō),分布式圖聚類在數(shù)據(jù)挖掘上的應(yīng)用還是十分的廣泛的。分布式圖聚類是一種把數(shù)據(jù)相互聯(lián)系的一種計(jì)算方式,它可以進(jìn)行大規(guī)模的運(yùn)算和分析。這種算法被很多商家采用。例如;某網(wǎng)上購(gòu)物的網(wǎng)站上想要進(jìn)行一次客戶對(duì)哪些商品的需求量的調(diào)查研究,但是客戶的數(shù)量大且關(guān)系復(fù)雜,對(duì)于調(diào)查研究來(lái)說(shuō)具有一定的難度。這時(shí),分布式圖聚類來(lái)說(shuō)就派上了用場(chǎng),它對(duì)于數(shù)據(jù)之間的關(guān)系研究十分的到位,同時(shí)數(shù)量上也不成問(wèn)題。運(yùn)用分布式圖聚類計(jì)算這種數(shù)據(jù)是十分的適合的,分析的內(nèi)容十分的穩(wěn)定與準(zhǔn)確。所以,廣大商家十分青睞與分布式圖聚類對(duì)于電子商務(wù)數(shù)據(jù)挖掘的應(yīng)用。

3 分布式圖聚類分析的結(jié)果的表達(dá)

分析的結(jié)果是對(duì)電子商務(wù)數(shù)據(jù)挖掘的總結(jié)。不要小瞧這一個(gè)部分,雖然看似簡(jiǎn)單但是如果表達(dá)不當(dāng),是會(huì)影響到數(shù)據(jù)的評(píng)估水平和準(zhǔn)確性。正確的表達(dá)是準(zhǔn)確評(píng)估的一部分。我們?nèi)绾螠?zhǔn)確結(jié)果的表達(dá)和分析呢?首先,我們要保證我們數(shù)據(jù)的準(zhǔn)確性和完整性,保證我們現(xiàn)在的數(shù)據(jù)的時(shí)間,內(nèi)容都十分的重要。這是評(píng)估結(jié)果是否準(zhǔn)確十分的重要。運(yùn)用正確的圖聚類進(jìn)行分析和統(tǒng)計(jì),一定要是適合我們想要知道的信息相符合的圖聚類,不然,運(yùn)用不當(dāng)會(huì)出很大的偏差。我們可以用圖把清晰的條理表達(dá)出來(lái)。直到讓我們更加直觀的一眼就看出來(lái)關(guān)聯(lián)性的數(shù)據(jù)。還可以運(yùn)用表格之類的相對(duì)于比較直觀的表現(xiàn)形式來(lái)表達(dá)出來(lái)。其實(shí),表達(dá)的主要目的就是怎樣可以讓公司的領(lǐng)導(dǎo)者能夠迅速的明白數(shù)據(jù)所表達(dá)的含義和內(nèi)容。然后才能正確地做出判斷,提出幫助公司發(fā)展的政策。如果我們能正確地運(yùn)用數(shù)據(jù)挖掘技術(shù)就能夠把復(fù)雜,數(shù)量繁多的數(shù)據(jù)信息轉(zhuǎn)變成清晰、直觀,讓人一目了然的數(shù)據(jù)或是數(shù)據(jù)圖等等。同時(shí),如果正確地分析了數(shù)據(jù)還可以讓商家找到正確的方式去經(jīng)營(yíng)店鋪,讓后制定出符合科學(xué)依據(jù)的方案,也會(huì)找到商機(jī),創(chuàng)造未來(lái)。

我們對(duì)數(shù)據(jù)的研究不是一個(gè)簡(jiǎn)單的過(guò)程,而是要一遍一遍的去研究,去探索,去找尋不同的方法,所以,端正我們的態(tài)度十分的重要。認(rèn)真地完成了每一個(gè)步驟,我們就離成功不遠(yuǎn)了。

4 總結(jié)

經(jīng)過(guò)研究,分布式圖聚類在電子商務(wù)數(shù)據(jù)挖掘中的應(yīng)用十分的廣泛。同時(shí)分布式圖聚類的優(yōu)點(diǎn)也是值得我們?nèi)ミ\(yùn)用與學(xué)習(xí)的。分布式圖聚類被許多商家所青睞和認(rèn)可,分布式圖聚類的數(shù)據(jù)挖掘也為商家?guī)?lái)了很大的收益。也能夠真實(shí)地反映出數(shù)據(jù)所涵蓋的信息量,并且減少數(shù)據(jù)統(tǒng)計(jì)的成本。由此證明,分布式圖聚類在電子商務(wù)挖掘信息中是十分重要和有效的。也是電子商務(wù)中不可或缺的一部分。但是,在本文中我們也提及了其他圖聚類的方法,我想讓大家知道,分布式圖聚類雖然適合大規(guī)模的數(shù)據(jù)統(tǒng)計(jì),也能清楚,穩(wěn)定的表現(xiàn)出數(shù)據(jù)之間的關(guān)系和內(nèi)容。但是,分布式圖聚類并不是全部實(shí)用,我們要做好電子商務(wù)數(shù)據(jù)挖掘就一定要找到適合數(shù)據(jù)的圖聚類,不要只用一個(gè)方法,這樣統(tǒng)計(jì)出來(lái)的數(shù)據(jù)會(huì)大打折扣。希望我們能夠正確的運(yùn)用數(shù)據(jù)計(jì)算分析方式,反映出最全面的信息。

參考文獻(xiàn):

[1] 溫菊萍,鐘勇.圖聚類的算法及其在社會(huì)關(guān)系網(wǎng)絡(luò)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用于軟件,2010,29(2):161-162.

[2] 李克然.基于云計(jì)算的電子商務(wù)數(shù)據(jù)管理模式研究[D].西安電子科技大學(xué),2011.

[3] 駱?biāo)拿?電子商務(wù)數(shù)據(jù)挖掘中的若干個(gè)關(guān)鍵技術(shù)的研究[D].南昌大學(xué),2013.

猜你喜歡
數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘的分析與探索
數(shù)據(jù)挖掘技術(shù)綜述與應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開(kāi)發(fā)實(shí)踐
高級(jí)數(shù)據(jù)挖掘與應(yīng)用國(guó)際學(xué)術(shù)會(huì)議
新乡县| 洞口县| 栖霞市| 乐亭县| 鹤庆县| 大余县| 宜宾市| 霍城县| 天峻县| 桃园市| 乡宁县| 南开区| 衡水市| 阜平县| 霍州市| 博湖县| 湟中县| 高台县| 芒康县| 江油市| 焦作市| 侯马市| 团风县| 容城县| 安化县| 同仁县| 盱眙县| 大港区| 台前县| 裕民县| 双辽市| 全州县| 万全县| 焦作市| 紫金县| 佛冈县| 资中县| 田东县| 安庆市| 宽甸| 南木林县|