国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

混合PSO的K—means算法在B2C 電子商城客戶細(xì)分中的應(yīng)用研究

2015-03-07 22:48胡艷霞劉尖學(xué)洪宗民
電腦知識(shí)與技術(shù) 2015年35期
關(guān)鍵詞:means算法

胡艷霞 劉尖學(xué) 洪宗民

摘要:因B2C電子商務(wù)的競(jìng)爭(zhēng)對(duì)個(gè)性化服務(wù)提出更高的要求,該文以某B2C電子商務(wù)網(wǎng)站建設(shè)為研究背景,結(jié)合粒子群優(yōu)化算法與 K-means 算法,以改進(jìn)K-means算法陷入局部最小和對(duì)初始聚類中心敏感的缺陷,并應(yīng)用到本文電子商務(wù)網(wǎng)站客戶細(xì)分中,得到具有不同特征的客戶群組,方便企業(yè)對(duì)客戶進(jìn)行針對(duì)性推薦服務(wù),用有限的資源提高客戶購買量,提高企業(yè)效益。理論分析和實(shí)驗(yàn)結(jié)果表明本算法具有較優(yōu)的全局收斂性且收斂速度快的特點(diǎn)。

關(guān)鍵詞:B2C;客戶細(xì)分;PSO;K-means算法;全局收斂性

中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)35-0158-04

Abstract: B2C e-commerce competition has made higher requirements for personalized services , Taking a B2C e-commerce website construction background, combined with PSO and K-means algorithm, to improve the K - means algorithm trapped in local minimum and is sensitive to the initial clustering center of the defect, and applied to customer segmentation, get customer group with different characteristics. It can support enterprise to make a specific recommendation service for each kind of customer, with limited resources to improve customer purchases, and improve the efficiency of the enterprise. The theory analysis and experimental results show that, the algorithm has greater global convergence.

Key words: B2C; customer segmentation; PSO; K-means algorithm; global convergence

隨著電子商務(wù)的發(fā)展,傳統(tǒng)企業(yè)的實(shí)體店鋪經(jīng)營(yíng)模式逐漸向網(wǎng)絡(luò)商務(wù)營(yíng)銷模式擴(kuò)展。互聯(lián)網(wǎng)為中小企業(yè)發(fā)展提供了一個(gè)更好的快速發(fā)展平臺(tái),通過網(wǎng)站建設(shè)實(shí)現(xiàn)網(wǎng)絡(luò)營(yíng)銷和電子商務(wù)成為時(shí)代發(fā)展的必然趨勢(shì)。本文以浙江省金華市某B2C電子商務(wù)網(wǎng)站建設(shè)為研究背景,其經(jīng)營(yíng)品類涵蓋滿足人們?nèi)粘R率匙∠M(fèi)的各類商品。

在電子商務(wù)環(huán)境下,客戶不僅獲取商務(wù)信息更為便捷,而且轉(zhuǎn)化成本也大大降低,導(dǎo)致客戶極易轉(zhuǎn)向競(jìng)爭(zhēng)者。因此,針對(duì)不同的客戶群體進(jìn)行針對(duì)性的管理,已經(jīng)成為電子商務(wù)企業(yè)面臨的重大任務(wù)。而科學(xué)合理的客戶細(xì)分是電子商務(wù)企業(yè)有效實(shí)施市場(chǎng)策略的第一步,是成功管理客戶關(guān)系的基石。

1 B2C電子商城

1.1運(yùn)營(yíng)模式特點(diǎn)

對(duì)比傳統(tǒng)商務(wù)活動(dòng),本文B2C電子商務(wù)實(shí)現(xiàn)了交易的無紙化、自動(dòng)化、數(shù)字化。其主要特點(diǎn)有:(1)用戶數(shù)量龐大,客戶的每一次搜索,每一次瀏覽點(diǎn)擊,每一次成功或失敗的交易都構(gòu)成了客戶個(gè)人數(shù)據(jù)庫的一個(gè)子集。(2)動(dòng)態(tài)性,客戶數(shù)據(jù)更新頻繁。B2C電子商務(wù)的發(fā)展消除了商務(wù)活動(dòng)在時(shí)間、地域上的限制;完成一次交易可能只需數(shù)十秒而且無需面對(duì)面的交易;智能終端、移動(dòng)互聯(lián)網(wǎng)更加促進(jìn)了B2C電子商務(wù)交易能夠隨時(shí)隨地隨心進(jìn)行,因而,每個(gè)客戶的數(shù)據(jù)庫信息都處于隨時(shí)變動(dòng)的狀態(tài)。(3)結(jié)構(gòu)性,B2C電子商務(wù)通過數(shù)據(jù)處理、傳輸、交換及電子支付過程將商務(wù)活動(dòng)中的訂貨、付款、配送等中心環(huán)節(jié)有機(jī)聯(lián)系起來,把電子信息處理和人工操作進(jìn)行集成,提高了人力、物力的利用率。(4)交易轉(zhuǎn)化成本低。在B2C模式中,企業(yè)與客戶之間的交流渠道增加,各種購物輔助軟件,使得價(jià)格對(duì)比、產(chǎn)品對(duì)比實(shí)施起來方便及時(shí)且成本低廉,客戶基本上可以隨時(shí)通過網(wǎng)絡(luò)掌握實(shí)時(shí)的供需信息,在此種情況下客戶很容易就會(huì)因某家店的價(jià)格過高或產(chǎn)品評(píng)論不好而轉(zhuǎn)向同類產(chǎn)品的競(jìng)爭(zhēng)者進(jìn)行交易。(5)客戶體驗(yàn)要求增強(qiáng)。B2C模式下交易各方都是通過網(wǎng)絡(luò)這個(gè)虛擬環(huán)境進(jìn)行,賣方對(duì)于買方實(shí)物的交付存在延遲性,因而客戶的在線購物體驗(yàn)、個(gè)性化的服務(wù)要求成為該B2C電子商務(wù)企業(yè)生存的關(guān)鍵。

1.2業(yè)務(wù)流分析

本文B2C電子商務(wù)網(wǎng)站的業(yè)務(wù)流程如下:首先由管理員將商品分類等信息保存到數(shù)據(jù)庫中,再發(fā)布商品信息。系統(tǒng)管理員可以對(duì)商品信息進(jìn)行管理,包括添加、修改、刪除、按條件查詢商品信息以及處理用戶訂單。所有信息進(jìn)人數(shù)據(jù)庫保存,并顯示在網(wǎng)站前臺(tái)。注冊(cè)用戶登錄網(wǎng)上商城可進(jìn)行商品檢索,查看商品信息。并將所需購買的商品加入購物車,完成訂單。

1.3客戶類型

根據(jù)客戶需求和購物動(dòng)機(jī)等標(biāo)志將電子商務(wù)的客戶劃分為幾種不同的類型:

時(shí)間饑餓型客戶:經(jīng)??梢栽陔p收入家庭中發(fā)現(xiàn),他們?cè)敢庠谫徫飼r(shí)支付更高的價(jià)格或額外費(fèi)用來節(jié)約時(shí)間,而不管是否喜歡在線購物體驗(yàn)。

購物逃避型客戶:不喜歡購物,他們可能只是通過網(wǎng)上購物來避免擁擠的人群、排隊(duì)或堵塞的交通。

狩獵型客戶:喜歡價(jià)格比較的過程和搜索物超所值的商品。

品牌型客戶:是指為了某個(gè)特定品牌而在線購物的客戶,也許是能給商家?guī)碜罡呷司麧?rùn)的客戶群體。

隨眾型客戶:看到周圍的朋友同事都在這家網(wǎng)店購物,也會(huì)隨眾消費(fèi)。

1.4客戶細(xì)分的作用

如今B2C電子商務(wù)企業(yè)的經(jīng)營(yíng)關(guān)鍵已變?yōu)橥ㄟ^維持客戶忠誠度、提高客戶滿意度來保證自己的市場(chǎng)競(jìng)爭(zhēng)力,這就需要B2C電子商務(wù)企業(yè)增強(qiáng)對(duì)客戶需求的關(guān)注力度,及時(shí)給出推薦信息,而及時(shí)得到合理建議的客戶很可能更有價(jià)值(因?yàn)樗麄冑徺I更多的東西)且更忠誠(因?yàn)樗麄兏械脚c銷售商有更緊密的關(guān)系)。而通過客戶細(xì)分便可實(shí)現(xiàn)這一目標(biāo)。

本文電子商城為了對(duì)客戶進(jìn)行針對(duì)性推薦服務(wù),提高網(wǎng)站、購物車轉(zhuǎn)化率,用有限的資源提高客戶購買量,提高企業(yè)效益,需要提取客戶特征進(jìn)行細(xì)分,得到具有不同特征的客戶群組。

1.5應(yīng)用K-means算法進(jìn)行客戶細(xì)分的不足

在客戶細(xì)分方面,現(xiàn)在普遍采用聚類分析算法[5],聚類分析中廣泛使用的是簡(jiǎn)潔、高效且易實(shí)施的K-means算法。根據(jù)客戶的交易明細(xì)、購買偏好等信息,利用k-means算法對(duì)這些數(shù)據(jù)進(jìn)行挖掘,可以科學(xué)有效地對(duì)企業(yè)的客戶進(jìn)行細(xì)分。

但是K-means 算法的聚類結(jié)果通常會(huì)隨著初始聚類中心的不同而不一樣,隨機(jī)選取的初始聚類中心可能會(huì)使K-means 算法陷入局部最優(yōu)解。針對(duì)上述問題,利用粒子群優(yōu)化算法全局搜索能力強(qiáng)的特點(diǎn),結(jié)合K-means 算法,本文提出一種混合的PSOK聚類算法以克服K-means算法陷入局部最小和對(duì)初始聚類中心敏感的缺陷。

2 PSOK算法

2.1 K-means算法

輸入:樣本數(shù)據(jù)集X和聚類數(shù)k

輸出:k個(gè)類

(1)隨機(jī)選擇k個(gè)初始聚類中心;

(2)逐個(gè)將數(shù)據(jù)集X中各點(diǎn)按最小距離原則分配給k個(gè)聚類中心的某一個(gè);

(3)重新計(jì)算每個(gè)類的聚類中心;

(4)若新的聚類中心和原來的聚類中心相等或小于預(yù)設(shè)閾值,則計(jì)算結(jié)束,否則轉(zhuǎn)步驟(2)。

2.2 自調(diào)整慣性權(quán)值的PSO優(yōu)化算法

其中: Xij為i個(gè)粒子的d維位置矢量;Vij為粒子的飛行速度;Pij為粒子迄今為止搜索的最優(yōu)位置;Pgj為整個(gè)粒子群迄今為止搜索的最優(yōu)位置;w為慣性權(quán)值,表示先前粒子的速度對(duì)當(dāng)前速度的影響程度; [r1,r2]為兩個(gè)相互獨(dú)立的隨機(jī)函數(shù),在0~1之間取值;[c1,c2]為學(xué)習(xí)因子。

粒子群算法雖然編碼簡(jiǎn)單,容易實(shí)現(xiàn),但它在優(yōu)化過程初期收斂速度較快,后期所有粒子都向最優(yōu)粒子學(xué)習(xí),失去種群多樣性,易陷入局部最優(yōu)。針對(duì)粒子算法的局限性,本文提出一種自調(diào)整慣性權(quán)值策略,它能改變w 為定值的單一模式,較好地權(quán)衡全局與局部搜索能力[4]。

2.3 PSOK算法編碼與適應(yīng)度選擇

本文采用的是基于粒子數(shù)的編碼方式,也就是每個(gè)粒子的位置是由N個(gè)聚類中心組成,粒子除了位置外,還有速度、適應(yīng)度值和聚類中心。由于樣本向量維數(shù)為D,因此粒子的位置是[N×D]維變量,所以粒子的速度也應(yīng)當(dāng)是[N×D]維向量,粒子都有其適應(yīng)度,和一個(gè)表示是哪個(gè)聚類中心的數(shù)目。

PSOK算法的步驟如下:

(1)對(duì)粒子群進(jìn)行初始化:設(shè)置種群規(guī)模(粒子個(gè)數(shù))m、粒子維數(shù)d,聚類數(shù)目k,搜索空間的大小、位置及速度的邊界xmax , xmin , vmax , vmin和各個(gè)參數(shù)的值,把所有樣本隨機(jī)指派到k個(gè)簇中,并計(jì)算k個(gè)簇的聚類中心,從而得到一個(gè)粒子,重復(fù)執(zhí)行m次,得到m個(gè)粒子。隨機(jī)初始化各粒子的初始速度和初始位置。

(2)根據(jù)式(5)計(jì)算每個(gè)粒子的適應(yīng)度值。

(3)對(duì)每個(gè)粒子,比較當(dāng)前適應(yīng)度值和它經(jīng)歷過的最好位置的適應(yīng)度值。若更好,則更新;對(duì)每個(gè)粒子,比較自己當(dāng)前最好適應(yīng)度值和群體所經(jīng)歷的最好位置的適應(yīng)度值。若更好,則更新。

(4)根據(jù)粒子的速度公式和位置公式調(diào)整粒子的速度和位置。

(5)樣本的K均值優(yōu)化。對(duì)于新一代粒子,按照以下的K均值算法進(jìn)行優(yōu)化:

首先根據(jù)粒子的當(dāng)前位置(k個(gè)新的聚類中心),按照最近鄰法則,確定每一個(gè)樣本應(yīng)該在哪一個(gè)簇中;其次樣本全部歸類后,重新計(jì)算聚類中心(粒子的位置),重新計(jì)算適應(yīng)度值,更新粒子的適應(yīng)度值。

(6)判斷是否達(dá)到最大迭代次數(shù)或者滿足最小誤差,如果終止條件滿足則輸出全局極值以及獲得全局極值的位置并結(jié)束算法,否則重復(fù)第二步。

3 實(shí)驗(yàn)與結(jié)果分析

3.1算法比較

實(shí)驗(yàn)數(shù)據(jù)采用某B2C電子商城2015年一萬多位客戶的消費(fèi)數(shù)據(jù)。對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理后產(chǎn)生11326條記錄。經(jīng)過處理后的數(shù)據(jù)共有服裝類、食品類、辦公類、家居類、奢侈品類這5維特征。文中根據(jù)這5維特征對(duì)數(shù)據(jù)進(jìn)行分析比較。分別使用Matlab對(duì)PSOK算法和K-means算法進(jìn)行實(shí)驗(yàn)數(shù)據(jù)處理。

從圖2可以看出,在同等條件下,K-means算法收斂速度很快,但很容易陷入局部最小值,而PSOK算法全局尋優(yōu)能力優(yōu)于K均值算法,而且由于粒子群算法不存在隨機(jī)尋優(yōu)的退化現(xiàn)象,因此收斂比較平穩(wěn),有較快的收斂速度。

3.2客戶細(xì)分聚類結(jié)果

在未進(jìn)行聚類前,數(shù)據(jù)分布比較雜亂,從統(tǒng)計(jì)學(xué)角度來看,總消費(fèi)在1000元以下的客戶有3858位,占總?cè)藬?shù)的34%;總消費(fèi)在(1000-5000)元之間的客戶有6783位,占總?cè)藬?shù)的59.8%;5000元以上的客戶只有685人,約占總?cè)藬?shù)的6%。通過這種統(tǒng)計(jì),我們對(duì)客戶購買商品只有一個(gè)總額上的概念,對(duì)客戶的消費(fèi)偏好得不到任何細(xì)致的信息。

本文中的PSOK算法對(duì)這些數(shù)據(jù)進(jìn)行聚類,輸入樣本數(shù)據(jù)集X,聚類數(shù)目K,設(shè)置粒子群體大小N,初始化種群,對(duì)數(shù)據(jù)集進(jìn)行處理,聚類結(jié)果如表l所示:

根據(jù)以上聚類結(jié)果,我們看到數(shù)據(jù)集被分成三類。其中第二類群體,客戶人數(shù)最多,約占樣本總數(shù)的60%,這類群體是電子商城的主要客戶。這類客戶的平均消費(fèi)特征如下:辦公用品消費(fèi)金額占了他們消費(fèi)總額的一半以上。他們主要以辦公用品消費(fèi)為主,企業(yè)就可以向這類客戶重點(diǎn)推薦辦公用品。

第三類客戶人數(shù)最少,可是平均消費(fèi)金額卻很高,這類客戶的平均消費(fèi)特征如下:奢侈品消費(fèi)金額占了他們消費(fèi)總額的一半以上。他們主要以奢侈品消費(fèi)為主,為企業(yè)創(chuàng)造了豐厚的利潤(rùn),企業(yè)可以利用有限的資源重點(diǎn)維系這些客戶,向他們重點(diǎn)推薦奢侈品。

第一類客戶相較于第二類客戶人數(shù)偏少,平均消費(fèi)金額較少,這類客戶的平均消費(fèi)特征如下:服裝和食品(生活日用品)的消費(fèi)金額占了他們消費(fèi)總額的一半以上。他們主要以生活日用品的消費(fèi)為主,屬于消費(fèi)能力偏低的人群。針對(duì)這類群體登錄電商網(wǎng)站時(shí)重點(diǎn)廣告推薦生活日用品。

從這三類群體的消費(fèi)特點(diǎn)可以看出客戶的消費(fèi)偏好,在進(jìn)行針對(duì)性推薦時(shí),可以花費(fèi)最小的代價(jià)向客戶推薦他們最感興趣的商品,相對(duì)于僅僅依靠統(tǒng)計(jì)學(xué)分析,只給那些消費(fèi)總額大的客戶盲目推薦各式商品信息相比,這種方式更加有效,更能為企業(yè)創(chuàng)造價(jià)值。

以上是基于客戶消費(fèi)偏好的細(xì)分,把具有相似特征的客戶歸為一類,不同特征的客戶分為不同的類,方便企業(yè)進(jìn)行針對(duì)性推薦服務(wù),用有限的資源提高客戶的購買量,提高企業(yè)效益和競(jìng)爭(zhēng)力。

4結(jié)束語

實(shí)驗(yàn)表明本文提出的PSOK算法具有較優(yōu)的全局收斂性且收斂速度快的特點(diǎn)。將其應(yīng)用于B2C電子商城客戶細(xì)分中,對(duì)客戶數(shù)據(jù)進(jìn)行聚類分析,得到具有不同特征的客戶群組,對(duì)不同群組進(jìn)行針對(duì)性的推薦服務(wù),用有限的資源提高客戶的購買量,提高企業(yè)效益和競(jìng)爭(zhēng)力。

參考文獻(xiàn)

[1] 王飛,錢玉文,王執(zhí)銓.基于無監(jiān)督聚類算法的入侵檢測(cè)[J].南京理工大學(xué)學(xué)報(bào),2009,33(3):288-292.

[2] 馮靜,舒寧. 群智能理論及應(yīng)用研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2006,42(17):31-34.

[3] 李峻金,向陽,蘆英明,吳朔桐. 粒子群聚類算法綜述[J]. 計(jì)算機(jī)應(yīng)用研究,2009,26(12):4424-4425.

[4] OMRANG M, SALM AN A, ENGELBRECHT A P. Image classification using paticle swarm optimization[C]. proc of the 4th Asia-Pacific Conference on Simulated Evolution and Learning 2002:370 - 374.

[5] 何煥. 聚類技術(shù)在客戶細(xì)分中的研究與應(yīng)用[D].江西:江西理工大學(xué),2009.

猜你喜歡
means算法
SIFT算法在木材紋理分類上的應(yīng)用
基于K—Means聚類算法入侵檢測(cè)系統(tǒng)研究
基于Weka的Apriori算法在原油產(chǎn)量預(yù)測(cè)中的應(yīng)用
基于HSI顏色空間的小麥粉精度自動(dòng)識(shí)別研究
基于數(shù)據(jù)抽樣的自動(dòng)k?means聚類算法