国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電信套餐個(gè)性化推薦模型

2016-07-19 18:03:35王虎
企業(yè)導(dǎo)報(bào) 2016年13期
關(guān)鍵詞:數(shù)據(jù)挖掘

王虎

摘 要:在內(nèi)憂外患的市場(chǎng)環(huán)境下,電信運(yùn)營(yíng)商推出大量的電信套餐用以滿足用戶的各類電信服務(wù)需求,但是過量套餐加大了用戶選擇合適套餐的難度,對(duì)用戶造成了困擾。針對(duì)電信套餐的個(gè)性化推薦問題,通過數(shù)據(jù)挖掘技術(shù)構(gòu)建了基于用戶消費(fèi)行為的電信套餐個(gè)性化推薦模型。

關(guān)鍵詞:電信套餐;數(shù)據(jù)挖掘;協(xié)同推薦

引言:近幾年,隨著國(guó)內(nèi)電信市場(chǎng)逐漸飽和,運(yùn)營(yíng)商基礎(chǔ)通信服務(wù)慢慢呈現(xiàn)供大于求的局面,新用戶凈增數(shù)逐年呈下降趨勢(shì),三大運(yùn)營(yíng)商之間的競(jìng)爭(zhēng)也日趨白熱化,運(yùn)營(yíng)商在價(jià)格競(jìng)爭(zhēng)的同時(shí),設(shè)計(jì)推出大量的電信套餐來(lái)滿足日新月異的用戶需求。然而大量電信套餐的上市行為并沒有緩解各大運(yùn)營(yíng)商的競(jìng)爭(zhēng)壓力,反而引發(fā)一系列的問題[1]:(1)對(duì)于用戶來(lái)說(shuō),電信套餐數(shù)量龐大,多種套餐的捆綁內(nèi)容和額度近似,月租費(fèi)卻又相差很多,很難從大量的套餐中快速選擇出符合用戶需求的套餐,同時(shí)用戶和套餐的不適配會(huì)對(duì)用戶造成不必要的經(jīng)濟(jì)損失,容易引發(fā)用戶對(duì)電信企業(yè)形象的負(fù)面評(píng)價(jià),最終造成用戶流失。(2)從企業(yè)角度來(lái)看,電信企業(yè)難以把握用戶的需求和市場(chǎng)熱點(diǎn),對(duì)于新套餐的推廣仍然采用粗放式的廣告投放方式,造成用戶審美疲勞,高成本,低回報(bào),實(shí)際推廣效果不理想,造成企業(yè)大量資源浪費(fèi)。因此,電信系統(tǒng)主動(dòng)向用戶推薦合適套餐的研究十分必要。本文對(duì)協(xié)同過濾算法及其關(guān)鍵技術(shù)做了詳細(xì)分析,并針對(duì)電信行業(yè)特點(diǎn)設(shè)計(jì)了電信套餐的個(gè)性化推薦模型,并對(duì)模型的主要模塊進(jìn)行了詳細(xì)介紹。

一、協(xié)同推薦算法及其關(guān)鍵技術(shù)

(一)協(xié)同過濾推薦的概念。協(xié)同過濾推薦[2]也被稱為社會(huì)過濾推薦,在社會(huì)群體中以興趣相似度為度量尋找用戶間的相關(guān)性,或發(fā)現(xiàn)項(xiàng)目間的相關(guān)性,基于這些關(guān)聯(lián)性進(jìn)行推薦活動(dòng)。實(shí)現(xiàn)協(xié)同推薦主要有三個(gè)步驟:步驟1:收集用戶偏好數(shù)據(jù)。步驟2:計(jì)算相似度,找到相似用戶群或者物品。步驟3:依據(jù)推薦策略,進(jìn)行推薦計(jì)算。協(xié)同過濾推薦算法根據(jù)相似度比較對(duì)象的不同,可分為基于用戶的協(xié)同推薦和基于物品的協(xié)同推薦。

(1)基于用戶的協(xié)同推薦算法。根據(jù)歷史數(shù)據(jù),計(jì)算所有用戶對(duì)產(chǎn)品的喜好程度,并由此找到目標(biāo)推薦用戶的相似鄰居集,依據(jù)算法原則“鄰居用戶喜歡的產(chǎn)品,目標(biāo)推薦用戶也可能喜歡”將鄰居用戶喜歡的產(chǎn)品匯總并排序形成推薦集推薦給目標(biāo)用戶。(2)基于物品的協(xié)同推薦算法。根據(jù)歷史數(shù)據(jù),計(jì)算所有用戶對(duì)產(chǎn)品的喜好程度,并由此找到相似物品集,依據(jù)算法原則“正在使用物品的相似物品,用戶也可能喜歡”將相似物品匯總并排序形成推薦集推薦給目標(biāo)用戶。

(二)相似度計(jì)算。在推薦的場(chǎng)景中,需要進(jìn)行用戶間的相似度計(jì)算,或者進(jìn)行物品間的相似度計(jì)算,以下為幾種常用的相似度計(jì)算方法:

(1)歐幾里德距離。歐氏距離是最容易理解的一種距離計(jì)算方法,源自歐氏空間中兩點(diǎn)間的距離公式。兩個(gè)n維向量a

(x11,x12,…,x1n)與b(x21,x22,…,x2n)間的歐氏距離。

d(x,y)=■ 公式(1)

(2)Cosine相似度。Cosine 相似度被廣泛應(yīng)用于計(jì)算文檔數(shù)據(jù)的相似度。T(x,y)=■=■ 公式(2)

(3)皮爾遜相關(guān)系數(shù)。皮爾遜相關(guān)系數(shù)一般用于計(jì)算兩個(gè)定距變量間聯(lián)系的緊密程度,它的取值在 [-1,+1] 之間。

p(x,y)= ■=■ 公式(3)

注:Sx, Sy是 x 和 y 的樣品標(biāo)準(zhǔn)偏差。

(三)相似鄰居的計(jì)算。根據(jù)相似度計(jì)算確定鄰居主要有兩種方式:(1)固定數(shù)量鄰居法。不管有多少數(shù)量的鄰居,我們只用距離來(lái)確認(rèn)最近的K個(gè),作為其鄰居。該方法容易受K值影響,近似鄰居數(shù)小于K值時(shí),會(huì)選擇遠(yuǎn)距離不太相似的點(diǎn)作為鄰居,對(duì)推薦集造成影響,降低推薦準(zhǔn)確率。(2)基于相似度門檻的鄰居。以當(dāng)前目標(biāo)點(diǎn)為中心,K值為半徑的圓范圍,范圍內(nèi)的所有點(diǎn)都是其鄰居,該方法不能確認(rèn)鄰居的數(shù)量,但是能夠保證鄰居用戶間的相似度不會(huì)產(chǎn)生太大差異,確保推薦結(jié)果的準(zhǔn)確性。

(四)協(xié)同過濾算法的優(yōu)勢(shì)和不足。(1)協(xié)同過濾算法的優(yōu)勢(shì)。1)內(nèi)容難以解析的商品也能夠很好的進(jìn)行推薦,如電影、音樂。2)能夠挖掘用戶潛在需求,推薦內(nèi)容新穎。(2)協(xié)同過濾算法的不足。1)稀疏性問題:如果用戶歷史評(píng)價(jià)信息缺失或者稀少,利用評(píng)價(jià)信息尋找相似用戶的準(zhǔn)確性就會(huì)大大降低。2)性能問題:隨著推薦用戶數(shù)和推薦商品種類數(shù)的增加,系統(tǒng)的性能會(huì)越加低效。3)冷啟動(dòng)問題:沒有用戶使用或者評(píng)價(jià)的新產(chǎn)品,無(wú)法運(yùn)用協(xié)同推薦。

二、基于用戶消費(fèi)行為的電信套餐個(gè)性化推薦模型

本文根據(jù)電信行業(yè)的特點(diǎn),從用戶消費(fèi)行為數(shù)據(jù)出發(fā),結(jié)合數(shù)據(jù)挖掘技術(shù)和推薦方法構(gòu)建了如圖1所示的電信套餐個(gè)性化推薦模型。

圖1 電信套餐個(gè)性化推薦模型

電信套餐個(gè)性化推薦模型共分為7個(gè)主要模塊:

(1)信息收集模塊。信息收集,包括用戶基本信息、消費(fèi)清單賬單數(shù)據(jù)、用戶業(yè)務(wù)訂購(gòu)數(shù)據(jù)、用戶終端使用信息、套餐產(chǎn)品構(gòu)成信息、套餐資費(fèi)等信息的收集。(2)用戶建模。先根據(jù)電信業(yè)務(wù)領(lǐng)域相關(guān)知識(shí)構(gòu)建電信業(yè)務(wù)領(lǐng)域本體模型,每一個(gè)用戶模型/套餐模型都是電信業(yè)務(wù)領(lǐng)域本體的一個(gè)實(shí)例,業(yè)務(wù)本體依據(jù)用戶消費(fèi)偏好數(shù)據(jù)自動(dòng)生成個(gè)性化的用戶模型,每一個(gè)電信套餐也依據(jù)套餐設(shè)計(jì)信息由本體生成個(gè)性化的套餐模型。(3)聚類分析模塊。電信用戶數(shù)據(jù)具有基數(shù)大、數(shù)據(jù)結(jié)構(gòu)復(fù)雜的特點(diǎn),造成推薦算法計(jì)算量巨大,推薦系統(tǒng)負(fù)荷過重,影響推薦效率,針對(duì)此問題采取K-means聚類對(duì)用戶數(shù)據(jù)進(jìn)行預(yù)處理操作,大大減少用戶或者物品的最近鄰居搜索范圍,提高計(jì)算速度,從而提高推薦效率。為了達(dá)到細(xì)分用戶的目的,需要進(jìn)行兩次用戶聚類。一次聚類是根據(jù)用戶消費(fèi)占比數(shù)據(jù)將用戶群劃分成數(shù)個(gè)消費(fèi)偏好存在差異的類簇;二次聚類是在一次聚類結(jié)果集的基礎(chǔ)上,選擇目標(biāo)用戶所在的類簇為第二次聚類的數(shù)據(jù)源,根據(jù)用戶在各業(yè)務(wù)的消費(fèi)量值為依據(jù)來(lái)進(jìn)行用戶的聚類劃分。(4)尋找鄰居用戶集模塊。在聚類結(jié)果集的基礎(chǔ)上,選擇合適的相似度計(jì)算方法進(jìn)行用戶相似度計(jì)算,并以目標(biāo)推薦用戶為中心,以用戶間的相似度為距離值,選取最近的K個(gè)用戶作為目標(biāo)推薦用戶的最近鄰居用戶集。(5)個(gè)性化推薦集生成模塊。由鄰居用戶集確定套餐預(yù)測(cè)集和增值業(yè)務(wù)預(yù)測(cè)集,同時(shí)進(jìn)行TOP-N篩選、電信業(yè)務(wù)規(guī)則過濾和用戶-套餐的適配比對(duì)過程,最后形成一個(gè)滿足用戶電信需求的套餐或者增值業(yè)務(wù)推薦集。(6)套餐推薦模塊。以分區(qū)推薦的方式,將個(gè)性化推薦集混合推薦給目標(biāo)用戶,并給系統(tǒng)反饋推薦結(jié)果和相關(guān)推薦反饋信息。(7)推薦系統(tǒng)更新模塊。根據(jù)反饋信息評(píng)估整個(gè)推薦模型和過程,確認(rèn)模型存在缺陷就將更新信息反饋回電信業(yè)務(wù)領(lǐng)域本體,更新本體結(jié)構(gòu)和概念等信息,生成新本體,同時(shí)重新生成用戶模型和套餐模型。

結(jié)論:本文主要介紹了協(xié)同過濾算法的主要思想、關(guān)鍵技術(shù)以及算法存在的問題,同時(shí)根據(jù)電信行業(yè)特點(diǎn)和數(shù)據(jù)特征,研究者提出了基于用戶消費(fèi)行為的電信套餐個(gè)性化推薦模型用以有效解決電信套餐的個(gè)性化推薦問題,智能推薦符合用戶需求的電信套餐,從而推進(jìn)電信服務(wù)產(chǎn)品智能化的研究進(jìn)程。

參考文獻(xiàn):

[1] 陶如軍. 中國(guó)電信:擁抱互聯(lián)網(wǎng)思維[J]. 國(guó)企, 2014, 09:58-61.

[2] 黃仁, 孟婷婷. 個(gè)性化推薦算法綜述[J]. 中小企業(yè)管理與科技(中刊), 2015, 03:271-273.

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
昭通市| 江安县| 南汇区| 东海县| 云和县| 英吉沙县| 罗江县| 分宜县| 石泉县| 明光市| 宜良县| 房产| 固安县| 谷城县| 兰州市| 临泽县| 宁波市| 海阳市| 桂平市| 囊谦县| 湟源县| 得荣县| 泸州市| 新丰县| 南昌县| 临汾市| 申扎县| 民权县| 井陉县| 炉霍县| 洛宁县| 孟连| 南漳县| 双辽市| 兰考县| 景洪市| 准格尔旗| 罗定市| 台前县| 嘉兴市| 锡林郭勒盟|