宋婧文
(華南師范大學(xué)計(jì)算機(jī)學(xué)院,廣東 廣州 510631)
推薦系統(tǒng)[1-8]是解決信息超載的一項(xiàng)熱門技術(shù),對(duì)于每一個(gè)使用移動(dòng)電話的用戶來說,上百種的資費(fèi)套餐項(xiàng)目可以算作一種信息超載。為了選擇一款適合自己的資費(fèi)套餐,用戶需要花費(fèi)大量的時(shí)間和精力。我國目前移動(dòng)電話的用戶數(shù)量已突破11億[9],如果套餐推薦的問題可以解決,這將是一筆可觀的社會(huì)效益。軟集[10-14]是解決不確定性問題的很好的數(shù)學(xué)工具,它能夠幫助人們?cè)趲в幸幌盗胁淮_定因素的方案下快速地找到最優(yōu)解。利用軟集決策的過程在某個(gè)程度上跟推薦的過程很相像,都是從所有對(duì)象中找到最接近指定要求的那一個(gè)。本文正是利用這一點(diǎn)相似性,用軟集的方法處理用戶實(shí)際需求和適用資費(fèi)套餐之間的不確定性,以達(dá)到移動(dòng)資費(fèi)套餐推薦的目的。
根據(jù)Molodtsov[10]的定義,令U 為初始論域,E 是一個(gè)參數(shù)集,P(U)表示U的冪集,A?E,設(shè)F:A→P(U)為映射,則稱(F,A)為U上的軟集。為了方便計(jì)算機(jī)的存儲(chǔ)和計(jì)算,軟集通常采用0-1二維表格的形式來表示和存儲(chǔ)[12]。
設(shè)H:E→P(X),g→H(g)為一個(gè)軟集,則稱AH:X→P(E),x|→AH(x)={g|x∈H(g)}為 H 的對(duì)偶[13]。若H:E→P(X)為一個(gè)軟集,則 AH:X→P(E)也為一個(gè)軟集;反之,若A:X→P(E)為一個(gè)軟集,則HA:E→P(X),g|→HA(g)={x|g∈A(x)}也為一個(gè)軟集。
基于軟集的移動(dòng)套餐推薦的關(guān)鍵是構(gòu)建適用于移動(dòng)套餐推薦時(shí)所用的軟集,由于研究的問題是如何因“套餐”制宜,是要為已有的資費(fèi)套餐發(fā)現(xiàn)合適的用戶,因此本文用對(duì)偶軟集作為推薦的軟集模型。
由于資費(fèi)套餐適用人群的描述一般是“x分鐘的通話時(shí)長”、“y條的短信發(fā)送量”等,因此本文在模型中引入?yún)^(qū)間值。
移動(dòng)套餐推薦的軟集模型如下:
設(shè)U是移動(dòng)套餐方案集,X是用戶集,E是用戶行為集,C是一款移動(dòng)套餐方案的區(qū)間集,C:E→L,L={[a,b]|a≤b},CL(E)={U|U 在 E 上的所有區(qū)間集},F(xiàn):U→CL(EX),則(F,U)是移動(dòng)推薦系統(tǒng)所用到的區(qū)間值對(duì)偶軟集。
例:U={c1,c2,c3},即 3 款移動(dòng)資費(fèi)套餐的集合;E為參數(shù)集,每個(gè)參數(shù)代表用戶適用移動(dòng)電話的一種業(yè)務(wù),令E={通話;短信;上網(wǎng)},為了方便表示用符號(hào)記為 E={e1,e2,e3}。
假設(shè)該軟集有如下映射方式:
C(c1)={e1/[0,50],e2/[0,10],e3/[10,50]},即套餐1適合通話時(shí)長為0到50分鐘,短信發(fā)送量為0到10條,上網(wǎng)流量為10到50M的用戶;
C(c2)={e1/[0,50],e2/[50,100],e3/[20,50]},即套餐2適合通話時(shí)長為0到50分鐘,短信發(fā)送量為50到100條,上網(wǎng)流量為20到50M的用戶;
C(c3)={e1/[0,50],e2/[0,100],e3/[0,10]},即套餐3適合通話時(shí)長為0到50分鐘,短信發(fā)送量為0到100條,上網(wǎng)流量為0到10M的用戶。
于是可以得到這樣一個(gè)區(qū)間值模糊軟集(F,U):
表1為該區(qū)間值對(duì)偶軟集的表格形式,ci,j的取值與ci和ej有關(guān),它表示ei在C(ej)中的適用區(qū)間。
表1 區(qū)間值對(duì)偶軟集(F,U)的表格形式
仍考慮上文的例子,U={c1,c2,c3},即 3 款移動(dòng)資費(fèi)套餐的集合,補(bǔ)充說明的是其中c1,c2屬于品牌A的套餐產(chǎn)品,c3屬于品牌B的套餐產(chǎn)品,品牌A與品牌B的套餐產(chǎn)品不可互通?,F(xiàn)在考慮A品牌用戶X先生上月的移動(dòng)電話業(yè)務(wù)使用情況,E={e1(X)=26,e2(X)=57,e3(X=13},即 X 先生上月通話時(shí)長共計(jì)26分鐘,短信發(fā)送量共計(jì)57條,使用上網(wǎng)流量共計(jì)13M。因?yàn)?種產(chǎn)品不可互通,所以X先生的備選方案集為P={c1,c2},顯然P?U。當(dāng)ej(x)屬于Ci(ej)時(shí),ci,j為 1,否則 ci,j為 0。
表2 軟集(F,P)的表格形式
在該例子中,因?yàn)閰?shù)e1所有套餐方案都符合,因此可以約去不進(jìn)行計(jì)算。
表3 約簡(jiǎn)軟集(F,Q)的表格形式
即對(duì)于X先生來說2種方案都是相似的,可以選擇其中一種。
但在實(shí)際生活中,每個(gè)人對(duì)于不同業(yè)務(wù)的使用情況各不相同,可以通過為每個(gè)參數(shù)賦予一個(gè)權(quán)重值來代表對(duì)業(yè)務(wù)的偏重。
下面通過費(fèi)用比的方式來表示權(quán)重。添加假設(shè)通話資費(fèi)為0.15元/分鐘,短信為0.1元/條,流量為0.5元/M,則X先生上月各業(yè)務(wù)的費(fèi)用為語音通話費(fèi)0.15 ×26=3.9(元),短信費(fèi)用 0.1 ×57=5.7(元),上網(wǎng)費(fèi)用0.5 ×13=6.5(元),則通話的權(quán)重值w1=3.9/(3.9+5.7+6.5)=0.25,短信的權(quán)重值 w2=5.7/(3.9+5.7+6.5)=0.35,上網(wǎng)的權(quán)重值 w3=6.5/(3.9+5.7+6.5)=0.40,該帶權(quán)值的約簡(jiǎn)軟集(F,Q)的表格形式如表4所示。
表4 帶權(quán)值的約簡(jiǎn)軟集(F,Q)的表格形式
則計(jì)算出來的最優(yōu)選項(xiàng)為c1。
總結(jié),基于軟集的移動(dòng)套餐推薦算法為:
(1)輸入軟集模型(F,U);
(2)輸入用戶集X;
(3)輸入用戶x∈X計(jì)算所用到的移動(dòng)套餐方案集 P,P?U;
(4)找出使Ci(ej)相等的ej進(jìn)行約簡(jiǎn),得出約簡(jiǎn)軟集(F,Q);
(5)建立軟集(F,Q)的權(quán)值表,其中權(quán)值wj=(pj×ej)/(Σpj×ej),pj=Σp(ci)/n,n為P的元素的個(gè)數(shù);
(6)找出 k,Ck=maxCi=wj× ci,j。
則ck就是方案P中對(duì)用戶x的推薦結(jié)果。
與其他推薦技術(shù)相比,筆者認(rèn)為基于軟集的移動(dòng)套餐推薦方法有以下特點(diǎn):
(1)基于軟集的移動(dòng)套餐推薦的計(jì)算過程非常簡(jiǎn)單,可用于實(shí)時(shí)計(jì)算,同時(shí)推薦的可信度較高;
(2)基于軟集的移動(dòng)套餐推薦方法不僅能用于產(chǎn)品推薦,同時(shí)還能就推薦結(jié)果作出反饋;
(3)基于軟集的移動(dòng)套餐推薦不存在稀疏性問題,然而卻同樣存在“冷啟動(dòng)”問題,因?yàn)樾掠脩舨o歷史使用數(shù)據(jù),因此該方法也無法為用戶提供推薦。不同的是,該問題只存在于新用戶個(gè)體,而非存在于整個(gè)系統(tǒng)之上,因此只要用戶一旦進(jìn)入移動(dòng)通信體現(xiàn),用戶的使用信息就會(huì)被一一記錄,該問題就得到了解決。
[1]Resnick Varian.Recommender systems[J].Communications of the ACM,1997,40(3):56-58.
[2]趙晨婷,馬春娥.探索推薦引擎內(nèi)部的秘密[EB/OL].http://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html,2013-06-08.
[3]Thomas Hess.Recommender Engines Seminar Paper[EB/OL].http://wenku.baidu.com/view/7a923e79168884868762d68e.html,2013-06-08.
[4]鄧愛林.電子商務(wù)推薦系統(tǒng)關(guān)鍵技術(shù)研究[D].上海:復(fù)旦大學(xué),2003.
[5]王國霞,劉賀平.個(gè)性化推薦系統(tǒng)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2012(7):70-80.
[6]曾春,邢春曉,周立柱.個(gè)性化服務(wù)技術(shù)綜述[J].軟件學(xué)報(bào),2002(10):55-64.
[7]余力,劉魯,羅掌華.我國電子商務(wù)推薦策略的比較分析[J].系統(tǒng)工程理論與實(shí)踐,2004(8):97-102.
[8]黎星星,黃小琴,朱慶生.電子商務(wù)推薦系統(tǒng)研究[J].計(jì)算機(jī)工程與科學(xué),2004(5):9-12.
[9]中華人民共和國國家統(tǒng)計(jì)局.電業(yè)務(wù)量完成情況[EB/OL].http://www.stats.gov.cn/tjsj/jdsj/t20130426_402893997.htm,2013-06-08.
[10]Molodtsov D.Soft set theory-first results[J].Computers and Mathematics with Applications,1999,37(4):19-31.
[11]Maji P K,Roy A R,Biswas R.An application of soft sets in a decision making problem[J].Computers and Mathematics with Applications,2002,44(8):1077-1083.
[12]Naim Cagman,Serdar Enginoglu.Soft matrix theory and its decision making[J].Computers and Mathematics with Applications,2010,59(10):3308-3314.
[13]溫永川.關(guān)于軟集的研究[D].大連:遼寧師范大學(xué),2008.
[14]孫同云.軟集合擴(kuò)充理論及其在決策中的應(yīng)用研究[D].重慶:重慶大學(xué),2012.