安政磊++姚文斌
摘要:伴隨隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,020餐飲領域發(fā)展迅速,然而平臺同質(zhì)化嚴重,個性化推薦已經(jīng)成為提升用戶體驗和提高運營水平的一種主要方式。而傳統(tǒng)的協(xié)同過濾方法在數(shù)據(jù)稀疏的情況下,用戶推薦準確率不高。本文研究基于020餐飲行業(yè)背景,研究用戶的行為對購買意向的影響,綜合考慮購買行為、評價行,為等多種用戶行為,判斷用戶的興趣點,從而確定用戶的購買意向,提出一種基于多種用戶行為的購買意向模型?;诖颂岢龌谫徺I意向的推薦方法。最后通過與傳統(tǒng)基于用戶的協(xié)同過濾算法進行比較,確定了本文推薦方法的有效性。
關(guān)鍵詞:行為分析;個性化推薦;協(xié)同過濾;推薦模型
中圖分類號:TP391.3
文獻標識碼:A
DOI:10.3969/j.issn.1003-6970.2015.12.019
本文著錄格式:安政磊,姚文斌.一種基于用戶購買意向的個性化推薦模型[J].軟件,2015,36(12):80-82
0 引言
近兩年來,隨著瓦聯(lián)網(wǎng)的發(fā)展,020餐飲領域已經(jīng)成為一種重要的商務模式。在豐要大城市中迅速的擴展開來。與此同時,其中的推薦系統(tǒng)卻沒有跟隨發(fā)展,多數(shù)平臺還停留在用戶豐動獲取商品信息的時代。這些平臺同質(zhì)化嚴重,全都標榜以用戶為中心,然而由于原始的建站思路,并沒有完全應用好快速發(fā)展的計算機技術(shù),導致發(fā)展上的瓶頸。
各種推薦系統(tǒng)層出不窮,推薦機制復雜多變。協(xié)同過濾算法已經(jīng)被廣泛的應用到各個推薦系統(tǒng),但隨著用戶數(shù)量的增加和站點內(nèi)容結(jié)構(gòu)的日益復雜,協(xié)同過濾技術(shù)的一些缺點逐漸暴露出來,首要問題就是稀疏性,隨著用戶和項目的數(shù)量的增長,用戶相似性矩陣也會急劇擴大。在維度巨大的相似矩陣并且用戶參與度不是很頻繁的情況下,推薦的可信度隨之降低。
目前多數(shù)協(xié)同算法研究和應用都集中在傳統(tǒng)的電子商務,對于基于餐飲行業(yè)的協(xié)同過濾算法的推薦研究較少。協(xié)同過濾算法的研究目標豐要是商品。本文針對餐飲行業(yè)的特點,研究的豐要原子單位是餐廳,考慮不同用戶行為對用戶的購買意向的影響,基于用戶的購買意向設計推薦算法,提高推薦準確率。
1 用戶行為的研究分析
1.1 購買行為分析
相交于傳統(tǒng)電子商務的購買數(shù)據(jù),020餐飲行業(yè)的購買行為確實不少,但是對于準確的分析用戶購買意向和購買行為之間的關(guān)系這項復雜的工作來說,在數(shù)量上還是有一定差距。而用戶的購買行為是用戶對某商品研究的結(jié)果,因此,用戶必然在前期進行過一系列與該商品相關(guān)的用戶瀏覽行為,可見用戶的購買行為還和用戶的瀏覽行為緊密相關(guān)。為此需要建立基于PV興趣統(tǒng)計出的用戶購買行為模型,基于用戶的興趣發(fā)現(xiàn)用戶的購買意向。分析步驟如下:
Stepl:根據(jù)日志文件中瀏覽記錄的定義找到所有餐廳訪問的記錄,過濾沒有餐廳的瀏覽記錄。同時,從數(shù)據(jù)庫獲取用戶的購買記錄。這兩種記錄作為本次分析的依據(jù)。
Step2:針對以上數(shù)據(jù),統(tǒng)計每個餐廳的訪問次數(shù)和購買次數(shù)。兩種數(shù)據(jù)對用戶的購買意向的影響的程度顯然不同,為了融合兩種數(shù)據(jù),為購買數(shù)據(jù)進行加權(quán)分析,餐廳的購買數(shù)據(jù)加倍,將數(shù)據(jù)整合在一起。
Step3:根據(jù)商品的被訪問時間和餐廳商品數(shù)量,來確定用戶對某商品的購買意向。公式如1-1所示。
ti表示用戶瀏覽餐廳時間,Ci表示餐廳的商品數(shù)量。而現(xiàn)在多數(shù)平臺還有其他查看商品的具體信息的彈出框頁面以及能夠查看單獨商品評價和評分信息等。但是這些信息不具有代表性,所以行為分析時也對這些行為進行忽略。
1.2 評價行為分析
評價行為是用戶購買意向的直接反饋,不僅是對本次購物感受的表達,還能夠據(jù)此對用戶未來的購買意向作出判斷??梢酝ㄟ^對用戶評價的情感分析,獲取用戶的購買意向。
Stepl:建立基本語料庫,選取常見情感表達詞語,根據(jù)知網(wǎng)的基礎語料分析庫,將這些情感表達詞語分別按照褒義詞和貶義詞的分別放到positive和negative兩個集合中。
Step2:短語或句子分詞。對于020餐飲行業(yè)來說,這個領域內(nèi)的表達情感的詞語是有限的,且本文只針對用戶的感情詞匯進行處理。這樣對評價樣本進行分詞,達到能夠滿足區(qū)分用戶情感趨向的程度。采用字符匹配算法來進行分詞。
Step3:詞語分類。為了構(gòu)造用戶評論的短語模型,需要對分詞進行詞性分析,明確評價信息中的名詞、形容詞等詞性區(qū)別。
Step4:構(gòu)造評價內(nèi)容的短語模型。
Step5:計算短語的情感值。采用統(tǒng)計學方法,計算一個短語模型在positive和negative集合中的文本出現(xiàn)次數(shù),分別結(jié)尾GNumber和BNumber。情感值計算公式1-2所示。
Step6:根據(jù)用戶評價內(nèi)容分詞,采用單詞匹配分析算法,按照公式1-3計算整個評價內(nèi)容的購買意向值。
2 基于購買意向的推薦模型
2.1 購買意向模型
對用戶行為進行分析,根據(jù)上節(jié)所述的用戶購買意向和用戶的購買行為以及用戶購買意向和評價行為的關(guān)系計算用戶的總體購買意向值。需要分別計算每個用戶對每個餐廳的購買意向值并求意向值之和,意向值之和定義為T。
T-upi+S
(1-4)
將購買意向值T作為計算用戶相似度的指標。
2.2 基于購買意向的推薦模型
基于用戶購買意向模型中用戶購買意向的變化,構(gòu)建基于購買意向的推薦模型。
(1)循環(huán)更新待推薦用戶的購買意向值。
循環(huán)所有餐廳,通過購買行為計算當前用戶u對第i個餐廳的購買意向度定義為Tupi(u,i),通過用戶評論計算出當前用戶u對第i個餐廳的購買意向值Ts(u,i),計算用戶對該餐廳的購買意向總和,記為T(u),更新當前用戶u對該餐廳的購買意向值。
(2)選擇該用戶u的購買意向最強的10個餐廳作為用戶u的向量。作為和其他用戶進行比較相似度的來源。采用余弦相似度進行用戶相似度的比較,選擇m個相似用戶,根據(jù)普通協(xié)同過濾算法,根據(jù)待選集合中用戶對餐廳的購買意向,得到中間推薦結(jié)果L1。
(3)對于選擇出來的10個餐廳,從高到低分別附上10到1之間的權(quán)重,根據(jù)數(shù)據(jù)庫內(nèi)定的餐廳類別進行如下分析:1)統(tǒng)計每個類別的餐廳個數(shù);2)將每個類別餐廳的個數(shù)和每個類別中權(quán)值最大的餐廳的權(quán)值相乘得到各個類別的一個值;3)在該類別中選擇2k個同類餐廳作為中間推薦結(jié)果L:
(4)將中間推薦結(jié)果L1和L2求交運算,當最終結(jié)果不到k個時,從L2剩余結(jié)果中在隨機補選兒個,得到k個最終推薦結(jié)果
3 實驗對比分析
3.1 實驗對比標準
本文的豐要目的是為了完成用戶的推薦工作。針對推薦工作,有常用的兩個評價于段,分別是召回率(3-1)和準確率(3-2)。
其中Tn代表數(shù)據(jù)集合中用戶u喜歡的物品的集合,Rn代表向用戶推薦的物品集合。
3.2 實驗分析
根據(jù)以上模型和算法步驟,根據(jù)用戶日志文件和后臺數(shù)據(jù)庫提供數(shù)據(jù),設置取相似用戶數(shù)量取值范圍為[50,100],實驗結(jié)果如圖l所示。
實驗結(jié)果表明,基于用戶協(xié)同過濾算法和購買意向模型差距不是十分大,在開始時兩者兒乎準確率同等大小。并且隨著召回率的增加,兩者的準確率都在降低。區(qū)別是基于用戶的協(xié)同過濾算法在開始時下降明顯,而后者下降不是很明顯,出現(xiàn)這樣情況的原因可能是,基于購買意向模型的推薦算法綜合考慮了用戶的購買行為、瀏覽行為、評價行為對用戶的購買意向的影響,從而能夠比基于用戶的協(xié)同過濾算法在推薦任務上完成地稍微好一點。
4 結(jié)論
協(xié)同過濾技術(shù)已經(jīng)被廣泛應用,但有很多還停留在最簡單的基于用戶的協(xié)同過濾,隨著用戶行為種類和數(shù)量的不斷增多,這些隱藏的行為比顯示的行為提供更多有關(guān)用戶購買意向的信息,然而很多現(xiàn)有的用戶網(wǎng)絡行為卻被推薦系統(tǒng)忽視。針對以上問題,本文從用戶行為角度出發(fā),并且抓住常見的隱式行為,分析用戶行為和用戶購買意向的關(guān)系,進而根據(jù)用戶行為建立用戶行為和用戶購買意向的整合模型,根據(jù)這個模型設計出一套用戶推薦算法,經(jīng)實驗證實,該方法雖不能極大提高推薦效果,但確實在某些情況下提高了召回率和準確率,為了更好地優(yōu)化推薦效果,還應該繼續(xù)研究基于用戶行為的購買意向的優(yōu)化計算方法。