郭琪 潘旭偉
摘要:互聯(lián)網(wǎng)的高速發(fā)展,讓信息化、數(shù)字化深入到了家家戶戶,這促使了電子商務(wù)的發(fā)展。人們面對各種各樣的商品,不知道如何抉擇,此時個性化推薦給人們帶來了希望。它根據(jù)用戶的需求和偏好為用戶推薦,幫助用戶解決信息過載的問題。本文對電子商務(wù)中的推薦進行了研究。
關(guān)鍵詞:推薦,電子商務(wù),個性化
引言
互聯(lián)網(wǎng)的高速發(fā)展,促進了各行各業(yè)的發(fā)展也為電子商務(wù)的生成提供了非常好的條件。電子商務(wù)讓企業(yè)的銷售行為從線下實體店銷售搬到了在線銷售,人們不需要出門就可以在網(wǎng)上購買他們喜歡的東西,給人們提供了很大的便捷,提高了人們的生活品質(zhì)。但是隨著信息的增加,物品品牌和種類爆炸性增長,使得人們在面臨多種選擇的時候變得難以抉擇。因為這樣的背景所以有了推薦系統(tǒng),它使得這個讓人們不知所措的問題的解決變得容易起來。推薦系統(tǒng)使人們不用再去主動的搜索大量物品,而是可以被動地接受信息,并且這些信息還都是人們喜歡的內(nèi)容。用戶行為和商品信息的數(shù)字化加倍促進了推薦系統(tǒng)在電子商務(wù)的運用。
1、電子商務(wù)個性化推薦概述及研究現(xiàn)狀
1.1 電子商務(wù)個性化推薦概述
Renick給出了電子商務(wù)個性化推薦的定義:電子商務(wù)個性化推薦是指利用電子商務(wù)網(wǎng)站向用戶提供商品信息和建議,幫助用戶決定購買什么產(chǎn)品[1]。電子商務(wù)個性化推薦主要有三部分構(gòu)成:輸入、推薦方法模塊和輸出。
輸入主要是將用戶的各種信息收集起來以作后續(xù)的運用。這些用戶信息包含了用戶自己的個人信息,例如年齡、工作、居住地等,還有用戶的歷史記錄,例如評分,購買,加購,點贊,評論等。根據(jù)這些歷史記錄信息可以判斷出用戶的興趣愛好,之后再采用各種先進的推薦算法根據(jù)這些信息找到與用戶喜歡的商品類似的商品給用戶做推薦,最后給用戶呈現(xiàn)出一個可視化的推薦結(jié)果。這就是一個完整的推薦過程。
1.2 電子商務(wù)個性化推薦研究現(xiàn)狀
優(yōu)秀的服務(wù)和技術(shù),可以吸引大量的用戶并且還可以使他們變?yōu)殡娮由虅?wù)網(wǎng)站的忠實用戶,這兩個也是成功的重要因素。個性化推薦技術(shù)可以根據(jù)用戶個人的需求和興趣給出意見,幫助用戶解決信息過載帶來的困擾同時提高其決定的質(zhì)量;也可以通過將潛在用戶變成真正的購買者從而幫助網(wǎng)站提高收入;還能在提高銷售數(shù)量的同時提高用戶對電子商務(wù)網(wǎng)站的忠誠和喜愛度。目前,有非常多的電子商務(wù)企業(yè)已經(jīng)認識到個性化推薦帶來的價值,并在他們的網(wǎng)站中引入了這項技術(shù)。例如亞馬遜網(wǎng)上書店,淘寶、京東也都會給出如類似產(chǎn)品推薦、流行產(chǎn)品推薦、猜你喜歡和購買此商品的用戶還購買了B商品的形式。
2、電子商務(wù)個性化推薦技術(shù)研究
2.1 協(xié)同過濾推薦
推薦算法中最成功就是協(xié)同過濾推薦,并且它也是相比較其他算法準(zhǔn)確率表現(xiàn)較好的算法。協(xié)同過濾方法主要是根據(jù)評分來為用戶進行推薦,所以需要大量的評分?jǐn)?shù)據(jù)。具體的分為user-based和item-based。User-based方法,是找到與給定用戶擁有相似評分的用戶,然后根據(jù)這些相似用戶來預(yù)估給定用戶對這個候選物品的評分。例如,用戶A對電影a的評分為4,電影b的評分為5,用戶B對A的評分為5,對B的評分也為5,那么用戶A和B就可以認為是相似用戶,按照這種方法可以找到所有相似用戶,綜合這些所有相似用戶的評分得出目標(biāo)用戶對候選物品的大概評分。Item-based協(xié)同過濾算法思想是利用物品間分?jǐn)?shù)的相似度,而不是利用用戶間相似度來計算預(yù)測值。為了推薦給定物品A,對于一個候選物品集S,找到集合種與A相似度最高的物品。為了預(yù)測物品A的評分,需要確定A對集合S中物品的評分,通過對這些評分的加權(quán)平均值來計算物品A的可能分值。
2.2 基于內(nèi)容的過濾
協(xié)同過濾算法雖然效果很好,然而因為評分矩陣十分稀疏,且還存在冷啟動方面問題,所以有時候也表現(xiàn)不佳。然而基于內(nèi)容的方法不用大量的評分?jǐn)?shù)據(jù),只需要用戶個人的歷史記錄就可以給用戶做推薦。一般情況分為以下三個步驟:
(1)物品表示。物品表示就是用這個物品的一些特征來表示此物品。物品特征向量是實現(xiàn)該方法的關(guān)鍵所在。通過特征提取,能從項目中獲取項目特征向量。所謂特征提取,就是從項目的各種不同特征中提取出最具有說服力的特征子集。對于文本,可以采取TF-IDF或LDA主題模型等方式將文本轉(zhuǎn)換為特征向量表示。
(2)用戶偏好表示。根據(jù)用戶以往瀏覽或者購買的物品,將這些物品的特征作為用戶的偏好。例如用戶曾經(jīng)看過標(biāo)簽為喜劇,愛情類的電影,那么這些特征就可以用來表示這個用戶的偏好。
(3)生成推薦。構(gòu)造出物品的特征表示和用戶偏好矩陣之后,就可以計算物品之間的相似度然后把那些用戶可能喜歡且無操作記錄的物品推薦給用戶。
基于內(nèi)容的方法雖然不需要大量的數(shù)據(jù),但是它的準(zhǔn)確率沒有其他方法好,而且推薦的東西經(jīng)常會很相似,這對用戶來說是不好的體驗。
2.3 基于關(guān)聯(lián)規(guī)則的推薦
關(guān)聯(lián)規(guī)則技術(shù)在電子商務(wù)領(lǐng)域被成功的應(yīng)用到購物籃數(shù)據(jù)中。應(yīng)用該技術(shù),可以發(fā)現(xiàn)一些不為人知的規(guī)律,在銷售的時候哪些商品具有相關(guān)性,知道了這種聯(lián)系后,可以增加商品的組合銷售能力,也可以用來設(shè)計布局?;陉P(guān)聯(lián)規(guī)則的方法是依據(jù)用戶的以往信息提取出隱性規(guī)律,通過這些規(guī)則可以獲得一些有意義的關(guān)聯(lián)組合,例如用戶買商品A的時候還買了B,然后就可以利用這些組合為用戶產(chǎn)生推薦內(nèi)容,這種方法產(chǎn)生的結(jié)果會更有效果。最經(jīng)典的案例是啤酒-尿布,我們在生活中也會發(fā)現(xiàn)這些關(guān)聯(lián)的規(guī)則,例如,你去超市就會發(fā)現(xiàn)打折的商品會和你平常需要的日用品放在一起。
2.4 基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦
基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦通過二部網(wǎng)絡(luò)結(jié)構(gòu)分析用戶和項目,即把用戶看出一類點,把商品看成另一類點,當(dāng)某個用戶購買過某個商品時,則他們之間會存在一條邊,但是同一類點之間不會存在連邊的,即用戶與用戶之間、商品與商品之間沒有邊相連,類似于這樣組成的網(wǎng)絡(luò)就稱作二部圖。電子商務(wù)中的商品推薦可以看成圖上的鏈路挖掘問題,通過擴散來找兩節(jié)點的關(guān)聯(lián)程度?;诰W(wǎng)絡(luò)結(jié)構(gòu)的方法的優(yōu)點是能夠發(fā)現(xiàn)用戶的潛在興趣,而且能夠稍微解決數(shù)據(jù)稀疏帶來的問題,但是它也存在著冷啟動問題。例如那些長尾商品,通過網(wǎng)絡(luò)結(jié)構(gòu)可能就會被發(fā)現(xiàn)然后推薦給用戶。
3、電子商務(wù)個性化推薦技術(shù)改進研究
傳統(tǒng)的推薦算法存在數(shù)據(jù)稀疏、冷啟動和可擴展性問題,針對這些缺陷,許多專家和學(xué)者在已有的算法基礎(chǔ)上進行了改進。
針對算法存在的推薦準(zhǔn)確性不高問題,王健等人采用將用戶特征融入到原有的協(xié)同過濾對算法進行改進,以提高推薦的準(zhǔn)確度[2]。在用戶特征相似性計算中,不同性別的用戶在選擇物品時會有不同的偏好,除了性別,還從年齡,職業(yè),地區(qū)等方面的不同刻畫了相似性公式,通過和傳統(tǒng)的協(xié)同方法結(jié)合,得出計算用戶相似性公式。
針對傳統(tǒng)協(xié)同過濾算法存在的數(shù)據(jù)稀疏和過分依賴評分?jǐn)?shù)據(jù)的問題,張小川等人提出一種基于關(guān)聯(lián)規(guī)則的改進算法[3]。該算法預(yù)先給定一個閾值,然后根據(jù)相似度選出較高的用戶組成鄰居集,根據(jù)閾值來判斷選擇計算的方法。相似度低于閾值,采用關(guān)聯(lián)規(guī)則的算法進行評分預(yù)測,否則則照原來的方法進行預(yù)測。鄧愛林等提出根據(jù)項目評分預(yù)測的協(xié)同過濾方法[4],利用物品間的相似度計算出給定用戶的最近鄰居。
為了提高二部圖隨機游走推薦算法的多樣性和解決數(shù)據(jù)集稀疏、信息缺失等問題,黃繼婷等人提出融合偏好度和網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法(IUNR)[5]。首先,將偏好度融合于用戶-項目二部圖及進行隨機游走,調(diào)整用戶不跟隨大眾個性化喜好的項目的游走概率,降低熱門項目推薦概率和提高冷門項目推薦概率,得到符合用戶個性化興趣且多樣性好的項目推薦列表;其次,考慮到用戶對項目所打標(biāo)簽是項目的重要特征數(shù)據(jù),充分利用項目的社會化標(biāo)簽,將偏好度融合于用戶-標(biāo)簽二部圖再進行隨機游走,挖掘用戶跟其他用戶不同的個性化興趣標(biāo)簽;最后,將個性化興趣標(biāo)簽對應(yīng)的關(guān)聯(lián)項目提取出來,并與得到的推薦列表結(jié)合,得到最終的推薦列表top-N,將列表推薦給目標(biāo)用戶。
雖然許多學(xué)者都提出了改進的方法,但由于環(huán)境的不斷變化,現(xiàn)有電子商務(wù)個性化推薦技術(shù)仍然不能完全解決目前存在的問題。除此上述介紹的改進方法,提高長尾物品的推薦,優(yōu)化運營策略,也可以帶來更多的收益。因為有很多物品因為沒有評分,很難被推薦給用戶,這些物品就是長尾物品。推薦更多樣的物品可以使用戶更加滿意;同時,根據(jù)時代的變化,提出更加新穎的運營策略,再結(jié)合個性化推薦技術(shù),可以使用戶的體驗感更好,從而加強用戶對網(wǎng)站的忠誠度,提高網(wǎng)站的銷售和利潤。
4、電子商務(wù)個性化推薦在未來的發(fā)展建議
在推薦系統(tǒng)的評估指標(biāo)中,有很多個指標(biāo)其中有兩個是新穎性和多樣性。一般的推薦都是在強調(diào)推薦結(jié)果的準(zhǔn)確率,但是只有準(zhǔn)確是不夠的,多樣性和新穎性也是十分關(guān)鍵的。新穎的物品是用戶沒有聽過或者見過的,給用戶推薦新穎的商品可以給用戶一種驚喜、意外的感覺?;趦?nèi)容的方法只是依據(jù)用戶自身的喜好給用戶推薦商品,從而缺少了新穎性。同時還需要增加長尾商品的推薦,可以更加全方位的滿足不同用戶的需求,而且長尾商品也會是新穎的,因為它不常見。多樣化的推薦同時可以提高用戶的選擇范圍,也可以提高用戶的體驗感。
參考文獻
[1] Resnick P, Varian H R. Recommender Systems[J]. Communications of the ACM,1997,40(3):56-58
[2] 王健,馬佳琳.協(xié)同過濾推薦算法的改進[J].通信電源技術(shù),2019, 36(03):29-30+35.
[3] 張小川,周澤紅,向南,桑瑞婷.基于關(guān)聯(lián)規(guī)則的協(xié)同過濾改進算法[J].重慶理工大學(xué)學(xué)報(自然科學(xué)),2019,33(03):161-168.
[4] 鄧愛林,朱揚勇,施伯樂.基于項目評分預(yù)測的協(xié)同過濾推薦算法[J].軟件學(xué)報,2003(09):1621-1628
[5] 黃繼婷,陳建兵,陳平華.融合偏好度與網(wǎng)絡(luò)結(jié)構(gòu)的推薦算法[J/OL].計算機工程與應(yīng)用:1-10[2019-05-28].
作者信息:
郭琪,浙江理工大學(xué)經(jīng)理管理學(xué)院,專業(yè):管理科學(xué)與工程,研究方向:個性化推薦;
潘旭偉,浙江理工大學(xué),啟新學(xué)院創(chuàng)業(yè)學(xué)院黨委書記,教授,博士研究生,研究方向:個性化推薦,知識管理,情境感知計算。