楊 靜
(天津現(xiàn)代職業(yè)技術(shù)學(xué)院,天津 300350)
基于情感的混合推薦模型
楊 靜
(天津現(xiàn)代職業(yè)技術(shù)學(xué)院,天津 300350)
情感因素對于顧客購買行為有很大的影響,本文使用傳統(tǒng)的基于內(nèi)容的推薦算法與協(xié)同過濾算法相結(jié)合,在此基礎(chǔ)上引入基于情感的推薦算法,通過計算顧客對于商品的情感分值,作為推薦主要依據(jù),通過行實驗評估,對推薦的準(zhǔn)確性和穩(wěn)定性都有較大的提升。
電子商務(wù);協(xié)同過濾;基于內(nèi)容的推薦;基于情感的推薦
圖1 混合推薦模型流程
時至今日,電子商務(wù)的發(fā)展已經(jīng)深刻地改變著人們的生活和社會節(jié)奏,面對幾何級數(shù)增長的電子商務(wù)信息,顧客在購買決策和尋找商品時需要花費(fèi)的時間和經(jīng)理也隨之增加。為了解決上述問題,絕大多數(shù)電子商務(wù)平臺都不同程度地使用推薦技術(shù),通過分析顧客行為推測顧客喜好,進(jìn)行主動推薦,提高顧客滿意度的同時也提高了銷售量。目前應(yīng)用較多的推薦技術(shù)有:
基于內(nèi)容的推薦方法,為每個顧客建立興趣模型,根據(jù)顧客以往的購買歷史和訪問數(shù)據(jù),提取顧客的興趣特征集合,形成顧客的偏好模型。該方法的簡單、高效,但難以區(qū)分和拓展興趣資源。
協(xié)同過濾應(yīng)用較普遍的方法,通過將興趣相同的顧客作為一類,據(jù)此推測某顧客對某商品的興趣。該方法適用性較強(qiáng),但不適用于樣本很少或者樣本急劇增加的情況。
研究表明,在諸多推薦方法中,往往都忽略了推薦系統(tǒng)與人在交流中最關(guān)鍵的“情感智能”因素。特別是對于特定的商品,如音樂、電影,情感因素對推薦往往起決定性作用,這就要求推薦系統(tǒng)要能夠更加主動地適應(yīng)顧客的情感需要。為此,推薦系統(tǒng)必須能夠識別顧客情感并據(jù)此作出正確、及時的推薦。目前,對于情感信息關(guān)注和研究越來越多,但多圍繞語音信號處理。本文將該方法引入電子商務(wù)推薦過程中,從而解決常用方法存在的問題。
整個推薦過程分為三個階段,即基于內(nèi)容的推薦、基于情感的推薦和協(xié)同過濾推薦,其基本流程是:首先將顧客當(dāng)前訪問序列、顧客購物歷史數(shù)據(jù)以及Web日志等信息進(jìn)行預(yù)先處理,計算出未評價商品和已評價商品的相似度,然后基于內(nèi)容進(jìn)行過濾;再依據(jù)數(shù)據(jù)庫中商品數(shù)據(jù)和顧客興趣值,計算出顧客的情感分值和商品擁有的情感類別,實施推薦;最后根據(jù)顧客興趣特征、顧客評分?jǐn)?shù)據(jù)以及訪問序列等信息,基于協(xié)同過濾進(jìn)行推薦;然后、對商品信息庫中的商品,與混合推薦算法推薦結(jié)果進(jìn)行相似度計算,產(chǎn)生N個推薦訪問結(jié)果推薦給顧客,并獲得顧客對推薦結(jié)果滿意情況的反饋信息,然后對模型進(jìn)行自適應(yīng)調(diào)整,以獲得最好的推薦效果?;玖鞒倘鐖D1所示。下面介紹各模塊的工作原理。
(一)基于內(nèi)容的推薦模塊
基于內(nèi)容的推薦算法,使用特征屬性定義商品對象,通過將顧客對于商品對象的評價做依據(jù),進(jìn)行推薦。因此該算法可以針對稀疏狀況下的商品進(jìn)行推薦。首先,計算數(shù)據(jù)庫中各商品之間相似度及喜愛的商品,使用公式(1):
(1)
其中,P代表數(shù)據(jù)庫中的某商品;A為已被某些顧客評價為喜愛的商品;n代表與商品所屬類別對應(yīng)的商品屬性的個數(shù);wi代表上述各屬性的權(quán)重值;mi代表該商品P第i個屬性的值;αi表示喜愛商品A的第i個屬性值。
(二)基于情感的推薦模塊
情感作為人和人之間交流所使用的信息,是由主觀思想和客觀事件引發(fā)的行為變化、生理變化以及主觀體驗。不同類型的情感可以引起不同的行為,情感的變化也會引起帶來行為的變化。因此,在關(guān)注顧客行為的推薦系統(tǒng),關(guān)于顧客情感和情感信息處理技術(shù)的研究也應(yīng)該受到人們的關(guān)注和重視。
表1 情感分類表
商品可以帶給顧客的情感多種多樣,以電影為例,它可以帶給觀影者快樂和滿足,同時也可以帶來恐怖和悲傷。而無論情感的類型如何,都會成為顧客選擇某種商品的直接或間接原因。這里,將影響顧客選擇商品的情感分為積極和消極兩大類,如表1所示:
針對上述情感將對顧客產(chǎn)生不同的行為影響,基于情感的推薦過程是相當(dāng)重要的,該模塊通過計算顧客偏好和商品情感之間的不同,達(dá)到準(zhǔn)確推薦的目的。
(2)
其中,Si代表顧客對第i種感情ei的評分;ni-favored代表在顧客喜歡的商品中,第i種感情ei出現(xiàn)的次數(shù);Nfavored代表顧客喜歡的商品的數(shù)量;相應(yīng)地,ni-disfavored代表在顧客喜歡的商品種第i種感情ei出現(xiàn)的次數(shù);Ndisfavored則代表顧客不喜歡的商品的總數(shù)量。則有:
(3)
其中,p(ej)代表擁有第j類情感的商品數(shù)量;p代表積極情感的平均值;q代表消極情感的平均值;ei代表顧客喜歡和不喜歡的情感;ej代表商品所包含的情感類型。則有:
(4)
其中Pi代表商品i的得分;n代表商品中包含的情感類型的數(shù)量。則Pi就是該模塊推薦的依據(jù),將Pi按降序排列進(jìn)行推薦。這里,為了說明模塊的工作原理,如圖2所示,以某一顧客U1為例,說明了該推薦模塊的推薦過程:
(三)協(xié)同過濾推薦模塊
為顧客能找到更多的可能感興趣的商品,要依據(jù)其他顧客提供的意見進(jìn)行推薦。為了達(dá)到上述目的,這里使用協(xié)同過濾算法,必須計算出顧客真實興趣和依據(jù)同類顧客興趣判斷出來的可能感興趣的商品之間的差值。算法如下
輸入:商品問卷中的顧客興趣(包括顧客和某一其他顧客的選擇)
輸出:差值[-100,100]
變量:
圖2 基于情感推薦模塊示例
U1[i,0],U2[i,0]:第i個商品的選擇,如喜歡(yes),不喜歡(no),空(neutral)
U1[i,1],...,U1[i,5]:顧客選擇某商品的5個原因
U2[i,1],...,U2[i,5]:某一其他顧客選擇某商品的5個原因
P:積極的獎勵或消極的懲罰
D:對于同一商品,兩個不同顧客的差值
S:差值之和
Collaboration-based(U1,U2)
S=0
forifrom1to20
P=-1
ifU1[i,0]=U2[i,0]then
P=1
end
forjfrom1to20then
ifU1[i,j]=U2[i,j]then
D=D+1
end
S=S+(D×P)
Collaboration-based(U1,U2)=S
(一)實驗數(shù)據(jù)
采用MovieLens站點提供的數(shù)據(jù)集(http://www.grouplens.org/node/73)。MovieLens是一個基于Web的電影推薦系統(tǒng),可做研究使用。該版本中包括1682部電影、943個顧客、以及100000條以上的評分記錄?;旌贤扑]模型的原理是首先計算各商品之間相似度及喜愛的商品,然后針對顧客偏好與商品情感進(jìn)行對比,再進(jìn)行過濾作為推薦依據(jù)。而MovieLens的數(shù)據(jù)主要是針對推薦電影的評分作為顧客喜好的反映,它依據(jù)電影的內(nèi)容以及拍攝手法和年代,將電影分為浪漫、動作、喜劇、冒險、科技、幻想、戰(zhàn)爭、音樂、紀(jì)錄、兒童等類型作為屬性。
評分值采用5分制,分別是1-討厭(Awful)、2-差點(FairlyBad)、3-還好(It'sOK)、4-享受(WillEnjoy)、5-必看(MustSee)。將顧客評分?jǐn)?shù)據(jù)庫中6000條評分?jǐn)?shù)據(jù)和7部電影作為實驗數(shù)據(jù)集。實驗時,應(yīng)將所有數(shù)據(jù)集劃分為訓(xùn)練集和測試集兩大部分,抽取一部分?jǐn)?shù)據(jù)作為訓(xùn)練評分所使用的訓(xùn)練集,測試集則在其余的顧客數(shù)據(jù)中隨機(jī)選取。這里,為了在設(shè)定測試情況較為稀疏,將其中20%的數(shù)據(jù)作為訓(xùn)練集,80%的數(shù)據(jù)作為測試集,要求保證訓(xùn)練集與測試集之間沒有交集。
(二)評價標(biāo)準(zhǔn)
模型的推薦效果要通過量化指標(biāo)來評估,評價標(biāo)準(zhǔn)的選取也影響著實驗數(shù)據(jù)。這里,針對基于情感模型的推薦的準(zhǔn)確度和實時性,將下屬兩項指標(biāo)作為測試依據(jù):
模型的性能要通過特定的指標(biāo)來體現(xiàn),因此評價標(biāo)準(zhǔn)的確定也決定著最終的實驗結(jié)果。這里,為了評價個性化推薦模型的準(zhǔn)確性和實時性,選取以下三項指標(biāo),對模型進(jìn)行測試:
(4.1)
平均誤差率的計算主要將顧客對商品喜好的預(yù)測值和實際值(即評分值)的差值,進(jìn)行加權(quán)后再求平均。平均誤差率是推薦準(zhǔn)確性的體現(xiàn),值越小,推薦精確度越高,值越大,推薦模型的質(zhì)量越差。
(4.2)
其中,標(biāo)準(zhǔn)差是針對平均誤差率進(jìn)行的標(biāo)準(zhǔn)差計算,是針對顧客預(yù)測值的平均誤差率進(jìn)行的標(biāo)準(zhǔn)差的計算。標(biāo)準(zhǔn)差主要反映在訓(xùn)練集和測試集數(shù)據(jù)隨機(jī)的情況下,即測試顧客數(shù)數(shù)隨機(jī)時,模型誤差的穩(wěn)定性,是推薦整體性能的體現(xiàn)。
(三)結(jié)果分析
這里,評價推薦質(zhì)量的標(biāo)準(zhǔn)設(shè)定為平均誤差率和標(biāo)準(zhǔn)差。平均誤差率是通過預(yù)測類別和實際類別的偏差情況來確定推薦質(zhì)量,平均誤差率值越大,推薦質(zhì)量越差。標(biāo)準(zhǔn)差的計算沿用統(tǒng)計學(xué)的方法,可以較為直觀地測量出推薦質(zhì)量。這里,將基于內(nèi)容的推薦算法和協(xié)同過濾推薦算法作為對照,三種算法分別反復(fù)執(zhí)行100次,推薦質(zhì)量如圖3、4所示:
圖3 算法平均誤差率比較
圖4 算法標(biāo)準(zhǔn)差比較
由圖、表可以觀察出針對于電影類商品,與其他兩種推薦算法相比,混合算法表現(xiàn)出較高的推薦精度、較好的穩(wěn)定性,明顯提高推薦精度。
隨著計算機(jī)技術(shù)和信息技術(shù)的進(jìn)步,人們對于智能系統(tǒng)的依賴程度越來越強(qiáng)。如何讓計算機(jī)能像人一樣感知態(tài)度、情感,進(jìn)而能據(jù)此準(zhǔn)確地為顧客進(jìn)行主動推薦,以及成為各電子商務(wù)平臺競爭的焦點。成功的推薦是以準(zhǔn)確的獲取顧客對產(chǎn)品的喜好為前提的,基于內(nèi)容的推薦是傳統(tǒng)推薦算法之一,方法簡單、高效,但存在擴(kuò)展性問題;過濾技術(shù)是準(zhǔn)確推薦的又一關(guān)鍵技術(shù),雖然適用性較強(qiáng),但存在稀疏性問題。
混合推薦模型就是將基于情感構(gòu)建模型結(jié)合傳統(tǒng)推薦算法,將影響顧客選擇商品的情感分為積極和消極兩大類,情感將對顧客產(chǎn)生不同的行為影響,通過計算顧客偏好和商品情感之間不同,結(jié)合用戶評分,進(jìn)行主動推薦?;谇楦械耐扑]過程是相當(dāng)重要的,能夠單獨針對每一位顧客的喜好進(jìn)行推薦,不僅能夠通過顧客提交的商品情感評價獲取顧客情感信息,進(jìn)而預(yù)測顧客對于商品的好惡程度,從而避免了傳統(tǒng)推薦方法僅僅簡單依據(jù)顧客在網(wǎng)站上的隨意行為作為推薦依據(jù)的缺點,更具準(zhǔn)確性和靈活性。據(jù)了解,把情感因素加入推薦模型,結(jié)合另外兩種技術(shù)進(jìn)行應(yīng)用的還很少,該算法通過實驗,即使在較為極端的測試狀況下,依舊表現(xiàn)出較好的推薦精確度和及時性,大大提升了推薦質(zhì)量。
[1]Dixon,S.,Bainbridge,D., &Typke,R. (2007).Sociologyandmusicrecommendationsystems[C].InProceedingsoftheinternationalsymposiumonmusicinformationretrieval.DownWithTheLoads.
[2]Karydis,I.,Nanopoulos,A.,Papadopoulos,A.,Katsaros,D., &Manolopoulos,Y.Content-basedmusicinformationretrievalinwirelessad-hocnetworks.InProceedingsofthe6thsymposiumonmusicinformationretrieval[C].KIDiddles.
[3]Krumhansl,C.L.Music:Alinkbetweencognitionandemotion[J].CurrentDirectionsinPsychologicalScience, 2002.
[4]Yeh,C.C.,Tseng,S.S.,Tsai,P.C., &Weng,J.F.Buildingapersonalizedmusicemotionpredictionsystem[C].InProceedingsofthe7thPaci?crimconferenceonmultimedia.2006.
[5]Weyde,T., &Datzko,C. (2005).Ef?cientmelodyretrievalwithmotifcontourclasses[C].InProceedingsofthe6thsymposiumonmusicinformationretrieval.
[6]林鴻飛,楊志豪,趙晶.基于內(nèi)容和合作模式的信息推薦機(jī)制[J].中文信息學(xué)報,2005,(09).
[7]詹永照,曹鵬.語音情感特征提取和識別的研究與實現(xiàn)[J].江蘇大學(xué)學(xué)報(自然科學(xué)版),2005,(01).
[8]曹毅,賀衛(wèi)紅.基于向量空間模型的信息安全過濾系統(tǒng)[J].計算機(jī)工程與設(shè)計,2006,(27).
[9]譚雄,譚慶平,陳駿. 新型電子商務(wù)網(wǎng)站的研究與設(shè)計[J]. 微計算機(jī)信息,2008,(02).
Emotion-Based Hybrid Recommendation Model
YANG Jing
(TianjinModernVocationalTechnologyCollege,Tianjin, 300350)
Emotion plays an important role in customers’ purchasing behaviors. Based on the traditional content-based recommendation algorithm and the collaborative filtering algorithm, this paper introduces the emotion-based recommendation algorithm. It calculates scores of customers’ emotion for commodities and takes it as the main clue for recommendation. The experimental evaluation proves that it greatly improves the accuracy and stability of recommendation.
e-commerce; collaborative filtering; content-based recommendation; emotion-based recommendation
2015-03-16
楊靜(1981-),女,漢族,天津人,天津現(xiàn)代職業(yè)技術(shù)學(xué)院管理工程學(xué)院,講師,碩士,主要研究方向:電子商務(wù)與知識工程。
TP391
A
1673-582X(2015)05-0094-05