王小豪 孫彥武 胡浩明 王蕊蕊 樂光學(xué)
摘要:商品推薦的發(fā)展不僅是大數(shù)據(jù)和云計(jì)算技術(shù)發(fā)展的成果體現(xiàn),也是電子商務(wù)行業(yè)的發(fā)展趨向,商品推薦是電商行業(yè)的關(guān)鍵技術(shù),是提升電商行業(yè)經(jīng)濟(jì)效益的有力途徑之一。通過在電商行業(yè)應(yīng)用商品推薦技術(shù),能夠?qū)崿F(xiàn)快速搜索和推送目標(biāo)商品,優(yōu)化用戶購物體驗(yàn),推動(dòng)新時(shí)代電商行業(yè)的進(jìn)一步發(fā)展。因此,該文通過對(duì)現(xiàn)有商品推薦算法的分析和研究,嘗試提出了基于商鋪和商品信譽(yù)度的推薦算法。通過問卷調(diào)查確定影響商鋪和商品信譽(yù)度的關(guān)鍵指標(biāo),運(yùn)用Entropy算法和歐幾里德距離分別計(jì)算商品信譽(yù)度和相似度,最后根據(jù)信譽(yù)度和相似度完成商品推薦。通過建模和仿真分析,該算法在一定程度上提高了商品推薦的可信度和精確度。
關(guān)鍵詞:商品推薦;商鋪/商品信譽(yù)度;Entropy;歐幾里德距離
中圖分類號(hào):TP391 ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)13-0294-03
Abstract: The development of commodity recommendation is not only the result of the development of big data and cloud computing technology, but also the development trend of e-commerce industry. Commodity recommendation is the key technology of e-commerce industry and one of the powerful ways to improve the economic benefits of e-commerce industry. By applying commodity recommendation technology in the e-commerce industry, it is possible to quickly search and push target commodity, optimize the user's shopping experience, and promote the further development of the e-commerce industry in the new era. Therefore, this paper attempts to propose a recommendation algorithm based on the reputation of shops and commodities through the analysis and research of existing commodity recommendation algorithms. Through the questionnaire survey to determine the key indicators affecting the shop and commodity credibility, using Entropy algorithm and Euclidean distance to calculate the commodity credibility and similarity, and finally complete the commodity recommendation based on credibility and similarity. Through modeling and simulation analysis, the algorithm improves the credibility and accuracy of commodity recommendation to a certain extent.
Key words: commodity recommendation; shop/commodity reputation; Entropy; ED
1 引言
近年來,隨著計(jì)算機(jī)、互聯(lián)網(wǎng)及社會(huì)化媒體技術(shù)的廣泛應(yīng)用,電子商務(wù)得到了快速發(fā)展,數(shù)以億計(jì)的消費(fèi)者在電商的服務(wù)下無時(shí)都在產(chǎn)生著海量的交互信息。對(duì)于信息過載的電商系統(tǒng),如何在琳瑯滿目的商品中給消費(fèi)者推薦目標(biāo)商品,已成為當(dāng)前研究的重點(diǎn)課題[1]。
目前,較為成熟的電商推薦系統(tǒng)包括基于協(xié)同過濾的推薦系統(tǒng)[2],基于內(nèi)容的推薦系統(tǒng)[3],基于網(wǎng)絡(luò)結(jié)構(gòu)的推薦系統(tǒng)和基于混合模式的推薦系統(tǒng)[4-5],非主流、新興的推薦系統(tǒng)(比如基于統(tǒng)計(jì)、效用的推薦系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)等[6])。
基于內(nèi)容的推薦算法相對(duì)成熟、推薦結(jié)果易于接受、應(yīng)用廣泛,但也存在不足。近幾年很多學(xué)者在內(nèi)容推薦算法的優(yōu)化方面提出了新的思路和方法,如基于Vague集的內(nèi)容推薦算法[7];基于點(diǎn)擊反饋的內(nèi)容推薦算法[8];基于用戶瀏覽歷史的內(nèi)容推薦算法[9]等。以上研究旨在優(yōu)化表征商品特征屬性的算法,通過商品特征屬性計(jì)算商品相似度,進(jìn)而完成商品推薦。學(xué)者提出的思路和方法即使已經(jīng)在盡可能地優(yōu)化內(nèi)容推薦算法,但也存在不足:推薦結(jié)果依賴于商品特征屬性建模,更完整的商品屬性模型方法可提供更佳精確地推薦;商品相似度依賴于商品自身屬性,并未考慮購物者的個(gè)人偏好。
基于上述問題,在現(xiàn)有新的研究思路和算法基礎(chǔ)上,本文主要研究的內(nèi)容是:在內(nèi)容推薦算法基礎(chǔ)上,嘗試將商品或商鋪的特征屬性建模為計(jì)算二者信譽(yù)度的多目標(biāo)綜合評(píng)價(jià)問題,然后以商品或商鋪的信譽(yù)度作為主要相似點(diǎn),運(yùn)用相似性算法完成商品推薦。
2 構(gòu)建基于信譽(yù)度的商品推薦模型
在電商平臺(tái)的買賣過程中,用戶總是期望得到最佳的購物體驗(yàn):快速獲取目標(biāo)商品,享受優(yōu)質(zhì)服務(wù)等。商品檢索或推薦技術(shù)不僅考慮商品自身屬性,如價(jià)格、銷量、好評(píng)率等,還要考慮商品所在商鋪的相關(guān)屬性,因此,目標(biāo)商品推薦便成為多目標(biāo)綜合評(píng)價(jià)問題。Entropy多目標(biāo)綜合評(píng)價(jià)算法在定量和定性方面能夠有效完善基于商品內(nèi)容的推薦問題,使得商品推薦結(jié)果更具有準(zhǔn)確性。
ED所得計(jì)算結(jié)果為具有相同或相近屬性的每對(duì)商品間的距離,因此,如果[d(p,q)]越小,則表示商品[p]和[q]間的相似度[sim(p,q)]越大。
3 算法仿真與實(shí)現(xiàn)
針對(duì)電商平臺(tái)的商品推薦,鑒于商鋪和商品信譽(yù)度對(duì)用戶選擇商品的影響,考慮商鋪銷量、開店歷時(shí)(年)、賣家的服務(wù)態(tài)度、物流服務(wù)的質(zhì)量、參評(píng)人數(shù)、糾紛退款率、僅退款自主完結(jié)時(shí)長(天)、退貨退款自主完結(jié)時(shí)長(天)和退款自主完結(jié)率等屬性對(duì)商鋪信譽(yù)度的影響,以及商鋪信譽(yù)度、商品價(jià)格、商品銷量和好評(píng)等屬性對(duì)商品信譽(yù)度的影響,運(yùn)用2.1節(jié)提出的信譽(yù)度計(jì)算方法分別計(jì)算商鋪和商品的信譽(yù)度,在商品信譽(yù)度基礎(chǔ)上,結(jié)合領(lǐng)域本體中商品間的關(guān)聯(lián)關(guān)系完成商品推薦。
本文運(yùn)用Python爬蟲算法抓取某知名電商平臺(tái)的手機(jī)商鋪及其所售手機(jī)的部分?jǐn)?shù)據(jù),該數(shù)據(jù)僅用于算法驗(yàn)證與仿真。
3.1 商鋪信譽(yù)度計(jì)算
運(yùn)用信譽(yù)度計(jì)算方法(公式1-9)計(jì)算了169家商鋪的信譽(yù)度,圖1為其中45家商鋪信譽(yù)度結(jié)果,由圖可知商鋪28是所有商鋪中信譽(yù)度最高的,因此在給用戶推薦時(shí)優(yōu)先推薦商鋪28中相似度高的商品。
3.2 商品信譽(yù)度計(jì)算
在商鋪信譽(yù)度基礎(chǔ)上,運(yùn)用信譽(yù)度計(jì)算方法(公式1-9)得出了如圖2所示的48個(gè)商品的信譽(yù)度數(shù)據(jù),由圖可知商品1的信譽(yù)度最高,因此在對(duì)用戶進(jìn)行推薦時(shí)優(yōu)先推薦商品1。
3.3 商品相似度計(jì)算
在商品信譽(yù)度基礎(chǔ)上,運(yùn)用公式(9)計(jì)算各個(gè)商品之間的相似度,結(jié)果如圖3所示的對(duì)稱矩陣,ED越小,說明商品間的相似度越高。
4 結(jié)論
本文在現(xiàn)有商品推薦體系基礎(chǔ)上,嘗試提出了基于信譽(yù)度的商品推薦模型?;跀?shù)據(jù)驅(qū)動(dòng),對(duì)樣本數(shù)據(jù)進(jìn)行分析研究,計(jì)算商品信譽(yù)度;運(yùn)用ED方法計(jì)算商品間相似度,最好根據(jù)用戶偏好完成商品推薦,該模型考慮了商鋪和商品的固有屬性對(duì)消費(fèi)者購買意愿的重要影響,在一定程度上提高了商品推薦的可信度和精確度,可擴(kuò)展性高。
參考文獻(xiàn):
[1] 王屯屯.基于LSTM的在線商城商品推薦研究[J].研究與開發(fā),2018(8):31-33.
[2] 榮輝桂,火生旭,胡春華,莫進(jìn)俠.基于用戶相似度的協(xié)同過濾推薦算法[J].通信學(xué)報(bào),2014(2):16-24.
[3] 曹毅,賀衛(wèi)紅.基于內(nèi)容過濾的電子商務(wù)推薦系統(tǒng)研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2009,19(6):182-185.
[4] 趙英,袁莉. 基于內(nèi)部網(wǎng)絡(luò)結(jié)構(gòu)的知識(shí)推薦系統(tǒng)設(shè)計(jì)研究[J].情報(bào)雜志,2012,31(1):161-165.
[5] 梁潔.基于混合模式的個(gè)性化推薦系統(tǒng)的研究與應(yīng)用[D].武漢理工大學(xué),2011.
[6] 崔春生,王夢(mèng)冉,王國成.一種基于可拓學(xué)的電子商務(wù)內(nèi)容推薦算法研究[J].運(yùn)籌與管理,2018,27(6):75-81.
[7] 崔春生.基于泛函網(wǎng)絡(luò)的組合推薦算法[J].系統(tǒng)工程理論與實(shí)踐,2014,34(4):1039-1047.
[8] 石慧霞.基于點(diǎn)擊反饋模型的內(nèi)容推薦算法研究[J].機(jī)床與液壓,2016,44(12):129-135.
[9] 周成林,黃長江,田景凡,等.基于用戶檢索歷史的個(gè)性化內(nèi)容推薦算法的設(shè)計(jì)與實(shí)現(xiàn)[J].數(shù)字技術(shù)與應(yīng)用,2015(10):142—142.
[10] 游云,萬常選,陳煌燁.考慮對(duì)象關(guān)聯(lián)關(guān)系的多樣化商品推薦方法[J]. 計(jì)算機(jī)工程與應(yīng)用,2018,54(7):70-76.
【通聯(lián)編輯:梁書】