楊莉
摘要:在電子商務發(fā)展的今天,協(xié)同過濾推薦能夠推薦給用戶可能感興趣的物品,這可以提高我們在海量物品中搜索自己感興趣物品的速度。首先,論文介紹了協(xié)同過濾(CF)推薦的關鍵技術。然后,重點分析了基于時間的協(xié)同過濾研究。最后,提出了協(xié)同過濾的可能面臨的問題,包括冷啟動、稀疏性等。
關鍵詞:協(xié)同過濾;用戶偏好;時間權重;相似性;推薦系統(tǒng)
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2019)09-0170-03
Abstract:Today, with the development of e-commerce, collaborative filtering algorithm can recommend items that may be of interest to users, which can improve the speed of searching for items of interest among mass items. Firstly, the key technologies of collaborative filtering (CF) recommendation are introduced. Then, the research of collaborative filtering based on time is emphatically analyzed. Finally, the possible problems of collaborative filtering, including cold start, sparsity and so on, are put forward.
Key words:collaborative filtering; user preference; time weight;similarity;recommender system
引 言
隨著網(wǎng)絡技術的蓬勃發(fā)展以及網(wǎng)民數(shù)量的快速上漲,針對海量的信息,用戶很難從這樣龐大的信息中抉擇出感興趣的、對其有價值的商品。對于這樣的“信息過載[1]”問題,推薦系統(tǒng)可以根據(jù)用戶相關信息來預測用戶喜歡的商品并推薦給用戶。
推薦系統(tǒng)分為:(1)協(xié)同過濾(Collaborative Filtering)[1]推薦:經(jīng)過用戶的注冊數(shù)據(jù)、歷史行為信息(包含歷史紀錄、點擊模式等)獲取數(shù)據(jù),按照用戶間的相似性把其余相似用戶愛好的項目推送給該用戶。(2)基于內(nèi)容的(Content-based)推薦[3],是參考用戶曾經(jīng)選擇的商品,再把相似的商品推給用戶。(3)基于關聯(lián)規(guī)則的推薦(APBR)[4],依據(jù)用戶歷史行為獲取相關數(shù)據(jù)、收集項目集合,提取規(guī)則,再由此推薦給用戶產(chǎn)品。經(jīng)典的有“尿布,啤酒”事件。(4)混合推薦[5],由于單個推薦算法只能解決其中一兩個突出問題,有一定的局限性,有時候為了解決其他問題,會綜合兩個及以上的混合推薦算法。
1 協(xié)同過濾推薦算法
這種算法[6]在推薦系統(tǒng)中應用很多。其關鍵在于對未打分項目進行評分預測并給予推薦。包含了內(nèi)存[7]( Memory- based)的CF與模型(Model-based)的CF推薦算法。
1.1基于內(nèi)存(Memory-Based)的協(xié)同過濾推薦算法
1.1.1基于用戶的協(xié)同過濾算法
4 協(xié)同過濾算法存在的問題
該算法被廣泛應用于各種個性化推薦算法,而且取得的效果也可佳,但由于現(xiàn)在互聯(lián)網(wǎng)的日益發(fā)展,物品的不斷增加和用戶數(shù)量的劇增,協(xié)同推薦在推薦中也存在著一些問題。
(1)冷啟動[22]問題:用戶冷啟動與項目冷啟動。即在計算時無可參考的數(shù)據(jù)。針對新注冊的用戶沒有任何參考依據(jù),未有任何打分項,稱作為用戶冷啟動;對于沒有被任何用戶評分的項目叫作項目冷啟動。尤其在協(xié)同過濾推薦算法中。
(2)稀疏性[23]問題:由于互聯(lián)網(wǎng)的發(fā)展,用戶和物品的增長導致數(shù)據(jù)的規(guī)模非常巨大,在系統(tǒng)中,不同用戶對大部分產(chǎn)品不相關,對很小一部分產(chǎn)品進行了評分(通常用戶瀏覽和購買的商品并且評價的商品不會超過10%),而只有評分過的產(chǎn)品才能在相似性度量中進行計算。由于數(shù)據(jù)的局限,促使獲得的鄰居集合不夠準確,影響最后效果。
(3)魯棒性[24]:在推薦時遭到惡意破壞后,推薦質量還能夠保持。
(4)時效性[25]問題:用戶的興趣偏好會隨時間的變化而不同,能夠根據(jù)用戶興趣的變化來推薦產(chǎn)品,是一個非常值得考慮的問題。
5 總 結
論文介紹了協(xié)同過濾的概念及過程,由于用戶興趣的變化,思考到時間因素對算法的影響。最后還說明了推薦算法在推薦中存在的挑戰(zhàn)。在協(xié)同過濾中最大的兩個不足是數(shù)據(jù)的稀疏性和冷啟動。在基于時間的推薦算法研究中,用戶隨時間的變化因素比較多,例如長期與短期興趣,季節(jié)性興趣等,這都是以后研究的重點。
參考文獻:
[1]施海鷹.基于關聯(lián)規(guī)則挖掘的分類隨機游走算法[J].計算機技術與發(fā)展,2017,27(9):7-11.
[2]孫光福,吳樂,劉淇,等.基于時序行為的協(xié)同過濾推薦算法[J].軟件學報,2013(11):2721-2733.
[3]何波,潘力.融合內(nèi)容和改進協(xié)同過濾的個性化推薦算法[J].控制工程,2018(8).
[4]文拯.關聯(lián)規(guī)則算法的研究[D].中南大學,2009.
[5]楊丹.基于多模信息融合的個性化推薦系統(tǒng)的研究[J].電腦知識與技術,2013(27):6067-6068.
[6]宋文君,郭強,劉建國.一種改進的混合推薦算法[J].上海理工大學學報,2015(4):327-331.