張伊 張冰冰
摘要:如何面對海量的信息如何進行過濾和篩選,并將用戶最想得到的信息進行展現(xiàn),這已經(jīng)成為這個信息爆炸時代最重要的問題之一。在此情景下,推薦系統(tǒng)應(yīng)運而生。它不像搜索引擎一樣只是對用戶提供的顯式需求進行被動式的匹配,而是可以根據(jù)用戶潛在的興趣和愛好主動地進行信息推薦,從而最終提升用戶體驗、提高服務(wù)質(zhì)量。
關(guān)鍵詞:推薦算法;數(shù)據(jù)挖掘;用戶興趣
一、引言
1.研究背景與意義
隨著網(wǎng)絡(luò)的高速發(fā)展,現(xiàn)在互聯(lián)網(wǎng)已經(jīng)從個人PC向移動互聯(lián)網(wǎng)發(fā)展。在全世界范圍內(nèi),除了傳統(tǒng)的個人PC外,互聯(lián)網(wǎng)中有增加了大量的移動終端,如智能手機、平板電腦、智能電視、智能汽車等各種設(shè)備都連到了互聯(lián)網(wǎng)當(dāng)中?;ヂ?lián)網(wǎng)中的各式終端在隨時隨地的獲取數(shù)據(jù)的同時,也會產(chǎn)生新的數(shù)據(jù)。例如,剛過去的一分鐘內(nèi),淘寶賣出數(shù)以萬計的商品,谷歌產(chǎn)生幾千萬條的搜索查詢等等,新浪和騰訊微博發(fā)送數(shù)萬條微博,幾萬個應(yīng)用程序從蘋果應(yīng)用商店下載,這些都是海量數(shù)據(jù)的具體體現(xiàn)。目前,隨著移動互聯(lián)網(wǎng)的廣泛運行,產(chǎn)生的數(shù)據(jù)比以往任何時期都要多的多,互聯(lián)網(wǎng)中的數(shù)據(jù)呈現(xiàn)出爆炸式增長的景象。大數(shù)據(jù)處理成為當(dāng)今信息領(lǐng)域中最熱門的項目之一。大數(shù)據(jù)處理通過運行新工具、系統(tǒng)、機器學(xué)習(xí)等,把海量動態(tài)的數(shù)據(jù)轉(zhuǎn)化為有價值的知識,挖掘出數(shù)據(jù)背后隱藏的經(jīng)濟規(guī)律。
2.新的推薦系統(tǒng)
目前,個性化的智能推薦系統(tǒng)是當(dāng)今大數(shù)據(jù)處理發(fā)展的一個重要趨勢。個性化的智能推薦系統(tǒng)可以結(jié)合用戶的歷史瀏覽記錄,分析出用戶習(xí)慣、行為、興趣愛好等,再通過建立用戶興趣模型,從而為用戶推薦所感興趣的信息。在現(xiàn)今這個信息大爆炸的時代,用戶面對海量信息時,往往不知改如何選擇,因此推薦系統(tǒng)得以產(chǎn)生并得以廣泛應(yīng)用。在現(xiàn)實中,用戶在互聯(lián)網(wǎng)上購買書籍時,推薦系統(tǒng)便可以可以向用戶推薦感興趣的書籍。例如,亞馬遜網(wǎng)站會根據(jù)用戶的書籍歷史購買記錄,向用戶提供個性化的推薦服務(wù)。因為不同的人有不同的性格特點、興趣愛好,所以,推薦系統(tǒng)應(yīng)針對每個人提供個性化的智能推薦服務(wù)。
二、推薦系統(tǒng)的實現(xiàn)技術(shù)
1.動態(tài)推薦系統(tǒng)
由于用戶的興趣是動態(tài)變化,物品的屬性也并非是單一的,所以推薦系統(tǒng)也應(yīng)具備動態(tài)特性。用戶的上下文,如地點、時間等,是動態(tài)推薦系統(tǒng)中需要考慮的重要因素。上下文的變化往往意味著用戶興趣的變化。因此,結(jié)合用戶上下文的動態(tài)推薦系統(tǒng)能夠在旅店、音樂、旅游景點等方面發(fā)揮出非常重要的作用。與傳統(tǒng)的推薦系相比統(tǒng),結(jié)合了用戶上下文具體環(huán)境的動態(tài)推薦系統(tǒng)在評價指標:精度、錯誤率、召回率都要好。
動態(tài)推薦系統(tǒng)的關(guān)鍵,是要建立用戶的上下文和用戶興趣之間聯(lián)系模型。在日志記錄中,用戶的評分作為顯性的反饋數(shù)據(jù),往往只占有很少的一部分,日志中大量的數(shù)據(jù)是用戶瀏覽、評論等這樣的隱性用戶反饋數(shù)據(jù)。要建立上下文與用戶興趣之間的聯(lián)系模型,必須考慮到用戶評分時一些細節(jié),像在視頻網(wǎng)站,是陪朋友觀看還是獨立觀看,觀看時間,是否連續(xù)播放等上下文具體情境,但是有些數(shù)據(jù)描述的是現(xiàn)實生活中的環(huán)境,動態(tài)推薦系統(tǒng)往往很難取得。用戶在進行評分時,是將多個環(huán)境因素考慮進去,以時間,地點等因素尤為重要。動態(tài)推薦系統(tǒng)應(yīng)該結(jié)合多個環(huán)境因素,向用戶提供與興趣最匹配的商品。
2.推薦系統(tǒng)的評價指標
任何一個最終可以實際運行的系統(tǒng),都繞不開評估檢測。只有每項評價指標都達到了目標值時,系統(tǒng)才算是一個合格的系統(tǒng)。不同的系統(tǒng)有著不同的評價指標,推薦系統(tǒng)的評價指標主要有準確度,覆蓋率,驚喜性,新穎性等。下面詳細介紹一下每個評價指標。
準確度在推薦系統(tǒng)中是最重要的一項指標,Top-N推薦系統(tǒng)和預(yù)測評分推薦系統(tǒng)在準確度上各有各自的表現(xiàn)方式。Top-N推薦系統(tǒng)通過采用分析用戶的隱性反饋行為數(shù)據(jù),向用戶推薦N個可能感興趣的物品。在預(yù)測評分推薦系統(tǒng)中,采用的是平均絕對誤差或者絕對均方根誤差來進行計算。
覆蓋率往往是用來解決推薦系統(tǒng)中所面臨的長尾問題,可以向感興趣的用戶推薦非熱賣的物品。例如,在許多電子商務(wù)網(wǎng)中,有一些冷門的商品評分很少,如果推薦系統(tǒng)向用戶推薦熱門的商品,那么該推薦系統(tǒng)的覆蓋率可能就會很低。
近幾年,新穎性和驚喜性越來越被人重視。驚喜性和新穎性可以反映出用戶對某些事物的特定需求。例如,一個喜愛電影的用戶,如果推薦的是當(dāng)下熱門的電影,則用戶可能不會感到意外,因為用戶可能已經(jīng)看過這些熱門電影。但是如果系統(tǒng)推薦了一些用戶沒有看過的且滿足用戶興趣愛好的電影,那么用戶在接受推薦時候,會有意外的感受。當(dāng)然并非只有最新的物品才具有新穎性和驚喜性,在用戶的認識領(lǐng)域當(dāng)中,只要是用戶沒有接觸的物品皆有可能為用戶帶來驚喜。
三、小結(jié)
在互聯(lián)網(wǎng)蓬勃發(fā)展的背景下,信息數(shù)據(jù)也呈現(xiàn)出爆炸式的高速增長??梢灶A(yù)見的是,在以后的一段時間內(nèi)向用戶提供高效、精準的個性化推薦是其必然的發(fā)展趨勢。(作者單位:河南財經(jīng)政法大學(xué))
參考文獻:
[1]李國杰.大數(shù)據(jù)研宄的科學(xué)價值.中國計算機學(xué)會通訊,2012,8(9):8-15.
[2]項亮.推薦系統(tǒng)實踐[M].北京:人民郵電出版社,2012,1-9
[3]艾瑞網(wǎng).2012-2013年中國移動互聯(lián)網(wǎng)行業(yè)年度監(jiān)測報告簡版.2013.
[4]劉建國,周濤,汪秉宏.個性化推薦系統(tǒng)的研究進展.自然科學(xué)進展,2009,19(1):1-15.
[5]曾鳴.云商業(yè)的大創(chuàng)想.[EB/OL]:http://www.aliresearch.com/html/stopic/ayan13.html,March 9,2013
[6]朱郁筱,呂琳媛.推薦系統(tǒng)評價指標綜述[J].電子科技大學(xué)學(xué)報,2012:41(2),163-169
[7]項亮.動態(tài)推薦系統(tǒng)關(guān)鍵技術(shù)研究[D].北京:中國科學(xué)院研究生院,2011,24-27
[8]李方濤.基于產(chǎn)品評論的情感分析研究[D].北京:清華大學(xué).2011.17-21