王希 胡玉嬌
摘要:協(xié)同過濾推薦算法通過對用戶歷史行為數(shù)據(jù)的挖掘發(fā)現(xiàn)用戶的偏好,基于不同的偏好對用戶進(jìn)行群組劃分并推薦品味相似的商品。協(xié)同過濾推薦算法原理在大學(xué)生閱讀中的作用就是通過該算法對大學(xué)生閱讀的歷史數(shù)據(jù)進(jìn)行篩選與分析,了解大學(xué)生的需求與興趣,從而將大學(xué)生感興趣的閱讀信息主動推薦給大學(xué)生。我們可以在協(xié)同過濾推薦算法的指導(dǎo)下,通過提高大學(xué)生媒介素養(yǎng)、引導(dǎo)大學(xué)生主動破除信息“繭房”、平衡廣泛涉獵與深度閱讀、控制好紙質(zhì)閱讀與互聯(lián)網(wǎng)閱讀的比例等措施,提高大學(xué)生互聯(lián)網(wǎng)閱讀的質(zhì)量。
關(guān)鍵詞:協(xié)同過濾推薦算法;大學(xué)生互聯(lián)網(wǎng)閱讀;媒介素養(yǎng)
大數(shù)據(jù)信息高速發(fā)展的背景下,大學(xué)生逐漸成為網(wǎng)絡(luò)閱讀的重要受眾。但是在海量的互聯(lián)網(wǎng)閱讀信息中,大學(xué)生如何快速找到自己感興趣的內(nèi)容,成為當(dāng)前需要解決的一大問題。協(xié)同過濾推薦算法可以通過對用戶歷史行為數(shù)據(jù)的挖掘發(fā)現(xiàn)用戶的偏好,基于不同的偏好對用戶進(jìn)行群組劃分并推薦品味相似的商品。協(xié)同過濾推薦算法原理對大學(xué)生閱讀的歷史數(shù)據(jù)進(jìn)行篩選與分析,了解大學(xué)生的需求與興趣,從而將大學(xué)生感興趣的閱讀信息主動推薦給大學(xué)生,使大學(xué)生快速找到自己感興趣的內(nèi)容,從而提高閱讀的數(shù)量與質(zhì)量。
一、大學(xué)生互聯(lián)網(wǎng)閱讀信息推薦系統(tǒng)現(xiàn)狀
由于網(wǎng)絡(luò)信息較為繁雜,在海量的閱讀信息面前,大學(xué)生群體經(jīng)常會面臨一些問題,如在閱讀的時候并不能準(zhǔn)確地找到自己感興趣的內(nèi)容等。在沒有明確的閱讀目標(biāo)時,搜索引擎也難以對大學(xué)生的閱讀信息進(jìn)行有效地篩選。
為了使用戶在互聯(lián)網(wǎng)的海量信息中更有效率地找到自己感興趣的信息,推薦系統(tǒng)便應(yīng)運而生。推薦系統(tǒng)是一種自動聯(lián)系用戶和項目的工具。與搜索引擎不同的是,推薦系統(tǒng)是通過研究用戶的興趣來實現(xiàn)個性化計算的。推薦系統(tǒng)可以從海量信息中發(fā)現(xiàn)用戶的興趣點,幫助用戶發(fā)現(xiàn)潛在需求。
主流推薦算法主要有基于關(guān)聯(lián)規(guī)則的推薦算法、基于內(nèi)容的推薦算法、協(xié)同過濾推薦算法以及混合推薦算法。關(guān)于大學(xué)生閱讀的推薦算法主要是協(xié)同過濾算法。本研究以大學(xué)生閱讀中的信息推薦為例,介紹協(xié)同過濾推薦算法原理,及其對大學(xué)生互聯(lián)網(wǎng)閱讀的指導(dǎo)。
二、協(xié)同過濾推薦算法中的兩種推薦算法
協(xié)同過濾推薦算法主要包括基于用戶的協(xié)同過濾算法和基于物品的協(xié)同過濾算法兩種推薦算法。
(一)基于用戶的協(xié)同過濾算法
基于用戶的協(xié)同過濾算法是推薦系統(tǒng)中歷史最久遠(yuǎn)的算法,是推薦系統(tǒng)誕生的里程碑。在大學(xué)生互聯(lián)網(wǎng)閱讀中,基于用戶的協(xié)同過濾算法可以由兩個步驟來說明:一是找到和該目標(biāo)大學(xué)生閱讀信息興趣相似的大學(xué)生集合;二是找到這個相似集合中大多數(shù)大學(xué)生都喜歡,且目標(biāo)大學(xué)生沒有閱讀過的信息內(nèi)容。
步驟一的關(guān)鍵就在于計算大學(xué)生閱讀興趣相似度,給定大學(xué)生u和用戶v,令N(u)表示大學(xué)生u曾經(jīng)有過正反饋的閱讀信息集合,令N(v)為用戶v曾經(jīng)有過正反饋的閱讀信息集合。那么,我們可以通過如下的余弦公式簡單地計算大學(xué)生u和用戶v的興趣相似度:
計算完大學(xué)生u和用戶V的閱讀相似度后,基于用戶的協(xié)同過濾算法會給大學(xué)生u推薦和他閱讀信息興趣最相似的幾個信息,以下公式計算了大學(xué)生u對閱讀信息i的感興趣程度:
其中,S(u,K)包含和大學(xué)生u閱讀信息興趣最接近的K個用戶,是對閱讀信息i有過正反饋行為的用戶集合,Wuv是大學(xué)生u和用戶v的閱讀信息興趣相似度,代表用戶v對閱讀信息i的興趣。如果用戶u對物品i有過正反饋行為,即可令rui=1。
根據(jù)式2——算出大學(xué)生u對閱讀信息i的興趣程度,得到閱讀信息推薦列表,根據(jù)閱讀信息集合中u的興趣程度進(jìn)行倒序排序,取前N個閱讀信息形成推薦列表,還可以設(shè)定興趣度閾值α,取目標(biāo)用戶興趣度不小于α的閱讀信息組成閱讀信息推薦列表R(u)。
(二)基于物品的協(xié)同過濾算法
基于物品的協(xié)同過濾算法是推薦算法的基礎(chǔ),該算法的原理是向大學(xué)生推薦和他們之前閱讀過的信息相似度很高的信息。比如,該目標(biāo)大學(xué)生閱讀過探索火星的相關(guān)科普文章,該算法會推薦NASA的最近研究成果信息。該算法也可以用兩個步驟來說明:一是計算各個閱讀信息間的相似度;二是對其相似度從高到低進(jìn)行排序,然后挑選一定數(shù)量的相似度較高的閱讀信息進(jìn)行推薦。
這個公式加大了j項的權(quán)重,從而降低了流行閱讀信息與許多閱讀信息相似的可能性。在得到物品之間的相似度后,基于物品的協(xié)同過濾算法再使用如下公式來度量大學(xué)生u對閱讀信息i的興趣程度Pui:
其中N(u)是用戶喜歡的閱讀信息的集合,S(j,K)是和閱讀信息j最相似的K個閱讀信息的集合,Wji表示的是閱讀信息j和i的相似度,rui表示的是大學(xué)生u對閱讀信息i的興趣(如果大學(xué)生u對物品i有過正反饋行為,即可令rui=1)。這個公式的含義是,用戶對歷史感興趣的項目越相似,就越有可能在用戶的推薦列表中獲得更高的排名。
根據(jù)式4——算出大學(xué)生u對閱讀信息i的興趣程度后,得到閱讀信息推薦列表,根據(jù)閱讀信息集合中u的興趣程度進(jìn)行倒序排序,取前N個閱讀信息形成推薦列表,還可以設(shè)定興趣度閾值α,取目標(biāo)用戶興趣度不小于α的閱讀信息組成閱讀信息推薦列表R(u)。
三、對大學(xué)生閱讀的指導(dǎo)意見
推薦系統(tǒng)雖然為大學(xué)生提供了便利,實現(xiàn)了對大學(xué)生閱讀興趣精準(zhǔn)化、個性化的推薦,但是由于其相似性與閉塞性使大學(xué)生的信息接受面較為狹窄。研究者姜小凌、馬佳儀曾提出,算法推薦可能引起三大問題:一是信息“繭房”導(dǎo)致視野窄化,二是信息同質(zhì)導(dǎo)致閱讀疲勞,二是信息碎片化導(dǎo)致淺閱讀。當(dāng)然,在改進(jìn)推薦算法方面,我們可以做些技術(shù)革新,以提高推薦能力、完善推薦頁面,不只推薦大學(xué)生感興趣的閱讀信息,也增加時事熱點與朋友感興趣的閱讀信息,逐漸縮小大學(xué)生感興趣的閱讀信息比例,從推薦系統(tǒng)算法的角度來盡量避免信息“繭房”的發(fā)生。針對以上基于推薦算法可能導(dǎo)致的問題,筆者認(rèn)為大學(xué)生互聯(lián)網(wǎng)閱讀應(yīng)從以下幾個方面進(jìn)行應(yīng)對。
(一)破除信息“繭房”,開拓視野
當(dāng)代大學(xué)生面臨學(xué)習(xí)專業(yè)性過強(qiáng)的問題,在升入大學(xué)選擇自己的專業(yè)后,多數(shù)人只涉獵本專業(yè)相關(guān)領(lǐng)域的信息。網(wǎng)絡(luò)閱讀本是大學(xué)生拓展知識面的重要途徑之一,是豐富自身文化素養(yǎng)的有益補(bǔ)充,但是若推薦系統(tǒng)僅采用興趣相似度作為計算標(biāo)準(zhǔn),那么將會使大學(xué)生的閱讀囿于某一方面或某一領(lǐng)域,容易造成視野狹窄。大學(xué)生應(yīng)該提高自身文化素養(yǎng),接受多方面信息,提高自己閱讀多方面信息的能力,不能故步自封。
(二)緩解閱讀疲勞,提升閱讀感受
大量高相似度的信息會產(chǎn)生同質(zhì)化,而閱讀者面對大量同質(zhì)化信息的時候,會產(chǎn)生閱讀的審美疲勞,進(jìn)而導(dǎo)致閱讀興致降低。閱讀興致降低會影響閱讀者的閱讀信息總量。所以大學(xué)生在閱讀中要避免產(chǎn)生審美疲勞,避免大量同質(zhì)化信息的重復(fù)性刺激。大學(xué)生應(yīng)該豐富閱讀信息的類型,多角度進(jìn)行閱讀刺激,提高閱讀感受。
(三)平衡廣泛涉獵與深度閱讀
破除信息“繭房”和避免信息同質(zhì)化都需要拓寬信息的入口寬度,擴(kuò)大知識信息的范圍,這樣有助于拓展閱讀視野和提升閱讀感受。但是,在同等閱讀量的情況下,廣泛涉獵會稀釋單種類信息的量,伴隨而來的一個問題就是信息的淺閱讀。淺閱讀往往獲得的是碎片化、表面化的信息,無法建構(gòu)形成全面的、系統(tǒng)的信息體系。所以大學(xué)生在廣泛涉獵的同時,也要有目的性、指向性、集中性,要設(shè)定好廣泛閱讀與深度閱讀的比例,使二者達(dá)到平衡,這樣既能增加知識的寬度,又能拓展知識的深度。
(四)控制好紙質(zhì)閱讀與互聯(lián)網(wǎng)閱讀比例大學(xué)生應(yīng)拓展多方面信息獲取范圍,
提高紙質(zhì)閱讀比例。近年,紙質(zhì)閱讀受到了網(wǎng)絡(luò)閱讀的嚴(yán)重沖擊,大學(xué)生更喜歡在手機(jī)、電腦上進(jìn)行閱讀。雖然網(wǎng)絡(luò)閱讀為大學(xué)生帶來了便捷,但也限制了大學(xué)生閱讀的全面性。為了實現(xiàn)短時間、大閱讀量的目的,大學(xué)生通常會選擇自己感興趣的內(nèi)容來閱讀,從而造成了大學(xué)生視野窄化,也造成了閱讀疲勞。大學(xué)生應(yīng)該加大線下閱讀的量,尤其要提高紙質(zhì)閱讀的質(zhì)與量,多閱讀學(xué)術(shù)性強(qiáng)的專著,接受更多、更全面的信息,以便形成堅實的知識結(jié)構(gòu)。
(五)提高大學(xué)生媒介素養(yǎng),普及推薦算法原理
學(xué)??赏ㄟ^開設(shè)相關(guān)講座,不斷提高大學(xué)生媒介素養(yǎng)。比如,舉辦網(wǎng)絡(luò)閱讀體驗活動等,在大學(xué)生中普及推薦算法原理知識,讓其認(rèn)識到協(xié)同過濾推薦算法原理對大學(xué)生互聯(lián)網(wǎng)閱讀造成的弊端,以及由此帶來的視野窄化、閱讀疲勞、淺閱讀過多等問題。這樣他們就能主動跳出局限、廣開思路,經(jīng)常變換閱讀角度,降低協(xié)同過濾推薦算法原理對大學(xué)生網(wǎng)絡(luò)閱讀的影響度。
參考文獻(xiàn):
[1]項亮.推薦系統(tǒng)實踐[M].北京:人民郵電出版社,2012.
[2]姜小凌,馬佳儀.閱讀的“暴力”:對新聞客戶端算法推薦的再思考[J].中國出版,2018,(24).