孫 宜 宋 卿
(中國傳媒大學(xué),北京 100024)
2019年8月30日,中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布了第44次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》。報告表明,截止2019年6月,中國網(wǎng)民數(shù)量達到8.54億,手機網(wǎng)民數(shù)量達到8.47億,網(wǎng)絡(luò)視頻用戶規(guī)模達到7.59億,約占我國人口總數(shù)的54.2%。
個性化推薦技術(shù)本質(zhì)上是系統(tǒng)主動進行內(nèi)容和用戶的匹配,因此內(nèi)容標簽和用戶標簽就成為個性化推薦的基礎(chǔ)。其中,用戶標簽往往也被稱為用戶畫像技術(shù)。用戶畫像近年來在個性化推薦領(lǐng)域發(fā)展非常迅速,該技術(shù)可以多維立體地將用戶的行為偏好抽象成一個個標簽,用戶的標簽與電影的標簽相匹配,再結(jié)合目前常用的協(xié)同過濾推薦算法,便可以達到高速有效地為用戶推薦電影的目的。
對于電影的個性化推薦不僅要考慮到算法的準確度,還要考慮電影的社會功能。將主流價值觀的注入與推薦算法結(jié)合,可以平衡現(xiàn)代互聯(lián)網(wǎng)技術(shù)與大眾文化,為人民群眾所喜聞樂見。
“個性化推薦”的概念最早在1995年被提出,美國卡耐基梅隆大學(xué)的羅伯特·阿姆斯特朗等人在美國人工智能協(xié)會上提出的個性化導(dǎo)航系統(tǒng)采用了“個性化推薦”的概念。幾乎同時,斯坦福大學(xué)的研究者也提出了一個個性化推薦系統(tǒng),拉開了個性化推薦的發(fā)展序幕。
20世紀90年代,推薦算法開始被研究。目前較為常用的推薦算法有基于關(guān)聯(lián)規(guī)則的推薦、基于內(nèi)容的推薦、協(xié)同過濾推薦和混合推薦等。在電影的個性化推薦中,協(xié)同過濾推薦算法使用最為廣泛。
鄧愛林等提出了一種基于項目評分預(yù)測的協(xié)同過濾推薦算法,通過對項目之間相似性的分析,對未打分的商品進行預(yù)測,以解決電子商務(wù)中用戶評分極端稀疏情況下傳統(tǒng)推薦系統(tǒng)存在的弊端,顯著提高推薦系統(tǒng)的質(zhì)量;張光衛(wèi)等人將云模型與協(xié)同過濾算法結(jié)合起來,利用云模型在知識層面分析用戶相似度以達到更好的個性化推薦效果;范波等人通過分析用戶對多個不同類型項目的評分相似度,提出了用戶間多相似度的協(xié)同過濾算法,有效提高了預(yù)測用戶評分以及個性化推薦的準確率;朱磊等提出將用戶的評分偏好與時間因素、物品屬性結(jié)合起來,改進相似度的度量公式,有效提高個性化推薦的準確度;畢閏芳針對電影個性化推薦系統(tǒng)提出了基于SVR的協(xié)同過濾和用戶畫像融合的推薦算法,將用戶對電影內(nèi)容的偏好以用戶畫像的方式融入到協(xié)同過濾中,獲得更好的推薦效果。
當(dāng)下,對于個性化推薦的研究多是以提高推薦準確率為目的,誠然高準確度的推薦系統(tǒng)提高了用戶體驗,也幫助網(wǎng)站提升了轉(zhuǎn)化率。但完全依賴于機器學(xué)習(xí)的推薦系統(tǒng)也漸漸將用戶困于“信息繭房”中,在算法中加入價值觀引導(dǎo)成為不可避免的趨勢。
用戶畫像是對用戶的基本信息與行為信息進行高度凝練得到的特征標簽集合,“貼標簽”是構(gòu)建用戶畫像最核心的工作。
圖1 用戶畫像構(gòu)建流程圖
構(gòu)建用戶畫像包括基礎(chǔ)數(shù)據(jù)收集、行為建模、構(gòu)建畫像三步,畫像構(gòu)建完畢后對用戶進行每一次個性化推薦時,將用戶的反饋納入到數(shù)據(jù)收集環(huán)節(jié),再次進行構(gòu)建用戶畫像的流程,如圖1所示,以此循環(huán)可將用戶畫像動態(tài)化,提高推薦的準確度。
用戶數(shù)據(jù)的收集主要分為靜態(tài)數(shù)據(jù)收集與動態(tài)數(shù)據(jù)收集兩種。靜態(tài)數(shù)據(jù)主要是用戶填寫的個人資料,包括姓名、性別、年齡等自然屬性,職業(yè)、學(xué)歷、婚姻狀況等社會屬性,這些數(shù)據(jù)通常具有較高的穩(wěn)定性,在較長一段時間內(nèi)不會發(fā)生非常大的改變。而動態(tài)數(shù)據(jù)主要是從用戶的行為和偏好中得到的數(shù)據(jù),包括用戶的瀏覽行為信息數(shù)據(jù)、偏好行為信息數(shù)據(jù)和交易行為信息數(shù)據(jù)。
在獲取了用戶的基礎(chǔ)靜態(tài)信息和行為信息后,利用自然語言處理、機器學(xué)習(xí)、聚類算法、預(yù)測算法等技術(shù),抽象出用戶的個性化標簽,對用戶行為進行建模。一個行為模型主要包括時間、地點、人物、方式、內(nèi)容五要素,具體可以描述為什么用戶(who)在什么時間(when)什么地點(where)以什么方式(how)做了什么事(what)。
通過技術(shù)手段對用戶行為進行建模后,則可以針對具體的應(yīng)用場景為用戶定義多維度的標簽體系,以可視化的方式構(gòu)建出用戶畫像。
協(xié)同過濾推薦算法主要通過用戶過去的行為與相似用戶的行為來預(yù)測用戶未來可能感興趣的項目,以達成精準化、個性化推薦效果。在實際應(yīng)用中,基于用戶的協(xié)同過濾算法與基于項目的協(xié)同過濾算法通常是結(jié)合起來使用的。
基于用戶的協(xié)同過濾算法是通過對有相似偏好的不同用戶進行交叉推薦,以達到給用戶推薦可能感興趣的項目的目的。尋找行為偏好相似的用戶是使用基于用戶的協(xié)同過濾算法的前提,故這一算法的核心是用戶之間相似度的計算。使用適用于特定環(huán)境的方法完成對用戶相似度的計算后,可對用戶群體進行分類或聚類,在未來的觀影行為中同類的用戶之間更有可能有相似的喜好,因而可以向用戶推薦同類用戶觀看過而本人未觀看過的電影。
基于項目的協(xié)同過濾算法是通過分析用戶以往感興趣的項目,將與之相似的項目推薦給用戶的推薦算法。與基于用戶的協(xié)同過濾算法相似,基于項目的協(xié)同過濾算法的核心便是判斷項目之間的相似性。除了傳統(tǒng)的相似性判斷方法外,在電影領(lǐng)域,還可以通過電影的導(dǎo)演、演員等要素對電影進行基于一定權(quán)重的直接劃分,進而找到相似的電影進行推薦。
電影個性化推薦算法過于單一時容易使用戶陷于“信息繭房”,視野逐漸窄化。推薦算法的極端情況便是“你喜歡什么,你的世界就只剩下什么”。每天看到相似甚至是相同的電影推薦,漸漸地就會給用戶一種“電影都是這樣”的錯覺,極大地限制了用戶的視野,久而久之,便會在不知不覺中將用戶困在興趣的小圈子里,就像是困在一個“繭房”中。在更極端的情況下,用戶甚至?xí)霈F(xiàn)“信息異化”的情況,個人想法被看到的信息所影響,成為被信息支配的奴隸,不再具有作為信息控制主體的能力。若用戶本身的情感傾向與價值觀就與主流價值觀相悖,那推薦算法就可能將他引入歧途。
在當(dāng)今的網(wǎng)絡(luò)環(huán)境之下,“流量明星”具有巨大的影響力,這并非健康的網(wǎng)絡(luò)環(huán)境應(yīng)有的特征。為改善這一情況,一方面要對內(nèi)容加強監(jiān)管,盡量控制流量明星的龐大粉絲群進行“控評”“刷屏”等行為,另一方面也要主動出擊,利用個性化推薦算法來弘揚主流價值觀。
電影不同于高度依賴個性化推薦的短視頻,短視頻不僅有高度的娛樂功能,還具有非常重要的教化功能。因此傳統(tǒng)的個性化推薦算法不能全然照搬到電影推薦領(lǐng)域中,主流價值觀的注入成為必然。
基于協(xié)同過濾的推薦算法不同于以今日頭條為代表的新聞客戶端所使用的基于內(nèi)容的推薦算法,它將推薦的維度提高,將“人群”作為推薦的基數(shù)數(shù)據(jù),不斷進行優(yōu)化和迭代?;趨f(xié)同過濾的推薦算法相較于基于內(nèi)容的推薦算法擁有更大的靈活性,其推薦的內(nèi)容也更加豐富,可以有效避免用戶接收到的信息窄化的問題,打破“信息繭房”。
個性化推薦依賴機器學(xué)習(xí)與深度學(xué)習(xí),它足夠智能化,卻不夠人性化,而多元化、開放式、動態(tài)化的推薦算法可以在一定程度上規(guī)避算法帶來的缺陷。為打破“信息繭房”,需要改進算法,使用糾偏技術(shù)。不但要動態(tài)跟蹤用戶的使用行為和使用偏好,及時轉(zhuǎn)變推薦的重心重點內(nèi)容,還要定期給用戶推薦非計劃中的電影,找到用戶可能感興趣但目前還沒有了解過的電影,拓寬用戶的視野,打破“信息繭房”,讓推薦算法更人性化。
在互聯(lián)網(wǎng)上的傳播環(huán)境是一個逐漸去中心化的系統(tǒng),在這樣的前提下,視頻網(wǎng)站與視頻客戶端必須把握住意識形態(tài)的主動權(quán)。作為一個傳播平臺,必須有以多樣化的方式宣揚社會主義核心價值觀的意識和作為。對主流價值觀的注入不僅要依靠集中力量加強人工審核,結(jié)合大數(shù)據(jù)技術(shù)進行溯源,把握不良電影和不良畫面的來源,從源頭上遏制不良內(nèi)容流出,提高電影質(zhì)量,還要從推薦系統(tǒng)本身入手,拒絕簡單粗暴的置頂方式,更加人性化地對價值觀進行個性化引導(dǎo)。
電影的推薦本質(zhì)上是對文化的傳播過程,這一過程會對用戶產(chǎn)生潛移默化的作用,進一步會對整個社會的風(fēng)氣和價值觀產(chǎn)生巨大的影響。當(dāng)前廣泛使用的用戶畫像的標簽體系中,通常沒有主流內(nèi)容的標簽維度,而在電影的個性化推薦中主流內(nèi)容的標簽維度是必不可少的。對于主流內(nèi)容標簽,應(yīng)根據(jù)具體情況對其權(quán)重進行適當(dāng)加強,在尊重用戶興趣的前提下,將主流價值觀以多樣化的方式傳遞給用戶。
將用戶畫像與協(xié)同過濾算法結(jié)合不僅可以很好地解決協(xié)同過濾算法忽略用戶對電影內(nèi)容的偏好的問題,在用戶畫像構(gòu)建過程中,通過分析用戶的行為數(shù)據(jù),特別是對評論等文本信息進行情感分析,還可以獲得用戶在一定時間段內(nèi)的情感傾向,當(dāng)用戶出現(xiàn)負面情緒或價值觀明顯偏離主流正確價值觀方向時,及時做出反應(yīng),將部分包含正面情緒和主流的正向價值觀的內(nèi)容推薦給用戶,改變“算法無價值觀”的現(xiàn)狀。
隨著5G移動網(wǎng)絡(luò)的建設(shè)和高清編碼技術(shù)的發(fā)展,會有越來越多的用戶隨時隨地通過移動終端觀看4K/8K高清電影。個性化推薦技術(shù)的引入,恰好能夠幫助我們在紛繁復(fù)雜的電影資源庫中快速找到那一部“對”的電影。
在目前人工智能大發(fā)展、大數(shù)據(jù)技術(shù)大應(yīng)用的背景下,個性化推薦技術(shù)已經(jīng)成為內(nèi)容傳播行業(yè)的標準配置,也將成為線上電影行業(yè)持續(xù)健康發(fā)展的突破口。用戶畫像基于用戶自身數(shù)據(jù)的采集分析,幫助視頻網(wǎng)站更加懂得用戶所想,為每一個用戶打造與眾不同的觀影體驗。而用戶畫像與協(xié)同過濾算法融合,將“歷史行為”“用戶分群”“電影內(nèi)容”都作為推薦的基數(shù)數(shù)據(jù),不斷進行優(yōu)化和迭代,具有更大的靈活性,其推薦的電影準確性也會得到一定的提高,在此過程中,通過對用戶情緒與價值觀的監(jiān)測并及時做出反應(yīng),可以有效避免用戶接收到的信息窄化問題,對用戶的價值觀進行及時的引導(dǎo)。