国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于社會(huì)標(biāo)簽的視頻推薦系統(tǒng)的研究

2021-06-16 05:29劉天成
電子制作 2021年4期
關(guān)鍵詞:瀏覽量權(quán)值標(biāo)簽

劉天成

(上海市川沙中學(xué),上海,201299)

0 引言

在這個(gè)信息流動(dòng)迅速的時(shí)代,視頻作為人們快速獲取信息和娛樂(lè)的渠道,被人們所喜愛(ài)。隨著大量的視頻網(wǎng)站的發(fā)展,每天用戶都有大量的視頻可以觀看,而其中有些不符合他們的興趣,有些則是質(zhì)量偏低。同時(shí),推薦系統(tǒng)的日臻完善,使得幫助用戶找到自己想要的視頻變得簡(jiǎn)單,而不需要自己花費(fèi)大量時(shí)間去尋找。

網(wǎng)絡(luò)的社會(huì)化趨勢(shì)產(chǎn)生了越來(lái)越多的社會(huì)化標(biāo)注系統(tǒng)[1],當(dāng)用戶給視頻添加過(guò)標(biāo)簽后,便可以匹配相似標(biāo)簽來(lái)匹配,但其系統(tǒng)還存在可信度低,準(zhǔn)確度低等問(wèn)題?;谕ㄓ脴?biāo)簽及其上的特定標(biāo)簽的推薦系統(tǒng)便是本文研究的主要系統(tǒng),而解決系統(tǒng)的問(wèn)題及對(duì)其提出創(chuàng)新便是本文的研究意義。

推薦系統(tǒng)是指對(duì)用戶的興趣進(jìn)行研究后,對(duì)其進(jìn)行個(gè)性化推薦,個(gè)性化推薦技術(shù),指的是系統(tǒng)智能獲取用戶的行為數(shù)據(jù),進(jìn)而主動(dòng)給用戶推薦他們感興趣的信息[2]。這種技術(shù)的想法最早出現(xiàn)在1992年,發(fā)展至現(xiàn)在,主要的推薦系統(tǒng)有:協(xié)同過(guò)濾推薦系統(tǒng),基于內(nèi)容的推薦系統(tǒng)等。

推薦系統(tǒng)能幫助用戶找到自己想看的視頻,而本文研究的方法便是基于社會(huì)標(biāo)簽的推薦系統(tǒng),當(dāng)下的社會(huì)標(biāo)簽主要由用戶和作者及專家群體來(lái)提供,通過(guò)匹配標(biāo)簽便能實(shí)現(xiàn)推薦,

但其系統(tǒng)也存在明顯的缺陷,因?yàn)闃?biāo)簽是由用戶創(chuàng)造和添加的,導(dǎo)致用戶可以寫(xiě)出他想表示的標(biāo)簽而非真正符合視頻的標(biāo)簽,有些標(biāo)簽甚至?xí)`導(dǎo)視頻所包含的真正內(nèi)容,造成了可信度低,標(biāo)簽數(shù)量龐大,不方便匹配等問(wèn)題,最終會(huì)導(dǎo)致系統(tǒng)承受巨大的負(fù)擔(dān),且會(huì)經(jīng)常出現(xiàn)錯(cuò)誤推薦。

1 視頻推薦系統(tǒng)概述

■1.1 協(xié)同過(guò)濾視頻推薦系統(tǒng)

協(xié)同過(guò)濾推薦系統(tǒng)分為基于用戶和基于物品,基于用戶的協(xié)同過(guò)濾推薦(UserCF)研究的是用戶間的關(guān)系,其在視頻推薦系統(tǒng)中的作用是匹配興趣相似的用戶,給當(dāng)前用戶推薦他沒(méi)有見(jiàn)過(guò)但另一用戶見(jiàn)過(guò)的視頻?;谖锲返膮f(xié)同過(guò)濾推薦(ItemCF)是根據(jù)用戶給物品的評(píng)分來(lái)匹配物品間的相似度而進(jìn)行匹配的,其在視頻推薦系統(tǒng)中是匹配視頻的相似度來(lái)進(jìn)行推薦的,其主要缺點(diǎn)為對(duì)于數(shù)據(jù)量有十分高的要求,缺少數(shù)據(jù)就會(huì)導(dǎo)致推薦不精確。

■1.2 基于社交網(wǎng)絡(luò)的視頻推薦系統(tǒng)

基于社交網(wǎng)絡(luò)的推薦的核心是把握用戶之間的信任關(guān)系的度量,起因是學(xué)者發(fā)現(xiàn)好友的推薦往往會(huì)被重視,通過(guò)研究人的重要性,人與人之間的交往關(guān)系,匹配其相似度來(lái)進(jìn)行推薦。個(gè)性化的好友推薦是基于兩個(gè)特征來(lái)研究的:用戶間共同好友和用戶間的相似性[3]。2017 年,胡云等人提出了一種綜合評(píng)分和信任關(guān)系的社會(huì)化推薦算法,解決了用戶特征向量的精準(zhǔn)構(gòu)建及信任傳遞問(wèn)題[4]。

■1.3 基于標(biāo)簽的視頻推薦系統(tǒng)

此系統(tǒng)的基礎(chǔ)是社會(huì)標(biāo)簽,來(lái)源于用戶為物品所給出的標(biāo)簽,本文定義該標(biāo)簽為通用標(biāo)簽,其劣勢(shì)主要為:不精確,較為混亂。在這種標(biāo)簽之上,還有一些特定標(biāo)簽,其來(lái)源于專家或作者所給出的標(biāo)簽,這類標(biāo)簽相比通用標(biāo)簽精確度更高,但它也存在一定缺點(diǎn),比如專家及作者只考慮專業(yè)方面卻忽視了用戶對(duì)其的看法,導(dǎo)致標(biāo)簽并不適應(yīng)大眾。

2 基于通用標(biāo)簽的視頻推薦系統(tǒng)

■2.1 通用標(biāo)簽的作用

視頻因其內(nèi)容難以由系統(tǒng)概括而在推薦的時(shí)候顯得尤為困難,系統(tǒng)不能自主判斷視頻的分類,因此,需要其他人來(lái)幫忙給出標(biāo)簽,本章主要研究由用戶給出的標(biāo)簽,而此舉動(dòng)包含了兩個(gè)部分,其一是用戶添加標(biāo)簽的行為,另一是對(duì)于一個(gè)視頻的標(biāo)簽,這兩方面分別對(duì)于用戶自身的興趣研究以及視頻的信息概述都有很大的幫助。

■2.2 標(biāo)簽關(guān)于自身興趣的興趣預(yù)測(cè)

用戶添加標(biāo)簽,可以反應(yīng)自身的興趣,用戶添加標(biāo)簽的這個(gè)舉動(dòng),表現(xiàn)的是用戶對(duì)于此視頻很關(guān)注,也對(duì)于視頻中的內(nèi)容很清楚,繼而可以推斷其對(duì)于同一類的視頻都會(huì)有一定的興趣,那么繼續(xù)匹配具有相似標(biāo)簽的視頻,便可以形成推薦,大大降低了推薦的難度。進(jìn)一步根據(jù)該行為進(jìn)行推薦的方法是,根據(jù)用戶給出的標(biāo)簽進(jìn)行匹配,匹配相似標(biāo)簽,具體方法如下:

該算法用來(lái)計(jì)算該標(biāo)簽與用戶的關(guān)聯(lián)性,其中,u表示用戶,a表示一個(gè)特定標(biāo)簽,times 表示被使用的次數(shù),r表示任意標(biāo)簽,all 表示用戶所標(biāo)注過(guò)的全部標(biāo)簽,relation的值越大,就說(shuō)明用戶與這個(gè)標(biāo)簽的關(guān)聯(lián)性越大,那么就可以籍此繼續(xù)推薦類似的標(biāo)簽,可以用協(xié)同過(guò)濾系統(tǒng)進(jìn)行進(jìn)一步的匹配,把有相似標(biāo)簽的視頻推薦給該用戶。

該系統(tǒng)在遇到興趣面較為廣泛卻很少添加標(biāo)簽的用戶時(shí)會(huì)顯得較為短板,因?yàn)榇祟愑脩魩缀鯖](méi)有自身關(guān)于標(biāo)簽的關(guān)聯(lián)性,這也就導(dǎo)致了無(wú)法利用上述算法,從而導(dǎo)致推薦無(wú)法進(jìn)行,解決方法是利用后文中的系統(tǒng)互補(bǔ),兩者分情況進(jìn)行交替使用,便可以解決不同用戶的差異所造成的問(wèn)題。

■2.3 標(biāo)簽關(guān)于視頻分類的作用

用戶給視頻添加的標(biāo)簽,可以對(duì)于視頻的分類產(chǎn)生幫助,當(dāng)后來(lái)看到該視頻的用戶想添加同樣的標(biāo)簽時(shí),那么此標(biāo)簽就基本可以認(rèn)定為準(zhǔn)確的標(biāo)簽,把同一類的標(biāo)簽集合起來(lái),再去根據(jù)用戶的興趣推薦,形成的一個(gè)循環(huán),就是另一個(gè)通用標(biāo)簽的作用。這個(gè)是主要的標(biāo)簽系統(tǒng)的作用,在一個(gè)視頻下有足夠的通用標(biāo)簽后,這個(gè)視頻就可以進(jìn)行分類,分類后,系統(tǒng)就只需要匹配標(biāo)簽之間的關(guān)系就可以成功地給用戶進(jìn)行推薦。

這個(gè)系統(tǒng)的主要兩個(gè)問(wèn)題為:第一個(gè)問(wèn)題,需要大量的數(shù)據(jù)量和瀏覽量,若是沒(méi)有這些瀏覽量,視頻的分類就極為不清晰,會(huì)導(dǎo)致無(wú)效推薦,而本文提出的解決方法就是與前文的系統(tǒng)結(jié)合,對(duì)于不流行,瀏覽量小的視頻主要利用前一個(gè)系統(tǒng)進(jìn)行對(duì)于用戶本身興趣的研究并給他推薦視頻,對(duì)于瀏覽量多的視頻,就主要使用后者,這樣的好處不僅僅可以互補(bǔ)兩個(gè)系統(tǒng),同時(shí),因?yàn)楸环诸惖囊曨l主要是一些較為流行的視頻,也可以有一定的質(zhì)量保證。第二個(gè)問(wèn)題,用戶的標(biāo)簽過(guò)于隨意,不夠準(zhǔn)確,或是太過(guò)于繁雜,這個(gè)問(wèn)題普遍存在于標(biāo)簽系統(tǒng)中,而主要的解決方法是利用下文中將提到的特定標(biāo)簽系統(tǒng),該系統(tǒng)有過(guò)濾掉大量的無(wú)用標(biāo)簽作用。

3 基于特定標(biāo)簽的視頻推薦系統(tǒng)

■3.1 標(biāo)簽群體的區(qū)別

此類標(biāo)簽主要由專家或是作者本人來(lái)給出,在給出標(biāo)簽之前,系統(tǒng)將把類似的標(biāo)簽集合起來(lái),由專家或作者提出一個(gè)簡(jiǎn)潔明了的標(biāo)簽或是舍棄該標(biāo)簽,例如“搞笑”和“惡搞”最終合并成“娛樂(lè)”,這樣可以合并大量的類似標(biāo)簽,將最終標(biāo)簽的數(shù)量降至10個(gè)以內(nèi),這10個(gè)中有通用標(biāo)簽,也有特定標(biāo)簽,此類標(biāo)簽因?yàn)橹饕晒俜教峁?,所以精確度比較高,但是也存在特定標(biāo)簽也會(huì)不夠精確的情況,關(guān)于標(biāo)簽精確度的問(wèn)題,可以使用以下算法進(jìn)行計(jì)算:

其中a 表示該標(biāo)簽,i表示該系統(tǒng)下的全部標(biāo)簽,最終的值應(yīng)在1以內(nèi),這個(gè)值代表著特定標(biāo)簽所占的百分比,若是特定標(biāo)簽被人們所認(rèn)可,那么之后便不會(huì)再添加更多的通用標(biāo)簽,也就使得特定標(biāo)簽所占的百分比上升,相反,百分比越低,那么就代表著該特定標(biāo)簽的準(zhǔn)確度越低,若是這個(gè)值低于0.5,基本可以確定該特定標(biāo)簽是有問(wèn)題的,此時(shí)應(yīng)該降低該標(biāo)簽的權(quán)值或是直接對(duì)提出標(biāo)簽的那一方提議修改,重新給出一個(gè)新的標(biāo)簽。這個(gè)值也可以一定程度反應(yīng)一個(gè)標(biāo)簽的權(quán)值,但是不夠精確,推薦視頻的時(shí)候,會(huì)根據(jù)兩種標(biāo)簽所占的權(quán)值來(lái)決定優(yōu)先級(jí),隨后進(jìn)行推薦。

■3.2 標(biāo)簽優(yōu)先級(jí)問(wèn)題

此系統(tǒng)屬于混合推薦系統(tǒng),而混合推薦主要有這幾個(gè)類型:加權(quán)型,分級(jí)型混合推薦系統(tǒng),合并型,瀑布型[5]。本文主要利用加權(quán)型來(lái)解決優(yōu)先級(jí)問(wèn)題。權(quán)的值取決于兩種標(biāo)簽的數(shù)量,在把通用標(biāo)簽聚集成集合的時(shí)候,對(duì)于每類相同標(biāo)簽的數(shù)量進(jìn)行計(jì)算,列出一個(gè)矩陣,其縱坐標(biāo)為各個(gè)標(biāo)簽的種類,橫坐標(biāo)為數(shù)量,權(quán)值,再利用如下算法:

■3.3 視頻質(zhì)量推薦優(yōu)化

在根據(jù)上文的系統(tǒng)進(jìn)行加權(quán)推薦后,會(huì)出現(xiàn)質(zhì)量參差不齊的問(wèn)題,有些低質(zhì)量的視頻依然有很高的權(quán)值,導(dǎo)致在推薦的時(shí)候會(huì)推薦一些低質(zhì)量的視頻。主要解決方法是通過(guò)瀏覽量和對(duì)于作者進(jìn)行評(píng)估兩種方法,第一種方法可以與第三章中的系統(tǒng)合用,從而通過(guò)推薦瀏覽量多或評(píng)分高的視頻來(lái)一定程度上解決視頻的質(zhì)量問(wèn)題。第二種方法是通過(guò)對(duì)于一個(gè)作者的以往的視頻的質(zhì)量進(jìn)行評(píng)估,可以參考的數(shù)據(jù)有:瀏覽量,評(píng)分,收藏量等,在瀏覽量一定的情況下,若是收藏量和評(píng)分都較高,那么該作者的評(píng)估就很高,在推薦他的視頻的時(shí)候,就可以適當(dāng)?shù)脑黾铀曨l的權(quán)值來(lái)使得該作者的視頻更容易被推薦,同時(shí),也能帶動(dòng)該作者的知名率,從而使得優(yōu)質(zhì)視頻得以宣傳,形成良性循環(huán),反之,低質(zhì)視頻就會(huì)被不斷的篩選,降低其權(quán)值,使其更不容易被推薦,從而降低其瀏覽量。

4 總結(jié)與展望

本文對(duì)基于標(biāo)簽的視頻推薦系統(tǒng)的現(xiàn)狀進(jìn)行了概述,對(duì)于幾個(gè)基于標(biāo)簽的推薦系統(tǒng)進(jìn)行了分析,提出了基于標(biāo)簽的推薦系統(tǒng),有效解決了視頻質(zhì)量較低的問(wèn)題。此次研究雖然完善了基于標(biāo)簽的推薦系統(tǒng)的一些缺點(diǎn),但仍有一些問(wèn)題仍未解決,例如如何確定三個(gè)系統(tǒng)的運(yùn)行優(yōu)先級(jí)。下一步研究工作本文作者將致力于研究如何推薦給用戶高質(zhì)量的視頻以及使得該系統(tǒng)運(yùn)行更穩(wěn)定。

猜你喜歡
瀏覽量權(quán)值標(biāo)簽
熱議李子柒
游記表述與游客關(guān)注度的關(guān)系研究
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
財(cái)務(wù)風(fēng)險(xiǎn)跟蹤評(píng)價(jià)方法初探
讓衣柜擺脫“雜亂無(wú)章”的標(biāo)簽
基于洪泛查詢的最短路徑算法在智能交通系統(tǒng)中的應(yīng)用
科學(xué)家的標(biāo)簽
科學(xué)家的標(biāo)簽
《江南Style》瀏覽量超20億
CNZZ報(bào)告顯示中國(guó)網(wǎng)民地域分布差異明顯