国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

深度神經(jīng)網(wǎng)絡(luò)視頻新媒體短視頻個性化推薦系統(tǒng)研究

2019-07-11 01:01:16高晨峰
衛(wèi)星電視與寬帶多媒體 2019年5期
關(guān)鍵詞:特征向量數(shù)據(jù)挖掘

高晨峰

【摘要】隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,新媒體短視頻不斷豐富著人們的生活。面對海量的新媒體短視頻,傳統(tǒng)基于協(xié)同過濾算法的視頻推薦系統(tǒng)已經(jīng)不能滿足人們的新媒體短視頻推薦需求。對此,本文利用深度學(xué)習(xí)和數(shù)據(jù)挖掘相關(guān)技術(shù),提出了一種基于深度神經(jīng)網(wǎng)絡(luò)模型的新媒體短視頻個性化推薦系統(tǒng),該推薦系統(tǒng)主要包括:數(shù)據(jù)采集處理模塊、用戶視頻建模模塊、神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊、推薦視頻生成模塊4個部分。通過對該推薦系統(tǒng)的實驗分析發(fā)現(xiàn),通過深度神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)與訓(xùn)練,該推薦系統(tǒng)具備較高的推薦性能,能夠充分把握用戶對新媒體短視頻的興趣偏好,實用價值較高。

【關(guān)鍵詞】新媒體短視頻;個性化推薦系統(tǒng);深度神經(jīng)網(wǎng)絡(luò)模型;數(shù)據(jù)挖掘;特征向量

一、引言

隨著互聯(lián)網(wǎng)通信與多媒體技術(shù)的發(fā)展,新媒體短視頻的播放量持續(xù)增長。截止2018年,愛奇藝、騰訊視頻、抖音短視頻等客戶端的視頻總量達(dá)到了7000萬,月度活躍用戶更是高達(dá)2億,每天有接近10億的視頻播放量。面對如此海量的新媒體短視頻,傳統(tǒng)的協(xié)同過濾算法難以采取常規(guī)的手段來實現(xiàn)新媒體短視頻的內(nèi)容特征提取,也就無法對新媒體短視頻內(nèi)容的進(jìn)行準(zhǔn)確推薦。同時,深度學(xué)習(xí)在自然語言處理、圖像處理和語音處理等領(lǐng)域取得了技術(shù)性突破,新媒體短視頻推薦技術(shù)應(yīng)運而生。

在此背景下,本文提出了一種基于深度神經(jīng)網(wǎng)絡(luò)模型的新媒體短視頻個性化推薦系統(tǒng),進(jìn)行用戶和新媒體短視頻建模及深度訓(xùn)練學(xué)習(xí),把握用戶興趣偏好與新媒體短視頻之間的內(nèi)在關(guān)系,實現(xiàn)新媒體短視頻的個性化推薦。

二、新媒體短視頻個性化推薦系統(tǒng)設(shè)計

(一)總體流程

基于深度神經(jīng)網(wǎng)絡(luò)模型的新媒體短視頻個性化推薦系統(tǒng)的整體流程示意圖如圖1所示,從圖1可以看到,該系統(tǒng)基本涵蓋以下幾個模塊:

(1)數(shù)據(jù)采集處理模塊。通過Hadoop大數(shù)據(jù)平臺獲取用戶的新媒體短視頻歷史操作數(shù)據(jù)和新媒體短視頻的文本描述數(shù)據(jù),完成兩部分?jǐn)?shù)據(jù)的預(yù)處理工作;

(2)用戶視頻建模模塊。采用傳統(tǒng)的文本挖掘算法對新媒體短視頻的文本描述數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,獲得新媒體短視頻內(nèi)容的關(guān)鍵特征,結(jié)合用戶對新媒體短視頻的播放記錄,實現(xiàn)用戶和視頻建模;

(3)神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊。以用戶和新媒體短視頻建模情況為深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,將新媒體短視頻和用戶特征向量作為深度神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),對深度神經(jīng)網(wǎng)絡(luò)進(jìn)行有監(jiān)督的訓(xùn)練。充分利用深度學(xué)習(xí)技術(shù)的特征提取優(yōu)勢,把握新媒體短視頻與用戶的語義特征,挖掘用戶興趣偏好與新媒體短視頻之間內(nèi)在關(guān)系,構(gòu)建個性化推薦系統(tǒng);

(二)數(shù)據(jù)采集處理模塊

基于深度神經(jīng)網(wǎng)絡(luò)模型的新媒體短視頻個性化推薦系統(tǒng)執(zhí)行的第一步就是要獲取相關(guān)數(shù)據(jù)信息,這里的相關(guān)數(shù)據(jù)信息包括兩個方面:

第一是新媒體短視頻的文本描述數(shù)據(jù)。新媒體短視頻與其他常規(guī)視頻一樣,其文本描述數(shù)據(jù)無外乎:視頻標(biāo)題、視頻基本內(nèi)容、視頻發(fā)布地區(qū)、視頻策劃、編劇和主演、視頻發(fā)布時間和發(fā)布作者等等。這些文本描述數(shù)據(jù)主要用于新媒體短視頻內(nèi)容的特征提取,為后續(xù)新媒體短視頻建模奠定基礎(chǔ)。

第二是用戶對新媒體短視頻的歷史操作記錄。這里的操作可以理解為用戶打開新媒體短視頻,用戶打開視頻有兩種情況,情況一是用戶移動視頻播放進(jìn)度條,粗略瀏覽新媒體短視頻,用戶實際觀看時長小于視頻總時長,可能該用戶對此新媒體短視頻并不是真正感興趣;情況二是用戶完整地觀看了新媒體短視頻,沒有快進(jìn)瀏覽,用戶實際觀看時長等于視頻總時長,可以認(rèn)為用戶對此視頻感興趣。因此,為了區(qū)分用戶對新媒體短視頻的兩種操作情況,在判斷用戶對新媒體短視頻操作是否有效時加入了新媒體短視頻播放時長比這一指標(biāo),新媒體短視頻播放時長比具體計算公式如下:

其中,τia為用戶a觀看新媒體短視頻i的時長,Ti為新媒體短視頻i的總時長。只有當(dāng)τia與Ti之比大于某個給定閾值時,才能認(rèn)為用戶對新媒體短視頻操作是有效的,并進(jìn)行記錄。一般而言,新媒體短視頻實際閾值為0.3左右。至此得到用戶對新媒體短視頻的歷史操作記錄,得到用戶特征向量,為后續(xù)用戶建模奠定基礎(chǔ)。

另外,在現(xiàn)有的網(wǎng)絡(luò)情況下,新媒體短視頻總是存在各種各樣的問題,例如:數(shù)據(jù)缺失、數(shù)據(jù)冗余等。為了保證視頻數(shù)據(jù)的完整性和可靠性,在正式建模分析之前,需要對文本描述數(shù)據(jù)進(jìn)行預(yù)處理,預(yù)處理主要包括:視頻過濾和視頻融合。視頻過濾主要是去除部分重要文本信息缺失的新媒體短視頻。視頻融合主要是合并重要文本信息相似的新媒體短視頻。

(三)用戶視頻建模模塊

根據(jù)數(shù)據(jù)采集處理模塊對相關(guān)數(shù)據(jù)信息的獲取和預(yù)處理,利用深度學(xué)習(xí)和數(shù)據(jù)挖掘相關(guān)技術(shù)對視頻數(shù)據(jù)和用戶數(shù)據(jù)分別進(jìn)行建模。

(1)視頻建模

視頻建模的方法較多,基于新媒體短視頻的播放特點,本文通過提取新媒體短視頻重要文本描述性關(guān)鍵詞作為視頻標(biāo)簽信息,由此進(jìn)行視頻建模。

提取視頻關(guān)鍵詞的思路是分析一個詞語在視頻中的重要性。而一個詞語在視頻中的重要性取決于兩個方面:第一在視頻中出現(xiàn)的頻率,記作TF值。TF值在某種程度上可以直接體現(xiàn)出該詞語在該視頻中的重要程度,TF值越大,它的重要性越高;第二是這個詞語在所有新媒體短視頻庫中的出現(xiàn)的頻率,也叫作逆向視頻頻率,記作IDF值。TF值反映出這個詞語在整個視頻庫中的重要程度,如果一個詞語在整個視頻庫經(jīng)常出現(xiàn),那個用該詞語代表某個視頻的能力反而會下降,即這個詞語所提供的信息量減少。因此,當(dāng)一個詞語在整個視頻庫出現(xiàn)的頻率越高時,對應(yīng)的IDF值就越小。

當(dāng)對所有的新媒體短視頻文本內(nèi)容進(jìn)行提取視頻關(guān)鍵詞后,就可以量化各個關(guān)鍵詞在新媒體短視頻的重要程度。去除重要程度較小的關(guān)鍵詞,保留那些重要程度較大的關(guān)鍵詞,并作為該視頻的標(biāo)簽信息,從而描述整個視頻特征,完成視頻建模。另外,還需要對新媒體短視頻進(jìn)行關(guān)鍵詞統(tǒng)計,建立視頻關(guān)鍵詞庫,生成關(guān)鍵詞索引。

猜你喜歡
特征向量數(shù)據(jù)挖掘
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計——以特征值和特征向量為例
克羅內(nèi)克積的特征向量
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
一類三階矩陣特征向量的特殊求法
一類特殊矩陣特征向量的求法
EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應(yīng)用
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
三維向量空間中線性變換的特征向量的幾何意義*
和林格尔县| 宜城市| 江阴市| 彭泽县| 进贤县| 朝阳区| 施甸县| 揭东县| 兴隆县| 齐河县| 手游| 肥东县| 亚东县| 广西| 四平市| 齐河县| 遂溪县| 延津县| 建阳市| 徐汇区| 大连市| 西藏| 施秉县| 宁明县| 内乡县| 交口县| 延边| 武功县| 三门峡市| 常山县| 海城市| 左云县| 贡嘎县| 阿尔山市| 南丹县| 和龙市| 辛集市| 怀宁县| 双辽市| 昌平区| 琼结县|