馬學(xué)森, 楊智捷, 儲(chǔ)昭坤, 周天保
(1.合肥工業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 合肥 230601; 2.安全關(guān)鍵工業(yè)測(cè)控技術(shù)教育部工程研究中心,安徽 合肥 230601)
根據(jù)思科統(tǒng)計(jì)[1],2021年全球上傳至網(wǎng)絡(luò)的視頻內(nèi)容激增,每月全球網(wǎng)絡(luò)上新增的視頻需要耗費(fèi)每個(gè)人超過500萬年的時(shí)間才能觀看完。因?yàn)橛脩舻臅r(shí)間和注意力是有限的,所以大多數(shù)視頻幾乎并沒有被注意到,只有少數(shù)受歡迎的視頻獲得大多數(shù)人的觀看。文獻(xiàn)[2]指出,許多應(yīng)用程序中使用著預(yù)測(cè)視頻受歡迎程度的功能,此項(xiàng)功能是廣告和推薦的關(guān)鍵一環(huán)。通過觀察YouTube視頻網(wǎng)站上很多用戶的反饋行為,一部分視頻在公開后的一段時(shí)間內(nèi),收到用戶的正向反饋后,視頻的流行度有顯著增加。文獻(xiàn)[3]指出,由于發(fā)布在線視頻的形式復(fù)雜,內(nèi)容多樣,巨大的數(shù)據(jù)量給人們?cè)斐尚畔⑦^量的困擾,研究者在視頻流行度預(yù)測(cè)的研究中側(cè)重于從海量信息中預(yù)測(cè)篩選出將來熱門的信息。
目前主流的視頻流行度預(yù)測(cè)模型有基于統(tǒng)計(jì)學(xué)和基于機(jī)器學(xué)習(xí)的預(yù)測(cè)方法?;诮y(tǒng)計(jì)學(xué)的預(yù)測(cè)方法[4]在不同時(shí)間段,使用累計(jì)瀏覽量的序列間關(guān)系進(jìn)行建模,未引入外部因素輔助預(yù)測(cè),準(zhǔn)確度仍不足。文獻(xiàn)[5]提出一種新的算法K-ARMA,找出K個(gè)最近的樣本并給予一定的權(quán)重值,根據(jù)K個(gè)樣本的流行度和自回歸滑動(dòng)平均(auto regressive moving average,ARMA)模型相結(jié)合開展預(yù)測(cè);該模型相比傳統(tǒng)ARMA模型在預(yù)測(cè)準(zhǔn)確度上有明顯的提升,但是未結(jié)合用戶行為數(shù)據(jù),未設(shè)置多組特征值。文獻(xiàn)[6]提出一種融合搜索引擎數(shù)據(jù)與社交網(wǎng)絡(luò)數(shù)據(jù)的多元線性回歸模型預(yù)測(cè)點(diǎn)播量排名,該模型比單獨(dú)用搜索引擎數(shù)據(jù)或社交網(wǎng)絡(luò)的預(yù)測(cè)模型預(yù)測(cè)效果更佳。
基于機(jī)器學(xué)習(xí)的流行度預(yù)測(cè)方法,文獻(xiàn)[7]提出一種混合機(jī)器學(xué)習(xí)方法來預(yù)測(cè)未發(fā)布視頻內(nèi)容的流行度,該模型通過視頻歷史內(nèi)容的信息預(yù)測(cè)新內(nèi)容的受歡迎程度,但未考慮觀眾的反饋數(shù)據(jù)(如觀眾人數(shù)、評(píng)分等)。隨著深度學(xué)習(xí)理論的出現(xiàn)與發(fā)展,長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)廣泛運(yùn)用于如風(fēng)速[8]、語音處理[9]、船舶航跡[10]等領(lǐng)域,預(yù)測(cè)效果良好。LSTM網(wǎng)絡(luò)在序列建模任務(wù)中有很大的優(yōu)勢(shì),它具有長時(shí)記憶功能,能夠單一方向提取時(shí)間序列的時(shí)間特征,其變體GRU(gate recurrent unit)因結(jié)構(gòu)相似,計(jì)算簡單等特點(diǎn)也被廣泛運(yùn)用于預(yù)測(cè)方面。雙向長短斯記憶(bi-directional long short-term memory,BiLSTM)網(wǎng)絡(luò)由雙向LSTM組成,主要應(yīng)用于文本情感分析[11]、命名實(shí)體識(shí)別等領(lǐng)域。文獻(xiàn)[12]提出將神經(jīng)網(wǎng)絡(luò)和馬爾可夫相組合的模型(a video popularity prediction algorithm based on a neural network and Markov combined model,Mar-BiLSTM),在使用Mar-BiLSTM模型后,精度有所提升的同時(shí)仍保持低模型復(fù)雜度。文獻(xiàn)[13]將自回歸與循環(huán)神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出一種基于自回歸循環(huán)神經(jīng)網(wǎng)絡(luò)(auto regressive recurrent neural network,DeepAR),主要應(yīng)用于零售等領(lǐng)域,該算法可有效融合大量相關(guān)時(shí)間序列,產(chǎn)生準(zhǔn)確的概率預(yù)測(cè);此算法運(yùn)用于視頻流行度的預(yù)測(cè)還需進(jìn)一步研究。
此外,更多學(xué)者將注意力機(jī)制引入時(shí)間序列預(yù)測(cè)中。文獻(xiàn)[14]提出一種將內(nèi)容特征與時(shí)序信息相融合的注意力視頻流行度模型,將內(nèi)容特征與時(shí)間序列分開處理后融合在一起,該模型很好地捕捉流行趨勢(shì)。文獻(xiàn)[15]研究微信文章的瀏覽量、點(diǎn)擊量等用戶反饋事件的出現(xiàn)頻次,引入注意力機(jī)制作用于LSTM網(wǎng)絡(luò),將微信文章的變化過程進(jìn)行建模用于預(yù)測(cè)流行趨勢(shì)。文獻(xiàn)[16]提出一種多變量時(shí)間模式預(yù)測(cè)的注意力機(jī)制(temporal pattern attention,TPA)模型,進(jìn)行多變量時(shí)間序列預(yù)測(cè),并有效運(yùn)用于電力負(fù)荷[16]、股票指數(shù)[17]、泊位占有率[18]等方面的預(yù)測(cè)。實(shí)驗(yàn)表明,TPA機(jī)制能融合多特征,預(yù)測(cè)精度較傳統(tǒng)方法更佳,但仍需進(jìn)一步驗(yàn)證在視頻流行度預(yù)測(cè)方向是否適用。
通過以上視頻流行度預(yù)測(cè)方法可以得出視頻流行度的預(yù)測(cè)面臨如下難題:
1) 觀眾點(diǎn)擊觀看視頻的行為具有不確定性,即觀眾在選擇在何時(shí)點(diǎn)擊何種視頻是不確定事件,與個(gè)人所面臨的環(huán)境事件與心理狀態(tài)有關(guān),這為視頻流行度預(yù)測(cè)增添了不確定性。
2) 視頻的流行度與視頻播放網(wǎng)站的用戶反饋具有相關(guān)性,即視頻網(wǎng)站會(huì)優(yōu)先推送更熱門的視頻給觀眾,觀眾會(huì)通過其他觀眾反饋的數(shù)據(jù)(如觀看數(shù)、評(píng)分等)來決定是否觀看視頻。
基于以上分析,本文提出注意力與神經(jīng)網(wǎng)絡(luò)的視頻流行度預(yù)測(cè)算法TPA-BiLSTM,并驗(yàn)證其在視頻流行度預(yù)測(cè)領(lǐng)域的有效性。本文貢獻(xiàn)主要包括以下3個(gè)方面。
首先,本文考慮不同用戶反饋事件[15]分析視頻的觀看量、點(diǎn)贊量、轉(zhuǎn)發(fā)量、收藏量等宏觀事件發(fā)生的次數(shù)。
其次,本文利用時(shí)間模式注意力TPA機(jī)制,對(duì)視頻流行度的復(fù)雜結(jié)構(gòu)進(jìn)行建模。TPA機(jī)制能夠聚焦最有利于預(yù)測(cè)的特征,并研究特征之間的關(guān)系,提高預(yù)測(cè)的準(zhǔn)確性。注意力機(jī)制可以計(jì)算每個(gè)維度輸入特征的權(quán)重,當(dāng)權(quán)值大時(shí),意味著該特征更有利于預(yù)測(cè);當(dāng)權(quán)值較小時(shí),表明該特征對(duì)視頻流行度預(yù)測(cè)的貢獻(xiàn)較小。視頻流行度的數(shù)據(jù)集代表具有短期和長期記憶的周期模式。TPA-LSTM機(jī)制包括LSTM模塊、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)模塊和時(shí)間注意力模塊,適用于各種數(shù)據(jù)集,甚至是具有弱周期模式的多元時(shí)間序列數(shù)據(jù)。LSTM組件可以捕獲一個(gè)相對(duì)長期的模式,而CNN模塊能提取變量之間的局部依賴性和時(shí)間維度下的短期模式。此外,時(shí)間注意力模塊可以選擇有助于預(yù)測(cè)和捕捉時(shí)間信息的變量。
最后,通過LSTM與雙向CNN組建的BiLSTM網(wǎng)絡(luò),可保留雙向時(shí)間序列的特征依賴。為使預(yù)測(cè)網(wǎng)絡(luò)從視頻觀看量的時(shí)間序列中不僅提取雙向時(shí)間特征,而且提取多維輸入之間的變化規(guī)律,結(jié)合BiLSTM和TPA的優(yōu)點(diǎn),建立注意力與神經(jīng)網(wǎng)絡(luò)的視頻流行度預(yù)測(cè)模型。
forwardt-w,…,t-1,favoritet-w,…,t-1}
(1)
BiLSTM是從LSTM模型結(jié)構(gòu)改進(jìn)的雙向LSTM。LSTM模型提出門控機(jī)制,采用3種門控機(jī)制有效解決梯度爆炸問題,如圖1所示。
圖1 LSTM隱藏單元結(jié)構(gòu)
圖1中,t時(shí)刻輸入的特征向量xt以及t-1時(shí)刻隱藏向量ht-1和細(xì)胞狀態(tài)Ct-1,在結(jié)構(gòu)內(nèi)計(jì)算權(quán)值與激活函數(shù)獲得信息,并輸出t時(shí)刻細(xì)胞狀態(tài)Ct和隱藏向量ht,具體計(jì)算過程為:
ft=σ(Wf[ht-1,xt]+bf)
(2)
it=σ(Wi[ht-1,xt]+bi)
(3)
(4)
(5)
ot=σ(Wo[ht-1,xt]+bo)
(6)
ht=ot×tanh(Ct)
(7)
BiLSTM用于上下文信息的建模,具有良好的長期信息存儲(chǔ)能力。數(shù)據(jù)的逆?zhèn)鞑ヒ馕吨鴷r(shí)間序列以相反順序被傳輸?shù)侥P?神經(jīng)元存儲(chǔ)2個(gè)輸入方向的信息,使用疊加的多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),完成流行度系列的深層特征挖掘,有效地提高模型的預(yù)測(cè)效果。BiLSTM的總體實(shí)現(xiàn)流程如圖2所示。
圖2 BiLSTM總體實(shí)現(xiàn)流程
圖2中,BiLSTM以LSTM作為基礎(chǔ),分別通過正向傳播和反向傳播來提取歷史數(shù)據(jù)的正向時(shí)間特征和反向時(shí)間特征,再由此時(shí)的2個(gè)隱藏單元所輸出的向量相連組成該時(shí)刻輸出,其中,h0、h1、ht-1、ht分別為對(duì)應(yīng)的0、1、t-1、t時(shí)刻的輸出向量。t-1時(shí)刻BiLSTM的計(jì)算過程為:
(8)
(9)
(10)
TPA結(jié)構(gòu)在TPA-BiLSTM模型中的作用和原理如下。
(11)
對(duì)時(shí)間模式矩陣進(jìn)行評(píng)分,評(píng)分函數(shù)f為:
(12)
(13)
其中:f為評(píng)分函數(shù);ai(i=1,2,3,…,n)為注意力權(quán)重。
基于1.3節(jié)介紹的TPA結(jié)構(gòu),構(gòu)建TPA-BiLSTM網(wǎng)絡(luò)模型,設(shè)計(jì)TPA-BiLSTM模型求解視頻流行度預(yù)測(cè)問題。
TPA-BiLSTM模型的視頻流行度預(yù)測(cè)過程,如圖3所示。
圖3 TPABiLSTM算法模型的預(yù)測(cè)過程
1) 輸入層。輸入數(shù)據(jù)包括視頻觀看量、點(diǎn)贊量、轉(zhuǎn)發(fā)量、收藏量。輸出數(shù)據(jù)為視頻流行度。首先對(duì)視頻觀看量、點(diǎn)贊量、轉(zhuǎn)發(fā)量、收藏量的歷史數(shù)據(jù)進(jìn)行處理,包括清洗數(shù)據(jù)、去噪等。
2) BiLSTM層。預(yù)處理后的數(shù)據(jù)輸入BiLSTM網(wǎng)絡(luò),BiLSTM模型從正向和反向提取時(shí)間特征ht。
3) TPA層。TPA使用BiLSTM網(wǎng)絡(luò)的輸出特征作為輸入,在所有采樣時(shí)刻提取單個(gè)特征狀態(tài)所包含的深層信息,并聚焦有利于預(yù)測(cè)的時(shí)間模式。
通過評(píng)價(jià)指數(shù)對(duì)模型進(jìn)行評(píng)價(jià)。對(duì)HC的行加權(quán)求和,得到信息向量vt為:
(14)
其中,ai為時(shí)間模式矩陣HC的第i行注意力權(quán)重。最后將vt和最后一個(gè)時(shí)刻的輸出ht融合,通過線性變化,得到最后的預(yù)測(cè)輸出,計(jì)算過程為:
ht′=Whht+Wvvt
(15)
(16)
實(shí)驗(yàn)采用kaggle網(wǎng)站的YouTube視頻數(shù)據(jù)集,主要用于時(shí)間序列變化分析、情感分析和流行度分析等。本文選取2020年6月1日至9月31日的歷史數(shù)據(jù)作為數(shù)據(jù)集,數(shù)據(jù)信息包括每日內(nèi)每小時(shí)的視頻觀看量、點(diǎn)贊量、轉(zhuǎn)發(fā)量、收藏量等觀眾反饋事件,也包含視頻ID、視頻播放時(shí)間、視頻種類。
為了保證實(shí)驗(yàn)數(shù)據(jù)的完整性并提高預(yù)測(cè)模型的準(zhǔn)確性和穩(wěn)定性。首先,補(bǔ)充數(shù)據(jù)集內(nèi)缺失的值,保證數(shù)據(jù)集的完整性;其次,去除噪聲數(shù)據(jù);最后,對(duì)數(shù)據(jù)集進(jìn)行歸一化,將數(shù)據(jù)進(jìn)行線性變化。劃分每個(gè)視頻數(shù)據(jù)集,訓(xùn)練集的選取為整個(gè)數(shù)據(jù)集的前80%,剩余的數(shù)據(jù)集作為測(cè)試集。
選取主流的5種時(shí)序預(yù)測(cè)方法與TPA-BiLSTM模型進(jìn)行對(duì)比,這些方法包括:ARMA模型、LSTM模型、GRU模型、DeepAR模型、Mar-BiLSTM模型。按照2.1節(jié)所描述處理時(shí)間序列數(shù)據(jù),然后進(jìn)行數(shù)據(jù)歸一化,輸入模型訓(xùn)練,最后對(duì)比測(cè)試集預(yù)測(cè)結(jié)果。對(duì)于ARMA模型,本文直接使用文獻(xiàn)[5]設(shè)定的參數(shù)和公開代碼進(jìn)行實(shí)驗(yàn)。LSTM模型與GRU模型隱藏層神經(jīng)元的個(gè)數(shù)為24,批處理尺寸為32,學(xué)習(xí)率為0.001,迭代次數(shù)為1 000。DeepAR模型隱藏層神經(jīng)元的個(gè)數(shù)為40,批處理尺寸為32,學(xué)習(xí)率為0.001,迭代次數(shù)為1 000。對(duì)于Mar-BiLSTM模型,本文參考文獻(xiàn)[12]內(nèi)的代碼與參數(shù)設(shè)定進(jìn)行訓(xùn)練模型。經(jīng)多次調(diào)整參數(shù)以訓(xùn)練模型后得出TPA-BiLSTM流行度預(yù)測(cè)模型的模型參數(shù)如下:迭代次數(shù)為1 000;學(xué)習(xí)率為0.001;輸入特征數(shù)為4;TPA-BiLSTM模型訓(xùn)練選取的樣本量取64;BiLSTM隱藏層神經(jīng)元的個(gè)數(shù)為24,隱藏層的層數(shù)為2。
使用均方根誤差(root mean square error,RMSE)ERMS和平均絕對(duì)誤差(mean absolute error,MAE)EMA作為評(píng)價(jià)指標(biāo)[3]。其中:ERMS能夠計(jì)算得到真實(shí)值與預(yù)測(cè)值的差別;EMA能夠計(jì)算得到求平均值后的預(yù)測(cè)值與真實(shí)值之間誤差的絕對(duì)值。
(17)
(18)
將TPA-BiLSTM模型與對(duì)比模型的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比。實(shí)驗(yàn)測(cè)試TPA-BiLSTM模型與對(duì)比模型在不同預(yù)測(cè)步長h的預(yù)測(cè)精度[16],h分別取6、12、24、48 h時(shí)不同模型的預(yù)測(cè)性能見表1所列。
表1 不同模型在不同預(yù)測(cè)步長下的預(yù)測(cè)性能對(duì)比
由表1可知,視頻流行度趨勢(shì)變化具有復(fù)雜多變的特點(diǎn),當(dāng)前發(fā)展變化規(guī)律與歷史規(guī)律不完全一致。傳統(tǒng)的時(shí)間序列預(yù)測(cè)未考慮外部因素的影響僅強(qiáng)調(diào)時(shí)間序列預(yù)測(cè),更適合在平穩(wěn)時(shí)間序列內(nèi)進(jìn)行預(yù)測(cè),因此當(dāng)存在預(yù)測(cè)誤差的缺陷并且外部因素的變化大時(shí),會(huì)產(chǎn)生大的偏差。隨著h逐漸增大時(shí),預(yù)測(cè)難度增大。LSTM與GRU整體上表現(xiàn)優(yōu)于ARMA,說明在視頻流行度的預(yù)測(cè)問題上,基于神經(jīng)網(wǎng)絡(luò)的方法能夠更好地?cái)M合非線性的時(shí)間序列數(shù)據(jù)。Mar-BiLSTM模型在預(yù)測(cè)過程中兼具時(shí)間序列的前、后2個(gè)方向的依賴信息,并通過建立馬爾可夫修正模型修正神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)產(chǎn)生的預(yù)測(cè)誤差,在保持模型復(fù)雜度的同時(shí)提高了模型的預(yù)測(cè)精度,該模型相較于其他單一模型的預(yù)測(cè)表現(xiàn)更優(yōu)。DeepAR模型融合自回歸與循環(huán)神經(jīng)網(wǎng)絡(luò),針對(duì)多重時(shí)間序列良好的表現(xiàn),綜合表現(xiàn)優(yōu)于單一模型的使用。本文提出的TPA-BiLSTM模型的RMSE和MAE 2種評(píng)價(jià)指標(biāo)均取得較好的實(shí)驗(yàn)結(jié)果。特別地,在預(yù)測(cè)未來6 h內(nèi)的視頻流行度時(shí),TPA-BiLSTM模型較Mar-BiLSTM模型的RMSE降低12%,較DeepAR模型RMSE降低16%。在預(yù)測(cè)未來48 h內(nèi)的視頻流行度時(shí),TPA-BiLSTM模型較LSTM模型RMSE降低5%,較DeepAR模型降低6%。從整體情況來看,TPA-BiLSTM模型隨著h的增加,預(yù)測(cè)指標(biāo)RMSE、MAE隨著h的增大而增大。經(jīng)測(cè)試TPA-BiLSTM模型的表現(xiàn)優(yōu)于其他模型,在不同預(yù)測(cè)步長h的預(yù)測(cè)精度上均有良好的表現(xiàn)。
綜上可得到如下結(jié)論:
1) 對(duì)比TPA-BiLSTM模型和ARMA模型的結(jié)果,發(fā)現(xiàn)TPA-BiLSTM模型的效果明顯優(yōu)于基于統(tǒng)計(jì)學(xué)的模型。傳統(tǒng)基于統(tǒng)計(jì)學(xué)的模型在多變量時(shí)序預(yù)測(cè)場(chǎng)景下,未考慮變量之間的相關(guān)性,且對(duì)非線性數(shù)據(jù)無法很好地處理,TPA-BiLSTM模型的預(yù)測(cè)結(jié)果更為準(zhǔn)確。
2) 對(duì)比TPA-BiLSTM、LSTM、GRU、DeepAR和Mar-BiLSTM模型,發(fā)現(xiàn)TPA-BiLSTM模型要強(qiáng)于現(xiàn)有基于神經(jīng)網(wǎng)絡(luò)方法的相關(guān)模型,模型預(yù)測(cè)在穩(wěn)定性與準(zhǔn)確性有更好地提升。TPA-BiLSTM模型相較于其他組合模型預(yù)測(cè)精度更高,誤差更小。這是由于TPA-BiLSTM模型捕獲多變量的時(shí)間序列模式,相比于只獲取單一變量的時(shí)間序列模式的模型效果更好。
采用YouTube視頻播放數(shù)據(jù)集進(jìn)行消融實(shí)驗(yàn),以驗(yàn)證TPA-BiLSTM模型各模塊設(shè)計(jì)的作用。每次刪去模型中一個(gè)組件,并與TPA-BiLSTM模型進(jìn)行對(duì)比驗(yàn)證各組件的有效性。將移除組件的模型進(jìn)行命名區(qū)分。即TPA-BiLSTMw/oCN模型,即不包含卷積神經(jīng)網(wǎng)絡(luò)模塊的模型;TPA-BiLSTMw/oBL模型,即不包含雙向隱藏層模塊的模型;TPA-BiLSTMw/oAT模型,即不包含注意力機(jī)制模塊的模型。3種模型的預(yù)測(cè)性能見表2所列。
表2 TPA-BiLSTM的不同結(jié)構(gòu)變種在不同預(yù)測(cè)步長下的預(yù)測(cè)性能對(duì)比
從表2可以看出:各組件對(duì)視頻流行度的預(yù)測(cè)都有貢獻(xiàn),其中貢獻(xiàn)最大的是CNN模塊,CNN模塊在不同h時(shí)都起著關(guān)鍵作用,在h為6、12、24、48 h時(shí),TPA-BiLSTM和TPA-BiLSTMw/oCN模型相比RMSE值分別下降19%、20%、4%、9%。貢獻(xiàn)其次的是雙向隱藏層模塊與注意力機(jī)制模塊,TPA-BiLSTM和TPA-BiLSTMw/oBL模型相比RMSE值也分別降低16%、11%、3%、6%,TPA-BiLSTM和TPA-BiLSTMw/oAT模型相比RMSE值下降17%、15%、4%、7%。
這意味著缺少任意一個(gè)組件都無法發(fā)揮該模型的準(zhǔn)確與穩(wěn)定性能,結(jié)合實(shí)驗(yàn)數(shù)據(jù)可知,本文提出的TPA-BiLSTM模型每個(gè)模塊的設(shè)計(jì)都是必要且有效的。
針對(duì)視頻流行度預(yù)測(cè)問題,本文提出一種基于注意力與神經(jīng)網(wǎng)絡(luò)的視頻流行度預(yù)測(cè)模型,能夠有效地提高流行度的預(yù)測(cè)性能。該模型從2個(gè)方向提取視頻流行度數(shù)據(jù)的時(shí)間特征,為了提高流行度預(yù)測(cè)精度,在模型中將點(diǎn)贊量、轉(zhuǎn)發(fā)量、收藏量數(shù)據(jù)特征作為視頻流行度的融合特征,使模型在預(yù)測(cè)精度與泛化能力上更出色,解決現(xiàn)有單一神經(jīng)網(wǎng)絡(luò)模型和傳統(tǒng)基于統(tǒng)計(jì)學(xué)方法難以準(zhǔn)確預(yù)測(cè)真實(shí)視頻流行度、難以融合多特征的問題。為了客觀地比較模型的有效性,將真實(shí)視頻流行度樣本分為訓(xùn)練集與測(cè)試集進(jìn)行實(shí)驗(yàn)。結(jié)果表明,本文所提模型比ARMA模型、LSTM模型、GRU模型、DeepAR模型和Mar-BiLSTM模型表現(xiàn)出更好的預(yù)測(cè)效果,并在消融實(shí)驗(yàn)中表明每個(gè)模塊的作用。后續(xù)的研究可將不同類型視頻的獨(dú)有特征納入考慮,設(shè)計(jì)適用于更為復(fù)雜情形的預(yù)測(cè)模型并進(jìn)行運(yùn)用推廣。