国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

融合內(nèi)容特征和時序信息的深度注意力視頻流行度預(yù)測模型

2021-07-30 10:33李澤平楊華蔚王忠德
計算機應(yīng)用 2021年7期
關(guān)鍵詞:時序建模趨勢

武 維,李澤平*,楊華蔚,林 川,王忠德

(1.貴州大學計算機科學與技術(shù)學院,貴陽 550025;2.貴州財經(jīng)大學大數(shù)據(jù)應(yīng)用與經(jīng)濟學院,貴陽 550025)

0 引言

提前預(yù)測視頻的受歡迎程度是許多應(yīng)用的重要部分,如推薦、廣告和信息檢索等[1]。通過對YouTube 視頻網(wǎng)站上的大量用戶反饋行為觀察發(fā)現(xiàn),部分視頻在發(fā)布后的一段時間內(nèi),經(jīng)用戶反饋后該視頻的流行度呈增長趨勢。為了捕獲視頻流行度的動態(tài)變化過程,本文首先采用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)建模并計算出視頻的流行趨勢指數(shù),同時離散化視頻的點贊量和點踩量,把流行度預(yù)測任務(wù)轉(zhuǎn)化為分類問題;將視頻的流行度分為“受歡迎”和“不受歡迎”兩類,采用神經(jīng)網(wǎng)絡(luò)模型對視頻的內(nèi)容特征進行建模;最后融合視頻的流行趨勢和內(nèi)容特征以預(yù)測視頻的流行度。

基于用戶反饋量的宏觀積累過程來預(yù)測流行度有很大的實用價值,長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)能夠有效地捕捉事件的變化過程[2],被廣泛應(yīng)用于股票走勢預(yù)測[3]、溫度變化趨勢預(yù)測[4]以及醫(yī)學研究中的抑郁趨勢預(yù)測[5]等。LSTM 網(wǎng)絡(luò)能夠有效地捕捉視頻的流行趨勢,目前已有研究者采用LSTM 網(wǎng)絡(luò)對視頻的流行動態(tài)進行建模和預(yù)測流行度,且取得了較好的效果[6]。受到這些研究工作的啟發(fā),本文采用LSTM 網(wǎng)絡(luò)對視頻的流行趨勢進行建模,捕獲視頻流行度的變化趨勢。

最近,基于深度學習的模型被應(yīng)用于用戶的偏好預(yù)測[7]、App的流行度預(yù)測[8]、電影的受歡迎程度預(yù)測[9]。部分深度學習模型主要分析了內(nèi)容特征對預(yù)測性能的影響[10],而另一部分較為新穎的研究工作則重點關(guān)注分類模型的性能[11],其中較為著名的基于深度學習的分類模型是神經(jīng)網(wǎng)絡(luò)因子分解機(Neural Factorization Machine,NFM)[12],它比傳統(tǒng)的深度神經(jīng)網(wǎng)絡(luò)模型具有更優(yōu)秀的特征表達能力。NFM 是一種新穎的深度學習模型,結(jié)合了線性的二階特征交互和非線性的高階特征交互,能有效地學習稀疏特征。實際情況下的流行度受外部因素影響容易波動,難以捕捉,但是用戶反饋事件的變化趨勢在很大程度影響了視頻的流行度,NFM 能夠有效地學習內(nèi)容特征,但它不能捕捉內(nèi)容的流行趨勢,因此如何結(jié)合視頻流行度變化過程和內(nèi)容特征建模是流行度預(yù)測研究工作的難題。

綜合分析現(xiàn)有的研究成果可知,流行度動態(tài)變化過程難以捕捉,但視頻的內(nèi)容特征對流行度預(yù)測模型的性能有很大的影響。目前,聯(lián)合流行度變化過程和內(nèi)容特征建模的研究工作較為少見。LSTM 網(wǎng)絡(luò)應(yīng)用于流行度的動態(tài)變化過程建模具有高效性[13],能夠有效捕捉流行度的變化趨勢。以NFM為例的基于深度學習的模型有效地結(jié)合了線性的二階特征交互和非線性的高階特征交互,具有優(yōu)秀的模型表達和泛化能力,但無法捕獲視頻的流行度變化趨勢。對此,本文提出一種融合內(nèi)容特征和時序信息的深度注意力視頻流行度預(yù)測(Deep Attention video popularity prediction model Fusing Content and Temporal information,DAFCT)。該模型融合了視頻的內(nèi)容特征和時序信息,具有優(yōu)秀的特征表達及泛化能力,并且能夠捕獲視頻的流行趨勢。

1 相關(guān)工作

1.1 基于LSTM網(wǎng)絡(luò)的流行趨勢預(yù)測

基于注意力機制的LSTM 網(wǎng)絡(luò)減少了對外部信息的依賴[14],已經(jīng)被廣泛應(yīng)用于文本分類、情感分析、點擊率預(yù)測等領(lǐng)域。2017 年,Wu 等[15]提出了一個深度時間上下文網(wǎng)絡(luò)(Deep Temporal Context Network,DTCN),通過對facebook 推文的流行度動態(tài)變化過程建模從而預(yù)測帖子的流行度,預(yù)測結(jié)果表明該模型對預(yù)測長期的流行動態(tài)有顯著的能力。2018年,Yuan 等[16]通過將注意力引入LSTM 網(wǎng)絡(luò)對引文的流行趨勢建模,從而預(yù)測引文的流行度,在computer science 引文數(shù)據(jù)集上準確 率可達85%。2019 年,Varuna 等[17]通過分 析Github上項目的Fork、Star等反饋事件,構(gòu)建了時間序列信息,采用LSTM 網(wǎng)絡(luò)對Github 上的時間序列信息建模并預(yù)測流行趨勢。同年7 月,在國際人工智能大會上,Liao 等[18]分析了在線文章的點擊量、瀏覽量、轉(zhuǎn)發(fā)量、點贊量等宏觀事件發(fā)生的次數(shù),將注意力機制引入LSTM 網(wǎng)絡(luò)對微信文章隨時間的變化過程進行建模以預(yù)測流行趨勢,進一步融合了內(nèi)容特征,從而預(yù)測出微信文章的流行度。該文的流行度趨勢建模過程如下,其中,c是當前的視頻為注意力權(quán)重為序列向量,為隱層輸出,為權(quán)重矩陣。

從以上對流行趨勢預(yù)測的最新研究成果的分析總結(jié)可知,LSTM網(wǎng)絡(luò)能夠很好地捕獲視頻的流行趨勢,因此,本文采用了基于注意力機制的LSTM網(wǎng)絡(luò)來捕捉視頻的流行趨勢。

1.2 基于深度學習的流行度預(yù)測模型

基于深度學習的流行度預(yù)測模型自2016 年以來便一直是學術(shù)界和工業(yè)界的研究熱點,對深度學習的流行度預(yù)測模型的關(guān)注始于2016 年Chen 等[19]提出的基于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)的模型,該模型基于圖像像素以及圖像描述等內(nèi)容特征建模,最初應(yīng)用于廣告的點擊率預(yù)測,后來被廣泛應(yīng)用于流行度預(yù)測研究當中。為了提高預(yù)測性能,2017 年He 等[20]對深度學習模型進行改進,提出了一個基于神經(jīng)網(wǎng)絡(luò)的協(xié)同過濾(Neural Collaborative Filtering,NCF)模型,經(jīng)實驗驗證NCF 模型的預(yù)測準確率達到了87.30%。2019 年,Luo 等[21]提取了新媒體中的政策信息,分析了政策信息中的內(nèi)容特征,采用DNN 建立了一個基于政策信息的流行度預(yù)測模型,實驗結(jié)果顯示該模型優(yōu)于梯度提升決策樹(Gradient Boost Decision Tree,GBDT)模型?;谏疃葘W習的流行度預(yù)測模型大多都是基于DNN改進的,計算公式如下:

以上研究成果只基于單個項目的內(nèi)容特征進行建模,忽略了流行趨勢對流行度預(yù)測模型性能的影響,在實際情況下視頻的流行度常常受到外界因素的干擾不容易建模,因此如何聯(lián)合內(nèi)容特征和流行趨勢建模是流行度預(yù)測研究亟待解決的問題。

2 本文模型

2.1 Attention-LSTM模型

本文采用LSTM 網(wǎng)絡(luò)捕捉視頻的流行趨勢,將注意力機制引入LSTM 網(wǎng)絡(luò)以降低外界因素的干擾,構(gòu)建了基于注意力機制的Attention-LSTM 模型。為了更形象地表征流行度的增長趨勢,本文使用OA-L表示視頻流行度的趨勢指數(shù),由Attention-LSTM 模型計算可得,Attention-LSTM 模型如圖1 所示。通過分析用戶的點贊、瀏覽、評論等反饋信息,給定時間間隔t,將隨時間變化的用戶反饋量構(gòu)建為時間序列dt,則得到反饋序列,LSTM網(wǎng)絡(luò)的計算公式改寫為:

圖1 Attention-LSTM模型Fig.1 Attention-LSTM model

Attention-LSTM模型計算過程如下:

給定某一時間間隔t,將n個隱層輸出記為Hi:

這些隱層輸出hi經(jīng)softmax層后,得到注意力權(quán)重:

將注意力權(quán)重記為Ai:

則Attention-LSTM模型輸出此時的流行趨勢:

由上述計算可得OA-L的值為小于1 的數(shù),表征某一視頻的流行趨勢指數(shù),接下來通過與NFM 模型的預(yù)測結(jié)果結(jié)合,進而計算出視頻的流行度。從實驗結(jié)果來看,Attention-LSTM模型能夠有效地捕獲視頻的流行趨勢,且對提高流行度預(yù)測模型的性能有很大幫助。

2.2 NFM模型

視頻的內(nèi)容包括視頻類型和數(shù)值信息,通常能為流行度預(yù)測提供有用的信息,是影響視頻流行度的關(guān)鍵因素之一。針對不同類型的視頻,不同用戶的喜好不同,用戶的反饋表現(xiàn)則截然不同。本文采用NFM 模型對視頻的內(nèi)容特征建模。NFM 模型首先采用one-hot 編碼技術(shù)將類型特征轉(zhuǎn)換為onehot 向量,然后將視頻類型的one-hot 向量輸入到NFM 模型的嵌入(embedding)層,接著視頻類型特征和數(shù)值特征通過一個二階特征交互池層組合,輸入隱藏層后由激活函數(shù)計算得到輸出結(jié)果。NFM 模型結(jié)合了線性的二階特征交互和非線性的高階特征交互,能夠從稀疏數(shù)據(jù)中學習特征,有效地提高了特征的表達能力。圖2 給出了用于內(nèi)容特征學習的NFM模型。

圖2 NFM模型Fig.2 NFM model

例如,給定視頻類型的集合為M={m1,m2,…,mk},對于第i(i=1,2,…,k)個視頻mi的類型,將視頻類型的one-hot 特征向量x使用嵌入技術(shù)進行降維后得到視頻類型的embedding向量表示:

其中:λi為第i個視頻類型的embedding 向量,xi為第i個視頻類型的one-hot向量。

將embedding向量νx輸入到二階交互層:

其中:σ、WL、bL分別為sigmoid函數(shù)、隱藏層的權(quán)重矩陣和偏置向量,L為隱藏層的層數(shù)。

將隱藏層的輸出yL輸入到全連接層后得到NFM 模型的輸出:

2.3 DAFCT

流行度變化過程中的時序信息難以捕獲,而視頻的內(nèi)容特征很大程度上決定了視頻的流行度,是流行度預(yù)測任務(wù)必不可少的條件。本文的DAFCT 首先采用RNN 挖掘時序信息以捕獲視頻的流行趨勢,引入注意力機制排除外界因素的干擾;然后采用深度神經(jīng)網(wǎng)絡(luò)處理內(nèi)容特征,針對稀疏的高維特征則采用嵌入技術(shù)進行降維以降低模型的計算復(fù)雜性;最后,使用concatenate 方法融合時序信息和內(nèi)容特征。本文DAFCT如圖3所示。

如圖3給定n個視頻,用pi表示視頻的流行度,將所有的n個流行度pi表示為P:

圖3 DAFCT結(jié)構(gòu)Fig.3 DAFCT structure

式(21)為視頻的點贊概率,即為視頻的受歡迎程度。結(jié)合2.1 節(jié)Attention-LSTM 模型的流行趨勢 和2.2 節(jié)NFM 模型的輸出,經(jīng)一個全連接層計算:

其中:OA-L為視頻的流行趨勢指數(shù),ONFM是NFM模型的預(yù)測結(jié)果。代入式(21)后得到流行度:

下面說明DAFCT的信息融合過程及應(yīng)用:

1)內(nèi)容特征和時序信息嵌入。本文的研究工作將視頻的統(tǒng)計信息分為時序信息和視頻的內(nèi)容,其中時序信息為給定時間間隔t內(nèi)的用戶反饋序列,視頻的內(nèi)容包括視頻類型等信息。進行實驗驗證時,模型訓練的時序信息對應(yīng)的特征為時序特征,視頻的內(nèi)容則對應(yīng)內(nèi)容特征,視頻的內(nèi)容包括視頻類型等特征。由圖3 可知,DAFCT 使用了嵌入技術(shù)對高維的特征降維,從而得到低維的稠密特征。假設(shè)當前視頻有7 種類型,這7 種視頻類型表示為{0,1,2,3,4,5,6},如果第i個視頻的類型為5,在數(shù)據(jù)預(yù)處理階段使用one-hot 編碼技術(shù)得到該視頻的類型x=[0,0,0,0,0,1,0],由此得到一個稀疏的向量,而在實際情況中的數(shù)據(jù)維度往往是非常巨大的,直接輸入模型會影響預(yù)測性能。針對這種情況,定義一個嵌入(embedding)向 量em=[0,0.1,0.25,0,0,1,0],則m·(em)T=[0.5],可以看到這個值表征了該視頻所屬的類型。本文只是做了簡單的假設(shè),實際情況下的視頻類型遠遠多于這個設(shè)定,數(shù)據(jù)維度往往大得多,計算復(fù)雜度高,嵌入向量是根據(jù)實驗而設(shè)定的,各不相同。由此可知使用嵌入技術(shù)能有效降低特征向量的維度。

2)信息提取。由圖3 可知,DAFCT 的流行度趨勢捕捉過程和視頻的內(nèi)容特征處理過程是并行的。Attention-LSTM 模型首先根據(jù)輸入的時序信息提取時序特征,輸入的時序特征經(jīng)遺忘門后通過一個sigmoid 函數(shù)計算出要丟棄的時序信息,然后根據(jù)要丟棄的信息更新舊的細胞狀態(tài);同時通過輸入門將細胞存儲的候選信息添加到新的細胞ct中將時序信息存儲下來;最后通過輸出門輸出視頻的流行趨勢,計算過程如2.1節(jié)所示。NFM 模型首先通過一個特征的二階交互層,使得視頻類型與其他內(nèi)容特征如視頻id 等特征之間進行了交互組合,然后將這些組合的特征輸入到隱藏層學習內(nèi)容特征,最后通過一個激活函數(shù)輸出預(yù)測結(jié)果,計算過程如2.2節(jié)所示。NFM 主要是對組合的特征學習,而不是單一的特征,使用了2 層隱藏層,相對于其他基于神經(jīng)網(wǎng)絡(luò)的模型更淺,有效地提高了模型的預(yù)測性能。

3)信息融合。如圖3 所示,DAFCT 使用了concatenate 方法將Attention-LSTM 模型捕捉的流行趨勢和NFM 模型挖掘的內(nèi)容特征融合起來,計算公式為,其中OA-L為Attention-LSTM模型的輸出,ONFM為NFM模型的輸出。

4)DAFCT 的應(yīng)用。為了驗證DAFCT,本文設(shè)計了深度注意力視頻流行度預(yù)測(Deep Attention Video Popularity Prediction,DAVPP)算法求解該模型,并應(yīng)用于視頻的流行度預(yù)測。

算法1 DAVPP算法。

輸入 歷史反饋序列dt,t-1 時刻的時序特征xt-1,經(jīng)one-hot 技術(shù)編碼后的內(nèi)容特征向量x,權(quán)重矩陣W和U,偏置向量b,視頻類型mi;

輸出 流行度pi。

3 實驗與結(jié)果分析

實驗的硬件平臺:Dell 服務(wù)器6 個CPU 核心,1 顆Nvidia Geforce Raytracing 2080 共享GPU 核,內(nèi)存32 GB,顯存11 GB。軟件環(huán)境:服務(wù)系統(tǒng)Ubuntu16.04,終端系統(tǒng)Windows 10,編譯平臺Pycharm Profession,Python 3.7,TensorFlow 1.9.0。

3.1 數(shù)據(jù)預(yù)處理

實驗采用kaggle(https://www.kaggle.com)平臺的YouTube 視頻數(shù)據(jù)集,該數(shù)據(jù)集是情感分析、文本分類、流行度分析、時間序列變化分析以及訓練機器學習算法研究的國際常用數(shù)據(jù)集之一。本文選取了數(shù)據(jù)集中2018 年5 月13 日到8 月26 日的歷史數(shù)據(jù)作為數(shù)據(jù)集,數(shù)據(jù)預(yù)處理分為以下三個部分:

1)時間序列特征構(gòu)建。

本文的Attention-LSTM 模型主要用于捕獲視頻的流行趨勢,因此在構(gòu)建時間序列時以view、like、dislike、video_id 等特征構(gòu)建了時間序列,沒有考慮這些操作數(shù)的變化規(guī)律是否具有周期性。

構(gòu)建的宏觀時間序列為:從數(shù)據(jù)集中抽出每隔一天的view、like、dislike、video_id 操作數(shù)作為宏觀時間序列來計算,并將這些數(shù)據(jù)按照時間順序進行排序,加上video_id 后得到時間序列數(shù)據(jù)集。

2)內(nèi)容特征。

為了保證實驗的有效性,內(nèi)容特征的選取在時間上與時序特征同步,內(nèi)容特征包括publish_time、video_type、channel、video_id和describe,內(nèi)容特征的預(yù)處理步驟如下:

步驟1 對每個樣本計算點贊量與點贊量和點踩量之和的比值,得到的結(jié)果若大于0.5,則認為該視頻內(nèi)容是受用戶歡迎的;反之則認為該視頻不受歡迎。

步驟2 將視頻的受歡迎程度分為兩類:“受歡迎(1)”和“不受歡迎(0)”。

步驟3 去除數(shù)據(jù)集中特征取值相同的字段,這些字段會對流行度預(yù)測效果產(chǎn)生干擾。

最后,為了使得正負樣本平衡,分別采用了上采樣和降采樣的方式對數(shù)據(jù)集做了處理,但從實驗效果來看降采樣方式最佳,于是最終本文采用了降采樣方式對數(shù)據(jù)集做了處理,得到了20 000個正樣本和20 000個負樣本。最后選取數(shù)據(jù)集的前80%作為訓練集,剩下的20%作為測試集。

3.2 評估指標

本文使用準確率(Acc)、召回率(re)和F1 分數(shù)(F1)3 個指標評估DAFCT 的性能。給定訓練集V={v1,v2,…,vn},正樣本集為,負樣本集為FA=,準確率是評估模型整體性能的指標,表示模型預(yù)測正確的樣本數(shù)占所有樣本數(shù) |V|的比例:

其中:X表示實際vi∈TR,且DAFCT 算法預(yù)測所得為vi∈TR的樣本數(shù)量;Y表示實際vi∈FA,且DAFCT 算法預(yù)測為vi∈FA的樣本數(shù)量。

召回率表示在所有的實際正例中,被正確預(yù)測的樣本有多少:

其中:Z表示實際vi∈FA,而DAFCT 算法預(yù)測為vi∈TR的樣本數(shù)量。F1分數(shù)表示綜合了準確率和召回率之后的性能指標:

其中pre為精確度,表示被分為正例的樣本中,實際為正例的比例:

其中:U表示實際vi∈TR,而DAFCT 算法預(yù)測為vi∈FA的樣本數(shù)量。

3.3 實驗設(shè)置

在使用Attention-LSTM 模型挖掘時序信息以捕捉視頻流行趨勢時,采用了神經(jīng)元為128 的單層LSTM 網(wǎng)絡(luò);使用NFM模型學習內(nèi)容特征時,DNN 隱藏層的神經(jīng)元個數(shù)為128,激活函數(shù)使用的是ReLU,同時利用L2 正則化對模型參數(shù)進行約束;DAFCT 訓練過程中的batch size 取1 024,模型在訓練過程中訓練了60 個epoch,輸出層的激活函數(shù)采用sigmoid 函數(shù)。實驗流程如圖4所示。

圖4 實驗流程Fig.4 Experimental flow

3.4 實驗與結(jié)果分析

為了便于觀察模型的預(yù)測效果,實驗分別與Attention-LSTM模型和NFM模型做了對比。

圖5是DAFCT 與Attention-LSTM 模型和NFM 模型的準確率、召回率和F1 分數(shù)對比。其中:DAFCT 的準確率、召回率、F1 分數(shù)的均值分別為0.892 6、0.780 3、0.765 3;Attention-LSTM 模型的準確率、召回率、F1 分數(shù)的均值分別為0.756 9、0.672 1、0.667 3;NFM 模型的準確率、召回率、F1 分數(shù)的均值分別為0.844 7、0.747 2、0.734 6。與Attention-LSTM 模型相比,DAFCT 的召回率和F1 分數(shù)分別提高了10.82、9.80 個百分點;與NFM 模型相比,召回率和F1 分數(shù)分別提高了3.31、3.07 個百分點。由此可見,Attention-LSTM 模型的整體性能不如NFM 模型和DAFCT,雖然Attention-LSTM 模型能夠有效地捕獲視頻的流行趨勢,但對時間序列數(shù)據(jù)要求嚴格,而且特征的表達能力有限;而NFM 模型雖然特征的表達能力強,但不能有效地挖掘視頻的流行趨勢,也存在一定缺陷。從實驗結(jié)果來看,結(jié)合二者能夠有效地提高流行度預(yù)測模型的性能。

圖5 三個對比模型的召回率、F1分數(shù)和準確率對比Fig.5 Comparison of recall,F(xiàn)1 score and accuracy of three comparison models

從圖6 可以觀察到,整體上Attention-LSTM 模型的F1 分數(shù)最小,DAFCT 的F1 分數(shù)最大。Attention-LSTM 模型在第17個epoch 時F1 分數(shù)突然增長,第19 個epoch 時突然下降,而后便一直增長,但增速不高,在第56 個epoch 達到平穩(wěn),可以看出此時Attention-LSTM 模型開始收斂;NFM 模型在第9 個epoch 時F1 分數(shù)突增到0.734 0,在第10 個epoch 時增長至最大值0.738 2 后在第11 個epoch 時降低,而后的幾個epoch 內(nèi)都呈增長趨勢,到了大約第17 個epoch 時突然下降并在接下來的幾次訓練過程中有輕微波動,在第31 個epoch 時趨于穩(wěn)定,逐步收斂;而DAFCT 在第7 個epoch 前的F1 分數(shù)波動較大,由圖6 可清晰觀察到從第7 到16 個epoch 過程中的F1 分數(shù)的增速最快,第17 個epoch 之后增速平穩(wěn),約第30 到48 個epoch過程中出現(xiàn)輕微的起伏,而后穩(wěn)步收斂。由以上分析可知,從評估指標F1 分數(shù)來看,與Attention-LSTM 模型相比,本文的DAFCT 的特征學習能力更強,雖然DAFCT 的學習速度沒有NFM模型快,但DAFCT更穩(wěn)定,且整體性能更好。

圖6 三個對比模型的F1分數(shù)對比Fig.6 Comparison of F1 scores of three comparison models

表1 顯示了DAFCT 和其他多種模型的預(yù)測性能對比,包括邏輯回歸(Logistic Regression,LR)[22]分類器、NFM 模型、隨機森林(Random Forest,RF)[23]分類器、支持向量機(Support Vector Machine,SVM)[24]、Attention-LSTM 模型。基于神經(jīng)網(wǎng)絡(luò)的預(yù)測模型大多是由LR 演進而來,LR 通過給特征賦予權(quán)重因子來對樣本進行分類;NFM 模型通過引入一個二階交互層使得線性特征和非線性的高階特征交互來提高模型的特征表達能力;RF 模型是基于決策樹的分類器,它結(jié)合了多棵樹對樣本進行訓練;SVM是基于特征空間的線性分類器,通過最大化特征的間隔距離將分類問題轉(zhuǎn)化為凸二次規(guī)劃問題求解;Attention-LSTM是基于循環(huán)神經(jīng)網(wǎng)絡(luò)的一種特殊的神經(jīng)網(wǎng)絡(luò),通過引入注意力機制過濾掉無關(guān)信息。本文的DAFCT 通過引入Attention-LSTM 網(wǎng)絡(luò)捕獲視頻的流行趨勢,引入NFM模型處理內(nèi)容特征,此外還引入了注意力機制使得特征的重要程度都能體現(xiàn),從而達到了更好的預(yù)測性能。從實驗結(jié)果可以看出本文提出的DAFCT 在性能整體上明顯優(yōu)于對比模型。

表1 所提模型與其他模型的預(yù)測性能對比Tab.1 Prediction performance comparison of the proposed model and other models

為了觀察LR、NFM、RF、SVM、Attention-LSTM 和DAFCT的整體分類性能,繪制了各模型的準確率,如圖7 所示。從圖7 可以看出,RF 模型的分類性能較低,而本文的DAFCT 的性能最好。RF模型開始的學習速度最快,但很快就收斂且增速呈下降趨勢;LR 模型的學習速度相對來說較為緩慢;SVM 和NFM 模型雖然穩(wěn)定,但分類的準確率沒有DAFCT 高。由圖7清晰可見,本文提出的DAFCT 在訓練過程中學習速度快且準確率高。

圖7 各對比模型的準確率對比Fig.7 Accuracy comparison of models

基于視頻內(nèi)容特征的分類器性能很大程度上依賴于提取的內(nèi)容特征,并且預(yù)測效果受到限制。Attention-LSTM模型對時間序列要求嚴格,因此只能捕獲視頻的流行趨勢,模型的特征表達能力較差,從以上實驗結(jié)果來看存在的缺陷還比較大;基于內(nèi)容特征的分類器如NFM、LR、RF 等則無法捕捉視頻的流行趨勢。與其他分類器相比較,本文的DAFCT 能夠有效地捕獲視頻的流行趨勢,并且能夠有效提高流行度預(yù)測模型的性能,且特征的學習和表達能力更強。從以上實驗結(jié)果分析可知,用戶反饋事件的積累量能夠有效地表達視頻的流行趨勢,而且能夠幫助提高流行度預(yù)測模型的性能,即這些用戶反饋的時序信息是影響流行度的重要因素;除此之外,內(nèi)容特征很大程度上影響了流行度預(yù)測模型的效果,是流行度預(yù)測研究工作當中必不可少的,因此結(jié)合二者才能夠使得流行度預(yù)測模型的性能更佳。

4 結(jié)語

本文提出一種融合內(nèi)容特征和時序信息的深度注意力流行度預(yù)測模型DAFCT,能夠有效地表達視頻的流行趨勢且提高流行度的預(yù)測性能。為了排除外界因素的干擾,增加了注意力機制,采用Attention-LSTM 模型挖掘時序信息以捕捉流行趨勢,利用NFM 模型處理內(nèi)容特征,模型成功地捕捉了流行趨勢并得到了較好的預(yù)測性能。實驗結(jié)果顯示,本文的DAFCT 的分類性能優(yōu)于其他分類器,但也可以看出本文設(shè)計的Attention-LSTM 模型存在局限性,在今后的研究工作當中,將會進一步把模型應(yīng)用在其他領(lǐng)域,探索該模型存在不足的原因并進行改善;另外,還將對DAFCT 的應(yīng)用及模型的高效求解算法做進一步的研究。

猜你喜歡
時序建模趨勢
顧及多種弛豫模型的GNSS坐標時序分析軟件GTSA
家電行業(yè)不能太悲觀 從618看未來的兩種趨勢
清明
基于GEE平臺與Sentinel-NDVI時序數(shù)據(jù)江漢平原種植模式提取
物理建模在教與學實踐中的應(yīng)用
在經(jīng)歷中發(fā)現(xiàn)在探究中建模
趨勢
你不能把整個春天都搬到冬天來
聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
求距求值方程建模
连南| 房山区| 竹山县| 佳木斯市| 左云县| 通海县| 滁州市| 黄龙县| 乐陵市| 塘沽区| 海伦市| 新乡县| 昌都县| 英吉沙县| 侯马市| 泉州市| 老河口市| 平武县| 新巴尔虎右旗| 洪江市| 土默特左旗| 惠来县| 即墨市| 泰顺县| 巴彦淖尔市| 航空| 腾冲县| 西华县| 绥中县| 马山县| 张北县| 衡阳市| 根河市| 永福县| 延川县| 永和县| 株洲市| 灵川县| 浏阳市| 内黄县| 咸宁市|