国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)驅(qū)動的媒體風(fēng)險感知模型

2022-07-14 09:50:44黃取治
關(guān)鍵詞:歷史數(shù)據(jù)互信息延遲時間

陳 耿,黃取治

(福建師范大學(xué)協(xié)和學(xué)院,福建 福州 350117)

隨著信息技術(shù)、通信技術(shù)、自媒體技術(shù)的不斷發(fā)展,當(dāng)前人們在工作、生活中存在多種類型的風(fēng)險,如環(huán)境風(fēng)險等[1-3].如何幫助人們提高對風(fēng)險的認(rèn)識,可以從媒體中挖掘風(fēng)險知識,因此媒體風(fēng)險感知模型的設(shè)計具有十分重要的理論意義和實際應(yīng)用價值[4-5].

針對媒體風(fēng)險感知模型設(shè)計問題,國內(nèi)外一些學(xué)者已取得了一批媒體風(fēng)險感知模型[6-8].最初學(xué)者們通過對媒體風(fēng)險感知進(jìn)行分析,根據(jù)分析結(jié)果和經(jīng)驗確定媒體風(fēng)險的等級,該方法的媒體風(fēng)險感知時間相當(dāng)長,媒體風(fēng)險感知成本高,而且其最大的缺陷是媒體風(fēng)險感知結(jié)果可信度低,無法客觀描述媒體風(fēng)險的等級[9].隨后出現(xiàn)了基于線性回歸的媒體風(fēng)險感知模型,該模型的工作過程十分簡單,媒體風(fēng)險感知速度快,但是媒體風(fēng)險感知誤差大.與此同時,還出現(xiàn)了基于BP神經(jīng)網(wǎng)絡(luò)的風(fēng)險評估模型研究,其假設(shè)風(fēng)險是一種線性變化規(guī)律[10],而實際上媒體風(fēng)險與多種因素相關(guān),不僅存在著線性變化規(guī)律,而且同時存在著非線性變化規(guī)律,因此對于非線性的媒體風(fēng)險數(shù)據(jù),其媒體風(fēng)險感知精度低[11-12].有學(xué)者采用最小二乘支持向量機(jī)進(jìn)行風(fēng)險評估[13]和采用粒子群算法結(jié)合神經(jīng)網(wǎng)絡(luò)構(gòu)建物流財務(wù)風(fēng)險評估模型[14],還有學(xué)者提出利用深度學(xué)習(xí)方法和粗糙集技術(shù)構(gòu)建風(fēng)險檢測系統(tǒng)[15],利用深度學(xué)習(xí)實現(xiàn)風(fēng)險內(nèi)容的弱監(jiān)督[16]和基于模糊推理系統(tǒng)和神經(jīng)網(wǎng)絡(luò)相結(jié)合的數(shù)據(jù)訪問風(fēng)險監(jiān)測系統(tǒng)[17].上述方法可以對復(fù)雜問題進(jìn)行建模,而且非線性擬合能力強(qiáng),但是它們同樣存在一定的不足,如在對風(fēng)險感知結(jié)果不穩(wěn)定,易出現(xiàn)“過擬合”或者“欠學(xué)習(xí)”的風(fēng)險感知結(jié)果.

為了更好地了解媒體風(fēng)險的變化規(guī)律,提高媒體風(fēng)險感知精度,本文在上述模型的基礎(chǔ)上,提出一種新的媒體風(fēng)險感知模型.在預(yù)處理采集數(shù)據(jù)后,利用最小二乘支持向量機(jī)的特性用于克服待測參數(shù)和數(shù)據(jù)間的非線性,為使參數(shù)對于不同的訓(xùn)練樣本具有自調(diào)整功能,引入粒子群算法對參數(shù)進(jìn)行尋優(yōu),從而優(yōu)化對非線性的媒體風(fēng)險數(shù)據(jù)的處理.最后,采用具體實例與傳統(tǒng)模型進(jìn)行對比測試,驗證了本文設(shè)計的媒體風(fēng)險感知模型的有效性和優(yōu)越性.

1 大數(shù)據(jù)驅(qū)動的媒體風(fēng)險感知模型具體設(shè)計

1.1 媒體風(fēng)險數(shù)據(jù)的預(yù)處理

媒體風(fēng)險受到多種因素影響,存在一定的不確定性和非線性,即混沌性.如何高精度識別媒體風(fēng)險數(shù)據(jù)序列的混沌性,對于改善媒體風(fēng)險感知結(jié)果具有重要的意義.設(shè)媒體風(fēng)險的歷史數(shù)據(jù)序列為:{xi,i=1,2,...,k},那么可以通過延遲時間(τ)重構(gòu)為m維的歷史數(shù)據(jù)序列,該m維歷史數(shù)據(jù)序列與原歷史數(shù)據(jù)序列具有相同的變化規(guī)律,具體如下:

(1)

式(1)中,N表示重構(gòu)后的相點數(shù)量.

那么相空間中的相點可以表示為:

X(j)=[x(j),x(j+τ),...,x(j+(m-1)τ],j=1,2,...,N,

(2)

對式(1)進(jìn)行分析可知,能否正確描述媒體風(fēng)險的變化特性,τ和m選取十分關(guān)鍵.本文采用互信息法選取τ,Cao法[18]選取m.

(1) 互信息法確定延遲時間τ.

對于兩個時間序列X和Y,它們信息熵分別為:

(3)

(4)

式(3)-(4)中,P(xi)表示事件xi發(fā)生的概率,P(yi)表示事件yi發(fā)生的概率.

兩個時間序列的聯(lián)合信息熵為:

(5)

式(5)中,Px,y(xi,yj)表示件xi,yi同時表示的概率.

互信息函數(shù)I(X,Y)定義如下:

I(X,Y)=H(X)+H(Y)-H(X|Y),

(6)

當(dāng)前I(X,Y)出現(xiàn)第一次最小值,此時的τ為時間序列的最優(yōu)τ.

(2)Cao法確定嵌入維m.

相點Xi和Xj歐氏距離的無窮范數(shù)定義如下:

(7)

定義:

(8)

(9)

(10)

隨著嵌入維數(shù)m的增加,E1(m)會逐漸增加,達(dá)到一定的程度后,E1(m)達(dá)到飽和狀態(tài),此時的m即為時間序列的最優(yōu)m.

1.2 大數(shù)據(jù)驅(qū)動技術(shù)

1.2.1 最小二乘支持向量機(jī)

由于媒體風(fēng)險感知本質(zhì)是一個分類問題,對于大規(guī)模媒體風(fēng)險數(shù)據(jù),支持向量機(jī)的訓(xùn)練復(fù)雜度比較高,媒體風(fēng)險感知訓(xùn)練時間與訓(xùn)練樣本數(shù)量呈指數(shù)變化關(guān)系,而最小二乘支持向量機(jī)簡化了支持向量機(jī)的訓(xùn)練過程,運行效率大幅度提高,因此通過引入最小二乘支持向量機(jī)設(shè)計媒體風(fēng)險感知分類器.設(shè)共有k個樣本數(shù)據(jù),它們組合在一起,產(chǎn)生訓(xùn)練集{(x1,y1),(x2,y2),...,(xk,yk)},根據(jù)最小二乘支持向量機(jī)的工作原理可知,存在一個最優(yōu)分類的超平面,該最優(yōu)分類的超平面應(yīng)該滿足如下:

(11)

式(11)中,ω表示法向量,T表示轉(zhuǎn)置運算,β表示偏置量.

那么可以得到最小二乘支持向量機(jī)的分類決策形式為:

f(xi)=sgn(ωTxi+β),

(12)

要對式(12)的分類決策問題進(jìn)行求解,需要對優(yōu)化函數(shù)φmin(ω,ξi)進(jìn)行相應(yīng)的求解,φmin(ω,ξi)具體定義如下:

(13)

式(13)中,γ表示正則化參數(shù),φ(xi)表示非線性映射函數(shù),其作用是將樣本空間X非線性映射到特征空間Y,具體原理如圖1所示.

圖1 樣本空間的非線性映射原理Fig.1 Nonlinear mapping principle of sample space

引入Lagrange乘子αi設(shè)計Lagrange方程:

(14)

式(14)的最優(yōu)化條件具體如下:

(15)

(16)

(17)

(18)

消除ξi和ω,建立如下形式的方程:

(19)

式(19)中,P=yiyjφT(xi)φT(xj)yiyjK(xi,xj),j=1,2,...,k,

yT=[y1,y2,...,yk],Ik=[1,1,...,1]T,α=[α1,α2,...,αk]T,

K(xi,xj)表示核函數(shù):

(20)

式(20)中,σ表示核寬度.

最后得到媒體風(fēng)險感知分類決策函數(shù)為:

(21)

1.2.2 粒子群算法

在最小二乘支持向量機(jī)的媒體風(fēng)險感知過程中,參數(shù)γ和σ對媒體風(fēng)險感知效果十分關(guān)鍵,采用粒子群算法確定參數(shù)γ和σ最優(yōu)值.粒子群算法在參數(shù)γ和σ尋優(yōu)過程中,采用如下方式更新其不同時刻的狀態(tài),具體如下:

(22)

(23)

1.3 大數(shù)據(jù)驅(qū)動的媒體風(fēng)險感知步驟

(1) 采集媒體風(fēng)險的歷史數(shù)據(jù),本文將媒體風(fēng)險感知問題當(dāng)作一種時間序列分析問題,因此只采集媒體風(fēng)險等級值,得到一個一維時間序列數(shù)據(jù).

(2) 本文采用互信息法選取延遲時間,Cao法選取嵌入維.

(3) 采用選取延遲時間和嵌入維對媒體風(fēng)險的歷史數(shù)據(jù)進(jìn)行相空間重構(gòu),得到多維的媒體風(fēng)險的歷史數(shù)據(jù).

(4) 采用粒子群確定最小二乘支持向量機(jī)的參數(shù)γ和σ最優(yōu)值.

(5) 最小二乘支持向量機(jī)根據(jù)參數(shù)γ和σ最優(yōu)值對媒體風(fēng)險的歷史數(shù)據(jù)進(jìn)行訓(xùn)練,建立最優(yōu)的媒體風(fēng)險感知模型.

2 媒體風(fēng)險感知模型的性能測評與分析

2.1 數(shù)據(jù)來源

為了分析大數(shù)據(jù)驅(qū)動的媒體風(fēng)險感知效果,選擇一些媒體風(fēng)險數(shù)據(jù)進(jìn)行分析.本文運用網(wǎng)頁信息抓取工具 Gooseeker 通過在線媒體網(wǎng)絡(luò)收集相關(guān)風(fēng)險事件發(fā)生時的媒體風(fēng)險感知原始數(shù)據(jù),其中包含媒體使用時間、媒體使用頻率、媒體使用動機(jī)、風(fēng)險事件知識獲取(股票市場、債券市場、貨幣市場、外匯市場等)、媒體信任度,均采用5分量表測量法進(jìn)行測量:1=幾乎沒有;2=較少;3=一般;4=經(jīng)常;5=總是.以某一項的數(shù)據(jù)為例,如圖2所示.

圖2 媒體風(fēng)險感知實驗的測試數(shù)據(jù)Fig.2 Test data of media risk perception experiment

一個樣本中包含30個變量,得到的一維時間序列數(shù)據(jù)類似于{2,5,3....,4},總樣本數(shù)據(jù)量巨大,需要對數(shù)據(jù)進(jìn)行預(yù)處理.

2.2 確定媒體風(fēng)險數(shù)據(jù)的延遲時間和嵌入維

根據(jù)第1節(jié)的計算過程,分別采用互信息法和Cao法對圖2媒體風(fēng)險感知實驗數(shù)據(jù)進(jìn)行分析,對于樣本數(shù)據(jù)中的某兩個時間序列,信息熵分別為0.02和0.03,聯(lián)合信息熵為-0.012,對應(yīng)得到的互信息函數(shù)為0.062,計算全部樣本中的互信息函數(shù),選定最小值,確定延遲時間結(jié)果如圖3所示.在此基礎(chǔ)上,計算歐氏距離的無窮范數(shù)為0.7,則嵌入維結(jié)果如圖4所示.從圖3和圖4可以看出,該媒體風(fēng)險感知實驗數(shù)據(jù)的延遲時間和嵌入維最優(yōu)值分別為7和7.采用延遲時間=7和嵌入維=7對圖2媒體風(fēng)險感知實驗數(shù)據(jù)進(jìn)行重構(gòu),將重構(gòu)數(shù)據(jù)用于最小二乘支持向量機(jī)建模.

圖3 互信息法確定媒體風(fēng)險數(shù)據(jù)的延遲時間Fig.3 Mutual information method to determine the delay time of media risk data

圖4 Cao法確定媒體風(fēng)險數(shù)據(jù)的嵌入維Fig.4 Cao method to determine the embedding dimension of media risk data

經(jīng)過粒子群算法確定參數(shù)γ和σ最優(yōu)值分別為0.58和0.26,通過最小二乘支持向量機(jī)進(jìn)行迭代計算,過程偽代碼如圖5所示.

圖5 迭代計算偽代碼Fig. 5 Iterative computation pseudo code

2.3 媒體風(fēng)險感知敏銳性

通過對媒體風(fēng)險感知數(shù)據(jù)進(jìn)行處理后,對數(shù)據(jù)進(jìn)行簡單算術(shù)平均合成,得到媒體風(fēng)險感知水平如圖6所示.分析圖6可知,大多數(shù)情況下,媒體風(fēng)險感知均值約為0.424,并呈上下波動.在A點(2008年全球金融危機(jī))、B點(2012年歐債危機(jī))、C點(2015-2017年股災(zāi)債災(zāi))、D點(2018年中美貿(mào)易戰(zhàn))、E點(2020年疫情暴發(fā)),嚴(yán)重增加了金融風(fēng)險,這期間媒體風(fēng)險感知水平均超過了0.68,遠(yuǎn)超均值,可以明顯地感知到風(fēng)險事件的發(fā)生.另外,從感知水平數(shù)值波動的趨勢來看,在風(fēng)險事件發(fā)生前,媒體風(fēng)險感知就已呈現(xiàn)出上升的趨勢.

圖6 媒體風(fēng)險感知走勢圖Fig.6 Trend chart of media risk perception

2.4 媒體風(fēng)險感知精度

為了使大數(shù)據(jù)驅(qū)動的媒體風(fēng)險感知結(jié)果具有可比性,選擇傳統(tǒng)媒體風(fēng)險感知模型進(jìn)行對比測試,其為BP神經(jīng)網(wǎng)絡(luò)的媒體風(fēng)險感知模型;最小二乘支持向量機(jī)的媒體風(fēng)險感知模型(數(shù)據(jù)沒有進(jìn)行預(yù)處理),共進(jìn)行5次實驗,不同模型的媒體風(fēng)險感知精度如圖7所示.從圖7可以看出,每一次實驗,本文方法的媒體風(fēng)險感知精度要高于傳統(tǒng)模型,有效減少了媒體風(fēng)險感知誤差,獲得了更理想的媒體風(fēng)險感知結(jié)果.這是因為本文方法通過互信息法和Cao法對初始數(shù)據(jù)進(jìn)行了預(yù)處理,并利用最小二乘支持向量機(jī)進(jìn)行了數(shù)據(jù)的分類,簡化了數(shù)據(jù)的運算量,使數(shù)據(jù)從高維度變?yōu)榈途暥龋阌跍?zhǔn)確地提取數(shù)據(jù)特征.

圖7 與傳統(tǒng)媒體風(fēng)險感知模型的精度對比Fig.7 Accuracy comparison with the traditional media risk perception model

2.5 本文模型的通用性測試

為了測試大數(shù)據(jù)驅(qū)動的媒體風(fēng)險感知模型的通用性,選擇20種不同類型媒體作為測試對象,統(tǒng)計它們的媒體風(fēng)險感知精度,結(jié)果如表1所示.從表1可以看出,對于這20種不同類型媒體數(shù)據(jù),

表1 本文模型的不同類型媒體風(fēng)險感知精度Tab.1 Risk perception accuracy of different types of media in this paper’s model

本文方法的媒體風(fēng)險感知精度超過95%,精度可以滿足實際應(yīng)用的要求,表明本文媒體風(fēng)險感知模型具有較好的通用性.

3 結(jié)束語

如何從媒體歷史數(shù)據(jù)中挖掘有用信息是當(dāng)前的研究熱點,為了降低媒體風(fēng)險感知誤差,把握媒體風(fēng)險變化規(guī)律,設(shè)計了基于大數(shù)據(jù)驅(qū)動的媒體風(fēng)險感知模型,該模型采用混沌理論對媒體歷史數(shù)據(jù)進(jìn)行相空間重構(gòu),便于挖掘數(shù)據(jù)隱藏的規(guī)律,然后引入粒子群算法優(yōu)化最小二乘支持向量機(jī)建立媒體風(fēng)險感知模型,具體測試結(jié)果表明,本文模型的媒體風(fēng)險感知精度高,具有十分廣泛的應(yīng)用價值.

猜你喜歡
歷史數(shù)據(jù)互信息延遲時間
基于設(shè)備PF性能曲線和設(shè)備歷史數(shù)據(jù)實現(xiàn)CBM的一個應(yīng)用模型探討
智能制造(2021年4期)2021-11-04 08:54:36
基于故障歷史數(shù)據(jù)和BP神經(jīng)網(wǎng)絡(luò)的接地選線方案研究
二氧化碳對乙烷燃燒著火延遲時間的影響
煤氣與熱力(2021年3期)2021-06-09 06:16:22
LTE 系統(tǒng)下行鏈路FDRX 節(jié)能機(jī)制研究
基于分層COX模型的跟馳反應(yīng)延遲時間生存分析
基于Hadoop技術(shù)實現(xiàn)銀行歷史數(shù)據(jù)線上化研究
用好細(xì)節(jié)材料 提高課堂實效
延遲時間對氣輔注射成型氣體穿透行為影響的數(shù)值模擬和實驗研究
中國塑料(2016年8期)2016-06-27 06:35:02
基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
聯(lián)合互信息水下目標(biāo)特征選擇算法
赣州市| 修文县| 佛学| 秦皇岛市| 乳源| 仁布县| 黄山市| 绵竹市| 新平| 庄河市| 罗田县| 安多县| 读书| 丽水市| 新郑市| 灌云县| 余姚市| 沭阳县| 于都县| 台安县| 巴林左旗| 延吉市| 安吉县| 大同市| 无极县| 乐陵市| 专栏| 即墨市| 昌江| 宁阳县| 山阳县| 通化市| 新密市| 牟定县| 新和县| 迁安市| 法库县| 武冈市| 淮滨县| 大名县| 临潭县|