張 宇,傅 敏,羅加蓉
(1.西南科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,四川 綿陽(yáng) 621010;2.四川雪寶乳業(yè)集團(tuán)有限公司,四川 綿陽(yáng) 621000)
截至2017年6月,中國(guó)網(wǎng)民規(guī)模達(dá)到7.51億,互聯(lián)網(wǎng)普及率達(dá)54.3%。互聯(lián)網(wǎng)的普及為網(wǎng)民表達(dá)自己對(duì)事件的態(tài)度和看法提供了便捷途徑,這種對(duì)事件的態(tài)度和看法形成網(wǎng)絡(luò)輿情,網(wǎng)絡(luò)輿情通過(guò)網(wǎng)絡(luò)媒體的傳播和擴(kuò)散,在一定程度上能夠促進(jìn)或阻礙事態(tài)發(fā)展。地震造成基礎(chǔ)設(shè)施、人員和財(cái)產(chǎn)的巨大損失,在各種因素作用下震災(zāi)輿情增加了震災(zāi)的應(yīng)對(duì)難度,甚至造成更為嚴(yán)重的次生或衍生災(zāi)害。
現(xiàn)行的各種輿情管控實(shí)踐證明,如果能夠?qū)φ馂?zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)進(jìn)行科學(xué)評(píng)估,一方面能夠有效減輕震災(zāi)帶來(lái)的災(zāi)害損失和社會(huì)危害,另一方面能夠?yàn)閼?yīng)急管理部門(mén)掌握災(zāi)區(qū)需求信息和制定輿情管控預(yù)案提供支持。目前相關(guān)研究主要集中于網(wǎng)絡(luò)輿情的熱度、傳播規(guī)律、風(fēng)險(xiǎn)管控等方面。在網(wǎng)絡(luò)輿情熱度研究方面,王慧軍等[1]為降低輿情熱度負(fù)面影響,依據(jù)優(yōu)化理論,研究了政府對(duì)輿情熱度監(jiān)控問(wèn)題;柳虹[2]提出了輿情熱點(diǎn)發(fā)現(xiàn)模型,對(duì)均值聚類(lèi)和支持向量機(jī)兩種算法在網(wǎng)絡(luò)輿情發(fā)現(xiàn)作用方面進(jìn)行了比較;方倩等[3]認(rèn)為微信公眾號(hào)文章熱度與主題、推送時(shí)間、標(biāo)題特征相關(guān),與推送頻率弱相關(guān);焦超等[4]提出了獨(dú)立網(wǎng)絡(luò)突發(fā)事件熱度分布的泊松分布模型;翟曉芳等[5]通過(guò)分析微博提出了新的熱度指標(biāo)計(jì)算方法;曹學(xué)艷等[6]研究了突發(fā)事件網(wǎng)絡(luò)輿情熱度等級(jí)與突發(fā)事件風(fēng)險(xiǎn)等級(jí)之間的對(duì)應(yīng)關(guān)系,根據(jù)對(duì)應(yīng)關(guān)系的“一致”或“不一致”提出突發(fā)事件應(yīng)對(duì)策略;張一文等[7]研究了非常規(guī)突發(fā)事件網(wǎng)絡(luò)輿情熱度評(píng)估指標(biāo)和權(quán)重;魏德志等[8]將新聞網(wǎng)頁(yè)內(nèi)容的相似度和頁(yè)面鏈接分析作為話題熱度的計(jì)算依據(jù),提出一種基于時(shí)間序列的熱點(diǎn)話題發(fā)現(xiàn)模型;Fu等分別采用不同聚類(lèi)算法和仿真模型對(duì)網(wǎng)絡(luò)熱點(diǎn)時(shí)間進(jìn)行發(fā)現(xiàn)和模擬[9-12]。在網(wǎng)絡(luò)輿情傳播研究方面,王治瑩等[13]研究了政府干預(yù)下突發(fā)事件輿情傳播規(guī)律與管控決策問(wèn)題;Huo等[14]建立了突發(fā)事件下官方行為與輿情傳播的交互作用模型;Lebensztayn等[15]構(gòu)建了群眾謠言傳播的馬爾科夫模型;Zhao等[16]研究了突發(fā)事件演化與輿情傳播及官方媒介的交互作用;齊佳音等[17]研究了突發(fā)公共事件網(wǎng)絡(luò)輿情的耦合機(jī)制,認(rèn)為網(wǎng)絡(luò)輿情的耦合協(xié)調(diào)度與社會(huì)影響力呈正比;康偉[18]研究了網(wǎng)絡(luò)輿情傳播結(jié)構(gòu)對(duì)信息的傳播路徑、速度和范圍的影響。在網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)管控方面的研究,張玉亮[19]依據(jù)突發(fā)事件發(fā)生周期系統(tǒng)提出網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估指標(biāo);路枝芳等[20]以輿情熱點(diǎn)事件為驗(yàn)證對(duì)象,采用因子聚類(lèi)分析方法研究了2015年中國(guó)第一季度各類(lèi)熱點(diǎn)輿情事件的風(fēng)險(xiǎn)程度。
綜上,現(xiàn)有研究主要有兩方面需要繼續(xù)深入:一是在指標(biāo)構(gòu)建上,現(xiàn)有研究更多考慮事件的外因,即社會(huì)屬性,如輿情轉(zhuǎn)載量、評(píng)論量及發(fā)文量等,較少考慮事件本身的物理屬性,如事件自身導(dǎo)致輿情演化的動(dòng)因、敏感性、促進(jìn)因素等。對(duì)外因的考慮也多從定量角度提取指標(biāo),較少關(guān)注一些定性指標(biāo),尤其是面對(duì)突發(fā)災(zāi)害背景下網(wǎng)絡(luò)輿情監(jiān)測(cè)所涉及的關(guān)鍵不確定性指標(biāo);二是針對(duì)震災(zāi)網(wǎng)絡(luò)輿情綜合風(fēng)險(xiǎn)評(píng)估問(wèn)題較少涉及,已有研究更多圍繞輿情熱點(diǎn)的分布、線性擬合及預(yù)測(cè)等方面,少量成果針對(duì)突發(fā)事件風(fēng)險(xiǎn)提出監(jiān)測(cè)指標(biāo)與評(píng)估方法,但監(jiān)測(cè)指標(biāo)更多突出輿情風(fēng)險(xiǎn)的社會(huì)屬性,很少涉及導(dǎo)致輿情風(fēng)險(xiǎn)的物理屬性,而且評(píng)估方法較為單一,往往忽略突發(fā)災(zāi)害網(wǎng)絡(luò)輿情指標(biāo)數(shù)據(jù)的非線性、高維度和非正態(tài)問(wèn)題,評(píng)估結(jié)果與實(shí)際偏差較大。基于以上原因,本研究的不同之處在于:從突發(fā)災(zāi)害網(wǎng)絡(luò)輿情的物理屬性和社會(huì)屬性?xún)煞矫嫣岢鲞m應(yīng)性強(qiáng)、能夠覆蓋整個(gè)輿情演化周期的風(fēng)險(xiǎn)監(jiān)測(cè)指標(biāo);將BP神經(jīng)網(wǎng)絡(luò)運(yùn)用于突發(fā)災(zāi)害網(wǎng)絡(luò)輿情綜合風(fēng)險(xiǎn)評(píng)估之中,并用AGA對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),提出基于AGABP的震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估方法。
網(wǎng)絡(luò)輿情主要有潛伏、擴(kuò)散和消退三個(gè)階段,其傳播曲線呈“S”型(如圖1),其風(fēng)險(xiǎn)點(diǎn)一般處于傳播中的擴(kuò)散前期和擴(kuò)散后期的轉(zhuǎn)折處,如圖1中的N點(diǎn),N點(diǎn)也是輿情高漲轉(zhuǎn)折點(diǎn)。
圖1 網(wǎng)絡(luò)輿情傳播過(guò)程
在圖1中,網(wǎng)絡(luò)輿情傳播風(fēng)險(xiǎn)的產(chǎn)生和高漲的出現(xiàn)主要由載體、主體和事件本身共同推動(dòng)完成。網(wǎng)絡(luò)媒體是震災(zāi)輿情產(chǎn)生的載體,屬條件因素;網(wǎng)民是震災(zāi)輿情產(chǎn)生的主體,屬推動(dòng)因素;震災(zāi)是輿情事件的本身,屬輿情產(chǎn)生的誘導(dǎo)因素。條件因素和推動(dòng)因素是震災(zāi)網(wǎng)絡(luò)輿情擴(kuò)散和傳播的社會(huì)屬性,誘導(dǎo)因素是震災(zāi)網(wǎng)絡(luò)輿情的物理屬性,敏感性對(duì)輿情的產(chǎn)生起誘導(dǎo)作用。在風(fēng)險(xiǎn)監(jiān)測(cè)指標(biāo)設(shè)計(jì)上,本研究圍繞震災(zāi)網(wǎng)絡(luò)輿情產(chǎn)生的物理屬性和社會(huì)屬性?xún)蓚€(gè)維度的作用力設(shè)計(jì)風(fēng)險(xiǎn)監(jiān)測(cè)指標(biāo)。
其一,震災(zāi)網(wǎng)絡(luò)輿情產(chǎn)生的物理屬性。這由震災(zāi)本身的危害程度決定,一般來(lái)講,震災(zāi)危害程度越大,社會(huì)影響力就越高,誘發(fā)網(wǎng)絡(luò)輿情擴(kuò)散的能力也會(huì)越強(qiáng)??刹捎谜馂?zāi)危害等級(jí)、受災(zāi)程度等二級(jí)指標(biāo)予以衡量,其中震災(zāi)危害等級(jí)主要包括地震震級(jí)和震中烈度2個(gè)三級(jí)指標(biāo),受災(zāi)程度主要包括傷亡人數(shù)、受災(zāi)范圍、財(cái)產(chǎn)損失3個(gè)三級(jí)指標(biāo)。
其二,震災(zāi)網(wǎng)絡(luò)輿情產(chǎn)生的社會(huì)屬性??刹捎谜馂?zāi)應(yīng)急能力、網(wǎng)絡(luò)媒體作用力、輿情擴(kuò)散能力3個(gè)二級(jí)指標(biāo)予以衡量,其中震災(zāi)應(yīng)急能力對(duì)減輕災(zāi)害損失、緩解網(wǎng)民負(fù)面情緒有直接影響,主要包括應(yīng)急資源滿(mǎn)足能力、政府部門(mén)反應(yīng)能力、監(jiān)測(cè)預(yù)警能力3個(gè)三級(jí)指標(biāo);網(wǎng)絡(luò)媒體作用力主要包括各主要網(wǎng)絡(luò)平臺(tái)的發(fā)文量、評(píng)論數(shù)及轉(zhuǎn)發(fā)量3個(gè)三級(jí)指標(biāo);輿情擴(kuò)散能力主要包括點(diǎn)擊數(shù)與回復(fù)數(shù)之比、原發(fā)文數(shù)變化率2個(gè)三級(jí)指標(biāo)。
綜上所述,本研究圍繞物理屬性和社會(huì)屬性?xún)蓚€(gè)維度提出5個(gè)二級(jí)指標(biāo)和13個(gè)三級(jí)指標(biāo)的震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)監(jiān)測(cè)評(píng)估指標(biāo),進(jìn)一步通過(guò)文獻(xiàn)調(diào)查、專(zhuān)家問(wèn)詢(xún)等方式,在震災(zāi)危害等級(jí)中增加1個(gè)次生災(zāi)害發(fā)生概率的三級(jí)指標(biāo),在震災(zāi)應(yīng)急能力中增加1個(gè)災(zāi)民綜合滿(mǎn)意度的三級(jí)指標(biāo),刪除輿情擴(kuò)散能力指標(biāo),形成4個(gè)二級(jí)指標(biāo)和13個(gè)三級(jí)初選指標(biāo)。為驗(yàn)證初選指標(biāo)之間相對(duì)獨(dú)立性、與評(píng)估目標(biāo)的相關(guān)性及代表性,本研究采取專(zhuān)家計(jì)分的方式獲取了13個(gè)初選指標(biāo)的初始數(shù)據(jù),并采用Cronbach`s Alpha參數(shù)來(lái)度量問(wèn)卷信度,通過(guò)做KMO和Bartlett球形檢驗(yàn)來(lái)驗(yàn)證問(wèn)卷表的效度。通過(guò)檢驗(yàn),總問(wèn)卷信度值Cronbach`s Alpha=0.871,說(shuō)明問(wèn)卷可靠性很高;KMO=0.743,Bartlett球形檢驗(yàn)為0.000,說(shuō)明問(wèn)卷效度很好,可用來(lái)做因子分析。檢驗(yàn)結(jié)果發(fā)現(xiàn)Bartlett球形檢驗(yàn)的P<0.001,說(shuō)明初選指標(biāo)中有重復(fù)解釋指標(biāo)存在,通過(guò)分析指標(biāo)兩兩之間的相關(guān)關(guān)系,刪掉兩兩之間相關(guān)度>0.6以上的指標(biāo)1個(gè),即刪掉“受災(zāi)范圍”,保證剩下12個(gè)初選指標(biāo)的相對(duì)獨(dú)立。為檢驗(yàn)剩下12個(gè)初選指標(biāo)與評(píng)估對(duì)象之間的相關(guān)度,進(jìn)一步做因子相關(guān)性分析,刪掉相關(guān)度<0.65的指標(biāo)1個(gè),即刪掉“震中烈度”指標(biāo),保障剩下11個(gè)指標(biāo)與被評(píng)估對(duì)象高度相關(guān)。本研究采用主成分分析方法尋找剩下指標(biāo),將累積貢獻(xiàn)率達(dá)85%的指標(biāo)作為最終評(píng)估指標(biāo)。最終形成2個(gè)維度4個(gè)二級(jí)指標(biāo)和10個(gè)三級(jí)指標(biāo)作為震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)監(jiān)測(cè)指標(biāo)(如表1)。
表1中的震災(zāi)應(yīng)急能力所屬的三級(jí)指標(biāo)采取專(zhuān)家計(jì)分方式確定;網(wǎng)絡(luò)作用力所屬三級(jí)指標(biāo)采用北京清博大數(shù)據(jù)科技有限公司開(kāi)發(fā)的“清博大數(shù)據(jù)輿情系統(tǒng)”平臺(tái)中的數(shù)據(jù),通過(guò)統(tǒng)計(jì)微信、微博、網(wǎng)頁(yè)、報(bào)刊、客戶(hù)端和論壇6個(gè)輿情傳播平臺(tái)上地震網(wǎng)絡(luò)輿情的發(fā)文量、評(píng)論數(shù)和轉(zhuǎn)發(fā)量數(shù)據(jù)。
建立震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)標(biāo)準(zhǔn)包括兩部分內(nèi)容:設(shè)定風(fēng)險(xiǎn)等級(jí)數(shù)和確定各風(fēng)險(xiǎn)等級(jí)下每個(gè)指標(biāo)的標(biāo)準(zhǔn)區(qū)間值。在設(shè)定震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)數(shù)上,本研究參考國(guó)際慣例及國(guó)內(nèi)相關(guān)學(xué)者研究,將震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)劃分為4級(jí),即v={Ⅳ,Ⅲ,Ⅱ,Ⅰ}={極高風(fēng)險(xiǎn),高風(fēng)險(xiǎn),一般風(fēng)險(xiǎn),低風(fēng)險(xiǎn)},并賦值:“極高風(fēng)險(xiǎn)”為4、“高風(fēng)險(xiǎn)”為3、“一般風(fēng)險(xiǎn)”為2、“低風(fēng)險(xiǎn)”為1。在確定各風(fēng)險(xiǎn)等級(jí)下每個(gè)指標(biāo)的標(biāo)準(zhǔn)區(qū)間上,以上海交通大學(xué)輿情研究實(shí)驗(yàn)室“中國(guó)公共事件數(shù)據(jù)庫(kù)”為依托,從500多起震災(zāi)案例中挑選出2000年以來(lái)震級(jí)在3~9之間的150起案例作為研究樣本,針對(duì)定性指標(biāo)按表1賦值后采取問(wèn)卷方式獲取數(shù)據(jù);針對(duì)定量指標(biāo),以特定期間客觀數(shù)據(jù)為準(zhǔn),其中,地震震級(jí)、傷亡人數(shù)和財(cái)產(chǎn)損失風(fēng)險(xiǎn)標(biāo)準(zhǔn)依據(jù)《國(guó)家地震應(yīng)急預(yù)案》確定,其余指標(biāo)的風(fēng)險(xiǎn)等級(jí)劃分借鑒蔣金才等[21]對(duì)水旱災(zāi)害風(fēng)險(xiǎn)等級(jí)劃分方法,對(duì)獲取的指標(biāo)數(shù)據(jù)采用聚類(lèi)方法進(jìn)行修正后得到震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)標(biāo)準(zhǔn)值。由于震災(zāi)背景下的網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)指標(biāo)數(shù)據(jù)往往具有不確定性,各指標(biāo)的風(fēng)險(xiǎn)等級(jí)標(biāo)準(zhǔn)難以用確切數(shù)據(jù)劃分,故采用模糊區(qū)間數(shù)表示各指標(biāo)的風(fēng)險(xiǎn)等級(jí)更為合理。鑒于此,本研究以150起案例為依據(jù),采用四分位風(fēng)險(xiǎn)劃分方法來(lái)確定震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)標(biāo)準(zhǔn)。具體做法是:首先,將各個(gè)指標(biāo)的專(zhuān)家建議值Z(i)進(jìn)行升序排列,設(shè)定Z(i)max為極高風(fēng)險(xiǎn)上限值,Z(i)min為最低風(fēng)險(xiǎn)下限值,中位數(shù)Z(i)med為一般風(fēng)險(xiǎn)值;然后,找出Z(i)min和Z(i)med序列中的中位數(shù)Z*(i)med、Z(i)med和Z(i)max序列的中位數(shù)Z**(i)med,其風(fēng)險(xiǎn)等級(jí)劃分方法如表2。
表2 震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)標(biāo)準(zhǔn)
最后,依據(jù)表2方法,計(jì)算各個(gè)風(fēng)險(xiǎn)等級(jí)下每個(gè)指標(biāo)的標(biāo)準(zhǔn)區(qū)間值,如表3。
表3 震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)標(biāo)準(zhǔn)
BP神經(jīng)網(wǎng)絡(luò)是一種負(fù)梯度優(yōu)化算法,具有自適應(yīng)、自組織、容錯(cuò)性和魯棒性強(qiáng)的優(yōu)點(diǎn),而且易于在計(jì)算機(jī)上實(shí)現(xiàn)編譯。將BP神經(jīng)網(wǎng)絡(luò)用于震災(zāi)輿情網(wǎng)絡(luò)風(fēng)險(xiǎn)評(píng)估點(diǎn)評(píng)估中,能夠有效解決多指標(biāo)非線性、高維度和非正態(tài)評(píng)估問(wèn)題的局限性,有利于評(píng)估系統(tǒng)以任意均方差的精度逼近任意平方可積非線性連續(xù)函數(shù),保證評(píng)估結(jié)果的可靠。但BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度較慢、存在局部最小問(wèn)題,會(huì)在很大程度上影響網(wǎng)絡(luò)的外推能力。為解決這個(gè)問(wèn)題,采用AGA對(duì)常規(guī)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),在BP算法訓(xùn)練評(píng)估網(wǎng)絡(luò)出現(xiàn)收斂速度緩慢時(shí)啟動(dòng)AGA來(lái)優(yōu)化網(wǎng)絡(luò)參數(shù),把優(yōu)化的參數(shù)作為BP算法的初始值。通過(guò)這樣的改進(jìn),能夠有效增強(qiáng)BP網(wǎng)絡(luò)的外推能力,防止訓(xùn)練網(wǎng)絡(luò)進(jìn)入局部循環(huán)。
由于存在一個(gè)三層BP神經(jīng)網(wǎng)絡(luò)可以任意精度逼近從輸入層到輸出層的映射,對(duì)輸出層節(jié)點(diǎn)n和隱層節(jié)點(diǎn)m的大小沒(méi)有嚴(yán)格限制。根據(jù)經(jīng)驗(yàn),隱層的節(jié)點(diǎn)數(shù)m一般不宜過(guò)大,m較大,BP網(wǎng)絡(luò)的概括能力和訓(xùn)練速度都會(huì)降低,在能達(dá)到期望精度條件下,m的取值范圍一般控制在[n,2n+1]內(nèi)且盡可能小。本研究構(gòu)建一個(gè)三層BP神經(jīng)網(wǎng)絡(luò)(如圖2),其拓?fù)浣Y(jié)構(gòu)為n∶n∶1,n取3。
圖2 三層BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
記輸入層神經(jīng)元為h,隱層神經(jīng)元為i,輸出神經(jīng)元為j,隱層節(jié)點(diǎn)i和輸出層節(jié)點(diǎn)j的閾值分別為θi、θj,輸入層節(jié)點(diǎn)h與隱層節(jié)點(diǎn)i間以及輸出層節(jié)點(diǎn)j與隱層節(jié)點(diǎn)i間的連線權(quán)值分別為whi、wij,各點(diǎn)的輸入、輸出分別為x、y?;贏GA的BP網(wǎng)絡(luò)算法設(shè)計(jì)如下。
步驟1:指標(biāo)隨機(jī)樣本點(diǎn)獲取。在后續(xù)的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,首先需要隨機(jī)生成無(wú)量綱的震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)樣本數(shù)據(jù),通過(guò)隨機(jī)樣本訓(xùn)練得到最優(yōu)參數(shù)后,再用實(shí)際樣本數(shù)據(jù)進(jìn)行測(cè)試。在隨機(jī)樣本數(shù)據(jù)獲取上,本研究參考王碩等[22]的研究成果,用均勻隨機(jī)數(shù)在各級(jí)指標(biāo)變化區(qū)間范圍內(nèi)隨機(jī)產(chǎn)生nu個(gè)指標(biāo)樣本值x*(k,j),相應(yīng)的震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)標(biāo)準(zhǔn)等級(jí)值為y(k)=i。為充分反映評(píng)估指標(biāo)中各指標(biāo)的邊界值的信息,取各指標(biāo)邊界值各1次,風(fēng)險(xiǎn)等級(jí)值取與該邊界值有關(guān)的兩個(gè)風(fēng)險(xiǎn)等級(jí)值的算術(shù)平均值,這樣就可得震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估標(biāo)準(zhǔn)樣本系列{x*(k,j),y(k)},k=1~nk,j=1~nj,其中nk為樣本數(shù)目。為消除指標(biāo)量綱,使本研究評(píng)估模型具有一般性,各指標(biāo)的無(wú)量綱化處理采取以下式子進(jìn)行:
x(k,j)=x*(k,j)/Xmax(j) (k=1~nk,j=1~nj)
(1)
a(i,j)=a*(k,j)/xmax(j) (i=1~ni,j=1~nj)
(2)
b(i,j)=b*(k,j)/xmax(j) (i=1~ni,j=1~nj)
(3)
步驟2:初始化。設(shè)用于機(jī)器學(xué)習(xí)的已做歸一化處理后的震災(zāi)輿情網(wǎng)絡(luò)樣本值的輸入、輸出樣本對(duì)為{xhk,dk|h=1,2,,n;k=1,2,,N},給各節(jié)點(diǎn)間的連接權(quán)值、閾值賦予(-1,1)區(qū)間上的隨機(jī)值。
步驟3:置k=1。把各層輸入、輸出樣本對(duì){xhk,dk}提供給網(wǎng)絡(luò),(h=1,2,,n;k=1,2,,N)。
步驟4:計(jì)算隱層各節(jié)點(diǎn)的輸入xi、輸出yi,輸出層節(jié)點(diǎn)的輸入xj、輸出yj,則有:
(4)
(5)
步驟5:計(jì)算輸出層節(jié)點(diǎn)所收到的總輸入變化時(shí)單樣本點(diǎn)誤差Ek=0.5(yj-dk)2的變化率以及隱層節(jié)點(diǎn)所收到的總輸入變化時(shí)單樣本點(diǎn)誤差Ek的變化率。
(6)
(7)
步驟6:修正各連接的權(quán)值和閾值。
(8)
(9)
其中,m為修正次數(shù),η為學(xué)習(xí)速率且η∈(0,1),a為動(dòng)量因子且a∈(0,1)。
步驟7:置k=k+1,轉(zhuǎn)步驟3,直至全部N個(gè)樣本點(diǎn)訓(xùn)練完畢,轉(zhuǎn)步驟9。
步驟8:轉(zhuǎn)步驟2,進(jìn)行新一輪的學(xué)習(xí),直至網(wǎng)絡(luò)全局誤差函數(shù)小于預(yù)先設(shè)定的一個(gè)較小值或?qū)W習(xí)次數(shù)大于預(yù)先設(shè)定的值,結(jié)束學(xué)習(xí)。
(10)
為使式(10)的全局誤差函數(shù)極小化,需要確定BP網(wǎng)絡(luò)中θi、θj、whi和wij的最優(yōu)值,以促使各層級(jí)網(wǎng)絡(luò)連接的權(quán)值和閾值達(dá)到穩(wěn)定。標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練參數(shù)過(guò)程中容易出現(xiàn)局部最小問(wèn)題,且訓(xùn)練后的參數(shù)在學(xué)習(xí)后期收斂速度過(guò)于緩慢,在較大程度上影響評(píng)估結(jié)果的可靠性。本研究采用AGA對(duì)BP網(wǎng)絡(luò)參數(shù)進(jìn)行優(yōu)化,將優(yōu)化后的參數(shù)作為BP網(wǎng)絡(luò)的初始值,避免標(biāo)準(zhǔn)BP網(wǎng)絡(luò)的不足。其優(yōu)化步驟如下[23]。
(1)BP網(wǎng)絡(luò)參數(shù)變化區(qū)間構(gòu)造。設(shè)cj是BP算法訓(xùn)練網(wǎng)絡(luò)出現(xiàn)收斂速度緩慢時(shí)網(wǎng)絡(luò)的任一參數(shù)的值,則它的變化區(qū)間構(gòu)造為[aj,bj],其中,aj=cj-d|cj|,bj=cj+d|cj|,d為一正的常數(shù)。
(2)BP網(wǎng)絡(luò)參數(shù)編碼。設(shè)編碼長(zhǎng)度為e,把區(qū)間[aj,bj]等分成2e-1個(gè)子區(qū)間,于是整個(gè)網(wǎng)絡(luò)參數(shù)變化空間被離散成(2e)p個(gè)網(wǎng)格點(diǎn)。其中,p=2n2+n+1。每個(gè)網(wǎng)格點(diǎn)稱(chēng)為個(gè)體,它對(duì)應(yīng)網(wǎng)絡(luò)p個(gè)參數(shù)的一種可能取值狀態(tài),并用p個(gè)e位二進(jìn)制數(shù)表示。于是,p個(gè)網(wǎng)絡(luò)參數(shù)、網(wǎng)格點(diǎn)、個(gè)體、二進(jìn)制數(shù)予以一一對(duì)應(yīng)。
(3)初始父代群體的隨機(jī)生成與父代個(gè)體適應(yīng)度的評(píng)估。從上述(2e)p個(gè)網(wǎng)格點(diǎn)中均勻隨機(jī)選取n個(gè)點(diǎn)作為初始父代群體。把第i個(gè)個(gè)體代入式(7)中,得到相應(yīng)的網(wǎng)絡(luò)全局誤差函數(shù)值Ei,Ei越小則個(gè)體的適應(yīng)能力越強(qiáng)。
(4)父代個(gè)體的選擇與雜交。把父代個(gè)體按優(yōu)化準(zhǔn)則函數(shù)值Ei從小到大排序,排序后最前面幾個(gè)個(gè)體稱(chēng)為優(yōu)秀個(gè)體。構(gòu)造與Ei成反比的函數(shù)pi,pi>0,p1+p2+,+pn=1,從這些父代個(gè)體中以概率pi選擇i個(gè)個(gè)體。于是共選擇兩組各為n個(gè)的個(gè)體,然后將兩組個(gè)體隨機(jī)兩兩配對(duì)n對(duì)雙親,將雙親的二進(jìn)制數(shù)組的任意一段值互換,得到兩組子代個(gè)體。
(5)子代個(gè)體的變異。任取步驟父代個(gè)體雜交中的一組子代個(gè)體,將它們的二進(jìn)制數(shù)組的任意兩值以變異率pm進(jìn)行翻轉(zhuǎn),即將原值為0的變?yōu)?,原值為1的變?yōu)?。
(6)迭代。由步驟(6)得到的n個(gè)子代個(gè)體作為新的父代,算法轉(zhuǎn)入父代個(gè)體適應(yīng)度評(píng)估步驟,進(jìn)入下一代進(jìn)化過(guò)程。
(7)加速循環(huán)。用第一次、第二次進(jìn)化迭代所產(chǎn)生的優(yōu)秀個(gè)體參數(shù)的變化范圍,作為參數(shù)新的初始變化區(qū)間,算法進(jìn)入網(wǎng)絡(luò)參數(shù)編碼步驟,即上述步驟(2);如此循環(huán)往復(fù),優(yōu)秀個(gè)體的參數(shù)變化區(qū)間將逐步收縮,與最優(yōu)的距離越來(lái)越近,直至達(dá)到給定加速次數(shù),結(jié)束運(yùn)行。
步驟9:把待測(cè)的第k期對(duì)應(yīng)各單項(xiàng)評(píng)估模型的評(píng)估值作為輸入樣本,輸入已學(xué)習(xí)完畢的網(wǎng)絡(luò),其網(wǎng)絡(luò)輸出值經(jīng)過(guò)與歸一化對(duì)應(yīng)的逆處理即為組合評(píng)估值Fk。
在AGA-BP算法中,根據(jù)經(jīng)驗(yàn),控制參數(shù)預(yù)先設(shè)定為:(1)設(shè)定BP網(wǎng)絡(luò)中的學(xué)習(xí)因子η=0.1,動(dòng)量系數(shù)a=0.1;(2)設(shè)定AGA中的編碼長(zhǎng)度e=10,變異率pm=1.0,父代個(gè)體數(shù)目q=300,優(yōu)秀個(gè)體數(shù)目s=10。
計(jì)算機(jī)運(yùn)行環(huán)境為:Core(TM) 2 CPU 2.29GHZ、內(nèi)存為2.00GB,仿真工具:Matlab_R2012a。本研究從《中國(guó)震例》中選取2005年以來(lái)國(guó)內(nèi)發(fā)生的6次地震作為AGABP評(píng)估模型的驗(yàn)證數(shù)據(jù),數(shù)據(jù)獲取途徑包括定性指標(biāo)專(zhuān)家評(píng)分、清博大數(shù)據(jù)輿情系統(tǒng)、《中國(guó)震例》及官方網(wǎng)站(如表4)。其中,網(wǎng)絡(luò)輿情轉(zhuǎn)發(fā)量、發(fā)文量及評(píng)論量的統(tǒng)計(jì)期間規(guī)定為震災(zāi)發(fā)生當(dāng)日后30日的數(shù)據(jù)量;震級(jí)、死傷人數(shù)及財(cái)產(chǎn)損失以震災(zāi)發(fā)生地官方網(wǎng)站公布為準(zhǔn)。評(píng)估方法應(yīng)用分為兩個(gè)階段:第一階段采用隨機(jī)樣本數(shù)據(jù)訓(xùn)練AGABP網(wǎng)絡(luò)以獲得最優(yōu)參數(shù),并與BP神經(jīng)網(wǎng)絡(luò)、邏輯斯蒂曲線對(duì)比,以觀察AGABP評(píng)估模型的訓(xùn)練精度;第二階段將6次地震網(wǎng)絡(luò)輿情數(shù)據(jù)裝入訓(xùn)練后的AGABP模型中,對(duì)6次震災(zāi)網(wǎng)絡(luò)輿情的風(fēng)險(xiǎn)性進(jìn)行評(píng)估,并提出政策建議。
表4 2005年以來(lái)6次震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)監(jiān)測(cè)指標(biāo)數(shù)據(jù)
注:表中各序號(hào)對(duì)應(yīng)地震為:1.江西九江(2005.11.26);2.云南寧洱(2007.6.3);3.四川汶川(2008.5.12);4.青海玉樹(shù)(2010.4.14);5.四川雅安地震(2013.4.20);6.云南魯?shù)?2014.8.3)
1.隨機(jī)樣本數(shù)據(jù)訓(xùn)練AGABP網(wǎng)絡(luò)
根據(jù)表3的震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)標(biāo)準(zhǔn)和步驟1,隨機(jī)生成1~31組震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)標(biāo)準(zhǔn)樣本數(shù)據(jù),如表5所示。
表5 震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估隨機(jī)樣本數(shù)據(jù)及AGABP計(jì)算對(duì)比
對(duì)樣本數(shù)據(jù)按式(1)至式(3)進(jìn)行無(wú)量綱處理后輸入AGABP網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練,取訓(xùn)練次數(shù)10 000次,AGABP加速尋優(yōu)4次,計(jì)算結(jié)果如表5。進(jìn)一步,將隨機(jī)樣本數(shù)據(jù)輸入BP神經(jīng)網(wǎng)絡(luò)、邏輯斯蒂曲線,其訓(xùn)練精度對(duì)比如圖3。
圖3 AGABP與BP神經(jīng)網(wǎng)絡(luò)、邏輯斯蒂曲線訓(xùn)練精度對(duì)比
從圖3可知,經(jīng)過(guò)10 000次訓(xùn)練后,AGABP網(wǎng)絡(luò)全局誤差為0.000 712,達(dá)到收斂要求;BP網(wǎng)絡(luò)的全局誤差為0.001 671;邏輯斯蒂曲線的擬合誤差為0.001 011。與實(shí)際風(fēng)險(xiǎn)等級(jí)值相比,AGABP網(wǎng)絡(luò)的精度明顯高于BP神經(jīng)網(wǎng)絡(luò)和邏輯斯蒂曲線;此時(shí),AGABP網(wǎng)絡(luò)的穩(wěn)定權(quán)值和閾值見(jiàn)表6。
表6 隨機(jī)樣本數(shù)據(jù)訓(xùn)練AGABP網(wǎng)絡(luò)10 000次后的穩(wěn)定權(quán)值和閾值
2.實(shí)例評(píng)估
經(jīng)過(guò)10 000次訓(xùn)練后,AGABP網(wǎng)絡(luò)的閾值和各層的權(quán)值達(dá)到穩(wěn)定,訓(xùn)練精度符合要求,說(shuō)明訓(xùn)練后的AGABP網(wǎng)絡(luò)能夠用于震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估中。分別運(yùn)用AGABP網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)和邏輯斯蒂曲線對(duì)表4中6個(gè)案例進(jìn)行評(píng)估。設(shè)定AGABP網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)各自訓(xùn)練次數(shù)15 000、加速尋優(yōu)4次,其他參數(shù)不變;邏輯斯蒂曲線仍采取擬合方式進(jìn)行風(fēng)險(xiǎn)評(píng)估。三種方法得到結(jié)果如表7、圖4所示。
表7 三種方法的評(píng)估結(jié)果
圖4AGABP、BP和邏輯斯蒂的評(píng)估曲線
采用AGABP模型對(duì)6次震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估結(jié)果表明:(1)地震震級(jí)、傷亡人數(shù)、財(cái)產(chǎn)損失、發(fā)文量、評(píng)論數(shù)和轉(zhuǎn)發(fā)量等6個(gè)指標(biāo)是影響震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)的關(guān)鍵性指標(biāo)。通過(guò)觀察隨機(jī)數(shù)據(jù)訓(xùn)練結(jié)果,次生災(zāi)害發(fā)生率、應(yīng)急資源滿(mǎn)足能力、監(jiān)測(cè)預(yù)警能力和災(zāi)民綜合滿(mǎn)意度這4個(gè)指標(biāo)對(duì)震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)等級(jí)的影響程度低于其余6個(gè)指標(biāo)。(2)AGABP模型評(píng)價(jià)結(jié)果與實(shí)際基本一致,可信度高于BP神經(jīng)網(wǎng)絡(luò)和邏輯斯蒂曲線。表7中,BP神經(jīng)網(wǎng)絡(luò)將汶川地震網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估為低風(fēng)險(xiǎn),這與實(shí)際不符,實(shí)際上汶川地震后網(wǎng)絡(luò)輿情迅速擴(kuò)散,謠言四起,經(jīng)過(guò)政府、專(zhuān)家的正確引導(dǎo)和管控才杜絕眾多負(fù)面輿情的膨脹。邏輯斯蒂曲線將雅安地震評(píng)估為一般風(fēng)險(xiǎn),這也與實(shí)際不符。
科學(xué)構(gòu)建震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)評(píng)估體系是制定網(wǎng)絡(luò)輿情應(yīng)對(duì)預(yù)案、提升震災(zāi)應(yīng)急效率和增加災(zāi)害應(yīng)急能力的基礎(chǔ)工作。本研究得出如下結(jié)論。
第一,提出具有高度代表性特征的震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)監(jiān)測(cè)指標(biāo)。依據(jù)網(wǎng)絡(luò)輿情傳播規(guī)律和震災(zāi)網(wǎng)絡(luò)輿情產(chǎn)生特征,從事件的物理屬性和社會(huì)屬性?xún)煞矫嬖O(shè)置風(fēng)險(xiǎn)監(jiān)測(cè)粗選指標(biāo)。通過(guò)指標(biāo)信度、效度檢驗(yàn)后,采用主成分分析和累計(jì)貢獻(xiàn)率方法對(duì)粗選指標(biāo)篩選后,提出2個(gè)維度、4個(gè)二級(jí)指標(biāo)、10個(gè)三級(jí)指標(biāo)所構(gòu)成的震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)監(jiān)測(cè)指標(biāo)體系。模型驗(yàn)證結(jié)果表明,本研究所構(gòu)建的指標(biāo)體系能夠有效對(duì)震災(zāi)網(wǎng)絡(luò)輿情進(jìn)行評(píng)估。
第二,訓(xùn)練后的AGABP模型,在收斂速度、參數(shù)優(yōu)化和預(yù)防過(guò)早收斂上明顯優(yōu)越于BP神經(jīng)網(wǎng)絡(luò),能夠用于震災(zāi)網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)管理實(shí)踐。
第三,AGABP模型的精度高于BP神經(jīng)網(wǎng)絡(luò)和邏輯斯蒂曲線。樣本訓(xùn)練和實(shí)例驗(yàn)證表明,BP神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu),精度低于AGABP模型,訓(xùn)練時(shí)間也長(zhǎng)于AGABP模型;邏輯斯蒂曲線在眾多非線性擬合中精度較高,從圖3、圖4也可以看出,兩次擬合結(jié)果表明邏輯斯蒂曲線對(duì)非線性數(shù)據(jù)的擬合結(jié)果十分穩(wěn)定,但與AGABP模型相比,邏輯斯蒂曲線的擬合精度仍然較差。
重慶大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2018年6期