□文/賈培佩 張 泰 張文良
(1.河北金融學(xué)院;2.河北軟件職業(yè)技術(shù)學(xué)院河北·保定)
網(wǎng)絡(luò)搜索數(shù)據(jù)與消費(fèi)者信心指數(shù)自回歸模型研究
□文/賈培佩1張?zhí)?張文良1
(1.河北金融學(xué)院;2.河北軟件職業(yè)技術(shù)學(xué)院河北·保定)
[提要]本文建立網(wǎng)絡(luò)搜索數(shù)據(jù)與消費(fèi)者信心指數(shù)自回歸時(shí)間序列模型,對(duì)消費(fèi)者信心指數(shù)進(jìn)行分析,發(fā)現(xiàn)網(wǎng)絡(luò)搜索數(shù)據(jù)和消費(fèi)者信心指數(shù)之間存在顯著相關(guān)性。
網(wǎng)絡(luò)搜索數(shù)據(jù);消費(fèi)者信心指數(shù);相關(guān)性
收錄日期:2015年8月19日
隨著互聯(lián)網(wǎng)科技的發(fā)展,以及我國固定網(wǎng)絡(luò)和移動(dòng)網(wǎng)絡(luò)的迅速普及,人們獲取信息的方式正在由傳統(tǒng)渠道向信息化渠道發(fā)展。本文主要對(duì)網(wǎng)絡(luò)搜索數(shù)據(jù)和消費(fèi)者信心指數(shù)之間的相關(guān)性進(jìn)行了探討。關(guān)鍵詞初選是整個(gè)研究的第一歩,搜索引擎的推薦、Googlecorrelate關(guān)鍵詞挖掘工具、SEO關(guān)鍵字挖掘和ICTCLAS漢語分詞系統(tǒng)是確定初選網(wǎng)絡(luò)搜索詞的四個(gè)重要方法,然后基于關(guān)鍵詞搜索量的相對(duì)值與消費(fèi)者信心指數(shù)的實(shí)際變化的相關(guān)性強(qiáng)弱,來確定最終用于研究的關(guān)鍵詞,同時(shí)還可以在運(yùn)用時(shí)差相關(guān)分析法確定相關(guān)性大小的過程中,發(fā)現(xiàn)其不同關(guān)鍵詞的領(lǐng)先或滯后階數(shù)。最后,將關(guān)鍵詞搜索指數(shù)與消費(fèi)者信心指數(shù)進(jìn)行相關(guān)性分析。
(一)關(guān)鍵詞初選。網(wǎng)絡(luò)搜索數(shù)據(jù)反映的是在某段時(shí)期,該關(guān)鍵詞的被關(guān)注度和搜索熱度。消費(fèi)者信心指數(shù)同比數(shù)據(jù)來自于我國國家統(tǒng)計(jì)局官方網(wǎng)站數(shù)據(jù)庫的統(tǒng)計(jì)數(shù)據(jù)。兩種數(shù)據(jù)選取的時(shí)段是從2009年11月到2013年6月。
本文根據(jù)消費(fèi)者信心指數(shù)的編制結(jié)構(gòu),選定了經(jīng)濟(jì)發(fā)展形勢(shì)、家庭收入和就業(yè)、物價(jià)水平、消費(fèi)或購買意愿等構(gòu)成和影響因素,選擇了“GDP”、“就業(yè)率”、“貨幣供應(yīng)量”、“黃金”和“二手房”等比較原始的網(wǎng)絡(luò)搜索關(guān)鍵詞。除了百度搜索風(fēng)云榜等比較簡單的關(guān)鍵詞挖掘方法對(duì)與消費(fèi)者信心比較相關(guān)的領(lǐng)域進(jìn)行了初步的關(guān)鍵詞搜集外,還運(yùn)用了數(shù)據(jù)挖掘工具Correlate、SEO關(guān)鍵字挖掘工具及ICTCLAS(漢語詞法分析系統(tǒng)),使得關(guān)鍵詞的選取工作更加的有章可循。通過上述的操作,得到1,500多個(gè)與初始關(guān)鍵詞相關(guān)的詞,之后對(duì)關(guān)鍵詞做了進(jìn)一步的搜集和整理工作。剔除重復(fù)的關(guān)鍵詞后,在谷歌趨勢(shì)搜索字詞欄中逐一進(jìn)行輸入,如“公積金買房”、“柴油價(jià)格”、“上證指數(shù)”、“理財(cái)產(chǎn)品”、“居民消費(fèi)價(jià)格指數(shù)”等,最終得到有搜索量并且各個(gè)月份數(shù)字相對(duì)比較完整的關(guān)鍵詞約600個(gè)。為了使最終的結(jié)果更具科學(xué)性和客觀性,需要把從谷歌趨勢(shì)中下載下來的網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)進(jìn)行如下數(shù)據(jù)預(yù)處理:
1、由于關(guān)鍵詞數(shù)據(jù)是以周為單位的,而消費(fèi)者信心指數(shù)國家統(tǒng)計(jì)局是按月公布的,因此為了更好地確定兩者之間存在的相關(guān)關(guān)系就有必要把網(wǎng)絡(luò)搜索關(guān)鍵詞的周數(shù)據(jù)合并轉(zhuǎn)換成以月度量化的月度數(shù)據(jù)。
2、為了解決季節(jié)變動(dòng)要素和不規(guī)則要素往往掩蓋經(jīng)濟(jì)發(fā)展中客觀變化給研究所帶來的問題,消除其短期波動(dòng),需要對(duì)關(guān)鍵詞進(jìn)行平滑處理,對(duì)網(wǎng)絡(luò)搜索關(guān)鍵詞,數(shù)據(jù)進(jìn)行三期的移動(dòng)平均,從而達(dá)到突出各網(wǎng)絡(luò)搜索數(shù)據(jù)長期變化規(guī)律的效果。
3、由于消費(fèi)者信心指數(shù)的數(shù)據(jù)是同比數(shù)據(jù),而網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)并不是同比數(shù)據(jù),因此為了更準(zhǔn)確地去發(fā)現(xiàn)兩者之間的相關(guān)關(guān)系,需要與消費(fèi)者信心指數(shù)的數(shù)據(jù)保持一致,有必要將平滑之后的網(wǎng)絡(luò)搜索關(guān)鍵詞數(shù)據(jù)轉(zhuǎn)換成同比數(shù)據(jù)。
(二)關(guān)鍵詞評(píng)價(jià)。根據(jù)消費(fèi)者信心指數(shù)的構(gòu)成和影響因素,利用百度等搜索引擎的關(guān)鍵詞推薦工具,以及SEO長尾關(guān)鍵詞挖掘工具,對(duì)網(wǎng)絡(luò)搜索的原始關(guān)鍵字詞進(jìn)行了挖掘和篩選過濾,保留下來大約600個(gè)與消費(fèi)者信心指數(shù)相關(guān)的網(wǎng)絡(luò)搜索初始關(guān)鍵詞。為了比較系統(tǒng)的評(píng)價(jià)網(wǎng)絡(luò)搜索關(guān)鍵詞搜索量的變化情況與消費(fèi)者信心指數(shù)之間的關(guān)系,對(duì)網(wǎng)絡(luò)搜索關(guān)鍵詞的評(píng)價(jià)主要從網(wǎng)絡(luò)搜索關(guān)鍵詞的領(lǐng)先性和相關(guān)性角度為衡量指標(biāo)。
文章中采用了時(shí)差相關(guān)分析法分別計(jì)算各個(gè)初選網(wǎng)絡(luò)搜索關(guān)鍵詞的領(lǐng)先階數(shù)和相關(guān)性。時(shí)差相關(guān)分析具體表達(dá)式為:
式中,p為某一網(wǎng)絡(luò)搜索關(guān)鍵詞相對(duì)與消費(fèi)者信心指數(shù)的領(lǐng)先階數(shù),rp表示當(dāng)時(shí)差為p的兩個(gè)變量之間的相關(guān)系數(shù),x表示網(wǎng)絡(luò)搜索關(guān)鍵詞搜索熱度的月度變化率,y表示消費(fèi)者信心指數(shù),而這個(gè)最大值即為關(guān)鍵詞與消費(fèi)者信心指數(shù)兩者之間的相關(guān)系數(shù)。
本文在關(guān)鍵詞評(píng)價(jià)過程中,符合要求的關(guān)鍵詞其p值必須大于0。同時(shí)為網(wǎng)絡(luò)搜索數(shù)據(jù)與消費(fèi)者信心指數(shù)的相關(guān)系數(shù)設(shè)定一個(gè)臨界值標(biāo)準(zhǔn)(本文中的臨界值為0.5),對(duì)于小于這一標(biāo)準(zhǔn)的網(wǎng)絡(luò)搜索關(guān)鍵詞,不予考慮,進(jìn)行剔除處理。
(三)搜索指數(shù)合成與檢驗(yàn)。表1從消費(fèi)者預(yù)期和消費(fèi)者滿意兩方面列出部分網(wǎng)絡(luò)搜索關(guān)鍵詞的皮爾森相關(guān)指數(shù)。(表1)
表1
圖1 擬合效果圖
(四)消費(fèi)者信心指數(shù)自回歸模型。本文選擇消費(fèi)者信心指數(shù)(Y)為被解釋變量,消費(fèi)者預(yù)期搜索指數(shù)(X1)和消費(fèi)者滿意搜索指數(shù)(X2)為解釋變量,建立時(shí)間序列模型,為了確定各個(gè)研究變量是否平穩(wěn),采用ADF檢驗(yàn)法,檢驗(yàn)結(jié)果為所有變量在5%的置信水平都已平穩(wěn)。接下來建立自回歸模型:
采用Engle和Granger的兩步協(xié)整關(guān)系檢驗(yàn)法來檢驗(yàn)其長期趨勢(shì)。結(jié)果顯示,殘差項(xiàng)具有穩(wěn)定性,因此網(wǎng)絡(luò)搜索指數(shù)與消費(fèi)者信心指數(shù)之間具有長期穩(wěn)定的協(xié)整關(guān)系。并且自回歸方程(1)擬合效果是最優(yōu)的,擬合方程見(2)、(3)式。該模型量化了網(wǎng)絡(luò)搜索數(shù)據(jù)與消費(fèi)者信心指數(shù)之間的關(guān)系,表明消費(fèi)者信心指數(shù)的變化是由消費(fèi)者未來生活預(yù)期的變化和消費(fèi)者對(duì)現(xiàn)有生活滿意情況的變化以及歷史的消費(fèi)者信心水平來共同決定。
模型當(dāng)中,解釋變量X1t-2和X2t-1代表的是消費(fèi)者通過網(wǎng)絡(luò)搜索相關(guān)內(nèi)容對(duì)消費(fèi)者信心指數(shù)刻畫的貢獻(xiàn),從宏觀和微觀兩個(gè)層面,以消費(fèi)者預(yù)期和消費(fèi)者滿意為代表,反映了在網(wǎng)絡(luò)生活中,消費(fèi)者預(yù)期和消費(fèi)者滿意網(wǎng)絡(luò)關(guān)注度和熱度的變化。兩個(gè)搜索指數(shù)變量的系數(shù)不同,這說明消費(fèi)者預(yù)期和消費(fèi)者滿意兩個(gè)影響因素的變化對(duì)消費(fèi)者信心的影響程度是不同的。消費(fèi)者預(yù)期搜索指數(shù)和消費(fèi)者預(yù)期搜索指數(shù)兩個(gè)指數(shù)各變化1%,對(duì)應(yīng)的消費(fèi)者信心指數(shù)變化的幅度分別為106.87%和2.10%。
我們把消費(fèi)者信心指數(shù)的真實(shí)值和模型得到的消費(fèi)者信心指數(shù)的擬合曲線圖繪制在一起。(圖1)可以看出本模型對(duì)于消費(fèi)者信心指數(shù)的擬合效果基本上令人滿意,兩者的走勢(shì)基本上是同步的。即:網(wǎng)絡(luò)搜索數(shù)據(jù)可以在一定程度上對(duì)消費(fèi)者信心指數(shù)進(jìn)行預(yù)測(cè),但是在某些時(shí)段,消費(fèi)者信心指數(shù)的模型擬合值和消費(fèi)者信心指數(shù)的真實(shí)值之間還是存在較大的偏差。
通過建立網(wǎng)絡(luò)搜索數(shù)據(jù)與消費(fèi)者信心指數(shù)之間的自回歸模型,我們發(fā)現(xiàn):1、網(wǎng)絡(luò)搜索數(shù)據(jù)與消費(fèi)者信心指數(shù)之間是協(xié)整的。消費(fèi)者預(yù)期搜索指數(shù)的提高會(huì)引起消費(fèi)者信心指數(shù)的下降;消費(fèi)者滿意搜索指數(shù)的提高會(huì)引起消費(fèi)者信心指數(shù)的上升。這表明消費(fèi)者預(yù)期也就是消費(fèi)者對(duì)宏觀層面的評(píng)估和預(yù)判對(duì)消費(fèi)者信心的影響要遠(yuǎn)遠(yuǎn)大于消費(fèi)者滿意即微觀層面的影響;2、網(wǎng)絡(luò)搜索數(shù)據(jù)中的部分?jǐn)?shù)據(jù)和消費(fèi)者信心之間具有顯著的相關(guān)性;3、利用網(wǎng)絡(luò)搜索數(shù)據(jù)合成的消費(fèi)者預(yù)期搜索指數(shù)和消費(fèi)者滿意搜索指數(shù)與消費(fèi)者信心指數(shù)之間存在不同時(shí)間的時(shí)差。消費(fèi)者預(yù)期搜索指數(shù)領(lǐng)先消費(fèi)者信心指數(shù)兩個(gè)月,消費(fèi)者滿意搜索指數(shù)領(lǐng)先消費(fèi)者信心指數(shù)一個(gè)月;4、引入網(wǎng)絡(luò)搜索指數(shù)后的自回歸模型對(duì)消費(fèi)者信心指數(shù)的擬合和預(yù)測(cè)都比較好,可以比官方公布的消費(fèi)者信心指數(shù)提前1個(gè)月左右,基本實(shí)現(xiàn)了對(duì)消費(fèi)者信心指數(shù)的實(shí)時(shí)監(jiān)測(cè)。
主要參考文獻(xiàn):
[1]國敏.基于網(wǎng)絡(luò)搜索技術(shù)的游客量預(yù)測(cè)方法研究[D].北京:首都師范大學(xué),2012.
[2]郭洪偉.我國消費(fèi)者信心指數(shù)的編制及存在的問題[J].商業(yè)時(shí)代,2010.
河北省統(tǒng)計(jì)科學(xué)研究計(jì)劃項(xiàng)目(2014HY39)
F713.55
A