国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于文本情感的投資者情緒與股指關(guān)系研究

2021-06-21 03:52陳妙苗
河南科學(xué) 2021年5期
關(guān)鍵詞:發(fā)帖股指投資者

李 珊,丁 宇,陳妙苗,鄭 晨

(南京航空航天大學(xué)經(jīng)濟(jì)與管理學(xué)院,南京 211106)

投資者情緒是行為金融學(xué)研究的一個(gè)熱點(diǎn).行為金融學(xué)理論認(rèn)為證券的價(jià)格不只是由其內(nèi)在的價(jià)值所決定,投資者的投資情緒和行為也會對其產(chǎn)生很大的影響.針對投資者情緒的研究主要是分析其與市場收益的關(guān)系[1].Delong等最先研究投資者情緒與股票價(jià)格的關(guān)系,并構(gòu)建了DSSW模型,指出投資者情緒是影響金融資產(chǎn)均衡價(jià)格的系統(tǒng)性風(fēng)險(xiǎn)[2].投資者情緒指數(shù)是量化分析投資者情緒的主要方法,傳統(tǒng)的投資者情緒指數(shù)主要可分為直接型情緒指數(shù)和間接型情緒指數(shù).直接型情緒指數(shù)是指通過問卷等調(diào)查方式獲得的投資者情緒,主要有友好指數(shù)、投資者智能指數(shù)以及央視看盤指數(shù)等;間接型情緒指數(shù)主要是以股票市場的交易信息作為情緒的代理變量,利用主成分分析等方法構(gòu)建得到.對于直接投資者情緒指數(shù),Brown和Cliff利用投資者智能指數(shù)反映投資者情緒[3],王美今和孫建軍則用央視看盤指數(shù)度量投資者情緒[4].對于間接投資者情緒指數(shù),Baker和Wurgler對股票交易數(shù)據(jù)如封閉式基金折價(jià)、市場交易量、IPO數(shù)及首日收益率、股利收益和股票發(fā)行/證券發(fā)行比率,利用主成分分析法并采用第一主成分作為投資者情緒指數(shù)[5].基于Baker的研究,易志高和茅寧將股利收益和股票發(fā)行/證券發(fā)行比率替換為消費(fèi)者信心指數(shù)和新增投資者開戶數(shù),采用主成分分析法提取前5個(gè)主成分構(gòu)建了投資者情緒綜合指數(shù)[6].隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,海量的互聯(lián)網(wǎng)數(shù)據(jù)和日趨成熟的數(shù)據(jù)處理技術(shù)為研究投資者情緒提供了新的思路和方法.Antweiler利用貝葉斯和支持向量機(jī)的方法對雅虎金融板塊上近150萬條數(shù)據(jù)進(jìn)行分析并構(gòu)建投資者情緒指數(shù),研究發(fā)現(xiàn)股票收益率與當(dāng)日論壇中的信息指標(biāo)呈顯著的相關(guān)關(guān)系[7].Tetlock通過對媒體新聞內(nèi)容和股票收益率進(jìn)行研究,發(fā)現(xiàn)悲觀的新聞報(bào)道會對股票收益率產(chǎn)生影響[8].孟雪井等利用文本挖掘技術(shù)建立了3種詞庫,并在綜合3種詞庫基礎(chǔ)上構(gòu)建了投資者情緒指數(shù),證明了我國股票市場的投資者情緒與市場指數(shù)之間存在聯(lián)動機(jī)制[9].石善沖等基于微信文本構(gòu)建了投資者情緒指數(shù),并與收盤價(jià)、成交量時(shí)間序列之間的關(guān)系進(jìn)行研究,結(jié)果表明微信文本挖掘的投資者情緒對于預(yù)測股票市場表現(xiàn)有重要作用[10].目前用于構(gòu)建投資者情緒指數(shù)的文本分析方法主要是機(jī)器學(xué)習(xí)法和情感詞典法[11-13].機(jī)器學(xué)習(xí)法主要利用傳統(tǒng)的機(jī)器學(xué)習(xí)算法包括決策樹、樸素貝葉斯和支持向量機(jī)等,需要選取或者建立文本特征,然后進(jìn)行情感分類,此方法的關(guān)鍵在于選擇合理的特征.情感詞典法需要先建立相關(guān)領(lǐng)域文本的情感詞典,在此基礎(chǔ)上對各文本數(shù)據(jù)進(jìn)行情感打分,最后根據(jù)得分進(jìn)行情感分類.從目前的研究來看,上述兩種方法依舊存在著一些不足之處:機(jī)器學(xué)習(xí)算法的效果很大程度上取決于文本特征的選?。?4],而情感詞典法的詞語在不同語境中所表現(xiàn)出的不同情感傾向問題是該方法的主要缺陷[15].隨著對深度學(xué)習(xí)領(lǐng)域的不斷探索和研究,越來越多的學(xué)者開始利用深度學(xué)習(xí)算法來進(jìn)行文本分析.國外學(xué)者最早將深度學(xué)習(xí)算法與自然語言處理結(jié)合起來并取得良好的效果[16-18].近年來,國內(nèi)的學(xué)者開始陸續(xù)將基于深度學(xué)習(xí)算法的文本分析方法應(yīng)用于網(wǎng)絡(luò)文本研究中.梁軍等提出了一種基于深度學(xué)習(xí)的遞歸神經(jīng)網(wǎng)絡(luò)模型對微博文本進(jìn)行情感分析,在不增加神經(jīng)網(wǎng)絡(luò)復(fù)雜度的前提下,提升了模型的準(zhǔn)確性[19].李杰等采用卷積神經(jīng)網(wǎng)絡(luò)模型對電商評論進(jìn)行短文本評論情感分類和特征詞聚類,結(jié)果表明模型的情感分類達(dá)到高準(zhǔn)確率,并且能有效提取產(chǎn)品特征[20].基于深度學(xué)習(xí)的文本處理方法正不斷受到各領(lǐng)域?qū)W者的青睞,然而在對投資者情緒指數(shù)研究上,還沒有引起廣泛關(guān)注.

基于深度學(xué)習(xí)模型對互聯(lián)網(wǎng)金融論壇文本數(shù)據(jù)進(jìn)行分析,進(jìn)而展開對投資者情緒的研究,采用雙向長短期記憶網(wǎng)絡(luò)模型(Bi-directional Long Short-Term Memory,Bi-LSTM)對投資者的論壇發(fā)帖文本進(jìn)行情感分類,并依此設(shè)計(jì)直接情緒指標(biāo),在此基礎(chǔ)上結(jié)合常用的間接情緒指標(biāo),利用主成分分析法構(gòu)建新的綜合投資者情緒指數(shù).選取我國散戶投資者為研究對象,通過他們在“上證股吧”論壇發(fā)帖的情感傾向分析投資者的群體情緒,并研究其與股指的關(guān)系.具體工作為:獲取股吧論壇的發(fā)帖文本并處理、利用百度開源的Bi-LSTM模型對發(fā)帖文本進(jìn)行情感分類、構(gòu)建綜合投資者情緒指數(shù)(Comprehensive Investor Sentiment Index,CISI)、研究投資者情緒與上證股指的相互性關(guān)系.

1 Bi-LSTM模型原理

1.1 LSTM網(wǎng)絡(luò)

長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)模型是在循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)模型的基礎(chǔ)上進(jìn)行改進(jìn)的一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,由Hochreiter等于1997年提出[21],LSTM模型解決了RNN模型在長序列任務(wù)中的梯度消失的問題.LSTM模型通過在RNN模型隱藏層單元中添加可控門對其進(jìn)行優(yōu)化,通過遺忘門f、輸入門i和輸出門O對信息進(jìn)行篩選,并通過更新“細(xì)胞狀態(tài)C”來保存重要信息,從而解決梯度消失問題,達(dá)到長期記憶的作用,LSTM記憶單元的結(jié)構(gòu)如圖1.

LSTM模型的記憶單元首先通過遺忘門以一定的概率將上一單元的輸出ht-1進(jìn)行丟棄.讀取當(dāng)前輸入信息xt和上一單元的輸出ht-1,通過Sigmoid函數(shù)(圖1中由σ表示)輸出數(shù)值ft∈[0,10],該數(shù)值決定對上一單元信息的保留程度,數(shù)值越高表示保留信息越多(公式(1)).

輸入門用于確定需要存入細(xì)胞狀態(tài)中的信息.輸入門的操作包含兩個(gè)環(huán)節(jié):首先通過Sigmoid層決定更新哪些信息(公式(2)),利用tanh層生成一個(gè)備選細(xì)胞狀態(tài)~Ct(公式(3)),然后綜合上述信息更新細(xì)胞狀態(tài)Ct(公式(4)).

記憶單元的最后一個(gè)核心部分是輸出門.輸出內(nèi)容ht由上一單元的輸出ht-1、本單元的輸入xt以及更新的細(xì)胞狀態(tài)Ct共同決定,Ot表示t時(shí)刻輸出門的輸出值,具體計(jì)算分為兩步:

由于遺忘門、輸入門和輸出門的存在,記憶單元嚴(yán)格控制了信息的輸入和輸出,保證了信息的質(zhì)量,同時(shí)記憶單元中細(xì)胞狀態(tài)的更新機(jī)制使信息能夠得到長時(shí)間的保留,從而保證LSTM模型對長距離信息的敏感性.

1.2 Bi-LSTM文本分類模型

由于LSTM模型具備長期記憶能力,因此對于處理文本序列數(shù)據(jù)任務(wù)有著很好的效果.但是在處理文本任務(wù)時(shí),由于LSTM模型處理數(shù)據(jù)是單向的,只能獲取上文信息而無法獲取下文信息,為了避免這種問題,采用雙向長短期記憶網(wǎng)絡(luò)Bi-LSTM模型,模型結(jié)構(gòu)如圖2.

Bi-LSTM模型主要有4層結(jié)構(gòu),分別是詞嵌入層、前向LSTM層、后向LSTM層以及全連接分類層.詞嵌入層將文本詞匯轉(zhuǎn)換成低維稠密實(shí)值詞向量;通過前向LSTM層從前往后獲取前文信息,通過后向LSTM層從后往前讀取下文信息,然后將兩個(gè)LSTM層的輸出拼接成一個(gè)長向量;最后用一個(gè)全連接層連接前層所有神經(jīng)元輸出,利用Softmax函數(shù)將輸出轉(zhuǎn)換成概率分布,對應(yīng)概率最大的種類即為該文本的預(yù)測分類.

圖2 Bi-LSTM文本分類模型結(jié)構(gòu)圖Fig.2 The structure of Bi-LSTM text classification model

2 指數(shù)設(shè)計(jì)研究

2.1 變量選取和設(shè)計(jì)

本文設(shè)計(jì)一套新的指標(biāo)體系,并基于CICSI指標(biāo)構(gòu)建法[6]構(gòu)建新的綜合性投資者情緒指數(shù)(CISI),該指標(biāo)體系包含投資者的直接情緒指標(biāo)變量和間接情緒指標(biāo)變量.由于數(shù)據(jù)的可獲取性,本研究選取的所有指標(biāo)都是月度數(shù)據(jù).首先,根據(jù)股吧論壇中的發(fā)帖數(shù)據(jù)設(shè)計(jì)直接情緒指標(biāo):

正向文本情緒得分(POS_SCORE):根據(jù)Bi-LSTM模型對文本的情感分類結(jié)果,以月為單位統(tǒng)計(jì)該月正向帖子的發(fā)帖數(shù)量(n_pos),將其除以月發(fā)帖總量(n_total),從而剔除每月發(fā)帖總量不同所造成的影響,得到正向文本情緒得分(公式(7)).該指標(biāo)反映了散戶投資者對于股市行情看漲的直接情緒.

負(fù)向文本情緒得分(NEG_SCORE):以月為單位統(tǒng)計(jì)該月負(fù)向帖子的發(fā)帖數(shù)量(n_neg),并將其除以該月發(fā)帖總量(n_total),同時(shí)為了體現(xiàn)其負(fù)向性,在前添加負(fù)號.該指標(biāo)反映了投資者對于股市行情看跌的直接情緒.

關(guān)注度指標(biāo)(FOCUS):已有研究表明,投資者的關(guān)注度與投資者的情緒有關(guān),并且投資者關(guān)注具有對股票市場的解釋能力及很強(qiáng)的預(yù)測能力[22-23].將單個(gè)發(fā)帖的瀏覽量(n_read)和評論量(n_comment)之和定義為該帖的關(guān)注度值,將每月所有帖子的關(guān)注度值求和作為該月關(guān)注度指標(biāo)(公式(9)).

同時(shí)選取常用的代理變量作為間接情緒指標(biāo),主要包含6個(gè)指標(biāo):

1)封閉式基金折價(jià)(DCEF):衡量基金價(jià)格對資產(chǎn)凈值的負(fù)向偏離程度,折價(jià)越低,表明投資者的期望越高.

2)換手率(TURN):衡量股票交易的活躍程度,換手率越高,表明投資者的投資熱情越高.

3)新增開戶數(shù)(NIA):直接反映了散戶投資者對投資市場的情緒,投資者情緒高漲時(shí),會吸引新的投資者參與投資,因此該指標(biāo)能很好反映整體的投資者情緒.

4)IPO數(shù)量(IPON)及首日收益率(IPOR):當(dāng)股市行情較好時(shí),投資者情緒高漲,這時(shí)IPO的數(shù)量將會增加;投資者情緒越高漲,對該股期望值越高,則其首日收益率越高.

5)消費(fèi)者信心指數(shù)(CCI):衡量投資者對未來宏觀經(jīng)濟(jì)的看好程度,通常消費(fèi)者信心指數(shù)越高,表明其對未來經(jīng)濟(jì)走勢越看好,因而會更有可能參與到股市的投資中.

6)消費(fèi)者價(jià)格指數(shù)(CPI)以及宏觀經(jīng)濟(jì)景氣的一致性指數(shù)作為宏觀經(jīng)濟(jì)走勢的代理指標(biāo):數(shù)據(jù)由CSMAR數(shù)據(jù)庫獲取.這是考慮到由于宏觀經(jīng)濟(jì)的走勢會對投資者的情緒產(chǎn)生影響,因此在構(gòu)建投資者情緒指標(biāo)時(shí)需要剔除該影響.

2.2 投資者情緒指數(shù)設(shè)計(jì)

基于上證大盤交易數(shù)據(jù)以及“上證指數(shù)”股吧評論文本數(shù)據(jù)設(shè)計(jì)一套新的情緒指標(biāo),并在此基礎(chǔ)上構(gòu)建綜合投資者情緒指數(shù),指數(shù)的構(gòu)建方法主要是主成分分析法.在進(jìn)行主成分分析時(shí),保留貢獻(xiàn)度最大的前5個(gè)主成分,同時(shí)保證所選取的主成分累計(jì)方差解釋率不低于75%,以保證主成分的解釋作用.

首先在原始的9個(gè)情緒指標(biāo)基礎(chǔ)上進(jìn)行提前期處理,構(gòu)建指標(biāo)的“提前”和“滯后”變量共18個(gè).對所有變量進(jìn)行標(biāo)準(zhǔn)化處理后進(jìn)行主成分分析,對5個(gè)主成分進(jìn)行加權(quán)平均構(gòu)建初始投資者情緒指數(shù)(CISI0).分別對CISI0與18個(gè)變量進(jìn)行相關(guān)性分析,選擇相關(guān)性較大的“提前”或者“滯后”變量作為各指標(biāo)的最終代理變量.對上述得到的9個(gè)指標(biāo)變量進(jìn)行第二次主成分分析,并對主成分進(jìn)行加權(quán)求和,得到含有宏觀因素的情緒指數(shù)(CISI1).為了剔除宏觀因素影響,以CISI1為因變量,以CPI和宏觀經(jīng)濟(jì)景氣一致性指數(shù)作為自變量建立線性回歸模型,取其殘差序列作為剔除了宏觀因素影響的CISI.

3 投資者情緒指數(shù)實(shí)證

3.1 數(shù)據(jù)采集及清洗

中國股民主要在證券論壇上進(jìn)行信息交流,選取用戶最多且人氣最高的證券論壇“東方財(cái)富網(wǎng)”中的“上證指數(shù)吧”作為數(shù)據(jù)源,通過python爬蟲獲取2015年1月1日至2019年12月31日用戶所有的發(fā)帖樣本3 973 657條,每條樣本包括標(biāo)題、內(nèi)容、作者、發(fā)帖時(shí)間、最后評論時(shí)間、閱讀量和評論量.通過對數(shù)據(jù)進(jìn)行初步觀察,發(fā)現(xiàn)絕大多數(shù)帖子的標(biāo)題和內(nèi)容存在相同或者高度重復(fù)的現(xiàn)象,因此只保留帖子的內(nèi)容部分來分析投資者情緒.進(jìn)一步觀察發(fā)現(xiàn),該股吧帖子內(nèi)容主要分為3種:股吧官方發(fā)布的信息帖、投資分析師的分析帖以及散戶投資者的交流帖.他們的表現(xiàn)在字?jǐn)?shù)上的區(qū)別在于前兩種帖子篇幅較長,通常在幾百字甚至更多,而散戶交流帖則偏短,一般為一到兩個(gè)句子,平均長度不超過50字.為了剔除非散戶帖子對研究結(jié)果的影響,將長度大于50字的帖子視作非散戶發(fā)帖并且刪除.最后將發(fā)帖時(shí)間和最后評論時(shí)間不在同一個(gè)月的樣本剔除,從而避免跨多天的帖子對研究結(jié)果的影響.經(jīng)過上述數(shù)據(jù)清洗,此次研究得到有效樣本3 199 291條.

3.2 文本情感分類

利用百度開源的Bi-LSTM模型“senta_bilstm”對清洗后的發(fā)帖進(jìn)行文本情感分析,“senta_bilstm”是基于海量數(shù)據(jù)訓(xùn)練具有高準(zhǔn)確度文本情感二分類模型.模型對文本進(jìn)行分析后,將文本的情感傾向及其屬于正向情緒的概率輸出,模型分類結(jié)果如表1.由示例可以看出,文本的正向情感越強(qiáng)烈,該句屬于正向文本的概率就越高,同理,當(dāng)文本所表達(dá)的負(fù)向情感越強(qiáng)烈時(shí),該句的正向概率就越低,由此說明模型能夠很好地理解文本的情感強(qiáng)度.對于一些口語表達(dá)或者股市論壇獨(dú)有的表達(dá)如“跳水”“吃面條”“喝白開水”等,雖然沒有直接情感詞存在,模型也能準(zhǔn)確識別出文本的情感傾向,彌補(bǔ)了通用型情感詞典在這方面的缺陷.

表1 文本情感分類結(jié)果示例Tab.1 Examples of text sentiment classification results

3.3 指數(shù)構(gòu)建

基于“上證指數(shù)”股吧發(fā)帖相關(guān)數(shù)據(jù)以及發(fā)帖文本的情感分類結(jié)果,以月為時(shí)間單位設(shè)計(jì)了反映投資者直接情緒的相關(guān)指標(biāo),同時(shí)從CSMAR數(shù)據(jù)庫中獲取反映間接情緒相關(guān)指標(biāo)的月度數(shù)據(jù),各指標(biāo)的樣本數(shù)量為60.對標(biāo)準(zhǔn)化處理后的所有指標(biāo)的“提前”和“滯后”變量進(jìn)行主成分分析并根據(jù)最大方差對主成分變量進(jìn)行旋轉(zhuǎn),選擇前5個(gè)主成分(累計(jì)方差解釋率為77.98%)進(jìn)行基于特征值的加權(quán)平均,得到初始投資者情緒指數(shù)(CISI0).計(jì)算CISI0與所有指標(biāo)變量的相關(guān)性,如表2所示.

表2 CISI0與代理變量相關(guān)系數(shù)表Tab.2 Correlation coefficient table of CISI0 and proxy variables

根據(jù)表2相關(guān)性值的大小,選擇FOCUSt、POS_SCOREt-1、NEG_SCOREt-1、DECFt-1、TURNt、IPONt、IPORt、NIAt-1和CCIt作為構(gòu)建CISI1的代理變量.CISI1的構(gòu)建方法與CISI0一致,前5個(gè)主成分累計(jì)方差解釋率為89.603%,各代理變量的因子載荷及其與CISI1相關(guān)系數(shù)如表3所示.

表3 各代理變量因子負(fù)載及與CISI1相關(guān)系數(shù)表Tab.3 Factor load of each proxy variable and its correlation coefficient table with CISI1

因此,CISI1的計(jì)算公式如下:

為了剔除宏觀因素對投資者情緒指數(shù)的影響,以CISI1為因變量,宏觀經(jīng)濟(jì)景氣一致性指數(shù)和消費(fèi)者價(jià)格指數(shù)作為自變量建立線性回歸模型,回歸結(jié)果見公式(11).式中CPI表示消費(fèi)者價(jià)格指數(shù),CI表示一致性指數(shù),取其殘差序列ε作為最終的CISI.

4 實(shí)證檢驗(yàn)和結(jié)果

4.1 相關(guān)性分析

為了驗(yàn)證本文構(gòu)建的投資者綜合情緒指數(shù)(CISI)能否反映上證股指(SI),從二者相關(guān)性的角度進(jìn)行分析.本文收集了2015年1月至2019年12月上證股指的月度數(shù)據(jù),繪制出CISI與SI的走勢圖(圖3),同時(shí)計(jì)算二者的皮爾森相關(guān)系數(shù).

圖3 CISI與SI走勢圖Fig.3 Trend chart of CISI and SI

由圖3可以看出,投資者綜合情緒指數(shù)與上證股指的走勢基本一致,投資者情緒曲線對股指曲線具有良好的擬合效果,說明本文所構(gòu)建的綜合投資者情緒指數(shù)能夠一定程度上反映出股指的變化趨勢.由二者的走勢曲線可以粗略地看出,投資者情緒與股指之間的變化趨勢在不同的時(shí)期存在一定的“提前”和“滯后”關(guān)系,在2015年期間,股指先于投資者情緒發(fā)生變化,隨后幾年二者的變化互有先后.同時(shí),投資者情緒指數(shù)序列和股指序列之間的皮爾森相關(guān)系數(shù)為0.520 2,在1%的水平上顯著相關(guān),說明投資者情緒與股指之間存在較強(qiáng)的正相關(guān)關(guān)系.

4.2 投資者情緒與股指的互動性關(guān)系分析

為了對投資者情緒與股指之間的關(guān)系進(jìn)行進(jìn)一步的分析,對二者進(jìn)行格蘭杰因果檢驗(yàn)并構(gòu)建VAR模型進(jìn)行方差分解.首先采用增廣的Dicky-Fuller檢驗(yàn)法(ADF)進(jìn)行單位根檢驗(yàn),驗(yàn)證CISI和SI的平穩(wěn)性.由表4的檢驗(yàn)結(jié)果可知,二者的ADF檢驗(yàn)值分別在低于1%和5%的臨界值水平下拒絕“CISI有單位根”和“SI有單位根”的假設(shè),即CISI序列在1%的顯著性水平下平穩(wěn),上證股指序列SI在5%的顯著性水平下平穩(wěn).

表4 平穩(wěn)性檢驗(yàn)結(jié)果Tab.4 Stationary test results

由于時(shí)間序列變量CISI和SI均為平穩(wěn)序列,因此可以直接進(jìn)行格蘭杰因果檢驗(yàn),從統(tǒng)計(jì)學(xué)的角度分析投資者情緒與股指之間的因果關(guān)系,表5列出檢驗(yàn)結(jié)果.

表5 格蘭杰因果檢驗(yàn)結(jié)果Tab.5 The results of Granger causality test

對于假設(shè)“CISI不是SI的格蘭杰原因”,在滯后1~3階時(shí)檢驗(yàn)結(jié)果P值均小于0.05,因此均拒絕原假設(shè),即CISI是SI的格蘭杰原因;對于假設(shè)“SI不是CISI的格蘭杰原因”,在滯后1~3階時(shí),P值均遠(yuǎn)小于0.01,因此在1%的顯著性水平下拒絕原假設(shè),即SI是CISI的格蘭杰原因.由上述格蘭杰檢驗(yàn)結(jié)果可知,投資者情緒指數(shù)和上證股指之間存在雙向的格蘭杰因果關(guān)系,即投資者的情緒會受到股市走勢的影響,同時(shí)又會反過來對股市產(chǎn)生影響.

進(jìn)一步構(gòu)建VAR(2)模型對CISI和SI進(jìn)行分析,模型如下所示:

式中:k表示模型的最大滯后階數(shù),ε1t和ε2t為方程的隨機(jī)擾動項(xiàng).本文根據(jù)SIC、SC以及HQ信息準(zhǔn)則,確定模型的滯后階數(shù)為3.模型的單位根均小于1,因此該VAR模型是穩(wěn)定的.基于VAR模型對投資者情緒指數(shù)CISI以及上證股指SI進(jìn)行方差分解,如表6所示.

表6 方差分解結(jié)果Tab.6 The results of Variance decomposition

由SI的方差分解結(jié)果可知,在股指和投資者情緒的雙重影響中,股指的變動主要由其自身解釋,并且自身的方差解釋率最終穩(wěn)定在85%左右.同時(shí),投資者情緒對股指變化也有一定的解釋并且解釋率呈現(xiàn)上升趨勢,由初期的1.119%逐漸增加,最后穩(wěn)定在14%左右.由CISI的方差分解結(jié)果可知,投資者情緒不僅受到自身往期的影響,同時(shí)也會受到股指的影響,并且在這個(gè)影響的過程中,股指的方差解釋率由最初的0快速增長,在第5期時(shí)到達(dá)51%,隨后保持穩(wěn)定.由股指和投資者情緒的方差分解結(jié)果可得,二者對彼此會產(chǎn)生一個(gè)逐漸增強(qiáng)的長期影響作用,但是最終的影響強(qiáng)度是不同的.對于股指而言,投資者情緒對其有一定的解釋作用,但是解釋力度相對較小,表明投資者情緒只是股市行情眾多影響因素中的一部分,因而影響作用相對較低,同時(shí)也印證了股市走向的難以預(yù)測性.對于投資者情緒而言,股指對其有著很強(qiáng)的解釋作用,表明股市行情對投資者的情緒有著至關(guān)重要的影響,揭示了股市行情走高時(shí),投資者投資情緒隨之高漲,而行情走低時(shí),投資者情緒持續(xù)低迷的現(xiàn)象.

4.3 優(yōu)越性分析

為了驗(yàn)證本文所設(shè)計(jì)的CISI指數(shù)的優(yōu)越性,依照相同的流程和方法,選擇DCEF、TURN、IPON、IPOR、NIA以及CCI構(gòu)建間接投資者情緒指數(shù)(SENT),并將其與CISI進(jìn)行對比分析.以上證股指(SI)作為因變量,分別以CISI和SENT作為自變量建立線性回歸方程,如式(13)和(14),對比結(jié)果如表7.

表7 CISI指數(shù)與SENT指數(shù)對比結(jié)果Tab.7 Comparison results of CISI index and SENT index

由表7可知,在線性回歸方程中,SI的R2為0.271,高于SENT的R2(0.117),說明CISI對股指的解釋效果要優(yōu)于SENT的解釋效果.對于回歸的均方誤差MSE,CISI作為自變量時(shí)的MSE為0.742,小于SENT對應(yīng)的MSE值(0.898),同時(shí)CISI與SI的相關(guān)系數(shù)(0.52)高于SENT的相關(guān)系數(shù)(0.342),說明CISI對股指的擬合效果更好.由此可見,添加了直接情緒因素的CISI指數(shù)比只包含間接型情緒的SENT指數(shù)取得了更好的股指擬合效果,因此CISI能更準(zhǔn)確地反映出投資者情緒與股指之間的關(guān)系.由CISI的優(yōu)越性可知,在量化投資者情緒并構(gòu)建情緒指數(shù)的時(shí)候,僅僅依據(jù)股票市場的交易數(shù)據(jù)來構(gòu)建的投資者情緒指數(shù)是不夠的,還需要考慮到投資者的直接情緒因素.

5 結(jié)論

通過設(shè)計(jì)一套新的指標(biāo)體系,以此構(gòu)建了綜合性的投資者情緒指數(shù),并根據(jù)2015年1月至2019年12月共60個(gè)月的樣本數(shù)據(jù),對投資者情緒與股指間的互動性關(guān)系進(jìn)行實(shí)證分析.構(gòu)建的指標(biāo)體系包含了投資者的直接情緒指標(biāo)和間接情緒指標(biāo).其中,直接情緒指標(biāo)基于“Bi-LSTM”模型對股吧發(fā)帖進(jìn)行文本情感分析得到,間接指標(biāo)則是從CSMAR數(shù)據(jù)庫中獲取的股市交易數(shù)據(jù).主要研究結(jié)果如下:①投資者情緒與股指之間存在長期且正向的相互影響作用,并且這種影響作用呈現(xiàn)出逐漸增強(qiáng)的趨勢.②投資者情緒和股指對彼此的影響程度是不同的,其中投資者情緒對股指的影響強(qiáng)度較小,而股指對投資者情緒的影響強(qiáng)度則很大.③對于投資者情緒指數(shù),當(dāng)其構(gòu)建指標(biāo)體系中包含投資者的直接情緒指標(biāo)時(shí),其對股指的擬合效果會比僅使用間接情緒指標(biāo)所構(gòu)建指數(shù)的效果更好.

目前,我國的投資市場仍處于發(fā)展階段,散戶投資者占有很高比例,投資者的情緒容易受到市場行情的影響.而投資者受影響后的情緒反過來又會對投資市場產(chǎn)生一定的影響,導(dǎo)致市場不規(guī)律波動.因此,對于每一個(gè)投資者而言,需要意識到自己的情緒在投資過程中受到的影響和作用,要加強(qiáng)專業(yè)知識的學(xué)習(xí),減少情緒波動造成的損失.在投資者情緒的構(gòu)建方法上,根據(jù)股吧論壇的發(fā)帖信息創(chuàng)新性地量化了投資者的直接情緒指標(biāo),并結(jié)合間接情緒指標(biāo)構(gòu)建了綜合性的投資者情緒指數(shù),期望該指數(shù)構(gòu)建方法對后續(xù)的投資者情緒研究有所啟發(fā).

猜你喜歡
發(fā)帖股指投資者
聊聊“普通投資者”與“專業(yè)投資者”
糾紛調(diào)解知多少
新興市場對投資者的吸引力不斷增強(qiáng)
英議會掏錢讓議員學(xué)如何發(fā)帖
平安千億回購 股指觸底回升
股指再度回落 機(jī)構(gòu)逢高減倉
降杠桿引發(fā)股指沖高回落
股指震蕩走高筑底之日可期
利用學(xué)校網(wǎng)絡(luò)平臺,培養(yǎng)學(xué)生寫作興趣
發(fā)帖與跟帖
宜春市| 鄂托克旗| 固阳县| 涟水县| 静安区| 临洮县| 武鸣县| 荆州市| 金昌市| 勃利县| 彝良县| 和静县| 白沙| 东光县| 闻喜县| 建德市| 屯留县| 镇平县| 台山市| 北流市| 中山市| 淮滨县| 新郑市| 鄂尔多斯市| 日喀则市| 定西市| 泾川县| 利川市| 沧州市| 莒南县| 渭南市| 鄢陵县| 温宿县| 龙泉市| 瓮安县| 北宁市| 新龙县| 东乡族自治县| 车险| 墨玉县| 通江县|