尹海員 王曉曉
[摘 要]股票定價效率是衡量股票市場有效性的重要指標,更高的定價效率有利于促進資本市場資源的合理配置,更好地服務實體經濟高質量發(fā)展。本文挖掘東方財富的投資者社區(qū)的文本發(fā)帖信息,利用機器學習方法分析文本情緒狀態(tài),構建投資者情緒指標并分析其對股票定價效率的影響。研究表明,投資者情緒與股票定價效率之間存在顯著正相關關系,也即樂觀的投資者情緒會帶動股票定價效率的提升。這種影響效應是通過樂觀情緒降低了信息不對稱程度,進而提升了股價信息含量,并與定價效率的機制路徑產生作用。進一步看,隨著賣空限制的降低,股票定價效率對情緒的敏感程度會增大;良好的信息環(huán)境會降低情緒對股票定價效率的影響。研究結論為從個體投資者情緒視角透視我國股票市場運行效率以及網絡媒體信息監(jiān)管的必要性提供了證據(jù)。
[關鍵詞] 投資者情緒;股票定價效率;數(shù)據(jù)挖掘;機器學習
[中圖分類號] F832.51;TP181[文獻標志碼] A[文章編號] 1672-4917(2024)03-0096-16
一、引言
我國資本市場經過30多年的大力發(fā)展,取得了非凡的成績。但不可否認的是,目前我國資本市場仍然不夠健全和成熟,存在著體系不完善、投資者決策行為跟風等問題。從市場現(xiàn)實看,個體投資者作為參與者占據(jù)了絕對多數(shù),多數(shù)情況下處于信息劣勢方,其獲取信息渠道有限加之自身缺乏專業(yè)知識,決策行為更易受自身心理、情緒等因素影響,導致股票市場異常波動甚至股價崩盤風險。在中國經濟高質量發(fā)展的背景下,提升股票市場的定價效率,完善證券價格的信號機制,對于優(yōu)化資本市場的資源配置功能以更好服務實體經濟具有重要意義。
在移動互聯(lián)時代,網絡社區(qū)為投資者提供了互相交流、互相學習、互相分享信息的重要平臺,為資本市場的參與者提供了新的交流方式。越來越多的投資者愿意通過網絡表達自己的觀點并與其他投資者交流信息。隨著網絡挖掘技術的發(fā)展,從網絡平臺上獲取研究所需的內容成為可能。探究網絡平臺上的情緒與信息含量成為學界近些年關注的重點,已有學者關注投資者情緒,特別是個體投資者情緒或者行為對股價信息含量的影響效應。比如楊菁菁等(2023年)發(fā)現(xiàn),投資者情緒越趨于樂觀則股價的信息含量越高,降低了股價同步性水平,而且隨著投資者關注度的增加、境外投資者持股比例的上升,這一影響效應會減弱[1]。鄭建東等(2022年)則關注社交媒體的投資者互動行為對資本市場定價效率的影響,他們利用股吧發(fā)帖數(shù)量來度量投資者交互行為程度,發(fā)現(xiàn)投資者在網絡股吧中的發(fā)帖數(shù)量增加有助于公司特質信息融入股價,降低了股價同步性[2]。
但這一領域的研究尚有改進的空間,主要體現(xiàn)在投資者情緒度量方法的改進、情緒對股票定價效率的影響效應等方面。從前者來看,早期研究者主要利用客觀指標構建主成分因子衡量情緒狀態(tài),隨著互聯(lián)網技術的發(fā)展,基于網絡數(shù)據(jù)的挖掘和文本分析成為主流方法,但采用不同的文本分析模型可能導致結果的各異[3]。從后者看,學者們很早就注意到投資者情緒對市場定價的影響,比如噪聲交易模型(DSSW)認為,投資者有限理性行為會相互影響,成為影響金融資產均衡價格的系統(tǒng)性風險。也有學者研究投資者情緒對資本市場效率的影響規(guī)律,但如何采用更為有效的投資者情緒指標值得進一步探討。
本文挖掘了東方財富網股吧的2019年1月至2022年2月的實時發(fā)帖文本信息,利用樸素貝葉斯模型將文本進行情感傾向識別分類并構建了樣本股票的投資者情緒指標。然后基于股價同步性和相關系數(shù)兩個指標,構造了定價效率指標,利用面板模型探討了投資者情緒和股票定價效率的關系、情緒影響股票定價效率的中介機制和市場制度、信息環(huán)境在其中起到的作用。我們發(fā)現(xiàn),投資者情緒對股票定價效率有顯著的正向影響,即投資者情緒越樂觀,股票定價效率越高。進一步看,隨著賣空限制的降低,股票定價效率對情緒的敏感程度會增大,而良好的信息環(huán)境會降低情緒對股票定價效率的影響。這些研究發(fā)現(xiàn)為透視我國股票市場投資者情緒如何影響市場運行,以及加強網絡媒體信息傳播監(jiān)管的必要性提供了實證證據(jù)。
本文的邊際貢獻主要體現(xiàn)在如下兩點:首先,拓展了股票定價效率、股價信息含量驅動因素的研究范疇和資本市場效率研究的視角。股票定價效率作為衡量市場健康發(fā)展的重要指標,學術界大多從宏觀經濟政策、公司角度去探究對其的影響。即使現(xiàn)有從投資者行為角度出發(fā)的研究,也多從投資者網絡中心性、關注度、本地偏好和持股行為等變量出發(fā)進行研究。而本文從投資者情緒視角分析其對股票定價效率的影響,拓寬了股票定價效率、股價信息含量驅動因素的研究邊界。其次,豐富了投資者情緒影響效應及其后果的研究內容。盡管投資者情緒成為了學術界關注的重點,但大多研究將其聚焦于對股票收益率、波動性和流動性的影響,少有文獻從行為金融視角出發(fā)研究投資者情緒對股票定價效率的影響。區(qū)別于傳統(tǒng)投資者情緒指標,我們抓取了股吧論壇的文本信息,使用樸素貝葉斯算法分類分析投資者情緒傾向,構建了基于網絡數(shù)據(jù)挖掘的情緒指標,在此基礎上探究其對股票定價效率影響規(guī)律,以及在不同的賣空限制程度和信息環(huán)境下的表現(xiàn)和中介機制,豐富了投資者情緒影響效應的研究內容。
二、文獻綜述與研究假設
(一)基于網絡數(shù)據(jù)挖掘的投資者情緒
近年來,基于網絡數(shù)據(jù)對投資者情緒進行挖掘分析已逐漸成為該領域的研究熱點。早期研究者主要使用網絡數(shù)據(jù)的數(shù)量指標,具體來說,即基于網絡搜索信息來構造投資者情緒指數(shù),包括谷歌、百度等搜索引擎的搜索數(shù)據(jù)等。比如Da(2015年)將谷歌搜索指數(shù)(SVI)作為投資者關注度指標,發(fā)現(xiàn)該指數(shù)可以預測股票市場回報率[4]。Gao(2020年)同樣利用該指數(shù)構建了2004—2014年期間全球40個國家的周度搜索指數(shù)作為股票市場情緒指數(shù),發(fā)現(xiàn)該指數(shù)是市場回報的反向預測因子[5]。國內學者大部分通過百度搜索指數(shù)構建投資者情緒指標,發(fā)現(xiàn)上市公司的日度百度指數(shù)顯著解釋其下一交易日股票集合競價時的價格跳躍現(xiàn)象[6]。近年來,文本分析技術的發(fā)展推動研究重心從網絡數(shù)據(jù)的數(shù)量指標轉向了內容指標。構造投資者情緒指數(shù)的信息內容來源包括推特、財經網站、微博、微信、股吧論壇[7-8]。研究者們利用文本分析方法構建情緒指標,發(fā)現(xiàn)基于網絡數(shù)據(jù)挖掘的投資者情緒可以傳遞到股票市場,影響成交量并能夠預測股市收益。
從技術方法上看,機器學習模型可以在一定程度上消除研究者的主觀性,近年來學術界逐漸運用機器學習模型來提取情緒狀態(tài)。目前支持向量機、樸素貝葉斯、K鄰近三種模型的使用最為普遍。楊曉蘭等(2016年)以東方財富網股吧發(fā)帖為研究對象,通過IP地址識別構建本地關注指標,使用K鄰近方法構建了投資者情緒指標[9]。Li等(2019年)使用支持向量機方法對中文網絡論壇發(fā)帖進行情感分類,并使用情感指標對股票收益進行預測[10]。支持向量機、樸素貝葉斯、K鄰近模型三種方法各有優(yōu)勢,其中樸素貝葉斯分類算法能更好地處理稀疏、高維、短文本的分類問題,最早Antweiler和Frank(2004年)利用樸素貝葉斯文本分類算法對雅虎財經上投資者發(fā)帖進行識別并構建了投資者情緒指標[11]。也有國內學者采用樸素貝葉斯算法識別了東方財富股吧發(fā)帖文本的情緒傾向,對投資者發(fā)帖情緒如何影響股票特質風險進行了探討[12]。
(二)股票定價效率及其影響因素
股票市場定價效率是股價對企業(yè)特質信息吸收的快慢與準確程度,是衡量市場有效性的一個關鍵指標。有效識別那些能夠影響股票定價效率的因素,可以更好地進行股票市場交易設計來提升市場有效性。眾多文獻已經從不同視角探索股票定價效率的影響因素,包括制度因素、公司內部因素、利益相關者行為因素,等等。
制度因素方面,包括賣空機制、市場開放、稅收等變量對于股票定價效率的影響。比如孟慶斌和黃清華(2018年)[13]證明了融資融券制度有效改善了價格發(fā)現(xiàn)機制,兩融標的股票的定價效率得到了顯著提高。也有學者發(fā)現(xiàn)滬港通、深港通的推出提高了我國大陸上市公司股票定價效率[14]。公司內部因素方面,學者們發(fā)現(xiàn)公司治理水平、信用等級、會計信息透明度等水平的改善,會降低股價同步性,提升股票定價效率。另外公司信息管理能力越高則股票定價效率也越高,比如田高良等(2018年)發(fā)現(xiàn)上市公司對網絡輿情的管理能夠向市場傳遞特質信息,提升信息效率[15]。隨著新媒體手段的廣泛應用,有學者開始關注上市公司新媒體手段的應用對公司股價信息效率的影響,Zhou等(2019年)發(fā)現(xiàn),上市公司開通官方微博在一定程度上可以增加公司股價中的信息含量,提高股票的定價效率,官方微博推文的數(shù)量與股價同步性呈負相關[16]。利益相關者行為方面,學者們研究了監(jiān)管部門、證券分析師、審計師、新聞媒體等股票市場參與主體行為如何影響股票定價效率。He和Fang(2019年)發(fā)現(xiàn)市場監(jiān)管部門針對上市公司的違規(guī)行為實施處罰時,被處罰公司的股票定價效率呈現(xiàn)先上升后下降的規(guī)律[17]。張大永等(2021年)從分析師羊群行為出發(fā),證明了“非信息驅動”的真羊群行為增加了公司的股價同步性[18]。Steven(2021年)發(fā)現(xiàn)審計公司規(guī)模、審計事務所任期與股價同步性正相關,更好的會計審計專家的專業(yè)技能有助于向市場提供可靠的公司信息,進而提升股票定價效率[19]。還有學者發(fā)現(xiàn),政府行為、媒體報道可以幫助更多企業(yè)特質信息融入股價,在一定條件下降低企業(yè)股價同步性,提高股價中公司特質信息的含量[20]。
(三)研究假設的提出
股票市場定價效率是衡量股市有效的重要指標,到底有哪些因素影響了定價效率值得深入研究。近年來,學者將投資者情緒因子加入到資產定價模型中,發(fā)現(xiàn)情緒是股票收益率的有效解釋因子。除收益率之外,學者們后續(xù)開始探討情緒是否與股票市場運行的其他變量存在相關性,這些變量包括股票交易量、波動性、公司盈利預測等。比如Das和Chen(2007年)衡量了24家在納斯達克上市的科技類公司的董事會會議信息中透露出的情緒信息,發(fā)現(xiàn)這些情緒信息與股票交易量和波動率等具有高度的相關性[21]。Price等(2012年)利用上市公司的電話會議進行文本分析,提取文本中所包含的情緒信息,發(fā)現(xiàn)它是股票收益和交易量的重要預測指標[22]。Jiang(2018年)基于公司財務報表和電話會議的文本基調構建情緒指標,發(fā)現(xiàn)經理情緒越樂觀則股票市場收益越低[23]。
學者們進一步研究投資者行為是否可以向市場注入有效信息,發(fā)現(xiàn)投資者之間的交流活動會為其理解信息提供參考,促進信息被更多投資者吸收消化,并提高市場效率[24]。還有文獻證明了活躍的投資者情緒可以改善信息不對稱程度,促進信息更好地融入股價[25]。投資者情緒是對未來股價走勢的主觀預期,如果投資者對股價未來走勢預期越樂觀,會更愿意通過網絡社交媒體的互動進行交流,抱著積極的態(tài)度進行投資決策。其更多的交流互動行為會促進信息被更多投資者理解,加快了市場信息與公司特質信息融入股價的速度并提升股票定價效率。所以,活躍的投資者情緒會減少知情交易及信息不透明程度,從而降低了公司的信息不對稱程度。反之,投資者的悲觀情緒會產生心理壓力和謹慎情緒,出于風險厭惡心理,投資者會弱化其在社交網絡的交互行為,信息擴散受到阻礙,降低股價定價效率?;谝陨戏治?,我們提出本文研究假設H1和假設H2:
假設H1:投資者情緒會影響股票定價效率,越樂觀的投資者情緒會增加股票價格的特質信息含量,進而提升定價效率。
假設H2:投資者的樂觀情緒通過降低公司信息不對稱程度進而提升股票定價效率。
股價波動的根源在于信息的變化。投資者社交網絡的交互行為以及由此集聚形成的情緒狀態(tài)有可能包含有價值的公司特定信息,有助于提升股票定價效率,但外部制度變量可能會影響這一效應。市場賣空機制能夠允許投資者通過買空和賣空行為操作,這樣會促使更多的信息融入股價。如果缺乏賣空制度,投資者即使在看空股票時也無法通過賣空操作來獲利。因此,在缺乏賣空機制的情況下,悲觀情緒無法得到充分的表達和釋放,進而影響股價的信息含量。另外,在不同信息環(huán)境中,信息傳遞效率不同,如果公司所處市場信息環(huán)境越透明,信息融入股價的時間越短,股票定價效率就越高。上市公司所處信息環(huán)境會影響投資者獲取以及處理信息的質量,進而影響股價對信息的反應程度。良好的公司信息環(huán)境可以降低信息不對稱程度,促進投資者的態(tài)度看法得到更多個體投資者的獲取和理解,從而提升股票定價效率?;谝陨戏治?,提出本文研究假設H3和假設H4:
假設H3:賣空限制程度越低的樣本公司股票,投資者情緒對股票定價效率的影響效應越顯著。
假設H4:信息環(huán)境越差的樣本公司股票,投資者情緒對股票定價效率的影響效應越顯著。
三、研究設計
(一)樣本選擇與數(shù)據(jù)說明
本文選擇滬深300指數(shù)成分股作為研究對象,并剔除以下幾類樣本:(1)為滿足數(shù)據(jù)處理需求,確保數(shù)據(jù)容量,剔除論壇中日平均發(fā)帖量少于10條的樣本;(2)剔除金融類上市公司、ST和*ST的公司樣本;(3)為避免“指數(shù)效應”偏差以及保證樣本期內數(shù)據(jù)連續(xù)性,剔除在研究期間被調入或調出滬深300指數(shù)的樣本,最終樣本股票為166只,時間區(qū)間選取為2019年1月1日—2022年2月28日。
本文利用東方財富網股吧獲取投資者情緒狀態(tài)。作為中國最活躍的股票論壇之一,東方財富網股吧具有得天獨厚的數(shù)據(jù)挖掘優(yōu)勢:從數(shù)據(jù)容量來說,用戶數(shù)和瀏覽量大、論壇資訊內容豐富;從數(shù)據(jù)質量來說,論壇開設時間久、發(fā)帖頻率高。這些優(yōu)勢有助于分樣本獲取個股文本信息。首先,本文利用Python編寫爬蟲程序,獲取東方財富網股吧實時發(fā)帖,其中每條發(fā)帖包括標題內容、閱讀量、評論量、發(fā)帖人及發(fā)帖時間,初步獲取原始發(fā)帖18 381 202條。其次,對原始文本進行數(shù)據(jù)清洗,包括剔除完全重復、純數(shù)字、純標點符號、圖片和表情以及無關外部鏈接的發(fā)帖。隨后,將發(fā)帖日期與股市行情的交易日期進行匹配,剔除非交易日發(fā)帖,最終獲得17 243 512條發(fā)帖。
本文實證所用樣本股票財務數(shù)據(jù)、交易數(shù)據(jù)來自銳思(RESSET)金融數(shù)據(jù)庫、國泰安(CSMAR)經濟金融數(shù)據(jù)庫。為保證數(shù)據(jù)的準確性,我們使用兩個數(shù)據(jù)庫的變量數(shù)據(jù)進行了交叉驗證。同時為避免極端值的影響,對所有連續(xù)變量進行上下1%的Winsorize縮尾處理。
(二)文本情緒分析
本文運用Python中的Jieba分詞工具對文本發(fā)帖進行分詞,獲得單個詞語;然后,參考哈工大停用詞庫中的停用詞,篩選出與股票無關的詞,保留與股市相關的詞匯,剔除停用詞;最后,使用TF-IDF和卡方統(tǒng)計(Chi-square)篩選出前K個特征詞,用特征向量來表示待分類文本,供計算機識別其語言。
為更好地量化投資者情緒,我們使用樸素貝葉斯模型進行情緒分類,共分為四個步驟:首先,通過人工標注“樂觀”“中性”和“悲觀”標簽將發(fā)帖分為三類,準備訓練數(shù)據(jù)集。其次,隨機選出12 000條發(fā)帖,請30名金融學專業(yè)研究生人工標注發(fā)帖文本,每3人為一組,每人標注1200條,每條帖子的最終標簽以3次結果中占比大的為最終的情緒狀態(tài),最終得到悲觀發(fā)帖5564條,樂觀發(fā)帖3368條,中性發(fā)帖3068條。再次,利用Python編寫樸素貝葉斯情感分類模型的程序,通過Sklearn庫中自帶的Nave.bayes模塊,選擇不同Testsize和隨機數(shù)種子,篩選不同的訓練集比例與特征詞數(shù)來訓練模型,最終模型準確率為73%。最后,利用訓練好的樸素貝葉斯文本分類模型預測所有發(fā)帖的情緒傾向,在此基礎上構建投資者情緒變量。
(三)變量設計
1.投資者情緒
借鑒Antweiler和Frank(2004年)思路[26],基于當月得到的樂觀/悲觀發(fā)帖數(shù)來構建月度投資者情緒:
Sentimenti,t=ln[(1+posi,t)/(1+negi,t)](1)
公式(1)中,posi,t 和negi,t分別是股票i在第t月的樂觀發(fā)帖數(shù)量和悲觀發(fā)帖數(shù)量。很顯然,當月度樂觀發(fā)帖數(shù)大于悲觀發(fā)帖數(shù)時,Sentimenti,t大于0,反之小于0。
為了檢驗該投資者情緒指標的有效性,我們選取CSMAR數(shù)據(jù)庫的社交媒體數(shù)據(jù)庫中的情緒指標proxy作為代理變量進行相關性驗證。由于CSMAR數(shù)據(jù)庫的社交媒體數(shù)據(jù)庫中的情緒指數(shù)從2020年1月開始發(fā)布,我們選取對應樣本時間段的數(shù)據(jù),利用公式(2)進行月度數(shù)據(jù)擬合回歸。表1結果表明,proxyi,t與基于公式(1)的Sentimenti,t在 1%的顯著性水平上正相關。
Sentimenti,t=α0+α1proxyi,t+εi,t(2)
2.股票定價效率
現(xiàn)有文獻主要從以下兩個思路來衡量股票定價效率。一是從股價的信息含量角度,判定股票價格是否真實而充分地反映了市場信息,以股價同步性指標為代表;二是從股價對信息的反應速度角度,判定價格是否能及時而準確地吸收新的市場信息,以相關系數(shù)指標為代表。本文選擇股價同步性(SYNi,t)和相關系數(shù)(ρi,t)來度量樣本股的定價效率。
股價同步性指標主要反映股價隨市場、行業(yè)股票組合變動而同向變動的程度。股價隨市場、行業(yè)同漲同跌程度越強,股價中特質信息越少,股票定價效率越低。為計算股價同步性,首先需要計算市場和行業(yè)收益率水平如下:
Indretj,t=(k∈jWk,t×Rk,t-Wi,t×Ri,t)/(Ij,t-1)(3)
公式(3)中,Indretj,t是待計算的樣本股i所處的行業(yè)j的收益率水平,Wk,t是樣本股i在行業(yè)j中第t日市值權重,Ij,t是樣本股i所在行業(yè)j在第t日的公司數(shù)量,對于樣本股i自身,需要在計算行業(yè)收益率時將其自身收益率排除在外。按照同樣的方法可以定義市場收益率Mktrett如下:
Mktrett=(Wk,t×Rk,t-Wj,t×Rj,t)/(It-1)(4)
公式(4)中,Mktrett是待計算的市場收益率,Wj,t是樣本股i所處行業(yè)j在第t日市值權重,It是市場中在第t日的行業(yè)數(shù)量,也就是說,我們同樣將樣本股i自身所處行業(yè)排除在外。
參考Morck等(2000年)的做法[27],在上述計算的基礎上,對于樣本股i進行如下回歸:
Reti,t=αi,t+β1Mktrett+β2Mktrett-1+β3Indretj,t+β4Indretj,t-1+εi,t(5)
公式(5)中,Reti,t表示樣本股i在第t日的收益率,Mktrett和Indretj,t分別表示第t日的市場收益率和樣本股所處行業(yè)j的收益率。我們加入了滯后一期的市場與行業(yè)收益率,用以控制可能存在的非同步交易偏差。按照公式(5)對樣本進行回歸,得到每個回歸所產生的擬合優(yōu)度值R2i,t。再通過公式(6)進行Logistic變換,得到股價同步性水平:
SYNi,t=ln(R2i,t/1-R2i,t)(6)
公式(6)中的R2i,t表示回歸得到的擬合優(yōu)度值,SYNi,t表示Logistic變換后的股價同步性指標,SYNi,t值越大,股價同步性水平越高。進一步看,通過公式(5)回歸得到的擬合優(yōu)度值中包含了行業(yè)收益率的影響,股票價格中可能包含了樣本股票所處行業(yè)的信息,SYNi,t值較大不一定必然代表股價中缺乏信息。我們繼續(xù)采用以下方法優(yōu)化股價同步性指標:
Reti,t=α+β1Mktrett+β2Mktrett-1+εi,t(7)
R2i,t_DIFF=R2i,t-R*2i,t(8)
SYNdiffi,t=ln[R2i,t_DIFF/(1-R2i,t_DIFF)](9)
通過對公式(7)回歸可以得到擬合優(yōu)度R*2i,t,R2i,t-DIFF是公式(5)的擬合優(yōu)度與公式(7)擬合優(yōu)度之差,再通過公式(9)變換得到股價同步性指標SYNdiffi,t,其值越小意味著股價同漲跌程度越低,即定價效率越高。
相關系數(shù)指標用來表示個股股價對市場波動的延遲程度,通過當期股票收益率和滯后一期的市場收益率來計算,最早由Bris等(2007年)提出[28],計算如下:
ρi,t=|Corr(ri,t,rm,t-1)|(10)
公式(10)中,ri,t表示樣本股 i在第t月的月度收益率,rm,t-1 是用來指代滯后一期的流通市值加權的市場收益率,用滬深300指數(shù)收益率來指代。作為股票定價效率的衡量指標,ρi,t越小,則當期個股收益率與滯后一期市場收益率之間關聯(lián)程度越薄弱,個股能更及時地吸收新的市場信息,定價效率越高。
3.控制變量
參照郭照蕊和張?zhí)焓妫?021年)相似主題的研究[29],我們選取以下11個控制變量: ①公司規(guī)模(Size)。公司規(guī)模越大,則企業(yè)信息披露機制越健全,受到外界的關注度越高,在一定程度上加快了信息融入股價的速度,進而提升定價效率。 ②資產負債率(Lev)。資產負債率反映了財務風險狀況,債務因素會影響股票定價。③資產報酬率(Roa)。資產報酬率反映了盈利能力,其越強則會向市場傳遞正面信息。 ④賬面市值比(Bm)。賬面市值比越高,公司越具有投資價值,其受到外界的關注度越高,進而影響市場效率。 ⑤換手率(Turnover)。換手率越高,股票的流動性越強,越能促進公司層面的特質信息融入股價,進而提高股價信息含量。⑥上市年限(Age)。上市時間越久的公司,其信息含量會越多,信息反應速度會下降進而影響股票定價效率。⑦第一大股東持股比例(Top1)。第一大股東持股比例越高,意味著基于私有信息的交易越多。⑧機構投資者持股比例(Institution)。機構投資者是理性和知情交易的代表,其持股比例越多,股價越符合隨機游走模式。⑨收益率波動(Volatility)。收益率的波動性越強,意味著股價包含的異質性信息越強。⑩企業(yè)性質(Type)。最終控制人的資本產權屬性不同,可能會影響信息披露程度和股價信息含量。B11是否使用四大審計(Big4)。若上市公司由普華永道、德勤、畢馬威、安永四大會計師事務所審計,意味著其信息披露的質量更高。
表2匯總了本文所用主要變量名稱、符號和釋義。
(四)基礎模型
我們構建面板回歸模型來分析基于網絡社區(qū)股吧提取的投資者情緒是否會影響股票的定價效率:
Efficiencyi,t=α0+α1Sentimenti,t+γControli,t+year+industry+εi,t(11)
模型(11)中,被解釋變量Efficiency表示股票定價效率,分別用股價同步性(SYNdiff)、相關系數(shù)(ρ)來衡量;Sentimenti,t為樣本股i在第t月的投資者情緒;Controli,t為系列控制變量;模型中加入了行業(yè)和年度虛擬變量以控制行業(yè)和年度固定效應。接著對模型和數(shù)據(jù)的匹配問題處理如下:首先,選擇合適的面板數(shù)據(jù)處理模型,經Hausman檢驗發(fā)現(xiàn)應該選擇固定效應模型(p<0.01)。其次,為了避免面板數(shù)據(jù)異方差與序列相關的問題,以公司為聚類變量對所有回歸模型標準誤進行了聚類調整。
四、實證分析與結果討論
(一)描述性統(tǒng)計與相關性分析
表3報告了各主要研究變量的描述性統(tǒng)計結果,投資者情緒(Sentiment)均值為-1.003,表明基于股吧文本信息提取的投資者情緒總體上比較悲觀;最小值為-1.550,最大值為1.739,標準差為0.234,說明投資者情緒的波動也比較大。定價效率的兩個度量指標中,股價同步性(SYNdiff) 和相關系數(shù)(ρ)均值分別為-1.802和-0.011,說明樣本股票的定價效率較高;標準差分別為1.610和0.223,說明定價效率的波動性較高。樣本期內換手率(Turnover)較高,均值為20.9%;股價收益率波動水平(Volatility)均值為0.023,標準差為0.010,說明樣本期內收益率較為穩(wěn)定。
表4報告了主要研究變量和部分控制變量的相關性分析結果。可以看出,投資者情緒(Sentiment)與股價同步性(SYNdiff)之間的相關系數(shù)為-0.090和-0.085,且在1%的顯著性水平上顯著負相關,說明了投資者情緒越高漲,越能提升股價信息含量,進而使股價同步性降低。投資者情緒(Sentiment)與相關系數(shù)指標(ρ)之間的相關系數(shù)為-0.027和-0.026,且在1%的水平上顯著,說明情緒越高漲則股價反應的滯后程度越低。這些結果初步表明,投資者情緒與股票定價效率存在正相關關系。造成這一現(xiàn)象的原因可能在于,一方面,股吧論壇中上市公司對于市場信息的披露促進了信息在投資者之間的流動,并且投資者之間的相互交流也加快了市場信息的傳播,有利于市場信息融入股價;另一方面,由于我國股票市場賣空限制的存在,投資者情緒更偏向樂觀,進而吸引更多的投資者進入市場交易,提升了流動性水平并提高了股票定價效率。后續(xù)我們通過面板數(shù)據(jù)回歸分析做進一步探討。
(二)基礎回歸結果
表5報告了投資者情緒(Sentiment)對股票定價效率影響效應的回歸結果,其中,列(1)和列(3)是考慮投資者情緒并加入控制變量后的回歸結果。可以發(fā)現(xiàn)投資者情緒對股價同步性和相關系數(shù)的回歸系數(shù)為-0.579和-0.075,且都在1%的顯著水平下顯著。列(2)和列(4)是進一步加入滯后一期投資者情緒(Sentimentt-1)后的回歸結果,對股價同步性和相關系數(shù)的回歸系數(shù)為-0.110和-0.039,分別在10%和1%的水平上顯著。同時,當期投資者情緒的系數(shù)稍微有些下降,但仍顯著負相關。表5結果進一步驗證了前述相關性分析結果,也即當期情緒、滯后一期情緒的高漲會提高股票定價效率,假設H1得到驗證。
控制變量方面,公司規(guī)模(Size)、賬面市值比(Bm)與股價同步性、相關系數(shù)成反比,說明規(guī)模越大、賬面市值比越高,股票定價效率越高;是否由四大會計師事務所審計(Big4)在各個回歸中均與股價同步性、相關系數(shù)成反比,說明審計水平的提升會有助于信息融入股價,提升定價效率;資產報酬率(Roa)與股價同步性、相關系數(shù)成反比,越高的資產回報率其定價效率越高;此外換手率(Turnover)、收益波動性(Volatility)都與定價效率變量呈現(xiàn)顯著的反比關系,說明高換手率、高收益波動性的股票,其流動性和收益變化對信息的反應更為敏感,股票定價效率更高。這些結論大部分與張延良等(2022年)的發(fā)現(xiàn)一致[30]。一個有意思的現(xiàn)象是,企業(yè)產權性質(Type)變量系數(shù)在回歸中均呈現(xiàn)顯著負向關系,說明國有控股上市公司其股票定價效率更高。這一現(xiàn)象背后的原因可能在于國有控股上市公司的治理結構更為完善,信息披露機制和渠道更為暢通,從而提升了信息傳遞效率和股價的信息含量。其他控制變量如機構投資者持股比例(Institution)、公司上市年限(Age)、資產負債率(Lev)、第一大股東持股比例(Top1)等,對股票定價效率沒有顯著影響。
(三)穩(wěn)健性檢驗—替換變量
本部分對解釋變量和被解釋變量進行替換以驗證回歸結果的穩(wěn)健性。使用公式(6)計算的股價同步性指標SYN代替SYNdiff,并利用CSMAR數(shù)據(jù)庫中社交媒體情緒指標(Sentiment2),計算如下:
Sentiment2i,t=ln[(1+post)/(1+negt)](12)
公式(12)中,post是當月積極的文本條數(shù),negt是當月消極的文本條數(shù),Sentiment2是我們構建的投資者情緒替代指標。表6報告了對解釋變量和被解釋變量進行重新替換后的穩(wěn)健性檢驗結果,列(1)是替換被解釋變量后投資者情緒對股價同步(SYN)的回歸結果??梢钥闯?,情緒對股價同步(SYN)的回歸系數(shù)為-0.297且在1%的顯著性水平下顯著,和前文實證結果一致。列(2)和列(3)是替換解釋變量后,投資者情緒(Sentiment2)對定價效率的回歸結果。可以看出投資者情緒回歸系數(shù)為-0.217,對相關系數(shù)(ρ)的回歸系數(shù)為-0.06,均在1%的顯著性水平下顯著。控制變量方面,除系數(shù)絕對值有大小變化差異外,在影響方向上和顯著性方面,與前文實證結果一致,證實了本文基礎結論的穩(wěn)健性。
(四)內生性探討—傾向得分匹配
為排除樣本選擇偏誤可能帶來的內生性問題,我們利用傾向得分匹配法(PSM),進一步來檢驗投資者情緒與股票定價效率間的關系。首先,按照投資者情緒值的大小排序,選取前50%作為實驗組、后50%作為對照組。在兩組樣本中按照選取的控制變量運用Logit回歸模型計算投資者情緒,控制變量包括賬面市值比(Bm)、資產收益率(Roa)、資產負債率(Lev)、公司規(guī)模(Size)。其次,基于Logit回歸模型估計系數(shù),計算樣本公司的傾向得分。最后,采用最鄰近匹配法以得分高低作為匹配標準進行1∶1匹配,再計算實驗組和控制組在Sentiment上的平均處理效應(ATT),其中Caliper設置為0.01且使用放回抽樣法進行分析。結果如表7所示,可以看出平均處理效應(ATT)均在1%的顯著性水平上為負,說明投資者情緒越樂觀則股票定價效率越高,PSM檢驗結果和前文基礎回歸結果一致。
(五)內生性探討—DID檢驗
盡管我們盡可能多地選擇了可能影響股價泡沫的控制變量,同時加入了自變量滯后項,但變量遺漏問題仍可能是造成內生性問題的主要來源,比如隨時間變化的影響因素仍然沒有被充分考慮到。進一步地,我們利用雙重差分模型(DID)通過組內差分和組間差分將隨時間變化和不變的擾動項剔除掉,更有效地排除潛在的內生性問題。我們的研究期恰好橫跨國內新冠疫情暴發(fā)時間點,將樣本股票分為低情緒組和高情緒組,以新冠疫情暴發(fā)時間為節(jié)點建立DID模型,觀察疫情暴發(fā)這一外生沖擊事件對兩組子樣本的股票定價效率是否存在顯著差異。我們設置虛擬變量sen和COVID-19,將投資者情緒按照樣本個股生成50%的分位數(shù),大于50%的分位數(shù)的取1為高情緒組,即sen=1;小于50%的分位數(shù)的取0為低情緒組,sen=0。虛擬變量COVID-19=1代表時間處于2019年12月8日及之后,新冠疫情暴發(fā);COVID-19=0表示處于2019年12月8日之前,沒有新冠疫情。
我們以2019年12月疫情暴發(fā)為節(jié)點做平衡趨勢檢驗,圖1中被解釋變量為股價同步性(SYNdiff),縱軸表示平均股價同步性;圖2被解釋變量為相關系數(shù)(ρ),縱軸表示平均相關系數(shù)。兩圖中垂直于橫軸的直線所對應時間為新冠疫情暴發(fā)時間點2019年12月8日,藍色虛線對應高情緒組,紅色實線對應低情緒組??梢园l(fā)現(xiàn),盡管疫情暴發(fā)前高情緒組平均股價同步性和平均相關系數(shù)均小于低情緒組,但二組有相同趨勢,而疫情暴發(fā)之后二者趨勢出現(xiàn)不同。
為了進一步檢驗平行趨勢,我們生成月份虛擬變量Month與情緒虛擬變量sen的交互項加入模型(13)進行回歸:
模型(13)中,m和n分別表示新冠疫情暴發(fā)前和后的期數(shù),其余變量與模型11相同。我們將疫情暴發(fā)當月作為基準組,比較疫情暴發(fā)前各月的交叉項系數(shù)δj,發(fā)現(xiàn)其顯著為0,進一步表明疫情暴發(fā)之前高、低情緒組之間的定價效率不存在顯著差異,這一結果與圖1和圖2可以相互印證。
我們用did表示sen和COVID-19交乘項,將COVID-19、did引入基準回歸模型中,表8報告了DID模型的檢驗結果??梢园l(fā)現(xiàn),引入這些變量后,投資者情緒對于股價同步性和相關系數(shù)的影響依然顯著為負。另外,COVID-19對股價同步性具有顯著的負向作用,新冠疫情的暴發(fā)反而抑制了股價同步性,提高了股票定價效率。
(六)安慰劑檢驗
我們繼續(xù)選擇安慰劑檢驗(Placebo-Test)來甄別股票定價效率是否受其他隨機變量的影響。具體方法為:首先,打亂樣本個股投資者情緒數(shù)據(jù),將投資者情緒數(shù)據(jù)隨機賦給樣本股票;其次,將隨機賦給樣本個股的投資者情緒(random_s2)分別對股票定價效率(股價同步性、相關系數(shù))進行回歸;最后,將上述步驟重復500次,統(tǒng)計結果中投資者情緒(random_s2)系數(shù)的p值并與基準回歸結果進行對比。
圖3和圖4分別報告了相應被解釋變量下投資者情緒(random_s2)回歸系數(shù)p值的核密度分布圖,其中圖3對應的被解釋變量為股價同步性,圖4的對應被解釋變量為相關系數(shù),橫軸表示當期虛擬投資者情緒的系數(shù),縱軸為對應系數(shù)的p值,水平虛線對應p值為0.1,垂直虛線為原基準回歸結果的系數(shù),左側系數(shù)為-0.579,右側系數(shù)為-0.075。可以看出,無論被解釋變量是股價同步性還是相關系數(shù),500次模擬所得虛擬投資者情緒的估計系數(shù)絕對值均遠小于對應基準回歸結果的系數(shù),并以0為中心呈對稱分布。大部分模擬情緒所得系數(shù)的對應p值大于0.1,并不顯著。可以認為,基準回歸結果并非偶然因素引起,投資者情緒對股票定價效率的影響作用比較穩(wěn)健。
五、進一步研究:中介機制與調節(jié)效應
(一)信息效應中介機制檢驗
為了檢驗創(chuàng)業(yè)板上市企業(yè)良好的ESG表現(xiàn)是否發(fā)揮“信息效應”,降低了公司的信息不對稱程度進而提高了股票定價效率,借鑒武鵬等(2023年)的研究方法[31],選取流動性比率(LR)、非流動性比率(IRR)和收益率反轉指標(GAM)的第一主成分作為“信息不對稱”(Asy)的代理變量。信息不對稱(Asy)數(shù)值越大,說明公司向市場傳遞的特質信息越少,信息不對稱程度越嚴重。我們進行了信息中介機制的檢驗,表9報告了檢驗結果。
列(1)—列(2)是以信息不對稱(Asy)為被解釋變量,投資者情緒及其滯后一期作為解釋變量,逐步納入回歸的結果。可以發(fā)現(xiàn),投資者情緒變量及其滯后一期變量的回歸系數(shù)均在5%的顯著性水平下顯著為負,說明投資者情緒的樂觀有助于緩解信息不對稱程度。將解釋變量和中介變量Asy同時納入回歸模型,列(3)—列(4)、列(5)—列(6)分別是以SYNdiff和ρ為被解釋變量的回歸結果??梢园l(fā)現(xiàn),情緒及其滯后一期、信息不對稱指標分別顯著為負和正,表明樂觀的投資者情緒能夠通過降低信息不對稱程度,進而提高股票市場定價效率,假設H2得到驗證。
(二)調節(jié)效應:賣空限制的影響
市場賣空機制通過允許投資者的買空和賣空行為,促使更多的信息融入股價。如果賣空受限,投資者即使在看空股票時也無法通過賣空操作來獲利,悲觀情緒無法得到充分的表達和釋放,進而影響股價的信息含量。借鑒Liu 等(2015年)的觀點[32],利用機構持股比例來衡量賣空限制程度。因為市場看空者要實施賣空操作,首先要從券商手中借入股票。機構投資者通常作為出借股票的一方,其持有股票的數(shù)量或者比例就決定了市場上賣空限制程度的強弱。這樣可供借出的股票數(shù)量就可以間接衡量賣空限制的程度,如果機構持股數(shù)量越少,則表示賣空限制程度越強。首先,我們對個股每季末的機構持股數(shù)量取均值,再進行排序,之后按照50%分位數(shù)將樣本股票分為機構持股數(shù)量高、低兩組。機構持股數(shù)量最低組作為對照組,對投資者情緒對股票定價效率的影響效應進行分組回歸。
表10報告了回歸結果,其中列(1)和列(2)是投資者情緒對股價同步性的回歸結果,列(1)是機構持股數(shù)量低的組,也即賣空限制高的組。投資者情緒的回歸系數(shù)是-0.379,且在1%的顯著性水平下顯著。列(2)是機構持股數(shù)量高的組,也即賣空限制低的組。投資者情緒的回歸系數(shù)是-0.705,且在1%的顯著性水平下顯著。列(3)和列(4)是投資者情緒對相關系數(shù)的回歸結果,列(3)是機構持股數(shù)量低的組。投資者情緒對相關系數(shù)的回歸系數(shù)是-0.067,且在1%的顯著性水平下顯著。列(4)是機構持股數(shù)量高的組,投資者情緒的回歸系數(shù)是-0.097,且在1%的顯著性水平下顯著。很明顯,無論對于股價同步性(SYNdiff)還是相關系數(shù)(ρ)來說,隨著賣空限制程度的降低,Sentiment的系數(shù)絕對值都呈現(xiàn)逐漸增大的規(guī)律且始終保持顯著。這意味著賣空限制越低,投資者情緒對股票定價效率的影響越明顯,假設H3得到驗證。
(三)調節(jié)效應:信息環(huán)境的影響
上市公司所處信息環(huán)境會影響投資者獲取以及處理信息的質量,進而影響股價對信息的反應程度。參考孟慶斌和黃清華(2018年)的度量方法[33],以分析師關注度(Analyst),即在t年度分析師跟蹤樣本股票i的總數(shù)量的自然對數(shù)作為信息環(huán)境的度量指標,對樣本進行分組回歸。表11中列(1)和列(2)是投資者情緒對股價同步性影響效應的回歸結果。可以發(fā)現(xiàn),低分析師關注度組中,投資者情緒對股價同步性的回歸系數(shù)是-0.752,在1%顯著性水平下顯著;高分析師關注度組中,投資者情緒對股價同步性的回歸系數(shù)是-0.344,在5%顯著性水平下顯著。列(3)和列(4)是投資者情緒對相關系數(shù)的回歸結果。低分析師關注度組中,投資者情緒對相關系數(shù)的回歸系數(shù)是-0.074;高分析師關注度組中,投資者情緒對相關系數(shù)的回歸系數(shù)是-0.073,兩者均在1%顯著性水平下顯著。無論對于同步性還是相關系數(shù)來說,隨著上市公司分析師關注度的提升,解釋變量Sentiment的系數(shù)絕對值都逐漸減小且始終保持顯著。這意味著分析師跟蹤人數(shù)越少,投資者情緒對股票定價效率的影響越明顯,也即公司信息環(huán)境的改善可以緩解情緒對股票定價效率的影響效應,假設H4得到驗證。
六、結論與啟示
本文以滬深300指數(shù)成分股作為研究樣本,利用Python文本挖掘技術抓取東方財富網樣本股股吧中2019年1月—2022年2月實時發(fā)帖文本,使用樸素貝葉斯方法對文本中隱含的情緒傾向進行分析并構建了投資者情緒指標,利用固定效應模型分析了投資者情緒對于股票定價效率的影響。進一步地,分析了這一影響效應在不同賣空限制程度和信息環(huán)境條件下的異質性表現(xiàn)。實證發(fā)現(xiàn),首先,基于股吧論壇發(fā)帖構建的投資者情緒與股票定價效率之間存在顯著正相關關系,也即越樂觀的投資者情緒越能帶動股票定價效率的提升。其次,中介機制分析表明,這種影響效應是通過樂觀情緒降低信息不對稱程度,進而提升股價信息含量和定價效率這一路徑產生作用。在一定程度上說明,投資者情緒的高漲提高了股價信息含量,加快了市場信息融入股價的速度。再次,隨著賣空限制的降低,投資者情緒對股票定價效率的影響會越明顯,也即股票定價效率對投資者情緒的敏感度會隨著賣空限制的降低而增強,而公司信息環(huán)境的改善可以降低投資者情緒對股票定價效率的影響效應。在經過一系列穩(wěn)健性檢驗后,上述結論仍然成立。這些結論為透視股票市場中的投資者情緒如何影響市場信息效率和市場運行,以及加強網絡媒體信息傳播監(jiān)管的必要性提供了實證證據(jù)。
在移動互聯(lián)時代,越來越多的個體投資者會選擇通過網絡渠道獲取信息、交流觀點。這種情勢的變化也為通過網絡信息監(jiān)督管理來提高股票市場運行效率提供了新思路?;诒疚慕Y論,對于上市公司來說,要充分重視對網絡信息渠道的檢測,同時切實履行信息披露責任,利于更多公司特質信息融入股價,提高股價的信息效率。對于監(jiān)管部門來說,要加強對互聯(lián)網平臺的監(jiān)管,保證信息的真實性以及可靠性。同時,應充分健全市場管理制度框架,比如由于賣空限制程度會影響股票定價效率對于投資者情緒的敏感程度,監(jiān)管部門應結合我國實際情況逐步完善融資融券制度。對于網絡平臺來說,其高質量發(fā)展不僅需要監(jiān)管部門的監(jiān)督和制約,還要實現(xiàn)自我監(jiān)督和管理,切實履行自己的責任,做高質量信息傳遞的渠道。網絡平臺可以對信息進行過濾甄別,對發(fā)布人身份與言論進行分析,為投資者提供技術支持,禁止互聯(lián)網上不合理的信息散布與擴散。
[參考文獻]
[1] 楊菁菁、胡錦、張朕東:《投資者情緒與資本市場信息效率——基于股價信息含量的視角》,《河北工業(yè)大學學報(社會科學版)》2023年第3期,第1—13+49頁。
[2] 鄭建東、呂曉亮、呂斌等:《社交媒體平臺信息交互與資本市場定價效率——基于股吧論壇億級大數(shù)據(jù)的證據(jù)》,《數(shù)量經濟技術經濟研究》2022年第11期,第91—112頁。
[3] Behrendt S, Schmidt A: “The Twitter Myth Revisited: Intraday Investor Sentiment, Twitter Activity, and Individual-Level Stock Return Volatility”, Journal of Banking and Finance, Vol.96, No.8,2018, pp.355-367.
[4] Da Z, Joseph E, Gao P: “The Sum of All FEARS Investor Sentiment and Asset Prices”,The Review of Financial Studies, Vol.28, No.1,2015, pp.1-32.
[5] Gao Z, Ren H, Zhang B: “Googling Investor Sentiment around the World”, Journal of Financial and Quantitative Analysis, Vol.55, No.2,2020, pp. 549-580.
[6] 俞慶進、張兵:《投資者有限關注與股票收益——以百度指數(shù)作為關注度的一項實證研究》,《金融研究》 2012年第8期,第152—165頁。
[7] Tsukioka Y, Yanagi J, Takada T: “Investor Sentiment Extracted from Internet Stock Message Boards and IPO Puzzles”, International Review of Economics and Finance, Vol.56, No.3, 2018, pp.205-217.
[8] 黃創(chuàng)霞、溫石剛、楊鑫等:《個體投資者情緒與股票價格行為的互動關系研究》,《中國管理科學》 2020年第3期,第191—200頁。
[9] 楊曉蘭、沈翰彬、祝宇:《本地偏好、投資者情緒與股票收益率:來自網絡論壇的經驗證據(jù)》,《金融研究》2016年第12期,第143—158頁。
[10] Li X, Qiao P, Zhao L: “CEO Mmedia Exposure, Political Connection and Chinese Firms Stock Price Synchronicity”, International Review of Economics and Finance, Vol.63, No.C,2019, pp.61-75.
[11][26] Antweiler W, Frank M Z: “Is All That Talk Just Noise? The Information Content of Internet Stock Message Boards”, The Journal of Finance, Vol.59, No.3,2004, pp.1259-1294.
[12] 尹海員、寇文娟:《基于樸素貝葉斯法的投資者情緒度量及其對股票特質風險的影響 》,《中國管理科學》2021年,DOI:10.16381/j.cnki.issn1003-207x.2021.0028。
[13][33] 孟慶斌、黃清華:《賣空機制是否降低了股價高估?——基于投資者異質信念的視角》,《管理科學學報》 2018年第4期,第43—66頁。
[14] 連立帥、朱松、陳關亭:《資本市場開放、非財務信息定價與企業(yè)投資——基于滬深港通交易制度的經驗證據(jù)》,《管理世界》 2019年第8期,第136—154頁。
[15] 田高良、司毅、秦嶺等:《網絡輿情及其應對與上市公司的信息效率》,《系統(tǒng)工程理論與實踐》2018年第1期,第46—66頁。
[16] Zhou D, Zhao Y, Lin P, Li B: “Can Microblogging Information Disclosure Reduce Stock Price Synchronicity? Evidence from China”, Australian Journal of Management, Vol.44, No.2,2019, pp.282-305.
[17] He Q, Fang C: “Regulatory Sanctions and Stock Pricing Efficiency: Evidence from the Chinese Stock Market”,Pacific-Basin Finance Journal, Vol.58, No.8,2015, pp.101241-101241.
[18] 張大永、劉倩、姬強:《股票分析師的羊群行為對公司股價同步性的影響分析》,《中國管理科學》2021年第5期,第55—64頁。
[19] Steven C, Lam B M, Li L Z, Jahidur R M: “Information Environment and Stock Price Synchronicity: Evidence from Aauditor Characteristics”, International Journal of Auditing, Vol.25, No.2,2021, pp.332-350.
[20] Dang T L, Dang M, Hoang L, Nguyen L: “Media Coverage and Stock Price Synchronicity”,International Review of Financial Analysis, Vol.67, No.C,2019, pp.1014-1030.
[21] Das S R, Chen M Y: “Yahoo! for Amazon: Sentiment Extraction from Small Talk on the Web”,Management Science, Vol.53, No.9,2007, pp.1375-1388.
[22] Price S M, Doran J S,Peterson D R, Bliss B A:“Earnings Conference Calls and Stock Returns: The Incremental Informativeness of Textual Tone”, Journal of Banking and Finance, Vol.36, No.4,2012, pp.992-1011.
[23] Jiang X, Xu N, Yuan Q: “Mutual-Fund-Affiliated Analysts and Stock Price Synchronicity: Evidence from China”,Journal of Accounting, Auditing & Finance, Vol.33, No.3,2018, pp.435-460.
[24] 潛力、龔之晨:《網絡溝通對股票市場的影響——基于投資者有限關注視角的研究》,《金融論壇》2021年第2期,第47—58頁。
[25] 孫鯤鵬、肖星:《互聯(lián)網社交媒體、投資者之間交流與資本市場定價效率》,《投資研究》2018年第4期,第140—160頁。
[27] Morck R, Yeung B, Yu W: “The Information Content of Stock Markets: Why Do Emerging Markets Have Synchronous Stock Price Movements?”, Journal of Financial Economics, Vol.58, No.1,2000, pp.215-260.
[28] Bris A, Goetzmann W N, Zhu N: “Efficiency and the Bear: Short Sales and Markets around the World”, The Journal of Finance, Vol.62, No.3,2007, pp.1029-1079.
[29] 郭照蕊、張?zhí)焓妫骸陡哞F開通對資本市場定價效率的影響研究》,《管理學報》2021年第4期,第614—623頁。
[30] 張延良、崔海濤,李琪等:《媒體關注對股票定價效率影響研究》,《投資研究》2022年第9期,第143—158頁。
[31] 武鵬、楊科、蔣峻松等:《企業(yè)ESG表現(xiàn)會影響盈余價值相關性嗎?》,《財經研究》2023年第6期,第137—152+169頁。
[32] Liu S: “Investor Sentiment and Stock Market Liquidity”, Journal of Behavioral Finance, Vol.16, No.1,2015, pp.51-67.
Does Investor Sentiment Affect the Efficiency of Stock Pricing?
——Textual Evidence from the Stock Community
Abstract: The efficiency of stock pricing is a crucial indicator for measuring the effectiveness of the stock market. Higher pricing efficiency facilitates the rational allocation of capital market resources and better serves the high-quality development of the real economy. This study explores the text postings within the investor community of Dongfang Fortune, analyzes the sentiment of the text using machine learning methods, constructs investor sentiment indicators, and examines their impact on the efficiency of stock pricing. The findings indicate a significant positive correlation between investor sentiment and stock pricing efficiency, suggesting that more optimistic investor sentiment drives an increase in stock pricing efficiency. This influence operates through a mechanism in which optimism reduces the degree of information asymmetry, thereby enhancing the information content of stock prices and improving pricing efficiency. Furthermore, with the loosening of short-selling restrictions, the sensitivity of stock pricing efficiency to sentiment will increase, and a conducive information environment will reduce the impact of sentiment on stock pricing efficiency. The research conclusion provides evidence for observing the operational efficiency of Chinas stock market from an individual investor sentiment perspective and the necessity of information regulation on online media.
Key words:investor sentiment; stock pricing efficiency; data mining; machine learning