陸 瑤, 張葉青, 黎 波, 趙浩宇
(清華大學(xué)經(jīng)濟管理學(xué)院, 北京 100084)
“高管特征與公司績效的關(guān)聯(lián)”一直以來是公司治理領(lǐng)域的重點研究問題.以往研究一方面探究了高管是否在公司決策中擔任了至關(guān)重要的角色, 另一方面挖掘出了可能會影響公司績效的一系列高管的個人特征[1,2].那么公司高管的個人特征能夠幫助預(yù)測公司業(yè)績嗎?在這些可能預(yù)測公司績效的高管特征中, 哪些特征更為關(guān)鍵呢?它們的預(yù)測機制又是怎樣的?以往研究主要圍繞單一特征與公司業(yè)績之間的因果關(guān)系推斷進行研究, 而缺乏從預(yù)測能力出發(fā)的系統(tǒng)定量的結(jié)論.本文試圖通過運用機器學(xué)習(xí)的方法來彌補這一空白.
目前, 大部分公司金融實證研究的目的是推斷變量之間的因果關(guān)系.因果解釋性模型從假設(shè)性理論出發(fā), 利用統(tǒng)計模型來驗證理論中可觀測變量之間的因果關(guān)系.這一類建模過程被稱為解釋性建模 (explanatory modeling), 其中最常用的模型是線性回歸模型和結(jié)構(gòu)方程模型.與解釋性建模不同, 預(yù)測性建模 (predictive modeling) 的目的是準確預(yù)測未來的觀測值.
預(yù)測性分析雖然較少出現(xiàn)在公司金融 (特別是公司治理) 的實證研究中, 但在學(xué)術(shù)研究中同樣至關(guān)重要.首先, 預(yù)測性模型沒有假設(shè)變量之間因果關(guān)系, 而大部分擬合效果好的模型也沒有假設(shè)變量之間特定的函數(shù)形式 (比如線性關(guān)系、U型關(guān)系、指數(shù)關(guān)系等); 相對地, 解釋性模型預(yù)先對因果關(guān)系提出假設(shè), 然后利用數(shù)據(jù)來進行檢驗.因此, 預(yù)測性模型能夠發(fā)掘出數(shù)據(jù)中更為復(fù)雜的規(guī)律, 有助于提出并驗證新的理論來解釋數(shù)據(jù)中存在的規(guī)律, 從而推動解釋性模型和理論的進步.其次, 預(yù)測效果提供了一個評估解釋性模型的新角度[3], 衡量每個變量對預(yù)測表現(xiàn)的貢獻度能刻畫該變量的重要程度, 進而檢驗以往理論的可靠性.第三, 預(yù)測性模型幫助研究者比較不同的解釋性模型.最后, 預(yù)測能力的強弱程度能夠反映理論解釋現(xiàn)象的能力的強弱程度[4].如果某一個解釋性模型的預(yù)測效果特別差, 則說明其所依托的理論不足以解釋現(xiàn)象, 該理論仍存在較大的發(fā)展空間.但值得一提的是, 雖然預(yù)測性模型和解釋性模型分別從“預(yù)測”和“理解”的角度出發(fā), 但兩者之間并非是完全對立的.本文預(yù)測性模型的設(shè)計基于一系列相關(guān)經(jīng)濟金融學(xué)文獻, 而非單純從數(shù)據(jù)中憑空構(gòu)建.因此, 本文與以往理論和實證研究的關(guān)系密不可分、相輔相成.
絕大多數(shù)對于高管特征與公司業(yè)績的研究僅僅關(guān)注了兩者之間的因果關(guān)聯(lián), 而忽視了高管特征對公司業(yè)績的預(yù)測能力.解釋性模型和預(yù)測性模型從概念和優(yōu)化目標上存在很大差異[5,6](1)從概念方面, 解釋性模型基于理論中變量的因果關(guān)系, 而預(yù)測性模型則基于可測變量之間的關(guān)聯(lián); 從優(yōu)化方法的角度, 解釋性建模的目標是最小化模型偏差以準確地刻畫潛在的理論模型, 而預(yù)測性建模的目標是同時最小化模型偏差和樣本方差.模型偏差和樣本方差的最小化之間存在一定的權(quán)衡關(guān)系, 因此預(yù)測準確性的提高需要犧牲一定的理論解釋性., 對公司業(yè)績有解釋力的高管指標并不一定能準確預(yù)測公司業(yè)績, 因此無法從因果推斷模型的估計結(jié)果中得出預(yù)測效果的結(jié)論.本文的研究目標是通過直接探究高管特征對公司業(yè)績的預(yù)測效果來彌補這一學(xué)術(shù)空白.
那么, 為什么要采用機器學(xué)習(xí)的方法來解答這一問題呢?首先, 改革開放以來, 我國經(jīng)歷了從中央高度集中的計劃經(jīng)濟體制到中國特色社會主義市場經(jīng)濟的轉(zhuǎn)軌階段.從公司的股權(quán)結(jié)構(gòu)來看, 國有企業(yè)高管的選拔和任命往往出于政治性因素的考慮, 而國企高管面臨的非市場化的晉升考核體制也使得他們在任職期間的目標不是企業(yè)的經(jīng)營業(yè)績, 而是政治訴求[7-8].在轉(zhuǎn)型期經(jīng)濟環(huán)境下, 國有企業(yè)的改革不斷推進, 中國特色社會主義市場經(jīng)濟體制逐步建立, 經(jīng)濟環(huán)境出現(xiàn)明顯波動.經(jīng)濟環(huán)境的波動可能導(dǎo)致高管特征與公司績效之間的關(guān)聯(lián)不是一成不變的, 而是隨經(jīng)濟環(huán)境波動而動態(tài)變化的.以往研究最常使用線性擬合模型, 該模型假定變量之間的相關(guān)性是恒定的, 并在此基礎(chǔ)上進行模型估計, 因此難以在經(jīng)濟環(huán)境波動的情形下得到可靠準確的預(yù)測模型.第二, 已有文獻發(fā)現(xiàn)高管的個人特征與公司績效之間的非線性關(guān)系以及這些特征之間的交互作用(2)比如Adams等[9]發(fā)現(xiàn)管理層的特征與組織變量的相互作用對公司表現(xiàn)有顯著影響., 這些研究意味著傳統(tǒng)的簡單線性擬合模型難以清晰、準確地厘清變量之間的復(fù)雜關(guān)系.基于此, 為了全面挖掘高管特征與公司績效之間關(guān)聯(lián), 本文引入處理復(fù)雜預(yù)測問題的機器學(xué)習(xí)模型, 試圖針對這一公司治理的傳統(tǒng)問題提供一個更為全面的解答.
本文以2008年~2016年的上市公司為樣本, 實證評估了高管特征對公司績效的預(yù)測能力, 進一步挖掘了對公司業(yè)績預(yù)測能力較強的高管的個人特征, 并刻畫了它們的預(yù)測機制.本文采用的機器學(xué)習(xí)方法為“Boosting回歸樹”.該方法的基本思想是: 從初始訓(xùn)練集中得到一個基回歸樹, 然后在當前預(yù)測誤差的基礎(chǔ)上訓(xùn)練新的基回歸樹, 每次迭代都向損失函數(shù)負梯度的方向移動, 從而達到損失函數(shù)隨著迭代次數(shù)增加而逐漸減小的效果, 最后加權(quán)結(jié)合多個基回歸樹得到回歸函數(shù).進一步地,基于訓(xùn)練模型分析了各個高管特征在預(yù)測公司業(yè)績中的重要程度和預(yù)測效果.研究結(jié)果發(fā)現(xiàn): 整體而言, 在我國公司CEO和董事長的特征對公司業(yè)績的預(yù)測能力較弱.而在眾多高管特征之中, 持股比例和年齡對公司業(yè)績的預(yù)測能力較強, 且它們與公司業(yè)績之間的關(guān)系呈現(xiàn)出明顯的非線性的特點.在更換了擬合的滾動窗口期、公司績效的衡量指標、Boosting模型的參數(shù)、其他機器學(xué)習(xí)算法后, 上述結(jié)果仍然穩(wěn)健.
與現(xiàn)有文獻相比, 本文的貢獻如下: 第一, 首次應(yīng)用機器學(xué)習(xí)方法來研究中國的公司治理問題, 評估了公司高管特征整體對于公司績效的預(yù)測能力, 本文的研究豐富了“高管特征與公司績效的關(guān)聯(lián)”這一領(lǐng)域的文獻.第二,采用前沿的Boosting回歸樹的方法, 規(guī)避了傳統(tǒng)線性模型的缺陷, 更好地分析了變量之間的非線性和交互關(guān)系.第三,探究了不同高管特征對于預(yù)測公司績效的重要程度, 并分析了相對重要的高管特征對公司績效的預(yù)測機制, 這一系列結(jié)論對選聘公司高管具有非常重要的啟示意義.
在現(xiàn)代公司制度下, 高管是公司的核心決策者, 因此“高管特征與公司業(yè)績的關(guān)聯(lián)”是經(jīng)濟、金融和管理學(xué)中的經(jīng)典研究問題.早期的實證研究發(fā)現(xiàn), 高管的個人特征能夠很大程度上解釋公司的資本結(jié)構(gòu)、投資決策和組織架構(gòu)[2,10].后續(xù)的一系列研究從高管特征的不同角度出發(fā), 驗證了多維度的高管特征對公司業(yè)績的影響.這些高管特征的維度可以被歸納為以下五類: 先天特質(zhì)、人生經(jīng)歷、個性特征、能力水平以及管理風格.同時,公司組織結(jié)構(gòu)也可能影響高管作用.
先天特質(zhì)方面, 已有文獻從高管的性別、年齡、容貌等角度研究.Kaplan和Sorensen[11]的研究發(fā)現(xiàn)男、女性高管在管理風格上沒有顯著差異.高管年齡的影響主要體現(xiàn)在年齡較大的高管的管理風格更加保守[2,12].
高管的人生經(jīng)歷一方面是高管個人特征的反映, 另一方面也可能會通過影響他們的風險偏好、專業(yè)技能、對行業(yè)發(fā)展的預(yù)期來影響公司決策的制定.這部分研究的切入點主要包括幼年生活經(jīng)歷[13,14]、家庭生活[15,16]、職業(yè)經(jīng)歷[2, 12,13,17]和教育經(jīng)歷[2,12]等.
高管的性格特點也會影響公司決策和公司績效.比如過度自信的高管可能會高估自己的能力和公司的收益, 從而制定更激進的投資和財務(wù)決策, 特別是公司的研發(fā)創(chuàng)新投入, 進而影響公司績效[18-20].此外, 高管是否樂于尋求刺激[21]和他們的風險態(tài)度[22-24]也會影響他們的管理風格.
近年來, 針對高管個人能力的研究也非常豐富, 受到研究者關(guān)注的高管個人能力主要包括基本能力、溝通交流能力和執(zhí)行能力等.個人能力本身是難以度量的, 因此越來越多的研究通過非結(jié)構(gòu)化數(shù)據(jù)和機器學(xué)習(xí)技術(shù)來構(gòu)建高管的多維能力指標, 并分析這些指標與公司績效之間的關(guān)聯(lián)[11,25,26].
與上述維度相比, 高管的管理風格是內(nèi)生性更強的指標.一方面, 管理風格受到高管個人經(jīng)歷、性格、專業(yè)水平等特質(zhì)的影響; 另一方面, 管理風格本身難以觀測和度量.比較典型的研究是Bandiera等[27]利用高管的日程記錄和非監(jiān)督機器學(xué)習(xí)算法, 刻畫了“領(lǐng)導(dǎo)型”和“管理型”兩種管理風格, 并發(fā)現(xiàn)領(lǐng)導(dǎo)型高管所在的公司的績效更佳.
此外, 公司的組織結(jié)構(gòu)也是影響高管作用的重要因素.例如, 管理層的薪酬制度和高管持股情況通過影響高管工作的努力程度和公司治理水平來影響公司績效[24,28,29].創(chuàng)始人高管以及家族企業(yè)中的高管對公司績效的影響也有所不同, 比如創(chuàng)始人高管會有更多的研發(fā)投入、資本支出和兼并收購活動[30,31].Khanna等[32]發(fā)現(xiàn)高管在企業(yè)內(nèi)部的裙帶關(guān)系會影響上市公司違規(guī)犯罪的概率.
關(guān)于中國上市公司高管與公司業(yè)績之間關(guān)聯(lián)的研究也層出不窮, 但限于數(shù)據(jù)的可得性, 國內(nèi)的研究大多立足于一些可觀測的高管特征指標, 并且更多地考慮了中國獨特的公司體制和經(jīng)濟環(huán)境.具體而言, 中國上市公司高管特征的分析大多圍繞高管的職業(yè)經(jīng)歷展開, 比如有政府任職經(jīng)歷的高管會更多地參與非生產(chǎn)性活動, 從而降低資源配置效率, 損害公司業(yè)績[33], 但是民營公司高管的政府背景對公司價值沒有顯著影響[34].高管的學(xué)術(shù)經(jīng)歷能幫助降低公司的債務(wù)融資成本[35], 但人大代表或政協(xié)委員的經(jīng)歷會提高發(fā)債成本[36].程新生和趙旸發(fā)現(xiàn)權(quán)威專業(yè)董事能夠促進企業(yè)創(chuàng)新活躍度[37].此外, 徐莉萍等[38]從個人家庭生活經(jīng)歷的角度入手, 發(fā)現(xiàn)高管離婚后公司盈利能力和市值水平都有所下降.風險投資和創(chuàng)始人持股會對公司治理效果產(chǎn)生影響[39].此外, CEO與董事之間的關(guān)聯(lián)關(guān)系也受到學(xué)者的關(guān)注, 比如CEO對董事會的影響力的提高使得CEO的違規(guī)傾向增加[40], CEO與董事之間存在“老鄉(xiāng)”關(guān)系會提高公司違規(guī)的可能性和公司的財務(wù)風險[41,42].而不同類型的董事 (咨詢董事或監(jiān)督董事) 與CEO的互動關(guān)系也有所差異[43].
從上述研究可知, 以往關(guān)于高管特征的研究主要圍繞某一類個人特質(zhì), 探討其對公司決策及業(yè)績的影響, 缺少全面比較公司高管特征相對重要性的研究.此外, 我國特有的制度和文化環(huán)境也使得國內(nèi)的高管研究難以直接借鑒西方的研究結(jié)論, 需要更加綜合地考慮高管特征對公司業(yè)績的影響.這為本文的研究提供了難得的契機.在已有文獻的基礎(chǔ)上, 本文結(jié)合了各角度的高管特征來探討哪些特征與公司業(yè)績有更為顯著的關(guān)聯(lián).
機器學(xué)習(xí)作為一種新興的統(tǒng)計工具, 越來越多地受到研究者的關(guān)注.目前, 已有研究從兩個角度嘗試將機器學(xué)習(xí)應(yīng)用到公司金融的研究領(lǐng)域: 無監(jiān)督學(xué)習(xí) (unsupervised learning) 和有監(jiān)督學(xué)習(xí) (supervised learning).
在無監(jiān)督學(xué)習(xí)中, 訓(xùn)練樣本并不對應(yīng)標記信息, 因此它的目標是通過訓(xùn)練總結(jié)、刻畫出多維數(shù)據(jù)的內(nèi)在關(guān)聯(lián), 進一步將高維甚至非結(jié)構(gòu)化的變量轉(zhuǎn)化為低維的、可解釋性強的變量.這一方法能夠從復(fù)雜的數(shù)據(jù)集中歸納、生成本身難以觀測的變量, 從而幫助解決公司金融研究中常面臨的關(guān)鍵變量難以精確度量的問題.典型的研究包括Bandiera等[27]利用無監(jiān)督學(xué)習(xí)中的潛在狄利克雷配置方法來分析CEO日?;顒佑涗浀臄?shù)據(jù), 刻畫出了“領(lǐng)導(dǎo)型”和“管理型”兩種CEO的行為特征, 并進一步發(fā)現(xiàn)“領(lǐng)導(dǎo)型”CEO與好的公司業(yè)績更相關(guān).Li等[44]采用單詞植入模型, 構(gòu)建了五個公司文化價值的指標, 并研究了其對公司行為決策的影響.總體而言, 無監(jiān)督學(xué)習(xí)有助于基于大數(shù)據(jù)來構(gòu)建難以直接觀測和衡量的指標, 大大拓展了公司金融中可研究的領(lǐng)域.
有監(jiān)督學(xué)習(xí)主要解決從特征變量(x)到結(jié)果變量(y)的預(yù)測問題.與傳統(tǒng)的線性回歸模型相比, 機器學(xué)習(xí)模型能夠應(yīng)對變量之間更加復(fù)雜的非線性和交互關(guān)系, 在樣本外達到更好的擬合效果[45].近年來, 有監(jiān)督學(xué)習(xí)已經(jīng)在資產(chǎn)定價領(lǐng)域備受關(guān)注[46-48], 但在公司金融領(lǐng)域的應(yīng)用較少.只有Gow等[49]基于CEO個性特征來預(yù)測公司樣本外的特征, 包括融資決策、投資決策以及經(jīng)營表現(xiàn).簡言之, 有監(jiān)督學(xué)習(xí)提高了傳統(tǒng)方法的預(yù)測精度, 在公司金融領(lǐng)域的應(yīng)用仍有廣大的探索空間.
本文選取的樣本為2008年 ~ 2016年所有的中國A股上市公司, 研究對象為上市公司的最高管理層——CEO和董事長.數(shù)據(jù)來源為國泰安經(jīng)濟金融研究數(shù)據(jù)庫 (CSMAR) 和銳思數(shù)據(jù)庫 (RESSET) .其中CEO和董事長的個人特征數(shù)據(jù)來自CSMAR從2008年起開始數(shù)據(jù)收錄的“上市公司人物特征”子數(shù)據(jù)庫.剔除了CEO特征與董事長特征存在缺失的樣本點, 同時保證了CEO和董事長個人特征數(shù)據(jù)的完整, 最終保留樣本18 170個, 平均占各年度全部上市公司的85.06%.表1報告了樣本分布情況.
表1 樣本分布
本文從盈利能力和價值這兩個角度對目標變量——公司績效進行衡量.公司的盈利能力對應(yīng)公司的財務(wù)績效, 公司的價值對應(yīng)公司的市場績效.具體而言, 本文采用行業(yè)中值調(diào)整后的資產(chǎn)收益率(adEBITDAper)作為財務(wù)績效指標, 采用行業(yè)中值調(diào)整后的托賓Q值(adTobinQ)作為市場績效指標.其中資產(chǎn)收益率定義為息稅折舊攤銷前利潤除以期末總資產(chǎn); 托賓Q值的定義為公司總市值除以總資產(chǎn).考慮到公司業(yè)績受行業(yè)因素和宏觀經(jīng)濟因素影響, 在實際分析過程中, 本文基于行業(yè)中值對這兩個公司績效指標進行了調(diào)整, 即實際績效指標減去公司所屬行業(yè)所有公司當年該績效指標的中位值.
CEO和董事長的多維度個人特征是本文的核心變量.本文結(jié)合文獻和中國A股上市公司數(shù)據(jù)可得性兩個方面來選取相關(guān)變量.在文獻綜述部分, 將高管特征的維度歸納為先天特質(zhì)、人生經(jīng)歷、個性特征、能力水平、管理風格, 以及公司的組織結(jié)構(gòu).其中, 先天特質(zhì)包括性別、年齡和容貌等高管與生俱來的種種特征, 而在這些特征當中, 能夠被客觀測度并可得的變量包括性別和年齡; 人生經(jīng)歷和能力水平可以從高管的職業(yè)經(jīng)歷以及教育經(jīng)歷來切入, 本文從生產(chǎn)經(jīng)營、市場管理、財務(wù)法律、金融領(lǐng)域的職業(yè)經(jīng)驗來衡量高管在各個領(lǐng)域的專業(yè)水平, 同時海外經(jīng)歷以及研究經(jīng)歷也是本文關(guān)注的指標.此外, 考慮到國有企業(yè)在中國經(jīng)濟中發(fā)揮的影響, 本文認為高管的政府工作經(jīng)歷也可能是預(yù)測公司績效的重要指標.組織結(jié)構(gòu)方面,采用高管持股和兼職情況來對公司績效進行預(yù)測.而由于個性和管理風格方面的特征難以觀測和準確度量,暫時未將其納入考慮, 但這會是下一步的重要研究方向.
具體而言, 本文選取的高管特征包括年齡、性別、話語權(quán)、年末持股比例、公司外兼職、職能經(jīng)驗、海外經(jīng)驗、學(xué)術(shù)經(jīng)驗、金融工作背景和政府工作背景.其中, 話語權(quán)由CEO和董事長是否兩權(quán)分離來衡量; 職能經(jīng)驗涵蓋三個方面, 第一是生產(chǎn)、技術(shù)和設(shè)計崗位經(jīng)驗, 第二是市場、人力、管理崗位經(jīng)驗, 第三是財務(wù)、法律職能崗位經(jīng)驗, 這三方面職能經(jīng)驗描述了高管主要的職場經(jīng)驗和能力; 海外經(jīng)驗反映該CEO或董事長是否有海外工作或求學(xué)經(jīng)歷; 學(xué)術(shù)經(jīng)驗反映該CEO或董事長是否有學(xué)術(shù)研究工作經(jīng)歷; 金融背景反映該CEO或董事長是否曾任職于金融機構(gòu)(3)此處統(tǒng)計中的金融機構(gòu)包括監(jiān)管部門、政策性銀行、商業(yè)銀行、保險公司、證券公司、基金管理公司、證券登記結(jié)算公司、期貨公司、投資銀行、信托公司、投資管理公司、交易所等.; 政府工作背景反映該CEO或董事長是否曾任職于政府部門, 衡量其政治關(guān)聯(lián)度.
在基準模型中, 公司層面的變量包括: 公司規(guī)模、公司壽命、杠桿率、重資產(chǎn)率和股權(quán)性質(zhì).其中, 公司規(guī)模由公司總資產(chǎn)規(guī)模衡量; 杠桿率由上市公司總負債與總資產(chǎn)的比率衡量; 重資產(chǎn)率由上市公司固定資產(chǎn)凈額與總資產(chǎn)的比率衡量; 股權(quán)性質(zhì)指的是國有股份占比.上述所有變量的具體定義, 均在表2中列明.
從探究因果關(guān)系的角度出發(fā), 上述變量之間存在明顯的內(nèi)生性問題, 而對變量之間內(nèi)生性的處理方式也是本文與以往大部分高管相關(guān)研究相比的重要區(qū)別之一.內(nèi)生性指的是在解釋性模型中, 解釋變量與殘差項之間的相關(guān)性, 通常由遺漏解釋變量、反向因果和測量誤差導(dǎo)致[4].解釋性建模旨在識別模型和證明因果關(guān)系, 因此內(nèi)生性的存在會使得參數(shù)估計有偏.然而, 與證明因果關(guān)系的解釋性建模不同的是, 本文的預(yù)測性建模并不關(guān)注因果關(guān)系, 而是相關(guān)關(guān)系, 所以變量之間內(nèi)生性的存在并不會影響對預(yù)測效果的評估[4].
表2分別列出了被預(yù)測變量、CEO特征、董事長特征和公司層面其他變量的描述性統(tǒng)計, 包括樣本量、均值、標準差和中位數(shù).為了防止極值帶來的統(tǒng)計偏差, 本文對連續(xù)型變量進行了1%和99% 的Winsorize處理.
從高管的個人特征變量的描述性統(tǒng)計結(jié)果 (面板B和面板 C) 中,可以發(fā)現(xiàn): 首先, 近四分之一 (24.96%) 樣本中CEO和董事長由同一人擔任; 第二, 男性在公司“一把手”職位中占絕對優(yōu)勢, 女性CEO僅占6.02%, 而女性董事長僅占4.53%; 第三, 我國上市公司CEO在其他公司兼職的比例高于董事長, 超過一半 (52.92%) CEO在其他公司兼職, 董事長在其他公司兼職的比例僅為26.51%; 第四, 我國上市公司CEO和董事長在職能背景方面具有類似的特征, 平均25%至30%的CEO或董事長具有生產(chǎn)、技術(shù)、設(shè)計等職能經(jīng)驗, 約18%的CEO或董事長具有財務(wù)、法律等專業(yè)職能經(jīng)驗, 超過90%的CEO或董事長具有市場、戰(zhàn)略、人力等管理職能經(jīng)驗; 第五, CEO或董事長具有海外工作、求學(xué)經(jīng)歷的比例較低, 僅約5%; 最后, 我國上市公司的董事長比CEO具備更豐富的政府工作、學(xué)術(shù)研究和金融工作經(jīng)歷.
表2 主要變量的定義和描述性統(tǒng)計
本文采用的機器學(xué)習(xí)方法為漸進梯度回歸樹 (gradient boosting regression trees, GBRT)(4)本文使用的Boosting算法是Ridgeway[50]使用的R語言工具包“gbm”, 參數(shù)設(shè)置如下: distribution=“gaussian”, n.trees=10 000, interaction.depth=6, shrinkage=0.001.在穩(wěn)健性檢驗部分驗證了參數(shù)調(diào)整對預(yù)測效果的影響., 簡稱“Boosting回歸樹”[51,52].Boosting回歸樹有效地結(jié)合了機器學(xué)習(xí)中的決策樹和集成思想, 通過加權(quán)多個基回歸樹來提高擬合效果, 在樣本內(nèi)和樣本外的擬合精確度都非常高[53].
(1)
(2)
即使得誤差平方和最小的常數(shù).計算損失函數(shù)的負梯度
(3)
利用損失函數(shù)負梯度在當前模型的值(zi)作為殘差的近似值, 基于xi擬合出新的回歸樹模型
g(x)=Ε(z|x)
(4)
選擇使得誤差最小的梯度下降幅度
(5)
進而得到經(jīng)過本輪迭代后新的預(yù)測函數(shù)
(6)
然后循環(huán)以上迭代過程(t=1,…,T) .
Boosting回歸樹的估計過程主要涉及三個參數(shù): 回歸樹的交互深度 (interaction depth) 、收縮參數(shù) (shrinkage parameter) 和回歸樹的數(shù)量.在本文的模型中, 參數(shù)的調(diào)整優(yōu)化 (tuning parameters) 僅建立在樣本內(nèi)信息之上, 而最優(yōu)參數(shù)的搜索范圍則是根據(jù)經(jīng)驗法則和運算成本來確定的.
交互深度指的是每個基回歸樹有幾次分叉.根據(jù)經(jīng)驗法則和算力限制設(shè)置了最大交互深度, 即最優(yōu)交互深度的搜索范圍.較多的分叉意味著基回歸樹能考慮到更復(fù)雜的交互性, 但更容易過度擬合.同時, 過高的交互深度也會帶來較大的計算成本.Hastie等[54]認為在多數(shù)問題中最優(yōu)交互深度都較低, 因此本文的研究將交互深度的上限設(shè)置為6.
收縮參數(shù)指的是被加入模型中的新的基學(xué)習(xí)器的權(quán)重.根據(jù)以往基于GBRT模型的研究經(jīng)驗[50,54], 收縮參數(shù)一般設(shè)置為0.01或0.001, 且在算力允許的情況下取值盡可能小.越小的收縮參數(shù)越可能帶來更優(yōu)的預(yù)測效果, 但本文并沒有嘗試小于0.001的收縮參數(shù), 主要原因是更小的收縮參數(shù)需要更高的運算性能, 會極大地提高計算成本(包括存儲成本和CPU運算時間), 且對預(yù)測的邊際提升效果很小[54], 容易過度擬合[52].因此, 本文取收縮參數(shù)值為0.001.
最優(yōu)的收縮參數(shù)和最優(yōu)的回歸樹數(shù)量是相互影響的.基回歸樹的數(shù)目與收縮參數(shù)之間需要一定的平衡, 小的收縮參數(shù)往往需要更多的基學(xué)習(xí)器.本文的模型中基回歸樹的數(shù)目上限設(shè)置為10 000.(6)本文分析部分所涉及的擬合過程取得最佳優(yōu)化效果時的回歸樹的數(shù)量通常處于3 000至5 000之間.在每一次滾動的訓(xùn)練樣本中,采用5折交叉驗證 (cross-validation) 的方法來確定最優(yōu)的基回歸樹的數(shù)目.上述模型參數(shù)的優(yōu)化過程完全沒有用到樣本外的信息.
作為一種集成的樹形回歸算法, Boosting雖然可以顯著提升預(yù)測準確度, 但模型的可解讀性卻不盡如人意.為了解決這一問題,采用了相對重要性 (relative importance) 和部分依賴圖 (partial dependence plot)來進一步挖掘模型背后的經(jīng)濟學(xué)內(nèi)涵.本文的目的并非僅僅是預(yù)測, 更是試圖回答哪些變量對預(yù)測效果影響較大以及預(yù)測模式如何.這些問題的回答一方面能夠有助于驗證以往文獻中“因果關(guān)系”的可靠性以及預(yù)測模型的可靠性, 比如本文通過部分依賴圖關(guān)系圖印證了高管持股比例與公司業(yè)績之間存在著非線性的復(fù)雜關(guān)系; 另一方面能夠推動對變量之間關(guān)系的理解, 從而提出新的理論[4].上述兩點意義對于正在形成期的理論而言尤為重要[55,56].如果僅僅關(guān)注預(yù)測效果, 而忽視預(yù)測模型的可解釋性, 那么整個模型就變成了一個“黑箱模型”, 內(nèi)在預(yù)測機制被掩蓋, 無法帶來更多啟發(fā).
一個變量的相對重要性指的是一個變量在模型擬合過程中, 相對于模型中其他變量的重要程度.根據(jù)Friedman[52],將變量重要性的定義為給定模型中其他部分不變, 在模型中加入該變量帶來的平方誤差的下降幅度.換言之, 相對重要性即在模型中其他部分不變的前提下, 在模型中去掉該變量或用一個隨機數(shù)變量將該變量替代后, 模型擬合能力的惡化程度相對于在其他變量上做相同操作后模型擬合能力惡化程度的大小.如果一個變量對應(yīng)的惡化程度相對較大, 則其在模型擬合過程中的相對重要性較大.本文通過計算相對重要性來回答高管的高維特征之中, 哪些特征對于公司績效的預(yù)測效果貢獻更大的問題.為了便于比較, 模型中所有變量的相對重要性指標之和被標準化為1.
本文希望基于Boosting模型的估計挖掘出一些解釋性意義, 因此進一步引入部分依賴圖來分析單個變量對于預(yù)測結(jié)果的影響模式.某一特征變量對于被預(yù)測變量的部分依賴關(guān)系是在控制其他特征為觀測值的情況下, 衡量這一特征變量值的變動對模型擬合效果的影響.這一指標能夠在一定程度上解決relative importance無法反映正負關(guān)系的問題.利用部分依賴圖, 可以考察某一高管特征對公司績效的預(yù)測模式
(7)
(8)
(9)
(10)
本文選擇Boosting回歸樹作為主要研究方法有以下兩點原因.1) Boosting回歸樹有較強的擬合能力.根據(jù)Hastie等[54]的論述, 在眾多統(tǒng)計學(xué)習(xí)方法中, 基于“樹”的學(xué)習(xí)器具有易于構(gòu)建、可解讀、對變量的嚴格單調(diào)變換保持不變、不受極端值影響等優(yōu)點.另外, 回歸樹本身能夠進行變量篩選, 因此即使加入不相關(guān)的變量, 也不會對結(jié)果造成影響.但是, 回歸樹是一種弱學(xué)習(xí)器, 單獨使用會得到不精確、波動大的結(jié)果.因此,Boosting回歸樹通過對集成許多基回歸樹, 能在盡量保持其固有優(yōu)勢的情況下, 顯著提升其準確性.2) Boosting回歸樹有較好的可解釋性.大多數(shù)有監(jiān)督的機器學(xué)習(xí)方法的唯一目的是預(yù)測, 因此往往會為了提高模型的復(fù)雜度和預(yù)測準確性而犧牲模型的可解釋性[57], 導(dǎo)致了絕大部分機器學(xué)習(xí)方法都是“黑箱模型”, 極大地限制了機器學(xué)習(xí)在公司金融領(lǐng)域的應(yīng)用.而Boosting回歸樹是機器學(xué)習(xí)中為數(shù)不多的解釋性較強的模型(7)隨機森林 (random forest) 模型和XGBoost也是可解釋性較強的模型, 本文在穩(wěn)健性分析中加以討論., 不僅可以提高模型的預(yù)測性, 而且能通過計算變量的相對重要性和繪制部分依賴圖來促進對理論的探索.
表3 模型構(gòu)建
本文對中國上市公司高管的個人特征進行綜合考量.首先構(gòu)建了只包含公司基本特征但不含公司高管人物特征的基準模型 (以下簡稱“基準模型”) .基準模型僅由五個描述公司特征的控制變量組成, 包括公司規(guī)模(lnAsset)、杠桿率(Leverage)、國有股份占比(State.Share)、重資產(chǎn)比例(PPE)和公司壽命(Esty).在基準模型的基礎(chǔ)上,分別加入CEO特征族和董事長特征族, 進一步構(gòu)建了兩個包含高管人物特征的模型(以下分別簡稱為“CEO模型”和“董事長模型”).三個模型如表3所示.
基于上述模型, 本文的研究設(shè)計主要按照以下幾個步驟進行:
(11)
第二, 考察高管各項特征對于預(yù)測公司績效的相對重要性.利用Boosting回歸樹的相對重要性指標, 計算三個模型中各變量的對于模型擬合的相對重要性, 取T次擬合結(jié)果中各變量的相對重要性的均值作為該變量綜合的相對重要性.在CEO模型和董事長模型中,將各人物特征的相對重要性相加可以得到CEO或董事長人物特征的綜合的相對重要性, 從而可以進一步對比CEO或董事長特征族在模型中的相對重要程度, 從中總結(jié)出對公司績效預(yù)測能力較強的高管特征.
第三, 對于相對重要性較高的高管特征,利用Boosting回歸樹生成部分依賴圖, 進一步分析其對于公司績效的預(yù)測模式和邊際影響.
最后, 對本文主要的分析結(jié)論進行穩(wěn)健性檢驗, 包括改變滾動時間窗口、改變公司績效衡量方式、調(diào)整Boosting模型的估計參數(shù)、更換機器學(xué)習(xí)方法和更換高管特征變量.
本部分利用Boosting回歸樹的方法和中國A股上市公司的樣本, 分別實證檢驗了CEO和董事長的個人特征是否能夠較大程度上提高模型對公司業(yè)績的預(yù)測效果.表4列出了“Boosting-CEO模型”和“Boosting-董事長模型”的擬合效果, 并加入了僅包括公司層面指標的“Boosting-基準模型”作為對照, 通過分析二者相對于“Boosting-基準模型”的擬合效果分別提升的程度, 判定CEO和董事長的個人特征整體對公司業(yè)績預(yù)測的貢獻程度.同時,將“OLS-基準模型”、“OLS-CEO模型”和“OLS-董事長模型”(8)與Boosting模型類似, OLS模型也是采用一年期滾動窗口回歸, 并分別計算了其在樣本內(nèi)的擬合效果和在樣本外的泛化能力.作為對照組, 檢驗Boosting回歸樹的機器學(xué)習(xí)方法是否能顯著提高模型的預(yù)測能力.在表4的面板A和面板B中,分別以財務(wù)績效和市場績效作為公司業(yè)績的代理變量.
表4 主要擬合結(jié)果
PanelA財務(wù)績效基準模型CEO模型提升效果董事長模型提升效果模型(1)(2)(2)-(1)(3)(3)-(1)R2IS(%)Boosting19.9422.692.7521.091.15OLS9.4310.461.0310.330.90R2OOS(%)Boosting12.3513.431.0813.260.91OLS9.179.360.199.540.37MSEOOSBoosting0.01240.0123-0.00010.0123-0.0001OLS0.01290.0128-0.00010.0128-0.0001PanelB市場績效基準模型CEO模型提升效果董事長模型提升效果模型(1)(2)(2)-(1)(3)(3)-(1)R2IS(%)Boosting65.8767.972.1067.811.94OLS48.8650.171.3149.911.05R2OOS(%)Boosting37.7238.620.9038.781.06OLS27.8828.430.5528.440.56MSEOOSBoosting1.781.75-0.031.75-0.03OLS2.052.03-0.022.03-0.02
表5中報告了CEO模型和董事長模型中各變量對于預(yù)測公司績效的相對重要性, 其中面板A和面板B分別展示了各變量對于預(yù)測財務(wù)績效和市場績效的結(jié)果.每一個面板的左側(cè)為CEO模型, 右側(cè)為董事長模型.為了便于區(qū)分,在屬于人物特征的變量后標記了“*”.從而發(fā)現(xiàn): 在眾多的高管特征中, 持股比例和年齡對預(yù)測公司績效的相對重要性較高 (在面板A和面板B中都大于1%) , 而其他諸如政府背景所代表的政府資源、金融工作背景所代表的金融資源和不同職能的工作經(jīng)驗等特征的相對重要性較低.
表5 各變量相對重要性排序
Table 5 The ranking of relative variable importance
排序CEO模型董事長模型變量相對重要性(%)變量相對重要性(%)1資產(chǎn)負債率31.77資產(chǎn)負債率32.252公司規(guī)模21.27公司規(guī)模21.303重資產(chǎn)占比18.52重資產(chǎn)占比18.734年齡*6.45年齡*6.395國有控股比例5.51公司壽命5.666公司壽命5.50國有控股比例5.597持股比例*4.91持股比例*4.928影響力(兼職)*1.05管理職能*0.819專業(yè)職能*1.00金融工作背景*0.7710學(xué)術(shù)經(jīng)驗*0.83政府背景*0.7511政府背景*0.76專業(yè)職能*0.7012金融工作背景*0.68CEO董事長兼任*0.4713性別*0.49學(xué)術(shù)經(jīng)驗*0.4214CEO董事長兼任*0.49性別*0.3515生產(chǎn)職能*0.41生產(chǎn)職能*0.3416海外經(jīng)歷*0.35影響力(兼職)*0.3417管理職能*0.00海外經(jīng)歷*0.22CEO特征族相對重要性總計17.43董事長特征族相對重要性總計16.47
表5 (續(xù))
Table 5 (Continue)
排序CEO模型董事長模型變量相對重要性(%)變量相對重要性(%)1公司規(guī)模50.06公司規(guī)模50.192資產(chǎn)負債率25.57資產(chǎn)負債率25.763重資產(chǎn)占比8.92重資產(chǎn)占比9.134持股比例*5.10持股比例*4.945公司壽命3.06公司壽命3.086年齡*2.96年齡*3.077國有控股比例1.42國有控股比例1.478學(xué)術(shù)經(jīng)驗*0.76學(xué)術(shù)經(jīng)驗*0.579影響力(兼職)*0.46政府背景*0.4110專業(yè)職能*0.35生產(chǎn)職能*0.3711海外經(jīng)歷*0.28專業(yè)職能*0.3212生產(chǎn)職能*0.27CEO董事長兼任*0.1913政府背景*0.25影響力(兼職)*0.1814CEO董事長兼任*0.24性別*0.1015性別*0.18管理職能*0.0816金融工作背景*0.13海外經(jīng)歷*0.0717管理職能*0.00金融工作背景*0.07CEO特征族相對重要性總計10.97董事長特征族相對重要性總計10.37
注:1. 依照相對重要性高低進行排序, 人物特征后標記*.
2. 下劃線代表相對重要性指標在面板A和面板B中的均大于1%的人物特征變量.
持股比例反映了高管對公司決策的話語權(quán)和公司績效對公司高管的激勵水平.高管年齡反映了高管對用于生產(chǎn)經(jīng)營和管理公司的內(nèi)部資源的積累.相比而言, CEO和董事長的其他人物特征反映的是其對個人自身技能和外部資源的積累.例如, 生產(chǎn)職能、專業(yè)職能和管理職能的工作經(jīng)驗和學(xué)術(shù)經(jīng)驗可以反映個人自備技能的積累, 政府工作背景、金融工作背景和海外經(jīng)歷等可以反映外部資源積累.上述分析結(jié)果表明高管的持股比例和年齡能夠更大程度上預(yù)測公司績效.其原因主要是在中國A股上市公司中, 高管對公司內(nèi)部資源的積累和把控能力對于公司績效的影響大于其個人自身技能和對外部資源的積累把控能力帶來的影響.
在變量重要性的分析中, 本文發(fā)現(xiàn)持股比例和年齡是高管特征中兩個最為重要的預(yù)測公司績效的因素.那么這兩個特征和公司績效的關(guān)聯(lián)究竟是怎樣的呢?為了回答這一問題, 本文中采用部分依賴圖來考察持股比例與年齡對于公司績效的預(yù)測模式.圖1至圖4展示了CEO持股比例和年齡對于公司績效的預(yù)測模式(9)董事長的持股比例和年齡的分析結(jié)果與CEO的類似.限于篇幅, 本文在正文中僅報告了CEO相關(guān)的部分依賴圖., 橫軸為持股比例或年齡, 縱軸為公司績效.
圖1和圖2分別展示了中國A股上市公司的CEO持股比例與公司財務(wù)績效和市場績效的部分依賴圖.根據(jù)表2描述性統(tǒng)計的結(jié)果, 中國A股上市公司的CEO和董事長的持股比例平均值很低, 中位數(shù)皆為0.進一步觀察發(fā)現(xiàn), 18 170個觀察值中, 僅有53個CEO的持股比例高于60%, 僅有76個董事長的持股比例高于60%, 高比例占股的現(xiàn)象極少.因此本文主要分析持股比例在0%到60%區(qū)間的部分依賴圖, 高管的持股比例對公司績效的預(yù)測效果具有明顯的非線性特點.整體來看, 隨著高管持股比例的提升, 公司績效呈上升趨勢.公司績效受到CEO持股比例影響的程度在不同持股比例下是不同的.部分依賴圖中的曲線初始階段較為平緩, 后半段陡升.這說明當持股比例處于中等以下水平區(qū)間時 (0%至約40%) , 持股比例增加對提升公司績效的作用較為微弱; 而當持股比例處于較高水平時 (約40%以上) , 增加持股比例對于提升公司績效的作用明顯.
圖1 CEO持股比例與財務(wù)績效
圖2 CEO持股比例與市場績效
以往文獻中針對高管持股的激勵效果存在爭論, 主流觀點有以下三種.首先, 管理層所有權(quán)的增加可以使得管理者與股東的利益趨同, 緩解代理問題[61].其次, 當高管持股水平超過一定閾值后, 他們的權(quán)力難以受到控制, 就能更多地謀取自身的利益而犧牲股東利益, 即“壕溝防守效應(yīng) (entrenchment effect) ”[62].最后, 高管持股與公司績效之間也可能沒有明顯關(guān)聯(lián)[63].基于這三類效應(yīng), 目前大量的實證結(jié)果驗證了高管持股與公司業(yè)績之間的非線性關(guān)聯(lián)(10)對于財務(wù)績效, 劉魯彬[64]的實證研究發(fā)現(xiàn), 當高管持股低于約23%或高于約61%時, 其與扣除了非經(jīng)常性損益后的凈資產(chǎn)回報率呈顯著正相關(guān), 否則呈顯著負相關(guān).對于市場績效, Morck等[65]的分段回歸分析表明, 高管持股比例低于5%或高于25%時, 其與托賓Q值呈顯著正相關(guān), 否則呈顯著負相關(guān).類似地, 韓亮亮等[66]利用小規(guī)模的中國市場樣本發(fā)現(xiàn)當高管持股比例低于8%或高于25%時, 其與托賓Q值呈正相關(guān), 否則呈負相關(guān)關(guān)系..
基于上述理論, 本文認為圖1和圖2的結(jié)果是因為當高管持股比例較高時, 利益趨同效應(yīng)更加明顯.與此同時, 隨著持股比例的提升, 其對公司績效的作用會在局部出現(xiàn)“下探”現(xiàn)象, 即在局部區(qū)間對公司績效有負面影響.理論上, 這種“下探”對應(yīng)著“壕溝防守效應(yīng)”, 即提升高管持股比例可能使高管對公司的控制能力增強, 受到的約束變?nèi)? 進而可以追求更大范圍的個人利益, 提高代理成本.該非線性關(guān)系也與Kim和Lu[24]的發(fā)現(xiàn)一致: 當高管持股比例高于一定水平時, 經(jīng)理人會過于風險厭惡, 從而放棄一些對公司有利的但高風險的投資行為 (例如研發(fā)投資) , 從而導(dǎo)致企業(yè)價值下降.總體而言, 本文發(fā)現(xiàn)高管持股對公司業(yè)績的作用效果是非線性的, 且在不同持股比例區(qū)間可能呈現(xiàn)出利益趨同效應(yīng)、壕溝防守效應(yīng)或沒有影響, 這對已有理論是互相補充印證的.
圖3和圖4分別展示了中國A股上市公司的CEO年齡與公司財務(wù)績效和市場績效的部分依賴圖.高管的年齡對于公司績效也具有明顯的非線性預(yù)測作用, 且對財務(wù)績效和市場績效的預(yù)測模式差異較大.從財務(wù)績效來看, 年齡與績效的關(guān)系近似與“U”型結(jié)構(gòu), 特別年輕CEO與特別年長的CEO管理的公司財務(wù)績效更佳.而市場績效卻會隨著CEO年齡增長而逐步提升, 同時在年齡超過一定范圍后, 市場業(yè)績會出現(xiàn)隨年齡增長而大幅下降的趨勢.這說明年齡與公司績效之間的關(guān)聯(lián)較為復(fù)雜.
圖3 CEO年齡與財務(wù)績效
圖4 CEO年齡與市場績效
從理論上看, CEO年齡可能會有三種機制來預(yù)測公司決策和公司業(yè)績.第一, 年齡的變化給高管帶來的個人心理和生理的變化將會間接影響公司的投融資行為.比如年輕的CEO容易過度自信, 因此更容易從事并購以及高風險項目, 而年老的CEO管理風格更為保守[67, 68].其次, CEO年齡是其在公司中的地位與權(quán)力的體現(xiàn), 年齡大的CEO在公司擁有更強的控制力, 會利用自身權(quán)力謀取私利, 不利于公司業(yè)績提升.最后, 年齡大意味著更高的社會資本和經(jīng)驗, 因此年齡大的CEO為企業(yè)貢獻更多的人力資本, 幫助企業(yè)提升業(yè)績.
結(jié)合圖3和圖4的結(jié)果, 本文認為年齡與公司業(yè)績的關(guān)系體現(xiàn)了上述三種預(yù)測機制, 且不同作用機制的相對強弱與其他變量存在較強的交互關(guān)系, 比如企業(yè)的國有性質(zhì)會使得年齡帶來的管理權(quán)力效應(yīng)更為顯著.因此, 年齡與公司業(yè)績的關(guān)聯(lián)較為復(fù)雜,會在未來研究中關(guān)注.
表6 更換滾動窗口期 (三年)
表7 更換公司績效的衡量方式
表7 (續(xù))
在基本分析中,分別采用行業(yè)中值調(diào)整后的資產(chǎn)收益率(息稅折舊攤銷前利潤除以期末總資產(chǎn)) 和托賓Q值作為公司的財務(wù)和市場績效評價指標.為了避免可能的變量衡量誤差帶來的結(jié)果偏差,更換了一組公司績效衡量指標來分析.財務(wù)指標更換為行業(yè)中值調(diào)整后的資產(chǎn)收益率 (凈利潤除以期末總資產(chǎn)) , 市場指標更換為行業(yè)中值調(diào)整后的個股年度超額回報率.
Boosting模型的估計過程中設(shè)定了多個參數(shù), 包括回歸樹的交互深度、收縮參數(shù)和回歸樹的數(shù)量.其中,模型將回歸樹數(shù)目的上限設(shè)為10 000, 而模型的回歸樹數(shù)目是通過交叉驗證最優(yōu)選擇的.本文擬合過程取得最佳優(yōu)化效果時的回歸樹的數(shù)量通常處于3 000至5 000之間,因此上限設(shè)置是合理的.
本文還檢驗了回歸樹的交互深度和收縮參數(shù)的選擇是否合理.在絕大多數(shù)的GBM模型中, 回歸樹的交互深度都在2至9之間, 而收縮系數(shù)在0.001和0.1之間[54].基于參數(shù)檢驗的基本思想,構(gòu)建了一系列可能的參數(shù)組合, 遍歷這些參數(shù)下的估計結(jié)果, 從而判斷在基本分析中所使用的參數(shù)是否合理.如果預(yù)測結(jié)果對參數(shù)的選擇十分敏感的話, 那么選擇的參數(shù)則是不合理.
具體而言, 本文將交互深度設(shè)為{2, 4, 6, 8}, 收縮參數(shù)設(shè)為{0.001, 0.01, 0.1}, 共構(gòu)成12(=4×3) 個參數(shù)組合, 并分別在每個參數(shù)下進行估計.表8以財務(wù)績效的預(yù)測模型為例, 展示了參數(shù)變動對預(yù)測效果的影響.結(jié)果發(fā)現(xiàn)在這些參數(shù)組合下, CEO和董事長對公司績效預(yù)測效果的提升程度與表4的結(jié)果相近.
表8 更換參數(shù)組合
5.4.1 隨機森林 (Random Forest)
Random Forest是機器學(xué)習(xí)算法中另一種常用的回歸樹模型.文獻表明, Boosting的預(yù)測能力強于Random Forest, 尤其是在指標維度低于4 000維時[69,70].因為Random Forest在解決回歸問題時, 無法做出超越訓(xùn)練集數(shù)據(jù)范圍的預(yù)測, 在噪音較大的問題上容易出現(xiàn)過度擬合[45].所以本文沒有將Random Forest作為主要的研究方法, 但采用這一方法作為穩(wěn)健性檢驗.
表9報告了Random Forest模型擬合的基本結(jié)果.發(fā)現(xiàn), 相對于Boosting模型, Random Forest模型的結(jié)果中高管特征對公司業(yè)績的預(yù)測性有所提高, 但總體而言仍處于較低水平.比如, 高管個人特征的加入對公司財務(wù)和市場績效的預(yù)測誤差分別降低了0.001 0和0.13.
表9 更換機器學(xué)習(xí)算法 (隨機森林)
Table 9 Alternative machine learning algorithms (random forest)
基準模型CEO模型董事長模型(1)(2)(2)-(1)(3)(3)-(1)R2IS(%)63.5180.8317.3280.8217.31R2OOS(%)15.2022.146.9422.607.40MSEOOS0.01200.0110-0.00100.0110-0.0010基準模型CEO模型董事長模型(6)(7)(7)-(6)(8)(8)-(6)R2IS(%)82.0691.099.0391.129.06R2OOS(%)37.0241.994.9742.045.02MSEOOS1.791.66-0.131.66-0.13
5.4.2 XGBoost
XGBoost (Extreme Gradient Boosting) 是除GBM之外另一種優(yōu)化GBRT問題的算法, 它與GBRT的主要區(qū)別在于在優(yōu)化過程中不僅考慮了損失函數(shù)的一階導(dǎo)數(shù)信息, 而且對損失函數(shù)進行了二階泰勒展開, 同時用到了一階和二階導(dǎo)數(shù)信息[71].但由于參數(shù)數(shù)量的增多,XGBoost所需的運算時間更長.在表10中報告了XGBoost的估計結(jié)果, 發(fā)現(xiàn)高管模型相對于基準模型的提升程度與表4中GBM的結(jié)果相似, 多數(shù)指標的提升幅度仍處于較低水平.比如, CEO個人特征的加入對財務(wù)績效的樣本外預(yù)測誤差 (MSEOOS) 的降低幅度僅為0.000 2.綜上, 本文的基本結(jié)果是穩(wěn)健的.
表10 更換機器學(xué)習(xí)方法 (XGBoost)
Table 10 Alternative machine learning algorithms (XGBoost)
基準模型CEO模型董事長模型(1)(2)(2)-(1)(3)(3)-(1)R2IS(%)22.1323.581.4523.381.25R2OOS(%)11.4412.551.1112.531.09MSEOOS0.01260.0124-0.00020.0124-0.0002基準模型CEO模型董事長模型(6)(7)(7)-(6)(8)(8)-(6)R2IS(%)65.7568.432.6866.730.98R2OOS(%)37.1137.880.7737.890.78MSEOOS1.801.78-0.021.78-0.02
在主要結(jié)果的CEO模型及董事長模型中, 高管個人特征大部分為虛擬變量.而回歸樹的方法可能會導(dǎo)致這些變量相對于連續(xù)型變量的預(yù)測能力較低.因此, 在原有一系列指標的基礎(chǔ)上,將高管個人特征的虛擬變量轉(zhuǎn)化為高管團隊特征的連續(xù)變量.例如, 在CEO模型中, 以高管團隊作為一個整體,將“是否有學(xué)術(shù)研究經(jīng)歷”轉(zhuǎn)換為擁有學(xué)術(shù)研究經(jīng)歷的高管占高管總?cè)藬?shù)的比重.同理, 本文轉(zhuǎn)換了其他虛擬變量, 包括是否在其他公司兼職、是否有生產(chǎn)、技術(shù)、設(shè)計職能經(jīng)驗, 是否有市場、戰(zhàn)略、人力管理職能經(jīng)驗, 是否有財務(wù)、法律職能經(jīng)驗, 是否有海外工作、求學(xué)經(jīng)歷、是否有政府工作經(jīng)歷和是否有金融行業(yè)工作經(jīng)歷.董事長的個人特征也轉(zhuǎn)化為董事會成員中擁有相應(yīng)特征的成員占比.模型的擬合結(jié)果在表11中匯報.發(fā)現(xiàn), 以特征指標的連續(xù)變量為預(yù)測指標的模型擬合效果有了一定提升, 比如在對財務(wù)績效的預(yù)測中, Boosting-CEO模型相對基準模型的樣本外提升效果從1.08變?yōu)?.47, 但仍然處于較低的水平, 這說明基本結(jié)論是穩(wěn)健的.
表11 高管特征均值的擬合結(jié)果
Table 11 Fitting results on the mean value of executive features
基準模型CEO模型提升效果董事長模型提升效果模型(1)(2)(2)-(1)(3)(3)-(1)R2IS(%)Boosting19.9422.532.5925.345.40OLS9.4310.881.4510.471.04R2OOS(%)Boosting12.3513.821.4714.452.10OLS9.179.920.759.680.51MSEOOSBoosting0.01240.0122-0.00020.0121-0.0003OLS0.01290.0128-0.00010.0128-0.0001基準模型CEO模型提升效果董事長模型提升效果模型(4)(5)(5)-(4)(6)(6)-(4)R2IS(%)Boosting65.8769.533.6669.423.55OLS48.8650.992.1350.892.03R2OOS(%)Boosting37.7238.881.1638.771.05OLS27.8828.921.1428.961.08MSEOOSBoosting1.781.75-0.031.75-0.03OLS2.052.02-0.032.02-0.03
以往高管特征研究大多僅研究單一特征與公司業(yè)績之間的因果關(guān)聯(lián), 缺乏全面的高管特征分析, 特別是其對公司績效的預(yù)測能力的分析.本文首次采用機器學(xué)習(xí)中的Boosting回歸樹算法全面考察了多維度的高管特征與公司業(yè)績之間的關(guān)聯(lián).具體而言, 本文以我國2008年~2016年上市公司為樣本, 總結(jié)了高管的高維特征變量, 研究了高管的個人特征是否能較大程度地預(yù)測公司業(yè)績, 并進一步分析了對公司業(yè)績預(yù)測程度較大的高管個人特征及其預(yù)測模式.研究發(fā)現(xiàn): (1) 整體而言, 公司CEO和董事長的特征對公司業(yè)績的預(yù)測力較弱; (2) 在眾多高管個人特征之中, 高管持股比例和年齡對公司業(yè)績的預(yù)測程度較高; (3) 高管持股比例和年齡與公司業(yè)績之間的關(guān)聯(lián)呈現(xiàn)出非線性的特點, 與以往的理論吻合.本研究不僅從一個更為全面的視角推進了中國高管特征與公司業(yè)績關(guān)聯(lián)的研究, 也對公司遴選高管和激勵機制設(shè)計等提供了有益啟發(fā).
本文首次應(yīng)用機器學(xué)習(xí)方法來研究中國的公司治理的問題, 評估了公司高管特征對于公司績效的整體預(yù)測能力, 豐富了“公司高管特征與公司績效之間關(guān)系”這一領(lǐng)域的文獻.此外, 本文采用前沿的Boosting回歸的方法規(guī)避了傳統(tǒng)線性模型的缺陷, 更加適用于分析變量之間的非線性和交互關(guān)系.最后, 本文探究了不同公司高管特征對于預(yù)測公司績效的重要程度, 并分析了相對重要的變量對公司績效的作用效果, 這一系列結(jié)論對于選聘公司高管具有實踐意義.
本文開啟了中國高管特征研究的一個新的維度: 高維高管特征對公司績效的預(yù)測能力.它對于深入理解中國高管在企業(yè)經(jīng)營管理中所扮演的角色具有重要意義.基于機器學(xué)習(xí)方法和預(yù)測性模型, 未來仍有廣闊的研究空間值得探索.首先, 機器學(xué)習(xí)方法能夠利用非結(jié)構(gòu)性數(shù)據(jù)來構(gòu)建無法直接觀測的變量 (比如高管的性格特點和行為等) , 從而挖掘在理論上尚未證實的重要高管特征, 豐富高管個人特征對公司績效的影響以及公司治理方面的研究.第二, 除了公司績效這一直接衡量公司表現(xiàn)的變量之外, 本文用類似的模型可以進一步探究中國高管特征對公司經(jīng)營決策的預(yù)測能力, 從而豐富高管對公司的影響機制方面的研究.總體而言, 本文開拓了新的研究視角, 為后續(xù)研究奠定了基礎(chǔ).