何曉站 ,程克群
(安徽農(nóng)業(yè)大學 經(jīng)濟管理學院,安徽 合肥 230036)
?
基于決策樹算法的農(nóng)業(yè)上市公司股利分配政策研究*
何曉站 ,程克群
(安徽農(nóng)業(yè)大學 經(jīng)濟管理學院,安徽 合肥 230036)
股利分配政策是上市公司對盈利進行分配或留存的決策問題。在大數(shù)據(jù)時代運用徽軟商業(yè)智能中的決策樹算法,可以對農(nóng)業(yè)上市公司的相關財務數(shù)據(jù)進行深入挖掘。通過決策樹規(guī)則進行分析,找出農(nóng)業(yè)上市公司股利分配采購影響因素,為農(nóng)業(yè)上市公司制定現(xiàn)金股利分配股利分配政策提供決策依據(jù),也為商業(yè)智能工具在企業(yè)決策中的運用提供借鑒。
農(nóng)業(yè)上市公司;決策樹;股利分配政策
上市公司股利分配政策是企業(yè)管理層依托公司發(fā)展為目標,平衡各方面利益,選擇對企業(yè)最為有利的股利分配方式,從而實現(xiàn)企業(yè)價值最大化??茖W合理的股利分配政策能夠幫助上市公司完善企業(yè)治理,使企業(yè)長期健康發(fā)展。由于我國資本市場建立的時間比較短,市場制度不健全,企業(yè)管理者認識不足,致使上市公司在制定股利分配政策時往往對企業(yè)價值最大化缺乏考慮。由于我國農(nóng)業(yè)上市公司自身發(fā)展還不完善,再加上我國證劵市場整體起步較晚、各項規(guī)章制度還不健全,農(nóng)業(yè)上市公司的內部治理和外部環(huán)境決定了我國農(nóng)業(yè)上市公司股利分配方式目前仍以現(xiàn)金股利為主,股利支付水平低、股利分配缺乏連貫性、股利分配支付方式多樣、不分配現(xiàn)象嚴重等導致股利政策的分配很不穩(wěn)定。因此,研究農(nóng)業(yè)上市公司的股利分配政策并提出相關合理建議是有必要的。
布萊克說:“我們越是認真地研究股利政策,越覺得他像一個謎?!盵1]1-5原紅旗發(fā)現(xiàn)規(guī)模小的公司傾向于選擇股票股利,而規(guī)模較大的公司則傾向于選擇現(xiàn)金股利[1]121。連續(xù)發(fā)放現(xiàn)金股利的公司,股利具有穩(wěn)定性;而連續(xù)發(fā)放不同形式股利的公司股利政策不具有穩(wěn)定性。由于時代的發(fā)展、證券市場的日益完善、市場現(xiàn)狀變化多端,不同時期股利分配政策會有所不同,影響股利分配的因素也會不一樣,這些因素表現(xiàn)的強弱也會變化。在選取股利分配政策影響因素時筆者認為現(xiàn)階段相對于凈資產(chǎn)倍率來說主營業(yè)務收入增長率更能反映公司的增長機會,本文選用主營業(yè)務收入增長率來替代未來的成長機會。王永輝和費海濤運用決策樹中的CART算法針對房地產(chǎn)行業(yè)股利分配傾向進行研究,具有一定的現(xiàn)實指導意義[2]。而CART算法的局限性在于對連續(xù)性的字段比較難預測,而Microsoft決策樹彌補了這一缺陷,且不同行業(yè)的股利分配影響因素有所差異。周好文、李增福、唐春陽比較全面地分析了行業(yè)對股利分配的影響,經(jīng)研究發(fā)現(xiàn)不同行業(yè)上市公司的股利分配具有非常顯著的差異性,且這種差異在行業(yè)之間具有普遍性[3],因此,本文選取農(nóng)業(yè)上市公司運用Microsoft決策樹的方法對股利分配政策進行研究。張孝梅、王勇通過分析上市公司股利分配現(xiàn)狀,查找問題的根源,并提出了相關政策建議,然而,他們并未運用實證方法進行驗證分析[4]。趙永梅運用SPSS19.0 統(tǒng)計軟件以及計量經(jīng)濟學中的多元線性回歸分析法對創(chuàng)業(yè)板上市公司股利分配政策的影響因素進行實證檢驗,找出了重要的因素,提出了合理的政策建議。而統(tǒng)計建模需要嚴格的前提假設,多元回歸模型則無法充分體現(xiàn)樣本的異質性[5]。
綜上研究發(fā)現(xiàn):第一,現(xiàn)有研究大多采用多元回歸模型進行分析,而統(tǒng)計建模需要嚴格的前提假設,現(xiàn)實中很多數(shù)據(jù)都無法滿足這些前提條件,從而影響模型的精度和解釋能力;第二,已有研究主要針對籠統(tǒng)的上市公司進行研究,忽視了不同行業(yè)的經(jīng)營特性和財務特征差異,多元回歸模型則無法充分體現(xiàn)這些樣本的異質性;第三,現(xiàn)有的股利分配政策研究中忽視了每股貨幣資產(chǎn)作為發(fā)放現(xiàn)金股利的限制性因素,對現(xiàn)金股利分配這一重要的股利分配影響因素研究不夠全面;第四,在已有的研究中,利潤分配大都被簡化為簡單的正負相關性關系,而其實存在著復雜的關聯(lián)關系。因此,本文擬選擇2014—2015年的數(shù)據(jù),引入Microsoft SQL Server中的Microsoft決策樹算法,對農(nóng)業(yè)上市公司的現(xiàn)金股利分配政策進行分析,從而得到發(fā)放現(xiàn)金股利的主要影響因素及相應的決策樹分類規(guī)則。
(一)農(nóng)業(yè)上市公司的現(xiàn)狀
隨著我國證券市場的不斷完善,公司股利分配端方式呈現(xiàn)多樣化?,F(xiàn)金股利分配從2011—2015年在發(fā)放股利的上市公司中占比均在58%以上,其中2012年更是占到了76.39%。同時,發(fā)放股利的上市公司中現(xiàn)金股利分配的上市公司占總體上市公司比例從2011年至2015年逐年遞增。由此可見,現(xiàn)金股利分配是我國上市公司股利分配最重要的股利分配方式,并且所占比例越來越大。與此同時,農(nóng)業(yè)類上市公司現(xiàn)金股利和股票股利是較偏好的股利分配形式,也有少數(shù)的轉股現(xiàn)象,其中現(xiàn)金股利分配方式要明顯高于其他方式。從2011年到2015年,我國農(nóng)業(yè)上市公司現(xiàn)金股利分配占比依次為47%、39%、42%、35%、40%(數(shù)據(jù)來源于CSMAR數(shù)據(jù)庫),同比相較上市公司整體仍然比較低。
2007年以來,我國上市公司總體股利分配水平有所優(yōu)化,但是股利支付率基本維持在20%到30%之間,相對于西方發(fā)達國家約60%左右的水平,顯然股利分配率比較低。從分配股利的公司數(shù)量來看,不分配股利的公司數(shù)量從2010年的63%降低到2015年的60%,說明不分配股利的情況有所緩和。通過數(shù)據(jù)統(tǒng)計可知,農(nóng)業(yè)類上市公司在分配現(xiàn)金股利的過程中,股利支付率較低,每股現(xiàn)金股利較低。從2011年到2015年間,農(nóng)業(yè)類上市公司現(xiàn)金股利分配金額都在1元每股以內,平均值也僅在0.5元每股左右,可見其現(xiàn)金股利分配率極低,這與農(nóng)業(yè)類上市公司的成本高、收益低等特點相關。
2007年上市公司分配股利的比重約為57%,而這些公司持續(xù)到2013年依然維持股利分配的僅為26%,下降的幅度超過120%。這表明我國上市公司的股利分配缺乏連續(xù)性和穩(wěn)定性,這一方面不符合證監(jiān)會的相關規(guī)定,另外也損害了投資者的利益。從國泰安公司CSMAR數(shù)據(jù)庫統(tǒng)計數(shù)據(jù)來看,從2011年到2015年,分配現(xiàn)金股利的農(nóng)業(yè)類上市公司分別為23家、19家、20家、17家、16家(其中2011年到2012年的統(tǒng)計樣本為49家上市公司,2013年和2015年為48家上市公司),并且有較大的波動,即有的公司往往今年有分配,明年就不再分配了。這充分說明農(nóng)業(yè)類上市公司股利分配政策比較波動,連續(xù)性不足,其在制定股利政策時沒有很好顧及到信號傳遞問題。
當每股派發(fā)的現(xiàn)金股利大于或等于每股收益的現(xiàn)金股利的上市公司就產(chǎn)生超能力派現(xiàn)問題。我國的超能力派現(xiàn)上市公司從2011年至2015年逐年上升,漲幅有3.5倍之多。這也意味著越來越多的上市公司采取利用前些年的留存收益進行股利分配,這一方面降低了以后公司的年度派發(fā)現(xiàn)金的能力,另一方面也可能會造成公司資金短缺,給公司帶來一定的財務風險,影響企業(yè)的長遠發(fā)展。而根據(jù)農(nóng)業(yè)類上市公司的統(tǒng)計數(shù)據(jù),存在超能力派現(xiàn)的企業(yè)從2011年到2015年依次有2家、2家、2家、4家、3家,相對于不足50家上市公司的樣本來說,也是不容忽視的。
(二)樣本選取及數(shù)據(jù)來源
本文選取2014—2015年的數(shù)據(jù)為研究樣本,同時,還剔除掉ST(連續(xù)兩年虧損的上市公司)、*ST(連續(xù)三年虧損的上市公司)類上市公司以及殘缺數(shù)據(jù)的企業(yè),最終得到共40個數(shù)據(jù)樣本(數(shù)據(jù)來源于CSMAR數(shù)據(jù)庫),對所有農(nóng)業(yè)上市公司的現(xiàn)金股利分配政策影響因素進行數(shù)據(jù)挖掘研究。
(三)研究變量的確定
本文綜合考慮上述已有研究文獻的方法存在的不足和研究結論并考慮本文的研究目的,選取和現(xiàn)金股利分配相關的控股股東性質、資本結構、盈利能力、營運能力、公司規(guī)模、股本結構、流動資產(chǎn)、成長機會、發(fā)展能力等相應的指標來分析挖掘其中的復雜關系,并找出其中的關聯(lián)關系以及關系的強弱。
因直接搜集得到的數(shù)據(jù)對以后模型的建立來說不夠規(guī)范,所以需要對數(shù)據(jù)進行預處理。針對模型中的“提升”,“下降”是以2015年相對2014年數(shù)據(jù)為標準進行對比后的結果,并設置國有控股為“1”,民營控股為“0”(見表1)。
(一)Microsoft決策樹的原理
決策樹是一種快速而直觀的分類技術,也是目前最受歡迎的數(shù)據(jù)挖掘分析技術之一。Microsoft決策樹算法是由 Microsoft SQL Server Analysis Services 提供的分類和回歸算法[6],用于對離散和連續(xù)屬性進行預測性建模。它是通過在決策樹中建立一系列相關的拆分,最終創(chuàng)建出所需要的模型,而用節(jié)點來表示所生成的拆分點。在模型構建的過程中,當出現(xiàn)可預測的列與輸入的列之間存在一系列密切相關關系時,此時決策樹算法會向該挖掘模型中增添相應的節(jié)點。而該決策樹算法預測的拆分方式主要依據(jù)于該研究變量是連續(xù)列還是離散列。
表1 模型的變量定義
決策樹是一棵有向樹,樹中的任一個非葉節(jié)點對應著數(shù)據(jù)集中某個屬性,葉節(jié)點則對應著分類結果,從而成一系列規(guī)則集。而產(chǎn)生的從根節(jié)點出發(fā)到葉節(jié)點的每一條路徑都是所研究目標變量的一條規(guī)則,所研究的變量中越是離根節(jié)點近的屬性對于目標變量的影響越重要。借助這種方法原理,可以對股利分配影響因素的重要程度進行研究,發(fā)現(xiàn)股利分配的影響因素規(guī)則及影響因素中較為重要的因素[6]。
(二)數(shù)據(jù)的整理轉換
根據(jù)上述決策樹的原理以及表1中的變量定義,將搜集的原始數(shù)據(jù),在Excel表中進行加工處理之后,即可導入到Microsoft SQL Server Management Studio中的數(shù)據(jù)表,并對那些不標準的數(shù)據(jù)進行轉換整理,最后,便可得到待處理的數(shù)據(jù)源表LENOVO—PC.CDD—dbo.CDD(見表2)。
表2 待分析數(shù)據(jù)源表
(三)挖掘模型的創(chuàng)建
在SQL Server Business Intelligence Development Studio中新建一個Analysis Services多維和數(shù)據(jù)挖掘項目之后,便可進行挖掘模型的構建。
首先,打開SQL Server Business Intelligence Development Studio創(chuàng)建新的數(shù)據(jù)源與上述創(chuàng)建的數(shù)據(jù)庫對接,數(shù)據(jù)源顧名思義是數(shù)據(jù)的來源,是一種數(shù)據(jù)連接,包含所有建立的數(shù)據(jù)庫連接的信息。
然后,在數(shù)據(jù)源視圖下新建數(shù)據(jù)源視圖,與上述數(shù)據(jù)表LENOVO-PC-CDD-dbo.2015.ACDD建立關系。數(shù)據(jù)源視圖是在數(shù)據(jù)源的基礎上生成的,包含創(chuàng)建數(shù)據(jù)模型所需的元數(shù)據(jù),根據(jù)不同的數(shù)據(jù)源中的多個數(shù)據(jù)元素生成數(shù)據(jù)模型。
最后,在挖掘結構下創(chuàng)建挖掘結構模型即2015.ACDD.dmm模型。設置所使用的數(shù)據(jù)挖掘的算法——Microsoft決策樹算法,選擇公司代碼作為主鍵用于分析可預測列現(xiàn)金股利分配與否,設定40個樣本作為本研究的數(shù)據(jù)集實例數(shù),用于對結果準確性進行測試。
(四)挖掘模型的準確性評估
在挖掘準確性表中可以看到預測的結果和真實結果的二維表(見表3)。
預測未進行股利分配為真的分配數(shù)為22,預測未進行股利分配為假的股利分配數(shù)為4,預測進行股利分配為真的分配數(shù)為12,預測進行股利分配為假的分配數(shù)為2。準確率為:
(22+12)/(22+4+12+2)=85%。
上述結果表明該模型是比較準確的。
表3 決策樹模型的分類矩陣
挖掘結構的數(shù)據(jù)挖掘提升圖是依據(jù)在測試的數(shù)據(jù)集中對可預測列的已知值進行繪制圖形,表示與隨機推測相比挖掘模型所帶來的改進,可以為具有相同屬性的多個可預測模型評估預測的準確性,也可以對單個結果的準確性進行預測。在提升圖中針對挖掘模型演示的提升數(shù)量越多,該模型也就越有效。通過對比數(shù)據(jù)集中的不同部分的提升百分比,來判斷多大百分比的事例可以從該預測模型中獲益。
圖1 預測模型測試集上進行股利分配=1條件下的數(shù)據(jù)挖掘提升圖
依據(jù)上述提升圖的原理(如圖1),通過設置提升圖為預測模型在測試集上選擇分配為1條件下的預測值,再次檢驗生成的該模型的準確程度。橫向坐標反映的是所研究的測試集總體事例數(shù)中選取的事例數(shù)占的百分比;縱向坐標反映的是從測試集中總體分配數(shù)符合可預測列分配為1條件下選取的事例數(shù)中符合可預測列分配為1所在條件下的分配數(shù)所占的百分比。圖1中最下面的線表示的是隨機預測模型,而最上面的線表示的是理想預測模型,觀察可以發(fā)現(xiàn)所生成的模型圖對應的中間的線,其軌跡相對于隨機預測的曲線有了較大的提升,而且也比較接近于理想模型下所對應的紅色提升曲線的軌跡,結合其對應的挖掘圖例(見圖4),由此可知該預測模型具有比較高的準確性。
表4 挖掘圖例
(五)分析結果與討論
通過決策樹挖掘,生成的決策樹模型(見圖2挖掘模型查看器)。
圖2 決策樹分析結果
決策樹生成之后,通過對影響因素和股利分配的關聯(lián)分析,挖掘出一系列的規(guī)則,這些規(guī)則對當前股利分配有豐富現(xiàn)實指導意義。本文所生成的決策樹每一條規(guī)則都包含多個因素前提,說明股利分配政策的制定需要綜合考慮多個相關變量。對最終的決策樹進行分析如下:第一,當總資產(chǎn)=1時,控股股東的性質=1,主營業(yè)務收入增長率=1,凈資產(chǎn)收益率=0,資產(chǎn)負債率=0時發(fā)放現(xiàn)金股利;在主營業(yè)務收入增長率=0時,應綜合考慮公司的資產(chǎn)負債率及凈資產(chǎn)收益率的狀況。結合指標變量的具體含義可以理解為:在公司擴大股本且具有高成長性時,公司會傾向于發(fā)放現(xiàn)金股利,在沒有高成長性時,國家控股的企業(yè)傾向發(fā)放現(xiàn)金股利,而民營企業(yè)在公司規(guī)模沒有擴大的情況下不進行現(xiàn)金股利分配。第二,在總資產(chǎn)=0,控股股東的性質=1會選擇發(fā)放現(xiàn)金股利;若控股股東的性質=0則會綜合考慮凈資產(chǎn)收益率和資產(chǎn)負債率的狀況??梢岳斫鉃樵跀U大股本,公司資本規(guī)模沒有擴大的情況下企業(yè)的控股股東性質對現(xiàn)金股利分配具有明顯的判別分類作用。綜合考慮每一條規(guī)則,發(fā)現(xiàn)股利分配受多方面綜合因素的影響。
根據(jù)上述決策樹預測模型的依賴關系網(wǎng)絡,顯示了模型中的輸入和可預測屬性之間的依賴關系,見圖3弱相關關系的聯(lián)系。
圖3 決策樹查看器的依賴關系
挖掘模型查看器左側的滑塊可起到與依賴關系強度相聯(lián)系的篩選器作用。如果向下拉動滑塊,挖掘模型查看器中顯示的鏈接強度逐漸加大(見圖3)。通過軟件分析,可以得出總資產(chǎn)、控股股東性質、凈資產(chǎn)收益率、主營業(yè)務收入增長率,每股貨幣資金對現(xiàn)金股利分配的影響由強到弱。因此,在本研究中選取的6個影響因素中,總資產(chǎn)對現(xiàn)金股利分配的影響最為顯著(見圖4)。
圖4 最強依賴關系
綜合上述分析可知:資本結構對農(nóng)業(yè)上市公司的股利分配起著至關重要的作用,但是這種制約作用也并不是無論在何種情況下都會產(chǎn)生。當企業(yè)籌集資金相對較為困難時,負債對其的制約作用才會顯得非常突出。當然,資產(chǎn)負債率對債權人和債務人的影響不同,在進行借入資本決策時,企業(yè)也應當根據(jù)自己當時的情況,綜合考慮各方面因素,充分評估產(chǎn)生利潤與增加的風險,權衡利弊,從而作出正確的分析與決策。
本文運用數(shù)據(jù)挖掘中的 Microsoft 決策樹算法,對40家農(nóng)業(yè)上市公司的現(xiàn)金股利分配進行了預測性分析。決策樹找到了影響因素和股利分配的關聯(lián)規(guī)則。通過對2013—2014年的樣本數(shù)據(jù)進行軟件分析可以得出資產(chǎn)負債率、每股貨幣資金、主營業(yè)務收入增長率、控股股東性質、總資產(chǎn)、凈資產(chǎn)收益率對現(xiàn)金股利分配的影響由強到弱。通過實證分析該模型的準確率較其他預測模型有了較大的提高。
在研究的40家農(nóng)業(yè)上市公司中,進行現(xiàn)金分配的有18家,其中國有控股的才7家,說明單控股股東的性質并不能判定其進行怎樣的分配。當然,現(xiàn)金股利分配也不能簡單地判定受哪一個方面的影響,它是受多方綜合因素的影響。使得股利分配的預測模型越來越復雜。
根據(jù)上面農(nóng)業(yè)類上市公司股利分配政策影響因素綜合分析,應提高農(nóng)業(yè)類上市公司盈利水平;完善相關法律法規(guī),規(guī)范農(nóng)業(yè)類上市公司行為;合理引導市場投資者行為,理性投資決策;完善農(nóng)業(yè)類上市公司內部制衡機制,避免公司內部決策失衡;針對上市公司股權結構不合理的現(xiàn)況,積極穩(wěn)妥改善股權結構。
[1] 原紅旗.中國上市公司股利政策分析[M].北京:中國財政經(jīng)濟出版社,2004:1-218.
[2] 王永輝,費海濤.上市公司股利分配傾向實證研究[J].財會通訊2009(2):27-28.
[3] 周好文,李增福,唐春陽.行業(yè)對股利分配的影響--基于中國上市公司的實證研究[J].2004(6):62-79.
[4] 張孝梅,王勇.我國上市公司股利分配現(xiàn)狀分析及政策建議[J].會計之友,2011(4):89-92.
[5] 趙永梅.我國創(chuàng)業(yè)板上市公司股利分配政策實證研究[D].呼和浩特:內蒙古財經(jīng)大學,2014:22-35.
[6] MUNDY J, THORNTHWAITE W,楊大川.數(shù)據(jù)倉儲工具箱面向SQL Server 2005和Microsoft商業(yè)智能工具集[M]. 北京:清華大學出版社,2007:338-375.
A Study of Agricultural Listed Companies’ Dividend Policy Based on Decision Tree Algorithm
HE Xiaozhan,CHENG Kequn
(School of Economics and Management, Anhui Agricultural University, Hefei 230036, China)
Dividend policy is the decision that list companies make to distribute or preserve profits. In this era of big data, Decision Tree algorithm of Microsoft’s business intelligence can be adopted to make an in-depth analysis of relevant financial data of agricultural list companies. And factors influencing dividend purchase of the companies can also be found according to the rules of the algorithm. The findings of this paper might provide agricultural list companies with a reference to making decisions on cash dividend and applying business intelligence tools in business decisions.
agricultural listed companies; Decision Tree algorithm; dividend policy
2016-03-21
安徽省教育廳人文社會科學研究項目(2011sk717:《皖江城市帶承接產(chǎn)業(yè)轉移示范區(qū)現(xiàn)代農(nóng)業(yè)建設的技術支撐研究》);安徽省領導圈定課題(SLDQDKT16-19F:《我省農(nóng)村宅基地有償轉讓研究》)
何曉站(1987-),女,安徽宿州人,安徽農(nóng)業(yè)大學經(jīng)濟管理學院碩士研究生。
程克群(1969-),男,安徽望江人,安徽農(nóng)業(yè)大學經(jīng)濟管理學院教授,碩士生導師。
F23
A
1009-2463 (2016)06-0048-08