喬 晗,蔡高遠(yuǎn),趙志偉
(1.河南大學(xué) 經(jīng)濟(jì)學(xué)院,河南 開(kāi)封 475004;2.天津財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)學(xué)院,天津 300222)
中小企業(yè)是我國(guó)國(guó)民經(jīng)濟(jì)的重要組成部分,但其衰減速度卻顯著高于其他國(guó)家(王永進(jìn)等,2017),加大了國(guó)家支持和社會(huì)資本投入的風(fēng)險(xiǎn)。因此,如何有效評(píng)價(jià)及識(shí)別具有高成長(zhǎng)價(jià)值的中小企業(yè),給出具有操作性的政策或投資依據(jù),進(jìn)而實(shí)現(xiàn)供給側(cè)結(jié)構(gòu)性改革相關(guān)政策對(duì)中小企業(yè)的精準(zhǔn)扶持,以及提高金融資本的投資效率,成為近年來(lái)政府、社會(huì)和學(xué)界共同關(guān)注的熱點(diǎn)問(wèn)題。相關(guān)研究具有服務(wù)經(jīng)濟(jì)及推進(jìn)企業(yè)成長(zhǎng)理論及綜合評(píng)價(jià)方法研究的學(xué)術(shù)與實(shí)踐價(jià)值。
評(píng)價(jià)企業(yè)成長(zhǎng)最直接的方式是尋找代理變量,如托賓Q或銷售額增長(zhǎng)率,其優(yōu)勢(shì)是評(píng)價(jià)值為數(shù)值型數(shù)據(jù),便于定量分析其影響因素[1]。但企業(yè)成長(zhǎng)是一個(gè)復(fù)雜概念,利用單一變量作為政府或資本的投資依據(jù)顯然不恰當(dāng)。諸多因素共同決定企業(yè)成長(zhǎng)的機(jī)制,意味相應(yīng)測(cè)度(評(píng)價(jià))需要多維因素的評(píng)價(jià)信息,并將其合成。因此,多指標(biāo)綜合評(píng)價(jià)方法成為衡量企業(yè)成長(zhǎng)性的另一個(gè)主流選擇,但國(guó)內(nèi)外相關(guān)研究遵循不同路徑。其中,由于風(fēng)險(xiǎn)投資/私募股權(quán)(VC/PE)更善于識(shí)別高成長(zhǎng)企業(yè)(Monika et al.,2015),國(guó)外文獻(xiàn)主要利用歷史信息或問(wèn)卷調(diào)查,通過(guò)歸納投資實(shí)踐的項(xiàng)目評(píng)價(jià)準(zhǔn)則,構(gòu)建企業(yè)成長(zhǎng)性評(píng)價(jià)指標(biāo)體系,并傾向于選擇企業(yè)家素質(zhì)等定性指標(biāo)[2]。
與國(guó)外文獻(xiàn)從實(shí)踐到理論的研究路徑不同,國(guó)內(nèi)文獻(xiàn)更注重從企業(yè)成長(zhǎng)理論出發(fā),構(gòu)建以財(cái)務(wù)指標(biāo)為主的評(píng)價(jià)體系。早期具有影響力的是國(guó)家經(jīng)貿(mào)委等(2001)提出的GEP評(píng)價(jià)法,通過(guò)10項(xiàng)財(cái)務(wù)指標(biāo)信息反映各方面的成長(zhǎng)優(yōu)勢(shì),但未能直接反映成長(zhǎng)的定性信息[注]GEP評(píng)價(jià)法假設(shè)定性信息最終將不同程度在企業(yè)財(cái)務(wù)指標(biāo)中表現(xiàn)出來(lái)。,且缺乏理論支撐。后續(xù)研究逐步強(qiáng)調(diào)成長(zhǎng)評(píng)價(jià)的理論基礎(chǔ),主要分兩種模式:一是力求評(píng)價(jià)模型的實(shí)踐意義,指標(biāo)體系構(gòu)建時(shí)選用以財(cái)務(wù)指標(biāo)為主的定量指標(biāo)(張冬,2013),但存在缺失定性信息的問(wèn)題;二是為求評(píng)價(jià)模型的完備性,指標(biāo)體系通常涉及難以測(cè)度的定性指標(biāo),但受方法所限難以實(shí)證分析,導(dǎo)致研究成果難以指導(dǎo)實(shí)踐,如張玉明等(2012)利用仿生學(xué)構(gòu)建企業(yè)成長(zhǎng)評(píng)價(jià)模型中涉及企業(yè)家經(jīng)營(yíng)能力等定性指標(biāo),但未實(shí)證檢驗(yàn)?zāi)P偷挠行?。此外,目前已有中小企業(yè)成長(zhǎng)性評(píng)價(jià)方法通常僅能給出成長(zhǎng)性高低的排序信息,且難以檢驗(yàn)評(píng)價(jià)結(jié)論的有效性,也在一定程度上降低了研究對(duì)于投資實(shí)踐的指導(dǎo)意義。
本文基于相關(guān)理論構(gòu)建中小企業(yè)成長(zhǎng)性評(píng)價(jià)模型,通過(guò)引入大數(shù)據(jù)技術(shù)力圖實(shí)現(xiàn)兩個(gè)具體目標(biāo):一是利用網(wǎng)絡(luò)爬蟲(chóng)和文本挖掘技術(shù),解決中小企業(yè)成長(zhǎng)性評(píng)價(jià)定性指標(biāo)難以測(cè)度的問(wèn)題,改善評(píng)價(jià)信息不充分的問(wèn)題;二是構(gòu)建基于機(jī)器學(xué)習(xí)算法的中小企業(yè)成長(zhǎng)性分類模型,增加企業(yè)成長(zhǎng)性的分類信息,提升傳統(tǒng)中小企業(yè)成長(zhǎng)性評(píng)價(jià)結(jié)論的信息量,并通過(guò)比較分類信息與傳統(tǒng)綜合評(píng)價(jià)方法的排序信息的一致程度,檢驗(yàn)成長(zhǎng)性綜合評(píng)價(jià)模型的可靠性,為決策實(shí)踐提供更為有效的參考依據(jù)。
企業(yè)的成長(zhǎng)極為復(fù)雜,目前仍然是一個(gè)具有很強(qiáng)“黑箱性質(zhì)”的問(wèn)題(楊林巖等,2010)。本文力圖在進(jìn)一步梳理企業(yè)成長(zhǎng)理論的基礎(chǔ)上,構(gòu)建一個(gè)中小企業(yè)成長(zhǎng)性評(píng)價(jià)模型。
企業(yè)成長(zhǎng)性評(píng)價(jià)框架是基于影響企業(yè)成長(zhǎng)的因素及其作用機(jī)制理論構(gòu)建的。
1.古典經(jīng)濟(jì)學(xué)分工理論。企業(yè)作為一種分工組織,技術(shù)操作分工強(qiáng)化勞動(dòng)者學(xué)習(xí)與經(jīng)驗(yàn)積累效應(yīng),專注工具運(yùn)用,推動(dòng)機(jī)器改進(jìn)和發(fā)明,其導(dǎo)致勞動(dòng)生產(chǎn)率提高,出現(xiàn)規(guī)模經(jīng)濟(jì)(斯密,1776)。隨著分工的專業(yè)化,則衍生出新企業(yè),拉長(zhǎng)社會(huì)生產(chǎn)鏈條,增加一國(guó)企業(yè)數(shù)量(阿·楊格,1928)。就成長(zhǎng)性概念的測(cè)度而言,分工體現(xiàn)出勞動(dòng)型技術(shù)與工具資本技術(shù)的合成進(jìn)步,因此,分工理論實(shí)際上開(kāi)創(chuàng)了將技術(shù)因素作為企業(yè)成長(zhǎng)動(dòng)因,以規(guī)模測(cè)度企業(yè)成長(zhǎng)性的先河。
2.新古典經(jīng)濟(jì)學(xué)的企業(yè)最優(yōu)規(guī)模理論。現(xiàn)實(shí)中,企業(yè)基于分工規(guī)模經(jīng)濟(jì)決定的成長(zhǎng)不可能無(wú)限持續(xù)。隨著企業(yè)規(guī)模擴(kuò)大,其靈活性和競(jìng)爭(zhēng)力的下降,最終必然失去成長(zhǎng)動(dòng)力,另外也存在企業(yè)家精力和壽命制約企業(yè)成長(zhǎng)的情況。馬歇爾提出引入外部經(jīng)濟(jì)、企業(yè)家有限生命和企業(yè)壟斷三個(gè)因素,建立企業(yè)成長(zhǎng)等價(jià)于調(diào)整企業(yè)規(guī)模,追求最優(yōu)規(guī)模經(jīng)濟(jì)的企業(yè)成長(zhǎng)動(dòng)因邏輯。即當(dāng)技術(shù)、需求等外在條件變化后,企業(yè)從原來(lái)最優(yōu)規(guī)模轉(zhuǎn)變到新最優(yōu)規(guī)模體現(xiàn)的企業(yè)成長(zhǎng)邏輯(納爾遜 等,1982;楊小凱,1994)。該理論基于企業(yè)規(guī)模的最優(yōu)界定,提出技術(shù)、需求等外部因素對(duì)企業(yè)成長(zhǎng)的影響機(jī)制,對(duì)企業(yè)成長(zhǎng)評(píng)價(jià)具有重要價(jià)值。
3.企業(yè)隨機(jī)成長(zhǎng)理論。吉布萊特(1931)提出,企業(yè)成長(zhǎng)獨(dú)立于企業(yè)規(guī)模,影響企業(yè)成長(zhǎng)因素極為復(fù)雜,其成長(zhǎng)是一個(gè)隨機(jī)過(guò)程。它被稱為“吉布萊特定律”。相關(guān)跟進(jìn)研究發(fā)現(xiàn),產(chǎn)業(yè)組織(Lotti el al,2001)、技術(shù)與資本(Cabral,1995)、融資信譽(yù)機(jī)制和法律制度(As1i,1998)及宏觀政策(Thorsten,2002)等外部因素與企業(yè)規(guī)模成長(zhǎng)呈現(xiàn)負(fù)相關(guān)。顯然該理論揭示了企業(yè)成長(zhǎng)受到大量多種類型外部因素影響的高度復(fù)雜性。
4.新制度經(jīng)濟(jì)學(xué)的企業(yè)成長(zhǎng)邊界理論。科斯(1937)以交易費(fèi)用劃分企業(yè)與市場(chǎng)邊界的理論,為理解企業(yè)成長(zhǎng)提供了將市場(chǎng)活動(dòng)放置于企業(yè)內(nèi)部,企業(yè)成長(zhǎng)可以表現(xiàn)為企業(yè)功能多樣化邊界擴(kuò)展的思路。威廉姆森(Williamson,1975,1985) 進(jìn)一步提出企業(yè)與市場(chǎng)的相關(guān)邏輯。即企業(yè)是按一種技術(shù)流程先后連續(xù)生產(chǎn)的一體化組織,其生產(chǎn)的各個(gè)環(huán)節(jié)均可以通過(guò)交易與市場(chǎng)發(fā)生關(guān)聯(lián)。當(dāng)交易存在信息不完全和不對(duì)稱情況,出現(xiàn)違約扯皮等影響生產(chǎn)連貫性問(wèn)題時(shí),企業(yè)可采取將其市場(chǎng)交易的生產(chǎn)活動(dòng)納入企業(yè)內(nèi)部,其成長(zhǎng)表現(xiàn)出企業(yè)縱向邊界的擴(kuò)展。其中,威廉姆森從核心技術(shù)角度,特別提出企業(yè)的“有效邊界”概念。該理論啟發(fā)企業(yè)成長(zhǎng)研究對(duì)市場(chǎng)組織效率因素影響的深入思考。
5.管理驅(qū)動(dòng)的企業(yè)成長(zhǎng)論。主要是Penrose提出企業(yè)資源決定能力,能力進(jìn)而決定成長(zhǎng)理論[3]。企業(yè)資源包括物質(zhì)和人力資源,管理將二者結(jié)合創(chuàng)造出企業(yè)“主觀”動(dòng)能,即在企業(yè)內(nèi)部實(shí)現(xiàn)物質(zhì)和人力資源的充分挖掘和創(chuàng)新利用的能力。其中,創(chuàng)新包括產(chǎn)品創(chuàng)新和組織創(chuàng)新,
創(chuàng)新能力是發(fā)現(xiàn)潛在成長(zhǎng)機(jī)會(huì)的前提。錢德勒(1977,1992)從歷史和宏觀角度對(duì)企業(yè)制度變遷研究中,推進(jìn)了彭羅斯的理論,發(fā)現(xiàn)了現(xiàn)代企業(yè)出現(xiàn)的重大制度變化。即企業(yè)規(guī)模極度擴(kuò)張引發(fā)相應(yīng)管理的高度復(fù)雜化,導(dǎo)致所有權(quán)與管理權(quán)的分離。而兩者分離導(dǎo)致企業(yè)目標(biāo)從所有者的利潤(rùn)最大化,轉(zhuǎn)向管理者利益最大化。其表現(xiàn)為管理者從追求利潤(rùn)轉(zhuǎn)換為追求與企業(yè)規(guī)?;蛟鲩L(zhǎng)密切相關(guān)的企業(yè)價(jià)值的成長(zhǎng)。由此,企業(yè)價(jià)值成為決定企業(yè)實(shí)現(xiàn)穩(wěn)定成長(zhǎng)的因素。顯然管理者在現(xiàn)代企業(yè)成長(zhǎng)中發(fā)揮著決定性作用。
綜上所述,企業(yè)成長(zhǎng)理論歷經(jīng)技術(shù)分工導(dǎo)致企業(yè)規(guī)模經(jīng)濟(jì)的成長(zhǎng),基于技術(shù)與需求變化的規(guī)模最優(yōu)決定,外部因素沖擊下企業(yè)成長(zhǎng)的隨機(jī)演化,企業(yè)將市場(chǎng)交易納入內(nèi)部的縱向邊界擴(kuò)展成長(zhǎng),以及基于企業(yè)家價(jià)值的成長(zhǎng)目標(biāo)轉(zhuǎn)換這樣一個(gè)歷史過(guò)程。但當(dāng)前隨著技術(shù)的快速進(jìn)步,資源配置的全球化,金融交易的機(jī)制深化,人力資本的持續(xù)提升,企業(yè)成長(zhǎng)決定因素及其機(jī)制的復(fù)雜性隨之持續(xù)增加。雖然經(jīng)典理論給出了企業(yè)成長(zhǎng)因素研究的重要思路,但其目前還不能給出邏輯一致的體系化分析,相關(guān)研究仍然具有推進(jìn)企業(yè)成長(zhǎng)性探索的意義。
為充分反應(yīng)評(píng)價(jià)對(duì)象特征的多維性,評(píng)價(jià)研究都傾向建立較為龐大的指標(biāo)體系。但加入過(guò)多不重要信息可能稀釋真正核心重要指標(biāo)的作用[4]。為此,本文在理論分析與趙志偉(2018)研究成果基礎(chǔ)上,構(gòu)建中小企業(yè)成長(zhǎng)性評(píng)價(jià)的簡(jiǎn)化模型,包括企業(yè)家素質(zhì)、創(chuàng)新成長(zhǎng)能力、管理成長(zhǎng)支撐、行業(yè)成長(zhǎng)空間及產(chǎn)品成長(zhǎng)動(dòng)力五大要素,具體內(nèi)容如表1所示。指標(biāo)體系中含有5個(gè)難以直接測(cè)度的定性指標(biāo)。
表1 中小企業(yè)成長(zhǎng)性評(píng)價(jià)指標(biāo)體系
基于大數(shù)據(jù)的經(jīng)濟(jì)變量測(cè)度方法近年來(lái)得到了快速發(fā)展,如喬晗利用超市電子數(shù)據(jù)測(cè)度消費(fèi)價(jià)格水平,Baker等通過(guò)計(jì)算主流報(bào)紙的關(guān)鍵詞出現(xiàn)頻率測(cè)度經(jīng)濟(jì)政策的不確定性[5-6]。本文借鑒上述思路,編寫爬蟲(chóng)程序抓取網(wǎng)絡(luò)文本信息,并利用文本挖掘技術(shù)測(cè)度中小企業(yè)成長(zhǎng)性評(píng)價(jià)中的定性指標(biāo)。
首先根據(jù)指標(biāo)特征,利用Python編寫爬蟲(chóng)程序抓取指標(biāo)測(cè)度所需的文本信息,如表2所示。然后利用Python第三方庫(kù)jieba對(duì)抓取的文本信息進(jìn)行替換、刪除和分詞操作,并建立字典,提高分詞的準(zhǔn)確性,為后續(xù)文本信息的挖掘奠定基礎(chǔ)。
表2 定性指標(biāo)測(cè)度方式
百度AI語(yǔ)義分類器適合情感分析,而“企業(yè)家聲譽(yù)”與“市場(chǎng)認(rèn)可度”的文本信息更多的是情感表達(dá),因此利用百度AI語(yǔ)義分類器作為上述兩指標(biāo)的語(yǔ)義分析與測(cè)度工具。以前者為例,假設(shè)抓取的企業(yè)i(i=1,2,…,k)企業(yè)家聲譽(yù)文本信息數(shù)量為ni,則對(duì)于特定某條文本j(0 (1) 同理,指標(biāo)“市場(chǎng)認(rèn)可度”亦如此。 (2) 其中wh(h=1,2,…,H)表示對(duì)應(yīng)分類下的權(quán)重。 基于綜合評(píng)價(jià)方法構(gòu)建的中小企業(yè)成長(zhǎng)性評(píng)價(jià)模型,通常僅能給出企業(yè)成長(zhǎng)性的排序信息,且難以檢驗(yàn)評(píng)價(jià)結(jié)果的可靠性。本文利用隨機(jī)森林等四種機(jī)器學(xué)習(xí)分類算法,建立成長(zhǎng)性預(yù)測(cè)模型,通過(guò)充分挖掘歷史信息的方式,增加評(píng)價(jià)結(jié)果的分類信息,并提供一種檢驗(yàn)綜合評(píng)價(jià)模型可靠性的思路。 為保證數(shù)據(jù)的可得性、代表性與完整性,本文選取我國(guó)中小板699家上市公司年作為訓(xùn)練樣本。其中輸入變量為樣本企業(yè)2013年49個(gè)財(cái)務(wù)指標(biāo)數(shù)據(jù)。輸出變量選擇上,現(xiàn)有衡量成長(zhǎng)性的單一指標(biāo)主要采用主營(yíng)業(yè)務(wù)收入增長(zhǎng)率(Dunne & Hughes,2013)或托賓Q(于旭等,2012)。但實(shí)質(zhì)兩者存在本質(zhì)差異:前者反映給定時(shí)間內(nèi)企業(yè)成長(zhǎng)的歷史表現(xiàn),后者則是利用當(dāng)期數(shù)據(jù)預(yù)測(cè)企業(yè)未來(lái)成長(zhǎng)趨勢(shì)。顯然,前者作為機(jī)器學(xué)習(xí)的輸出變量更為恰當(dāng)。因此,本文利用2011-2017年間樣本企業(yè)主營(yíng)業(yè)務(wù)收入增長(zhǎng)率作為輸出變量。所有數(shù)據(jù)來(lái)源于國(guó)泰安數(shù)據(jù)庫(kù)。 在數(shù)據(jù)預(yù)處理方面,首先進(jìn)行數(shù)據(jù)清洗,檢查是否有錯(cuò)誤數(shù)據(jù),并利用拉格朗日插值法填補(bǔ)缺失數(shù)據(jù)。在此基礎(chǔ)上對(duì)輸出變量的連續(xù)型數(shù)據(jù)進(jìn)行轉(zhuǎn)換,以適應(yīng)分類算法的需要,即將主營(yíng)業(yè)務(wù)收入增長(zhǎng)率排名前30%標(biāo)記為高成長(zhǎng)企業(yè)(輸出變量記為1),剩余為非高成長(zhǎng)企業(yè)(輸出變量記為0)。 基于上述訓(xùn)練樣本,本文選取隨機(jī)森林、Adaboost、支持向量機(jī)和樸素貝葉斯四種經(jīng)典分類算法,分別構(gòu)建中小企業(yè)成長(zhǎng)性預(yù)測(cè)模型,并采用十折交叉驗(yàn)證法檢驗(yàn)四種分類算法的可靠性,并評(píng)價(jià)不同算法對(duì)數(shù)據(jù)集的泛化能力??紤]到歷史數(shù)據(jù)的長(zhǎng)度可能會(huì)對(duì)企業(yè)成長(zhǎng)性預(yù)測(cè)產(chǎn)生影響,本文采用三個(gè)時(shí)間段的數(shù)據(jù)分別作為訓(xùn)練模型,最終預(yù)測(cè)精度如表3所示。 表3結(jié)果顯示,四種算法中除樸素貝葉斯分類算法預(yù)測(cè)精度稍低以外,其余三種均表現(xiàn)出了較好的預(yù)測(cè)能力;歷史數(shù)據(jù)長(zhǎng)度沒(méi)有對(duì)預(yù)測(cè)精度構(gòu)成較大影響。2012-2017年數(shù)據(jù)在四種算法中的預(yù)測(cè)精度均較高,表明當(dāng)模型利用當(dāng)前數(shù)據(jù)預(yù)測(cè)5年內(nèi)的企業(yè)成長(zhǎng)時(shí)更為有效。因此,基于隨機(jī)森林、Adaboost和支持向量機(jī)三種算法訓(xùn)練的模型適合用于預(yù)測(cè)中小企業(yè)的成長(zhǎng)性。應(yīng)當(dāng)指出的是,雖然上述機(jī)器學(xué)習(xí)算法能夠直接給出中小企業(yè)成長(zhǎng)性的分類預(yù)測(cè)信息,但由于其沒(méi)有理論依據(jù),且缺乏政策空間,因此本文僅將其定位于成長(zhǎng)性評(píng)價(jià)模型的檢驗(yàn)與補(bǔ)充。 3)用三根木條制作一個(gè)三角形的架子①,再用四根木條釘一個(gè)四邊形的架子②,分別拉動(dòng)架子①和②的邊框,你有什么發(fā)現(xiàn)?(質(zhì)疑4) 表3 四種算法10折交叉驗(yàn)證精度結(jié)果 這里選取中小板20家上市公司[注]本文遵循隨機(jī)原則選取樣本企業(yè),利用簡(jiǎn)單隨機(jī)抽樣方法選取,根據(jù)抽樣結(jié)果顯示,20家企業(yè)分布于9個(gè)地區(qū)的7個(gè)行業(yè),具有一定代表性。為研究對(duì)象,利用上文構(gòu)建的指標(biāo)體系及相應(yīng)測(cè)度方法評(píng)價(jià)其成長(zhǎng)性,并通過(guò)基于機(jī)器學(xué)習(xí)算法建立成長(zhǎng)性預(yù)測(cè)模型,在檢驗(yàn)評(píng)價(jià)結(jié)論可行性與有效性的同時(shí),提供企業(yè)成長(zhǎng)性的分類信息,為投資決策提供更多依據(jù)。定量指標(biāo)數(shù)據(jù)主要來(lái)源于國(guó)泰安數(shù)據(jù)庫(kù)、上市公司年報(bào)及評(píng)價(jià)企業(yè)主頁(yè)。由于存在敏感指標(biāo)(如企業(yè)家聲譽(yù)等),本文隱去評(píng)價(jià)企業(yè)名稱,并用編號(hào)(j=1,2,…,20)代替。 首先借鑒趙志偉(2018)的研究成果,對(duì)各企業(yè)定量指標(biāo)“研發(fā)費(fèi)用占比(X3)”、“研發(fā)人員占比(X4)”、主營(yíng)業(yè)務(wù)收入增長(zhǎng)率(X6)、行業(yè)平均利潤(rùn)率(X9)及產(chǎn)品利潤(rùn)與營(yíng)銷成本比(X11)進(jìn)行測(cè)度。企業(yè)員工離職率(X7)是負(fù)向指標(biāo),通過(guò)用1減去該指標(biāo)的方式正向化。企業(yè)文化創(chuàng)立時(shí)間(X8)通過(guò)查找公司主頁(yè)相關(guān)內(nèi)容計(jì)算。 對(duì)于指標(biāo)“政策支持程度(X10)”,通過(guò)利用Python編寫爬蟲(chóng)程序,抓取人民網(wǎng)財(cái)經(jīng)頻道2018年1月1日至6月20日期間,“行業(yè)名+國(guó)家+政策”或“行業(yè)名+部(委)+政策”的詞語(yǔ)組合在文本信息中出現(xiàn)的頻率進(jìn)行測(cè)度:頻率越高說(shuō)明企業(yè)所處行業(yè)受到政策支持力度越大。 對(duì)于指標(biāo)“企業(yè)家聲譽(yù)(X1)”、“市場(chǎng)認(rèn)可程度(X12)”、“企業(yè)家能力(X2)”和“技術(shù)領(lǐng)先程度(X5)”,根據(jù)上文方法抓取2017年1月1日至2018年6月1日期間相應(yīng)網(wǎng)頁(yè)(如表2所示)的評(píng)論信息,并進(jìn)行語(yǔ)義分析。其中分類數(shù)量H的確定,需要同時(shí)權(quán)衡指標(biāo)測(cè)度精度要求與分類精度。因?yàn)殡m然H越大越有利于指標(biāo)測(cè)度,但同時(shí)可能會(huì)大幅降低分類精度。為此,本文在相同訓(xùn)練樣本條件下,設(shè)定H的取值分別為3和5進(jìn)行驗(yàn)證集精度的比較。與此同時(shí),還利用百度AI語(yǔ)義分類器進(jìn)行精度比較,以檢驗(yàn)是否有必要利用樸素貝葉斯分類算法,具體結(jié)果如表4所示。其中wh在H=3和H=5下分別為0.5,0,0.5和0.3,0.2,0,0.2,0.3。 通過(guò)表4可知,樸素貝葉斯分類器3分類時(shí)在驗(yàn)證集上具有更高的預(yù)測(cè)精度,且精度要高,一方面說(shuō)明了本文人工構(gòu)建訓(xùn)練集并使用樸素貝葉斯分類器的必要性,另一方面也表明樸素貝葉斯分類器在多分類預(yù)測(cè)時(shí)表現(xiàn)較差?;谏鲜龇治霰疚牧頗=3。在此基礎(chǔ)上利用公式(2)計(jì)算各企業(yè)在X2和X5下的指標(biāo)值。 表4 不同分類器的預(yù)測(cè)精度 首先無(wú)量綱化指標(biāo)信息。無(wú)量綱化方法的選擇及所導(dǎo)致原始數(shù)據(jù)分布的變化,都會(huì)直接影響綜合評(píng)價(jià)的最終結(jié)果(喬晗,2015)。為了保證原始變量相對(duì)變異信息保持不變,本文選用如下均值化方法去除指標(biāo)值的量綱,其中: (3) 為了檢驗(yàn)本文第二部分構(gòu)建的中小企業(yè)成長(zhǎng)性評(píng)價(jià)模型及第三部分的指標(biāo)測(cè)度方法的有效性,除模型1以外,本文還依次列出了如下7個(gè)中小企業(yè)成長(zhǎng)性評(píng)價(jià)(預(yù)測(cè))模型結(jié)果,并將結(jié)果報(bào)告在表5中。模型2為表1去除5個(gè)定性指標(biāo)后20家中小企業(yè)的成長(zhǎng)性排名,通過(guò)結(jié)果可以發(fā)現(xiàn)排序結(jié)果發(fā)生了較大變化,說(shuō)明本文加入的定性信息對(duì)中小企業(yè)成長(zhǎng)性評(píng)價(jià)結(jié)論具有較大影響。為了進(jìn)一步驗(yàn)證本文建立的評(píng)價(jià)模型的有效性,本文利用國(guó)家經(jīng)貿(mào)委等(1999)及趙志偉(2018)的研究成果對(duì)本文20個(gè)企業(yè)樣本展開(kāi)評(píng)價(jià)[7]。最終結(jié)果分別為模型3和模型4的排序,比較發(fā)現(xiàn)雖然模型1、3和4均為中小企業(yè)成長(zhǎng)性評(píng)價(jià),但評(píng)價(jià)結(jié)論表現(xiàn)出一定的差異。那么實(shí)踐中到底采用哪個(gè)評(píng)價(jià)模型指導(dǎo)投資決策呢?由此引出評(píng)價(jià)結(jié)論的檢驗(yàn)問(wèn)題,這是當(dāng)前綜合評(píng)價(jià)方法研究始終面臨的一個(gè)難題。更為重要的是,雖然評(píng)價(jià)模型1-4均給出了20家中小企業(yè)的成長(zhǎng)性排序,但依然無(wú)法為決策者提供出哪些企業(yè)是否具備高成長(zhǎng)性的建議,因?yàn)榧词古琶?的企業(yè)也不一定具備高成長(zhǎng)型。上述兩方面問(wèn)題降低了綜合評(píng)價(jià)方法對(duì)于實(shí)踐工作的指導(dǎo)價(jià)值。為此,本文利用第四部分構(gòu)建的基于4種機(jī)器學(xué)習(xí)分類模型對(duì)評(píng)價(jià)結(jié)論進(jìn)行檢驗(yàn),結(jié)果如表5模型5-8所示,分別為隨機(jī)森林、Adaboost、支持向量機(jī)與樸素貝葉斯四種算法。通過(guò)結(jié)果比較發(fā)現(xiàn),前三種分類算法結(jié)論較為一致,且與本文構(gòu)建的綜合評(píng)價(jià)模型結(jié)論(模型1)更為接近:模型1排名前7位的企業(yè)幾乎均被三種算法視為高成長(zhǎng)型企業(yè),排名后5位也被三種算法視為非高成長(zhǎng)型企業(yè)。 表5 20家中小企業(yè)成長(zhǎng)性綜合評(píng)價(jià)值及相應(yīng)排序與分類 最終通過(guò)機(jī)器學(xué)習(xí)算法構(gòu)建的中小企業(yè)成長(zhǎng)性分類模型檢驗(yàn)可知,本文構(gòu)建的中小企業(yè)成長(zhǎng)性評(píng)價(jià)模型更為有效,且在20個(gè)中小企業(yè)中,序號(hào)為6、3、10、16及1這五家企業(yè)具有高成長(zhǎng)型,具備投資價(jià)值。 本文在企業(yè)成長(zhǎng)相關(guān)理論基礎(chǔ)上融入當(dāng)前PE/VC投資理念,利用綜合評(píng)價(jià)方法與機(jī)器學(xué)習(xí)算法,分別建立了企業(yè)成長(zhǎng)性的評(píng)價(jià)(排序)模型與預(yù)測(cè)(分類)模型,并利用網(wǎng)絡(luò)爬蟲(chóng)和文本挖掘技術(shù)測(cè)度定性指標(biāo),力圖為政府對(duì)中小企業(yè)扶植政策的實(shí)施,及其政策效果識(shí)別提供評(píng)價(jià)依據(jù),同時(shí)也為金融資本向中小企業(yè)投資提供成長(zhǎng)性評(píng)價(jià)的理論方法參考。 具體主要完成以下工作:第一,在已有研究成果基礎(chǔ)上重構(gòu)中小企業(yè)成長(zhǎng)性評(píng)價(jià)模型及相應(yīng)簡(jiǎn)化指標(biāo)體系,力圖用更少的信息預(yù)測(cè)企業(yè)成長(zhǎng)。實(shí)證檢驗(yàn)結(jié)果表明該模型及指標(biāo)體系具備有效性。第二,利用基于靜態(tài)與動(dòng)態(tài)網(wǎng)頁(yè)爬蟲(chóng)技術(shù)抓取網(wǎng)絡(luò)文本信息,并以此為依據(jù)測(cè)度中小企業(yè)成長(zhǎng)性評(píng)價(jià)指標(biāo)體系中難以直接描述的定性指標(biāo),解決了評(píng)價(jià)指標(biāo)信息不充分的問(wèn)題。第三,利用機(jī)器學(xué)習(xí)算法構(gòu)建了中小企業(yè)成長(zhǎng)性預(yù)測(cè)模型,解決了中小企業(yè)成長(zhǎng)性評(píng)價(jià)因結(jié)論信息量不足而難以直接投資實(shí)踐的問(wèn)題,并為檢驗(yàn)評(píng)價(jià)模型結(jié)論有效性提供一種新思路。四、成長(zhǎng)性預(yù)測(cè)模型構(gòu)建
(一)樣本與數(shù)據(jù)
(二)模型訓(xùn)練
五、成長(zhǎng)性評(píng)價(jià)方法應(yīng)用研究
(一)指標(biāo)測(cè)度
(二)評(píng)價(jià)信息集成
(三)有效性檢驗(yàn)
六、主要結(jié)論