楊聯(lián)強(qiáng),葉夢(mèng)琳,程丹丹,劉美月
(安徽大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,合肥 230601)
自改革開(kāi)放以來(lái),中國(guó)經(jīng)濟(jì)迅速發(fā)展,國(guó)內(nèi)各種形式的一體化蓬勃興起,各地區(qū)經(jīng)濟(jì)正在成為一個(gè)相互依賴(lài)相互聯(lián)系的有機(jī)整體。然而中國(guó)東西部的區(qū)域經(jīng)濟(jì)發(fā)展出現(xiàn)較大的不平衡,主要體現(xiàn)在東部發(fā)展較快,但是中西部由于受地理位置的約束,造成經(jīng)濟(jì)發(fā)展遲緩,東部和西部的人均GDP和居民收入存在顯著的差異。[1]以上市公司數(shù)量為例,中國(guó)上市公司主要集中在東部地區(qū),中西部地區(qū)上市公司分布相對(duì)分散,數(shù)量上也呈現(xiàn)劣勢(shì)。調(diào)查發(fā)現(xiàn),中國(guó)各地區(qū)上市公司數(shù)量分布存在明顯的階梯型特點(diǎn)。[2]如何選取合適的計(jì)量經(jīng)濟(jì)方法,研究上市公司區(qū)域分布差異性,值得進(jìn)行深入探討。
民營(yíng)企業(yè)是推動(dòng)中國(guó)經(jīng)濟(jì)發(fā)展不可或缺的力量。例如,去年以來(lái),中國(guó)民營(yíng)上市公司積極應(yīng)對(duì)疫情挑戰(zhàn),生產(chǎn)經(jīng)營(yíng)情況明顯好于國(guó)有、外資企業(yè),展現(xiàn)出較強(qiáng)的發(fā)展活力。民營(yíng)企業(yè)具有收入增長(zhǎng)快、營(yíng)業(yè)成本低、效益恢復(fù)好、研發(fā)強(qiáng)度高、發(fā)展預(yù)期穩(wěn)、公司規(guī)模小、易吸納勞動(dòng)力等特點(diǎn)。[3]從國(guó)有與民營(yíng)企業(yè)對(duì)于區(qū)域人均財(cái)政收入、居民人均可支配收入、人均GDP三個(gè)維度衡量的區(qū)域經(jīng)濟(jì)貢獻(xiàn)看,二者差異顯著。國(guó)有企業(yè)僅在增值稅對(duì)于區(qū)域人均財(cái)政收入影響方面優(yōu)于民營(yíng)企業(yè),在所得稅對(duì)于區(qū)域人均財(cái)政收入的影響和總資產(chǎn)對(duì)于人均GDP影響方面二者近似外,其它所有的解釋變量均是民營(yíng)企業(yè)優(yōu)于國(guó)有企業(yè)。中國(guó)的民營(yíng)企業(yè)不僅在微觀效率上具有優(yōu)勢(shì),在區(qū)域宏觀經(jīng)濟(jì)的貢獻(xiàn)方面,同樣具有明顯的優(yōu)勢(shì)。[4]
本文選取各省市民營(yíng)上市公司數(shù)量為因變量,參照已有研究文獻(xiàn),測(cè)度區(qū)域經(jīng)濟(jì)發(fā)展程度的變量,可以從不同維度來(lái)衡量民營(yíng)經(jīng)濟(jì)的貢獻(xiàn)。經(jīng)濟(jì)增長(zhǎng)是區(qū)域發(fā)展程度不可或缺的衡量維度之一,而民營(yíng)企業(yè)的發(fā)展離不開(kāi)一個(gè)地區(qū)的自然資源、社會(huì)資源、發(fā)達(dá)的交通,與企業(yè)相關(guān)的科學(xué)研究更是影響了企業(yè)發(fā)展的未來(lái)。故本文選取各省市區(qū)域面積、人口數(shù)、鐵路營(yíng)業(yè)里程、公路里程、電力消耗量、地級(jí)及以上城市數(shù)、城區(qū)面積、地區(qū)生產(chǎn)總值、R&D人員全時(shí)當(dāng)量、R&D經(jīng)費(fèi)、R&D項(xiàng)目數(shù)、有效發(fā)明專(zhuān)利數(shù)、普通高等學(xué)校數(shù)、普通本專(zhuān)科招生數(shù)、普通本專(zhuān)科在校學(xué)生數(shù)、技術(shù)市場(chǎng)成交額等作為自變量來(lái)分析它們之間的相關(guān)性。[5]然而中國(guó)上市公司區(qū)域分布數(shù)量明顯呈現(xiàn)不合理性,并且在某些地區(qū)過(guò)于集中在少數(shù)省、市,如廣東和上海。在很大程度上會(huì)形成異常值或離群值,如果利用經(jīng)典的均值回歸模型,那么在計(jì)算過(guò)程中對(duì)每個(gè)觀測(cè)值都賦予相同的權(quán)重,由此帶來(lái)對(duì)異常值的處理不當(dāng),使回歸系數(shù)估計(jì)產(chǎn)生較大偏差,從而大大影響回歸模型的有效性。[6]另外,采用嚴(yán)格的穩(wěn)健回歸模型應(yīng)用于全國(guó)各省市民營(yíng)公司分布數(shù)量差異研究相對(duì)匱乏,這為本文提供了立題依據(jù)。鑒于此,本文將選擇合適的計(jì)量經(jīng)濟(jì)模型時(shí),加入模型穩(wěn)健性的理論分析,并創(chuàng)新性的將合適的穩(wěn)健回歸模型應(yīng)用于中國(guó)民營(yíng)上市公司分布與區(qū)域要素的相關(guān)性分析上,從而排除異常值的過(guò)渡干擾,更可靠的揭示真實(shí)的相關(guān)性,為相關(guān)的政策建議給出更準(zhǔn)確的數(shù)據(jù)分析結(jié)果支撐。[7]
市公司區(qū)域分布差異涉及多個(gè)方面, 本研究以2017年中國(guó)民營(yíng)企業(yè)上市公司為例,從面積(x1)、人口數(shù)(x2)、鐵路營(yíng)業(yè)里程(x3)、公路里程(x4)、電力消耗量(x5)、地級(jí)及以上城市數(shù)(x6)、城區(qū)面積(x7)、地區(qū)生產(chǎn)總值(x8)、R&D人員全時(shí)當(dāng)量(x9)、R&D經(jīng)費(fèi)(x10)、R&D項(xiàng)目數(shù)(x11)、有效發(fā)明專(zhuān)利數(shù)(x12)、普通高等學(xué)校數(shù)(x13)、普通本專(zhuān)科招生數(shù)(x14)、普通本專(zhuān)科在校學(xué)生數(shù)(x15)、技術(shù)市場(chǎng)成交額(x16)等多方面進(jìn)行研究, 各變量的描述統(tǒng)計(jì)如表1。各自變量與因變量(y)之間的散點(diǎn)圖如圖1所示。
表1 各自變量描述統(tǒng)計(jì)量
續(xù)表1 各自變量描述統(tǒng)計(jì)量
圖1 變量間的散點(diǎn)圖
本文的數(shù)據(jù)均來(lái)自中國(guó)統(tǒng)計(jì)年鑒,數(shù)據(jù)的分析、處理和計(jì)算均在SPSS 26.0中完成。
穩(wěn)健回歸是基于異常值提出來(lái)的一種用于改良最小二乘估計(jì)的統(tǒng)計(jì)回歸方法,它基于迭代最小二乘法在一定程度上減小了異常值對(duì)回歸估計(jì)的影響,從而提高了回歸模型的有效性。[11]對(duì)于一個(gè)因變量的變動(dòng)與多個(gè)解釋變量有關(guān)的線(xiàn)性模型,考慮分別用最小二乘估計(jì)和穩(wěn)健回歸模型來(lái)分析一般的多元線(xiàn)性回歸模型。
1.2.1 最小二乘估計(jì)
考慮模型
y=Xβ+u
最小二乘估計(jì)的目標(biāo)函數(shù)為
最小化該目標(biāo)函數(shù)可得正規(guī)方程組
由此可以得到,最小方差無(wú)偏估計(jì)
大家知道,線(xiàn)性回歸模型的上述最小二乘估計(jì)量,在噪聲 服從高斯或次高斯分布的條件下,有著最優(yōu)的估計(jì)效率。
1.2.2 穩(wěn)健回歸模型
線(xiàn)性模型的最小二乘估計(jì)雖然在一定條件下有著優(yōu)秀的表現(xiàn),但如果樣本點(diǎn)存在異常值,此時(shí)采用最小二乘估計(jì)卻會(huì)產(chǎn)生較大的偏差,也就是說(shuō)該方法的穩(wěn)健性不夠。因此,再采用穩(wěn)健回歸模型對(duì)本文問(wèn)題進(jìn)行建模分析,看最終的結(jié)果有何差異。選取Huber損失函數(shù)
其中,c為調(diào)和常數(shù),本文取c=1.345。
于是目標(biāo)函數(shù)
(1)
極小化(1)式(即對(duì)β求偏導(dǎo),并令其為零)可得:
令權(quán)重
于是
具體迭代步驟描述如下:
(1)取迭代初值:選取最小二乘估計(jì)的參數(shù)向量(X′X)-1X′y作為本次迭代的初值β(k);
(2)求初始?xì)埐睿豪玫踔涤?jì)算初始?xì)埐頴i=yi-Xiβ(k);
(4)令權(quán)重向量w=(w1,w2,…,wn)′,將其化成對(duì)角陣W=diag(w),帶入β(k+1)=(X′WX)-1X′Wy,求得β1,進(jìn)而求得新的殘差與權(quán)重向量;
(5)再返回步驟(2),計(jì)算每一步迭代的β(k),若每一個(gè)估計(jì)值都滿(mǎn)足:
則β(k+1)即為所求估計(jì)值(ε為預(yù)先設(shè)定的誤差容忍度)。
以民企上市公司數(shù)量為因變量,面積/平方公里, 人口/萬(wàn)人, 鐵路營(yíng)業(yè)里程/公里等為自變量,建立如上的多元線(xiàn)性回歸模型,分別采用最小二乘估計(jì)和穩(wěn)健回歸擬合方程的系數(shù),分析回歸方程的顯著性以及回歸系數(shù)的顯著性,觀察在兩種不同的方法下的差異性,從而理解穩(wěn)健回歸在處理異常值時(shí)的意義所在。下面比較最小二乘法與穩(wěn)健回歸下回歸方程的顯著性與回歸系數(shù)的顯著性。
由最小二乘估計(jì)分析結(jié)果可知,模型R2=0.971,意味著各省市面積/平方公里、人口/萬(wàn)人、鐵路營(yíng)業(yè)里程/公里等各解釋變量可以解釋民企上市公司數(shù)量的97.11%變化原因。
首先進(jìn)行回歸方程的顯著性檢驗(yàn),發(fā)現(xiàn)在檢驗(yàn)水平α=0.05的檢驗(yàn)下模型通過(guò)F檢驗(yàn)(F=29.450,p=0.000<0.05),即各省市面積/平方公里、人口/萬(wàn)人、鐵路營(yíng)業(yè)里程/公里等各解釋變量至少有一項(xiàng)會(huì)對(duì)民企上市公司數(shù)量產(chǎn)生影響關(guān)系。
再進(jìn)行回歸系數(shù)的顯著性檢驗(yàn),以各省市面積/平方公里為例:面積/平方公里的回歸系數(shù)值為0.000,但是并沒(méi)有呈現(xiàn)出顯著性(t=0.210,p=0.837>0.05),意味著面積/平方公里并不會(huì)對(duì)民企上市公司數(shù)量產(chǎn)生顯著影響關(guān)系。以此類(lèi)推可以得到下面的結(jié)論:
面積/平方公里, 人口/萬(wàn)人, 鐵路營(yíng)業(yè)里程/公里等均不會(huì)對(duì)民企上市公司數(shù)量產(chǎn)生顯著影響關(guān)系。(下面利用同樣的方法進(jìn)行分析,不再贅述)
然而觀察數(shù)據(jù)表發(fā)現(xiàn)其中存在矛盾:數(shù)據(jù)表中可以看出地區(qū)生產(chǎn)總值高的地區(qū)民企上市公司數(shù)量較多,例如,上海、安徽、新疆的地區(qū)生產(chǎn)總值分別為30 632.99、27 018、10 881.96億元,北京、安徽、新疆的民企上市公司數(shù)量分別為157、60、29所,綜合表中數(shù)據(jù)可判斷出地區(qū)生產(chǎn)總值對(duì)民企上市公司數(shù)量呈顯著的正向影響。此外,R&D經(jīng)費(fèi)(全社會(huì)研究與實(shí)驗(yàn)發(fā)展經(jīng)費(fèi))支出指統(tǒng)計(jì)年度內(nèi)全社會(huì)實(shí)際用于基礎(chǔ)研究、應(yīng)用研究和實(shí)驗(yàn)發(fā)展的經(jīng)費(fèi)支出,即對(duì)經(jīng)濟(jì)發(fā)展產(chǎn)生間接影響。另外,由于研究具有不確定性,需要大量科學(xué)技術(shù)支持,常常無(wú)法帶來(lái)盈利且需要花費(fèi)大量費(fèi)用。故R&D經(jīng)費(fèi)應(yīng)對(duì)民企上市公司數(shù)量呈顯著的負(fù)向影響。綜上,由于上述分析與結(jié)論的矛盾性,考慮OLS分析在本次檢驗(yàn)中的不準(zhǔn)確性,因此,下面研究穩(wěn)健回歸分析在本次檢驗(yàn)中的準(zhǔn)確性。
由穩(wěn)健回歸分析結(jié)果可知,回歸方程的顯著性檢驗(yàn):在檢驗(yàn)水平α=0.05的檢驗(yàn)下模型通過(guò)F檢驗(yàn)(F=24.861,p=0.000<0.05),即各省市面積/平方公里、人口/萬(wàn)人、鐵路營(yíng)業(yè)里程/公里等各解釋變量至少有一項(xiàng)會(huì)對(duì)民企上市公司數(shù)量產(chǎn)生影響關(guān)系。
回歸系數(shù)的顯著性檢驗(yàn):由上表可知,地區(qū)生產(chǎn)總值/億元、R&D項(xiàng)目數(shù)、有效發(fā)明專(zhuān)利數(shù)/件、技術(shù)市場(chǎng)成交額/萬(wàn)元會(huì)對(duì)民企上市公司數(shù)量產(chǎn)生顯著的正向影響關(guān)系,R&D經(jīng)費(fèi)/萬(wàn)元會(huì)對(duì)民企上市公司數(shù)量產(chǎn)生顯著的負(fù)向影響關(guān)系,面積/平方公里、人口/萬(wàn)人、鐵路營(yíng)業(yè)里程/公里、公路里程/公里、電力消費(fèi)量/億千瓦小時(shí)、R&D人員全時(shí)當(dāng)量/人年、地級(jí)及以上城市數(shù)/個(gè)、城區(qū)面積/平方公里、普通高等學(xué)校、普通本專(zhuān)科招生數(shù)、普通本專(zhuān)科在校學(xué)生數(shù)不會(huì)對(duì)民企上市公司數(shù)量產(chǎn)生顯著影響關(guān)系。
在本文中,地區(qū)生產(chǎn)總值/億元、R&D經(jīng)費(fèi)/萬(wàn)元、R&D項(xiàng)目數(shù)、有效發(fā)明專(zhuān)利數(shù)/件、以及技術(shù)市場(chǎng)成交額/萬(wàn)元這幾個(gè)解釋變量在最小二乘估計(jì)下對(duì)民企上市公司數(shù)量沒(méi)有顯著性影響,而在穩(wěn)健回歸下對(duì)民企上市公司數(shù)量產(chǎn)生了顯著性影響,這恰恰說(shuō)明了穩(wěn)健回歸在處理異常值時(shí)的優(yōu)良性,這種回歸本身具有克服或消除樣本數(shù)據(jù)波動(dòng)性的功能,相較于最小二乘估計(jì)能夠更好地?cái)M合出被解釋變量與解釋變量的關(guān)系。
最小二乘估計(jì)與穩(wěn)健估計(jì)的本質(zhì)差異在于前者賦予觀測(cè)值相同的權(quán)重,后者利用迭代最小二乘法減小異常值對(duì)回歸估計(jì)的影響,從而認(rèn)識(shí)到穩(wěn)健回歸在處理異常值時(shí)的優(yōu)良性。
由模型分析結(jié)果了解到,地區(qū)生產(chǎn)總值/億元、R&D經(jīng)費(fèi)/萬(wàn)元、R&D項(xiàng)目數(shù)、有效發(fā)明專(zhuān)利數(shù)/件、以及技術(shù)市場(chǎng)成交額/萬(wàn)元這幾個(gè)解釋變量在兩種估計(jì)下對(duì)民營(yíng)上市公司數(shù)量產(chǎn)生了不同的影響。從前文對(duì)解釋變量的描述性統(tǒng)計(jì)中得知,地區(qū)生產(chǎn)力的發(fā)展與科技的進(jìn)步對(duì)經(jīng)濟(jì)的影響是毋庸置疑的。顯然在這組數(shù)據(jù)下,穩(wěn)健回歸的估計(jì)結(jié)果更加接近真實(shí)情況。
因此,在解決此類(lèi)問(wèn)題時(shí),需要著重考慮對(duì)經(jīng)濟(jì)生產(chǎn)力與科學(xué)技術(shù)進(jìn)步產(chǎn)生顯著影響的解釋變量,如果發(fā)現(xiàn)數(shù)據(jù)存在明顯的異常值,采用穩(wěn)健回歸也許會(huì)得到較佳的結(jié)果。[11]綜合本文分析結(jié)果,為了減小區(qū)域經(jīng)濟(jì)發(fā)展差異,促進(jìn)各地協(xié)調(diào)發(fā)展,建議鼓勵(lì)以科技創(chuàng)新驅(qū)動(dòng)轉(zhuǎn)型升級(jí),助力區(qū)域跨越式發(fā)展;支持民營(yíng)企業(yè)發(fā)展,促進(jìn)區(qū)域協(xié)調(diào)發(fā)展;踐行綠色發(fā)展理念,增強(qiáng)可持續(xù)發(fā)展能力。[12]