裴艷麗,趙 龍
(揚(yáng)州大學(xué) 廣陵學(xué)院,江蘇 揚(yáng)州 225000)
改革開(kāi)放40 多年來(lái),外商直接投資在中國(guó)經(jīng)濟(jì)高質(zhì)量發(fā)展中發(fā)揮了重要作用,高度流動(dòng)性的外商直接投資促進(jìn)我國(guó)產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型升級(jí),也為我國(guó)跨國(guó)公司核心競(jìng)爭(zhēng)力的提升創(chuàng)造了條件。但外商直接投資呈現(xiàn)區(qū)位分布不均衡、結(jié)構(gòu)分布不合理等特征,制約了地區(qū)經(jīng)濟(jì)協(xié)同發(fā)展。不少學(xué)者都對(duì)FDI的空間分布特征進(jìn)行研究,但應(yīng)用經(jīng)濟(jì)學(xué)在研究過(guò)程中經(jīng)常會(huì)遇到一個(gè)普遍存在的問(wèn)題,即研究人員在面對(duì)大數(shù)據(jù)時(shí)經(jīng)常需要弄清楚不同研究對(duì)象的實(shí)際分布特征,對(duì)現(xiàn)行經(jīng)濟(jì)數(shù)據(jù)通過(guò)校準(zhǔn)隨機(jī)模型參數(shù)進(jìn)行準(zhǔn)確描述,對(duì)未來(lái)趨勢(shì)發(fā)展進(jìn)行準(zhǔn)確預(yù)測(cè)。
對(duì)FDI 分布特征的研究大多從其區(qū)位影響因素著手,分析傳統(tǒng)因素和新經(jīng)濟(jì)因素在FDI 區(qū)位選擇中分別發(fā)揮的作用。Coughlin 等(1991)[1]以美國(guó)各州外商直接投資的區(qū)位分布實(shí)際數(shù)值為準(zhǔn)探究發(fā)展?jié)摿?、聚集水平、投資能力對(duì)區(qū)位選擇的影響。Haskcl 等(2007)[2]認(rèn)為外商直接投資的區(qū)位分布會(huì)影響本地區(qū)和相鄰地區(qū)的經(jīng)濟(jì)效率。Judson 和Owen(1999)[3]構(gòu)建計(jì)量經(jīng)濟(jì)模型,最終發(fā)現(xiàn)通貨膨脹率和GDP 水平對(duì)區(qū)位選擇的影響是顯著的,政府政策的加持加大了其顯著性的體現(xiàn)。Adhikary(2017)[4]基于最小二乘法對(duì)南亞國(guó)家區(qū)位因素進(jìn)行分析,不同國(guó)家呈現(xiàn)出不同的分布特征,利率、匯率、通貨膨脹率等因素對(duì)南亞國(guó)家區(qū)位分布影響呈現(xiàn)不一樣的表現(xiàn)。顏銀根(2014)[5]運(yùn)用Tobit 面板模型提出同源國(guó)效應(yīng)作為一種新經(jīng)濟(jì)因素對(duì)中國(guó)外商直接投資的區(qū)位選擇產(chǎn)生重大影響。李建華(2019)[6]分析外商直接投資的區(qū)位和產(chǎn)業(yè)特征,發(fā)現(xiàn)產(chǎn)業(yè)集聚與外商直接投資呈相輔相成的關(guān)系,產(chǎn)業(yè)溢出效應(yīng)與效益效應(yīng)并存。除此之外,不少國(guó)內(nèi)外學(xué)者也從空間視角探究外商在華投資的特征和區(qū)位現(xiàn)狀,2000 年Coughlin 最早將計(jì)量經(jīng)濟(jì)學(xué)方法與研究外商直接投資特征相聯(lián)系,發(fā)現(xiàn)從空間視角上,本地區(qū)FDI 與相鄰地區(qū)FDI 呈正相關(guān)關(guān)系。董玉琪(2018)[7]對(duì)江蘇省外商直接投資分布特征分析發(fā)現(xiàn),地區(qū)集聚會(huì)向周邊城市擴(kuò)散,二次聚集現(xiàn)象明顯。綜合目前國(guó)內(nèi)外研究結(jié)果,在促進(jìn)國(guó)內(nèi)國(guó)際雙循環(huán)大背景下,充分把握目前外商直接投資分布特征和動(dòng)態(tài)演化規(guī)律對(duì)正確制定“引進(jìn)來(lái)”與“走出去”戰(zhàn)略有重要意義。但目前準(zhǔn)確描述外商直接投資的分布特征,以數(shù)學(xué)模型準(zhǔn)確描述其分布的實(shí)踐較少。因此本文提出一種基于Golub-Welsch 算法的非參數(shù)校準(zhǔn)方法,以2000—2020 年中國(guó)29 個(gè)省份面板數(shù)據(jù)為樣本,考察不同省份的外商直接投資分布特征和動(dòng)態(tài)演進(jìn)。
核密度估計(jì)是一種估計(jì)隨機(jī)變量的概率密度函數(shù)的非參數(shù)方法,如果一組數(shù)據(jù)的密度函數(shù)很難基于參數(shù)分布估計(jì),采用非參數(shù)核密度估計(jì)的方式可以較好地描述隨機(jī)變量的分布規(guī)律。具體的表達(dá)公式為:
其中xi是指每一個(gè)樣本變量的觀測(cè)值,x為均值,K(x)為核函數(shù),要根據(jù)不同的樣本類型選擇合適的核函數(shù)。h代表帶寬,始終是大于0 的常數(shù)。h的取值參照經(jīng)驗(yàn)公式:
核密度估計(jì)的重點(diǎn)在于核函數(shù)和最優(yōu)帶寬的計(jì)算,目前常用的是高斯核函數(shù),Tauchen(1986)[8],Tauchen 和Hussey(1991)[9]運(yùn)用有限狀態(tài)馬爾科夫鏈方法用于離散具有高斯沖擊的隨機(jī)過(guò)程。高斯分布模型由于對(duì)其分析可處理性較強(qiáng),一直受到學(xué)術(shù)界歡迎。姜楠和周曉滄(2006)[10]用非線性規(guī)劃的方式改進(jìn)FCM 算法的不足。劉君(2012)[11]基于多元q-高斯分布研究投資組合模型。夏利宇等(2019)[12]提出基于ACACM 準(zhǔn)則的數(shù)據(jù)離散化算法,用于研究信用評(píng)級(jí)模型,基于該算法可以提高模型參數(shù)準(zhǔn)確性和風(fēng)險(xiǎn)控制力。上述研究都是基于高斯分布進(jìn)行的研究,主要得益于基于高斯分布分析的可處理性較強(qiáng)。但隨著現(xiàn)代經(jīng)濟(jì)的發(fā)展,在經(jīng)濟(jì)學(xué)中研究非高斯模型正變得越來(lái)越普遍。Rietz(1988)[13]將罕見(jiàn)災(zāi)害的出現(xiàn)引入資產(chǎn)定價(jià)模型中,一定程度上解釋了低無(wú)風(fēng)險(xiǎn)利率之謎。宮曉莉等(2020)[14]假設(shè)信息隨機(jī)因子服從非高斯分布,研究B-S 期權(quán)定價(jià)模型,非高斯分布可以更加準(zhǔn)確地描述金融數(shù)據(jù)的特征。但本文在研究外商直接投資實(shí)際數(shù)據(jù)時(shí),并沒(méi)有具體的數(shù)學(xué)表達(dá)式,數(shù)據(jù)分布較為隨機(jī),基于高斯分布擬合的曲線和實(shí)際分布曲線差距較大。唐偉敏等(2020)[15]考慮了一般非高斯馬爾可夫過(guò)程的離散化。在其中一種應(yīng)用中,他們通過(guò)用正態(tài)混合近似來(lái)離散預(yù)先指定網(wǎng)格上的非參數(shù)密度。因此本文提出一種基于特征值的非參數(shù)估計(jì)方法,對(duì)特征多項(xiàng)式構(gòu)造三項(xiàng)遞推關(guān)系,從而將高斯節(jié)點(diǎn)的求解轉(zhuǎn)變?yōu)槿?xiàng)式特征值的求解,用來(lái)進(jìn)行核密度估計(jì)和帶寬的計(jì)算,并選用一組隨機(jī)數(shù)值驗(yàn)證算法的效性,因此本文所提出的方法更容易實(shí)現(xiàn),速度更快。
本文所使用數(shù)據(jù)為2000—2020 年中國(guó)各省份的外商直接投資數(shù)據(jù),因?yàn)槲鞑睾托陆糠謹(jǐn)?shù)據(jù)缺失,因此選用中國(guó)29 個(gè)?。ㄊ?、區(qū))的數(shù)據(jù)。為了對(duì)比方便,選擇5 年為一個(gè)間隔點(diǎn),分析2000 年、2005年、2010 年、2015 年、2020 年這5 個(gè)年份的外商直接投資動(dòng)態(tài)演進(jìn)過(guò)程,具體數(shù)據(jù)如表1 所示。
表1 外商直接投資數(shù)據(jù)
表2 算法1 具體操作步驟
表3 算法2 具體操作步驟
就2020 年而言,外商直接投資總量排名前5 位的省市分別為江蘇、廣東、湖南、上海、河南,直接利用外商直接投資額分別為:283.80 億元、234.84 億元、210.00 億元、202.33 億元、200.65 億元。2015 年,外商直接投資利用額排名前5 位的省市從高到低分別是廣東、江蘇、天津、上海、浙江,利用外商直接投資額分別為:268.75 億元、242.75 億元、211.34 億元、184.59 億元、169.60 億元。近5 年來(lái)江蘇、廣東、上海三個(gè)省市利用外商直接投資額較為平穩(wěn),一直維持在全國(guó)前五的地位。從總體狀況看,2000—2020 年各省份利用外商直接投資額呈現(xiàn)增長(zhǎng)的態(tài)勢(shì),但各個(gè)省市利用外商直接投資額的絕對(duì)值波動(dòng)較大。相較于2000 年,只有青海、黑龍江和遼寧三個(gè)省份直接外商投資額下降,其余所有省份均上升,增長(zhǎng)率排名前5 的省份為江西、安徽、河南、湖南、陜西,江西增長(zhǎng)率高達(dá)6 331.72%。
假設(shè)非參數(shù)密度f(wàn)(x)已知。由于隨機(jī)模型通常涉及期望,因此希望找到節(jié)點(diǎn)和權(quán)重,使得:
其中g(shù) 是被積函數(shù),X 是概率密度為f(x)的隨機(jī)變量。等式(1)的右側(cè)定義了一個(gè)N點(diǎn)求積公式。在此我們假設(shè)對(duì)于所有的n≥0 存在,其中-∞≤a<b≤∞是固定的。通過(guò)下式定義函數(shù)f,g的內(nèi)積<f,g>:
(1)deg(pn)=n且pn的首系數(shù)為1;
(2)對(duì)于所有的m≠n,有<pm,pn>=0。
令a<x1<…<xN<b是N階正交多項(xiàng)式pN(x)的N個(gè)根,并且定義:
是N-1 階多項(xiàng)式,xn取值1,xm(m∈{1,…,N} )取值為0。則對(duì)于所有高達(dá)2N-1 階的所有多項(xiàng)式p(x),有:
注意,算法1 的唯一輸入是節(jié)點(diǎn)數(shù)N和概率密度f(wàn)的矩,其中k=0,…,2N。因此,對(duì)于給定數(shù)據(jù)的非參數(shù)密度離散化,一個(gè)自然的想法是將樣本矩輸入到算法1 中。之后基于算法1,構(gòu)建了以下基于數(shù)據(jù)的非參數(shù)分布自動(dòng)離散化算法。
由于N點(diǎn)高斯求積具有2N-1 的精度,通過(guò)構(gòu)造N點(diǎn)離散化將數(shù)據(jù)的樣本矩匹配到2N-1 階(以及數(shù)值誤差)。由高斯-馬爾可夫定理可知,樣本矩是總體矩的最佳線性無(wú)偏估計(jì),即在形式的所有估計(jì)中,具有最小的均方誤差,其中為某個(gè)權(quán)值,算法2 在某種意義上是最優(yōu)的,對(duì)于在0鄰域內(nèi)具有有限矩生成函數(shù)的隨機(jī)變量,分布與其矩生成函數(shù)之間存在一一對(duì)應(yīng)關(guān)系。因此,應(yīng)用泰勒近似,我們期望通過(guò)匹配足夠多的矩來(lái)近似隨機(jī)變量的特性。
與任何數(shù)值方法一樣,進(jìn)行算法的精度評(píng)價(jià)是非常重要的。由于提出的方法是為了離散非參數(shù)分布(特別是非正態(tài)分布),因此本文第一個(gè)實(shí)驗(yàn)中假設(shè)數(shù)據(jù)分布是正態(tài)混合。在第二個(gè)實(shí)驗(yàn)中假設(shè)數(shù)據(jù)分布形式是正態(tài)分布,以觀察非參數(shù)高斯求積方法相對(duì)于正確指定參數(shù)的方法在性能上有何差異。
1.正態(tài)混合分布。為了進(jìn)行研究,本文設(shè)計(jì)如下數(shù)值實(shí)驗(yàn)。首先,隨機(jī)構(gòu)建一個(gè)包含兩個(gè)組成部分的正態(tài)分布的數(shù)據(jù)集。各組的比例、均值和標(biāo)準(zhǔn)差分別為p=(pj)=(0.1392,0.8608)、μ=(μi)=(0.15,0.55)和σ=(σj)=(0.05,0.15)。然后根據(jù)此概率分布密度生成一組包含5 000 個(gè)點(diǎn)的離散數(shù)據(jù)集。之后,基于生成的離散數(shù)據(jù)集,采用三種方法分析此數(shù)據(jù)滿足的概率分布情況。最后,與實(shí)際概率分布曲線進(jìn)行對(duì)比,以驗(yàn)證算法的有效性。這三種方法分別為:(1)非參數(shù)高斯求積法(算法2),簡(jiǎn)稱“NP-GQ”;(2)Gauss算法,其均值和標(biāo)準(zhǔn)差用極大似然估計(jì);(3)最大熵方法,其中的核密度估計(jì)(帶高斯核)被輸入,在本文中將其簡(jiǎn)稱為“NP-ME”。圖1 展示了這三種方法對(duì)設(shè)定滿足混合分布數(shù)據(jù)集的概率密度匹配情況。
圖1 混合分布數(shù)據(jù)下概率密度估算對(duì)比圖
根據(jù)圖1 可以得知,正如所預(yù)期,使用Gauss 計(jì)算的正態(tài)分布無(wú)法正確地反映數(shù)據(jù)規(guī)律。NP-ME 方法雖然能夠跟蹤到數(shù)據(jù)的非參數(shù)分布趨勢(shì),但是其精度低于NP-GQ 方法計(jì)算出的結(jié)果。并且與實(shí)際概率分布密度曲線對(duì)比可知,NP-GQ 方法的估算結(jié)果與其十分接近,此說(shuō)明了本文所提NP-GQ 方法的有效性。
2.正態(tài)分布。在此生成一組滿足均值為1,方差為2 正態(tài)分布的數(shù)據(jù)集,其數(shù)據(jù)大小為1 000。然后基于此數(shù)據(jù)集,以觀察非參數(shù)高斯求積方法相對(duì)于正確指定參數(shù)的方法在性能上的區(qū)別。將本文提出的非參數(shù)高斯求積方法NP-GQ 與Guass 算法和NPME 方法進(jìn)行了比較,圖2 展示了這一仿真結(jié)果。
圖2 正態(tài)分布數(shù)據(jù)下概率密度估算對(duì)比圖
根據(jù)圖中仿真結(jié)果表明,工程應(yīng)用中流行的NPME 方法效果較差。由于Tauchen 方法的不良性能在其他文獻(xiàn)中也有記錄,因此這一結(jié)果并不令人驚訝。然而,令人驚訝的是,非參數(shù)高斯混合方法(NP-GQ)表現(xiàn)與Guass 算法的結(jié)果相似(只是略差于)。并且Guass 算法是求解標(biāo)準(zhǔn)正態(tài)分布時(shí)的最優(yōu)的方法。因此,本實(shí)驗(yàn)表明,即使數(shù)據(jù)的分布情況已被正確指定,使用本文所提的非參數(shù)高斯混合也不一定會(huì)較大地影響精度。
綜合上述仿真結(jié)果可知,若參數(shù)分布非混合,本文提出方法不會(huì)與標(biāo)準(zhǔn)正態(tài)分布存在過(guò)大偏差;當(dāng)參數(shù)分布為混合情況或被錯(cuò)誤指定時(shí),本文提出方法的精確度超過(guò)了使用參數(shù)分布的精確度。
在此基于1997—2020 年不同省份外商直接投資額數(shù)據(jù),利用本文提出的基于數(shù)據(jù)的非參數(shù)分布自動(dòng)離散化算法對(duì)其進(jìn)行分析,以2017 年為例分別統(tǒng)計(jì)出2017 年利用外商直接投資額的直方圖,非參數(shù)分布和參數(shù)分布。從圖3 結(jié)果可以看出,非參數(shù)分布曲線更契合實(shí)際的分布直方圖,因此再次佐證,研究外商直接投資的分布特征和演進(jìn)應(yīng)該采用非參數(shù)分布方法。進(jìn)一步研究,基于上述算法進(jìn)行外商直接投資的核密度估計(jì)。
圖3 2017 年不同省份參數(shù)與非參數(shù)分布的對(duì)比圖
以對(duì)數(shù)外商直接投資額為指標(biāo),基于上述所提算法進(jìn)行核密度估計(jì),準(zhǔn)確描繪出外商直接投資的動(dòng)態(tài)分布圖。2000—2020 年周期較長(zhǎng),將全部年份描繪在同一圖中會(huì)造成視覺(jué)的重疊。因此,將較長(zhǎng)的樣本周期按5 年為一個(gè)時(shí)間節(jié)點(diǎn),觀察2000 年、2005 年、2010 年、2015 年、2020 年這5 個(gè)不同年份的趨勢(shì)變化。從圖4 可以看出不同時(shí)期中國(guó)外商直接投資的動(dòng)態(tài)演進(jìn)圖,通過(guò)對(duì)圖4 的分析可以把握中國(guó)外商直接投資的分布特征。2000—2020 年我國(guó)29 個(gè)省市外商直接投資額的分布特征表現(xiàn)出兩個(gè)特點(diǎn):(1)密度函數(shù)的中心峰度不斷地向右移動(dòng),變化區(qū)間呈現(xiàn)先變小再變大的趨勢(shì),峰值不斷變大。這可以表明,我國(guó)絕大多數(shù)的省市外商直接投資的數(shù)額在不斷地變大,利用外商直接投資水平不斷提高,省際間的外商直接投資絕對(duì)值差距經(jīng)歷先變小又變大的演變。(2)我國(guó)外商直接投資的增長(zhǎng)分布也發(fā)生比較明顯的變化,波峰由原先的“一主一小”逐漸向“多小一主”的格局演變。2000 年呈現(xiàn)“一主一小”的格局,主峰在左。2005 年仍然呈現(xiàn)“一主一小”格局,但主峰在右。2010 年開(kāi)始呈現(xiàn)“多小一主”的分布格局,主峰一直在右,多峰形態(tài)明顯,表明省際間的外商直接投資額差距不斷增大。
圖4 中國(guó)外商直接投資的動(dòng)態(tài)分布圖
本文提出一種新的非參數(shù)分布自動(dòng)離散化算法,擬合最優(yōu)的相關(guān)參數(shù),優(yōu)化非參分布數(shù)據(jù)下的核密度估計(jì)。隨著經(jīng)濟(jì)發(fā)展,我國(guó)外商直接投資呈現(xiàn)出幾方面的轉(zhuǎn)變。從政策角度看,政策導(dǎo)向以稅收優(yōu)惠為主逐漸向以法律制度為主推動(dòng)外商享受同等國(guó)民待遇方面轉(zhuǎn)變。從結(jié)構(gòu)方面,外商直接投資產(chǎn)業(yè)制造業(yè)所占比重逐步下降,服務(wù)業(yè)所占比重日益提升。從區(qū)域特點(diǎn)看,東部地區(qū)實(shí)際利用外資額占據(jù)主導(dǎo)地位,但中西部外商直接投資利用額逐步擴(kuò)大。為此外商直接投資作為國(guó)內(nèi)經(jīng)濟(jì)循環(huán)和國(guó)際經(jīng)濟(jì)循環(huán)的重要銜接點(diǎn),有望在我國(guó)經(jīng)濟(jì)高質(zhì)量發(fā)展中獲得更多商機(jī),繼續(xù)保持穩(wěn)定增長(zhǎng)趨勢(shì),在構(gòu)建新發(fā)展格局中發(fā)揮獨(dú)特功能。