国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

產(chǎn)業(yè)空間集聚中心引力指數(shù)算法的設(shè)計及應(yīng)用
——基于長三角一體化視角的企業(yè)微觀數(shù)據(jù)驗證

2020-04-27 05:22嵇正龍
統(tǒng)計與信息論壇 2020年3期
關(guān)鍵詞:引力程度距離

嵇正龍,宋 宇

(西北大學 經(jīng)濟管理學院,陜西 西安 710127)

一、問題提出

促進經(jīng)濟增長和發(fā)展的政策措施效果在很大程度上取決于經(jīng)濟活動在地理上的空間集聚。長三角一體化、國家中心城市和戶籍制度改革等國家戰(zhàn)略規(guī)劃決策,意圖進一步促進資源的集聚,形成經(jīng)濟增長的新動能。根據(jù)2018年各省市國民經(jīng)濟與社會發(fā)展統(tǒng)計公報,長江三角洲地區(qū)(滬、蘇、浙、皖)在約35.91萬平方公里的國土面積上,實現(xiàn)地區(qū)生產(chǎn)總值 21.15萬億元,工業(yè)增加值 8.83萬億元,常駐人口2.25億人,分別占全國的3.74%、23.49%、28.95%、16.15%。從國土面積占比與三項經(jīng)濟社會發(fā)展的核心指標的全國占比形成的反差,可以看出長三角地區(qū)經(jīng)濟活動的空間集聚程度較高。總體來說,長三角地區(qū)經(jīng)濟空間集聚慢于人口空間集聚,創(chuàng)新的空間集聚和溢出效應(yīng)表現(xiàn)出明顯的區(qū)域內(nèi)部差異[1],生產(chǎn)者服務(wù)業(yè)發(fā)展和密集的區(qū)域高鐵網(wǎng)絡(luò)等對制造業(yè)的空間集聚產(chǎn)生了顯著的正向促進作用[2]。

國內(nèi)關(guān)于地區(qū)經(jīng)濟空間集聚的測度大多是對傳統(tǒng)方法的應(yīng)用,也有研究文獻是利用微觀企業(yè)層面的數(shù)據(jù)應(yīng)用較為前沿的DO指數(shù)測度空間集聚特征[3],而對空間集聚方法本身缺乏更深入的探討。已有空間集聚衡量方法的發(fā)展脈絡(luò)是怎么樣的?有哪些優(yōu)點和不足?能否設(shè)計一個新的衡量方法對已有方法進行有益的補充?為回答這些問題,本文聚焦于經(jīng)濟活動空間集聚衡量新方法的設(shè)計。

二、文獻回顧

自產(chǎn)業(yè)集聚理論發(fā)展之初,經(jīng)濟集聚程度的測度方法的研究與應(yīng)用就成為了經(jīng)濟集聚理論發(fā)展的核心組成部分之一。回顧經(jīng)濟集聚測度方法的相關(guān)研究成果,主要可以分為基于產(chǎn)業(yè)集群的離散空間測度法和基于點對距離的連續(xù)空間測度法兩類,并有學者對二者的融合做出了探索??偟膩碚f,兩類空間集聚程度測度方法共存于現(xiàn)有研究文獻中。

(一)基于產(chǎn)業(yè)集群的離散空間集聚指數(shù)

該類指數(shù),基本沿著馬歇爾提出的外部性理論和規(guī)模收益遞增解釋集聚,至關(guān)重要的經(jīng)濟集聚的空間特征被簡化處理。假設(shè)空間由可識別的離散地理單元構(gòu)成,基于產(chǎn)業(yè)集群視角,應(yīng)用產(chǎn)值或者人口等數(shù)據(jù)構(gòu)造集聚度指標,試圖將空間維度作為經(jīng)濟變量引入主流分析框架。

早期的研究,由于公司的確切位置數(shù)據(jù)的獲取限制,所有關(guān)于經(jīng)濟活動地理集中的研究都使用行政區(qū)域的匯總數(shù)據(jù)來測量空間集聚。這方面的研究有大量的文獻,主要涉及區(qū)域比較,但公司或研究機構(gòu)等經(jīng)濟行為主體的實際空間位置無從體現(xiàn)。這類指數(shù)以熵指數(shù)、赫芬達爾指數(shù)、空間基尼系數(shù)、泰勒指數(shù)、EG指數(shù)等為代表,將經(jīng)濟活動空間按照國家或者行政管理區(qū)劃等分為若干區(qū)域,評估經(jīng)濟活動的空間集中程度[4]。其中,EG指數(shù)與其他指標不同之處在于,通過構(gòu)造產(chǎn)業(yè)集聚的三因素模型,考慮企業(yè)規(guī)??傮w分布,對基礎(chǔ)數(shù)據(jù)進行處理,然后計算出產(chǎn)業(yè)集聚新指標[5],對集聚判斷更為準確。該類指標的優(yōu)點表現(xiàn)為,基于經(jīng)濟集聚的理論分析,將容易獲取的宏觀數(shù)據(jù)或區(qū)域經(jīng)濟總量指標,應(yīng)用簡單易懂的公式估計經(jīng)濟集聚程度,尤其是計算量較小。因此,此類指標的應(yīng)用,不僅在早期的實證研究中較為常見,當前的研究中依然被廣泛使用。

但是該類指標忽略了空間因素的關(guān)鍵缺陷也是顯而易見的。第一,忽略了空間因素。作為衡量經(jīng)濟活動空間集聚的指標卻沒有考慮地理距離的影響,而地理距離正是知識溢出的空間局限性來源。盡管技術(shù)進步和社會發(fā)展了,但是知識溢出仍然受到空間距離的限制。也正是因為簡單化的處理,這些指數(shù)反映的是某個單元的產(chǎn)業(yè)集聚,而非真正意義上的空間集聚,同時缺乏判斷一個地區(qū)的專門化程度是否存在集群的閾值,被認為更多的是反映專業(yè)化的趨勢,不能確定集群的空間維度,只能確定專業(yè)化程度較高的區(qū)域。第二,高估了集聚的作用。由于該類指標反映的是產(chǎn)值在較大的地理尺度上的相對集中,而產(chǎn)值與經(jīng)濟增長等發(fā)展指標具有顯著的同向性,即具有較強的內(nèi)生性,難以通過控制變量解決,因此會正向高估集聚程度及其對經(jīng)濟增長的影響。第三,集聚程度受限于區(qū)域劃分。這類指標所確定的產(chǎn)業(yè)集聚程度取決于區(qū)域邊界的主觀劃分,即分區(qū)邊界的位置對觀測水平有影響[6],產(chǎn)生所謂的區(qū)域單位可修改問題,簡稱MAUP問題。理想情況下,應(yīng)該在連續(xù)的空間中進行所有的數(shù)據(jù)分析,以避免主觀的空間單元劃分而產(chǎn)生的邊界偏差[7]。有些研究假設(shè)離散測度的空間集聚程度不受區(qū)域排列的影響,嘗試將離散測度與自相關(guān)測度相結(jié)合限制MAUP的作用;有些研究試圖通過整合空間集聚程度指數(shù)的自相關(guān)程度,在一定程度上糾正空間集聚程度結(jié)果。前者是試圖尋找限制MAUP效應(yīng)的方法,后者是遵循MAUP的要求,不做任何的空間分區(qū),但都不是很成功[8]。因此,關(guān)注地理指標因素,發(fā)展新的空間集聚程度指數(shù)是非常有必要的。

(二) 基于點對距離的連續(xù)空間集聚指數(shù)

基于點對距離的連續(xù)空間集聚測度方法,假設(shè)空間是連續(xù)的非均勻狀態(tài),不可分割,基于地理空間距離,描述經(jīng)濟活動在空間上不同單元的聯(lián)合行為所體現(xiàn)的整體分布特征,并借助于經(jīng)典假設(shè)對該分布特征進行統(tǒng)計檢驗。

隨著數(shù)據(jù)的收集和處理技術(shù)的進步,空間經(jīng)濟學的實證研究需要高效利用越來越容易獲取的詳實的微觀數(shù)據(jù)的新工具。同時,為解決經(jīng)濟學家傳統(tǒng)上使用的空間集聚衡量方法和指標存在的缺陷,地理位置信息成為構(gòu)造衡量集聚程度新指標的重要數(shù)據(jù)來源?;诰嚯x的方法,利用微觀經(jīng)濟數(shù)據(jù),將每個企業(yè)視為地圖上的一個點,并借用所謂的點模式分析方法研究它們的空間分布,其中最具有開創(chuàng)性意義的是使用點對數(shù)據(jù)的K函數(shù)測度聚類[9],成為后來大部分基于距離衡量經(jīng)濟活動空間集聚指標設(shè)計的起點。但是,直到DO指數(shù)方法的出現(xiàn)[10],基于距離的經(jīng)濟活動空間集聚程度的衡量方法才得到迅速推廣。DO指數(shù)開創(chuàng)性的提出了一種基于公司間距離分布的集聚度量方法,不依賴分區(qū),提供關(guān)于所有尺度的集聚分布的信息。DO指數(shù)很好的發(fā)展了K函數(shù)方法,將企業(yè)的地理位置信息納入空間集聚的衡量研究中,應(yīng)用核密度函數(shù)對經(jīng)濟活動的集聚程度做出估計和檢驗,成為后來同類研究的典范?;贒O指數(shù),相繼發(fā)展出具有基準的累積指數(shù)版本的BT指數(shù);基于K函數(shù)的累積密度函數(shù)估計的MP指數(shù)等代表性方法[11-12]。

上述指數(shù)研究利用微觀數(shù)據(jù),把企業(yè)看作是經(jīng)濟空間中無量綱的點。但在經(jīng)濟空間中觀察到的點并非無量綱,企業(yè)的員工數(shù)量、產(chǎn)品、資本等方面具有不同的量綱特征?;诖?,利用點過程理論的工具,采用基于模型的方法,使用基于K函數(shù)加權(quán)版本的指數(shù)考慮企業(yè)特征指標構(gòu)建了EGA指數(shù)[13]。DO指數(shù)以及MP指數(shù)和EGA指數(shù)都是受到了標記點過程理論的啟發(fā),但是只有EGA指數(shù)明確地將產(chǎn)業(yè)集聚測量與一個確定的統(tǒng)計參數(shù)聯(lián)系起來,可以不使用蒙特卡羅方法來虛擬檢驗[14]。此外,受到波特的產(chǎn)業(yè)集群理論啟示,使用公司級聚類指數(shù)檢測空間聚類進行區(qū)域研究,在計算和解釋上都不同于現(xiàn)有的基于距離的度量,是識別沒有預(yù)先確定邊界的集群的一種方法,被稱為Cluster指數(shù)法[15]。

針對上述方法都是計算歐幾里德直線距離,無法跨越自然屏障的缺陷,部分研究成果采用了規(guī)劃距離對上述的一些方法進行了優(yōu)化。關(guān)于距離的測算:有定義并研究了Network K函數(shù),分析沿著街道網(wǎng)絡(luò)測量的距離;也有考慮現(xiàn)實世界的地理位置,需要道路聯(lián)結(jié)的街道和橋梁穿過的河流形成的路徑[16]。點過程的數(shù)學性質(zhì)通常依賴于歐幾里德距離,因此總的來說還是歐幾里德距離的計算方法較多。

基于距離的集聚程度衡量方法的優(yōu)點是具有統(tǒng)計理論支撐,能夠在全域空間上檢測地區(qū)所發(fā)生顯著地理集中或分散的尺度。以DO指數(shù)為代表,基于空間距離的指數(shù)研究都構(gòu)造了統(tǒng)計檢驗,比傳統(tǒng)的空間集聚程度測量方法更為穩(wěn)健,成為了當前基于距離的空間集聚衡量的評估方法的主流和前沿。與基于集群離散空間的衡量方法不同,基于距離的方法不以特定的方式對問題區(qū)域進行分區(qū),而是考慮連續(xù)空間。與只在單一尺度上描述經(jīng)濟活動位置的測量方法不同,基于距離的方法可以在任意尺度上檢測空間結(jié)構(gòu)。

基于點對距離的連續(xù)空間集聚指數(shù)法,存在企業(yè)異質(zhì)性考察不足、置信區(qū)間設(shè)置較為隨意、集聚程度的具體數(shù)值缺乏應(yīng)用和具體集聚位置不明等缺陷。第一,基于點對的地理距離構(gòu)建指數(shù),理論上可以考慮企業(yè)質(zhì)量因素做加權(quán)處理,但是實際應(yīng)用中基本都是以未加權(quán)的地理距離進行評估。因此,未能體現(xiàn)企業(yè)異質(zhì)性帶來的空間距離影響差異。隨著經(jīng)濟發(fā)展,交通和通信水平都在改善,經(jīng)濟聯(lián)系越來越緊密,單純的靜態(tài)地理距離衡量產(chǎn)業(yè)集聚程度卻是變化不明顯的??臻g集聚的異質(zhì)性還體現(xiàn)在從許多中小企業(yè)的高度集聚到幾個大企業(yè)集聚,或者是一個大企業(yè)和許多中小企業(yè)聚集在一起,把這種現(xiàn)象稱為企業(yè)集群和經(jīng)濟活動集群[13]。第二,置信區(qū)間的隨機選擇位置缺乏科學依據(jù),因為每個行業(yè)的選址具有不同的真實要求,不同行業(yè)位置并不是可以相互替代的,比如機械制造選址要求與化工產(chǎn)業(yè)就明顯不能替代。第三,除了EGA指數(shù)和Cluster指數(shù)方法,其他指標由于其設(shè)定的評估方法非常理論,加權(quán)的計算比較復雜,并依賴函數(shù)檢驗和圖形判斷集聚情況,而對于集聚程度的具體數(shù)值卻不重視,因此限制了將集聚程度作為一個重要的經(jīng)濟變量應(yīng)用于更為廣泛和深入的空間經(jīng)濟分析,特別是空間計量的可能性。第四,由于考察的結(jié)論是在某個尺度上是否集聚的情況,而對真實的地理空間的集聚位置并未指明,顯得模糊不清[15,17]。

此外,該類函數(shù)的思想很簡單,但主要是受限于計算量的約束?;诰嚯x的方法基本都是數(shù)據(jù)密集型和計算機依賴型。數(shù)據(jù)雖然容易得到了,但是算法過于細致導致速度很慢,系統(tǒng)資源占用很高,與基于集群的傳統(tǒng)指數(shù)相比,正是數(shù)據(jù)密集型和計算機依賴型限制了基于距離的方法的應(yīng)用[15]。所有這些函數(shù)的計算以及它們各自的置信區(qū)間估計非常耗時。計算時間與點的平方數(shù)(計算所有對點之間的距離)和零假設(shè)的虛擬次數(shù)成正比,內(nèi)存需求與點數(shù)的平方成正比,計算中涉及的點的數(shù)量取決于函數(shù)[18]。最近的發(fā)展已經(jīng)提出大數(shù)據(jù)集的處理的挑戰(zhàn)以及如何處理數(shù)據(jù)的重要計算需求[15]。

(三)產(chǎn)業(yè)集聚和點對距離融合的探索

單純根據(jù)地理位置距離設(shè)計的集聚程度指標更多反映的是空間集聚的地理尺度,而我們感興趣的問題是空間經(jīng)濟活動的集聚程度及其地理位置。實際上,每個公司都有許多經(jīng)濟質(zhì)量特征(比如員工數(shù)量或資本)。利用企業(yè)選址概率模型對EG指數(shù)修正的研究是最早關(guān)于綜合集聚和位置的嘗試[19]。真正意義上綜合權(quán)衡集聚和距離的研究是建立一個集聚概率模型,混合使用基于聚類的方法和基于距離的方法,識別產(chǎn)業(yè)集聚的空間尺度、空間位置和類型的帶狀集聚理論[17]。上述關(guān)于產(chǎn)業(yè)集聚與地理位置融合的各類模型擴展具有極大的創(chuàng)新意義,但是囿于其模型設(shè)計的復雜,計算量的龐大,限制了其應(yīng)用推廣,基本沒有這些方法推廣應(yīng)用的研究文獻。

(四)總體述評

通過對上述兩條研究路線的梳理和比較發(fā)現(xiàn),兩條研究路線存在較大的差異,各有優(yōu)劣。第一條研究路線,在按照主觀劃分地理單元的空間上,基于產(chǎn)值或者就業(yè)人數(shù)的評估,主要是提供一個數(shù)值。該數(shù)值更多體現(xiàn)的是專業(yè)化水平,而非集聚程度,且與產(chǎn)出等指標存在明顯的共線性。由于缺乏閾值進行標準的統(tǒng)計檢驗,該數(shù)值難以做出是否集聚的判斷。第二條研究路線,基于微觀的地理數(shù)據(jù),試圖對全域做出判斷,并對集聚做出嚴苛的統(tǒng)計檢驗,反映的是空間集聚的地理尺度而非具體集聚位置。理論上可以綜合考慮就業(yè)人員或者產(chǎn)出的加權(quán),但是實際應(yīng)用中很少做加權(quán)處理,原因在于計算的復雜度呈現(xiàn)幾何級別的增加。因此,大多是從整體分布角度描述集聚程度的分布,同時對于集中程度指數(shù)的不重視也限制了計量分析的應(yīng)用。因此,綜合考慮集群和距離等多種因素,融合企業(yè)多維信息的企業(yè)活動空間集聚衡量的新方法,符合中國區(qū)域發(fā)展的差異性和競爭性的實際,也是經(jīng)濟活動空間集聚指標研究的一個有價值的探索方向。

在回顧已有空間集聚衡量研究方法的基礎(chǔ)上,本文提出了基于引力模型的產(chǎn)業(yè)空間集聚衡量方法,定義為中心引力指數(shù)法,即基于企業(yè)微觀層面數(shù)據(jù),綜合考慮了企業(yè)的地理位置和質(zhì)量指標,構(gòu)造相對置信區(qū)間做統(tǒng)計檢驗和設(shè)定絕對判斷閾值,并追蹤產(chǎn)業(yè)空間集聚的地理位置動態(tài)。本文的主要創(chuàng)新之處在于:將企業(yè)的分布看作是多維的立體空間,而不是二維的平面地圖分布,考慮了多維分布的聚集問題;試圖兼顧基于產(chǎn)值集聚程度衡量的簡單易用和基于距離集聚程度衡量方法的統(tǒng)計檢驗要求;通過產(chǎn)業(yè)視角,基于企業(yè)的微觀地理數(shù)據(jù)衡量集聚程度,能夠?qū)Ξa(chǎn)業(yè)的空間集聚程度、空間分布特征以及空間轉(zhuǎn)移過程做出合理的判斷和解釋,確定產(chǎn)業(yè)集聚的空間地理位置。

三、中心引力指數(shù)算法設(shè)計

本文借鑒已有集聚指數(shù)的計算方法,包括基于產(chǎn)業(yè)和基于距離兩種研究路線,結(jié)合引力模型理論,提出衡量經(jīng)濟活動空間集聚的中心引力指數(shù)算法。

(一)虛擬中心企業(yè)設(shè)定

中心企業(yè)的設(shè)定是中心引力指數(shù)核算的關(guān)鍵,也是確定產(chǎn)業(yè)空間集聚地理位置的關(guān)鍵。傳統(tǒng)的空間集聚程度的測度方法是使用產(chǎn)值或者人口規(guī)模考察,缺乏對空間因素尤其是距離的考察。為了修正該缺陷,同時得益于數(shù)據(jù)獲取分析技術(shù)的進步,基于距離的方法異軍突起。關(guān)注地理空間考察,理論上可以兼顧產(chǎn)值和人口等質(zhì)量因素,但是現(xiàn)實應(yīng)用卻極其罕見,并且對集聚的真實地理空間位置語焉不詳。為彌補上述兩類方法的缺陷,融合產(chǎn)業(yè)集聚和地理距離的研究做出了有益探索,但是受限于公式復雜和計算量的龐大,實際應(yīng)用較少。因此,綜合已有研究成果,基于引力模型,同時考察多個因素,特別是解決集聚的地理位置問題,本文提出了中心引力指數(shù)方法。設(shè)定中心企業(yè),為空間集聚的地理位置定位提供基礎(chǔ),彌補了DO指數(shù)等無法定位的缺陷。具體設(shè)定方法如下:

第一步,劃定經(jīng)濟集聚核心企業(yè)集合。基于距離的經(jīng)濟聚集測度的核心是經(jīng)濟活動的集聚,其次才是空間分布問題。由于全域企業(yè)的分布規(guī)模大小不一,位置較為分散,因此,經(jīng)濟集聚核心企業(yè)集合的選擇,更多的側(cè)重于經(jīng)濟活動的集聚,在考察地理距離因素時需避免離群點極端值的影響。假設(shè)Z行業(yè)中有N家企業(yè),企業(yè)的考察指標涵蓋多個質(zhì)量指標,統(tǒng)稱為指標集合Xi。按照經(jīng)濟質(zhì)量Xi指標集合對行業(yè)所有企業(yè)分別排序,分別取每個指標降序排列中位數(shù)以上的企業(yè),共同組成一個企業(yè)集合,并剔除重復樣本,最后形成一個包含n家企業(yè)的經(jīng)濟集聚核心企業(yè)集合z。第二步,設(shè)定中心企業(yè)。此處的中心企業(yè),不僅僅考慮地理位置的中心,還需要考慮經(jīng)濟活動的中心。因此,取經(jīng)濟集聚核心企業(yè)集合z的企業(yè)各項指標的中位數(shù),作為一個虛擬中心企業(yè)的各項對應(yīng)指標值,同時對各個企業(yè)的經(jīng)緯度坐標取中位數(shù),作為中心企業(yè)的地理位置坐標,記為O點,用CO標記虛擬中心企業(yè)。

根據(jù)上述設(shè)定規(guī)則,中心企業(yè)的各項指標均值計算公式如下:

XO=median(Xi)

(1)

(二)引力模型介紹

1.兩點之間簡單引力模型

設(shè)有兩個點,分別為點1和點2,各自的質(zhì)量(經(jīng)濟分析中可以用人口、產(chǎn)出和GDP等表示)分別為m1和m2,兩點之間的距離為d1,2(經(jīng)濟分析中可以是地理距離,也可以是其他具有空間性質(zhì)的變量),則兩點之間的引力為g1,2,公式表示如下:

(2)

其中φ代表引力系數(shù)(1)φ在牛頓引力公式中是常數(shù),但是在做經(jīng)濟分析時,在不同的分析情況下是變化的。。

2.兩點之間單因素引力模型一般形式

設(shè)有空間點的集合P,共有N個點,任意兩點i點和j點之間的引力為:

(3)

其中:α,β和γ是大于0的常數(shù)。

3.兩點之間多因素引力模型

在經(jīng)濟分析中,往往是由多點組成的空間,也同時考察多個因素共同作用,因此,兩點多因素引力模型變得更為復雜。

Gi,j=f(Xi,Xj,Si,j)

(4)

其中:X表示考察的因素的集合;S表示點之間的具有空間性質(zhì)的向量。假設(shè)考察k個因素,那么兩點之間引力合計為:

(5)

(三)中心引力指數(shù)估計及檢驗

1.中心引力指數(shù)估計

對于有N個企業(yè)的Z行業(yè),企業(yè)與虛擬中心企業(yè)形成N個引力點對關(guān)系。一個企業(yè)與虛擬中心企業(yè)之間形成多因素引力點對關(guān)系,中心點對距離記為dO,i。所有因素的中心引力加總,得到該企業(yè)的中心引力總值GO,i。

(6)

行業(yè)中所有企業(yè)的中心引力加總為GZ。

(7)

設(shè)定中心企業(yè)所在位置為圓心O點,距離r為半徑形成一個圓形區(qū)域,r∈[mindO,i,maxdO,i],其中半徑r均勻的從圓心O點逐漸延長到最遠的企業(yè)距離maxdO,i。該圓形區(qū)域內(nèi)的企業(yè)組成經(jīng)濟集聚核心區(qū)企業(yè)集合,記為ZO,所有企業(yè)的中心引力值,記為GO。

(8)

行業(yè)Z的產(chǎn)業(yè)集聚程度,記為CRZ,用經(jīng)濟集聚核心區(qū)ZO中的企業(yè)中心引力總值GO與行業(yè)Z中所有企業(yè)的中心引力總值GZ的比值表示。

(9)

2.經(jīng)濟集聚檢驗

產(chǎn)業(yè)是否集聚以及集聚的空間分布特征等,并不能簡單的從前述行業(yè)空間集聚程度指標的絕對值做出可靠的判斷。借鑒已有的空間集聚測度的檢驗思路,需要設(shè)定一個科學的置信區(qū)間做統(tǒng)計檢驗以及集聚判斷閾值,并作圖分析?;趯Ξa(chǎn)業(yè)集聚和分散審慎的判斷,本文的檢驗分兩步進行:第一步,根據(jù)前述經(jīng)濟核心區(qū)面積和行業(yè)覆蓋區(qū)域面積指標估計相對閾值指標,構(gòu)造置信區(qū)間;第二步,提出空間集聚程度的絕對值標準作為判斷閾值。檢驗的原則:只有依次符合上述兩步判斷,才能確認集聚或者分散。

第一步,關(guān)于相對值判斷的置信區(qū)間設(shè)定。假設(shè),核心區(qū)域面積記為AO;行業(yè)Z覆蓋的圓形區(qū)域面積,記為AZ;二者的比值,記為μO。此處的μO為集聚與分散的基準值。

(10)

(11)

第二步,關(guān)于絕對值判斷的閾值設(shè)定。集聚與否,不等同于集聚程度,因此需要對不同的集聚程度做出更為細致的判斷,便于考察產(chǎn)業(yè)的集聚結(jié)構(gòu)特征。本文采用一定的比例將集聚程度分為低度集聚、中度集聚和高度集聚三個等級。本文選定的標準是將0.25和0.75兩個分位點作為三個等級劃分的臨界值。

(12)

四、中心引力指數(shù)算法應(yīng)用

(一)數(shù)據(jù)整理

中心引力指數(shù)算法應(yīng)用例證,使用的空間范圍為長江三角洲地區(qū)三省一市,即江蘇省、浙江省、安徽省和上海市;研究的對象為制造業(yè)(兩位標準產(chǎn)業(yè)代碼SIC13-SIC43),數(shù)據(jù)來源《中國工業(yè)企業(yè)數(shù)據(jù)庫(1998—2013)》中制造業(yè)企業(yè)微觀數(shù)據(jù),其中2010年企業(yè)質(zhì)量指標基本缺失,故剔除。根據(jù)長三角地區(qū)的微觀企業(yè)數(shù)據(jù)的實際情況,選擇資產(chǎn)總計大于0、固定資產(chǎn)1 000萬元以上、年銷售額500萬元以上、就業(yè)人數(shù)30人以上,且企業(yè)地址相對完整的制造業(yè)企業(yè)為研究樣本。

數(shù)據(jù)的統(tǒng)計口徑和兩位數(shù)產(chǎn)業(yè)代碼在2002年和2012年發(fā)生兩次調(diào)整,因此整體數(shù)據(jù)存在匹配問題。需要進行行業(yè)大類名稱匹配,而不是簡單的代碼匹配。數(shù)據(jù)匹配調(diào)整有三種基本法方案:一是前向調(diào)整,以1998年統(tǒng)計口徑為基準,2003年之后數(shù)據(jù)做前向調(diào)整。二是后向調(diào)整,以2012年的統(tǒng)計口徑對之前的數(shù)據(jù)做相應(yīng)調(diào)整。三是以2002年的統(tǒng)計口徑為基準做前后向靈活調(diào)整。本文以合并數(shù)據(jù)為首選調(diào)整原則,兼顧指標的均衡處理,選擇2002年的統(tǒng)計口徑為基準做數(shù)據(jù)匹配處理(2)具體數(shù)據(jù)匹配調(diào)整處理方法以及后續(xù)的數(shù)據(jù)驗證、圖形分析,有需要的讀者,聯(lián)系作者索取。。煙草制品行業(yè)(SIC16)和武器彈藥(SIC39)屬于特殊行業(yè),故排除在考察范圍之外。

研究指標根據(jù)前述引力指數(shù)算法模型,選取企業(yè)地址、工業(yè)銷售產(chǎn)值、固定資產(chǎn)和資產(chǎn)總計四個指標因素。企業(yè)的精準經(jīng)緯度坐標值是將企業(yè)詳細地址通過R語言的RCurl包對接高德地圖的API接口獲取;而虛擬中心企業(yè)的地理位置根據(jù)經(jīng)緯度坐標,逆向處理。不同于現(xiàn)有大部分研究使用歐幾里得距離,本文應(yīng)用航海上廣泛運用的蘭勃特公式計算大圓距離。本文的數(shù)據(jù)清洗、挖掘和計算是基于R語言3.5.3版本完成。

(二)計算步驟

1.設(shè)定中心企業(yè)

長三角地區(qū)看作一個整體的經(jīng)濟區(qū)域,在兩位數(shù)代碼行業(yè)層面進行分析。本文根據(jù)前述關(guān)于中心企業(yè)設(shè)定的指標的計算方法,按照工業(yè)銷售產(chǎn)值(Vi)、資產(chǎn)總計(Ti)和固定資產(chǎn)(Fi)三個指標對行業(yè)所有企業(yè)分別排序,分別取每個指標降序排列大于中位數(shù)的企業(yè),共同組成一個企業(yè)集合,并剔除重復樣本,最后形成一個包含n家企業(yè)的核心區(qū)域經(jīng)濟集聚企業(yè)集合z。中心企業(yè)的各項指標由核心區(qū)域經(jīng)濟集聚企業(yè)集合z中企業(yè)的各項指標的中位數(shù)得到,即根據(jù)式(1)計算。

2.計算中心點對的多因素引力

根據(jù)企業(yè)的經(jīng)緯度,應(yīng)用航海上大圓距離公式計算兩點之間的球面距離。假設(shè)已知兩點經(jīng)緯度P1(φ1,λ1)和P2(φ2,λ2),應(yīng)用蘭勃特公式計算大地線長。

(13)

其中,cosσ=sinφ1sinφ2+cosφ1cosφ2cosΔλ;a、c為橢球的長半徑和扁率;σ為由地理經(jīng)緯度求得的球面距離。本文使用R語言Geosphere包中基于蘭勃特公式的Distm函數(shù)估計點對距離。

根據(jù)前述中心引力指數(shù)算法的設(shè)計方法核算行業(yè)的空間集聚程度。引力模型中參數(shù)的設(shè)定,參考白俊紅等關(guān)于引力模型參數(shù)設(shè)定的標準[20],引力系數(shù)φ、引力因素參數(shù)α和β都設(shè)定為1,γ設(shè)定為2。此外,如果企業(yè)的地址與中心企業(yè)相同,或者非常接近,導致距離極小,將該點對地理距離設(shè)定為1千米,以避免出現(xiàn)中心引力極端值對估測的干擾。

3.空間集聚程度與檢驗估計

根據(jù)前述算法設(shè)計思路,設(shè)定中心企業(yè)CO,將半徑的起始距離設(shè)定為最近的企業(yè)距離mindO,i,然后逐漸增加距離,實行逐點統(tǒng)計,連續(xù)估計經(jīng)濟空間集聚程度,并同步估計檢驗標準。為了避免極值的影響和深入結(jié)構(gòu)化分析,本文將距離邊界設(shè)定為全域企業(yè)距離的中位數(shù),選擇行業(yè)距離的中位數(shù)(mediandO,i)為分界點,將距離小于mediandO,i的企業(yè)組成考察企業(yè)集合,記為ZM,企業(yè)所在區(qū)域為考察區(qū)域,半徑記為R。已有的大多數(shù)基于距離的集聚指數(shù)的估計,對所有的行業(yè)設(shè)置固定考察距離,忽視了行業(yè)差異導致其分布的地理范圍不同的特征。因此,本文針對不同的行業(yè)以中位數(shù)為標準,也就是不同的行業(yè)選擇了不同的考察距離,符合產(chǎn)業(yè)自身的特征。集聚程度記為CRZ,與式(9)類似,用中心區(qū)域的企業(yè)引力總值(GO)除以局域企業(yè)集合的引力總值(GM)得到。

(14)

檢驗標準使用中心區(qū)域的面積(記為AO)與考察面積(記為AM)相比得到。

(15)

4.作圖檢驗分析

最直觀的方式是按照前述閾值范圍作圖。按照式(11)和式(12)比較以判斷經(jīng)濟活動集聚還是分散,以及集聚的程度分類。繪圖可以直觀的判定產(chǎn)業(yè)集聚的空間尺度和集聚程度。繪圖過程中,將集聚程度使用原值帶入,而閾值分別用上限和下限帶入構(gòu)成置信區(qū)間。綜上,對于產(chǎn)業(yè)的集聚與否的判定標準具有絕對標準和相對標準兩個檢驗,只有同時滿足兩個判定才能對集聚還是分散做出謹慎的斷定。

(三)典型行業(yè)示例

為了更好地理解中心引力指數(shù)法及其結(jié)果的評價和應(yīng)用,選取具有代表性特征的木材加工及竹、藤、棕、草制品業(yè)(SIC20)1998年、2002年、2007年和2013年的數(shù)據(jù)作為示例,從時間上分析空間分布的變化。之所以選擇該行業(yè),因為該行業(yè)屬于傳統(tǒng)的制造業(yè),具有勞動密集和原料依賴特征,因此其隨著經(jīng)濟的發(fā)展會具有明顯的集聚和產(chǎn)業(yè)轉(zhuǎn)移特征。

1.產(chǎn)業(yè)全域分布與虛擬中心轉(zhuǎn)移

產(chǎn)業(yè)(SIC20)在研究時間跨度中的空間分布變化,同時表現(xiàn)出集聚程度逐漸提高和集聚的空間轉(zhuǎn)移兩個顯著特征(見圖1)。從圖1a到圖1d可以看出,隨著時間的推移,產(chǎn)業(yè)的集聚程度明顯提高,表現(xiàn)為圖中的黑點所代表的規(guī)模以上企業(yè)越來越密集。集聚的轉(zhuǎn)移的特征也非常顯著,從黑點所形成的簇可以發(fā)現(xiàn),1998年的時候,產(chǎn)業(yè)主要集聚在環(huán)太湖地區(qū),而到了2013年,產(chǎn)業(yè)主要集聚在江蘇北部的宿遷地區(qū)。

1a 1998年

1b 2002年

1c 2007年

1d 2013年圖1 長三角產(chǎn)業(yè)(SIC20)全域分布與虛擬中心轉(zhuǎn)移圖

根據(jù)虛擬中心企業(yè)的位置轉(zhuǎn)移,考察產(chǎn)業(yè)集聚的空間轉(zhuǎn)移。產(chǎn)業(yè)集聚的虛擬中心企業(yè)作為衡量集聚的關(guān)鍵,其空間位置不僅是估計產(chǎn)業(yè)集聚程度的基礎(chǔ),并且是產(chǎn)業(yè)轉(zhuǎn)移地理空間路徑的關(guān)鍵標志。隨著時間變化,產(chǎn)業(yè)發(fā)生轉(zhuǎn)移,其集聚中心,也就是虛擬中心企業(yè)必然也會發(fā)生轉(zhuǎn)移。而中心企業(yè)位置的轉(zhuǎn)移正是代表了產(chǎn)業(yè)集聚在地理空間上的轉(zhuǎn)移。應(yīng)用前述數(shù)據(jù)處理技術(shù),將所觀察產(chǎn)業(yè)的四個階段的虛擬中心企業(yè)地理經(jīng)緯度和具體地理位置求解。從圖1中虛擬中心企業(yè)的地址“?”標記的變遷進行分析發(fā)現(xiàn),產(chǎn)業(yè)(SIC20)先后從上海到蘇州,再到無錫,最后到宿遷的產(chǎn)業(yè)轉(zhuǎn)移集聚路徑,表明該勞動密集型兼具資源依賴型的傳統(tǒng)產(chǎn)業(yè)從長三角的經(jīng)濟中心地帶向外圍轉(zhuǎn)移。虛擬中心企業(yè)位置轉(zhuǎn)移分析方法同樣適用于其他產(chǎn)業(yè)的轉(zhuǎn)移路徑的追蹤分析。

產(chǎn)業(yè)(SIC20)轉(zhuǎn)移的過程經(jīng)歷了單中心集聚,到雙中心集聚,再到單中心集聚的完整過程(見圖1)。從圖1a和圖1b可以看出,產(chǎn)業(yè)在蘇滬杭地區(qū)產(chǎn)生集聚;從圖1c可以看到,產(chǎn)業(yè)在向江蘇北部轉(zhuǎn)移,并逐漸形成新集聚,而原來的產(chǎn)業(yè)集聚中心依然存在,此時形成了雙中心集聚;從圖1d可以發(fā)現(xiàn),最終該產(chǎn)業(yè)在新的地區(qū)形成集聚,回到了單中心集聚。這個集聚轉(zhuǎn)移的單中心到雙中心,再到單中心的過程,在中心引力指數(shù)法的應(yīng)用中也將得到驗證(見圖2c)。

2.產(chǎn)業(yè)集聚程度與空間尺度變化

木材加工及竹、藤、棕、草制品業(yè)(SIC20)在四個年份中集聚的時間和空間變化基本涵蓋了中心引力指數(shù)法所要研究的內(nèi)容(見圖2)。在圖2中,點線組合的粗線是產(chǎn)業(yè)集聚程度;兩條虛線是根據(jù)面積比設(shè)定的置信區(qū)間,也就是相對判定標準,上面的是上限,下面的是下限;而0.25和0.75的水平實線是絕對判斷指標臨界值,用以對集聚程度做絕對值區(qū)間劃分。遵從前述的判斷標準,從圖2可以看出:該產(chǎn)業(yè)在1998—2013年之間呈現(xiàn)逐漸集聚的特征,可以分為四個階段。第一階段,從圖2a可以看出,產(chǎn)業(yè)呈現(xiàn)低度集聚特征,空間分布尺度在20千米~50千米;第二階段,從圖2b可以看出,產(chǎn)業(yè)呈現(xiàn)出中度集聚狀態(tài),集聚的空間尺度在50千米~70千米范圍,相較于上一階段,集聚的程度在提高的同時,集聚的空間尺度也在明顯擴大;第三階段,從圖2c可以看出,自80千米左右的地方開始呈現(xiàn)高度集聚,空間集聚的地理尺度也擴大到了140千米左右;第四階段,從圖2d可以看出,集聚的空間范圍呈現(xiàn)收縮特征,空間集聚的地理尺度在20千米~90千米范圍呈現(xiàn)高度集聚。

2a 1998年

2b 2002年

2c 2007年

2d 2013年圖2 長三角產(chǎn)業(yè)(SIC20)集聚程度與空間尺度圖

綜合上述四個階段,從圖2a到圖2c,我們可以看到該行業(yè)從低度集聚到高度集聚狀態(tài)是一個地理分布逐漸擴大的過程;從圖2c到圖2d,可以發(fā)現(xiàn)在轉(zhuǎn)向高度集聚的時候,地理空間分布的地理尺度又呈現(xiàn)收縮,進一步強化了集聚。具體體現(xiàn)在圖2c中的集聚曲線出現(xiàn)了明顯的兩個拐折,分別在50千米~70千米和80千米~140千米兩個空間尺度,表明出現(xiàn)了兩個集聚中心。這一點與前述的圖1c所變現(xiàn)的雙中心集聚現(xiàn)象相吻合,有力地證明了中心引力指數(shù)算法在偵測產(chǎn)業(yè)的多中心集聚方面是有效的。

(四)長三角地區(qū)產(chǎn)業(yè)集聚的總體特征

通過對長三角地區(qū)兩位代碼的制造業(yè)逐個分析,數(shù)據(jù)和圖形研究都表明該地區(qū)制造業(yè)表現(xiàn)出高度集聚的特征,并且絕大部分產(chǎn)業(yè)集聚都位于環(huán)太湖地區(qū),只有少數(shù)的傳統(tǒng)產(chǎn)業(yè)向外圍轉(zhuǎn)移,見圖3。

3a 1998年

3b 2013年圖3 長三角地區(qū)制造業(yè)1998年與2013年制造業(yè)全域分布對比圖

產(chǎn)業(yè)集聚主要向三個方向轉(zhuǎn)移:比如木材加工及竹、藤、棕、草制品業(yè)(SIC20)為代表的傳統(tǒng)勞動密集型兼具資源依賴的產(chǎn)業(yè)在向長三角北部地區(qū)轉(zhuǎn)移;食品加工業(yè)(SIC13)從蘇州依次轉(zhuǎn)向常州、鎮(zhèn)江和南京,即沿長江經(jīng)濟帶向西轉(zhuǎn)移;紡織業(yè)(SIC17)和皮革制造業(yè)(SIC19)從蘇錫常地區(qū)向湖州和嘉興地區(qū)轉(zhuǎn)移。而其他大部分產(chǎn)業(yè)繼續(xù)在長三角核心地區(qū)集聚強化。在研究期間內(nèi),集聚的時間趨勢較為明顯,都是隨著時間的推移,集聚程度呈現(xiàn)上升的趨勢。即使發(fā)生了部分產(chǎn)業(yè)的轉(zhuǎn)移,以蘇滬杭為中心的長三角核心地區(qū)依然是制造業(yè)中心。產(chǎn)業(yè)不同,集聚的空間尺度存在差異,總體上集聚的空間分布地理尺度在100千米范圍內(nèi)。

五、結(jié)論與展望

(一) 總體結(jié)論

1.中心引力指數(shù)算法是對已有產(chǎn)業(yè)空間集聚測度方法的綜合權(quán)衡和補充?,F(xiàn)有空間集聚測度方法大體可以從基于產(chǎn)值和基于距離的兩個研究路線分為兩類,前者忽略距離,后者所謂的產(chǎn)值加權(quán)缺乏實際應(yīng)用。究其原因,兩條路線的研究都是受制于技術(shù),前者受限于數(shù)據(jù)采集技術(shù),后者受限于計算能力限制。隨著技術(shù)的進步,出現(xiàn)了一些基于實際距離的考察,但依然處于初步階段,未能突破運算能力的限制,正是在這樣的背景下,本文提出了中心引力指數(shù)法,有效綜合了現(xiàn)有研究方法的優(yōu)點,規(guī)避了限制。通過融入成熟的引力模型,綜合了產(chǎn)值和距離,然后采用中心化方法,設(shè)定虛擬中心企業(yè),有效擺脫了運算能力的限制。因此,中心引力指數(shù)算法對已有的測度方法是一個可靠的拓展,形成綜合權(quán)衡和補充。

2.中心引力指數(shù)法能夠高效測度空間集聚。由于采用較為成熟的引力模型,融合產(chǎn)值和距離,并借鑒了已有測度方法的許多數(shù)學處理方法,通過設(shè)定虛擬中心企業(yè)的做法,在具備堅實的理論基礎(chǔ)的同時,極大地簡化了數(shù)學計算。特別是通過相對指標構(gòu)造置信區(qū)間和絕對指標判斷閾值,識別集聚程度并分類,能夠有效地對經(jīng)濟活動的空間集聚程度和地理空間分布特征做科學的結(jié)構(gòu)分析。方法的有效性還體現(xiàn)在使用長三角地區(qū)的微觀企業(yè)數(shù)據(jù)進行驗證,表明了中心引力指數(shù)法能夠有效地測度集聚程度和空間分布特征,準確偵測產(chǎn)業(yè)多中心集聚,并能夠根據(jù)虛擬中心企業(yè)的地理位置轉(zhuǎn)移,準確追蹤產(chǎn)業(yè)集聚的轉(zhuǎn)移。

3.長三角地區(qū)制造業(yè)集聚和空間分布特征分析。樣本數(shù)據(jù)分析表明,長三角地區(qū)的制造業(yè)同時呈現(xiàn)集聚和轉(zhuǎn)移兩個特征。部分傳統(tǒng)產(chǎn)業(yè),特別是勞動密集型和資源依賴型產(chǎn)業(yè)在向長三角的外圍轉(zhuǎn)移,虛擬中心企業(yè)的地理位置清楚表明了主要是向江蘇北部、長江中上游和浙江中部三個方向轉(zhuǎn)移。特別強調(diào)的是,產(chǎn)業(yè)轉(zhuǎn)移而不是發(fā)散,轉(zhuǎn)移的過程中集聚程度在逐漸提升,最終在外圍的某個地區(qū)形成了高水平的集聚。比如江蘇北部的木材、南京的食品加工和嘉興的皮革制造等。蘇滬杭核心區(qū)的制造業(yè)的集聚程度在進一步提高,也就是沒有發(fā)生轉(zhuǎn)移的產(chǎn)業(yè)的集聚程度進一步強化。制造業(yè)的集聚基本都經(jīng)歷了集聚程度與地理空間分布同向變化,然后集聚程度提高,地理空間分布收縮的分階段過程。最終制造業(yè)都呈現(xiàn)高度集聚,同時在100千米范圍內(nèi)的空間分布特征。

(二)研究展望

中心引力指數(shù)算法能夠兼容現(xiàn)有方法的優(yōu)點,并規(guī)避其限制,應(yīng)用示例效果較好。但是,作為現(xiàn)有研究方法的權(quán)衡和融合,是對現(xiàn)有方法的有效補充,而非替代。中心引力指數(shù)算法尚存在一些不足,未來的研究可以從以下幾個方面拓展。

1.關(guān)于引力模型本身的拓展。本文所引入的引力模型是較為基本的模型,而且考察的企業(yè)的質(zhì)量指標都是產(chǎn)值相關(guān),而對于就業(yè)規(guī)模、技術(shù)水平和財稅貢獻等指標并未考察。而這些指標對于產(chǎn)業(yè)的集聚也非常關(guān)鍵,因此對于能夠融合更多因素,全面反映產(chǎn)業(yè)集聚影響因素的引力模型的拓展,將對中心引力指數(shù)算法的完善產(chǎn)生根本性的影響。

2.關(guān)于企業(yè)之間引力考察不足。中心引力指數(shù)算法,顧名思義,是圍繞著現(xiàn)實企業(yè)和虛擬中心企業(yè)之間的引力做出的產(chǎn)業(yè)集聚測度。而產(chǎn)業(yè)集聚是全體企業(yè)之間產(chǎn)生的綜合的關(guān)系,而不是單一的一對企業(yè)的關(guān)系,也就是所有點對之間的引力。這正是中心引力指數(shù)算法為了簡化計算而產(chǎn)生的效率損失。關(guān)于點對企業(yè)的引力計算量將是極其龐大的,但是其衡量集聚程度更為精確。

3.關(guān)于多中心集聚的識別問題。中心引力算法具有一個先天的缺陷,那就是假定了產(chǎn)業(yè)是單中心集聚。而事實上有不少產(chǎn)業(yè)是多中心集聚,尤其是產(chǎn)業(yè)在轉(zhuǎn)移的過程中,必然有一個多中心集聚的過程。如果能夠應(yīng)用諸如核密度或者泊松分布等統(tǒng)計檢驗工具對多中心集聚進行識別和偵測,結(jié)果會更為精準。這應(yīng)該是完善中心引力指數(shù)算法的一個拓展方向。

猜你喜歡
引力程度距離
精致和嚴謹程度讓人驚嘆 Sonus Faber(意大利勢霸)PALLADIO(帕拉迪奧)PW-562/PC-562
男女身高受歡迎程度表
延安新引力
算距離
感受引力
每次失敗都會距離成功更近一步
A dew drop
愛的距離
距離有多遠
將內(nèi)燃機摩擦減小到最低程度