溫丹輝,丁守宏,孫振清
(天津科技大學(xué) 經(jīng)濟(jì)與管理學(xué)院,天津 300222)
黨的十八屆五中全會后,“綠色”成為新發(fā)展理念之一,各項環(huán)保措施被嚴(yán)格實行,取得了良好成效[1]。全國生態(tài)環(huán)境質(zhì)量持續(xù)改善,重點工業(yè)企業(yè)的污染物排放持續(xù)下降[2],不過仍有一些監(jiān)管難點。中央環(huán)保督察“邊督邊改”公開信息顯示[3],當(dāng)前環(huán)保問題突出表現(xiàn)為工地?fù)P塵、噴漆異味、貨車尾氣、餐飲油煙、垃圾堆放等散亂污染。散亂污染并沒有嚴(yán)格定義,《京津冀及周邊地區(qū)2017年大氣污染防治工作方案》中將污染源分為重點排污單位和“小散亂污”兩類,重點排污單位主要指大中型企業(yè),“小散亂污”主要指環(huán)保不達(dá)標(biāo)的小型企業(yè)[4]。管理實踐中,“小散亂污”企業(yè)與工地?fù)P塵、機(jī)動車尾氣(尤其是大中型客貨車輛)、餐飲油煙等往往被統(tǒng)稱為“小散亂”污染源。2017年兩會期間,有委員代表提出,“小散亂”污染源具有單個體量小、類型眾多、空間上分散、時間上無序、排污主體難把握等特征,與重點污染源相比管控難度更大,但其對大氣污染的貢獻(xiàn)總量不可忽視,現(xiàn)階段我國大氣污染防治的重心應(yīng)當(dāng)由管控較大污染源向“小散亂”污染源全面管控適度轉(zhuǎn)移[5]。2020年生態(tài)環(huán)境部列出的12項重點工作中提出要持續(xù)整治“散亂污”企業(yè),深入推進(jìn)柴油貨車污染治理。可見,國家對“小散亂”污染源的治理工作正在持續(xù)深入,但也面臨一系列困難,本文針對具有上述小散亂特征的污染排放管制問題展開分析與討論。
環(huán)境治理涉及不同主體之間的博弈關(guān)系。博弈關(guān)系不僅存在于管制者與被管制對象之間,還與環(huán)境監(jiān)管制度相關(guān)。環(huán)境監(jiān)管體系包含國家、科層制、問責(zé)制等多重制度邏輯[6],中國地方監(jiān)管機(jī)構(gòu)遵循“屬地管理”原則[7], 環(huán)保部門的環(huán)境目標(biāo)通過逐級分包下來后,下級環(huán)保部門與上級部門往往存在區(qū)域合作治理關(guān)系,可能存在“討價還價”和“運動式執(zhí)法”等問題[8-9]。另外,監(jiān)管機(jī)構(gòu)監(jiān)管策略選擇還受到第三方監(jiān)管、環(huán)保稅等多種外部因素制約[10-11]。
演化博弈模型是適宜的研究方法。Smith & Price[12]使用演化博弈(evolutionary game)模型研究了不同群體之間驅(qū)動力的相互反饋作用,并明確了演化穩(wěn)定策略(evolutionarily stable strategy,ESS)這一基本概念。與經(jīng)典博弈的區(qū)別在于,演化博弈是基于有限理性假設(shè)的:決策者囿于時間和能力,無法獲取完全的長期決策信息,只能根據(jù)已有的收益信息不斷調(diào)整策略[13]。Taylor & Jonker[14]提出的“復(fù)制者動態(tài)方程”是演化博弈中表現(xiàn)學(xué)習(xí)策略較好的一種方式,該方程假設(shè)博弈參與者純策略的增長率與其適應(yīng)性成正相關(guān)并通過微分方程進(jìn)行求解。之后,研究者將演化博弈模型運用到多個領(lǐng)域,綠色發(fā)展與環(huán)境保護(hù)是研究熱點之一[15-18]。
不少研究采用固定收益假設(shè)來分析監(jiān)管者與污染者之間的均衡策略。在固定收益假設(shè)下,中心點位置通常不是演化博弈的ESS,研究者往往關(guān)注如何使得環(huán)境治理博弈收斂于“政府百分之百監(jiān)管,企業(yè)百分之百治污”的理想結(jié)點位置[19-21]。這些結(jié)論有一定局限性:在現(xiàn)實中,監(jiān)管機(jī)構(gòu)檢查概率不可能達(dá)到100%,除非不惜代價完成政治高壓任務(wù)[22]。而即便懲罰力度很大,也總會有污染者試圖違法排污,故實際的均衡點往往依概率收斂于某個中心位置。
因此,有不少研究者關(guān)心中心點位置的治污概率以及如何加強(qiáng)策略穩(wěn)定性,包括討論了初始策略對中心點位置收斂性的影響[23],修訂了研究假設(shè)并引入了動態(tài)收益或成本函數(shù),即在收益矩陣中參與者的策略收益不是常數(shù),而是與雙方策略概率相關(guān)。蔡玲如等[24]為了改善對排污收斂條件提出實施動態(tài)懲罰機(jī)制,Tian等[25]采用系統(tǒng)動力學(xué)方法討論動態(tài)補(bǔ)貼機(jī)制對綠色供應(yīng)鏈的影響。胡震云等[26]采用對總效用函數(shù)求導(dǎo)的方法得到了動態(tài)支付函數(shù);何為等[27]利用“環(huán)境生產(chǎn)函數(shù)”求偏導(dǎo)函數(shù)的方法得到動態(tài)支付函數(shù),討論了考核政策對下級監(jiān)管機(jī)構(gòu)與散亂污染源演化博弈收斂條件的影響,提出了“環(huán)境管理效應(yīng)”的概念并研究其對于博弈結(jié)果的影響;溫丹輝等[28]設(shè)定了關(guān)于強(qiáng)激勵、目標(biāo)考核和問責(zé)制的動態(tài)函數(shù),討論行政發(fā)包制度對大氣污染治理的影響。這些研究在設(shè)置動態(tài)收益函數(shù)時,主要考察污染者邊際收益和邊際治污成本,或者考察對監(jiān)管者的動態(tài)獎懲機(jī)制,但很少對監(jiān)管行為成本特征展開討論,也極少針對散亂污染源治理的研究。
散亂污染源主要特點在于其分布廣泛、數(shù)量龐大,監(jiān)管難度高。這種特征可以表現(xiàn)為監(jiān)管者的檢查成本遞增。不同產(chǎn)品的成本特征存在差異性:有些產(chǎn)品具有規(guī)模經(jīng)濟(jì)效應(yīng),邊際成本呈下降趨勢;某些產(chǎn)品由于資源稀缺性原因,邊際成本呈上升趨勢。散亂污染源監(jiān)管雖然是公共服務(wù),但由于污染源數(shù)量多、分布廣,難以做到全面覆蓋,只能進(jìn)行抽檢,例如,在路面上隨機(jī)設(shè)卡檢查大貨車的排放[29],并且工作強(qiáng)度隨著抽查密度增加而增大,閑暇時間價值上升,檢查成本將隨之上升。本文通過設(shè)定動態(tài)的檢查成本來模擬該成本特征,并研究此成本特征影響下的策略及均衡狀態(tài)的變動情況,并提出相應(yīng)對策。
監(jiān)管機(jī)構(gòu)策略簡化為兩種:“檢查”“不檢查”,假設(shè)監(jiān)管機(jī)構(gòu)選擇“檢查”的概率為p,選擇“不檢查”的概率為1-p;散亂污染源(污染者)的策略簡化為“治污”和“排污”,“治污”的概率為q,“排污”的概率為1-q。成本收益假設(shè)如下:
(1)正常收益:監(jiān)管機(jī)構(gòu)采取不檢查策略的正常收益為零,污染者治污策略的正常收益為零(實際上兩者皆不為零,將其設(shè)定為零是為了簡化模型結(jié)構(gòu)。博弈支付函數(shù)的正仿射變換(positive affine transformation)不影響復(fù)制者動態(tài)方程結(jié)構(gòu),即某一個常數(shù)加入支付矩陣的某一列,則復(fù)制者動態(tài)前后不變。
(2)檢查成本:監(jiān)管機(jī)構(gòu)對污染者的檢查成本為D,D>0。根據(jù)散亂污染源的特征,設(shè)定D為遞增函數(shù),則有:
式中:A>0,A為檢查的固定成本,主要表現(xiàn)散亂污染源的地域分布特征,污染物分布偏遠(yuǎn)時,A較高;k>0,可將k理解為污染源的數(shù)量特征,當(dāng)污染源數(shù)量非常大時,k值較高。監(jiān)管者的檢查成本將隨檢查概率p快速上升。
(3)排污收益:污染者的額外排污收益(即省下的治污成本)為E,E>0。
(4)排污懲罰:污染者排污被查獲時就會被實施處罰F。設(shè)定F>E,否則污染者沒有治污動力。
(5)監(jiān)管正激勵:監(jiān)管者查獲排污行為將得到正向激勵B,B>0。
(6)監(jiān)管負(fù)激勵:監(jiān)管機(jī)構(gòu)疏于監(jiān)管會得到來自上級和外部的負(fù)向激勵C,C>0。
收益矩陣如表1所示(監(jiān)管機(jī)構(gòu)收益在前)。
表1 監(jiān)管機(jī)構(gòu)與污染者的博弈收益矩陣
經(jīng)典的不對稱演化博弈假定博弈群體均為同質(zhì)大樣本,且群體間隨機(jī)配對。在此,由于一個地區(qū)的污染者群體通常只面對一個監(jiān)管機(jī)構(gòu),因此對復(fù)制者動態(tài)過程修改假設(shè),假設(shè)污染者進(jìn)行相互學(xué)習(xí),監(jiān)管者進(jìn)行自我學(xué)習(xí),依據(jù)上期收益情況改變本期策略。復(fù)制動態(tài)與演化博弈策略如下:
地方監(jiān)管機(jī)構(gòu)選擇“檢查”“不檢查”策略的期望收益分別為U1和U2,則有:
污染者選擇“治污”和“排污”策略的期望收益分別為V1和V2,則有:
采用復(fù)制者動態(tài)方程,演化速度用微分方程形式表示為:
其中,稱p6為均衡監(jiān)管概率,按此概率實施監(jiān)管,污染者選擇“治污”和“排污”策略的收益無差異。系統(tǒng)演化穩(wěn)定策略只有X4、X5、X6,證明如下。
李雅普諾夫系統(tǒng)穩(wěn)定性判據(jù):當(dāng)Jacobi矩陣特征根的實部均為負(fù)值時,零解為系統(tǒng)演化博弈均衡點;當(dāng)特征根實部至少有一個為正時,零解不穩(wěn)定;特征根實部為0時,為臨界狀態(tài),需計算高階導(dǎo)數(shù)或可進(jìn)行數(shù)值模擬。
演化系統(tǒng)Jacobi矩陣為:
命題1:X1、X2、X3不是演化博弈ESS;當(dāng)B+C<A時,X4為演化博弈ESS。
證明:將X1=(1, 1)、X2=(0, 1)、X3=(1, 0)、X4=(0, 0)分別代入J,則:
由 于E>0,F(xiàn)>E,A>0,k>0,X1、X2、X3至少有一個特征根非負(fù),不是演化博弈ESS。當(dāng)B+C<A時,X4的特征根均為負(fù),為演化博弈ESS。命題1得證。
命題2:當(dāng)A<B+C<A+kE/F時,系統(tǒng)均衡點為X5。
證明:將X5=(p5,q5)代入J,計算J(X5)的特征根并化簡如下:
由于A<B+C<A+kE/F,有0<p5=(B+C-A)/k<E/F<1,因此,λ51<0。
此時,X5的特征根均為負(fù),為演化博弈ESS。命題2得證。
命題3:當(dāng)B+C>A+kE/F時,X6為演化博弈ESS。
證明:將X6=(p6,q6)代入J并化簡矩陣元素,有:
其特征根方程為:
將4p6q6(1-p6)(1-q6)(B+C)F>0代入式(15),可得J(X6)的特征根λ61、λ62實部為負(fù),X6為演化博弈ESS。命題3得證。
命題1~3得到了除臨界點B+C=A,B+C=A+kE/F以外的所有ESS。經(jīng)數(shù)值模擬,臨界點系統(tǒng)穩(wěn)定策略仍收斂于上述位置。因此,系統(tǒng)ESS只有X4、X5、X6,分別命名為:完全失效情形、隱形失效情形和常規(guī)情形,總結(jié)如表2。
表2 系統(tǒng)的演化穩(wěn)定策略
X4對應(yīng)散亂污染源監(jiān)管的完全失效情形。本情形下(B+C<A),監(jiān)管者無作為而污染者隨意排污,原因在于檢查成本A過高、激勵水平(正激勵B和負(fù)激勵C)較低,因此監(jiān)管者缺乏監(jiān)管動力。完全失效情形通常發(fā)生于那些在監(jiān)管者難以有效覆蓋的區(qū)域,例如偏遠(yuǎn)山村居民薪柴燃燒引發(fā)的大氣污染。如果不是執(zhí)行專項任務(wù),這些領(lǐng)域基本處于零監(jiān)管狀態(tài)。完全失效情形(E=2,F(xiàn)=8,B=4,C=2,A=7,k=1)下散亂污染源監(jiān)管演化博弈趨勢如圖1所示。
圖1 完全失效情形下散亂污染源監(jiān)管演化博弈趨勢
X5對應(yīng)散亂污染源監(jiān)管的隱性失效情形。與X4點對應(yīng)的完全失效情形不同,由于監(jiān)管者面臨的激勵水平較高(B+C>A),故監(jiān)管者會采取監(jiān)管行動,因此,外界觀察到監(jiān)管者在努力工作,但污染者不會采取治污策略,因此我們稱之為“隱形失效”。隱形失效的原因是污染源過于分散,即k>(B+C-A)F/E),檢查成本快速上升使得監(jiān)管概率無法達(dá)到均衡概率水平p6=E/F,此時污染者“排污”策略收益高于“治污”策略收益,因而全部選擇“排污”策略,如貨車尾氣治理往往處于隱性失效狀態(tài)。隱性失效情形(E=2,F(xiàn)=8,B=4,C=2,A=2,k=15)下散亂污染源監(jiān)管的演化博弈趨勢如圖2所示。
圖2 隱性失效的散亂污染源監(jiān)管演化博弈趨勢
X6對應(yīng)常規(guī)情形。常規(guī)情形下,監(jiān)管者以均衡監(jiān)管概率p6展開監(jiān)管,污染者以概率q6進(jìn)行治污。常規(guī)情形下我們主要關(guān)注兩點:
首先關(guān)注如何提升治污概率,均衡治污概率由公式(8)給出。
其次關(guān)注策略收斂性問題。為了更好地觀察收斂趨勢,我們引入隨機(jī)項u和v,則有:
式中:u和v為獨立的一維標(biāo)準(zhǔn)布朗運動,模擬博弈過程中隨機(jī)因素的影響。給定時間t,u(t)和v(t)服從正態(tài)分布N(0,t),du(t)和dv(t)服從正態(tài)分布N(0, Δt)。p(1-p)和q(1-q)表明,當(dāng)p和q為1/2時,隨機(jī)因素影響最大。
不同成本特征下散亂污染源治理會出現(xiàn)治污概率低下和策略收斂性較差(執(zhí)法運動)兩種問題。
問題一:治污概率低下。在檢查成本較高的區(qū)域(A值和k值較高,一般為城鄉(xiāng)接合部或者農(nóng)村地區(qū)),企業(yè)的治污策略收斂于較低水平。較高檢查成本地區(qū)(E=2,F(xiàn)=8,B=4,C=2,A=3,k=2)演化博弈趨勢如圖3所示。
圖3 較高檢查成本地區(qū)常規(guī)情形演化博弈趨勢
問題二:策略收斂性較差。檢查成本較低的區(qū)域(A值和k值較低,一般為污染源集中區(qū)域),監(jiān)管者可以通過高密度檢查短期內(nèi)獲取高額收益,隨著污染者排污行為減少,監(jiān)管者實施“檢查”策略的平均獲益下降,就會降低檢查頻率,直至違法水平提升,如此循環(huán)往復(fù)。較低檢查成本地區(qū)(E=2,F(xiàn)=8,B=4,C=2,A=1,k=0.5)演化博弈趨勢如圖4所示,在隨機(jī)因素影響下,策略呈現(xiàn)明顯的執(zhí)法運動狀態(tài)。
圖4 較低檢查成本地區(qū)常規(guī)情形演化博弈趨勢
監(jiān)管完全失效的主要原因在于污染源地處偏遠(yuǎn)導(dǎo)致固定檢查成本(A值)太高,監(jiān)管行動得不償失。因此,需要依靠技術(shù)進(jìn)步手段(例如無人機(jī))降低固定檢查成本。
監(jiān)管隱性失效的主要原因在于污染源空間分布廣泛,檢查成本隨著監(jiān)管密度迅速上升(k值大),排污行為被懲處的概率很低導(dǎo)致污染者選擇排污策略。除了采用技術(shù)手段降低k值以外,另一個有效手段是提升違法處罰F,從而使得B+C>A+KE/F。
常規(guī)情形需要解決治污概率低下和策略收斂性較差的問題。較高檢查成本地區(qū)容易出現(xiàn)治污概率低下的情況。由公式(8)可以看到,提升處罰水平F和激勵水平B、C,降低不變檢查成本A和成本系數(shù)k可提升治污概率q6。
較低檢查成本地區(qū)出現(xiàn)策略收斂性問題的原因在于監(jiān)管者面臨低收益水平時具有降低監(jiān)管頻率的沖動,動態(tài)監(jiān)管激勵可以抑制這種沖動從而改善策略收斂性[25]。將負(fù)向激勵C改為動態(tài)形式:
式中:α表示外部監(jiān)督的強(qiáng)度;(1-p)(1-q)為漏檢違法企業(yè)數(shù)量;λ>0表示監(jiān)管部門面臨的負(fù)向激勵不是常數(shù),而是與漏檢違法企業(yè)數(shù)量正相關(guān)。這是一種懲治落后的監(jiān)督機(jī)制,例如在環(huán)保督查機(jī)制下漏檢違法企業(yè)數(shù)量較多的將會被問責(zé),因此抑制了監(jiān)管者降低監(jiān)管頻率的沖動。
在圖4的基礎(chǔ)上,按公式(16)改變C的形式,取λ=1,α=20(負(fù)向激勵水平與原有水平相當(dāng))后展開數(shù)值模擬,演變趨勢如圖5所示,博弈雙方的策略收斂性得到顯著改善。
圖5 引入動態(tài)激勵后監(jiān)管機(jī)構(gòu)和污染者的演化趨勢圖
通過引入動態(tài)檢查成本并構(gòu)建散亂污染源治理演化博弈模型,本文討論了不同檢查成本下散亂污染源監(jiān)管的均衡策略與收斂性問題。計算結(jié)果表明,動態(tài)檢查成本約束下散亂污染源監(jiān)管會呈現(xiàn)完全失效、隱性失效和常規(guī)情形三種均衡狀態(tài)。
進(jìn)一步分析后可知,散亂污染源監(jiān)管完全失效是由于固定檢查定成本過高,從而出現(xiàn)“無監(jiān)管、無治理”的情形;隱形失效是因為變動檢查成本過高,檢查概率無法到達(dá)均衡水平從而出現(xiàn)“有監(jiān)管、無治理”的情形;在常規(guī)情形下,較高的檢查成本導(dǎo)致治污概率低下,較低的檢查成本可以實現(xiàn)高水平治污,但需要防范周期性反彈現(xiàn)象。
根據(jù)計算、模擬與討論,針對散亂污染源治理提出政策建議如下:
(1)應(yīng)積極推廣新技術(shù)以降低檢查成本。散亂污染源分布廣、數(shù)量多、檢查成本高、抽檢概率低,容易出現(xiàn)完全失效和隱形失效情形。目前重點污染源很多都安裝了在線監(jiān)測設(shè)施,但散亂污染源治理仍主要依靠人工抽檢。因此,很有必要引入新的技術(shù)手段(例如信息技術(shù)和無人機(jī)監(jiān)控取證手段)來降低檢查成本,防止監(jiān)管失效。
(2)應(yīng)提升違法處罰水平以降低監(jiān)管所需要的均衡概率。國家治理散亂污染由來已久,但有些違法排污的處罰措施仍沿用20世紀(jì)末的標(biāo)準(zhǔn),例如機(jī)動車排污處罰上限通常為200元。由于較低的違法處罰需要較高的均衡監(jiān)管概率,容易導(dǎo)致隱形失效問題,因此,有必要較大幅度提升散亂污染源的違法處罰水平。
(3)堅持環(huán)保督察常態(tài)化以防止污染反彈。降低檢查成本容易陷入“運動執(zhí)法”、污染反彈的情形,因此,應(yīng)引入環(huán)保督察動態(tài)激勵機(jī)制改善策略收斂性,防止污染反彈。