余福茂,王希鵑
(杭州電子科技大學(xué) 管理學(xué)院,浙江 杭州 310018)
?
隨機(jī)懲罰下政府和非正規(guī)回收群體的演化博弈
余福茂,王希鵑
(杭州電子科技大學(xué) 管理學(xué)院,浙江 杭州 310018)
為了探索在隨機(jī)懲罰的情況下,政府監(jiān)督策略和電子廢棄物非正規(guī)回收群體回收行為之間的影響,構(gòu)建了政府和非正規(guī)回收群體間的演化博弈模型。首先從理論上分析了政府的隨機(jī)懲罰和補(bǔ)貼對非正規(guī)回收群體回收行為策略的影響,然后利用數(shù)值仿真進(jìn)一步驗(yàn)證隨機(jī)懲罰、補(bǔ)貼、回收收入等外生變量和內(nèi)生變量對回收行為策略的影響。結(jié)果表明:通過增大隨機(jī)懲罰或補(bǔ)貼的方式來促進(jìn)非正規(guī)回收群體選擇轉(zhuǎn)型升級,不僅需要在監(jiān)管部門對非正規(guī)回收群體采取的隨機(jī)懲罰小于社會(huì)效益和污染治理成本之和的前提下,而且還需要滿足關(guān)于監(jiān)督力度的特定條件;政府如果加大監(jiān)督力度,適當(dāng)增加政府補(bǔ)貼,合理控制隨機(jī)懲罰,將有利于電子廢棄物回收行業(yè)的可持續(xù)長期發(fā)展。
非正規(guī)回收群體;政府;隨機(jī)懲罰;補(bǔ)貼
我國電子廢棄物回收處理領(lǐng)域面臨著的嚴(yán)峻挑戰(zhàn)——可再生資源的利用問題和嚴(yán)重的環(huán)境污染問題,電子廢棄物回收領(lǐng)域得到越來越多學(xué)者的關(guān)注[1-2]。從回收行為角度,Mishima等研究了促進(jìn)消費(fèi)者回收的有效方法以鼓勵(lì)回收行為策略[3];Chi等以調(diào)查問卷為主要研究方法分析了中國臺(tái)州地區(qū)影響消費(fèi)者回收行為的影響因素,以促進(jìn)電子廢棄物的有效回收[4];Qu等調(diào)查了大連居民的回收行為和支付意愿并為政策制定者提供潛在的解決方案[5]。從回收策略角度,Xu等在博弈論的基礎(chǔ)上,研究了在零售商和制造商激烈競爭下的最優(yōu)零售價(jià)格、最優(yōu)回收價(jià)格和最優(yōu)利潤[6];Huang等基于博弈論研究了閉環(huán)供應(yīng)鏈單渠道或雙渠道的最優(yōu)策略問題[7];Lakhan探討了市政回收獎(jiǎng)勵(lì)對廢棄物的回收率及成本的影響問題[8]。從回收模式優(yōu)化角度,余福茂等討論了政府補(bǔ)貼激勵(lì)對電子廢棄物四種不同回收模式下廢舊產(chǎn)品回收率和各主體收益的影響[9];劉慧慧等分析了在不同競爭情景下政府補(bǔ)貼對電器廢棄物正規(guī)回收渠道和非正規(guī)回收渠道的影響[10];易余胤等通過對比三種混合回收模式回收率、零售價(jià)和利潤的變化,發(fā)現(xiàn)制造商與零售商混合回收的模式為最理想的回收模式[11]。
目前相關(guān)研究主要都是以再制造商、處理商和生產(chǎn)商等為研究對象,然而我國80%的電子廢棄物都是由非正規(guī)回收渠道回收的。非正規(guī)回收渠道的回收主體主要包括小商販、個(gè)體戶、拾荒者、非法拆解戶等,本文將上述主體統(tǒng)稱為非正規(guī)回收商,由n個(gè)非正規(guī)回收商組成非正規(guī)回收群體。在政府的監(jiān)督下,政府對通過正規(guī)回收渠道回收的主體有補(bǔ)貼獎(jiǎng)勵(lì),而對通過非正規(guī)回收渠道回收的主體采取隨機(jī)懲罰,懲罰的程度由是否被政府抓住和對環(huán)境可能造成的污染情況所決定。本文使用演化博弈的方法,研究政府的監(jiān)督策略即補(bǔ)貼和隨機(jī)懲罰對非正規(guī)回收群體回收行為的影響,建立政府和非正規(guī)回收群體的演化模型并進(jìn)行演化穩(wěn)定性分析和數(shù)值仿真,旨在促進(jìn)非正規(guī)回收群體向正規(guī)回收渠道轉(zhuǎn)型升級,從而減少環(huán)境污染,使電子廢棄物回收行業(yè)向更加健康環(huán)保的方向發(fā)展。
假設(shè)一:策略假設(shè)。假設(shè)政府具有兩種監(jiān)督策略,其策略空間s1=(監(jiān)督,不監(jiān)督),其采取“監(jiān)督”策略的概率為Y,則采取“不監(jiān)督”策略的概率為1-Y。其中,“監(jiān)督”策略是指政府對非正規(guī)回收群體不同回收行為的懲罰措施或補(bǔ)貼獎(jiǎng)勵(lì)政策;而“不監(jiān)督”策略是指政府不進(jìn)行監(jiān)督。非正規(guī)回收群有兩種回收策略,其策略空間s2=(轉(zhuǎn)型升級,不轉(zhuǎn)型升級),其采取“轉(zhuǎn)型升級”策略的概率為X,則釆取“不轉(zhuǎn)型升級”策略的概率為1-X。其中,“轉(zhuǎn)型升級”策略是指非正規(guī)回收群體選擇轉(zhuǎn)型升級成為合法的回收群體,通過正規(guī)回收渠道回收;而“不轉(zhuǎn)型升級”策略是指非正規(guī)回收群體仍然通過非正規(guī)回收渠道回收。
假設(shè)二:有限理性。假定非正規(guī)回收群體和政府雙方都具體有限理性。
假設(shè)三:獨(dú)立性。非正規(guī)回收群體由n個(gè)非正規(guī)回收商組成,假定n個(gè)非正規(guī)回收商相互獨(dú)立。
假設(shè)四:懲罰系數(shù)。當(dāng)非正規(guī)回收群體選擇轉(zhuǎn)型升級時(shí),政府會(huì)給予相應(yīng)的補(bǔ)貼;當(dāng)非正規(guī)回收
群體依然選擇通過非正規(guī)回收渠道回收時(shí),在政府的管制下一旦被政府發(fā)現(xiàn),便會(huì)得到一定的懲罰。非正規(guī)回收商在政府管制下選擇非正規(guī)回收渠道回收時(shí)是否會(huì)受到懲罰,即滿足一定的懲罰系數(shù)ε,其中ε為符合兩點(diǎn)分布的隨機(jī)變量,滿足p(ε=0)=1-β,p(ε=1)=β,則E(ε)=0×(1-β)+1×β=β。
假設(shè)五:懲罰力度函數(shù)。若非正規(guī)回收群體受到了政府的懲罰,其受到懲罰的程度滿足懲罰力度函數(shù):F(P)=P,其中P符合二項(xiàng)分布P~B(n,p),事件為一個(gè)非正規(guī)回收商受到政府懲罰,n表示非正規(guī)回收群體的總個(gè)數(shù),k表示受到懲罰的非正規(guī)回收商個(gè)數(shù),p表示一個(gè)非正規(guī)回收商受到懲罰的概率即懲罰力度。
假設(shè)六:參數(shù)假設(shè)。假定博弈雙方僅具有有限理性,具體參數(shù)假設(shè)和基本解釋如下:
C:電子廢棄物的有用成分即可以直接拿來利用時(shí),此時(shí)回收所需的有用成本;
C1:電子廢棄物需要處理提取出的可利用成分,此時(shí)通過正規(guī)渠道回收處理的成本;
C2:電子廢棄物需要處理提取出的可利用成分,此時(shí)通過非正規(guī)渠道回收處理的成本;
C3:政府選擇“不監(jiān)督”策略且非正規(guī)回收商選擇非正規(guī)回收渠道回收時(shí),由于環(huán)境污染政府需付出的治理成本;
α:電子廢棄物中可直接拿來用的部分所占的比例;
R1:一個(gè)非正規(guī)回收商選擇向正規(guī)回收渠道轉(zhuǎn)型升級時(shí)的收入,即合法環(huán)保回收的收入;
R2:一個(gè)非正規(guī)回收商選擇非正規(guī)回收渠道回收時(shí)的收入,即非正規(guī)回收的收入;
R3:非正規(guī)回收群體選擇正規(guī)回收渠道回收或政府選擇“監(jiān)督”策略時(shí)政府得到的社會(huì)效益;
G:非正規(guī)回收群體選擇正規(guī)回收渠道回收時(shí),政府給予的獎(jiǎng)勵(lì)即補(bǔ)貼。
綜合上述模型假設(shè)和參數(shù)設(shè)置,得出政府和非正規(guī)回收商之間博弈的收益矩陣如表1所示。
表1 政府和非正規(guī)回收群體博弈的收益矩陣
根據(jù)收益矩陣,可得政府對非正規(guī)回收群體回收處理行為采取“監(jiān)督”策略的收益函數(shù)為:
πGY=X(R3-G)+(1-X)(R3+εP)
則政府對非正規(guī)回收群體回收處理采取“監(jiān)督”策略的期望收益為:
EGY=E(πGY)=X(R3-G)+(1-X)[R3+E(P)E(ε)]=X(R3-G)+(1-X)(R3+βnp)
政府對非正規(guī)回收群體回收處理采取“不監(jiān)督”策略及混合策略的期望收益分別為:
EGN=-C3(1-X)=XC3-C3
可得政府監(jiān)督策略的復(fù)制動(dòng)態(tài)方程為:
(1)
電子廢棄物非正規(guī)回收群體采取“轉(zhuǎn)型升級”策略的期望收益為:
ERY=YG+nR1-αC-(1-α)C1
電子廢棄物非正規(guī)回收群體采取“不轉(zhuǎn)型升級”策略的收益函數(shù)為:
πRN=-Yβnp+nR2-αC-(1-α)C2
電子廢棄物非正規(guī)回收群體采取“不轉(zhuǎn)型升級”策略的期望收益為:
ERN=E(πRN)=-YE(ε)E(P)+nR2-αC-(1-α)C2
=-Yβnp+nR2-αC-(1-α)C2
非正規(guī)回收群體采取“轉(zhuǎn)型升級”策略、“不轉(zhuǎn)型升級”策略及混合策略的期望收益分別為:
=XY(G+βnp)-Yβnp+X[nR1-nR2-(1-α)(C1-C2)]+nR2-αC-(1-α)C2
同理,可以得出電子廢棄物非正規(guī)回收群體回收策略的復(fù)制動(dòng)態(tài)方程為:
(2)
由式(1)和(2)組合而成的系統(tǒng)復(fù)制動(dòng)態(tài)方程為:
(一)非正規(guī)回收群體回收行為策略的演化穩(wěn)定性分析
(1)當(dāng)Y=Y0時(shí),等式F(X)=0恒成立,在此區(qū)間內(nèi)所有的X取值點(diǎn)均處于穩(wěn)定狀態(tài)。
(2)當(dāng)Y≠Y0時(shí),根據(jù)具體參數(shù)取值的不同分以下三種情況討論:
1)當(dāng)(1-α)(C1-C2)>G+βnp+n(R1-R2)時(shí),X=0是演化穩(wěn)定策略,即經(jīng)過長期演化,有限理性的非正規(guī)回收群體會(huì)選擇不轉(zhuǎn)型升級為正規(guī)回收群體,依然堅(jiān)持非正規(guī)回收行為。
2)當(dāng)n(R1-R2)<(1-α)(C1-C2) 3)當(dāng)(1-α)(C1-C2) (二)政府監(jiān)督策略的演化穩(wěn)定性分析 (1)當(dāng)X=X0時(shí),等式F(Y)=0恒成立,即對所有的Y取值點(diǎn)都處于穩(wěn)定狀態(tài)。 (2)當(dāng)X≠X0時(shí),根據(jù)具體參數(shù)取值的不同分以下三種情況討論: 1)當(dāng)R3>G+2βnp時(shí),Y=1是穩(wěn)定策略,即隨著t的推移,有限理性的政府會(huì)穩(wěn)定趨于采取“監(jiān)督”策略。 2)當(dāng)βnp-C3 3)當(dāng)R3<βnp-C3時(shí),Y=0是演化博弈的穩(wěn)定策略,即此時(shí)政府的社會(huì)效益比政府付出的監(jiān)督成本低,且在該情況下政府的策略選擇并不會(huì)隨著非正規(guī)回收群體回收行為的不同而產(chǎn)生變化。 (三)非正規(guī)回收群體和政府混合策略的演化穩(wěn)定性分析 由系統(tǒng)復(fù)制動(dòng)態(tài)方程(1)和(2)描述了非正規(guī)回收群體和政府之間混合策略選擇的演化,可以得出當(dāng)且僅當(dāng)0≤X0≤1,0≤Y0≤1成立時(shí),混合策略有以下五個(gè)均衡點(diǎn),分別為:(0,0)、(0,1)、(1,0)、(1,1)和(X0,Y0),該混合系統(tǒng)的Jacobian矩陣為: 為得到各個(gè)穩(wěn)定點(diǎn)所反應(yīng)出來的特征根,將各個(gè)穩(wěn)定點(diǎn)分別代入該Jacobian矩陣,便能夠根據(jù)特征根判別其結(jié)果的穩(wěn)定性,該系統(tǒng)各均衡點(diǎn)所反應(yīng)出的特征根如表2所示。 表2 系統(tǒng)各均衡點(diǎn)所反應(yīng)的特征根 (1)情形1:(1-α)(C1-C2) 運(yùn)用Matlab對算例進(jìn)行數(shù)值仿真,在滿足此情形的條件下,政府和非正規(guī)回收群體混合策略的動(dòng)態(tài)演化如圖1所示。 圖1 情形1下混合策略動(dòng)態(tài)演化圖 根據(jù)數(shù)值仿真結(jié)果,在此情形下,非正規(guī)回收群體采取“轉(zhuǎn)型升級”的策略X慢慢趨向于1,而政府采取“監(jiān)督”策略Y會(huì)逐漸穩(wěn)定于1,此時(shí)策略X隨著策略Y的變化而變化。當(dāng)R3<βnp-C3時(shí),非正規(guī)回收群體采取“轉(zhuǎn)型升級”的策略X受到政府采取“監(jiān)督”策略Y的影響但不顯著;當(dāng)R3>βnp-C3時(shí),在政府采取“監(jiān)督”策略的情況下,非正規(guī)回收群體會(huì)主動(dòng)采取“轉(zhuǎn)型升級”策略。 (2)情形2:n(R1-R2)<(1-α)(C1-C2) 運(yùn)用Matlab對算例進(jìn)行數(shù)值仿真,在滿足此情形的條件下,政府和非正規(guī)回收群體混合策略的動(dòng)態(tài)演化如圖2所示。 圖2 情形2下混合策略動(dòng)態(tài)演化圖 根據(jù)數(shù)值仿真結(jié)果,在此情形下,政府采取“監(jiān)督”策略Y會(huì)逐漸趨向于1,而非正規(guī)回收群體轉(zhuǎn)型升級策略X受到政府監(jiān)督策略Y的影響逐漸變小。當(dāng)R3<βnp-C3時(shí),非正規(guī)回收群體行為策略的選擇會(huì)隨著政府策略不同而稍微產(chǎn)生變化,且主要取決于政府監(jiān)督策略Y的大?。划?dāng)R3>βnp-C3時(shí),政府會(huì)主動(dòng)采取“監(jiān)督”策略,無論非正規(guī)回收群體是否采取“轉(zhuǎn)型升級”策略。 (3)情形3:(1-α)(C1-C2)>G+βnp+n(R1-R2) 運(yùn)用Matlab對算例進(jìn)行數(shù)值仿真,在滿足此情形的條件下,政府和非正規(guī)回收群體混合策略的動(dòng)態(tài)演化如圖3所示。 圖3 情形3下混合策略動(dòng)態(tài)演化圖 根據(jù)數(shù)值仿真結(jié)果,在此情形下,非正規(guī)回收群體采取“轉(zhuǎn)型升級”的策略X漸趨向于0,而政府采取“監(jiān)督”策略Y會(huì)逐漸趨向于1。即有限理性的政府會(huì)選擇對非正規(guī)回收群體采取“監(jiān)督”策略,而非正規(guī)回收群體會(huì)主動(dòng)采取“不轉(zhuǎn)型升級”策略。若R3越小,非正規(guī)回收群體在政府監(jiān)督下越會(huì)主動(dòng)采取“不轉(zhuǎn)型升級”策略。 本文運(yùn)用演化博弈的方法對非正規(guī)回收群體和政府之間的選擇策略進(jìn)行建模,分析了影響策略選擇的因素,其中內(nèi)生變量有轉(zhuǎn)型升級成本(1-α)C1和不轉(zhuǎn)型升級的成本(1-α)C2,外生變量有轉(zhuǎn)型升級總收入nR1、不轉(zhuǎn)型升級總收入nR2、補(bǔ)貼G、隨機(jī)懲罰βnp和社會(huì)效益R3等。 通過分析電子廢棄物非正規(guī)回收群體和政府博弈雙方的演化穩(wěn)定策略,可知博弈雙方采取混合策略時(shí)呈周期性規(guī)律,并通過數(shù)值仿真分析驗(yàn)證結(jié)論表明: (1)當(dāng)政府對非正規(guī)回收群體采取監(jiān)督策略的概率Y>Y0時(shí),非正規(guī)回收群體會(huì)選擇轉(zhuǎn)型升級為正規(guī)回收群體,使電子廢棄物回收處理市場轉(zhuǎn)向可持續(xù)的環(huán)保方向發(fā)展;當(dāng)政府對非正規(guī)回收群體采取監(jiān)督策略的概率Y (2)政府的隨機(jī)懲罰βnp和補(bǔ)貼G都與政府采取監(jiān)督策略的概率Y具有互補(bǔ)性。即政府的補(bǔ)貼G或政府的隨機(jī)懲罰βnp越大時(shí),政府采取監(jiān)督策略的概率越小。 (3)在情形1下,當(dāng)R3>βnp-C3時(shí),政府會(huì)主動(dòng)采取“監(jiān)督”策略,非正規(guī)回收群體也會(huì)主動(dòng)采取“轉(zhuǎn)型升級”策略,有利于電子廢棄物回收處理行業(yè)的可持續(xù)綠色發(fā)展。在情形2下,當(dāng)R3>βnp-C3時(shí),政府采取“監(jiān)督”策略對非正規(guī)回收群體的回收行為策略選擇影響不大。在情形3下,政府會(huì)主動(dòng)采取“監(jiān)督”策略,而非正規(guī)回收群體會(huì)主動(dòng)采取“不轉(zhuǎn)型升級”策略,且若R3越小,非正規(guī)回收群體在政府監(jiān)督下越會(huì)主動(dòng)采取“不轉(zhuǎn)型升級”策略,依然無法減少對環(huán)境造成的污染。 綜上所述,通過增大隨機(jī)懲罰或補(bǔ)貼的方式來促進(jìn)非正規(guī)回收群體選擇轉(zhuǎn)型升級,不僅需要在監(jiān)管部門對非正規(guī)回收群體采取的隨機(jī)懲罰小于社會(huì)效益和污染治理成本之和的前提下,而且還需要滿足關(guān)于監(jiān)督力度的特定條件;與此同時(shí),政府可以加大監(jiān)管力度,加強(qiáng)政府監(jiān)督部門的執(zhí)法水平并提高監(jiān)管電子廢棄物回收處理行業(yè)的工作效率。 [1]Kuo T C. Waste electronics and electrical equipment disassembly and recycling using Petri net analysis: Considering the economic value and environmental impacts[J]. Comouters & Industrial Engineering, 2013, 65(1SI): 54-64. [2]Cimpan C, Rothmann M, Hamelin L, et al. Towards increased recycling of household waste: Documenting cascading effects and material efficiency of commingled recyclables and biowaste collection[J]. Journal of Environmental Management, 2015(157): 69-83. [3]Xu C, Li B, Lan Y, et al. A Closed-Loop Supply Chain Problem with Retailing and Recycling Competition[J]. Abstract and Applied Analysis, 2014(8):1-14. [4]Qu Y, Zhu Q, Sarkis J, et al. A review of developing an e-wastes collection system in Dalian, China[J]. Journal of Cleaner Production,2013(52): 176-184. [5]Huang M, Song M, Lee L H, et al. Analysis for strategy of closed-loop supply chain with dual recycling channel[J]. International Journal of Production Economics, 2013, 144(2): 510-520. [6]Chi X, Wang M Y L, Reuter M A. E-waste collection channels and household recycling behaviors in Taizhou of China[J]. Journal of Cleaner Production, 2014(80): 87-95. [7]Mishima K, Nishimura H. Requirement analysis to promote small-sized E-waste collection from consumers[J]. Waste Management & Research, 2016, 34(2): 122-128. [8]Lakhan C. The relationship between municipal waste diversion incentivization and recycling system performance[J]. Resources, Conservation and Recycling, 2016(106): 68-77. [9]余福茂,鐘永光,沈祖志.考慮政府引導(dǎo)激勵(lì)的電子廢棄物回收處理決策模型研究[J].中國管理科學(xué),2014,22(5):131-137. [10]劉慧慧,黃濤,雷明.廢舊電器電子產(chǎn)品雙渠道回收模型及政府補(bǔ)貼作用研究[J].中國管理科學(xué),2013,21(2):123-131. [11]易余胤,梁家密.獎(jiǎng)懲機(jī)制下的閉環(huán)供應(yīng)鏈混合回收模式[J].計(jì)算機(jī)集成制造系統(tǒng),2014,20(1):215-223. Evolutionary Game of Government and Informal-recycling-group under Random Punishment YU Fu-mao, WANG Xi-juan (SchoolofManagement,HangzhouDianziUniversity,HangzhouZhejiang310018,China) In order to explore the influence on the supervision strategy of the government and the recycling behavior of the informal-recycling-group of the electronic waste, the evolutionary game model related with the government and the informal-recycling-group is constructed.First, the effects of random punishment and subsidy on the recycling behavior of the informal-recycling-group are analyzed from the perspective of theory, and then the effects of the exogenous variables and endogenous variables on the recycling behavior strategies are verified with the numerical simulation, such as the random punishment, the subsidy, and the income of recycling.The results show that increasing the random punishment or subsidies to promote the informal-recycling-group to choose their transformation and upgrading not only demands the supervision department to take the random punishment to the informal-recycling-group, which should be less than the sum of social benefits and the cost of pollution control, but also to meet the specified conditions of the supervision dynamics. If the government increases its supervision dynamic, appropriately increases the government subsidies and reasonably controls its random punishment, it will be beneficial to the recycling industry of electronic waste in a long-term sustainable development. informal-recycling-group; government; random punishment; subsidy 10.13954/j.cnki.hduss.2016.05.001 2016-05-20 國家自然科學(xué)基金(70903021,71373064) 余福茂(1975-),男,山西應(yīng)縣人,教授,博士,資源環(huán)境政策與管理、物流與供應(yīng)鏈管理. X708 B 1001-9146(2016)05-0001-06四、數(shù)值仿真
五、結(jié)論