孫冬石,王文娣
(大連東軟信息學(xué)院 信息與商務(wù)管理學(xué)院,遼寧 大連 116023)
生產(chǎn)者責(zé)任延伸機制(Extended Producer Responsibility,以下簡稱EPR)的概念于1988年被瑞典環(huán)境經(jīng)濟學(xué)家托馬斯首次提出,后來經(jīng)由學(xué)者們在理論和實踐中不斷完善。隨著可持續(xù)性發(fā)展理論的不斷完善,EPR在德國、美國、荷蘭、日本等發(fā)達國家的法律法規(guī)和社會公信等領(lǐng)域不斷提升影響,近年來,在我國隨著《再生資源回收管理辦法》等制度的出臺,EPR也在逐漸成為我國構(gòu)建循環(huán)經(jīng)濟體系的重要支撐。但應(yīng)該看到的是,目前我國EPR的實施無論在執(zhí)行度和有效性上都不夠理想。其原因主要有如下幾點:生產(chǎn)者作為企業(yè)的逐利性、消費者的不信任、缺乏第三方公信力。
針對上述問題,國內(nèi)外的學(xué)者進行了大量的研究。學(xué)者們首先對EPR的適用范圍和實施模式進行了研究,Wassenhove,等是應(yīng)用博弈論解決閉環(huán)供應(yīng)鏈上EPR問題的先驅(qū),比較了生產(chǎn)者、零售商和第三方進行產(chǎn)品回收的效率,并就集中和分散兩種模式的優(yōu)劣進行了分析;王文賓,等研究了在具有4個利益相關(guān)者的閉環(huán)供應(yīng)鏈中,不同回收難度的產(chǎn)品,生產(chǎn)者應(yīng)該承擔(dān)的固定投資的比例與供應(yīng)鏈整體利潤最大化的關(guān)系,界定了生產(chǎn)者在產(chǎn)品逆向中的責(zé)任區(qū)間。政府的參與也被證明是EPR順利實施的關(guān)鍵因素,彭本紅,等證明了政府規(guī)制對EPR的巨大作用,并且比較了政府與消費者之間在合作與不合作兩種模式下,EPR實施情況的差別,提煉出影響廢舊產(chǎn)品回收的主要因素。消費者的行為是EPR實施中另一個重要影響因素,曲英,等以手機為例,提出了生產(chǎn)者與第三方物流結(jié)合的廢舊手機回收思路,并探討了居民對不同的聯(lián)合回收模式的偏好,為生產(chǎn)者進行決策支持。
學(xué)者們的研究分析了EPR的適用條件,并對EPR實施中的影響各主體的因素進行歸納,但目前研究的對象一般具有較高的回收價值,實踐中針對一些低回收價值但有較強的公益屬性的產(chǎn)品,生產(chǎn)者對于EPR的態(tài)度是非常不明確的,在沒有響應(yīng)的激勵機制輔助,產(chǎn)品的逆向供應(yīng)鏈很容易出現(xiàn)斷裂。本文首先要研究目前的較為常用的激勵機制在差異化產(chǎn)品EPR實施中的表現(xiàn),并根據(jù)產(chǎn)品的特征,給出全面提升EPR實施的路徑建議。
1.1.1 演化博弈。演化博弈在研究有限理性的多主體策略平衡問題上具有較大的適用性。EPR的實施效果是政府、企業(yè)、消費者這三個產(chǎn)品逆向供應(yīng)鏈中利益相關(guān)者策略博弈的平衡。生產(chǎn)者是EPR的實施的執(zhí)行主體。政府在EPR中的作用主要體現(xiàn)為兩點:一是增加實施EPR的概率,在政策上使更多的企業(yè)可以參與到循環(huán)資源網(wǎng)絡(luò)的構(gòu)建。該項監(jiān)督主要以激勵的形式為主,參考現(xiàn)有政府部門的做法,激勵的主要手段是降低納稅比率;二是保證生產(chǎn)者在進行產(chǎn)品的回收時,按照回收標準進行處理,保證產(chǎn)品轉(zhuǎn)化過程對環(huán)境和消費者的損害在要求的范圍內(nèi)。該項內(nèi)容是對生產(chǎn)者誠信度的監(jiān)督,且不按標準的廢棄產(chǎn)品處理會產(chǎn)生惡劣的影響,所以該項監(jiān)督是以懲罰形式體現(xiàn),手段為對違規(guī)生產(chǎn)者收繳罰金。EPR演化博弈中的另一個主體是消費者。消費者的重復(fù)購買行為和生產(chǎn)者實施EPR 過程中對消費者的補貼是影響EPR實施演化的主要動因。由政府、生產(chǎn)者、消費者三方主體構(gòu)成的EPR演化博弈中,涉及到的相關(guān)變量見表1。
表1 演化博弈中的變量設(shè)定
三方的策略集分別為(監(jiān)督,不監(jiān)督)、(實施,不實施)、(購買、不購買),把肯定策略選擇用1表示,否則用0表示,則三方在博弈中按照主體不同的選擇將產(chǎn)生8個純策略組合,收益情況見表2。
表2 三方主體收益矩陣
在實踐中,博弈策略選擇不是簡單的(0,1),而是以概率進行。設(shè)三方選擇監(jiān)督、實施、購買的策略的概率分別為α、β、γ,概率的區(qū)間都為[0,1]。關(guān)于EPR的演化博弈中,政府、生產(chǎn)者和消費者的復(fù)制動態(tài)方程中包含了大量的外生變量、不同策略的概率分布和收益的組合,利用聯(lián)立方程組,通過雅可比矩陣計算特征值,判斷局部穩(wěn)定性分析的方法并不適用,其計算過程復(fù)雜,且不能分析單獨外生變量對策略選擇的影響。
1.1.2 系統(tǒng)動力學(xué)。系統(tǒng)動力學(xué)(System Dynamics,SD)的主要思想是系統(tǒng)結(jié)構(gòu)決定系統(tǒng)性能,是以控制論為基礎(chǔ),把復(fù)雜系統(tǒng)分解為若干子系統(tǒng),并構(gòu)建子系統(tǒng)之間的邏輯聯(lián)系,通過計算機仿真模型,驗證系統(tǒng)的性能,為決策提供支持。系統(tǒng)動力學(xué)與演化博弈方法具有較高的適配性,在需要判斷大量的外生變量對主體演化博弈穩(wěn)定性的影響時,系統(tǒng)動力學(xué)可以提供較為清晰的仿真結(jié)果。
所以,本文選擇應(yīng)用系統(tǒng)動力學(xué)的理念,使用Vensim PLE軟件構(gòu)建不同的外生變量與決策變量之間的因果關(guān)系圖和存量流量圖,并通過對可調(diào)控的外生變量進行不同條件下的靈敏度分析,進一步對低于預(yù)期效果的產(chǎn)品設(shè)計混合激勵機制,以實現(xiàn)三方在長期博弈過程中可以達到理想平衡。
仿真中的基本參數(shù)設(shè)置為:INITIAL TIME=0,F(xiàn)INAL TIME=72,TIME STEP=1,Unites for Time=Week。在仿真中,α、β、γ構(gòu)成的純策略組合作為初始解的時候,在仿真過程中,α、β、γ也將保持不變。為方便進行仿真分析,對其進行微調(diào)打破恒等式,0設(shè)置為0.01,1設(shè)置為0.99。
根據(jù)各變量之間的因果關(guān)系,可得出如圖1所示的存量流量圖。
圖1 基于EPR演化博弈的存量流量圖
1.2.1 高回收價值產(chǎn)品的數(shù)據(jù)。本文通過進行問卷、走訪調(diào)研,及查閱網(wǎng)絡(luò)資料等方式,進行數(shù)據(jù)收集,以確定外生變量賦值。為考慮研究的普適性,本文討論的產(chǎn)品為市場上常見產(chǎn)品,生產(chǎn)者的數(shù)量眾多,每個生產(chǎn)者市場份額較小,提供有差別的同種類產(chǎn)品,產(chǎn)品的替代性很強,認為產(chǎn)品所在的市場為壟斷競爭市場。在這種市場中,近似認為產(chǎn)品的價格等于其價值,在計量中等于其使用價值,即≈。
在高回收價值產(chǎn)品仿真分析中,選擇電冰箱作為參考產(chǎn)品,以多家生產(chǎn)者產(chǎn)品的平均值為外生變量的初始賦值。變量為單位產(chǎn)品的相關(guān)費用,單位:千元。
產(chǎn)品價格P為3,則同時V=3。業(yè)界的產(chǎn)品總成本設(shè)定為產(chǎn)品價格的2/3左右,即為2;生產(chǎn)者按標準進行EPR,其物流費、加工處理費等成本C為總成本C的1/10左右,即C=0.2;支付消費者的回收補償V約為總成本的一半,即V=0.1;冰箱的回收主要是重金屬和零部件,廢舊冰箱的回收總價值為成本的20%左右,約0.4,減去回收成本C,即為通過產(chǎn)品回收節(jié)省的原材料成本S=0.2;廢舊冰箱回收的正向收益等于治理重金屬、氟利昂等污染費用加上節(jié)省的垃圾處理費用,經(jīng)調(diào)研B=0.3;冰箱為代表的高回收價值產(chǎn)品,生產(chǎn)者的收益主要來自原材料回收,其實施EPR的主動性較高,按標準回收率也較高,設(shè)定=90%;目前政府對EPR監(jiān)督缺乏專業(yè)的手段,假定=50%;生產(chǎn)者不按標準進行回收時,成本會大幅降低,約為標準回收的1/2,即C=0.1;政府實施監(jiān)督的成本C目前處于較低的水平,抽檢每個冰箱需要的總成本為C=0.02;生產(chǎn)者不按標準實施責(zé)任延伸,主要是造成污染D,另外,不標準的原材料再利用也對消費者造成損害D,通常情況下,D是直接的,且損害較大,設(shè)定D為D的2倍,D=0.2,則D=0.1;稅收減免等獎勵收益R一般不超過價格的5%,故本文設(shè)定為R=0.15;不按標準回收將導(dǎo)致環(huán)境污染、市場公信度差等嚴重的問題,需要對違規(guī)的生產(chǎn)者進行嚴懲,F(xiàn)設(shè)定為R的2倍,即F=0.3。
1.2.2 低回收價值產(chǎn)品的數(shù)據(jù)。為了驗證低回收價值產(chǎn)品的演化,需要對部分外生變量進行調(diào)整。首先,選擇的對象為建筑材料為代表的低回收價值產(chǎn)品,為了在盡可能類似的條件下比較三方主體的選擇,保持產(chǎn)品的初始價格不變,成本不變,即P=3,C=2。改變的外生變量如下:由于建筑材料回收價值低,回收總價值為成本的10%左右,約0.2;回收成本相對也較低,設(shè)定為C=0.5,其中給消費者補償V=0.05,則S=回收總價值-C=0.05;生產(chǎn)者不按標準進行回收時,C=0.08;實施生產(chǎn)者責(zé)任延伸的主動性較低,按標準回收率也較低,=30%。
根據(jù)高回收價值產(chǎn)品外生變量的設(shè)定,選擇(1,1,1)為α、β、γ的初始策略,仿真結(jié)果圖2所示。
圖2 初始策略為(1,1,1)的高回收價值產(chǎn)品仿真
圖3 初始策略為(1,1,1)的低回收價值產(chǎn)品仿真
從以上的仿真結(jié)果可知,低回收價值的產(chǎn)品,最終政府、生產(chǎn)者之間達成(不監(jiān)管、不實施)的平衡,而消費者是否選擇購買具有較高的隨機性。生產(chǎn)者缺乏實施EPR的意向。
在低回收價值產(chǎn)品的三方演化博弈仿真中,顯然最終演化結(jié)果是不樂觀的。需要驗證部分策略型外生變量的調(diào)整是否可以對生產(chǎn)者實施EPR策略產(chǎn)生影響。以下的靈敏度分析是在圖3 仿真結(jié)果中進行的。
(1)稅收減免等獎勵收益R和欺騙的懲罰F。當前條件下,最終演化成為0,考慮增加獎勵來對生產(chǎn)者實施激勵。其他變量保持不變,圖4顯示了R分別等于0.15,0.2和0.3時的變化。
圖4 政府獎勵R變化時β的演化圖
仿真結(jié)果表明,提升獎勵會降低下降的速率,但影響較小,且最終不能改變生產(chǎn)者不實施EPR的選擇。此外,政府監(jiān)管中的懲罰只針對非標準的責(zé)任延伸,懲罰的目的是防止生產(chǎn)者惡意騙取政府激勵,但在當前的條件下,生產(chǎn)者沒有意愿實施責(zé)任延伸,懲罰的作用沒有體現(xiàn)。綜合獎勵和懲罰效果,可證明,對于低回收價值產(chǎn)品,政府部門針對生產(chǎn)者是否實施責(zé)任延伸的一般性獎懲機制是失效的。
(2)產(chǎn)品回收時給消費者的補償。考慮降低V來驗證相關(guān)決策變量的變化規(guī)律。當其他變量不變,V值為0.05,0.03和0時,對模型進行靈敏度分析。結(jié)果表明,V下降會降低下降的速率,但影響較小,下降趨勢圖與圖4類似,不做展示。消費者購買率的變化如圖5所示。
圖5 消費者補償Vr變化時γ的演化圖
結(jié)果顯示,V下降會對消費者的購買選擇產(chǎn)生較大的影響,當V降低時,其從產(chǎn)品生產(chǎn)者再次購買的概率降速較大。且即便V=0時,依舊無法保證EPR的理想概率,而消費者的購買欲望接近于0,無疑是飲鴆止渴的行為。
(3)非標準且被發(fā)現(xiàn)的比率和監(jiān)督成本C。通過對非標準且被發(fā)現(xiàn)的比率和監(jiān)督成本C進行上浮和下浮的調(diào)整發(fā)現(xiàn),當前條件下,以上兩個外生變量對生產(chǎn)者責(zé)任延伸實施的概率的影響不大,篇幅關(guān)系不做展示。
綜上,靈敏度分析證明了對于低回收價值產(chǎn)品,博弈中的可策略性調(diào)整的外生變量不能對生產(chǎn)者是否實施EPR產(chǎn)生決定性影響,即單一激勵協(xié)調(diào)失靈。
本文深入研究了EPR在差異化產(chǎn)品逆向供應(yīng)鏈中的實施效果,通過政府、生產(chǎn)者、消費者的博弈,建立了多外生變量影響下的三方演化博弈模型,并通過Vensim軟件建立系統(tǒng)動力學(xué)仿真模型,分析了不同回收價值的產(chǎn)品回收中博弈主體的表現(xiàn)。結(jié)合本文的研究成果得出以下的結(jié)論。
(1)EPR 的實施與產(chǎn)品回收價值有直接的關(guān)系?;厥諆r值高的產(chǎn)品,生產(chǎn)者會選擇主動實施EPR。而低回收價值的產(chǎn)品,生產(chǎn)者實施EPR的意愿低。且通過對單一外生變量進行策略調(diào)整,如改變獎懲措施、加強政府監(jiān)督、降低生產(chǎn)者對消費者的補償?shù)?,也只能實現(xiàn)短期EPR實施率的提升,而不能保證生產(chǎn)者在長期演化中穩(wěn)定實施EPR。
(2)針對生活中大量的低回收價值,無法科學(xué)處理就會產(chǎn)生嚴重污染或資源浪費的產(chǎn)品,需主動對產(chǎn)品逆向供應(yīng)鏈進行重構(gòu),改變產(chǎn)品單一的逆向回收路徑,如引入第三方垃圾處理機構(gòu)進行逆向產(chǎn)品預(yù)處理降低回收成本,才能從根本上提升生產(chǎn)者實施EPR的比例。
(3)在單一激勵失靈的情況下,合理地進行激勵機制的組合設(shè)計是EPR實施的有效保障。但在混合激勵的設(shè)計中,要注意正向激勵和反向激勵在組合中是否出現(xiàn)“效益悖反”的現(xiàn)象。激勵的設(shè)計固然需要以企業(yè)為核心,但要兼顧產(chǎn)品逆向供應(yīng)鏈中其他主體的收益。