楊蘇,蔡樂
(1.安徽建筑大學(xué) 經(jīng)濟與管理學(xué)院,安徽 合肥 230601;2.安徽省建筑經(jīng)濟與房地產(chǎn)管理研究中心,安徽 合肥 230601)
在工業(yè)化進程中,環(huán)境問題成為全球性問題,在資源和環(huán)境限制下的綠色行為也日益重要。企業(yè)的綠色行為是指為了在資源環(huán)境約束下提高自身競爭優(yōu)勢,為獲得社會、經(jīng)濟和環(huán)保的最大收益行為,采用綠色創(chuàng)新與管理,將資源消耗降到最低且將環(huán)境污染減到最少[1]。在綠色行為決策過程中,企業(yè)追求的是自身的利潤最大化,而政府作為監(jiān)管方,受到一些不確定因素的影響,也無法時刻都做出完全理性的決策行為,因此風險決策行為可以看做是在不確定情形下有限理性決策主體所做的綠色行為決策的這一行為,符合演化博弈的有限理性假設(shè)。
已有研究證實絕大多數(shù)的環(huán)境污染問題產(chǎn)生的原因是企業(yè)未采取綠色行為或政府未能進行及時有效的監(jiān)管[2-5],而運用演化博弈分析綠色行為的現(xiàn)有研究成果中對企業(yè)不采取綠色行為、政府不積極監(jiān)管的決策行為背后的形成機理并未給出有說服力的解釋[6-7]。那么究竟如何利用演化博弈研究綠色行為決策過程中的形成機理?
演化博弈理論[8-10]摒棄了經(jīng)典博弈論完全理性假設(shè)的局限,從人的有限理性出發(fā)來分析和預(yù)測群體行為,真實反映決策主體行為的多樣性和復(fù)雜性。一些學(xué)者已運用演化博弈的方法對綠色行為決策進行了研究,這些研究成果[11-14]改進了原有完全理性的假設(shè)局限,但在分析過程中仍采用的是基于傳統(tǒng)期望效用理論的客觀收益矩陣來表達支付矩陣,無法準確刻畫決策行為人的心理感知,所得出的結(jié)論常與現(xiàn)實矛盾甚至相悖。因為前景理論與傳統(tǒng)的期望效用理論相比較,增加了決策者的理性不足和偏好兩方面的考慮,衡量的是動態(tài)不確定條件下的前景價值,所以其在分析企業(yè)行為方式行為變化時更加客觀,也更符合在真實情況下人們的決策行為[15-16]。
因此,本文將前景理論引入演化博弈分析框架,遵循有限理性的假設(shè)前提,用前景理論中的前景價值函數(shù)替代傳統(tǒng)期望效用理論中的收益矩陣,構(gòu)建演化博弈模型并通過仿真分析探討政府不同環(huán)境規(guī)制強度下的企業(yè)行為策略。
建立基于前景理論綠色行為的企業(yè)前景價值感知函數(shù),并構(gòu)建主體綠色決策的演化博弈模型,運用演化動態(tài)中的復(fù)制動態(tài)來刻畫政府和企業(yè)的策略選擇與演化路徑。
在不考慮外部環(huán)境和其他決策主體影響的情況下,綠色行為決策過程可以視為一種不確定情形下政府和企業(yè)的風險決策行為?;诖?,提出以下假設(shè):
假設(shè)1:在綠色行為決策中,存在著政府和企業(yè)博弈雙方,其各自對策略價值的感知從而進行決策,并且政府和企業(yè)這種感知價值的特征符合前景理論,前景價值(V)即博弈主體對策略得失值的心理感受,其分為價值函數(shù)v(x)和權(quán)重函數(shù)π(p)。
其中,我們將pi作為決策事件所發(fā)生的概率,π( pi)代表決策者的主觀判斷事件所發(fā)生的概率,其權(quán)重函數(shù)形狀為倒“S”型,γ 值越小,函數(shù)曲線越彎曲,滿足π(0)= 0,π(1)= 1;Δxi為事件發(fā)生后博弈主體所得的實際收益與參照點的差值,Δx =x - x0,x0為參照點。
α、β ∈(0,1)為博弈主體的風險偏好系數(shù),當α = β = 1 時此時的博弈主體是風險中等偏好。損失規(guī)避系數(shù)為λ(λ ≥1),它的值越大則表示主體對損失的敏感性強于收益。
假設(shè)2:企業(yè)和政府的策略選擇分別有兩種:{采取綠色創(chuàng)新行為I1,不采取綠色創(chuàng)新行為I2}與{積極監(jiān)管S1,消極監(jiān)管S2}。
若政府為投入積極監(jiān)管而產(chǎn)生的費用為c,相對應(yīng)的前景價值感知為C;企業(yè)的進行的綠色創(chuàng)新行為采取包括勞動、時間、精力等付出的實際成本為t,前景價值感知相應(yīng)為T。f1為政府實際處罰企業(yè)造成的環(huán)境污染問題,相應(yīng)的前景價值感知為F1。
假設(shè)3:政府在決策時的主要關(guān)注問題是社會效益最大化,企業(yè)既追求利潤最大化也會考慮社會效益。社會理性更加決定了個體利益,行為如果只考慮到個體利益無法絕對保證個體的最大化利益[17]。
企業(yè)與政府在日常生產(chǎn)生活中所存在的博弈過程是動態(tài)可重復(fù)的過程,根據(jù)對方的相關(guān)變化來調(diào)整自身策略,改變的策略會形成演化穩(wěn)定均衡。
企業(yè)采取綠色行為的概率為x,不采取綠色行為的概率為1 - x 政府積極監(jiān)管的概率為y,消極監(jiān)管的概率為1 - y,其中。
文中各變量設(shè)置與符號約定參見表1。
表1 變量設(shè)置與符號約定
通過上述三個假設(shè),構(gòu)建基于前景理論的綠色行為決策主體間的演化博弈模型、收益感知矩陣,如下表2 所示。
表2 綠色行為決策主體的收益感知矩陣
(3)當博弈雙方采取{ }S1,I2策略時,假設(shè)企業(yè)不采取綠色行為被發(fā)現(xiàn)的實際概率為q,若未被發(fā)現(xiàn)則可逃脫處罰。
基于復(fù)制動態(tài)的演化博弈分析方法[18],由表2可知,企業(yè)在采納綠色行為和不采納綠色行為兩種情形下的期望收益感知及平均收益感知分別為:
同理,政府在積極監(jiān)管和消極監(jiān)管兩種情形下的期望收益感知及平均收益感知分別為:
根據(jù)非對稱復(fù)制動態(tài)演化方式,得到x 和y 的復(fù)制動態(tài)方程分別為:
綠色行為決策主體的演化均衡結(jié)果可通過式(10)和(11)聯(lián)立的微分方程組系統(tǒng)求解得到。
使(F(x),F(y))=(0,0),從而得到了五個點,分 別 是:E1(0,0),E2(0,1),E3(1,0),E4(1,1) 與E5(x0,y0),其 中,y0)=。
再根據(jù)每個均衡點的detJ 和trJ 的正負情況進行判定,將雅克比矩陣記為 J,J =,雅克比矩陣存在局部穩(wěn)定性相應(yīng)判定準則[19],當且僅當detJ >0 且trJ <0 時可能均衡點為演化穩(wěn)定均衡點其對應(yīng)的局部穩(wěn)定性分析為下表3。
表3 局部穩(wěn)定性分析結(jié)果
根據(jù)前景理論可知,綠色行為主體的決策是由其收益心理感知決定的,只有同時滿足(13)中的所有條件,政府才會選擇積極監(jiān)管,企業(yè)才會選擇采用綠色行為的策略,此時達到帕累托最優(yōu)。
由于x,y ∈[ 0,1 ],而要使得點E5(x0,y0)有意義則需要滿足:
即企業(yè)采取綠色行為的所付出的費用的前景價值感知小于政府對企業(yè)進行污染行為的處罰風險、聲譽及損失的風險貼現(xiàn)值之和,且也小于由此帶來的額外外部收益,企業(yè)才可能自發(fā)采取綠色行為。
通過采用MATLAB 軟件仿真模擬企業(yè)綠色行為決策演化構(gòu)建博弈模型中的參數(shù)變化對系統(tǒng)演化的影響。
假設(shè)初始值為x=0.2,y=0.2,k=1,m=0.4,n=0.6,F(xiàn)1=0.5,F(xiàn)2=1,C=1,T=1,通過上述的初始值設(shè)置,再進行MATLAB 軟件50 次的重復(fù)博弈仿真。
2.2.1 政府對企業(yè)行為的監(jiān)管成本C 值得改變對結(jié)果的影響
由圖1 知,關(guān)于監(jiān)管成本C 的臨界值在0.9 值附近,當臨界值小于C 時,y 收斂于0,然而C 的減少一定程度降低y 收斂于0 速度;當臨界值大于C時,y 收斂于1,此時C 的減少一定程度加快y 收斂于1。由此我們發(fā)現(xiàn),經(jīng)過C 的降低,政府積極監(jiān)管的概率會的到提升。
圖1 政府的監(jiān)管成本C的變化對演化結(jié)果的影響
2.2.2 企業(yè)污染行為被政府處罰的損失其F1的變化對演化結(jié)果的影響
由圖2 可得,F(xiàn)1在1.0-1.5 之間存在某個臨界值,當F1小于該臨界值時x 收斂于0,而F1增加會減慢x 收斂于0 的速度;當F1大于其時,x 則會收斂于1??梢?,通過增加企業(yè)污染行為被政府處罰所損失的F1使企業(yè)在綠色生產(chǎn)方面更加重視。
2.2.3 企業(yè)的風險損失的前景價值感知F2的變化對演化結(jié)果的影響
圖2 企業(yè)受到政府處罰的損失的前景價值感知F1變化對演化結(jié)果的影響
由圖3 可知,臨界值存在于1.6-1.8 之間,當臨界值大于F2,x 收斂于0,增大F2減慢x 的收斂;當臨界值小于F2時,x 收斂于1,這使得增大F2反而加快了x 的收斂。從而,增加企業(yè)的風險損失的前景價值感知F2,可促進企業(yè)更多的采納綠色生產(chǎn)行為。
圖3 企業(yè)的風險損失的前景價值感知F2變化對演化結(jié)果的影響
2.2.4 綠色行為的采取所付出成本T 其變化對演化結(jié)果的影響
從圖4 可得,在0.6 的附近存在一個相應(yīng)的臨界值,當T 比其小時,x 收斂于1,此時T 的減少能夠更快的促使x 收斂于1。當T 比此臨界值大時,x 會收斂于0,但T 減少時能降低x 收斂于0 的速度;所以,幫助企業(yè)降低綠色行為成本T 幫助綠色行為采納。
2.2.5 風險傳遞系數(shù)k 的變化對演化結(jié)果的影響
圖4 綠色行為的采取所付出成本T其變化對演化結(jié)果的影響
由圖5 可知,在1.2-1.4 之間存在某個臨界值,臨界值小于k 時,y 收斂于1,此時增加k 一定程度令y 加速收斂于1。所以,政府在通過加大經(jīng)濟懲罰的力度和制定更加嚴厲的環(huán)境規(guī)范政策會相應(yīng)增加企業(yè)對于綠色行為的拒絕產(chǎn)生的環(huán)境危害所遞送到政府的成本,企業(yè)在種種措施下會更加傾向于綠色行為。
圖5 風險傳遞系數(shù)k變化對演化結(jié)果的影響
2.2.6 y 改變對演化結(jié)果的影響
從圖6 得知,F(xiàn)2= 1.6 時,臨界值存在0.8 附近,臨界值大于y 時,x 收斂于0,并且增加y 一定程度減緩x 收斂于0 的速率,反之。所以提升政府積極監(jiān)管的概率y 比例能夠促進企業(yè)采納綠色行為。
綜上,由以上綠色行為決策的演化博弈模型和仿真結(jié)果可知,企業(yè)采納綠色行為與否在于對其收益和成本的前景價值感知的衡量?;谇熬袄碚摵陀邢蘩硇约僭O(shè),可從以下方面促進企業(yè)的綠色行為:
(1)強化企業(yè)的心理預(yù)期價值感知
圖6 y變化對演化結(jié)果的影響
企業(yè)的綠色行為是不確定性的風險決策行為,決策者的風險偏好和有限理性會影響決策行為。根據(jù)前景理論,決策者面對收益的反應(yīng)是風險規(guī)避,面對損失的反應(yīng)是風險偏好,并且對損失的感知比對收益的感知更為敏感;決策者往往還會低估事件發(fā)生的風險。因此可在一定范圍內(nèi)變動懲罰的大小,通過增加聲譽損失、提高準入門檻等方式,增加企業(yè)對損失的風險價值感知,或者采取不定期和隨機抽查的方式,加大企業(yè)對懲罰的心理威懾作用,促進企業(yè)的綠色行為。
(2)采取差異化的環(huán)境監(jiān)管政策
考慮到環(huán)境監(jiān)管政策對不同企業(yè)綠色行為決策的影響,政府應(yīng)根據(jù)不同性質(zhì)企業(yè)不同階段需求不同的特點,選擇不同的監(jiān)管強度進行監(jiān)管。對有違規(guī)生產(chǎn)、排放記錄的企業(yè),應(yīng)增加檢查頻率加大監(jiān)管力度,對采取綠色行為、聲譽良好的企業(yè),可降低監(jiān)管力度減少監(jiān)管成本。
(3)建立更為有效的激勵和監(jiān)督機制
有效的激勵機制和監(jiān)督機制可以正向促進企業(yè)綠色行為。可更多的激勵企業(yè)的綠色行為,能夠使得綠色行為在激勵中不斷地改革創(chuàng)新,同時,其采用的科學(xué)技術(shù)也會越來越豐富,那些選擇綠色行為的企業(yè)也能夠更輕松地獲得更大的競爭力,除了常規(guī)的稅收優(yōu)惠、環(huán)保補貼、財政支持等激勵措施,還應(yīng)當創(chuàng)新激勵方式,采取一些增加企業(yè)聲譽、認證等形式的激勵,為企業(yè)提供可獲得長期競爭優(yōu)勢的愿景。政府的監(jiān)管不可能做到時刻有效,因此,可考慮多種監(jiān)管方式的協(xié)同,如引入第三方監(jiān)管,充分發(fā)揮環(huán)境非政府組織的監(jiān)管作用。
本文創(chuàng)新性地構(gòu)建了前景理論框架下的綠色行為決策演化博弈模型,更為真實地展現(xiàn)了博弈主體從感知到?jīng)Q策過程中的有限理性,運用前景理論中的價值函數(shù)來表示決策主體的得失的心理感知,用決策權(quán)重函數(shù)來表示決策主體對各自不同策略選擇的概率的認知,推導(dǎo)了促進綠色行為發(fā)生的四個條件,探討博弈雙方具體何時做出“趨利”的選擇,何一時間點選擇“避害”的策略,并利用MATLAB 軟件仿真模擬了各個參數(shù)對演化結(jié)果的影響,所得結(jié)論更為貼近現(xiàn)實中綠色行為決策主體的行為。