王冬計(jì),李 營(yíng),劉聯(lián)勝,劉春雨,賈思琪,董奇烜
(1.河北工業(yè)大學(xué) 能源與環(huán)境工程學(xué)院,天津 300401;2.河北工業(yè)大學(xué) 經(jīng)濟(jì)管理學(xué)院,天津 300401)
北方農(nóng)村地區(qū)燃煤采暖造成嚴(yán)重的環(huán)境污染,對(duì)居民身體健康產(chǎn)生嚴(yán)重威脅[1]。為營(yíng)造舒適、清潔的居住環(huán)境,急需推廣清潔采暖方式。秸稈具有低灰、低硫、低氮、CO2零排放等優(yōu)點(diǎn)[2-3],用秸稈壓塊燃料替代散煤取暖已成為解決能源問題和改善生態(tài)環(huán)境的有效途徑之一[4]。然而,傳統(tǒng)的秸稈直燃方式因存在燃料收集與使用勞動(dòng)強(qiáng)度高、堆放占用空間大等問題,而被逐漸富裕起來的農(nóng)民舍棄。采用成型技術(shù)將松散的秸稈(60~80 kg/m3)壓縮為壓塊燃料(700~1 300 kg/m3)既便于運(yùn)輸、存儲(chǔ),又可以有效提高燃料的能量密度[5],使其便于使用,用于農(nóng)村采暖不僅可以減少化石燃料消耗,還可減少溫室氣體排放,是一條可行的可持續(xù)發(fā)展道路[6-8]。
目前,中國(guó)的秸稈壓塊燃料供應(yīng)鏈多呈“農(nóng)戶→秸稈經(jīng)紀(jì)人→壓塊生產(chǎn)企業(yè)→燃料市場(chǎng)”的模式。秸稈被農(nóng)民低價(jià)出售給秸稈經(jīng)紀(jì)人,經(jīng)多級(jí)秸稈經(jīng)紀(jì)人后由壓塊生產(chǎn)企業(yè)收購(gòu),成型后的產(chǎn)品在燃料市場(chǎng)出售。該供應(yīng)鏈屬于單向多層的服務(wù)模式,成型燃料因多次利潤(rùn)疊加而價(jià)格高昂,致使農(nóng)民使用壓塊燃料的意愿較弱,形成了農(nóng)民僅供應(yīng)秸稈原料而不使用壓塊產(chǎn)品的開環(huán)結(jié)構(gòu),供需兩側(cè)的物質(zhì)與價(jià)格均不穩(wěn)定。造成該現(xiàn)象的主要原因是對(duì)農(nóng)戶的行為模式認(rèn)識(shí)不夠準(zhǔn)確,將農(nóng)戶行為模式認(rèn)為是典型的經(jīng)濟(jì)人。實(shí)質(zhì)上,農(nóng)民既是秸稈供應(yīng)者又是壓塊燃料消費(fèi)者。在農(nóng)村地區(qū)構(gòu)建秸稈壓塊服務(wù)站公共服務(wù)設(shè)施,形成“農(nóng)戶→秸稈壓塊服務(wù)站→農(nóng)戶”,則可去除供應(yīng)鏈的中間環(huán)節(jié),構(gòu)建穩(wěn)定可靠的區(qū)域能源市場(chǎng)體系,實(shí)現(xiàn)以可再生能源替代散煤供暖,進(jìn)而達(dá)到節(jié)能減排的效果。
秸稈壓塊服務(wù)站在組織關(guān)系上涉及到當(dāng)?shù)卣?、企業(yè)和農(nóng)民三部分,三者不是孤立的個(gè)體而是互利共贏的合作者。研究三方參與主體的行為策略是一個(gè)典型的博弈問題,解決博弈問題一直存在很多方法,如靜態(tài)博弈、動(dòng)態(tài)博弈、重復(fù)博弈等[9]。但以上博弈理論沿襲經(jīng)典經(jīng)濟(jì)學(xué)的完全理性人假設(shè)[10],即政府、企業(yè)和農(nóng)民均被視為完全理性人,在一次博弈或重復(fù)博弈中即可找到最佳策略。然而這一假設(shè)與實(shí)際是不相符的。實(shí)際情況下各參與主體的知識(shí)、能力及智慧等方面是不同且有限的,而且僅僅通過簡(jiǎn)單的重復(fù)博弈是不能使所有參與主體達(dá)到“共同知識(shí)”的[11]。秸稈壓塊服務(wù)站建設(shè)博弈過程,不僅涉及農(nóng)民、企業(yè)及政府各主體客觀的經(jīng)濟(jì)行為,還存在農(nóng)民和企業(yè)可能不知道其他參與主體收益函數(shù)的情況,并且各主體都有各自的習(xí)慣和經(jīng)驗(yàn),存在系統(tǒng)推理誤差等主觀因素。政府、企業(yè)及農(nóng)民都是有限理性人,且三方之間的博弈是一個(gè)信息不完全的復(fù)雜動(dòng)態(tài)博弈過程。演化博弈論認(rèn)為人的理性是有限的,不要求完全信息條件,它強(qiáng)調(diào)一種動(dòng)態(tài)均衡[12]。為此選取演化博弈理論對(duì)秸稈壓塊服務(wù)站建設(shè)問題進(jìn)行研究。
首先構(gòu)建政府、企業(yè)及農(nóng)民三方博弈模型;其次,結(jié)合演化博弈穩(wěn)定性理論尋找三方博弈的穩(wěn)定點(diǎn),討論不同條件下模型的穩(wěn)定狀態(tài),分析各參與主體的行為策略;然后采用Shapley值法建立利潤(rùn)分配模型;最后結(jié)合案例對(duì)政府的激勵(lì)和三方利潤(rùn)分配占比進(jìn)行量化分析,以期為政府制定合理的激勵(lì)策略提供理論支持。
演化博弈理論包括復(fù)制動(dòng)態(tài)方程[13]和演化穩(wěn)定策略[14]兩方面內(nèi)容。前者強(qiáng)調(diào)的是選擇,后者強(qiáng)調(diào)的是變異。復(fù)制動(dòng)態(tài)方程是描述博弈方的某一特定策略在一個(gè)種群中被采用頻數(shù)的動(dòng)態(tài)微分方程。演化穩(wěn)定策略是指在多方博弈過程中,由于博弈方都是有限理性的,不可能在起初就找到各自最優(yōu)策略,博弈方需對(duì)有利策略不斷修正和改進(jìn),直至趨于某個(gè)穩(wěn)定策略。
秸稈壓塊服務(wù)站的建設(shè)由政府、企業(yè)和農(nóng)民三方群體組成。通過分析各群體行為,構(gòu)建三方演繹博弈模型。在三方博弈中,政府以社會(huì)效益和環(huán)境效益最大化為決策依據(jù);企業(yè)以自身利益最大化為決策依據(jù);農(nóng)民以自身受益最大化為決策依據(jù)。政府的決策為采取經(jīng)濟(jì)激勵(lì)政策或不采取經(jīng)濟(jì)激勵(lì)政策,企業(yè)的決策為投資建設(shè)秸稈壓塊服務(wù)站或不投資建設(shè)秸稈壓塊服務(wù)站,農(nóng)民的決策為采用秸稈壓塊取暖或不采用秸稈壓塊取暖。基于上述參與主體的決策行為,做出如下假設(shè)。
假設(shè)1:政府、企業(yè)和農(nóng)民之間的博弈屬于不完全信息博弈,即三方掌握的信息均不完全。
假設(shè)2:農(nóng)民不采用秸稈壓塊取暖所帶來的環(huán)境損失,在政府采取經(jīng)濟(jì)激勵(lì)政策、企業(yè)建設(shè)情況下,政府和企業(yè)共同承擔(dān)該項(xiàng)損失,其中政府承擔(dān)比例為β,企業(yè)承擔(dān)比例為1-β;其余情況下政府承擔(dān)該項(xiàng)損失。
各參與主體的相關(guān)參數(shù)設(shè)定如下:
政府采取經(jīng)濟(jì)激勵(lì)政策需付出的成本記為C1,萬元;政府不采取經(jīng)濟(jì)激勵(lì)政策需付出的宣傳成本記為C2,萬元。其他參與主體均積極參與下政府獲得的社會(huì)效益和環(huán)境效益記為R1,萬元;其中因企業(yè)的積極參與政府獲取的效益比例為θ;其他參與主體均不參與下政府的損失記為D1,萬元。
企業(yè)投資建設(shè)秸稈壓塊服務(wù)站付出成本記為C3,萬元;獲得的經(jīng)濟(jì)效益記為R2,萬元;獲得的政府補(bǔ)貼記為W1,萬元。企業(yè)不建設(shè)秸稈壓塊服務(wù)站損失的社會(huì)聲譽(yù)記為C4,萬元。
農(nóng)民采用秸稈壓塊取暖需付出燃料成本記為C5,萬元;獲得的政府補(bǔ)貼記為W2,萬元。農(nóng)民不采用秸稈壓塊取暖需付出燃料成本記為C6,萬元;造成的環(huán)境損失記為D2,萬元。
根據(jù)以上假設(shè),構(gòu)建圖1所示的政府G、企業(yè)E和農(nóng)民F之間的博弈樹模型。圖中yes代表主體的行為是參與秸稈壓塊服務(wù)站的建設(shè)和使用,no代表主體的行為是不參與秸稈壓塊服務(wù)站的建設(shè)和使用。數(shù)字1、2、3、4、5、6、7、8分別代表不同的情況,如數(shù)字1表示政府采取經(jīng)濟(jì)激勵(lì)政策、企業(yè)投資建設(shè)秸稈成型燃料服務(wù)站、農(nóng)民采用秸稈壓塊取暖的情況。
圖1 政府、企業(yè)以及農(nóng)民之間的博弈樹模型
根據(jù)上述博弈樹模型得出農(nóng)民采用秸稈壓塊取暖與不采用秸稈壓塊取暖的收益情況分別如表1、表2所示。
表1 農(nóng)民采用秸稈壓塊取暖時(shí)各主體的收益情況
表2 農(nóng)民不采用秸稈壓塊取暖時(shí)各主體收益情況
1.2.1 政府的博弈策略
設(shè)定政府采取經(jīng)濟(jì)激勵(lì)政策的概率為x,則政府不采取經(jīng)濟(jì)激勵(lì)政策的概率為1-x;企業(yè)投資建設(shè)秸稈壓塊燃料服務(wù)站的概率為y,則企業(yè)選擇不投資建設(shè)秸稈壓塊燃料服務(wù)站的概率為1-y;農(nóng)民采用秸稈壓塊取暖的概率為z,則農(nóng)民不采用秸稈壓塊取暖的概率為1-z。政府、企業(yè)、農(nóng)民的平均期望收益分別用H1、H2、H3表示。
政府的平均期望收益用式(1)進(jìn)行計(jì)算,即
H1=xH11+(1-x)H12
(1)
式中H11、H12分別為政府采取經(jīng)濟(jì)激勵(lì)政策的期望收益和政府不采取經(jīng)濟(jì)激勵(lì)政策的期望收益,萬元,分別由式(2)、式(3)進(jìn)行計(jì)算,即
H11=yz(-C1+R1-W1-W2)+(1-y)z[(1-θ)R1-C1-W2]+y(1-z)(-C1+θR1-W1-βD2)+(1-y)(1-z)(-C1-D1-D2)=yz[-D1+(β-1)D2]+y[(1-β)D2+D1+θR1-W1]+z[(1-θ)R1+D1+D2-W2]+(-C1-D1-D2)
(2)
H12=yz(-C2+R1)+(1-y)z[(1-θ)R1-C2]+y(1-z)(-C2+θR1-D2)+(1-y)(1-z)(-C2-D2-D1)=z[(1-θ)R1+D1+D2]+y(θR1+D1)-yzD1+(-C2-D1-D2)
(3)
隨著群體不斷演化,群體中的個(gè)體不斷選擇某策略進(jìn)行博弈,采用某策略的個(gè)體的期望收益高于群體平均收益,則該類個(gè)體的數(shù)量會(huì)增加;反之,則該類個(gè)體的數(shù)量會(huì)減少。這就表明在演化過程中群體中個(gè)體總數(shù)量一直處于不斷變化中,而采取經(jīng)濟(jì)激勵(lì)政策策略的個(gè)體概率也在不斷變化,用于描述這個(gè)概率變化情況的方程即為復(fù)制動(dòng)態(tài)方程。采用復(fù)制動(dòng)態(tài)方程,即選擇某一特定策略概率的變化等于該策略的收益值與群體平均收益值之間的差值[14-15]?;诖耍扇〗?jīng)濟(jì)激勵(lì)政策策略的復(fù)制動(dòng)態(tài)方程x′(t)由式(4)進(jìn)行計(jì)算,即
x′(t)=x(H11-H1)
(4)
基于上述政府收益和復(fù)制動(dòng)態(tài)方程,展開得到政府采取經(jīng)濟(jì)激勵(lì)政策策略的概率x的復(fù)制動(dòng)態(tài)方程為
(5)
1.2.2 企業(yè)的博弈策略
企業(yè)的平均期望收益由式(6)進(jìn)行計(jì)算,即
H2=yH21+(1-y)H22
(6)
式中H21、H22分別為企業(yè)投資建設(shè)秸稈壓塊服務(wù)站和不投資建設(shè)秸稈壓塊服務(wù)站的期望收益,萬元,分別由式(7)和式(8)進(jìn)行計(jì)算,即
H21=xz(-C3+R2+W1)+(1-x)z(-C3+R2)+x(1-z)[-C3+R2+W1-(1-β)D2]+(1-x)(1-z)(-C3+R2)=x[W1-(1-β)D2]+xz(1-β)D2-C3+R2
(7)
H22=-C4
(8)
同理,企業(yè)采取建設(shè)策略的復(fù)制動(dòng)態(tài)方程y′(t)由式(9)進(jìn)行計(jì)算,即
y′(t)=y(H21-H2)
(9)
基于上述企業(yè)收益和復(fù)制動(dòng)態(tài)方程,展開得到企業(yè)采取建設(shè)策略的概率y的復(fù)制動(dòng)態(tài)方程為
(10)
1.2.3 農(nóng)民的博弈策略
農(nóng)民的平均期望收益由式(11)進(jìn)行計(jì)算,即
H3=zH31+(1-z)H32
(11)
式中H31、H32為農(nóng)民采用秸稈壓塊取暖和不采用秸稈壓塊取暖的期望收益,萬元,分別由式(12)和式(13)進(jìn)行計(jì)算,即
H31=xy(-C5+W2)+x(1-y)(-C5+W2)+(1-x)y(-C5)+(1-x)(1-y)(-C5)=xW2-C5
(12)
H32=xy(-C6)+x(1-y)(-C6)+(1-x)y(-C6)+(1-x)(1-y)(-C6)=-C6
(13)
同理,農(nóng)民采取秸稈壓塊取暖策略的復(fù)制動(dòng)態(tài)方程z′(t)由式(14)進(jìn)行計(jì)算,即
z′(t)=z(H31-H3)
(14)
基于農(nóng)民收益和復(fù)制動(dòng)態(tài)方程,展開得到農(nóng)民采取秸稈壓塊取暖策略的概率z的復(fù)制動(dòng)態(tài)方程為
(15)
令F1(x)=0,F(xiàn)2(y)=0,F(xiàn)3(z)=0,可以得到8個(gè)平衡點(diǎn),分別為S1=(0,0,0),S2=(0,0,1),S3=(0,1,0),S4=(0,1,1),S5=(1,0,0),S6=(1,0,1),S7=(1,1,0),S8=(1,1,1)。除上述8個(gè)平衡點(diǎn)外,還存在平衡點(diǎn)S9=(x,y,z),其中x、y、z均在區(qū)間(0,1)內(nèi)。該平衡點(diǎn)的表達(dá)式為
(16)
根據(jù)式(16)求解得到平衡點(diǎn)S9=(x,y,z),即
(17)
根據(jù)演化博弈的穩(wěn)定性理論可得,若dF1(x)/dx<0,dF2(y)/dy<0,dF3(z)/dz<0,則S9=(x,y,z)為三方博弈的穩(wěn)定點(diǎn),其中
(18)
1.3.1 政府的演化穩(wěn)定策略
1)當(dāng)yz(β-1)D2-y[(1-β)D2-W1]-zW2-C1+C2=0,即y、z取式(17)中的數(shù)值時(shí),表明x取任意值,系統(tǒng)都處于穩(wěn)定狀態(tài),不再演化。此時(shí)政府既可以選擇采取經(jīng)濟(jì)激勵(lì)政策,也可以選擇不采取經(jīng)濟(jì)激勵(lì)政策。
2)當(dāng)yz(β-1)D2-y[(1-β)D2-W1]-zW2-C1+C2<0時(shí),dF1(0)/dx<0,dF1(1)/dx>0。依據(jù)微分方程穩(wěn)定性判別條件,當(dāng)F′(x)≤0時(shí)取得穩(wěn)定,則可得x=0為演化穩(wěn)定策略。表明政府逐漸從采取經(jīng)濟(jì)激勵(lì)政策的策略向不采取經(jīng)濟(jì)激勵(lì)政策的策略演化,即不采取經(jīng)濟(jì)激勵(lì)政策是此時(shí)政府的演化穩(wěn)定策略。
3)當(dāng)yz(β-1)D2-y[(1-β)D2-W1]-zW2-C1+C2>0時(shí),dF1(0)/dx>0,dF1(1)/dx<0。此時(shí)x=1為演化穩(wěn)定策略,表明政府逐漸從不采取經(jīng)濟(jì)激勵(lì)政策的策略向采取經(jīng)濟(jì)激勵(lì)政策的策略演化,即采取經(jīng)濟(jì)激勵(lì)政策是此時(shí)政府的演化穩(wěn)定策略。
1.3.2 企業(yè)的演化穩(wěn)定策略
1)當(dāng)x[W1-(1-β)D2]+xz(1-β)D2-C3+R2-C4=0,即x,z取式(17)中的數(shù)值時(shí),表明y取任意值,系統(tǒng)都處于穩(wěn)定狀態(tài),不再演化。此時(shí)企業(yè)既可以選擇投資建設(shè)秸稈壓塊服務(wù)站,也可以選擇不投資建設(shè)秸稈壓塊服務(wù)站。
2)當(dāng)x[W1-(1-β)D2]+xz(1-β)D2-C3+R2-C4<0時(shí),dF2(0)/dy<0,dF2(1)/dy>0。此時(shí)y=0為演化穩(wěn)定策略,表明企業(yè)逐漸從投資建設(shè)秸稈壓塊服務(wù)站的策略向不投資建設(shè)秸稈壓塊服務(wù)站的策略演化,即不投資建設(shè)秸稈成型燃料服務(wù)站是此時(shí)企業(yè)的演化穩(wěn)定策略。
3)當(dāng)x[W1-(1-β)D2]+xz(1-β)D2-C3+R2-C4>0時(shí),dF2(0)/dy>0,dF2(1)/dy<0。此時(shí)y=1為演化穩(wěn)定策略,表明企業(yè)逐漸從不投資建設(shè)秸稈壓塊服務(wù)站的策略向投資建設(shè)秸稈壓塊服務(wù)站的策略演化,即投資建設(shè)秸稈壓塊服務(wù)站是此時(shí)企業(yè)的演化穩(wěn)定策略。
1.3.3 農(nóng)民的演化穩(wěn)定策略
1)當(dāng)xW2-C5+C6=0,即x取式(17)中的數(shù)值時(shí),表明z取任意值,系統(tǒng)都處于穩(wěn)定狀態(tài),不再演化。此時(shí)農(nóng)民既可以選擇采用秸稈壓塊取暖,也可以選擇不采用秸稈壓塊取暖。
2)當(dāng)xW2-C5+C6<0時(shí),dF3(0)/dz<0,dF3(1)/dz>0。此時(shí)z=0為演化穩(wěn)定策略,表明農(nóng)民逐漸從采用秸稈壓塊取暖的策略向不采用秸稈壓塊取暖的策略演化,即不采用秸稈壓塊取暖是此時(shí)農(nóng)民的演化穩(wěn)定策略。
3)當(dāng)xW2-C5+C6>0時(shí),dF3(0)/dz>0,dF3(1)/dz<0。此時(shí)z=1為演化穩(wěn)定策略,表明農(nóng)民逐漸從不采用秸稈壓塊取暖的策略向采用秸稈壓塊取暖的策略演化,即采用秸稈壓塊取暖是此時(shí)農(nóng)民的演化穩(wěn)定策略。
根據(jù)Ritzberger和Weibull[16]提出的結(jié)論,只需對(duì)S1=(0,0,0),S2=(0,0,1),S3=(0,1,0),S4=(0,1,1),S5=(1,0,0),S6=(1,0,1),S7=(1,1,0),S8=(1,1,1)8個(gè)均衡點(diǎn)的穩(wěn)定性進(jìn)行分析。有學(xué)者提出應(yīng)用雅可比矩陣的局部穩(wěn)定性可得到均衡點(diǎn)的穩(wěn)定性[17]。根據(jù)博弈三方的復(fù)制動(dòng)態(tài)方程,可以得到如表3所示的雅可比矩陣。
表3 雅可比矩陣
由李亞普諾夫第一法則可知,演化穩(wěn)定策略(ESS)對(duì)應(yīng)的雅可比矩陣的特征根必須小于0[18]。各均衡點(diǎn)的特征根值如表4所示。
表4 各均衡點(diǎn)的特征根
主要關(guān)注服務(wù)站能夠順利建設(shè)和運(yùn)行下各參與主體的策略行為,即主要關(guān)注S8=(1,1,1)點(diǎn)的穩(wěn)定性。依據(jù)表4可知,S8=(1,1,1)點(diǎn)的特征根分別為C1-C2+W2-W1+2D2(β-1),C4+C3-R2-W1,-C6+C5-W2。S8=(1,1,1)點(diǎn)為穩(wěn)定點(diǎn)時(shí),其特征根需要同時(shí)滿足以下條件:
(19)
即當(dāng)政府、企業(yè)及農(nóng)民的付出成本和收益大小符合上述條件時(shí),政府采取經(jīng)濟(jì)激勵(lì)政策策略、企業(yè)采取建設(shè)策略、農(nóng)民采取采用秸稈壓塊取暖策略的概率均為1。
依據(jù)式(17)可得政府采取經(jīng)濟(jì)激勵(lì)政策的概率為x=(C5-C6)/W2。政府的策略選擇取決于農(nóng)民采用秸稈壓塊取暖需付出的燃料成本C5、農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本C6及政府給予農(nóng)民的補(bǔ)貼W2。與農(nóng)民采用秸稈壓塊取暖需付出的燃料成本C5成正比,與農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本C6和政府給予農(nóng)民的政府補(bǔ)貼W2成反比。這表明農(nóng)民采用秸稈壓塊取暖的成本越高,政府越需要加大經(jīng)濟(jì)激勵(lì)力度,以提高農(nóng)民的參與積極性。農(nóng)民不采用秸稈壓塊取暖的成本越高,政府的經(jīng)濟(jì)激勵(lì)力度可以相應(yīng)減弱。
農(nóng)民選擇采用秸稈壓塊取暖的概率為z={W2(C3+C4-R2)-(C5-C6)[W1-(1-β)D2)]}/[(1-β)D2(C5-C6)]。當(dāng)政府補(bǔ)貼W2=[(C5-C6)W1]/(C3+C4-R2)時(shí),農(nóng)民選擇采用秸稈壓塊取暖的概率為1。通過政府補(bǔ)貼W2的表達(dá)式可看出政府對(duì)農(nóng)民的補(bǔ)貼力度與農(nóng)民采用秸稈壓塊取暖需付出的燃料成本C5成正比,與農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本C6成反比。這表明當(dāng)采用秸稈壓塊取暖成本過高時(shí),為了提高農(nóng)民采用的積極性,政府需要加大對(duì)農(nóng)民的補(bǔ)貼力度;當(dāng)農(nóng)民不采用秸稈壓塊取暖,仍采用燃煤取暖的成本越小時(shí),農(nóng)民對(duì)燃煤取暖的認(rèn)可度越高,相應(yīng)也就需要政府加大對(duì)農(nóng)民采用秸稈壓塊取暖的補(bǔ)貼力度以促使農(nóng)民放棄燃煤取暖。因此,政府可以通過限制煤炭使用量、調(diào)整煤炭?jī)r(jià)格、對(duì)超額燃燒煤炭的農(nóng)民收取一定比例的懲罰費(fèi)用等措施來提高農(nóng)民燃煤成本,從而提高農(nóng)民采用秸稈壓塊取暖的積極性。
根據(jù)博弈局中人之間是否具有約束力的協(xié)議,可以將一個(gè)博弈過程分為合作博弈和非合作博弈。合作博弈主要研究在博弈局中人之間具有約束力的協(xié)議并使得整體利益最大時(shí),各局中人如何分配收益的問題。其中,合作是合作博弈的基礎(chǔ),團(tuán)體理性是其重點(diǎn)。根據(jù)前文政府、企業(yè)、農(nóng)民三者之間的博弈模型,假設(shè)三者達(dá)成合作協(xié)議,進(jìn)行合作博弈模型建立,得出三者的合理利益分配。
Shapley值法由Shapley于1953年提出,為解決多個(gè)局中人在合作過程中因利益分配而產(chǎn)生矛盾的問題,屬于合作博弈領(lǐng)域。該方法是按照成員對(duì)聯(lián)盟的邊際貢獻(xiàn)率將利益進(jìn)行分配,即成員i所分得的利益等于該成員為其所參與聯(lián)盟創(chuàng)造的邊際利益的平均值?;赟hapley值進(jìn)行聯(lián)盟成員的利益分配避免了分配上的平均主義,比任何一種僅按資源投入價(jià)值、資源配置效率及將二者相結(jié)合的分配方式都更具合理性和公平性,也體現(xiàn)了各盟員相互博弈的過程[18-19]。因此,采用Shapley值法對(duì)政府、企業(yè)、農(nóng)民博弈進(jìn)行利潤(rùn)分配。
3.1.1 符號(hào)定義
定義Shapley值法需用到的符號(hào)如下:
1)n、N:假設(shè)合作博弈中有n個(gè)博弈局中人,由N={1, 2, …,n}表示n個(gè)博弈局中人的集合。
2)S:不同博弈局中人組成不同的聯(lián)盟,記為S,S是N的子集,N為總體聯(lián)盟。
3)v(S):定義在N上的一實(shí)函數(shù)v為特征函數(shù),即聯(lián)盟S的收益記為v(S)。特征函數(shù)v(S)具有超可加性,若聯(lián)盟S1和S2沒有交集,則S1和S2構(gòu)成新聯(lián)盟的利益大于等于聯(lián)盟S1和S2的收益之和,即當(dāng)S1、S2符合S1∩S2=?條件時(shí),v(S1+S2)≥v(S1)+v(S2)。
4)xi(v):表示聯(lián)盟中成員i獲得的利益。
3.1.2 Shapley值法
Shapley證明了Shapley值分配策略滿足有效性公理、對(duì)稱性公理、冗員性公理和可加性公理時(shí),Shapley值是唯一的。4個(gè)公理的內(nèi)容如下:
2)對(duì)稱性。設(shè)π是N={1, 2, …,n}的一個(gè)排列,對(duì)于N的任意子集S={i1,i2,…,in},有πS={πi1,πi2,…,πim}。若在定義特征函數(shù)w(S)=v(πS),則對(duì)于每個(gè)成員i∈N都有xi(w)=xπi(v)。這表示合作獲利的分配不隨利益相關(guān)者的先后順序或者記號(hào)標(biāo)記變化。
3)冗員性。若對(duì)于包含成員i的所有子集S都有v(S{i})=v(S),則xi(v)=0。其中S{i}為集合S去掉元素i后的集合。這說明如果一個(gè)成員對(duì)于任何他參與的合作聯(lián)盟都沒有貢獻(xiàn),則他不應(yīng)當(dāng)從全體合作中獲利。
4)可加性。若在N上有兩個(gè)特征函數(shù)v1、v2,則有x(v1+v2)=x(v1)+x(v2)。這表明有多種合作時(shí),每種合作的利益分配方式與其他合作結(jié)果無關(guān),總分配是兩項(xiàng)的和。
成員i從總體利益v(N)所分配的利益由式(20)進(jìn)行計(jì)算,即
(20)
式中:Si為N中包含成員i的所有子集形成的集合;|S|為聯(lián)盟S所包含的成員數(shù),成員i在參與S聯(lián)盟時(shí)有(|S|-1)!種排序,而剩余(n-|S|)個(gè)成員的排序有(n-|S|)!種排序,[(|S|-1)!(n-|S|)!]/(n!)為成員i對(duì)于聯(lián)盟整體所應(yīng)分得利益的權(quán)重;Si}為從集合S中刪除元素i后的集合,[v(S)-v(Si})]為成員i參與不同聯(lián)盟S為自身參與聯(lián)盟創(chuàng)造的邊際貢獻(xiàn)。
3.2.1 構(gòu)建利潤(rùn)分配模型
秸稈壓塊服務(wù)站的合作博弈模型中有3個(gè)局中人:政府、企業(yè)和農(nóng)民,分別記為A、B、C,局中人的策略都是要么合作要么不合作?,F(xiàn)考慮的是合作博弈,3個(gè)局中人在博弈前都簽訂協(xié)議,合作形成一個(gè)聯(lián)盟,根據(jù)上述介紹的Shapley值法可以計(jì)算大聯(lián)盟中每個(gè)局中人的利益。下面首先計(jì)算各聯(lián)盟的利益情況。
1)當(dāng)3個(gè)局中人相互獨(dú)立,即Shapley值法中的S=1時(shí),各博弈局中人的利益情況如下:
政府(A)單獨(dú)采取經(jīng)濟(jì)激勵(lì)政策獲得收益為v(A)=(-C1-D1-D2)。
企業(yè)(B)單獨(dú)選擇建設(shè)服務(wù)站獲得收益為v(B)=(-C3+R2)。
農(nóng)民(C)單獨(dú)選擇采用秸稈壓塊取暖獲得收益為v(C)=(-C5)。
2)當(dāng)3個(gè)局中人兩兩合作,即Sharpley值法中的S=2時(shí),各聯(lián)盟的利益情況如下:
當(dāng)政府(A)與企業(yè)(B)合作時(shí),相當(dāng)于政府采取經(jīng)濟(jì)激勵(lì)政策,企業(yè)選擇建設(shè)服務(wù)站,農(nóng)民選擇不采用秸稈壓塊取暖,此時(shí)兩者形成聯(lián)盟的利益為v(A,B)=(θR1+R2-D2-C1-C3)。
當(dāng)政府(A)與農(nóng)民(C)合作時(shí),相當(dāng)于政府采取經(jīng)濟(jì)激勵(lì)政策,企業(yè)選擇不建設(shè)服務(wù)站,農(nóng)民選擇采用秸稈壓塊取暖,此時(shí)兩者形成聯(lián)盟的利益為v(A,C)=(-C1-D1-C5)。
當(dāng)企業(yè)(B)與農(nóng)民(C)合作時(shí),相當(dāng)于政府不采取經(jīng)濟(jì)激勵(lì)政策,企業(yè)選擇建設(shè)服務(wù)站,農(nóng)民選擇采用秸稈壓塊取暖,此時(shí)兩者形成聯(lián)盟的利益為v(B,C)=(-C3+R2-C5)。
3)當(dāng)3個(gè)局中人都參與合作形成大聯(lián)盟,即Sharpley值法中的S=3時(shí),聯(lián)盟的利益情況如下:
當(dāng)政府(A)、企業(yè)(B)與農(nóng)民(C)均合作時(shí),相當(dāng)于政府采取經(jīng)濟(jì)激勵(lì)政策,企業(yè)選擇建設(shè)服務(wù)站,農(nóng)民選擇采用秸稈壓塊取暖,此時(shí)三者形成聯(lián)盟的利益為v(A,B,C)=(R1+R2-C1-C3-C5)。
3.2.2 模型求解
根據(jù)式(20)以及各聯(lián)盟的利益情況,可以計(jì)算聯(lián)盟中各局中人的邊際貢獻(xiàn)。該合作博弈中共有3個(gè)局中人,聯(lián)盟S中的人數(shù)依次取1、2、3,分別對(duì)應(yīng)各局中人相互獨(dú)立、兩兩合作以及形成統(tǒng)一大聯(lián)盟時(shí)的利益情況。下面求解各局中人的邊際貢獻(xiàn)。
3.2.2.1 政府獲利情況
政府(A)可以組成的聯(lián)盟有4種情況:{A}、{A,B}、{A,C}、{A,B,C}。依據(jù)Shapley公式計(jì)算得到政府(A)各聯(lián)盟概率值、利益情況及總利潤(rùn)情況,如表5所示。
表5 政府(A)的Shapley值
依據(jù)表5可得:政府(A)單獨(dú)參與項(xiàng)目的概率為1/3,此時(shí)政府獲利-C1-D1-D2;政府分別與企業(yè)、農(nóng)民合作參與服務(wù)站建設(shè)項(xiàng)目的概率均為1/6,此時(shí)政府獲利分別為θR1-D2-C1、-C1-D1;政府、企業(yè)、農(nóng)民三方合作參與的概率為1/3,此時(shí)政府獲利為R1-C1。
綜上,政府總獲利xA(v)= 1/6[(θ+2)R1-6C1-3D1-3D2]。
3.2.2.2 企業(yè)獲利情況
企業(yè)(B)可以組成的聯(lián)盟有4種情況:{B}、{A,B},{B,C},{A,B,C}。依據(jù)Shapley公式計(jì)算得到企業(yè)(B)各聯(lián)盟概率值、利益情況及總利潤(rùn)情況,如表6所示。
表6 企業(yè)(B)的Shapley值
依據(jù)表6可得:企業(yè)(B)單獨(dú)參與項(xiàng)目的概率為1/3,此時(shí)企業(yè)獲利(-C3+R2);企業(yè)分別與政府、農(nóng)民合作參與服務(wù)站建設(shè)項(xiàng)目的概率均為1/6,此時(shí)企業(yè)獲利分別為θR1+R2+D1-C3、-C3+R2;企業(yè)、政府、農(nóng)民三方合作參與的概率為1/3,此時(shí)企業(yè)獲利為R1+R2+D1-C3。
綜上,企業(yè)總獲利xB(v)=1/6[6R2+(θ+2)R1+3D1-6C3]。
3.2.2.3 農(nóng)民獲利情況
農(nóng)民(C)可以組成的聯(lián)盟有4種情況:{C}、{A,C}、{B,C}、{A,B,C}。依據(jù)Shapley公式計(jì)算得到農(nóng)民(C)各聯(lián)盟概率值、利益情況及總利潤(rùn)情況,如表7所示。
表7 農(nóng)民(C)的Shapley值
依據(jù)表7可得:農(nóng)民(C)單獨(dú)參與項(xiàng)目的概率為1/3,此時(shí)農(nóng)民獲利-C5;農(nóng)民分別與政府、企業(yè)合作參與服務(wù)站建設(shè)項(xiàng)目的概率均為1/6,此時(shí)農(nóng)民獲利分別為D2-C5、-C5;農(nóng)民、企業(yè)、政府三方合作參與的概率為1/3,此時(shí)農(nóng)民獲利為(1-θ)R1+D2-C5。
綜上,農(nóng)民總獲利xC(v)= 1/6[2(1-θ)R1+3D2-6C5]。
3.2.2.4 利潤(rùn)分配比例
得到3個(gè)局中人的邊際貢獻(xiàn)后,將其單位化即可得到每個(gè)局中人在大聯(lián)盟中的利益分配比例。令xT(v)=xA(v)+xB(v)+xC(v),則政府(A)應(yīng)得的利益分配比例為xA(v)/xT(v),企業(yè)(B)應(yīng)得的利益分配比例為xB(v)/xT(v),農(nóng)民(C)應(yīng)得的利益分配比例為xC(v)/xT(v)。
根據(jù)各局中人的Shapley值,可以得到各局中人的利益分配比例如下。
政府的利潤(rùn)分配比例wA由式(21)進(jìn)行計(jì)算,即
(21)
企業(yè)的利潤(rùn)分配比例wB由式(22)進(jìn)行計(jì)算。
(22)
農(nóng)民的利潤(rùn)分配比例wC由式(23)進(jìn)行計(jì)算。
(23)
某企業(yè)計(jì)劃投資建設(shè)秸稈成型燃料服務(wù)站,計(jì)劃投入成本100萬(建廠費(fèi)50萬,設(shè)備費(fèi)30萬,人工20萬)。設(shè)定政府補(bǔ)貼期限為5年。由于該企業(yè)為工程建設(shè)企業(yè),依據(jù)非居民所得稅核定征收管理辦法中第五條規(guī)定,從事承包工程作業(yè)、設(shè)計(jì)和咨詢服務(wù)的成本利潤(rùn)率為15%~30%。假定該企業(yè)每年預(yù)計(jì)利潤(rùn)率為25%,即企業(yè)每年利潤(rùn)為25萬,5年總利潤(rùn)額為125萬元。企業(yè)不投資建設(shè)秸稈壓塊服務(wù)站,5年損失的社會(huì)聲譽(yù)總共為5萬元。農(nóng)民若采用燃煤取暖,每年需要煤2 t,每噸800元,即年成本為0.16萬元,5年總成本為0.8萬元;若采用秸稈壓塊取暖,每年需要4 t,每噸150元,即年成本為0.06萬元,5年總成本為0.3萬元。農(nóng)民不采用秸稈壓塊取暖每年所帶來的環(huán)境損失為6萬元,5年總成本為30萬元,其中政府承擔(dān)損失比例為2/3。政府年宣傳成本為7萬,5年總成本為35萬元。政府推行經(jīng)濟(jì)激勵(lì)政策付出的年成本為5萬,5年總成本為25萬元。政府獲得的年社會(huì)效益和環(huán)境效益為企業(yè)收益的1.4倍,即政府的5年總收益為175萬元,其中因企業(yè)的積極響應(yīng)政府獲取的效益比例為3/5。企業(yè)和農(nóng)民均不參與項(xiàng)目下政府的年損失為8萬元,5年的總成本為40萬元。企業(yè)和農(nóng)民均不參與時(shí)政府沒有補(bǔ)貼支出。
依據(jù)企業(yè)和農(nóng)民參與概率均為1時(shí)的政府補(bǔ)貼表達(dá)式,將上述數(shù)據(jù)代入計(jì)算得知,政府每年需補(bǔ)貼企業(yè)8.729 5萬元,每年需補(bǔ)貼農(nóng)民0.218 2萬元,5年內(nèi)政府補(bǔ)貼開支為44.738 5萬元。同時(shí),在秸稈壓塊服務(wù)站建設(shè)和運(yùn)行過程中,企業(yè)和農(nóng)民始終是利益相關(guān)者,雙方的策略選擇都受到政府政策的影響,同時(shí)農(nóng)民的參與程度也會(huì)影響企業(yè)投資建設(shè)秸稈壓塊服務(wù)站的積極性。對(duì)于政府而言,其對(duì)雙方的補(bǔ)貼比例應(yīng)該控制在一定范圍內(nèi),這樣既可以提高雙方參與積極性,又可以節(jié)省財(cái)務(wù)開支。若政府對(duì)雙方的補(bǔ)貼比例失衡,一方面這可能會(huì)降低某一方的參與積極性,另一方面也會(huì)增加政府財(cái)政支出。因此,確定一個(gè)相對(duì)合理的補(bǔ)貼比例對(duì)秸稈成型燃料服務(wù)站的建設(shè)和運(yùn)行起著至關(guān)重要的作用。確定政府對(duì)企業(yè)和農(nóng)民的補(bǔ)貼比例范圍在40∶1時(shí)雙方參與積極性最高。
依據(jù)式(21)~式(23),將上述數(shù)據(jù)代入計(jì)算得知,政府的利益分配占比為9.06%,企業(yè)的利益分配占比為69.17%,農(nóng)民的利益分配占比為21.77%。
通過構(gòu)建政府、企業(yè)以及農(nóng)民三方參與主體的演化博弈模型,分析了不同情況下三方參與主體的演化結(jié)果,并對(duì)三方參與主體的行為進(jìn)行了分析,得出以下主要結(jié)論:
1)政府采取經(jīng)濟(jì)激勵(lì)政策策略的概率受農(nóng)民采用秸稈壓塊取暖需付出的燃料成本以及不采用秸稈壓塊取暖需付出的燃料成本的影響。與農(nóng)民采用秸稈壓塊取暖需付出的燃料成本成正比關(guān)系,與農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本成反比關(guān)系。兩種采暖方式的成本差距越大,政府越傾向于采取經(jīng)濟(jì)激勵(lì)政策。
2)企業(yè)采取建設(shè)策略的概率取決于政府滿足企業(yè)自身補(bǔ)貼需求的程度。當(dāng)政府出臺(tái)相關(guān)財(cái)政補(bǔ)貼政策完全滿足企業(yè)補(bǔ)貼需求后,企業(yè)選擇參與建設(shè)秸稈壓塊服務(wù)站的概率為1。同時(shí)研究表明,政府對(duì)企業(yè)的補(bǔ)貼力度與企業(yè)建設(shè)秸稈壓塊服務(wù)站需付出的建設(shè)成本成正比關(guān)系,與企業(yè)建設(shè)所得的經(jīng)濟(jì)效益以及企業(yè)不建設(shè)損失的社會(huì)聲譽(yù)成反比關(guān)系。隨著企業(yè)建設(shè)成本降低或不建設(shè)損失成本升高,其對(duì)政府補(bǔ)貼力度的要求也會(huì)相應(yīng)降低。
3)農(nóng)民采取用秸稈壓塊取暖策略的概率取決于政府滿足農(nóng)民自身補(bǔ)貼需求的程度。當(dāng)政府出臺(tái)相關(guān)財(cái)政補(bǔ)貼政策完全滿足農(nóng)民補(bǔ)貼需求后,農(nóng)民選擇采用秸稈壓塊取暖的概率為1。同時(shí)研究表明,政府對(duì)農(nóng)民的補(bǔ)貼力度與農(nóng)民采用秸稈壓塊取暖需付出的燃料成本成正比關(guān)系,與農(nóng)民不采用秸稈壓塊取暖需付出的燃料成本成反比關(guān)系。隨著農(nóng)民采用秸稈壓塊取暖燃料成本的降低或農(nóng)民不采用秸稈壓塊取暖燃料成本的升高,其對(duì)政府補(bǔ)貼力度的要求也會(huì)相應(yīng)降低。
4)除政府補(bǔ)貼力度會(huì)影響企業(yè)和農(nóng)民參與程度外,政府對(duì)企業(yè)和農(nóng)民的補(bǔ)貼比例也影響著雙方策略選擇。一個(gè)合理的補(bǔ)貼比例在企業(yè)和農(nóng)民均選擇參與該項(xiàng)目中發(fā)揮著至關(guān)重要的作用。企業(yè)和農(nóng)民作為項(xiàng)目實(shí)施的利益相關(guān)者,雙方策略的選擇會(huì)相互影響。政府補(bǔ)貼比例不合理會(huì)導(dǎo)致某一參與主體積極性降低,從而影響另一參與主體的策略選擇。研究結(jié)果表明,當(dāng)政府對(duì)企業(yè)和農(nóng)民的補(bǔ)貼比例保持在40∶1時(shí)企業(yè)和農(nóng)民均傾向于參與該項(xiàng)目。
5)在秸稈壓塊服務(wù)站建設(shè)運(yùn)行項(xiàng)目中,政府從中分配的利潤(rùn)最少,其次是農(nóng)民,企業(yè)分配利潤(rùn)最多。政府、企業(yè)、農(nóng)民的利潤(rùn)分配占比分別為9.06%、69.17%、21.77%,該結(jié)論與實(shí)際相符。政府作為宏觀調(diào)控機(jī)構(gòu),本身的關(guān)注點(diǎn)不在盈利,其主要承擔(dān)的是社會(huì)責(zé)任。而企業(yè)恰恰相反,其作為營(yíng)利機(jī)構(gòu)關(guān)注的焦點(diǎn)為利潤(rùn)額。