金 浩, 劉德民, 安 明
(河北工業(yè)大學(xué)經(jīng)濟(jì)管理學(xué)院,天津 300401)
醫(yī)藥作為人類生存不可或缺的重要部分,其安全問題關(guān)乎民眾生命健康和國家安全,保障醫(yī)藥產(chǎn)品安全也是各級政府的基本職責(zé)之一.《“十三五”國家藥品安全規(guī)劃》明確指出,要堅持把藥品安全作為關(guān)系民生的政治任務(wù)來落實,確保人民群眾用藥安全.2020–06–02,習(xí)近平在召開專家學(xué)者座談會時著重強調(diào),人民安全是國家安全的基石.但近年來人民群眾用藥安全問題事件頻發(fā),引起社會廣泛關(guān)注.例如,2013年乙肝疫苗疑似致死事件、2014年浙江“毒膠囊”事件、2018年長生生物狂犬疫苗造假事件以及由2019 新冠肺炎引發(fā)的“毒口罩”等制售假貨事件均危害到民眾的生命安全[1],產(chǎn)生了十分惡劣的社會影響.藥品質(zhì)量安全問題反復(fù)出現(xiàn),充分暴露出我國藥品質(zhì)量安全監(jiān)管存在嚴(yán)重不足問題,亟需相關(guān)政府部門進(jìn)行“亡羊補牢”.
藥品供應(yīng)鏈相對其它產(chǎn)品供應(yīng)鏈較長,一般包括原輔料供應(yīng)商制造企業(yè)、批發(fā)企業(yè)、零售企業(yè)、醫(yī)療衛(wèi)生機構(gòu)和患者等參與主體,具有較強專業(yè)性和生產(chǎn)環(huán)節(jié)中的自然壟斷特性[2],節(jié)點企業(yè)間存在較嚴(yán)重的信息不對稱,極易出現(xiàn)“劣幣驅(qū)逐良幣”的市場失靈現(xiàn)象[3].此外,藥品供應(yīng)鏈節(jié)點企業(yè)具有獨特信息優(yōu)勢,極易誘發(fā)道德風(fēng)險–提供不合格藥品原輔料或藥品成品,引發(fā)藥品安全問題.在此情況下,就需要政府或第三方監(jiān)管部門采取有效手段,來降低此現(xiàn)象發(fā)生的概率[4].已有研究表明,政府或第三方監(jiān)管部門是否參與監(jiān)管及其監(jiān)管懲罰力度強弱都會對企業(yè)生產(chǎn)經(jīng)營行為產(chǎn)生影響.比如,高昂的懲罰能夠激勵藥品生產(chǎn)企業(yè)遵循FDA 規(guī)制[5],嚴(yán)格的審計能夠從監(jiān)管角度形成對懲罰的較好補充[6],并且加強監(jiān)管的成本控制可以擴大利潤空間形成對企業(yè)的監(jiān)管投入激勵[7].總體來說,設(shè)定合理有效的監(jiān)管懲罰機制有助于提升藥品質(zhì)量安全[8].然而,當(dāng)前我國藥品行業(yè)普遍存在“大產(chǎn)業(yè)–弱監(jiān)管”問題,產(chǎn)業(yè)發(fā)展能力和監(jiān)管能力嚴(yán)重不匹配,藥品安全的潛在風(fēng)險不斷上升[9],藥品制造企業(yè)生產(chǎn)低劣藥品的謀利行為對人民健康構(gòu)成嚴(yán)重威脅[10].并且現(xiàn)階段我國藥品安全監(jiān)管是由社會性監(jiān)管和政府監(jiān)管組成的混合制監(jiān)管模式,這種監(jiān)管模式可能會減弱政府監(jiān)管的有效性[11],因此適當(dāng)引入第三方權(quán)威認(rèn)證體系可提升政府監(jiān)管部門監(jiān)管效率[12].
從博弈論角度分析提高產(chǎn)品質(zhì)量安全的監(jiān)管策略,是學(xué)者們通常采用的分析手段.劉長玉等[13]構(gòu)建綠色產(chǎn)品質(zhì)量監(jiān)管的三方靜態(tài)博弈模型,分析討論了影響政府、企業(yè)和第三方行為策略的關(guān)鍵因素.趙熒梅等[14]基于靜態(tài)博弈模型考察了信息不對稱條件下的產(chǎn)品質(zhì)量監(jiān)管問題.朱立龍等[15]構(gòu)建多方靜態(tài)博弈模型分析了藥品監(jiān)管部門與藥品供應(yīng)鏈節(jié)點企業(yè)的博弈關(guān)系.靜態(tài)博弈模型假定博弈參與方是理性的,參與者同時做出決策.在藥品制造供應(yīng)鏈節(jié)點企業(yè)質(zhì)量安全投入過程中,“搭便車”行為時有發(fā)生,潛在降低了藥品質(zhì)量安全性[16].然而在實際應(yīng)用中藥品制造供應(yīng)鏈節(jié)點企業(yè)進(jìn)行決策是有先后順序的,并且是有限理性的,靜態(tài)博弈模型不能有效解決所存在問題.政府如何才能設(shè)計有效的監(jiān)管機制來促使藥品原輔料生產(chǎn)商和藥品生產(chǎn)商積極參與質(zhì)量安全投入,減少“搭便車”行為呢?
演化博弈考慮博弈參與人是有限理性,假定博弈參與方的理性會根據(jù)博弈局勢的變化而變化[17].演化博弈模型可有效刻畫博弈參與者的決策選擇,能夠有效分析監(jiān)管機制下的策略選擇[18],在產(chǎn)品質(zhì)量監(jiān)管和策略選擇相關(guān)研究中被廣泛應(yīng)用.李杰等[19]研究分析了商家售假行為與平臺監(jiān)管的演化博弈問題.曹裕等[20]考慮了新媒體環(huán)境下政府監(jiān)管與食品企業(yè)摻假行為的演化博弈問題.由以上研究可知,演化博弈是解決復(fù)雜博弈關(guān)系與決策選擇演化問題的有效方法[21],產(chǎn)品質(zhì)量安全監(jiān)管問題是多方博弈參與者隨機配對的反復(fù)博弈問題[22].因此演化博弈方法適用于藥品質(zhì)量安全監(jiān)管分析中,能夠更好解決政府如何設(shè)計有效監(jiān)管機制問題.宋燕等[23]通過構(gòu)建“藥品供應(yīng)商–藥監(jiān)部門”演化博弈模型,研究分析得出藥品安全監(jiān)管的穩(wěn)定狀態(tài)與監(jiān)管對象的安全投入成本息息相關(guān).朱立龍等[24]從“互聯(lián)網(wǎng)+醫(yī)療健康”背景出發(fā),構(gòu)建“政府部門、藥品生產(chǎn)商、醫(yī)藥電商和患者”四方演化博弈模型,從患者反饋角度分析了政府監(jiān)管機制對藥品質(zhì)量安全的影響.
綜上所述,藥品質(zhì)量安全監(jiān)管問題的相關(guān)文獻(xiàn)多以藥品銷售供應(yīng)鏈為研究出發(fā)點,考察原輔料質(zhì)量安全問題的研究相對不足.原輔料作為各類藥品制作時的原材料,藥品原輔料的質(zhì)量從供應(yīng)鏈源頭直接影響藥品安全性和合格率,藥品生產(chǎn)商通常從外部采購原輔料,再加上多數(shù)原輔料具有天然特性,原輔料供應(yīng)商所具有的壟斷性質(zhì)往往為追求利潤會提供低劣原輔料.因此,原輔料質(zhì)量的嚴(yán)格把控就成為藥品供應(yīng)鏈質(zhì)量安全保障中的基礎(chǔ)性環(huán)節(jié).基于此,通過構(gòu)建“原輔料供應(yīng)商–藥品生產(chǎn)商”演化博弈模型,并考慮博弈主體質(zhì)量安全投入產(chǎn)出函數(shù)對系統(tǒng)穩(wěn)定性的影響,最后對關(guān)鍵參數(shù)進(jìn)行仿真分析.本文考慮到藥品原輔料對于藥品制造的重要性及自身獨特性,通過構(gòu)建動態(tài)演化博弈模型分析藥品制造過程中的質(zhì)量安全問題.其次,引入柯布–道格拉斯生產(chǎn)函數(shù),將勞動要素和資本要素同時納入藥品原輔料質(zhì)量監(jiān)管投入的考慮范疇,具體分析了綜合技術(shù)水平、勞動產(chǎn)出彈性系數(shù)等參數(shù)系數(shù)變化如何影響博弈參與者的演化穩(wěn)定策略.最后,設(shè)計嚴(yán)格的懲罰機制,并對參數(shù)進(jìn)行合理賦值,運用MATLAB 模擬仿真分析系統(tǒng)穩(wěn)定性,根據(jù)仿真結(jié)果為政府部門進(jìn)一步構(gòu)建和完善藥品質(zhì)量監(jiān)管機制提供一定理論依據(jù)和決策參考.
本文僅考慮一個包含藥品原輔料供應(yīng)商和藥品生產(chǎn)商(分別簡稱為供應(yīng)商和生產(chǎn)商)的系統(tǒng),并假定雙方都是有限理性人,生產(chǎn)決策過程都是不完美的.在演化博弈的初始階段他們的決策都不是最優(yōu)決策,參與方通過不斷學(xué)習(xí)并了解對方的策略來調(diào)整自身決策,直到雙方達(dá)到均衡狀態(tài).供應(yīng)商A 和生產(chǎn)商B 的決策空間設(shè)定為(進(jìn)行質(zhì)量安全投入,不進(jìn)行質(zhì)量安全投入,簡記為QA,QB).供應(yīng)商的質(zhì)量安全投入包括招聘專業(yè)人員篩選材料和引進(jìn)先進(jìn)設(shè)備對合格材料溯源.生產(chǎn)商的質(zhì)量安全投入主要包括招聘專業(yè)人員檢測原輔料、引進(jìn)先進(jìn)質(zhì)量安全生產(chǎn)線、統(tǒng)一產(chǎn)品包裝并溯源.結(jié)合以上內(nèi)容,作出如下假設(shè):
1)供應(yīng)商以及生產(chǎn)商在進(jìn)行質(zhì)量安全投入時,一般包括勞動投入L和資本投入K,根據(jù)柯布–道格拉斯生產(chǎn)函數(shù)供應(yīng)商質(zhì)量安全投入成本收益為同理生產(chǎn)商質(zhì)量安全投入成本收益為
2)將供應(yīng)商質(zhì)量安全投入成本定義為CA=LA+KA,生產(chǎn)商的成本定義為CB=LB+KB.供應(yīng)商不進(jìn)行質(zhì)量安全投入收益定義為rA,生產(chǎn)商則定義為rB,其中rA>0,rB>0.
3)當(dāng)博弈中只有供應(yīng)商進(jìn)行質(zhì)量安全投入時,藥品原輔料質(zhì)量的提升會帶動整個藥品的質(zhì)量提升.此時供應(yīng)商的收益為?CA+rA,其中A0(A0≥1)表示給定的技術(shù)水平對成本收益的效應(yīng).而生產(chǎn)商因原輔料質(zhì)量的提升會獲得更多的收益TB,其中TB> rB.相似的,當(dāng)只有生產(chǎn)商進(jìn)行質(zhì)量安全投入時,生產(chǎn)商的收益為?CB+rB,而供應(yīng)商收益為TA,其中TA>rA.
4)在博弈中,當(dāng)參與雙方都進(jìn)行質(zhì)量安全投入時,那么患者會更加信任藥品的質(zhì)量,此時他們的收益分別為?CB+rB,其中A1>A0,B1>B0.
根據(jù)以上博弈假設(shè),建立雙方支付矩陣,如表1 所示.
表1 供應(yīng)商與生產(chǎn)商之間的支付矩陣Table 1 Payment matrix between the supplier and the manufacturer
基于以上假設(shè)及博弈雙方的支付矩陣(表1),可建立一個動力系統(tǒng).供應(yīng)商選擇策略QA和策略QB所獲得的收益分別為EA和.
供應(yīng)商平均預(yù)期收益為
同理,生產(chǎn)商選擇策略QA和策略QB所獲得的收益分別為EB和即
生產(chǎn)商平均預(yù)期收益為
依據(jù)演化博弈理論,可構(gòu)建出供應(yīng)商和生產(chǎn)商在質(zhì)量安全投入策略上的動態(tài)系統(tǒng)(I)
其中
依據(jù)微分方程理論, 動態(tài)演化博弈的均衡點(x,y)需同時滿足F1(x,y) = 0 與G1(x,y) = 0, 可得到A(0,1),B(1,1),C(1,0),O(0,0),D(xD,yD)是潛在的演化穩(wěn)定策略(ESS),其中
根據(jù)Friedman 方法,由微分方程系統(tǒng)描述的動態(tài)演化穩(wěn)定策略可從系統(tǒng)(I)的雅可比矩陣的局部穩(wěn)定分析得出.該雅可比矩陣J為
其中
將系統(tǒng)的5 個均衡點分別代入到雅克比矩陣J中,可計算出矩陣行列式的detJ值和跡trJ值.根據(jù)演化博弈理論,當(dāng)trJ >0 和detJ <0 同時成立時,該系統(tǒng)平衡點就是局部穩(wěn)定的,為系統(tǒng)的演化穩(wěn)定策略(ESS).各均衡點detJ值和跡trJ值如表2 所示,其中
表2 各均衡點det J 值和tr J 值Table 2 Determinant and trace of J of equilibrium points
基于以上條件,可判斷當(dāng)A0,A1,B0,B1有所變化時,系統(tǒng)(I)的演化穩(wěn)定策略(ESS)也隨之改變.
依據(jù)以上各均衡點雅克比矩陣J的行列式(detJ)值和跡(trJ)值的計算方法,可判斷出系統(tǒng)的局部穩(wěn)定性.各條件下均衡點的局部穩(wěn)定性如表3 和表4 所示.
表3 條件1、條件2 和條件3 均衡點局部穩(wěn)定性Table 3 Local stability of equilibrium point for conditions 1,2 and 3
表4 條件4 和條件5 均衡點局部穩(wěn)定性Table 4 Local stability of equilibrium point for conditions 4 and 5
基于以上條件假設(shè),可得出系統(tǒng)(I)中博弈參與雙方的演化穩(wěn)定相位圖(如圖1),進(jìn)一步對圖1 進(jìn)行如下分析:
1)當(dāng)供應(yīng)商和生產(chǎn)商的質(zhì)量安全投入生產(chǎn)函數(shù)的綜合技術(shù)水平A0,A1,B0,B1都較小時, 即滿足條件1 時.不管是單方還是雙方進(jìn)行質(zhì)量安全投入,由于其綜合技術(shù)水平較低,付出的成本不能獲得預(yù)期的收益,此時雙方選擇不進(jìn)行質(zhì)量安全投入策略,均會得到最大收益.如圖1(a),(x,y) = (0,0)是系統(tǒng)(I)的演化穩(wěn)定策略.
圖1 系統(tǒng)(I)的ESS 相位圖Fig.1 ESS of phase diagram System(I)
2)當(dāng)生產(chǎn)商的生產(chǎn)函數(shù)綜合技術(shù)水平B0,B1較高而供應(yīng)商的綜合技術(shù)水平A0,A1較低, 即滿足條件2 時.由于供應(yīng)商生產(chǎn)函數(shù)的產(chǎn)出收益小于所投成本,而生產(chǎn)商生產(chǎn)函數(shù)的產(chǎn)出收益大于所投成本且有正的外部性.因此,供應(yīng)商為追求自身利益最大化不會選擇質(zhì)量安全投入策略,相反生產(chǎn)商則會選擇質(zhì)量安全投入策略.如圖1(b),(x,y)=(0,1)是系統(tǒng)(I)的演化穩(wěn)定策略.
3)當(dāng)供應(yīng)商質(zhì)量安全投入生產(chǎn)函數(shù)的綜合技術(shù)水平A0,A1較高而供應(yīng)商的綜合技術(shù)水平B0,B1較低,即滿足條件3 時.通過分析可知,生產(chǎn)商生產(chǎn)函數(shù)產(chǎn)出收益小于所投成本,而供應(yīng)商生產(chǎn)函數(shù)產(chǎn)出收益大于所投成本并有正的外部性.因此,生產(chǎn)商為追求自身利益最大化不會選擇質(zhì)量安全投入策略,相反供應(yīng)商則會選擇質(zhì)量安全投入策略.如圖1(c),(x,y)=(1,0)是系統(tǒng)(I)的演化穩(wěn)定策略.
4) 在供應(yīng)商和生產(chǎn)商兩者的綜合技術(shù)水平滿足條件4 的情景下, 兩者的生產(chǎn)函數(shù)產(chǎn)出收益都大于所投成本并都具有正的外部性, 那么兩者在進(jìn)行決策時, 系統(tǒng)可能會出現(xiàn)兩個穩(wěn)定策略, 如圖1(d),(x,y)=(1,0)和(x,y)=(0,1).由圖可知系統(tǒng)的演化穩(wěn)定策略與系統(tǒng)的初始狀態(tài)有關(guān),當(dāng)四邊形BDOC 的面積大于BDOA 的面積時,說明供應(yīng)商的正外部性收益要大于生產(chǎn)商的正外部性收益,系統(tǒng)的演化穩(wěn)定策略更傾向于(x,y) = (0,1).而當(dāng)四邊形BDOA 的面積小于BDOC 的面積時,供應(yīng)商的正外部性收益要小于生產(chǎn)商的正外部性收益,則系統(tǒng)的演化穩(wěn)定策略更傾向于(x,y)=(1,0).
5)在供應(yīng)商和生產(chǎn)商兩者的綜合技術(shù)水平滿足條件5 的情景下,參與雙方的生產(chǎn)函數(shù)產(chǎn)出收益足夠大于雙方產(chǎn)生的正外部性收益,雙方同時進(jìn)行質(zhì)量安全投入會給雙方帶來最大的收益,系統(tǒng)會最終穩(wěn)定在點(x,y)=(1,1),如圖1(e)所示.
在第4 種情景下, 供應(yīng)商和生產(chǎn)商的生產(chǎn)函數(shù)綜合技術(shù)水平分別滿足時, 由圖可判斷BDOA 的面積SA和BDOC 的面積SB的大小決定著系統(tǒng)的演化穩(wěn)定策略是(QA,QB)還是(QB,QA); 當(dāng)SA< SB時,系統(tǒng)的穩(wěn)定策略為(QA,QB); 當(dāng)SA> SB時, 系統(tǒng)的穩(wěn)定策略為(QB,QA); 當(dāng)SA=SB時, 系統(tǒng)的穩(wěn)定策略為(QA,QB)和(QB,QA)的概率相等.
下面分析在不同參數(shù)變化情境下,SA,SB的大小如何影響系統(tǒng)穩(wěn)定策略.通過計算,SA表示為
命題1當(dāng)供應(yīng)商的生產(chǎn)函數(shù)綜合技術(shù)水平越小,生產(chǎn)商的生產(chǎn)函數(shù)綜合技術(shù)水平越大時,系統(tǒng)穩(wěn)定策略為(QB,QA)概率就會越大.
證明在其它參數(shù)不變情況下,將SA分別對A0,A1,B0,B1求偏導(dǎo),可得
根據(jù)以上條件的成立, 可知在其它參數(shù)不變的條件下, 供應(yīng)商的質(zhì)量安全投入生產(chǎn)函數(shù)綜合技術(shù)水平A0,A1越低, 而生廠商的質(zhì)量安全投入生產(chǎn)函數(shù)綜合技術(shù)水平B0,B1越高, 則系統(tǒng)演化穩(wěn)定在(x,y)=(0,1)的概率越大. 證畢.
命題2當(dāng)供應(yīng)商的收益rA較小,而生產(chǎn)商的收益rB較大時,則系統(tǒng)穩(wěn)定策略為(QA,QB)的概率就會可越大.
證明在它參數(shù)不變情況下,將SA分別對rA,rB求偏導(dǎo)數(shù).由可得
根據(jù)以上條件的成立,可知在其它參數(shù)不變的條件下,SA是rA的減函數(shù),是rB的增函數(shù),那么在rA較小且rB較大同時成立時,系統(tǒng)演化穩(wěn)定在(x,y)=(1,0)的概率越大. 證畢.
命題3當(dāng)生產(chǎn)商的正外部性越大供應(yīng)商獲得的收益TA越大,供應(yīng)商的正外部性越小生產(chǎn)商獲得收益TB越小時,系統(tǒng)穩(wěn)定策略為(QB,QA)的概率就會越大.
證明在其它參數(shù)不變情況下,將SA分別對TA,TB求偏導(dǎo),由A0LαAK1?αA> CA,B0LβBK1?βB> CB可得
由此可知,在其它參數(shù)不變的條件下,SA是TA的增函數(shù),是TB的減函數(shù),當(dāng)供應(yīng)商獲得的外部性收益TA越小,生產(chǎn)商獲得的外部性收益TB越大時,系統(tǒng)將演化穩(wěn)定在(x,y)=(0,1)的概率就越大. 證畢.
命題4本文假設(shè)C=L+K,其中L表示勞動投入,K表示資本投入.當(dāng)供應(yīng)商的勞動投入成本LA越小,生產(chǎn)商的勞動投入成本LB越大時,系統(tǒng)穩(wěn)定策略為(QA,QB)的概率就會越大.
證明在其它參數(shù)不變情況下,將SA分別對LA,LB求偏導(dǎo)數(shù),由
由此可知,在其它參數(shù)不變的條件下,SA是LA的減函數(shù),是LB的增函數(shù).供應(yīng)商的勞動投入成本越小,相反生產(chǎn)商的勞動投入成本越大,則系統(tǒng)穩(wěn)定策略為(x,y)=(1,0)的概率就越大. 證畢.
命題5當(dāng)供應(yīng)商的中資本投入成本KA越小, 生產(chǎn)商資本投入成本KB越大時, 系統(tǒng)穩(wěn)定策略為(QA,QB)的概率就會越大.
證明在其它參數(shù)不變情況下,將SA分別對KA,KB求偏導(dǎo)數(shù),由
根據(jù)以上條件可知,在其它參數(shù)不變的條件下,SA是KA以及KB的增函數(shù),進(jìn)一步分析可知因此,當(dāng)生產(chǎn)商質(zhì)量安全資本投入越大,供應(yīng)商質(zhì)量安全資本投入越小,此時供應(yīng)商會比生產(chǎn)商帶來更多的外部性收益,系統(tǒng)穩(wěn)定策略在(x,y)=(1,0)的概率越大. 證畢.
命題6α代表供應(yīng)商的勞動產(chǎn)出彈性系數(shù),β代表生產(chǎn)商的勞動產(chǎn)出彈性系數(shù).當(dāng)供應(yīng)商的勞動產(chǎn)出彈性系數(shù)越大,生產(chǎn)商的勞動產(chǎn)出彈性系數(shù)越小時,則系統(tǒng)穩(wěn)定策略為(QA,QB)的概率就會越大.
證明在其它參數(shù)不變情況下,將SA分別對α,β求偏導(dǎo),由可得
因此,在其它參數(shù)不變的情況下,SA是α的增函數(shù),β的減函數(shù).供應(yīng)商勞動產(chǎn)出彈性系數(shù)越大,生產(chǎn)商勞動產(chǎn)出彈性系數(shù)越小,則系統(tǒng)穩(wěn)定策略為(x,y) = (1,0)的概率就越大,即供應(yīng)商生產(chǎn)函數(shù)的產(chǎn)出所帶來的外部性效益大于生產(chǎn)商. 證畢.
綜上分析可知,如果博弈主體進(jìn)行質(zhì)量安全投入生產(chǎn)函數(shù)的綜合技術(shù)水平越低,其產(chǎn)出效益低于所投成本,或者還沒有不投入任何成本獲得對方的外部性收益大,在這種情境下參與單方不會選擇質(zhì)量安全投入策略.在現(xiàn)實社會生活中,供應(yīng)商和生產(chǎn)商的專業(yè)知識以及追求目標(biāo)不一致,這造成了他們之間的信息不對稱,那么市場出現(xiàn)機會主義行為和道德風(fēng)險的概率會大幅增加.在這種現(xiàn)實背景下,只有借助外部力量,如政府或第三方監(jiān)管,制定相關(guān)的懲罰機制來約束參與方履行契約,方可降低機會主義行為和道德風(fēng)險出現(xiàn)的概率.假設(shè)在政府監(jiān)管下,供應(yīng)商和生產(chǎn)商雙方各簽訂一份懲罰約束契約: 如果只有單方履行所簽訂契約,那么未履行契約的那一方將會給履行契約的那一方一筆罰金,若雙方都履行或者都不履行契約,雙方則不用進(jìn)行轉(zhuǎn)移罰金.基于此給出在懲罰約束下演化博弈參與雙方的支付矩陣,如表5 所示.
表5 懲罰約束下供應(yīng)商與生產(chǎn)商支付矩陣Table 5 Payment matrix of suppliers and producers under penalty constraints
根據(jù)微分方程理論,構(gòu)建出懲罰約束下供應(yīng)商和生產(chǎn)商在質(zhì)量安全投入策略上的動態(tài)系統(tǒng)(II)
其中
命題7系統(tǒng)(II)的平衡點為(x,y)=(0,0),(x,y)=(0,1),(x,y)=(1,0),(x,y)=(1,1).當(dāng)且僅當(dāng)以下不等式成立時,點(為系統(tǒng)的平衡點,即
由此可得
證畢.
命題8平衡點(x,y)=(1,1)是系統(tǒng)(II)唯一的ESS 的充要條件為
證明在系統(tǒng)(II)的演化博弈過程中,參與雙方的演化穩(wěn)定策略的條件為
即
由此可得
為更加真實反映政府或第三方監(jiān)管制訂的懲罰約束契約對演化博弈最終穩(wěn)定策略的影響,本文在對系統(tǒng)模型中的參數(shù)進(jìn)行賦值的基礎(chǔ)上, 對演化博弈模型進(jìn)行了仿真分析.在滿足條件且CA=LA+KA,CA< rA< TA,CB=LB+KB,CB< rB< TB, 0< α <1, 0< β <1 的情況下, 假設(shè)參數(shù)初始值如下:LA= 1.25,KA= 1.75,rA= 2.1,TA= 2.3,A0= 1.95,A1= 2.0,α= 0.3,LB= 1.2,KB= 1.8,rB= 2.2,TB= 2.4,B0= 1.9,B1= 1.95,β= 0.25.根據(jù)柯布–道格拉斯生產(chǎn)函數(shù)的特點,為說明參與雙方勞動力投入和資本投入的不同對演化穩(wěn)定結(jié)果的影響,采取不同的賦值方式來討論不同條件背景下的演化穩(wěn)定策略.參數(shù)變化如下: 1)在保持其它參數(shù)初始值不變的情況下,分別改變α,β為0.35 和0.2;2)在保持其它參數(shù)初始值不變的情況下, 重新賦值LA,KA,LB,KB, 其中LA= 1.75,KA= 1.25,LB= 1.1,KB= 1.9.根據(jù)以上三種參數(shù)設(shè)定情況, 分別得到三個初始策略選擇比例, 分別為(xD,yD) = (0.8,0.7),(xD,yD) = (0.6,0.3),(xD,yD) = (0:6; 0:3).
不同懲罰制度下供應(yīng)商與生產(chǎn)商演化穩(wěn)定策略仿真結(jié)果如圖2 所示.在沒有政府或第三方懲罰監(jiān)管下,三種參數(shù)設(shè)定情況下的博弈如圖2(a)所示,結(jié)果分析如下: 1)在不改變?nèi)魏螀?shù)情景下,參與雙方的初次博弈策略為(xD,yD) = (0.8,0.7),隨著時間的變化供應(yīng)商的策略選擇比例逐步下降,生產(chǎn)商的策略選擇比例逐步上升,雙方經(jīng)過多次的博弈,博弈結(jié)果為穩(wěn)定在(xD,yD) = (0,1),即博弈的長期結(jié)果為供應(yīng)商會出現(xiàn)違約行為,選擇不進(jìn)行質(zhì)量安全投入策略;2)當(dāng)其它參數(shù)不變,在增加α值并降低β值的情境下,參與雙方的初次博弈策略為(xD,yD)=(0.6,0.3).與第一種情境下博弈結(jié)果相比,隨著時間的變化供應(yīng)商的策略選擇會以更多的比例下降,生產(chǎn)商的策略選擇會以更多的比例上升,最終博弈結(jié)果也穩(wěn)定在(xD,yD) = (0,1),即博弈的長期結(jié)果為供應(yīng)商會出現(xiàn)違約行為,選擇不進(jìn)行質(zhì)量安全投入策略;3)當(dāng)其它參數(shù)不變,在增加LA并降低LB的情境下,參與雙方的初次博弈策略為(xD,yD) = (0.6,0.3).與第一種情境下博弈結(jié)果相比,隨著時間的變化生產(chǎn)商的策略選擇比例逐步下降,供應(yīng)商的策略選擇比例逐步上升,雙方經(jīng)過多次的博弈,博弈結(jié)果為穩(wěn)定在(xD,yD)=(0,1),博弈的長期結(jié)果為生產(chǎn)商會出現(xiàn)違約行為,選擇不進(jìn)行質(zhì)量安全投入策略.因此,在沒有政府或第三方懲罰監(jiān)管下,增加α值降低β值會博弈會更快到達(dá)穩(wěn)定策略,但是不會改變長期的博弈穩(wěn)定策略,即勞動投入彈性系數(shù)的變化會影響博弈達(dá)到穩(wěn)定策略的時間.此外,若增加LA并降低LB會改變博弈穩(wěn)定策略,即要素投入的變化會影響博弈雙方的策略選擇.
圖2 不同懲罰制度下供應(yīng)商與生產(chǎn)商演化穩(wěn)定策略仿真Fig.2 Simulation of evolutionary stability strategies of suppliers and manufacturers under different penalty systems
接下來考察在懲罰力度不同的情況下,系統(tǒng)穩(wěn)定性如何發(fā)生變化.在其它參數(shù)不變的情況下,當(dāng)F在命題7 約束條件下時,取F=0.02,圖2(b)展示了在此背景下系統(tǒng)隨時間變化的演化結(jié)果.可以看出,當(dāng)懲罰力度較小時,博弈演化穩(wěn)定結(jié)果沒有改變,并延長了系統(tǒng)達(dá)到演化穩(wěn)定狀態(tài)的時間,懲罰力度較小的監(jiān)管短期會影響博弈雙方的選擇態(tài)度,但長期內(nèi)不會影響博弈雙方的策略選擇,不能達(dá)到預(yù)期的監(jiān)管目的.當(dāng)懲罰力度時,在其他參數(shù)不變情況下,分別取F=0.3 和F=0.5,此時系統(tǒng)演化結(jié)果如圖2(c)、圖2(d)所示,可以清晰看出,當(dāng)懲罰力度較大時,供應(yīng)商和生產(chǎn)商都會選擇進(jìn)行質(zhì)量安全投入策略,并隨著懲罰力度的增大,系統(tǒng)將會以更快的速度達(dá)到穩(wěn)定狀態(tài).進(jìn)一步的,圖3 將供應(yīng)商和生產(chǎn)商放在同一平面內(nèi)考察不同懲罰力度下系統(tǒng)演化結(jié)果,以此來分析整個系統(tǒng)的演化路徑.可以看出,當(dāng)懲罰力度時,系統(tǒng)演化穩(wěn)定策略趨向于(1,1),為系統(tǒng)的唯一演化穩(wěn)定策略.綜上可知,采取強有力的懲罰力度會改變系統(tǒng)演化結(jié)果,能夠在較短時間內(nèi)促使系統(tǒng)達(dá)到演化穩(wěn)定狀態(tài),促使博弈雙方選擇質(zhì)量安全投入策略,有效從藥品生產(chǎn)供應(yīng)鏈源頭保障藥品質(zhì)量,切實保障人民群眾健康安全.
圖3 不同懲罰制度下系統(tǒng)(II)的演化穩(wěn)定策略仿真Fig.3 Evolutionary stability strategy simulation under different penalty systems of system(II)
本文基于現(xiàn)實中個體理性的研究假設(shè),引入柯布–道格拉斯生產(chǎn)函數(shù),構(gòu)建“藥品原輔料供應(yīng)商–藥品生產(chǎn)商”的演化博弈模型.通過求解相應(yīng)的復(fù)制動態(tài)方程及繪制演化示意圖,系統(tǒng)分析了博弈參與者策略選擇的動態(tài)演化過程.結(jié)合數(shù)值仿真分析,詳細(xì)考察在不同懲罰機制下系統(tǒng)的差異性演化穩(wěn)定策略.此外,探討了綜合技術(shù)水平和要素投入效率等重要參數(shù)的變化對博弈參與雙方策略選擇的影響.最后,為藥品質(zhì)量安全監(jiān)管提供有效的解決思路.
通過演化博弈分析,發(fā)現(xiàn)較高綜合技術(shù)水平有利于博弈參與方進(jìn)行質(zhì)量安全投入,較高勞動投入彈性系數(shù)及懲罰力度均可縮短系統(tǒng)達(dá)到穩(wěn)定策略的時間.在以不同主要要素投入為主的藥品生產(chǎn)供應(yīng)鏈中,主要要素投入較高的參與方進(jìn)行質(zhì)量安全投入的概率更高.因此,為保障藥品質(zhì)量安全,政府應(yīng)當(dāng)建立健全相關(guān)政策體系,積極引導(dǎo)藥品制造供應(yīng)鏈節(jié)點企業(yè)采取正確的行為決策.一方面,加強對藥品生產(chǎn)供應(yīng)鏈節(jié)點企業(yè)中綜合技術(shù)水平較低企業(yè)的監(jiān)管,并積極引導(dǎo)其提升自身技術(shù)水平.另一方面,對于以勞動要素投入為主的藥品生產(chǎn)供應(yīng)鏈,應(yīng)加大對勞動要素投入較少企業(yè)的懲罰力度,對于以資本要素投入為主的藥品生產(chǎn)供應(yīng)鏈,應(yīng)加大對資本要素投入較少企業(yè)的懲罰力度,降低企業(yè)“搭便車”行為發(fā)生的概率.此外,政府或第三方監(jiān)管部門應(yīng)制定有效的懲罰力度契約,對違約企業(yè)實施嚴(yán)格的懲罰機制,最大限度降低違約行為的出現(xiàn).