秦永恒,萬迪日方
企業(yè)違規(guī)行為是商業(yè)企業(yè)采取違法手段謀求不正當(dāng)利益的行為。由于高額非法收益的存在,企業(yè)違規(guī)行為是一種長期和普遍的存在,這不僅增加了監(jiān)管部門的工作難度,更損害了廣大消費(fèi)群體的根本利益。近期,一些企業(yè)的違規(guī)行為更是屢屢見諸媒體報(bào)端,綜而觀之,這類行為多呈現(xiàn)出兩種特點(diǎn),一種是違規(guī)的區(qū)域化,也就是同一個區(qū)域內(nèi)有多家企業(yè)采取同樣的違規(guī)手段牟利,如河北昌黎多家企業(yè)生產(chǎn)假葡萄酒低價(jià)銷售,北京、甘肅等地的許多銷售商大量采用填充水泥的包裝箱用于蘋果整箱銷售等;另一種就是違規(guī)的反復(fù)化,企業(yè)的違規(guī)屢查屢犯,屢禁不止,如安徽血鉛事件中的當(dāng)事企業(yè)就曾多次整改,但仍然對環(huán)境造成了嚴(yán)重污染,并危及了當(dāng)?shù)鼐用竦纳踩?/p>
這些事件的發(fā)生,除了企業(yè)方面的逐利因素,相關(guān)的監(jiān)管檢查的不力或缺失也是其發(fā)生的一個重要原因,這可以看作是企業(yè)利益和監(jiān)管檢查兩個因素交互之下的結(jié)果。對兩者關(guān)系的相關(guān)研究中,葛和平與曹家和就曾從靜態(tài)博弈的角度對外資并購中國上市公司過程中的違規(guī)與監(jiān)管進(jìn)行了分析[1],吳桐與徐榮貞則從演化博弈的角度對金融創(chuàng)新與外部監(jiān)管進(jìn)行了探討[2]。但在分析原因并提出相應(yīng)的政策改進(jìn)建議之外,更為重要的是在違規(guī)發(fā)生后,應(yīng)該如何采取有力措施在短時(shí)間內(nèi)予以應(yīng)對并防止他們的再次發(fā)生,這是在已有研究中所缺少的。
針對以上問題,本文首先從動態(tài)學(xué)習(xí)的角度分析了企業(yè)違規(guī)行為在監(jiān)管存在的條件下擴(kuò)散或反復(fù)的原因和過程,因?yàn)榕c傳統(tǒng)的非合作博弈理論認(rèn)為均衡是在博弈的規(guī)則、參與人的理性以及參與人的支付都是共同知識的條件下由參與人的分析和自省所得出的結(jié)果不同,演化博弈理論認(rèn)為均衡是并非完全理性的參與人隨著時(shí)間的推移尋求最優(yōu)化這一過程的長期結(jié)果[3],這使得該理論的應(yīng)用更加切合實(shí)際,而將參與者的學(xué)習(xí)過程引入演化博弈則能使之更好的應(yīng)用于社會經(jīng)濟(jì)演化的分析之中[4]。進(jìn)一步地,本文從微分動力系統(tǒng)的最優(yōu)控制角度分析了違規(guī)行為發(fā)生之后的應(yīng)對思路,并提出了對監(jiān)管部門的措施建議。
違規(guī)企業(yè)與行政監(jiān)管部門在目標(biāo)上是存在根本對立的。借鑒Mostagir提出的委托-代理博弈模型[5],本文將以上雙方的博弈模型化,如表1所示。其中行所在博弈方為企業(yè),列所在博弈方為監(jiān)管部門。企業(yè)方可以為同一區(qū)域內(nèi)的全部同類企業(yè),x(t)為其中采取違規(guī)策略的企業(yè)比例,其值是時(shí)間的函數(shù),表示其隨時(shí)間的動態(tài)變化;或者企業(yè)方也可以為某個單一主體,x(t)則表示其采取違規(guī)策略的概率。行政監(jiān)管部門為單一主體,其采取監(jiān)管策略的概率為u(t),如果企業(yè)方為多個企業(yè)時(shí),u(t)則表示其中被加以監(jiān)管檢查的企業(yè)比例。
當(dāng)企業(yè)依法進(jìn)行生產(chǎn)銷售時(shí),行政部門的監(jiān)管與否不會對其收益造成顯著影響,此時(shí)企業(yè)的收益為V1,當(dāng)企業(yè)違規(guī)操作時(shí),遭遇監(jiān)管檢查將使其違法獲得收益,而監(jiān)管部門的失察或放任則會導(dǎo)致其獲得更高的違法收益V2,由企業(yè)方收益的實(shí)際含義可知0<V1<V2。而監(jiān)管部門方考慮的顯然并非收益,而是監(jiān)管成本或公眾利益的損失:當(dāng)對誠信的企業(yè)進(jìn)行監(jiān)管時(shí),全面的檢查也不會獲得實(shí)質(zhì)性發(fā)現(xiàn),此時(shí)付出的監(jiān)管成本為C2,而對違規(guī)企業(yè)的監(jiān)管要么可以輕易發(fā)現(xiàn),要么雖然發(fā)現(xiàn)難度較高,但發(fā)現(xiàn)后所能避免或挽回的經(jīng)濟(jì)損失必然更高,因此此時(shí)付出的總體監(jiān)管成本較低,為C1,如果行政部門采取放任態(tài)度,對于誠信的企業(yè),他們付出的監(jiān)管成本為0,而對違規(guī)企業(yè)的放任將導(dǎo)致巨大的社會危害或經(jīng)濟(jì)損失,因此此時(shí)的不作為是以更高的成本C3為代價(jià)的。因此,監(jiān)管部門的成本有如下關(guān)系:0<C1<C2<C3。 在 這 種 設(shè) 定下,博弈不存在純策略納什均衡,并且違規(guī)的最高收益對應(yīng)于監(jiān)管部門的最高成本,暗示出雙方目標(biāo)的根本對立。
表1 企業(yè)與行政監(jiān)管博弈的得益矩陣
設(shè)初始狀態(tài)下存在較低比例的違規(guī)企業(yè),因而有0<x(0)<1,同時(shí),監(jiān)管部門一般也采取的是抽查的監(jiān)管方式,因而有0<u(0)<1。企業(yè)策略的選擇一部分是自主完成,而更大部分則是通過對其他企業(yè)策略的動態(tài)學(xué)習(xí)。企業(yè)在每個階段隨機(jī)兩兩匹配,學(xué)習(xí)過程遵循強(qiáng)化學(xué)習(xí)模式[6]。當(dāng)一方看到另一方由于采取不同于己方策略得到了更高的收益,則會以一定比例模仿另一方,在后續(xù)階段也采取對方的策略,而如果看到對方的策略相同或者與己不同但得到了低于己方當(dāng)前策略的收益,則不會調(diào)整。因此,根據(jù)學(xué)習(xí)過程并結(jié)合得益矩陣,可以知道企業(yè)策略的轉(zhuǎn)變只會發(fā)生在兩種情況下:或是受到監(jiān)管檢查的情況下違規(guī)企業(yè)因觀察到誠信企業(yè)的做法可以獲利而向誠信策略轉(zhuǎn)變,或是不存在監(jiān)管檢查的情況下誠信企業(yè)因觀察到違規(guī)企業(yè)獲利更高而冒險(xiǎn)向違規(guī)策略轉(zhuǎn)變。那么,處于監(jiān)管條件下的違規(guī)企業(yè)比例為x(t)u(t),他們遇到違規(guī)企業(yè)的概率為1-x(t),因此第一種情況發(fā)生的比例為x(t)u(t)(1-x(t)),同理,第二種情況發(fā)生的比例為(1-x(t))(1-u(t))x(t)。另外,考慮到并非所有的企業(yè)都會轉(zhuǎn)變或者立即進(jìn)行轉(zhuǎn)變,因此設(shè)第一種情況下企業(yè)改變策略的概率為p,第二種情況下企業(yè)改變策略的概率為q,則兩種情況下策略轉(zhuǎn)變的比例分別為 px(t)u(t)(1-x(t))和q(1-x(t))(1-u(t))x(t)。于是,在連續(xù)時(shí)間情形下,系統(tǒng)動態(tài)可以表示為:
省略時(shí)間標(biāo)記t,并對上式化簡,得到
以上的分析同樣適用于單一企業(yè)違規(guī)行為的情形,其差別僅僅在于由多個企業(yè)間的橫向?qū)W習(xí)變?yōu)榱俗陨碇g的縱向?qū)W習(xí)。初始階段企業(yè)可能存在較低概率的違規(guī)行為,當(dāng)遭遇監(jiān)管檢查時(shí),會向自身之前的合法經(jīng)營方式轉(zhuǎn)變,而未遇到檢查時(shí),則會以一定比例向追求更多非法收益的方式轉(zhuǎn)變。另外,本文中所提及的監(jiān)管檢查必須是實(shí)質(zhì)性的檢查,而非流于形式的表面工作。
圖1 監(jiān)管檢查力度較低時(shí)x(t)的變化曲線
圖2 監(jiān)管檢查力度內(nèi)生動態(tài)變化時(shí)的系統(tǒng)相圖
當(dāng)相應(yīng)的監(jiān)管檢查缺失或力度不足時(shí),違規(guī)行為面臨的風(fēng)險(xiǎn)較低而獲利較高,因此會鼓勵更多企業(yè)通過效仿參與其中,并進(jìn)而導(dǎo)致違規(guī)企業(yè)在某地域內(nèi)的比例升高,形成違規(guī)行為的區(qū)域化。從(2)式來看,考慮到0<x(t)<1,因此當(dāng) q-u(t)(p+q)>0,也即 u(t)<時(shí),x·(t)>0,違規(guī)企業(yè)的比例將逐漸增加。取p=0.9和q=0.1,這表示違規(guī)企業(yè)遭遇檢查時(shí)多數(shù)會立即糾正錯誤,轉(zhuǎn)為正規(guī)生產(chǎn)經(jīng)營,而企業(yè)對采取違規(guī)行為相對謹(jǐn)慎,轉(zhuǎn)變比例較低。對(2)式進(jìn)行數(shù)值仿真,得到如所示的結(jié)果。可以看到,當(dāng)監(jiān)管水平較低時(shí),違規(guī)企業(yè)的比例依然可以在短時(shí)間內(nèi)可以達(dá)到很高比例,因此現(xiàn)有監(jiān)管水平的高低是違規(guī)行為區(qū)域化的重要形成原因。
如果行政監(jiān)管的力度由系統(tǒng)內(nèi)生確定,即監(jiān)管部門處于監(jiān)管成本的考慮,也會對監(jiān)管力度進(jìn)行動態(tài)調(diào)整,因?yàn)楫?dāng)區(qū)域內(nèi)企業(yè)違規(guī)比例較低時(shí),全面密集的檢查會導(dǎo)致高昂的監(jiān)督成本,而且檢查結(jié)果也并不會因此而顯著改變。假設(shè)監(jiān)管部門的監(jiān)管力度調(diào)整也遵循動態(tài)學(xué)習(xí)的規(guī)則,策略的調(diào)整包含兩種情況,一種是對現(xiàn)有違規(guī)企業(yè)由放任轉(zhuǎn)為監(jiān)管,另一種則是對現(xiàn)有誠信企業(yè)放松監(jiān)管,并設(shè)相應(yīng)的策略轉(zhuǎn)變概率分別為r和s,當(dāng)r=1時(shí)即表示對違規(guī)企業(yè)立即采取措施,絕不放任,而s>0則表示監(jiān)管部門對誠信企業(yè)的檢查放松程度。根據(jù)與之前類似的分析,可得連續(xù)時(shí)間狀態(tài)下監(jiān)管比例的動態(tài)方程為:
省略時(shí)間標(biāo)記t并化簡得:
此時(shí)的系統(tǒng)動態(tài)由(2)和(4)式聯(lián)立構(gòu)成的微分方程組描述。
對由(2)和(4)構(gòu)成的非線性微分方程組在均衡點(diǎn)的鄰域內(nèi)線性化展開,得
取p=0.9,q=0.1,r=1,s=0.5,x(0)=0.3,u(0)=0.5,繪制動態(tài)系統(tǒng)的軌線和向量場,如圖2所示。由圖像可以看到,在監(jiān)管力度動態(tài)調(diào)整的情況下,企業(yè)違規(guī)行為的比例(或單一企業(yè)違規(guī)行為的概率)將根據(jù)監(jiān)管力度相應(yīng)調(diào)整。當(dāng)比例達(dá)到一定水平之后,監(jiān)管力度也隨之提高,并使得違規(guī)比例相應(yīng)下降,在下降到某一水平之后,監(jiān)管力度也會隨之下降,并導(dǎo)致以后違規(guī)行為的死灰復(fù)燃。違規(guī)與監(jiān)管在長期內(nèi)形成一個交替升降的循環(huán)過程。由此可知,監(jiān)管檢查力度隨違規(guī)水平的動態(tài)調(diào)整是導(dǎo)致違規(guī)行為反復(fù)化的重要原因。而違規(guī)行為的平均水平,即均衡點(diǎn)的位置,由動態(tài)學(xué)習(xí)的行為轉(zhuǎn)化概率決定,違規(guī)行為的峰值則由采取監(jiān)管檢查行動時(shí)的既有監(jiān)管水平和違規(guī)水平,即系統(tǒng)的初始狀態(tài)決定。
要達(dá)到迅速降低違規(guī)水平的目標(biāo),即是要使由式(2)確定的動力系統(tǒng)歸零的時(shí)間最短。這構(gòu)成了系統(tǒng)的最短時(shí)間控制問題,相應(yīng)的的性能泛函為:
圖3 監(jiān)管檢查力度外生動態(tài)調(diào)整時(shí)x(t)的變化曲線
J=∫0tfd t,其中tf為控制的終端時(shí)間,控制變量受約束0≤u(t)≤1。
構(gòu)造Hamilton函數(shù),得:
注意到式(5)中Hamilton函數(shù)關(guān)于u是線性的,且由實(shí)際意義可知,p>0,q≥0,以及x(0)>0,所以得到系統(tǒng)的最優(yōu)控制為:
其中的Hamilton乘子λ(t)表示在t時(shí)刻狀態(tài)變量x(t)的邊際效應(yīng),在本文所述問題中的實(shí)際含義為欺詐企業(yè)比例增加所導(dǎo)致的消除時(shí)間的增加量。因此,式(6)的最優(yōu)控制表明,只要違規(guī)比例的提高會導(dǎo)致控制過程的時(shí)間延長,則為了盡快消除這種行為,就應(yīng)該對區(qū)域內(nèi)的所有企業(yè)采取無差別的全面檢查(對單一企業(yè)則意味著對其進(jìn)行連續(xù)全面的跟蹤)。
要在長期內(nèi)控制某一違規(guī)現(xiàn)象的比例并最終消除這種現(xiàn)象,就意味著要使由式(2)所確定的動力系統(tǒng)的演化穩(wěn)定均衡為x=0。由式(2)得:
式(8)的結(jié)果表明,若要達(dá)到長期內(nèi)控制違規(guī)行為水平并最終消除的目標(biāo),就要使監(jiān)管檢查的力度保持于某一水平之上,該水平亦由動態(tài)學(xué)習(xí)的行為轉(zhuǎn)化概率確定。同時(shí),考慮到監(jiān)管檢查成本的因素,因此只要使監(jiān)管力度常態(tài)化,并略高于必要水平即可,即令u為略大于的常數(shù)。
取p=0.9,q=0.1,x(0)=0.2,u(0)=0,u(20)=1,u(23)=0.2,動態(tài)系統(tǒng)的變化趨勢如圖3所示??梢钥吹剑?dāng)某種違規(guī)行為凸顯時(shí),只要迅速采取全面或連續(xù)的監(jiān)管檢查,就可以在短時(shí)間內(nèi)(t=3)使違規(guī)行為的水平快速降低;當(dāng)違規(guī)行為的蔓延勢頭得到遏制并降低到較低水平后,就可以將監(jiān)管檢查的力度也降低到略高于必要水平,并且當(dāng)這種力度在長期期穩(wěn)定保持下去時(shí),企業(yè)的同類違規(guī)行為將進(jìn)一步降低并最終消除。
本文針對企業(yè)與監(jiān)管部門間的博弈關(guān)系,構(gòu)建了基于動態(tài)學(xué)習(xí)的企業(yè)違規(guī)行為微分動力系統(tǒng)。并在此基礎(chǔ)上分析了近一段時(shí)間媒體報(bào)道中頻繁出現(xiàn)的企業(yè)違規(guī)行為區(qū)域化、反復(fù)化現(xiàn)象,指出監(jiān)管檢查力度的不足和動態(tài)調(diào)整是導(dǎo)致以上現(xiàn)象出現(xiàn)的重要原因。并從最優(yōu)控制和演化穩(wěn)定策略的角度分析了以上現(xiàn)象出現(xiàn)后的應(yīng)對措施,提出應(yīng)在短時(shí)間內(nèi)采取普查的方式迅速降低違規(guī)行為的比例(或概率),并在較長長期內(nèi)保持必要的監(jiān)管力度以進(jìn)一步降低其比例并最終達(dá)到消除該類違規(guī)行為的目標(biāo)。
本文的結(jié)論適用于對不同類型企業(yè)如生產(chǎn)型、銷售型企業(yè)行為的監(jiān)管,對于不同類型的行業(yè)監(jiān)管如食品衛(wèi)生監(jiān)督、金融監(jiān)管等同樣具有參考價(jià)值。在尚無針對某一違規(guī)行為的專門應(yīng)對措施(比如針對水泥蘋果包裝箱的銷售實(shí)名制)或該措施出臺之前,本文提出的對監(jiān)管檢查力度的調(diào)整建議將可以作為一般性的應(yīng)對舉措加以實(shí)施。
另外需要指出的是,文中的分析是在監(jiān)管成本有限的隱含假設(shè)下得出的。對于現(xiàn)實(shí)中某些違規(guī)行為監(jiān)管檢查難度極大或者監(jiān)管成本極高的情形,要么u(t)所受到約束的上限將小于1,要么相應(yīng)的控制措施項(xiàng)中還須包含對成本項(xiàng)的考慮,導(dǎo)致此時(shí)采取u(t)=1的控制方式的閾值會適當(dāng)提高,但無論如何,對違規(guī)行為采取砰-砰控制(Bang-bang Control)的思想是確定不變的。
[1]葛和平,曹家和.外資并購中國上市公司中違規(guī)與監(jiān)管的博弈分析[J].統(tǒng)計(jì)與決策.2006,(14).
[2]吳桐,徐榮貞.金融危機(jī)下金融創(chuàng)新與監(jiān)管的演化博弈分析[J].統(tǒng)計(jì)與決策.2010,(18).
[3]Fudenberg D,Levine D K.The Theory of Learning in Games[M].Cambridge:The MITPress,1998.
[4]黃凱南.演化博弈與演化經(jīng)濟(jì)學(xué)[J].經(jīng)濟(jì)研究.2009,(02).
[5]Mostagir M.Exploiting Myopic Learning:INFORMSAnnual Meeting[Z].Austin,Texas:2010.
[6]Borgers T,Sarin R.Learning Through Reinforcement and Replicator Dynamics[J].Journal of Economic Theory,1997,77(1).
[7]馬知恩,周義倉.常微分方程定性與穩(wěn)定性方法[M].北京:科學(xué)出版社,2001.