楊明歌, 楊 卓, 梁小珍
(上海大學 管理學院,上海 200444)
隨著互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能的蓬勃發(fā)展,世界進入數(shù)字經(jīng)濟時代。數(shù)字經(jīng)濟深刻影響著傳統(tǒng)制造業(yè)。一方面,通過“產(chǎn)業(yè)數(shù)字化”推動傳統(tǒng)制造業(yè)的數(shù)字化轉(zhuǎn)型;另一方面,通過“數(shù)字產(chǎn)業(yè)化”實現(xiàn)資源的快速配置與再生,促使傳統(tǒng)制造業(yè)向再制造轉(zhuǎn)變。再制造不僅可以解決環(huán)境惡化和資源短缺的問題,還可以為企業(yè)帶來經(jīng)濟效益。近年來,再制造環(huán)節(jié)中的產(chǎn)品回收和產(chǎn)品生命周期支持過程中的逆向物流受到越來越多的重視,傳統(tǒng)供應鏈紛紛向閉環(huán)供應鏈轉(zhuǎn)變。
關(guān)于閉環(huán)供應鏈中的再制造問題,學者們進行了廣泛的研究,已有研究主要集中在定價決策[1,2],回收模式[3,4]和協(xié)調(diào)機制[5,6]三個方面,均從閉環(huán)供應鏈的前向環(huán)節(jié)研究再制造問題,鮮有文獻從閉環(huán)供應鏈的后向環(huán)節(jié)研究再制造問題。實際上,再制造閉環(huán)供應鏈的后向銷售環(huán)節(jié)存在諸多問題。例如,當面對直銷和分銷兩種銷售渠道時,新產(chǎn)品和再制品的銷售渠道選擇問題[7];當制造商和零售商均可提供保修期延長服務時,選擇制造商還是零售商提供服務的問題[8]。
再制品銷售緊跟數(shù)字經(jīng)濟時代步伐,進駐各種網(wǎng)絡平臺。由于消費者對再制品的認識不足導致再制品銷售受挫。銷售商為吸引消費者購買商品,利用數(shù)字經(jīng)濟的虛擬性和隱蔽性進行數(shù)據(jù)濫用和侵權(quán)行為。例如,再制品銷售商受利益驅(qū)使,花費一定偽裝成本將再制品偽裝成新產(chǎn)品,并以新產(chǎn)品的價格出售偽裝后的再制品。這種行為即再制品價格欺騙,不僅嚴重損害消費者利益,還破壞市場公平性。因此,有必要從閉環(huán)供應鏈的后向銷售環(huán)節(jié)研究再制造問題。楊明歌等[9]建立演化博弈模型,研究閉環(huán)供應鏈的再制品價格欺騙問題。楊明歌等[9]使用的是演化博弈,假設博弈參與方是有限理性的,且價值函數(shù)建立在期望效用理論基礎上。雖然演化博弈的有限理性假設有一定現(xiàn)實意義,但是期望效用理論描述的是理性人決策,忽略了心理因素和風險偏好對個體決策的影響,未真正刻畫出有限理性個體的決策過程。
為更加準確地研究人們的決策行為,1979年,KAHNEMAN和TVERSKY等[10]從認知心理學的角度提出較期望效用理論更加貼近現(xiàn)實人決策的前景理論。1980年,THALER[11]首次提出心理賬戶的概念。之后,KAHNEMAN和TVERSKY對心理賬戶進行完善。為克服演化博弈局限性,2017年,韓帥等[12]首次將前景理論和心理賬戶(PT-MA)理論與演化博弈結(jié)合,研究煤礦安全群體行為。隨后,許多學者借鑒韓帥等[12]的方法研究其它管理決策問題[13,14]。
受上述研究的啟發(fā),本文考慮心理因素和風險偏好對個體決策的影響,將PT-MA理論引入演化博弈,研究閉環(huán)供應鏈后向銷售環(huán)節(jié)的再制品價格欺騙問題。與楊明歌等[9]不同的是,本文假設政府的監(jiān)管能力有限,即便政府嚴格監(jiān)管,也不一定識別出銷售商是否偽裝售賣再制品。同時,考慮消費者的識別能力和理賠,即消費者以一定的概率識別出所購買的“新產(chǎn)品”是否為偽裝售賣的再制品,若是,則消費者要求理賠,并從銷售商處獲得賠償。與楊明歌等[9]相比,本文基于PT-MA理論所構(gòu)建的演化博弈模型更貼合實際。關(guān)于三方演化博弈的求解,楊明歌等[9]使用的是分步分析法,而本文使用的是特征值法。
數(shù)字經(jīng)濟時代,網(wǎng)絡數(shù)據(jù)量大且終端難以控制,使得政府難以有效監(jiān)管,給不良銷售商留下可趁之機,損害消費者權(quán)益。在此背景下,本文研究一個由銷售商、政府和消費者構(gòu)成的再制品市場。銷售商的產(chǎn)品來源全為再制品,且有將再制品偽裝成新產(chǎn)品售賣的能力。受利益驅(qū)使,銷售商可能選擇偽裝。由于信息不公開,消費者不知道市場產(chǎn)品的來源情況。消費者可以選擇購買,也可以選擇不購買。消費者一旦購買到由再制品偽裝成的新產(chǎn)品,會要求銷售商賠償。政府可以選擇嚴格監(jiān)管,也可以選擇不嚴格監(jiān)管。政府一旦發(fā)現(xiàn)銷售商偽裝售賣再制品,會對其進行處罰。
假設1不考慮退換貨問題,即在本文研究的再制品市場中銷售是單向的。
假設2再制品與新產(chǎn)品不同質(zhì),且消費者對再制品的接受程度普遍偏低,故再制品的價格小于新產(chǎn)品的價格。
假設3再制品粉飾成本較低,單位再制品粉飾成本小于新產(chǎn)品與再制品價格之差。
假設4政府能力有限,當政府嚴格監(jiān)管時,識別出銷售商是否偽裝售賣再制品的概率為λ(0<λ<1);當政府不嚴格監(jiān)管時,識別出銷售商是否偽裝售賣再制品概率為0。
假設5消費者能力有限,識別出購買的產(chǎn)品是否為再制品偽裝成的新產(chǎn)品的概率為θ(0<θ<1),即消費者產(chǎn)品敏感系數(shù)θ。
假設6無論銷售商是否偽裝售賣再制品,均產(chǎn)生一定的生產(chǎn)成本;進一步,若銷售商選擇偽裝售賣再制品,則擔心自己的欺騙行為被發(fā)現(xiàn),即產(chǎn)生心理成本與再制品粉飾成本。故銷售商選擇不偽裝的成本小于其選擇偽裝的成本,即C12 假設7無論政府是否嚴格監(jiān)管,均需花費一定的人力和物力去檢查銷售商的售賣行為,即產(chǎn)生檢查成本;若政府選擇不嚴格監(jiān)管,則擔心不嚴格履行職責被投訴,即產(chǎn)生心理成本。故政府選擇嚴格監(jiān)管成本小于選擇不嚴格監(jiān)管成本,即C21 假設8無論消費者是否購買,均需花費一定的時間和精力去考察該產(chǎn)品,即產(chǎn)生考察成本;若消費者選擇購買,還擔心自己購買到由再制品偽裝成的新產(chǎn)品,即產(chǎn)生心理成本。故消費者選擇不購買的成本小于選擇購買的成本,即C32 假設9當政府不嚴格監(jiān)管或消費者購買時,政府和消費者均選擇了相對不安全的策略。此時,無論銷售商選擇偽裝還是不偽裝,都將給政府和消費者帶來風險。不妨假設銷售商產(chǎn)生的風險以一個大于0的定值轉(zhuǎn)移給政府和消費者,即風險傳遞系數(shù)h>0。假設銷售商產(chǎn)生的風險以同樣的風險傳遞系數(shù)h轉(zhuǎn)移給政府和消費者。 假設10當政府嚴格監(jiān)管且消費者不購買時,政府和消費者均選擇了相對安全的策略。此時,無論銷售商選擇偽裝還是不偽裝,都無法將風險轉(zhuǎn)移給政府和消費者,即銷售商獨自承擔風險。 S11:銷售商選擇偽裝時的收入; S12:銷售商選擇不偽裝時的收入; C11:銷售商選擇偽裝時的成本; C12:銷售商選擇不偽裝時的成本; C13:政府不嚴格監(jiān)管或消費者購買時,銷售商承擔的風險成本; C14:政府嚴格監(jiān)管且消費者不購買時,銷售商承擔的風險成本; W11:銷售商偽裝且政府嚴格監(jiān)管,政府識別出銷售商偽裝售賣再制品時收取的罰款; W12:銷售商偽裝且消費者購買,消費者識別出銷售商偽裝售賣再制品時獲得的賠償; h:風險傳遞系數(shù); p:風險發(fā)生概率; f1:銷售商選擇偽裝,政府選擇嚴格監(jiān)管且消費者選擇購買時的風險系數(shù) f2:銷售商選擇偽裝,政府選擇不嚴格監(jiān)管且消費者選擇購買時的風險系數(shù); f3:銷售商選擇偽裝,政府選擇不嚴格監(jiān)管且消費者選擇不購買時的風險系數(shù); f4:銷售商選擇不偽裝,政府選擇嚴格監(jiān)管且消費者選擇購買時的風險系數(shù); f5:銷售商選擇不偽裝,政府選擇不嚴格監(jiān)管且消費者選擇購買時的風險系數(shù); f6:銷售商選擇不偽裝,政府選擇不嚴格監(jiān)管且消費者選擇不購買時的風險系數(shù); S2:政府識別出銷售商偽裝售賣再制品獲得的聲譽收益; C21:政府選擇嚴格監(jiān)管時的成本; C22:政府選擇不嚴格監(jiān)管時的成本; W2:政府未識別出銷售商偽裝售賣再制品導致的聲譽損失; λ:政府選擇嚴格監(jiān)管時識別出銷售商偽裝售賣再制品的概率; S3:消費者選擇購買產(chǎn)生的滿足感,即精神收益; C31:消費者選擇購買時的成本; C32:消費者選擇不購買時的成本; W3:消費者購買到再制品偽裝成的新產(chǎn)品的心理損失; θ:消費者產(chǎn)品敏感系數(shù)。 博弈G中效用函數(shù)用收益函數(shù)代替,計算銷售商、政府和消費者的收益,可得政府嚴格監(jiān)管和不嚴格監(jiān)管時的傳統(tǒng)收益矩陣。PT-MA理論依據(jù)個體對“獲得”和“失去”感知的不同,將個體決策的收益劃分為表示“獲得”感知的效價函數(shù)U(x)和表示“失去”感知的成本函數(shù)T(x),效價函數(shù)和成本函數(shù)共同構(gòu)成個體決策的價值函數(shù)[12]。即傳統(tǒng)收益矩陣中,收入等有“獲得”感知的收益函數(shù)歸入效價函數(shù)U(x),成本和損失等有“失去”感知的收益函數(shù)歸入成本函數(shù)T(x),可得政府嚴格監(jiān)管時和不嚴格監(jiān)管時的前景收益感知矩陣,見表1和表2,并分別簡記為表3和表4。 表1 政府嚴格監(jiān)管時的前景收益感知矩陣 表2 政府不嚴格監(jiān)管時的前景收益感知矩陣 表3 政府嚴格監(jiān)管時的簡化前景收益感知矩陣 表4 政府不嚴格監(jiān)管時的簡化前景收益感知矩陣 假設銷售商選擇偽裝策略概率為x,選擇不偽裝策略概率為1-x;政府選擇嚴格監(jiān)管策略概率為y,選擇不嚴格監(jiān)管策略概率為1-y;消費者選擇購買策略概率為z,選擇不購買策略概率為1-z,其中x,y,z∈[0,1]。x,y,z為事件發(fā)生客觀概率。但當人們面對“獲得”與“失去”時,對事件的決策權(quán)重往往不等于事件發(fā)生的客觀概率,而是高估小概率、低估大概率的主觀概率。TVERSKY和KAHNEMAN[15]考慮人們面對“獲得”與“失去”時表現(xiàn)的不同風險態(tài)度,給出高估小概率、低估大概率的決策權(quán)重函數(shù)表達式。之后,韓帥等[12]使用該決策權(quán)重函數(shù)表示主觀概率。借鑒韓帥等[12]的做法,設π(P)表示決策權(quán)重函數(shù),其中P為事件發(fā)生的客觀概率,π(P)的表達式見TVERSKY和KAHNEMAN[15]。用價值函數(shù)替代收益函數(shù),用決策權(quán)重函數(shù)替代客觀概率,從而把期望收益轉(zhuǎn)化為價值感知?;诒?和表4,可得系統(tǒng)的復制動態(tài)方程組為 F(x)=x(1-x)[π(y)π(z)(a1-a3)+π(y)·π(1-z)(a2-a4)+π(1-y)π(z)(a5-a7)+π(1-y)π(1-z)(a6-a8)] F(y)=y(1-y)[π(x)π(z)(b1-b5)+π(x)·π(1-z)(b2-b6)+π(1-x)π(z)(b3-b7)+π(1-x)π(1-z)(b4-b8)] F(z)=z(1-z)[π(x)π(y)(c1-c2)+π(x)·π(1-y)(c5-c6)+π(1-x)π(y)(c3-c4)+π(1-x)π(1-y)(c7-c8)] 本文使用特征值法求解三方演化博弈。依據(jù)系統(tǒng)復制動態(tài)方程組求得Jacobi矩陣以及均衡點的特征值,得到命題1。 命題1(1)當a1>a3且c1>c2時,(1,1,1)是系統(tǒng)演化穩(wěn)定策略;(2)當a2>a4且c1 由b1>b5,b2>b6,b3>b7,b4>b8可知,政府選擇嚴格監(jiān)管的價值感知始終大于選擇不嚴格監(jiān)管的價值感知,故政府選擇嚴格監(jiān)管并保持不變。與選擇不嚴格監(jiān)管相比,選擇嚴格監(jiān)管時一旦發(fā)現(xiàn)銷售商有價格欺騙行為可以獲得對銷售商的罰款和聲譽收益,從而產(chǎn)生更大的效價感知。但選擇嚴格監(jiān)管時不需要承擔心理成本和風險成本,從而產(chǎn)生更小的成本感知。因此,選擇嚴格監(jiān)管的價值感知大于選擇不嚴格監(jiān)管的價值感知。 當a1>a3且c1>c2時,(偽裝,嚴格,購買)是系統(tǒng)演化穩(wěn)定策略。這種情況一般發(fā)生在再制造產(chǎn)業(yè)發(fā)展的初期階段,再制造相關(guān)法律的不健全和政府監(jiān)管的缺乏導致銷售商具有很強的投機心理。大數(shù)據(jù)的虛擬性使消費者很難辨別產(chǎn)品偽劣,對所售產(chǎn)品的戒備心理很弱,相信自己的主觀判斷,容易買到由再制品偽裝成的新產(chǎn)品,再制品價格欺騙事件頻頻發(fā)生。對銷售商而言,與選擇不偽裝相比,選擇偽裝可以獲得更多的收入,從而產(chǎn)生更大的效價感知。但選擇偽裝需要承擔額外的粉飾成本、心理成本、政府罰款、消費者賠償以及更大的風險成本,從而產(chǎn)生更大的成本感知。若銷售商的投機心理占據(jù)上風,則會低估選擇偽裝的心理成本和風險成本,以及政府和消費者對其價格欺騙行為的識別能力,以至于增加的成本感知小于增加的效價感知。此時,銷售商選擇偽裝的價值感知大于選擇不偽裝的價值感知。對消費者而言,與選擇不購買相比,選擇購買可以獲得滿足感,且一旦發(fā)現(xiàn)銷售商有價格欺騙行為還可以獲得補償,從而產(chǎn)生更大的效價感知。但選擇購買需要承擔額外的心理成本、風險成本和潛在損失,從而產(chǎn)生更大的成本感知。若消費者戒備心理很弱,則會低估選擇購買的心理成本、風險成本和潛在損失,以至于增加的成本感知小于增加的效價感知。此時,消費者選擇購買的價值感知大于選擇不購買的價值感知。 當a2>a4且c1 當a2 當a1 本節(jié)進行數(shù)值仿真分析相關(guān)因素對系統(tǒng)演化穩(wěn)定策略的影響。假設銷售商、政府和消費者的初始客觀概率為x0=0.5,y0=0.4,z0=0.6;參考WU等[14]相關(guān)參數(shù)取值,結(jié)合本文選題背景,賦值如下:S11=3,S12=2,C11=2,C12=1.5,C13=100,C14=1.5,W11=2,W12=2,p=0.03,f1=0.6,f2=0.7,f3=0.5,f4=0.2,f5=0.4,f6=0.3,S2=2,C21=1.5,C22=2,W2=2,λ=0.5,S3=2,C31=2,C32=1.5,W3=2,θ=0.5。由韓帥等[12]易知,效價函數(shù)U(x)表達式為: 成本函數(shù)T(x)的表達式為: 其中,U1為效價參照點,U2為成本參照點,ρ和μ為損失規(guī)避程度,α,β,φ,δ為風險偏好系數(shù)。借鑒TVERSKY等[16]、JAN和KAA[17]關(guān)于ρ,μ,α,β,φ,δ的取值,本文令ρ=μ=2,α=β=0.88,φ=δ=0.98。由TVERSKY等[15]易知,決策權(quán)重函數(shù)π(P)的表達式為: 其中,r為決策影響系數(shù)。參考SENBIL和KITAMURA[18]決策影響系數(shù)的設定,本文令r=0.75。 (1)改變心理參照點U1和U2,觀察銷售商、政府、消費者策略演化路徑的變化。 選取U1的三個不同值-1,2,5,分別畫出x的演化路徑,見圖1;分別畫出y的演化路徑,見圖2;分別畫出z的演化路徑,見圖3。結(jié)果表明:降低U1可以促使x加快演化到0并保持穩(wěn)定,也可以促使y和z均加快演化到1并保持穩(wěn)定。即降低效價參照點可以促使系統(tǒng)演化至“銷售商不偽裝,政府嚴格監(jiān)管,消費者購買”的狀態(tài),并保持不變。 圖1 U1變化時x的演化路徑 圖2 U1變化時y的演化路徑 圖3 U1變化時z的演化路徑 同理,選取U2的三個不同值-1,2,5,分別畫出x,y,z的演化路徑,由于篇幅所限,此處圖形省略。結(jié)果表明:降低U2可以促使x加快演化到0并保持穩(wěn)定,可以促使y加快演化到1并保持穩(wěn)定,提高U2可以促使z加快演化到1并保持穩(wěn)定。即降低成本參照點可促使銷售商選擇不偽裝且政府選擇嚴格監(jiān)管,提高成本參照點可促使消費者選擇購買。 (2)改變風險偏好系數(shù)α,β,φ,δ,觀察銷售商、政府、消費者策略演化路徑變化。 令α=β=φ=δ,取α,β,φ,δ三組不同值0.2,0.5,0.8,分別畫出x,y,z演化路徑,由于篇幅所限,此處圖形省略。結(jié)果表明:提高α,β,φ,δ可促使x加快演化到0并保持穩(wěn)定,促使y和z均加快演化到1并保持穩(wěn)定。即提高銷售商、政府和消費者的風險偏好系數(shù),可促使系統(tǒng)演化至“銷售商不偽裝,政府嚴格監(jiān)管,消費者購買”的狀態(tài),并保持不變。 (3)改變損失規(guī)避程度ρ和μ,觀察銷售商、政府、消費者策略演化路徑的變化。 令ρ=μ,取ρ和μ的三組不同值0,1,2,分別畫出x,y,z的演化路徑,由于篇幅所限,此處圖形省略。結(jié)果表明:①當ρ=μ=0時,x演化到1并保持穩(wěn)定;提高ρ和μ可促使x加快演化到0并保持穩(wěn)定。即當損失規(guī)避程度為0時,銷售商的演化穩(wěn)定策略為偽裝;隨著損失規(guī)避程度的產(chǎn)生與增加,銷售商最終演化至選擇不偽裝。②提高ρ和μ可促使y加快演化到1并保持穩(wěn)定,即提高損失規(guī)避程度可以促使政府選擇嚴格監(jiān)管。③降低ρ和μ可促使z加快演化到1并保持穩(wěn)定,即降低損失規(guī)避程度可促使消費者選擇購買。 數(shù)字經(jīng)濟作為新的經(jīng)濟形態(tài),推動了生產(chǎn)、生活和社會治理方式的深刻變革。但大數(shù)據(jù)的共享水平還有待提高,銷售商、政府和消費者之間的信息公開仍有很多壁壘,從而對消費者權(quán)益保護提出更高要求。為保護消費者權(quán)益,促使經(jīng)濟社會有效發(fā)展,將PT-MA理論與演化博弈結(jié)合研究銷售商再制品價格欺騙行為,得到以下結(jié)論: (1)降低效價參照點或成本參照點均可促使銷售商選擇不偽裝,政府選擇嚴格監(jiān)管;降低效價參照點或提高成本參照點均可促使消費者選擇購買。事實上,個體的價值感知取決于其收益與參照點的差。實際中,為促使再制品市場達到有效狀態(tài),可從以下三個方面調(diào)整。第一,引導銷售商客觀認識其產(chǎn)品,防止過高評價產(chǎn)品價值,從而降低其效價參照點;推動銷售商銷售方式轉(zhuǎn)型升級,通過在線銷售降本增效,防止其過高評價銷售過程中的付出,從而降低其成本參照點。第二,引導政府發(fā)動消費者共同監(jiān)管再制品市場,從而降低其效價參照點;為政府監(jiān)管工作提供支持,推動政府辦公的數(shù)字化轉(zhuǎn)型,從而降低其成本參照點。第三,提高大數(shù)據(jù)信息共享程度,使消費者正確認識新產(chǎn)品與再制品區(qū)別,降低其效價參照點;引導消費者提高對再制品認可度,打破其對再制品質(zhì)量不佳的固有印象,提高其成本參照點。 (2)提高銷售商、政府和消費者的風險偏好系數(shù),可促使系統(tǒng)演化至“銷售商不偽裝,政府嚴格監(jiān)管,消費者購買”的狀態(tài)。風險偏好系數(shù)反映個體對風險的態(tài)度。實際中,為促使再制品市場達到有效狀態(tài),可從以下三個方面調(diào)整。第一,政府提高對銷售商再制品價格欺騙行為的識別能力,鼓勵消費者曝光銷售商的這種行為,使銷售商選擇偽裝的風險提高,即風險偏好系數(shù)提高,從而銷售商不敢輕易選擇偽裝。第二,引導消費者積極監(jiān)督政府工作,鼓勵消費者積極向政府部門投訴銷售商偽裝行為,使政府選擇不嚴格監(jiān)管的風險提高,即風險偏好系數(shù)提高,從而促使政府選擇嚴格監(jiān)管。第三,健全相關(guān)法律法規(guī),完善產(chǎn)品的售后服務保障,減輕消費者的戒備心理,從而提高消費者的風險偏好系數(shù),使消費者愿意冒險選擇購買。 (3)提高損失規(guī)避程度可促使銷售商選擇不偽裝且政府選擇嚴格監(jiān)管;降低損失規(guī)避程度可促使消費者選擇購買。損失規(guī)避程度反映個體對損失的態(tài)度。實際中,為促使再制品市場達到有效狀態(tài),可從以下三個方面調(diào)整。第一,加大對銷售商偽裝的懲罰力度,使銷售商選擇偽裝的損失增加,從而提高銷售商的損失規(guī)避程度。第二,加強對政府不嚴格監(jiān)管的懲罰力度,使政府選擇不嚴格監(jiān)管的損失增加,從而提高政府的損失規(guī)避程度。第三,建立全方位的智慧維權(quán)服務系統(tǒng),拓寬維權(quán)渠道,降低維權(quán)成本,盡可能減少消費者選擇購買的損失,從而降低消費者損失規(guī)避程度。 為整治數(shù)字經(jīng)濟時代的再制品銷售亂象,保護消費者權(quán)益,本文深入分析銷售商、政府和消費者心理因素對再制品價格欺騙的影響,為再制品市場發(fā)展提出建議。本文研究還存在一定的不足。例如,考慮的參數(shù)較少,而現(xiàn)實中的影響因素很多;又例如,數(shù)值仿真采用的是虛擬數(shù)據(jù),并非實際數(shù)據(jù),可能與現(xiàn)實存在出入。之后的研究可從以上不足入手。1.2 符號說明
2 模型建立與求解
2.1 前景收益感知矩陣
2.2 三方演化博弈模型的建立
2.3 三方演化博弈模型的求解
3 演化結(jié)果分析
4 數(shù)值仿真
5 結(jié)論與建議