田 冉,韓 敏,李斌勇
(西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院,成都610031)
基于Agent的協(xié)同物流利潤(rùn)分配模型
田 冉,韓 敏,李斌勇
(西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院,成都610031)
傳統(tǒng)Rubinstein利潤(rùn)分配模型中的參數(shù)設(shè)定多由經(jīng)驗(yàn)判定,造成協(xié)商結(jié)果的不確定性。針對(duì)該問(wèn)題,建立一種自學(xué)習(xí)的利潤(rùn)分配模型。該模型將協(xié)同物流商分為主動(dòng)協(xié)同和被動(dòng)協(xié)同2類,不同類型的協(xié)同物流商在探索對(duì)方物流商底價(jià)的基礎(chǔ)上給出自己的報(bào)價(jià)或者反報(bào)價(jià),依據(jù)當(dāng)前報(bào)價(jià)結(jié)果決定是否轉(zhuǎn)變協(xié)商角色類型,并引入自學(xué)習(xí)的報(bào)價(jià)參數(shù)實(shí)現(xiàn)報(bào)價(jià)過(guò)程中報(bào)價(jià)策略的改變,得到使協(xié)同各方滿意的結(jié)果。仿真結(jié)果表明,與傳統(tǒng)Rubinstein利潤(rùn)分配模型相比,該模型能降低達(dá)成協(xié)商所需的次數(shù),有效避免因經(jīng)驗(yàn)判定造成的不確定性。
交通運(yùn)輸經(jīng)濟(jì);利潤(rùn)分配;報(bào)價(jià)策略;協(xié)同物流;討價(jià)還價(jià)策略
協(xié)同物流運(yùn)輸模式是現(xiàn)代物流運(yùn)輸?shù)陌l(fā)展方向和趨勢(shì)所在,而在協(xié)同過(guò)程中必然會(huì)產(chǎn)生由“1+1>2”的協(xié)同效應(yīng)所帶來(lái)的新的協(xié)同利潤(rùn),而如何分配新利潤(rùn)就成為對(duì)物流鏈的協(xié)同的關(guān)鍵問(wèn)題。由于協(xié)作企業(yè)之間是不同的利益主體,因此既要保證各方的利益,又要保證協(xié)同的整體利益最大化,在考慮協(xié)同各方利益的基礎(chǔ)上公平合理地分配協(xié)同物流運(yùn)輸中產(chǎn)生的協(xié)同利潤(rùn),協(xié)調(diào)協(xié)同各方的關(guān)系,這是關(guān)系到協(xié)同物流能否順利進(jìn)行和持續(xù)進(jìn)行的基本問(wèn)題。
目前,對(duì)于利潤(rùn)分配的對(duì)象上可以分為橫向和縱向的利潤(rùn)分配,對(duì)于物流鏈縱向利潤(rùn)分配的主體主要為參與物流鏈上協(xié)同的物流商之間的利潤(rùn)分配。對(duì)于物流鏈橫向利潤(rùn)分配的主體主要為物流鏈多個(gè)層級(jí)上的物流商與制造廠、經(jīng)銷商、供應(yīng)商之間的利潤(rùn)分配。
利潤(rùn)分配方法主要集中在利潤(rùn)的直接分配和利潤(rùn)的協(xié)商分配(即討價(jià)還價(jià))上,直接分配多采用Shaply值法及其改進(jìn)方法[1-3],協(xié)商分配多基于Stackelberg[4-6],Bertrand[6-7]等博弈策略的基礎(chǔ)上建立K-S[4],Rubinstein[8]等分配模型及與其他算法的混合算法[9-11]組成的分配模型。從經(jīng)濟(jì)學(xué)研究的角度來(lái)說(shuō),現(xiàn)有的合作博弈理論是解決價(jià)格博弈問(wèn)題的最佳策略,但是還存在一些問(wèn)題,如在利潤(rùn)直接分配上多采用的Shaply值法的結(jié)果優(yōu)劣主要取決于利潤(rùn)分配因素及其權(quán)重的定義。在利潤(rùn)協(xié)商分配的過(guò)程中多采用合作博弈策略模型,如Stackelberg策略可以找到一個(gè)合作區(qū)間,但無(wú)法給出一個(gè)準(zhǔn)確的利潤(rùn)分配方案[12]。而Rubinstein討價(jià)還價(jià)策略雖然可以給出一個(gè)分配方案,但其設(shè)定參數(shù)對(duì)其還價(jià)策略的影響很大,當(dāng)設(shè)定參數(shù)取值不合適時(shí)會(huì)陷入難以協(xié)商成功的困境。
隨著物流協(xié)同的不斷發(fā)展和物流鏈上企業(yè)間系統(tǒng)的相互集成,使用Agent根據(jù)環(huán)境的變化進(jìn)行協(xié)商策略的變更,從而進(jìn)行協(xié)同利潤(rùn)的分配是一種很好的解決方案[13-15]。本文為各協(xié)作物流商建立擁有獨(dú)立報(bào)價(jià)的Agent,通過(guò)各Agent之間的相互學(xué)習(xí)探索對(duì)方的價(jià)格底線,從而改變自己的協(xié)同角色和修正自己的報(bào)價(jià)參數(shù)進(jìn)行討價(jià)還價(jià),最終實(shí)現(xiàn)各方都滿意的協(xié)作利潤(rùn)分配。
2.1 模型描述
對(duì)在協(xié)同物流的過(guò)程中產(chǎn)生新的利潤(rùn)進(jìn)行分配時(shí),以協(xié)調(diào)Agent為主導(dǎo),在主動(dòng)協(xié)商物流商和被動(dòng)協(xié)商物流商之間執(zhí)行Stackelberg博弈策略。博弈的順序?yàn)橹鲃?dòng)物流商提出報(bào)價(jià),使自己的利益最大,隨后由被動(dòng)物流商根據(jù)主動(dòng)物流商的報(bào)價(jià)再提出反報(bào)價(jià),并使自己的收益最大。具體的流程如下:協(xié)調(diào)Agent首先在歷史數(shù)據(jù)中查詢是否有先例可以遵循,如果有則將其作為初始的利潤(rùn)分配,由協(xié)調(diào)Agent直接廣播給各協(xié)同Agent。如果沒(méi)有則向分配利潤(rùn)Agent發(fā)送分配請(qǐng)求,利潤(rùn)分配Agent初始按照各物流商在協(xié)同中的貢獻(xiàn)度進(jìn)行分配利潤(rùn),這里采用文獻(xiàn)[2]方法確定初始利潤(rùn)分配方案,并將分配結(jié)果告知各協(xié)同Agent,如各協(xié)同Agent均同意該分配方案則結(jié)束協(xié)商,如不同意則進(jìn)入多Agent協(xié)商過(guò)程。物流商Agent根據(jù)利潤(rùn)分配Agent分配的價(jià)格(即第一次根據(jù)貢獻(xiàn)自動(dòng)分配的報(bào)價(jià))提出自己的反報(bào)價(jià),并根據(jù)其他協(xié)作方的反報(bào)價(jià)探索其私有信息(例如底價(jià)和報(bào)價(jià)策略),并修正自己對(duì)于對(duì)方現(xiàn)有報(bào)價(jià)看法的主觀判斷,從而在兼顧協(xié)同的同時(shí)修正自己的報(bào)價(jià)策略和反報(bào)價(jià),從而盡可能地提高自己所獲得的利益。
如各物流商Agent直接拒絕該方案則協(xié)商需要人為干預(yù)后再次協(xié)商。當(dāng)協(xié)商次數(shù)到達(dá)最大協(xié)商次數(shù)后仍然沒(méi)有達(dá)成協(xié)議則協(xié)商結(jié)束。協(xié)商的過(guò)程如圖1所示。
圖1 協(xié)商過(guò)程
這里將Agent分為協(xié)調(diào)Agent和物流商Agent,協(xié)調(diào)Agent負(fù)責(zé)利潤(rùn)分配歷史數(shù)據(jù)的查詢、初始的利潤(rùn)分配廣播和到達(dá)最大協(xié)商次數(shù)節(jié)點(diǎn)時(shí)人為干預(yù)協(xié)調(diào)終止的工作。
物流商Agent負(fù)責(zé)每個(gè)獨(dú)立的物流商在利潤(rùn)分配過(guò)程中對(duì)報(bào)價(jià)的反應(yīng)和對(duì)其他物流商底價(jià)的探索。其部分信息是私有的,即自身的底價(jià)和對(duì)報(bào)價(jià)的滿意度,而部分信息是公開(kāi)的,即各個(gè)物流商歷史報(bào)價(jià)信息、反報(bào)價(jià)信息。
2.2 模型定義
多Agent的協(xié)商過(guò)程與協(xié)商次數(shù)、雙方底價(jià)、互相報(bào)價(jià)、各自的報(bào)價(jià)策略等因素有關(guān)。根據(jù)協(xié)同物流中利潤(rùn)分配的實(shí)際情況,本文將協(xié)商模型定義為一個(gè)多元組(ST,SA,ACTION,T,RP,OP,β(t)):
(1)ST為進(jìn)行協(xié)商的子任務(wù),SA為進(jìn)行協(xié)商的子任務(wù)的集合,即由運(yùn)輸任務(wù)SA可以拆分出多個(gè)為運(yùn)輸任務(wù)SA拆分的子任務(wù)個(gè)數(shù)。
(2)ACTION為該智能體的動(dòng)作集合:接受(Accept),拒絕(Reject),報(bào)價(jià)與反報(bào)價(jià)(Offer and C_offer)。智能體按照當(dāng)前的報(bào)價(jià)和規(guī)則進(jìn)行行動(dòng)。
(3)T為協(xié)商次數(shù),定義Tmax為協(xié)商的最大次數(shù),即協(xié)商不可能無(wú)休止地進(jìn)行下去,當(dāng)協(xié)商次數(shù)超過(guò)協(xié)商的最大次數(shù)時(shí),停止協(xié)商。最大協(xié)商次數(shù)定義為:
其中,μ為事先定義的合理的協(xié)商次數(shù);f(SA)為運(yùn)輸任務(wù)SA分配協(xié)同的物流商數(shù)量;N為常數(shù),用于控制協(xié)商的最大次數(shù)不至于過(guò)多。最大協(xié)商次數(shù)與參與協(xié)同的物流商數(shù)量成正比,當(dāng)參與協(xié)同的物流商數(shù)量越多,參與協(xié)同的資源就越多,重新協(xié)商達(dá)成協(xié)同的機(jī)會(huì)就越大,協(xié)商的最大次數(shù)就越多,反之亦然。
(4)RP為該物流商的底價(jià),對(duì)于該物流商來(lái)說(shuō)如果報(bào)價(jià)低于底價(jià)則停止協(xié)商。參與協(xié)同的各個(gè)物流商是無(wú)法知道其他物流商的底價(jià)。只有通過(guò)不斷報(bào)價(jià)與反報(bào)價(jià),最終達(dá)成協(xié)商。
(5)OP為物流商的報(bào)價(jià)與反報(bào)價(jià)的價(jià)格。物流商通過(guò)反報(bào)價(jià)來(lái)探索其他物流商的底價(jià)和報(bào)價(jià)參數(shù),從而使得自己的利益最大化。同時(shí)定義OPe為最后的成交價(jià)格。
(6)β(t)為報(bào)價(jià)參數(shù),與協(xié)商中的智能體的風(fēng)險(xiǎn)趨向和協(xié)商的次數(shù)相關(guān)。主動(dòng)協(xié)商的報(bào)價(jià)參數(shù)定義為:
其中,β(0)=w;λ為正實(shí)數(shù),決定了報(bào)價(jià)參數(shù)的變化速度;w∈(0,1],決定了β(t)的最大值。當(dāng)w=1時(shí),圖2分別表示了λ=0.1,λ=1.0和λ=10.0在w=1.0時(shí)主動(dòng)協(xié)商的β(t)的變化情況。
圖2 主動(dòng)協(xié)商企業(yè)報(bào)價(jià)參數(shù)β(t)的變化過(guò)程
圖3分別表示了λ=0.1,λ=1.0和λ=10.0在w=1時(shí)被動(dòng)協(xié)商的β(t)的變化情況。
圖3 被動(dòng)協(xié)商企業(yè)報(bào)價(jià)參數(shù)β(t)的變化過(guò)程
(7)物流商Agent對(duì)利潤(rùn)分配報(bào)價(jià)的反應(yīng)一般是模糊的,特別是對(duì)分配給自己的利益總希望更多一些。因此,對(duì)分配給自己的利潤(rùn)價(jià)格可以建立模糊評(píng)價(jià)集合,即該物流商對(duì)報(bào)價(jià)的反應(yīng)集合,對(duì)應(yīng)的滿意度定義為:
當(dāng)物流商i對(duì)t時(shí)刻分配結(jié)果不滿意時(shí),即滿意度小于1時(shí),需要主動(dòng)和其他協(xié)同物流商進(jìn)行協(xié)商,即采用式(2)中的主動(dòng)協(xié)商報(bào)價(jià)參數(shù)定義進(jìn)行報(bào)價(jià);當(dāng)物流商i對(duì)t時(shí)刻分配結(jié)果滿意時(shí),其滿意度在所有物流商中最大,即其在協(xié)商過(guò)程中僅需要被動(dòng)接受其他物流商的協(xié)商要求,即采用式(2)中的被動(dòng)協(xié)商的報(bào)價(jià)參數(shù)定義進(jìn)行報(bào)價(jià)。
2.3 自學(xué)習(xí)協(xié)商算法
物流商Agent在觀察學(xué)習(xí)其他協(xié)同物流商反報(bào)價(jià)的基礎(chǔ)上判斷其他物流商對(duì)報(bào)價(jià)的反應(yīng)類型,并提出自己報(bào)價(jià)分配方案與其他物流商進(jìn)行協(xié)商。其學(xué)習(xí)的過(guò)程如下:
SteP1 查詢歷史
查詢分配歷史記錄判斷利潤(rùn)分配Agent提出的報(bào)價(jià)方案是否在之前有過(guò)成功的先例。如果有則按此歷史方案進(jìn)行廣播,如果所有Agent不反對(duì)則直接接受,結(jié)束協(xié)商過(guò)程。如果沒(méi)有則進(jìn)入Step2。
SteP2 主動(dòng)物流商的報(bào)價(jià)
假設(shè)需要對(duì)2個(gè)物流商a,b協(xié)作時(shí)產(chǎn)生的利潤(rùn)S進(jìn)行分配,此時(shí)對(duì)于物流商a來(lái)說(shuō),如果對(duì)初始報(bào)價(jià)方案不滿,即其滿意度此時(shí)物流商a需要主動(dòng)和物流商b進(jìn)行協(xié)商,因此,物流商a的Agent需要向總的協(xié)調(diào)Agent提出新的報(bào)價(jià)方案
對(duì)于物流商a來(lái)說(shuō),物流商b的底價(jià)RP′b是未知的,但其滿意度肯定大于自己,因此,需要給出一個(gè)對(duì)自己有利的報(bào)價(jià)方案。這里物流商a的協(xié)同Agent將物流商b的底價(jià)假設(shè)為一個(gè)可能值的集合{B1,B2,…,Bq},每一個(gè)可能值的取值定義為:
假設(shè)從物流商b的反報(bào)價(jià)估算的物流商b的底價(jià)集合是滿足正態(tài)分布的,因此,歸一化后將其定義為:
其中,σ2為底價(jià)變化的步長(zhǎng),當(dāng)物流商b急于達(dá)成協(xié)商時(shí),該值較小,反之則較大,因此,定義σ2=α×D,D為常數(shù)。
定義 P(OP′b|Bi)為在物流商b的底價(jià)為Bi時(shí),分配給物流商b的利潤(rùn)為OP′b時(shí)的概率,定義后驗(yàn)概率為:
隨著協(xié)商的進(jìn)行,被動(dòng)企業(yè)可以根據(jù)協(xié)商的情況變更α的取值。α值越大時(shí),代表物流商b的風(fēng)險(xiǎn)承受能力越高,其協(xié)商的耐心越大,|OP′b/(1+α)-Bi|越小,則P(OP′b|Bi)越大,此時(shí)假設(shè)集的概率分布越精確。
根據(jù)全概率公式:
推算出物流商b的底價(jià):
以該底價(jià)為基礎(chǔ)提報(bào)該報(bào)價(jià)方案(S-RP′b,RP′b)給協(xié)商Agent。
SteP3 被動(dòng)物流商的反報(bào)價(jià)
被動(dòng)物流商b的Agent從協(xié)商Agent收到報(bào)價(jià)方案(S-RP′b,RP′b)后,根據(jù)該方案同Step2的過(guò)程探索主動(dòng)物流商a的底價(jià)RP′a,并根據(jù)該底價(jià)提出反報(bào)價(jià)方案(S-OP′b,OP′b)給主動(dòng)物流商,其中,OP′b=(S-RP′b)(1+βb(t))。
SteP4 報(bào)價(jià)過(guò)程中的學(xué)習(xí)
通過(guò)以下的比較來(lái)學(xué)習(xí)和改進(jìn)自己的報(bào)價(jià)方案:根據(jù)物流商的反報(bào)價(jià)方案(S-OP′b,OP′b),計(jì)算各物流商的滿意度。如果各個(gè)物流商的滿意度均為1,則直接按照該報(bào)價(jià)方案結(jié)束協(xié)商;如果各個(gè)物流商的滿意度不都為1,即假設(shè)對(duì)此時(shí)的反報(bào)價(jià)方案(S-OP′b,OP′b)計(jì)算各物流商的滿意度后,如果物流商的滿意度小于1,即仍為主動(dòng)物流商,S-OP′b<RP′a,則認(rèn)為物流商a高估了物流商b的底價(jià),此時(shí)變更主動(dòng)物流商a的α的取值為:
其中,K為連續(xù)主動(dòng)協(xié)商的次數(shù),當(dāng)主動(dòng)物流商多次為某一物流商時(shí),該物流商的K=K+1;λ為主動(dòng)物流商報(bào)價(jià)的變化速度。
如果物流商b的滿意度小于1,即OP′b<RP′b,則認(rèn)為低估了物流商b的底價(jià),此時(shí)以物流商b為主動(dòng)協(xié)商的物流商按照反報(bào)價(jià)方案(S-OP′b,OP′b)返回Step2繼續(xù)協(xié)商。
SteP5 協(xié)商次數(shù)限制
如果在規(guī)定的協(xié)商次數(shù)t內(nèi)都未成功達(dá)成分配協(xié)議則進(jìn)行人工干預(yù)。在Agent的協(xié)商過(guò)程中,也可以隨時(shí)進(jìn)行人為調(diào)整報(bào)價(jià)參數(shù)以變更自己的報(bào)價(jià)策略從而進(jìn)行干預(yù)。
假設(shè)沒(méi)有歷史數(shù)據(jù),所有的物流商都參與討價(jià)還價(jià)的流程。設(shè)定最大的協(xié)商次數(shù)為Tmax=120。以某汽車制造廠的2個(gè)進(jìn)行運(yùn)輸協(xié)同的物流公司為例,初始的利潤(rùn)分配、各自的底價(jià)和報(bào)價(jià)參數(shù)如表1所示。
表1 初始利潤(rùn)分配和底價(jià)元
由于初始分配給物流商A的利潤(rùn)小于A的底價(jià),因此按照式(5)其滿意度為0.904 19,此時(shí)物流商A對(duì)初始分配不滿,為主動(dòng)物流商,需要對(duì)分配進(jìn)行協(xié)商且急于獲取更多的利潤(rùn)以達(dá)成協(xié)商,因此物流商A的耐心較小,需要以一個(gè)較大的初始λa值和wa值來(lái)對(duì)初始分配提出自己的報(bào)價(jià),而此時(shí)物流商B為被動(dòng)物流商,因此其耐心肯定大于物流商A。由于物流商B對(duì)初始分配的滿意度為1,其已經(jīng)對(duì)現(xiàn)有分配滿意且希望獲取更多的利潤(rùn),因此其并不急于達(dá)成協(xié)商,耐心較大。設(shè)定物流商B的α=0.8,λ=0.5,下面計(jì)算主動(dòng)物流商A提出的報(bào)價(jià)方案。
對(duì)于主動(dòng)物流商A的Agent,按照式(2)計(jì)算得出初始報(bào)價(jià)參數(shù)為β(1)=(1-m in(1,600)/600)2× 1=0.983 4。設(shè)定式(6)中的參數(shù)q=5,N=100,式(7)中的參數(shù)D=100,按照式(6)求得物流商B的底價(jià)的可能值為{1 383.59,1 483.59,1 583.59,1 683.59,1 783.59},按照式(7)求得對(duì)應(yīng)的概率為{0.054 5,0.244 2,0.402 6,0.244 2,0.054 5},按照式(8)求得后驗(yàn)概率分別為{0.947 6,0.966 1,0.984 6,0.996 9,0.978 3},按照式(9)求得概率為{0.052 6,0.240 6,0.404 2,0.248 2,0.054 4},進(jìn)而按照式(10)計(jì)算出此時(shí)物流商B的底價(jià)為1 584.70,物流商A的Agent按照該底價(jià)提出報(bào)價(jià)的分配方案為{4 415.30,1 584.70}。
對(duì)于物流商A提出的分配方案{4 415.30,1 584.70},已知物流商A急于達(dá)成協(xié)商,屬于主動(dòng)物流商,因此,設(shè)定物流商A的α=0.4,λ=2,來(lái)對(duì)該分配提出自己的反報(bào)價(jià)。和上述的物流商A的Agent計(jì)算方式相同,參數(shù)設(shè)定相同,求得物流商B反報(bào)價(jià)的分配方案{3 706.16,2 293.84}。
此時(shí)協(xié)調(diào)Agent以分配方案{3 706.16,2 293.84}作為當(dāng)前方案廣播給所有物流商,再次判斷物流商A和物流商B對(duì)該方案的滿意度。同上述的計(jì)算過(guò)程,物流商A仍為主動(dòng)物流商,物流商B為被動(dòng)物流商,此時(shí)物流商A的按照式(11)變化為0.9,物流商A根據(jù)報(bào)價(jià)方案{3 706.16,2 293.84}提出新的報(bào)價(jià)方案{4 792.72,1 207.28},物流商B提出反報(bào)價(jià)的方案{4 041.21,1 958.79}。此時(shí)對(duì)于該方案物流商A和B的滿意度為{0.985 6,1}。
物流商A仍為主動(dòng)物流商,K=2,同上述計(jì)算過(guò)程物流商B提出反報(bào)價(jià)的方案{4 213.82,1 786.18}。此時(shí)對(duì)于該方案物流商A和B的滿意度為{1,0.992 3}。此時(shí)物流商B為主動(dòng)物流商,K=0,重新進(jìn)行協(xié)商。如此反復(fù)進(jìn)行,當(dāng)t=9時(shí),反報(bào)價(jià)的方案{4 177.36,1 822.64},此時(shí)對(duì)于該方案物流商A和B的滿意度均為1,達(dá)成協(xié)議,協(xié)商結(jié)束??倽M意度變化結(jié)果如圖4所示。
圖4 總滿意度比較
如圖4所示,當(dāng)協(xié)商的物流商在報(bào)價(jià)過(guò)程中都不參與學(xué)習(xí)時(shí),報(bào)價(jià)的滿意度是緩慢上升的,在t=109時(shí),總滿意度之和為2,即協(xié)商結(jié)束。當(dāng)參與學(xué)習(xí)時(shí),報(bào)價(jià)曲線在t=9時(shí),總滿意度之和為2,提高了報(bào)價(jià)協(xié)商的效率。因此,報(bào)價(jià)過(guò)程中的自學(xué)習(xí)可以有效地降低達(dá)成可以使得各方滿意的協(xié)同物流分配方案過(guò)程中的協(xié)商次數(shù)。同時(shí)從圖中的自學(xué)習(xí)總滿意度的變化曲線可以看出,總滿意度越接近2時(shí),協(xié)商的次數(shù)越多,這是由于主動(dòng)協(xié)商的物流商耐心增加,報(bào)價(jià)參數(shù)增加放緩,不同角色物流商協(xié)商次數(shù)增加。當(dāng)總滿意度開(kāi)始下降且未到達(dá)2時(shí),則變化主動(dòng)協(xié)商的預(yù)測(cè)參數(shù)和范圍并開(kāi)始新一輪的討價(jià)還價(jià)。
如果將該報(bào)價(jià)結(jié)果和Rubinstein討價(jià)還價(jià)模型的結(jié)果進(jìn)行比較,這里設(shè)定參與討價(jià)還價(jià)的物流商的貼現(xiàn)因子相同,均為0.8時(shí),其協(xié)商過(guò)程中總滿意度的變化曲線如圖5所示。
圖5 本文模型和Rubinstein模型的總滿意度比較
Rubinstein討價(jià)還價(jià)模型受主動(dòng)協(xié)商物流商的還價(jià)設(shè)定的影響較大,一旦主動(dòng)還價(jià)設(shè)定過(guò)高,使得主動(dòng)協(xié)商物流商過(guò)快轉(zhuǎn)換角色,則可能陷入不斷轉(zhuǎn)換角色而很難達(dá)成協(xié)商的循環(huán)中,如圖5的Rubinstein取不合適參數(shù)值的曲線所示,當(dāng)Rubinstein模型討價(jià)還價(jià)策略取不合適的參數(shù)值時(shí),在最大的協(xié)商次數(shù)范圍內(nèi)一直未能達(dá)成協(xié)商。而當(dāng)Rubinstein模型討價(jià)還價(jià)策略取合適的參數(shù)值時(shí),如圖5的Rubinstein取合適參數(shù)值的曲線所示,僅需要7次協(xié)商即可形成協(xié)商雙方滿意度都為1的利潤(rùn)分配方案,但在實(shí)際應(yīng)用中很難取到一個(gè)合適的還價(jià)值,還價(jià)值往往通過(guò)經(jīng)驗(yàn)判定,而采用本文模型時(shí),協(xié)商總滿意度到2的速度取決于貼現(xiàn)因子,Agent自動(dòng)探索對(duì)方底價(jià)和修正報(bào)價(jià)方案而無(wú)需人工經(jīng)驗(yàn)設(shè)定還價(jià)值,如圖5所示,共需要9次協(xié)商即可形成協(xié)商雙方滿意度都為1的利潤(rùn)分配方案,從而避免了經(jīng)驗(yàn)判定所帶來(lái)的協(xié)商的不確定性。
當(dāng)有多個(gè)物流商參與利潤(rùn)分配時(shí),根據(jù)圖1所示,在協(xié)調(diào)Agent發(fā)布初始利潤(rùn)分配后,物流商根據(jù)各自的底價(jià)自行判斷自己的協(xié)商角色,將第一個(gè)主動(dòng)物流商作為物流商A,將之后的所有物流商整體作為物流商B,應(yīng)用2.3節(jié)中的自學(xué)習(xí)過(guò)程進(jìn)行討價(jià)還價(jià),得出滿意結(jié)果后再對(duì)物流商B內(nèi)的物流商重復(fù)上述過(guò)程,這樣就將多個(gè)物流商討價(jià)還價(jià)的問(wèn)題轉(zhuǎn)換為2個(gè)物流商討價(jià)還價(jià)的問(wèn)題。
本文將協(xié)作物流商分為主動(dòng)協(xié)商物流商和被動(dòng)協(xié)商物流商,通過(guò)各物流商Agent對(duì)當(dāng)前協(xié)商Agent分配報(bào)價(jià)方案的滿意度確定自己的主動(dòng)或者被動(dòng)地位。主動(dòng)協(xié)商物流商通過(guò)探索被動(dòng)協(xié)商物流商的底價(jià)來(lái)提出自己的報(bào)價(jià)方案,被動(dòng)物流商通過(guò)探索主動(dòng)協(xié)商物流商的底價(jià)來(lái)對(duì)主動(dòng)物流商提出的報(bào)價(jià)方案給出反報(bào)價(jià)方案,通過(guò)協(xié)商次數(shù)和連續(xù)主動(dòng)協(xié)商的影響不斷地修正自己的報(bào)價(jià)參數(shù),從而提高協(xié)商效率,最終實(shí)現(xiàn)各方都滿意的協(xié)作利潤(rùn)分配。應(yīng)用實(shí)例結(jié)果證明其有效性。但本文并未考慮協(xié)商過(guò)程中的協(xié)商成本,且未考慮協(xié)商后發(fā)生違約時(shí),再次協(xié)商時(shí)應(yīng)予懲罰等情況,這些都是今后的研究重點(diǎn)。
[1] Singh C,Sarkar S,A ram A,et al.Cooperative Profit Sharing in Coalition-based Resource Allocation in Wireless Networks[J].IEEE/ACM Transactions on Networking,2012,20(1):69-83.
[2] 劉偉華,曲思源,鐘石泉.隨機(jī)環(huán)境下的三級(jí)物流服務(wù)供應(yīng)鏈任務(wù)分配[J].計(jì)算機(jī)集成制造系統(tǒng),2012,18(2):381-388.
[3] 齊 源,趙曉康,李玉敏.基于Shaply值及Gahp的供應(yīng)鏈知識(shí)共享收益分配研究[J].科技進(jìn)步與對(duì)策,2011,28(9):132-137.
[4] 孫多青,馬曉英.基于博弈論的多零售商參與下逆向供應(yīng)鏈定價(jià)策略及利潤(rùn)分配[J].計(jì)算機(jī)集成制造系統(tǒng),2012,18(4):867-874.
[5] 陳遠(yuǎn)高,劉 南.具有服務(wù)差異的雙渠道供應(yīng)鏈競(jìng)爭(zhēng)策略[J].計(jì)算機(jī)集成制造系統(tǒng),2010,16(11):568-575.
[6] 肖 劍,但 斌,張旭梅.雙渠道供應(yīng)鏈中制造商與零售商的服務(wù)合作定價(jià)策略[J].系統(tǒng)工程理論與實(shí)踐,2010,30(12):2203-2211.
[7] 胡盛強(qiáng),張畢西,劉繪珍,等.基于多方博弈的二級(jí)網(wǎng)狀供應(yīng)鏈合作及利潤(rùn)分配研究[J].系統(tǒng)科學(xué)學(xué)報(bào),2012,20(2):48-51.
[8] 李 勇,張 異,楊秀苔.供應(yīng)鏈中制造商供應(yīng)商合作研發(fā)博弈模型[J].系統(tǒng)工程學(xué)報(bào),2005,20(1):12-18.
[9] 姜能濤,古 貞.協(xié)同機(jī)制下供應(yīng)鏈?zhǔn)S嗬麧?rùn)合理分配的影響因素研究[J].物流工程與管理,2010,32(4):97-100.
[10] 韓建軍,郭耀煌.基于事前協(xié)商的動(dòng)態(tài)聯(lián)盟利潤(rùn)分配機(jī)制[J].西南交通大學(xué)學(xué)報(bào),2003,38(6):425-433.
[11] 周 揚(yáng),石巋然.制造商主導(dǎo)的供應(yīng)鏈合作及利潤(rùn)分配研究[J].科技管理研究,2012,31(5):136-140.
[12] 潘會(huì)平,陳榮秋.供應(yīng)鏈合作的利潤(rùn)分配機(jī)制研究[J].系統(tǒng)工程理論與實(shí)踐,2005,25(6):568-572.
[13] Bremer J,Sonnenschein M.Estimating Shapley Values for Fair Profit Distribution in Power Planning Smart Grid Coalitions[C]//Proceedings of International Conference on Multiagent System Technologies.Berlin,Germ any:Springer,2013:208-221.
[14] Pinto T,Morais H,Oliveira P,et al.A New Approach for Multi-agent Coalition Formation and Management in the Scope of Electricity Markets[J].Energy,2011,36(8):5004-5015.
[15] 蔣國(guó)瑞,龐 婷.基于多Agent供應(yīng)鏈協(xié)同的自適應(yīng)協(xié)商方法[J].計(jì)算機(jī)工程,2014,40(3):188-192.
編輯 劉冰
Collaborative Logistics Profit Distribution Model Based on Agent
TIAN Ran,HAN Min,LIBinyong
(School of Information Science and Technology,Southwest Jiaotong University,Chengdu 610031,China)
For the problem of uncertainty of negotiation caused by the parameters setting in the Rubinstein profit distribution model are mostly from the artificial experience,a self learning model of profit distribution is established for this problem.The model divides logistic providers to active collaborative logistics provider and passive collaborative logistics provider.Different types of collaborative logistics providers propose offer or counter offer by exploring the other logistics provider's base price,decide whether to change the role type by current offer results,changes the strategy of quotation in quotation process by self learning quotation parameters,and gets the satisfactory results for all parties. Simulation results show that this model can reduce the number of negotiation times,and can effectively avoid the negotiation uncertainty of experience judgment com pared with the Rubinstein profit distribution model.
transportation economy;profit distribution;pricing strategy;collaborative logistics;bargaining strategy
田 冉,韓 敏,李斌勇.基于Agent的協(xié)同物流利潤(rùn)分配模型[J].計(jì)算機(jī)工程,2015,41(9):286-291.
英文引用格式:Tian Ran,Han M in,Li Binyong.Collaborative Logistics Profit Distribution Model Based on Agent[J]. Computer Engineering,2015,41(9):286-291.
1000-3428(2015)09-0286-06
A
TP391
10.3969/j.issn.1000-3428.2015.09.053
國(guó)家“863”計(jì)劃基金資助項(xiàng)目“汽車及工程機(jī)械多產(chǎn)業(yè)鏈業(yè)務(wù)協(xié)同服務(wù)平臺(tái)研發(fā)”(2013AA 040606)。
田 冉(1981-),男,博士研究生,主研方向:智能計(jì)算,決策支持系統(tǒng);韓 敏,副研究員、博士;李斌勇,博士研究生。
2014-07-11
2014-08-06 E-m ail:troom@163.com