張超寧, 張 瑩, 徐應(yīng)濤
(浙江師范大學(xué) 數(shù)理與信息工程學(xué)院,浙江 金華 321004)
隨著電子商務(wù)的迅速發(fā)展,傳統(tǒng)消費(fèi)模式發(fā)生了巨大變化,C2C的消費(fèi)模式已經(jīng)逐步取代傳統(tǒng)的實(shí)體經(jīng)濟(jì)消費(fèi)模式,電子商務(wù)是目前最具有發(fā)展前景的商業(yè)模式.在線交易憑借便利、自由等優(yōu)勢,吸引了大批的消費(fèi)者.然而,不同于傳統(tǒng)消費(fèi)模式,C2C電子商務(wù)消費(fèi)模式的交易雙方需要在在線信譽(yù)評估數(shù)據(jù)結(jié)果和期望的信譽(yù)值之間作出衡量,最終決定是否繼續(xù)交易或者放棄交易.
因此,信譽(yù)評價(jià)對在線交易的成功起到了關(guān)鍵性的作用.到目前為止,針對基于C2C平臺(tái)的信譽(yù)評價(jià)模型,眾多學(xué)者進(jìn)行了一系列研究與完善.文獻(xiàn)[1]通過對現(xiàn)有信譽(yù)評價(jià)模型的分析,概述了當(dāng)前信譽(yù)計(jì)算的主要方法,同時(shí)提出了信托和信譽(yù)系統(tǒng);文獻(xiàn)[2]考慮到在線業(yè)務(wù)互動(dòng)的不確定性,通過對定性和定量指標(biāo)的全面計(jì)算處理,結(jié)合層次分析和集對分析給出了信譽(yù)評估;文獻(xiàn)[3]著重于信譽(yù)模型的風(fēng)險(xiǎn)分析,認(rèn)為個(gè)別交易參與者會(huì)利用先前累積的高信譽(yù)值進(jìn)行欺詐行為,為了阻止這些不良行為的發(fā)生,提出了在信譽(yù)計(jì)算模型中引入“移動(dòng)時(shí)間窗口”的概念,利用2個(gè)時(shí)間窗口分別計(jì)算交易參與者的平均信譽(yù)值和當(dāng)前信譽(yù)值;文獻(xiàn)[4]考慮了交易雙方在相互評分過程中會(huì)存在一定情感誤差,增加了E-Spores模型中對交易價(jià)值的考慮,有效避免了一些投機(jī)用戶通過銷售低價(jià)產(chǎn)品獲得累積的高信譽(yù)值,進(jìn)而進(jìn)行高價(jià)交易的詐騙牟利行為.
在眾多相關(guān)文獻(xiàn)中,研究者大多側(cè)重對信譽(yù)系統(tǒng)的定性分析[5],在一定程度上忽略了對信譽(yù)系統(tǒng)的定量分析.
針對目前信譽(yù)評價(jià)的不完整性,本文著力于信譽(yù)系統(tǒng)的定量分析,綜合考慮交易者在交易過程中的信譽(yù)投入,并對系統(tǒng)模型進(jìn)行擾動(dòng)分析,通過引入全變差函數(shù),提出基于離散時(shí)間最優(yōu)控制的系統(tǒng)信譽(yù)評價(jià)模型,保證系統(tǒng)信譽(yù)的穩(wěn)定性;最后,進(jìn)一步分析交易雙方各自的信譽(yù)比重,提高信譽(yù)系統(tǒng)的可信度.
(1)
式(1)中:k代表離散時(shí)間點(diǎn);M為終端時(shí)間點(diǎn);k=0,1,…,M-1;αi∈R,βi∈R(i=1,2)是既給的常數(shù).
(2)
在交易過程中,可能會(huì)出現(xiàn)交易一方通過惡意操作產(chǎn)生虛假的高信譽(yù)值,對另一方隱含極大的交易風(fēng)險(xiǎn).簡而言之,在目標(biāo)函數(shù)中,系統(tǒng)信譽(yù)為達(dá)既定期望,可能會(huì)產(chǎn)生極大脈沖能量.為了阻止此類風(fēng)險(xiǎn)的發(fā)生,引入最大信譽(yù)增幅約束:
(3)
式(3)中,δ(k)代表k時(shí)刻系統(tǒng)的增幅上限.通過數(shù)據(jù)分析可知,當(dāng)0≤δ(k)≤0.5時(shí),被認(rèn)為滿足穩(wěn)定性條件,本文取δ(k)=0.2.
綜合以上分析,可以構(gòu)建基于離散時(shí)間最優(yōu)控制的在線信譽(yù)評價(jià)模型.
對于最優(yōu)控制系統(tǒng)(1),求解最優(yōu)信譽(yù)投入策略u*使之滿足約束條件(3),并且使性能指標(biāo)(2)達(dá)到最優(yōu).
由于最優(yōu)控制系統(tǒng)(1)中全變差項(xiàng)是非光滑的絕對值函數(shù)之和,現(xiàn)有優(yōu)化方法無法直接求取最優(yōu)解,所以下面將對此模型進(jìn)行理論分析與求解.
為了求解上述既給模型,首先考慮以下離散時(shí)間動(dòng)態(tài)模型:
x(k+1)=f(k,x(k),u(k)),k=0,1,…,M-1,x(0)=x0.
(4)
首先令U={v=(v1,v2,…,vr)∈Rr;αi≤vi≤βi,i=1,2,…,r},U是Rr上的緊凸子集.記u=(u(0)T,u(1)T,…,u(M-1)T)T,其中u(k)∈U,k=0,1,…,M-1,稱這樣的u為容許控制變量,由所有這樣的u組成的集合為容許控制變量集,記為U.在不引起歧義的情況下,將容許控制變量簡稱為控制變量.若序列{x(k|u),k=0,1,…,M-1}滿足系統(tǒng)方程(4),則稱x(k|u)為對應(yīng)于控制u∈U的系統(tǒng)的解.
定義1令ui(k)代表在時(shí)間k下的第i個(gè)控制變量分量,ui(k)的變量差表示為
同時(shí),定義u(k)的全變差公式為
(5)
注2由式(5)全變差表達(dá)式的定義知,若u為固定常量,則式(5)的值始終不發(fā)生改變,說明全變差為0;若控制變量u未固定,則式(5)的值會(huì)發(fā)生改變,且改變量越大,說明全變差越大;反之,相反.
下面假設(shè)該系統(tǒng)滿足以下終端狀態(tài)約束:
φj(x(M|u))=0,j=1,2,…,Ne.
(6)
式(6)中:φj(x(M|u))∈Rn(j=1,2,…,Ne,Ne為等式約束個(gè)數(shù),1≤Ne≤N)是給定的實(shí)值函數(shù),且同時(shí)考慮關(guān)于狀態(tài)和控制變量的all-time-step不等約束
hj(k,x(k|u),u(k))≤0,k=0,1,…,M-1,j=Ne+1,Ne+2,…,N.
(7)
式(7)中,hj(j=Ne+1,Ne+2,…,N)是已知的Lipschitz可微實(shí)值函數(shù).
定義2所有滿足約束條件(6)和(7)的控制變量u∈U記作F,稱F為可行控制集,稱F上的變量為可行控制變量.
下面給出約束條件控制下的離散時(shí)間最優(yōu)控制問題:
問題1選擇可行控制u∈U?F,滿足
(8)
式(8)中:α≥0表示一個(gè)加權(quán)常量;Φ0:Rn→R是一給定的實(shí)值函數(shù);f(k,5,5)在Rn×Rr上是連續(xù)可微的,k=0,1,…,M-1.
由于J1中的全變差項(xiàng)是通過一系列非光滑的絕對值函數(shù)構(gòu)成,所以無法使用現(xiàn)有的標(biāo)準(zhǔn)梯度優(yōu)化算法解決.下面將通過一種新型的轉(zhuǎn)化方式,將非光滑問題1轉(zhuǎn)化為等價(jià)的光滑問題.
首先,構(gòu)建如下控制變量轉(zhuǎn)換函數(shù):
代入原系統(tǒng)方程(4),可得新的系統(tǒng)方程
y(k+1)=f(k,y(k),ψk(ξ)),
(9)
則?ξ∈R(2M-1)r,式(9)有相對應(yīng)的解y(5|ξ),除此之外,有以下約束:
Φj(y(M|ξ))=0,j=1,2,…,Ne;
(10)
hj(k,y(k|ξ),ψk(ξ))≤0,k=0,1,…,M-1,j=Ne+1,Ne+2,…,N.
(11)
令X={ξ∈Z|Φj(y(M|ξ))=0,j=1,2…,Ne;hj(k,y(k|ξ),ψk(ξ))≤0,j=Ne+1,Ne+2,…,N,k=0,1,…,M-1},可得新的最優(yōu)控制問題2:
問題2對于系統(tǒng)方程(9),尋找一個(gè)ξ∈X,滿足
同時(shí)滿足約束條件(10)和(11).
定理1假設(shè)u*=(u(0)*,u(1)*,…,u(M-1)*)T∈F是問題1的最優(yōu)解,則ξ*是問題2的最優(yōu)解,其中ξ*=(u(M-1)*,ν0,*,ν1,*,…,νM-2,*,ω0,*,ω1,*,…,ωM-2,*).
(12)
綜合引理2和定理1可知,問題1的最優(yōu)解是問題2的最優(yōu)解;反之亦然.有以下推論:
推論1問題1與問題2等價(jià).
由于問題2的目標(biāo)函數(shù)是光滑的,所以相對于問題1更易取得最優(yōu)解.基于推論1,若要對問題1進(jìn)行最優(yōu)分析,則只需對問題2進(jìn)行求解.針對于問題2,其受限于終端狀態(tài)約束及all-time-step不等約束,為了方便梯度的計(jì)算,下面對問題2作近似轉(zhuǎn)換.
對?j=Ne+1,Ne+2,…,N,問題2的不等約束等價(jià)為
(13)
考慮到式(13)是非光滑的,故構(gòu)建如下約束條件的光滑形式[7]:
(14)
顯然,它是光滑的.
問題2′ 尋找一個(gè)ξ∈Xε,使得
引理3若ξε是問題2′的可行控制變量,則ξε也是問題2的可行控制變量.
證明 易證.故略.
(15)
(16)
(17)
推導(dǎo)整理式(15)可得
(18)
(19)
根據(jù)引理3和定理2,問題2′可看作是問題2的近似問題.當(dāng)?ε≥0且ε→0 時(shí),問題2′的解就是問題2的解.下面考慮利用罰函數(shù)法對問題2′優(yōu)化求解.對任意ε>0,θ>0,引入罰函數(shù)構(gòu)造問題2′的增廣目標(biāo)函數(shù)
Jε,θ=J2(ξ)+θgj,ε(ξ).
(20)
式(20)中,θ>0代表懲罰因子.
針對上述問題,具體算法如下:
C-E算法:
給定初始數(shù)據(jù):θ>0,L>1,k=1和εk>0;ξ=(γ,ν0,ν1,…,νM-2,ω0,ω1,…,ωM-2).
步驟1:利用梯度算法求解Jε,θ的解,記作x*.
步驟2:將x*代入式(20)檢驗(yàn)是否滿足約束條件.若滿足,則移到步驟3;否則令θ=Lθ,重回步驟1.
步驟3:若εk在既給的邊界內(nèi),則停止計(jì)算;否則,令εk+1=εk/L,k=k+1,重回步驟1.
最終,通過C-E算法可得非線性規(guī)劃問題的最優(yōu)解.
本文提出的信譽(yù)評價(jià)模型符合問題1的形式,根據(jù)理論分析,可采用相應(yīng)的算法求解.下面所給算例均在MATLAB R2013b環(huán)境中,通過結(jié)合C-E算法和DMISER3軟件進(jìn)行計(jì)算分析.
為了提高系統(tǒng)的準(zhǔn)確性,考慮淘寶網(wǎng)上大流量店鋪的信譽(yù)評價(jià),本文以“Sleepy Bunny瞌睡兔”這一商家為例,整理分析其2012—2015年信譽(yù)變化趨勢,利用線性回歸方法,得出了以下系統(tǒng)方程:
k時(shí)刻交易完成后賣家和買家的信譽(yù)函數(shù)如下:
為了防止某些商家為了提高信譽(yù)值進(jìn)行的惡意操作,將最大信譽(yù)增幅上限設(shè)置為δ(k)=0.20,進(jìn)而將交易雙方的信譽(yù)值代入,得到以下信譽(yù)增幅約束條件:
為了擴(kuò)大約束可行性,通過對大量數(shù)據(jù)分析,引入擾動(dòng)因子Δ=0.05,得到最終約束
其中,k=0,1,…,M-1.利用本文提出的方法,可得到關(guān)于交易雙方信譽(yù)值變化曲線及最優(yōu)執(zhí)行策略,如圖1和圖2所示.
賣家信譽(yù)函數(shù);買家信譽(yù)函數(shù)
圖1 交易雙方信譽(yù)值變化曲線
圖2 交易雙方信譽(yù)投入變化曲線
取M=30,通過C-E算法,當(dāng)α=0.01時(shí)得到系統(tǒng)最優(yōu)值g0=6.075 294.通過計(jì)算及圖形分析,表明本文提出的信譽(yù)評價(jià)模型能有效抵抗信譽(yù)風(fēng)險(xiǎn),動(dòng)態(tài)體現(xiàn)雙方信譽(yù)變化.