王依凡,葉宏達,邱子杰,王志勇
(1.電子科技大學(xué) 計算機科學(xué)與工程學(xué)院,四川 成都 611731;2.電子科技大學(xué) 信息與通信工程學(xué)院,四川 成都 611731;3.電子科技大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,四川 成都 611731)
隨著 “互聯(lián)網(wǎng)+”時代的到來,多家公司基于移動互聯(lián)網(wǎng)建立自助式勞務(wù)眾包平臺,“拍照賺錢”是其中一種自助式大眾外包服務(wù)模式。用戶注冊成為APP會員后,在APP上領(lǐng)取需要拍照的任務(wù),從而賺取任務(wù)所標定的酬金。這種新型的眾包任務(wù)平臺運營模式,擴大了資源范圍,提高了原本的工作效率,形成以大眾網(wǎng)絡(luò)為核心的獨特競爭力的運行系統(tǒng)[1-2]。而在眾包的任務(wù)設(shè)計過程中,如何保證任務(wù)的有效完成以及激勵用戶繼續(xù)接單任務(wù)的意愿度,成了一個重要的問題。通常,眾包平臺會采用提升任務(wù)價格或是將幾個任務(wù)打包成一個任務(wù)的方式來刺激接單。而在研究目前的眾包價格規(guī)律中,大多數(shù)采用了多元線性回歸的方法來分析價格規(guī)律[3-5],或采用Logistic回歸模型結(jié)合線性回歸分析價格規(guī)律[6]。
本文根據(jù) “閑俠拍立賺”眾包平臺的數(shù)據(jù),綜合考慮了區(qū)域的經(jīng)濟水平、人民生活水平和時間成本、人均任務(wù)數(shù)等因素,研究眾包任務(wù)的定價規(guī)律。在設(shè)定新的定價方案時,進一步考慮了眾包平臺的收益,建立以任務(wù)定價為決策變量,以眾包平臺利潤的限度為約束條件,以任務(wù)完成率最大化的單目標優(yōu)化模型進行求解,并通過任務(wù)完成率和用戶信譽度的提升率對新舊方案進行比較;再進一步考慮實際情況下,眾包平臺將位置比較集中的任務(wù)聯(lián)合一起打包發(fā)布,利用用戶的價格效用感知價值規(guī)律對原模型進行修正;最后利用蒙特卡洛算法模擬了新方案的實施效果。
為研究目前眾包平臺的任務(wù)定價規(guī)律,本文根據(jù) “閑俠拍立賺”眾包平臺的數(shù)據(jù),包括任務(wù)經(jīng)緯度坐標、任務(wù)標價和任務(wù)完成情況,以及會員的經(jīng)緯度坐標、會員預(yù)定任務(wù)限額和會員信譽值等信息,在MATLAB中繪制已完成任務(wù)和未完成任務(wù)的熱力分布圖,如圖1所示。
圖1中圓圈表示已完成任務(wù),叉表示未完成任務(wù)。根據(jù)該已完成任務(wù)和未完成任務(wù)的熱力分布圖可知,兩者的分布具有較強的空間區(qū)域特性,因此可采用K-Means聚類算法和網(wǎng)格法對經(jīng)緯度進行區(qū)域劃分。為了較好地概括反映空間區(qū)域特性,同時具體反映各區(qū)域的情況,以0.02°為步長,分別對經(jīng)緯度進行劃分,將經(jīng)度在112.6°E~114.6°E, 緯度在22.4°N ~24.4°N 的區(qū)域劃分成100×100的網(wǎng)格,其中緯度每改變0.01°N,實地距離約改變1.849 1 km;經(jīng)度每改變0.01°E,實地距離約改變1.855 3 km[7]。
圖1 已完成任務(wù)和未完成任務(wù)的熱力分布圖
根據(jù)經(jīng)濟學(xué)規(guī)律,研究任務(wù)定價規(guī)律,一方面可通過任務(wù)所在經(jīng)緯度位置的會員密度與任務(wù)之間的供需比進行分析;另一方面,任務(wù)的自身難度可能對任務(wù)的定價產(chǎn)生影響,可通過該任務(wù)與相同會員密度任務(wù)的定價均值進行比較,確定任務(wù)自身的難度系數(shù),對任務(wù)定價規(guī)律進行修正。
對經(jīng)緯度劃分的每個網(wǎng)格進行編號,可統(tǒng)計每個網(wǎng)格內(nèi)的任務(wù)總數(shù),記為λDi(i=1,2,3,…,10 000)。同時考慮到,眾包會員的活動范圍有一定的限制,因此假設(shè)每個眾包會員存在接受任務(wù)的意愿距離為R。以每個任務(wù)為圓心,意愿距離R為半徑畫出可行圓,經(jīng)緯度范圍在可行圓中的會員數(shù)即為可完成此任務(wù)的意愿會員數(shù)。根據(jù)螞蟻眾包、阿里眾包和美團眾包等眾包平臺公司的使用數(shù)據(jù),眾包會員的意愿距離R范圍大約在3.5~4.0 km,參考網(wǎng)格法劃分的網(wǎng)格實際距離,對任務(wù)所在網(wǎng)格四周所在的九宮格內(nèi)的眾包會員總數(shù)進行統(tǒng)計,周圍眾包會員總數(shù)記為Si。定義區(qū)域i的會員密度為:
利用MATLAB中的Curve Fitting Tool曲線擬合工具箱對任務(wù)j的定價pj與任務(wù)的周圍會員密度ρi進行函數(shù)擬合,除去數(shù)據(jù)中異常值后,對擬合后函數(shù)與實際定價進行殘差計算,求解出殘差最小的函數(shù)形式,進而得到任務(wù)定價p與任務(wù)的周圍會員密度ρ的具體函數(shù)表達式p=f(ρ)。
針對擬合后的函數(shù)與實際任務(wù)定價p之間存在較大差異的個別點,這些點所對應(yīng)任務(wù)的實際定價與相同會員密度的任務(wù)定價存在明顯差異,可假設(shè)相同會員密度的任務(wù)定價呈正態(tài)分布,通過3σ原則篩選出奇異點(σ為標準差)。
對于定價超過均值上下3σ范圍內(nèi)的任務(wù),可能是任務(wù)本身難度系數(shù)存在差異[7],因此定價出現(xiàn)偏差,可通過引入任務(wù)難度系數(shù)η對定價p的函數(shù)表達式進行修正。
針對篩選出的奇異點所對應(yīng)的任務(wù),定義其難度系數(shù)為:
式中,ηj為任務(wù)j的難度系數(shù),j為任務(wù)j的實際定價,pj為任務(wù)j根據(jù)式p=f(ρ)的理論函數(shù)值。對定價p的函數(shù)表達式通過難度系數(shù)η進行修正,修正式為:
考慮到任務(wù)完成程度的分布具有顯著的地域性特點,因此可通過K-Means聚類算法根據(jù)任務(wù)完成率對經(jīng)緯度進行聚類。設(shè)一組經(jīng)緯度數(shù)據(jù)為{(lo1,la1),(lo2,la2),(lo3,la3),…,(lon,lan)},其中l(wèi)o為經(jīng)度,la為緯度,n為完成任務(wù)的總數(shù),同時根據(jù)熱力圖給出聚類中心的經(jīng)緯度初值{(co1,ca1), (co2,ca2), (co3,ca3),…,(co4,ca4)},利用K-Means聚類算法,以每個任務(wù)的經(jīng)緯度數(shù)據(jù)與離它最近的聚類中心的歐式距離平方和最小為優(yōu)化目標函數(shù)[8],目標函數(shù)定義如下:
根據(jù)上述K-Means聚類算法將區(qū)域劃分為4個片區(qū),記為Q1,Q2,Q3和Q4。根據(jù)上述模型分析可知,影響任務(wù)完成率的因素主要有人均任務(wù)數(shù)、任務(wù)定價、人均預(yù)定任務(wù)限額以及地域?qū)傩缘?其中人均任務(wù)數(shù)、任務(wù)定價、人均配額決定了眾包軟件平臺的人均利潤,第i個聚類區(qū)域的人均利潤計算公式為:
而眾包平臺會員在選擇任務(wù)的過程中不僅受到人均利潤的影響,還與當(dāng)?shù)氐慕?jīng)濟水平有關(guān),在經(jīng)濟較發(fā)達的地區(qū),生活成本與時間成本相對較高,相同的利潤對會員接受任務(wù)的吸引程度較弱;在經(jīng)濟欠發(fā)達的地區(qū),生活成本與時間成本相對較低,相同的利潤對會員接受任務(wù)的吸引程度較顯著。
對于地區(qū)的生活成本與時間成本通過人均工資[9]進行衡量,可進一步定義指標接受任務(wù)意愿度為:
式中,ti為第i個聚類區(qū)域的接受任務(wù)意愿度,si為第i個聚類區(qū)域的人均工資。
利用SPSS對各聚類區(qū)域的任務(wù)平均完成率與綜合指標意愿度之間的線性關(guān)系進行檢驗,任務(wù)平均完成率定義為:
式中,uj為第i個聚類區(qū)域的任務(wù)平均完成率,uij為經(jīng)緯度在第i個聚類區(qū)域的第j個任務(wù)的完成情況,ni為第i個聚類區(qū)域的任務(wù)總數(shù)。
通過MATLAB的cftool工具,求解出任務(wù)定價p與周圍會員密度ρ的擬合關(guān)系表達式為:
在對求解結(jié)果的誤差分析中,發(fā)現(xiàn)擬合函數(shù)關(guān)系得到的定價理論值與任務(wù)實際定價存在個別奇異點,根據(jù)2.1節(jié)中對難度系數(shù)的修正,修正后的定價規(guī)律p′表達式為:
式中,ρ為周圍會員密度,η為難度系數(shù)。
對于修正后的定價規(guī)律,對所有網(wǎng)格的任務(wù)進行相對誤差的計算,求得的相對誤差平均值為0.935 4%,相對誤差平均值較小,說明擬合結(jié)果較好。
同時根據(jù)修正后的定價規(guī)律分析易知,定價規(guī)律主要與周圍會員密度以及任務(wù)的難度系數(shù)有關(guān),周圍會員密度越大,定價的價格越低,說明周圍眾包任務(wù)會員數(shù)量越能滿足任務(wù)的需要,出現(xiàn)供過于求的情況。另一方面,難度系數(shù)越高,價格越高,說明難度越大的任務(wù),越需要通過價格提高來鼓勵會員接受任務(wù)。
利用SPSS對各聚類區(qū)域的任務(wù)平均完成率u與綜合指標意愿度t之間的線性關(guān)系進行檢驗,得到表達式(且擬合精度的平均值約為85.70%)為:
針對上述聚類得到的區(qū)域參數(shù)與完成度如表1所示。
表1 區(qū)域完成度與相關(guān)因素表
分析完成率的函數(shù)表達式與表1可知,如對于區(qū)域完成度較低的深圳地區(qū),人均工資越高,完成率越小,說明在時間成本與生活成本較高的地區(qū),相同的任務(wù)定價對用戶的吸引程度下降,用戶的接受任務(wù)意愿度下降。
在對任務(wù)定價的過程中,除了考慮到任務(wù)定價對眾包平臺用戶任務(wù)完成度的影響,還需考慮眾包APP自身的可持續(xù)發(fā)展問題,可通過眾包平臺的利潤進行衡量。
假設(shè)對于每個已完成任務(wù),眾包平臺以原價的β倍作為利潤進行定價,則對第i個區(qū)域眾包平臺的總營業(yè)額為:
式中,ni為第i個區(qū)域任務(wù)總數(shù),β為每個任務(wù)的利潤比例,pi為第i個區(qū)域的任務(wù)定價。
對第i個區(qū)域眾包平臺的總損失額為:
式中,ui為第i個區(qū)域任務(wù)完成率,pi為第i個區(qū)域的任務(wù)定價,p′i為第i個區(qū)域未完成任務(wù)的定價,p0i為第i個區(qū)域的初始任務(wù)定價。第一項表示由于任務(wù)未完成造成的損失金額,第二項表示由于價格變動對任務(wù)完成率改變造成的損失。
故對第i個區(qū)域眾包平臺的利潤值的計算為:
在制定任務(wù)定價的新設(shè)計方案時,眾包平臺通常以任務(wù)完成率為主要目標,而在一定限度內(nèi)適度降低自己的利潤,設(shè)定眾包平臺降低利潤的最大限度為原利潤的80%,可建立以任務(wù)定價為決策變量,以眾包平臺利潤的限度和任務(wù)定價的范圍為約束條件,以任務(wù)完成率ui為目標建立優(yōu)化模型,模型如下所示:
式中,ti、φi和φ0i分別為第i個區(qū)域的接受任務(wù)意愿度、眾包平臺的利潤值和原利潤值。
考慮任務(wù)難度系數(shù),根據(jù)上述模型求解出的各區(qū)域的任務(wù)定價均值,對于每個任務(wù),即經(jīng)度為loj,緯度為laj的任務(wù)j,在新的定價設(shè)計方案下的pj值為:
首先考慮對位置較集中的任務(wù)進行打包,基于模型一中以經(jīng)緯度0.02°為步長劃分的網(wǎng)格,統(tǒng)計每個網(wǎng)格的任務(wù)數(shù)量,并對所有網(wǎng)格任務(wù)數(shù)量求均值,即:
考慮在經(jīng)度方向約1.855 3 km,緯度方向約1.849 1 km的網(wǎng)格內(nèi),任務(wù)之間的相對位置較集中,對網(wǎng)格內(nèi)的任務(wù)進行聯(lián)合打包發(fā)布,故打包個數(shù)x為向下取整,即x=|ˉ|。
根據(jù)文獻[10-11]可知,基于市場經(jīng)濟學(xué)理論,銷售單價與商品包裝的相對數(shù)量之間存在一定函數(shù)關(guān)系,可得眾包平臺問題中,相對單個任務(wù)的定價與打包內(nèi)任務(wù)的個數(shù)之間的函數(shù)關(guān)系為:
式中,y為相對單個任務(wù)的定價,x為打包任務(wù)的個數(shù)。
根據(jù)文獻[12]可知,對于眾包平臺用戶,眾包平臺為了擴大市場份額,提高用戶接受任務(wù)的積極性,銷售單價相對較低,而用戶的效用感知價值也會產(chǎn)生變化,用戶的效用感知價值定義為:
式中,p為任務(wù)打包前定價,y為相對單個任務(wù)的價格。
在任務(wù)完成率的求解過程中,可通過用戶的效用感知價值 p′對完成率的計算公式進行修正,即:
式中,n、m、w和s分別表示在網(wǎng)格所屬的聚類區(qū)域的任務(wù)人數(shù)、會員人數(shù)和人均工資。
將修正后的用戶效用感知價值代入眾包平臺利潤值φi的計算中,應(yīng)用在目標優(yōu)化模型式(10)中,可求解得出打包情況下的定價方案。
通過3.2節(jié)中的目標優(yōu)化模型求解出新方案的任務(wù)定價,將新定價方案與原方案進行對比,對比結(jié)果如表2所示。
表2 各區(qū)域新舊定價方案的任務(wù)完成率的變化
通過MATLAB的cftool工具擬合得到眾包平臺用戶的信譽值λ與人均預(yù)定任務(wù)限額ˉri的函數(shù)關(guān)系為:
經(jīng)SPSS檢驗可得,式(14)中人均預(yù)定任務(wù)限額可表示為:
式中,ni、mi和pi分別為第i個區(qū)域任務(wù)總數(shù),用戶總數(shù)和任務(wù)定價均值。通過式(16)可預(yù)測新定價方案下眾包平臺會員信譽度的變化,如表3所示。
表3 原定價方案與設(shè)計定價方案的效果對比
由表3可得,新定價方案與原定價方案相比,大多數(shù)地區(qū)任務(wù)完成率和會員信譽度有所提高,說明對于眾包平臺的客戶而言,任務(wù)完成率提高有助于提高眾包平臺的客戶數(shù)量;對于眾包平臺的用戶會員而言,會員信譽度的提高有助于會員對眾包平臺的忠誠度增加與接單積極性的提高。
通過蒙特卡洛法模擬區(qū)域任務(wù)完成度,得到原定價方案與設(shè)計定價方案的完成度熱力分布對比圖如圖2和圖3所示(其中圓圈表示已完成任務(wù),畫叉表示未完成任務(wù))。
圖2 原方案任務(wù)完成度
圖3 新方案任務(wù)完成度
由圖2和圖3對比可以看出,根據(jù)本文考慮打包情況下對任務(wù)完成率進行優(yōu)化的定價方案,與原方案相比,任務(wù)完成度整體提高,特別是對于圖中左上角所對應(yīng)的廣州和右下方的深圳地區(qū),原本畫叉區(qū)域較大,說明原方案下未完成率較高,在本設(shè)計定價方案下,圓圈圖樣較密集,說明完成率極大提高。
本文通過網(wǎng)格法和K-Means聚類算法對眾包平臺的數(shù)據(jù)進行處理,分析得出眾包任務(wù)的定價規(guī)律,既保留了原始數(shù)據(jù)的區(qū)域特征,又在一定程度上降維簡化計算過程?;趩文繕藘?yōu)化模型求解得到新的定價方案,從眾包任務(wù)完成率、眾包平臺自身利潤和平臺用戶信譽度多個角度對新舊定價方案效果進行量化評價。借用經(jīng)濟學(xué)中用戶感知價值概念對打包情況下的定價方案進行修正,通過蒙特卡洛法模擬出新方案的實施效果。
在實際情況下,眾包任務(wù)的打包是一個動態(tài)過程,定價方案會隨著打包情況改變,本文僅對此進行靜態(tài)分析,此問題有待后續(xù)探究解決。