王徐瑤 鄒國(guó)昊 朱紅鑫
摘 要:隨著互聯(lián)網(wǎng)普及率的逐漸提高以及Web2.0時(shí)代網(wǎng)絡(luò)虛擬產(chǎn)品交易的興起,眾包已經(jīng)成為一種新型的電子商務(wù)模式,任務(wù)定價(jià)是眾包平臺(tái)服務(wù)的關(guān)鍵要素,優(yōu)良的定價(jià)可以大大減少調(diào)查成本。本文針對(duì)眾包平臺(tái)任務(wù)定價(jià)問(wèn)題,通過(guò)分析相關(guān)數(shù)據(jù),建立多元線性回歸方程,確定任務(wù)定價(jià)規(guī)律;采用SPSS軟件對(duì)數(shù)據(jù)進(jìn)行聚類(lèi),并利用MATLAB計(jì)算與擬合變量間的關(guān)系,建立邏輯回歸方程預(yù)測(cè)修改方案的任務(wù)完成情況,進(jìn)而定義任務(wù)完成度與平臺(tái)效益值探究任務(wù)定價(jià)的合理性。
關(guān)鍵詞:多元線性回歸;Logistic增長(zhǎng)函數(shù);SPSS聚類(lèi);眾包平臺(tái)
一、引言
互聯(lián)網(wǎng)行業(yè)的快速發(fā)展帶動(dòng)了Web2.0時(shí)代網(wǎng)絡(luò)虛擬產(chǎn)品交易的興起,“眾包”也已然成為了一種新型的電子商務(wù)模式,并占據(jù)著越來(lái)越重要的市場(chǎng)地位,任務(wù)定價(jià)是眾包平臺(tái)服務(wù)的關(guān)鍵要素,優(yōu)良的定價(jià)可以大大減少調(diào)查成本,有效的保證調(diào)查數(shù)據(jù)的真實(shí)性且縮短調(diào)查周期,但如果定價(jià)不合理,有的任務(wù)就會(huì)無(wú)人問(wèn)津,而導(dǎo)致商品檢查的失敗。任務(wù)定價(jià)與多方面的因素有關(guān),合理全面的考慮影響因素才能得到合理價(jià)格,才能促進(jìn)自助式勞務(wù)眾包平臺(tái)的發(fā)展。
“拍照賺錢(qián)”APP就是一種典型的眾包模式,用戶通過(guò)自主領(lǐng)取APP中的拍照任務(wù),獲取相應(yīng)的報(bào)酬,與此同時(shí),發(fā)布者也可以通過(guò)這種模式迅速高效地收集到所需數(shù)據(jù)。本文通過(guò)分析前期獲取的廣東四市八百多個(gè)任務(wù)的定價(jià)數(shù)據(jù),深入研究定價(jià)與地理位置的相關(guān)參數(shù)的關(guān)系,得到項(xiàng)目任務(wù)定價(jià)規(guī)律,綜合分析多方面因素與任務(wù)完成情況的關(guān)系,設(shè)計(jì)新的任務(wù)定價(jià)規(guī)律,并與原方案比較利弊。實(shí)際情況下,多個(gè)任務(wù)可能位置比較集中,用戶爭(zhēng)相選擇,一種考慮是將這些任務(wù)聯(lián)合打包,一起發(fā)布,類(lèi)似于滴滴打車(chē)的拼車(chē),可以有效完成任務(wù),且降低了調(diào)查成本。在這種考慮下,修改前面的定價(jià)模型,并分析任務(wù)完成的情況。最后,對(duì)打包發(fā)布的任務(wù)給出定價(jià)方案,并評(píng)價(jià)方案的實(shí)施效果。
二、研究模型的建立
1.數(shù)據(jù)收集
如上表顯示為收集的兩千多個(gè)新任務(wù)的數(shù)據(jù),通過(guò)GPS經(jīng)度和緯度可以詳細(xì)定位出每個(gè)任務(wù)的位置。
2.模型假設(shè)
(1)假設(shè)任務(wù)難易程度相同,所有會(huì)員可以完成;(2)假設(shè)會(huì)員在是否完成任務(wù)時(shí)僅考慮性價(jià)比因素;(3)位置因素只考慮距離遠(yuǎn)近,不考慮地形,交通等不同情形;(4)假設(shè)任務(wù)定價(jià)完全由定價(jià)規(guī)律決定,無(wú)人為或政治等其他方面因素。
3.模型的建立與求解
(1)數(shù)據(jù)分析。①模型的準(zhǔn)備數(shù)據(jù)的處理:基于數(shù)據(jù)量較大的基礎(chǔ)上,首先對(duì)經(jīng)緯度進(jìn)行聚類(lèi),其算法流程圖如下:
利用MATLAB軟件,分別以經(jīng)緯度為變量,從總數(shù)據(jù)數(shù)據(jù)中生成4個(gè)初始聚類(lèi)中心,最后迭代500次后給出最終聚類(lèi)中心。
首先,分析位置與定價(jià)的關(guān)系,繪制定價(jià)關(guān)于經(jīng)緯度的圖形,如圖2任務(wù)定價(jià)關(guān)于經(jīng)緯關(guān)系圖:
在地圖上搜查聚類(lèi)中心,可以發(fā)現(xiàn)聚類(lèi)中心為大型商業(yè)中心或市政府所在地,且把不同聚類(lèi)類(lèi)別的位置在地圖上顯示,主要分布在四個(gè)城市,分別為廣州市、深圳市、東莞市、佛山市。
結(jié)果的案例數(shù)地圖所在地基本符合廣東四市地理分布,少量數(shù)據(jù)不符合規(guī)律已剔除。明顯可得不同的地區(qū)任務(wù)數(shù)量差別很大,經(jīng)濟(jì)發(fā)達(dá)地區(qū)任務(wù)數(shù)量明顯高于經(jīng)濟(jì)次發(fā)達(dá)地區(qū)?,F(xiàn)對(duì)任務(wù)價(jià)格分析所處的不同地理位置的影響。用EXCEL表格根據(jù)所在地不同進(jìn)行分類(lèi),計(jì)算可得深圳市的平均任務(wù)價(jià)格為68.21元、廣州市79.35元、東莞市66.64元,佛山市65.39元.根據(jù)聚類(lèi)得廣州市與深圳市的任務(wù)數(shù)量與任務(wù)均價(jià)明顯高于東莞市與佛山市,這說(shuō)明地區(qū)經(jīng)濟(jì)發(fā)展情況與定價(jià)關(guān)系很大,且不同地區(qū)之間可能存在政府政策的影響。
②模型的建立:任務(wù)定價(jià)與多個(gè)因素有關(guān),為探究具體變量對(duì)任務(wù)定價(jià)的影響,采用多項(xiàng)式擬合模型:
對(duì)多項(xiàng)式擬合,采用控制變量的方法,例如研究固定范圍內(nèi)會(huì)員數(shù)對(duì)價(jià)格的影響,控制其他變量不變,單獨(dú)研究一個(gè)變量與浮動(dòng)價(jià)格的多項(xiàng)式關(guān)系。
(2)模型的求解。任務(wù)受多種因素的影響,控制變量,首先分析所在地理位置與任務(wù)定價(jià)呈現(xiàn)的規(guī)律如圖3:
得四個(gè)聚類(lèi)中心分別為四個(gè)城市的中心,且距離市中心越遠(yuǎn)價(jià)格越高,因?yàn)槭兄行慕煌ū憷?,?huì)員集中,且市中心任務(wù)集中,可一次完成批量任務(wù)。所以距離市中心距離的遠(yuǎn)近是影響任務(wù)定價(jià)的重要因素,呈從中心向周?chē)椛洮F(xiàn)象。不同城市間也存在影響,相鄰城市的共同影響區(qū)任務(wù)多,任務(wù)定價(jià)偏低。
現(xiàn)在具體討論幾個(gè)因素對(duì)任務(wù)價(jià)格的影響。首先所在地區(qū)經(jīng)濟(jì)對(duì)任務(wù)價(jià)格的基礎(chǔ)性作用。如地區(qū)任務(wù)基本定價(jià)圖4所示。
從圖中可得地區(qū)決定定價(jià)的基本價(jià)格,地區(qū)經(jīng)濟(jì)富裕,基礎(chǔ)價(jià)格高于其他地區(qū),且呈中心遞減趨勢(shì),符合實(shí)際的價(jià)格分布情況。
從圖中可得與市中心的距離對(duì)定價(jià)有浮動(dòng)價(jià)格影響,基本影響價(jià)格在5元-6元之間,且經(jīng)濟(jì)發(fā)達(dá)地區(qū)的浮動(dòng)價(jià)格影響更加明顯,距離市中心距離越遠(yuǎn)價(jià)格更高,但不是簡(jiǎn)單的線性關(guān)系,因?yàn)橛绊懸蛩赜薪煌ū憷?、?huì)員數(shù)量、會(huì)員距離等多方面因素。
可得任務(wù)周?chē)鷷?huì)員數(shù)與浮動(dòng)價(jià)格成負(fù)相關(guān),任務(wù)與會(huì)員距離成正相關(guān)。為避免圖形的波動(dòng)所以將任務(wù)周?chē)鷷?huì)員人數(shù)坐標(biāo)方向變化,形成任務(wù)與會(huì)員相對(duì)距離一致效果。首先規(guī)定會(huì)員執(zhí)行任務(wù)的距離,規(guī)定會(huì)員會(huì)預(yù)約的任務(wù)在自己一小時(shí)車(chē)程內(nèi),統(tǒng)一規(guī)定為50千米,相對(duì)距離為到任務(wù)與50千米的比值,最后研究會(huì)員數(shù)量與會(huì)員和任務(wù)距離的函數(shù)關(guān)系。
圖5中采取三種擬合方法,計(jì)算周?chē)鷷?huì)員數(shù)與浮動(dòng)價(jià)格的影響,分別為線性擬合、多項(xiàng)式擬合、樣條插值擬合。樣條插值擬合符合數(shù)據(jù)點(diǎn)變化,但沒(méi)有具體函數(shù)表達(dá)式,多項(xiàng)式與線性擬合都有函數(shù)關(guān)系式。線性擬合的相關(guān)系數(shù)為0.98,擬合度良好。
由任務(wù)距周?chē)鷷?huì)員距離關(guān)系可得,近似成線性關(guān)系,用線性擬合得函數(shù)關(guān)系式:
綜合以上所有因素的影響的共同作用,探究因素非線性疊加對(duì)任務(wù)定價(jià)的影響,與原任務(wù)定價(jià)的吻合度。
由圖可知,實(shí)際價(jià)格為零刻度線,模擬價(jià)格為波動(dòng)在實(shí)際價(jià)格上下的紅色圓圈。可見(jiàn),殘差值在-1.5-1.5之間,殘差范圍下,所以可知本題模型解法與平臺(tái)原任務(wù)定價(jià)吻合度非常好。
①模型的修正:通過(guò)對(duì)原模型的分析發(fā)現(xiàn),原方案僅考慮地理位置的相關(guān)參數(shù),從忽略了會(huì)員的信譽(yù)值與預(yù)約時(shí)間,任務(wù)本身的時(shí)間限制等因素,說(shuō)明定價(jià)策略非常不合理,所以綜合考慮這些因素,設(shè)計(jì)定價(jià)方案。在定價(jià)方案制定過(guò)程中需要促進(jìn)任務(wù)完成與提高平臺(tái)收益。
劉曉鋼在研究眾包中任務(wù)發(fā)布者出價(jià)行為的影響因素中,分析相似任務(wù)出價(jià)的出價(jià)、任務(wù)難度、任務(wù)期限、相鄰會(huì)員數(shù)量,任務(wù)位置等方面綜合考慮定價(jià)問(wèn)題。楊志國(guó)在申請(qǐng)專(zhuān)利多任務(wù)環(huán)境下眾包平臺(tái)定價(jià)方法提到眾包任務(wù)發(fā)布者制定任務(wù)發(fā)布策略、眾包平臺(tái)迭代更新其價(jià)格策略。陳家銀在豬八戒眾包平臺(tái)數(shù)據(jù)分析余眾包模式設(shè)計(jì)指出接包計(jì)件模式最受參與者歡迎,并且計(jì)件模式的任務(wù)價(jià)格都與參與人數(shù)有著較強(qiáng)的正向性關(guān)系。
綜合以上學(xué)者研究成果,我們建立多元線性回歸方程,主要考慮城市經(jīng)濟(jì)基礎(chǔ),距離市中心距離,任務(wù)點(diǎn)距會(huì)員距離,預(yù)定任務(wù)開(kāi)始時(shí)間,信譽(yù)值五個(gè)主要因素與任務(wù)定價(jià)之間的關(guān)系。
②新模型的建立:建立多元線性回歸模型,所得數(shù)據(jù)提供了預(yù)定任務(wù)開(kāi)始時(shí)間,信譽(yù)值這兩組數(shù)據(jù)。城市經(jīng)濟(jì)基礎(chǔ)由城市總GDP與人均GDP決定,距離市中心與任務(wù)點(diǎn)距會(huì)員距離可通過(guò)計(jì)算可得。
正態(tài)性:即隨機(jī)擾動(dòng)項(xiàng)服從正態(tài)分布
③新模型的求解:在原方案中我們已經(jīng)考慮了部分因素對(duì)任務(wù)定價(jià)的影響,現(xiàn)增加預(yù)定任務(wù)限額、預(yù)定任務(wù)開(kāi)始時(shí)間與信譽(yù)值三個(gè)因素,并修改原方案中因素對(duì)任務(wù)定價(jià)的影響關(guān)系。
信譽(yù)值主要體現(xiàn)在預(yù)定任務(wù)限額與預(yù)定開(kāi)始時(shí)間上,故忽略信譽(yù)值的影響。分析可知任務(wù)預(yù)定時(shí)間隨浮動(dòng)價(jià)格呈二次函數(shù)關(guān)系,在預(yù)定時(shí)間的中值處浮動(dòng)價(jià)格最高,對(duì)于任務(wù)預(yù)定限額則是預(yù)定限額越高價(jià)格越高,因?yàn)樾抛u(yù)值高,服務(wù)優(yōu)質(zhì)、可靠。
進(jìn)行兩個(gè)變量對(duì)因變量的影響分析與擬合,如圖7,任務(wù)周?chē)鷷?huì)員數(shù)量、距離市中心距離與定價(jià)的三維散點(diǎn)圖并進(jìn)行關(guān)系擬合。以東莞市為例。
以東莞市數(shù)據(jù)為例,任務(wù)周?chē)鷷?huì)員數(shù)量、距離市中心距離對(duì)任務(wù)定價(jià)的影響,擬合結(jié)果理想,在兩個(gè)自變量下定價(jià)大致符合平面方程規(guī)律。依次思想,擬合其他因素對(duì)任務(wù)定價(jià)的影響,最終可以得出五個(gè)因素關(guān)于定價(jià)的關(guān)系如下所示:
該方程關(guān)系式可得,驗(yàn)證方程的可行性,首先對(duì)所有位置點(diǎn)重新計(jì)算價(jià)格。
新的任務(wù)定價(jià)與原方案比較,個(gè)別數(shù)據(jù)具有偶然性,所以統(tǒng)一考慮總體數(shù)據(jù)的修改性。對(duì)數(shù)據(jù)進(jìn)行分類(lèi),分為任務(wù)執(zhí)行與任務(wù)未執(zhí)行。
對(duì)比可知,任務(wù)被執(zhí)行的定價(jià)平均值修改后低于修改前,再保證任務(wù)執(zhí)行的前提下,說(shuō)明成本花費(fèi)減小,新的定價(jià)方案合理。任務(wù)未被執(zhí)行的平均值修改后高于修改前,提高價(jià)格吸引會(huì)員完成任務(wù),提升任務(wù)完成率。在提高任務(wù)完成的情況下,部分任務(wù)增價(jià),部分任務(wù)減價(jià),總的平臺(tái)花費(fèi)下降,提高了平臺(tái)效益值。
④結(jié)果及解釋?zhuān)航⒍嘣€性方程,擬合計(jì)算得到新的任務(wù)定價(jià)。對(duì)比新的任務(wù)定價(jià)與原任務(wù)定價(jià)對(duì)比。分為任務(wù)完成與任務(wù)未完成兩個(gè)種類(lèi),兩種任務(wù)下,未被完成的價(jià)格提高,完成的價(jià)格降低。修改后定價(jià)方案可以提高任務(wù)完成率,并降低任務(wù)成本,新方案合理。
3.模型的優(yōu)化
在實(shí)際情況下,可能存在任務(wù)集中情況,一次執(zhí)行多個(gè)距離較近的任務(wù)節(jié)省時(shí)間提高收入,所以用戶會(huì)爭(zhēng)相選擇,所以統(tǒng)一將這些任務(wù)打包發(fā)布。我們研究打包可能和多個(gè)因素有關(guān),比如距離,任務(wù)難易程度,任務(wù)性質(zhì)等其他因素,根據(jù)所給數(shù)據(jù),主要考慮任務(wù)點(diǎn)間距離因素。聚類(lèi)后,任務(wù)數(shù)大幅減小,但部分任務(wù)任務(wù)量增大,所以需重新定價(jià),給出新的定價(jià)規(guī)律。因?yàn)槿蝿?wù)的重新分配,所以還需預(yù)測(cè)任務(wù)完成情況。
(1)優(yōu)化模型的建立。建立修改多元線性方程,增加任務(wù)量自變量與修改原距離自變量關(guān)系式
首先根據(jù)距離對(duì)任務(wù)重新劃分,綜合考慮打包后任務(wù)量變化,執(zhí)行任務(wù)的距離變化重新計(jì)算函數(shù)關(guān)系式的系數(shù),從而得到新的定價(jià)規(guī)律。使用元胞向量機(jī)模型分類(lèi),與直接用距離分類(lèi)相互印證、輔證。
元胞自動(dòng)機(jī)由元胞空間、元胞狀態(tài)、鄰居及進(jìn)化規(guī)則四個(gè)基本要素組成。在數(shù)學(xué)上,可以用一個(gè)四元組表示:
式中A為元胞自動(dòng)機(jī),Zd為d維歐氏元胞空間,S是有限狀態(tài)集合,可表示為:
Si代表元胞自動(dòng)機(jī)的第i個(gè)狀態(tài);而N則是中心元胞的鄰域,表示為:
其中Xi為相鄰元胞對(duì)于中心元胞的位置;f為
(2)優(yōu)化模型的求解
先在每個(gè)任務(wù)點(diǎn)處以固定的半徑畫(huà)圓,分析所有任務(wù)點(diǎn)的空間距離關(guān)系。
由圖中可得,東莞市任務(wù)距離較廣東市任務(wù)距離分布稀疏,不夠密集,但也存在許多三四個(gè)任務(wù)點(diǎn)聚集現(xiàn)象,對(duì)這些任務(wù)點(diǎn)分布較密的采用打包現(xiàn)象。
采用上述方法,對(duì)八百多個(gè)任務(wù)點(diǎn)進(jìn)行打包。具體結(jié)果為分為314個(gè)打包任務(wù),打包內(nèi)任務(wù)數(shù)基本為1-5個(gè),距離相距較近,利于任務(wù)執(zhí)行。打包內(nèi)任務(wù)數(shù)集中在1-5個(gè),任務(wù)數(shù)不多,任務(wù)量可以個(gè)人完成。在重新定價(jià)與打包數(shù)變化的基礎(chǔ)上,現(xiàn)進(jìn)行平臺(tái)效益值分析,其如下圖9所示:
打包任務(wù)數(shù)不能過(guò)多過(guò)少,這樣都會(huì)使平臺(tái)效益下降。平均定價(jià)如果太高,會(huì)員競(jìng)相選擇,但平臺(tái)花費(fèi)增大;定價(jià)過(guò)低,會(huì)員無(wú)人執(zhí)行,平臺(tái)收益效果也不好。本文修改模型,首先合理的對(duì)距離進(jìn)行分類(lèi),分類(lèi)效果良好。然后在考慮任務(wù)執(zhí)行情況與平臺(tái)收益的基礎(chǔ)上,給出定價(jià)規(guī)律,最終定價(jià)方案,促進(jìn)了任務(wù)執(zhí)行情況。分析結(jié)果如圖10所示:
圖中可得在平臺(tái)投入資金相同時(shí),打包后任務(wù)完成度明顯高于打包前,打包后單個(gè)任務(wù)定價(jià)普遍低于打包前,但性價(jià)比明顯提高,多個(gè)任務(wù)可一次完成,提高收入。
(3)優(yōu)化模型的結(jié)果及解釋
打包后的定價(jià)規(guī)律與原方案比較得,既提高了任務(wù)完成度也提升了平臺(tái)效益值,花費(fèi)更少,完成度更高。打包后的定價(jià)規(guī)律與原修改的定價(jià)規(guī)律相比,任務(wù)完成度相差不大,但平臺(tái)效益值提升,即花費(fèi)更少完成相同的任務(wù)。
參考文獻(xiàn):
[1]劉曉鋼.眾包中任務(wù)發(fā)布者出價(jià)行為的影響因素研究[D].重慶大學(xué),2012.6.
[2]陳家銀,豬八戒眾包平臺(tái)數(shù)據(jù)分析與眾包模式設(shè)計(jì)[D].大連理工大學(xué),2012.5.3.
[3]司守奎,孫兆亮.數(shù)學(xué)建模算法與應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2015.
作者簡(jiǎn)介:王徐瑤,女,江蘇興化人,江蘇師范大學(xué);鄒國(guó)昊,男,江蘇南京人,江蘇師范大學(xué);朱紅鑫,男,江蘇徐州人,江蘇師范大學(xué)