劉馳
摘要:通過對激勵機制的討論,認為激勵機制是群智感知中最重要的研究內(nèi)容之一,在保證參與者數(shù)量和提高感知數(shù)據(jù)準確性、覆蓋率和及時性上起著不可忽視的重要作用。激勵機制與群智感知中其他主要研究問題密切關(guān)聯(lián),如參與者選擇、能耗優(yōu)化、所收集數(shù)據(jù)質(zhì)量優(yōu)化等,所以此方面近來從實驗到理論方案的研究,都是為了提供更綜合、全面的激勵步驟和保障各方利益。同時,還指出了激勵機制在未來面臨的一些挑戰(zhàn)和機遇。
關(guān)鍵詞: 群智感知;激勵機制;實驗研究;未來展望
智能設備(包括智能手機、平板電腦等)不僅可以作為移動設備進行日常通信,而且還因為其本身所含的嵌入式傳感器,如加速傳感器、數(shù)字羅盤、陀螺儀、全球定位系統(tǒng)(GPS)、麥克風、攝像頭等,而將其作為強大的感知單元。利用這些傳感器使招募普通人來收集和共享感知數(shù)據(jù)變成了可能,“群智感知”便是基于這一新興應用發(fā)展而來的一個新研究領(lǐng)域[1]。通過使用上述的嵌入式傳感器,普通人作為“參與者”從周圍環(huán)境中收集多維度的數(shù)據(jù)并且用現(xiàn)存的通信基礎設施分享這些數(shù)據(jù)[2]。群智感知已經(jīng)在諸如醫(yī)療保健、社交網(wǎng)絡、安全設施、環(huán)境檢測和公共交通等不同應用領(lǐng)域中顯示出它巨大的潛力。比如,Yang等人提出了基于群智感知系統(tǒng)的室內(nèi)定位方案,任意參與者可以把他們的位置信息上傳給服務器,然后那些和他們在同一地點的參與者可以下載這些定位信息進而完成定位[3]。Massung等人使用群智感知系統(tǒng)[4]來支持社區(qū)環(huán)保行動,他們使用自己開發(fā)的應用來讓參與者承擔輕量級的環(huán)境數(shù)據(jù)收集任務。Mason等人設計了一個系統(tǒng)允許野生探索的參與者上傳老虎的照片和GPS信息,以用來追蹤野生老虎的蹤跡[5]。
群智感知的一般流程如圖1所示,包括3部分:任務發(fā)布者、感知平臺和參與者。當任務發(fā)布者需要一些感知數(shù)據(jù),他會把相應的任務要求以及收集數(shù)據(jù)的預算發(fā)送給感知平臺,這些要求包括感知數(shù)據(jù)的精度、粒度、時間和數(shù)量等;接著感知平臺根據(jù)實際需要招募參與者去收集數(shù)據(jù)并且根據(jù)一定的方案給參與者回報;之后參與者把數(shù)據(jù)傳給感知平臺,感知平臺最后把數(shù)據(jù)傳給任務發(fā)布者。
激勵機制作為系統(tǒng)的一個主要方面,也被廣泛應用于其他領(lǐng)域。如,Wang等人在自治網(wǎng)絡中提出了動態(tài)的激勵機制[6];Zhao等人使用激勵協(xié)議去鼓勵末端節(jié)點協(xié)作以使P2P網(wǎng)絡能提供穩(wěn)定強大的服務[7];Huang等人為點對點移動網(wǎng)絡中的單個人提供激勵去鼓勵相互協(xié)作[8]。
把報酬獎勵引入群智感知系統(tǒng),有以下兩方面的原因:
(1)參與者參與感知任務可能會產(chǎn)生費用花銷,以及移動設備的電量消耗等,報酬獎勵可以用來抵消并且鼓勵參與者忽略這些成本,進而貢獻數(shù)據(jù)。
(2)不同于那些可以利用匯聚節(jié)點完全控制所有節(jié)點的傳統(tǒng)傳感器網(wǎng)絡,移動智能設備更私有化,它完全由其所有者控制,什么時候收集數(shù)據(jù)、持續(xù)收集的時間都由智能設備的所有者決定。所以獎勵可以用來或多或少地影響所有者的這些決定,繼而幫助提高收集數(shù)據(jù)的整體質(zhì)量。
Wang等人也說過如果沒有合適的激勵機制,那么由私人提供給大眾的信息總是不能達到最令人滿意的狀態(tài)[6]。在群智感知系統(tǒng)中,我們面臨兩個挑戰(zhàn)[9]:如何去招募并且留住更多的參與者;如何去估計他們的貢獻。第1個挑戰(zhàn)可以站在參與者的角度去理解,只有在參與者的需求、目的和他們所關(guān)注的內(nèi)容完全被理解之后,激勵才能發(fā)揮它的作用和效果。也就是說,我們應該如何提供利益、安全和公平的參與機會以維持足夠的參與者。第2個挑戰(zhàn)需要站在任務發(fā)布者和平臺的角度去看待,因為不同的任務需要不盡相同的感知持續(xù)時間和數(shù)據(jù)質(zhì)量[10],所以如何利用最小的回報去得到更高質(zhì)量的數(shù)據(jù)是一個挑戰(zhàn)。
文章回顧并討論了激勵機制實驗的相關(guān)學術(shù)成果,然后展望了其研究發(fā)展方向。
1群智感知中的激勵實驗
文獻[11]—[13]研究了不同激勵策略對參與者人數(shù)和感知平臺所收集到數(shù)據(jù)的數(shù)量所產(chǎn)生影響,是最具代表性的3篇文章。表1總結(jié)了這3篇文章的實驗信息和結(jié)果。
1.1 實驗參數(shù)
少量現(xiàn)金回報策略[11]是在真實世界測試激勵表現(xiàn)的首步工作之一。研究人在美國的一所大學召集了55名年輕參與者進行了5周的實驗。研究人要求參與者在校園里拍垃圾桶中垃圾的照片以查看這所校園的垃圾回收情況。任務完成后參與者通過亞馬遜土耳其機器人(MTurk)領(lǐng)取少量現(xiàn)金回報。實驗通過參與者上傳照片數(shù)量的多少衡量他所做的貢獻。
噪聲地圖這個實驗召集了49名參與者進行了5周的實驗[12]。參與者用麥克風收集他所在區(qū)域的噪聲水平并和他的運動軌跡一同上傳到感知平臺。不同于文獻[11]中使用現(xiàn)金激勵,研究人使用虛擬積分作為對參與者的回報。實驗通過參與者所錄聲音片段的時長來衡量他所做出的貢獻。
文獻[13]中的研究人召集了85名參與者進行了近11周的實驗。值得注意的是:不同于文獻[11]、[12]中的實驗,這個實驗中的參與者來自于不同的社會階層,他們的年齡和文化背景也不相同。實驗要求使用參與者手機的麥克風、攝像頭和GPS傳感器。和文獻[11]一樣,文獻[13]中的實驗使用現(xiàn)金作為參與者的回報。實驗把參與者上傳照片的數(shù)量和所錄聲音片段的時長通過計算的數(shù)值來衡量他所做的貢獻。
1.2 激勵策略
盡管這3篇文獻中所提出并使用的激勵策略不同,但是他們都使用比較試驗的方法顯示激勵策略的影響。
文獻[11]使用的是少量現(xiàn)金回報方式,研究人把所有參與者隨機分成A、B、C、D、E 5組。A組的參與者不管他們貢獻了多少數(shù)據(jù),都會得到固定數(shù)量的現(xiàn)金回報;B、C和D組的參與者會依據(jù)他們的實際貢獻獲得回報,但是各個組中每張照片回報的金額不同,B組金額最少,C組中等,D組給的金額最多,E組根據(jù)參與者的排名給他們回報。
文獻[13]中的所有參與者被分成兩組,第一組為獎金支付組(BPG),它會根據(jù)參與者的排名給予相應的額外獎勵,這類似于文獻[3]中的E組;第2組為數(shù)據(jù)競爭組(DCG)類似于文獻[11]中的A組。但是不同于文獻[3],E組中競爭失敗的參與者會沒有任何回報,BPG組中競爭失敗的參與者依然會有“底”回報。
在文獻[12]中,研究人用兩種不同的方案去吸引參與者,即“內(nèi)部激勵”和“外部激勵”。內(nèi)部激勵方案為參與者提供的回報是用虛擬積分換取的虛擬成就,而外部激勵為參與者提供的回報是用虛擬積分作為比較因素換取的名次。在文章中我們把外部激勵組稱作競爭組,而內(nèi)部激勵組稱作非競爭組。
總的來說,這3組實驗主要的區(qū)別是:文獻[3]提供的“按數(shù)據(jù)份數(shù)計量”的現(xiàn)金激勵;文獻[12]提供的是“按數(shù)據(jù)份數(shù)計量”的虛擬積分激勵;文獻[5]提供的是有保底回報的大量現(xiàn)金激勵。他們的基本特點是都使用比較策略,即用競爭策略去和非競爭策略作一系列的比較以研究激勵的性能表現(xiàn)。
1.3 實驗結(jié)果評估
如表1所示,文獻[11]中A—E組日平均數(shù)據(jù)貢獻分別是3、5.57、6.7、4和13.5張照片。A—D組中每天的日貢獻量沒有太大變化。但值得注意的是:E組的日貢獻量變化幅度很大,在開始的幾周里參與者貢獻量增長迅速,但是最后幾周貢獻量幾乎跌到0點。文獻[12]中競爭組和非競爭組的結(jié)果非常明顯,分別是每天平均0.13 h的聲音片段和0.24 h的聲音片段。文獻[13]的結(jié)果顯示BPG組的日平均貢獻是1.16張照片和0.32 h的聲音片段,DCG組日平均貢獻是0.83張照片和0.25 h的聲音片段。我們接下來根據(jù)他們的結(jié)果縱向比較并得出如下結(jié)論:
(1)關(guān)于參與者的貢獻。文獻[11]和[13]的結(jié)果好于文獻[12],也就是說現(xiàn)金回報要比虛擬積分回報更能吸引參與者貢獻數(shù)據(jù)。
(2)依據(jù)參與者的實際貢獻支付回報比給參與者固定回報的方式能獲得更多的數(shù)據(jù)。比如,按數(shù)據(jù)份數(shù)計量激勵策略要好于不按份數(shù)計量策略。這個現(xiàn)象已經(jīng)在文獻[11]和[13]中得到了證實,文獻[13]中對參與者支付了更多的回報但是收到了更少的數(shù)據(jù)。
(3)具有競爭性質(zhì)的激勵機制比沒有競爭性質(zhì)的激勵機制更有效率。但是文獻[11]中的E組和文獻[13]中的BPG組有不同的結(jié)果:E組的參與者雖然在開始時貢獻多,但是許多參與者逐漸退出實驗,但是BPG組的參與者雖然貢獻的數(shù)量不如E組,但是仍然可以看作是相當可觀的貢獻量。這種結(jié)果是由使用的機制造成的。不同于E組,BPG組競爭失敗的參與者仍然可以得到保底的回報。所以對競爭失敗甚至沒有貢獻的參與者,給予他們合適的回報有助于未來他們繼續(xù)參與感知任務。
(4)E組中B、C、D組有一個有趣的事實,隨著每張照片所得回報的價錢增多,感知平臺可以接受到的數(shù)據(jù)數(shù)量并沒有增多。D組參與者每張照片可得到的回報最多,但是他們卻貢獻的照片數(shù)量最少。我們相信這是由實驗的設置造成的,由于參與者不允許從一個組調(diào)換到另一個組,而且沒有新的參與者加入進來,這就造成了組內(nèi)沒有競爭,所以才有這樣的結(jié)果。
(5)以上3個文獻中所涉及的實驗沒有一個使用了復雜的激勵策略,也沒有需要較長時間的參與者協(xié)商階段。
2 群智感知中激勵機制的
展望
群智感知領(lǐng)域未來所面臨的關(guān)鍵挑戰(zhàn)和機遇有以下5個方面。
2.1 將任務發(fā)布者和平臺分離
任務發(fā)布者和平臺是兩個獨立的經(jīng)濟實體,應該區(qū)別對待。一個任務發(fā)布者可能會在就近的不同平臺上發(fā)布任務,而這些平臺可能會基于不同的數(shù)據(jù)需求(比如所需數(shù)據(jù)的新舊、粒度的粗細等)招募不同的參與者。根據(jù)這些不同的需求,任務發(fā)布者需要支付數(shù)量不等的費用,用來優(yōu)化參與者的整體收入。
通過引入不同的平臺,他們之間的競爭將成為另一個研究方向。一方面,不同平臺通過競爭,從不同任務發(fā)布者中接受感知任務。這樣以來,對于每個平臺在數(shù)據(jù)質(zhì)量的要求下最小化感知成本就成為了一個需要優(yōu)化問題,此外當平臺提供不同質(zhì)量的感知結(jié)果時,如何精確地預算成本也是一個新的挑戰(zhàn);另一方面,不同平臺將會通過競爭招募和維持一定數(shù)量的參與者?,F(xiàn)有的激勵策略假設平臺占據(jù)著主要位置,而地位低的參與者則被要求降低他們的報價來獲得參與感知的權(quán)利。通過在平臺間引入競爭,每個平臺在高價格招募更多參與者和低價格增加自己的利潤這兩者間進行權(quán)衡,進而不得不重新分配他們提供給參與者的報價。這樣,不僅參與者的利益得到了更好的保障,而且會吸引更多的任務發(fā)布者。
2.2 將歷史感知數(shù)據(jù)應用到新任務中
平臺可以將收集到的歷史數(shù)據(jù)賣給其他的平臺和任務發(fā)布者,因為不同任務可能在空間和時間上有所重疊,唯一區(qū)別是不同任務要求的數(shù)據(jù)質(zhì)量不同。根據(jù)這個特點,一種使參與者和平臺都能得到獎勵的激勵方案將被提出,進而演化成如何優(yōu)化雙方的利益這個研究問題。雖然歷史數(shù)據(jù)可以應用到新任務,但是問題依然存在,比如平臺如何權(quán)衡歷史數(shù)據(jù)的應用和參與者招募這兩者的關(guān)系。使用較少的歷史數(shù)據(jù)而招募更多的參與者可能會使平臺的利潤減少,但是使用較多的歷史數(shù)據(jù)而招募更少的參與者可能會使參與者數(shù)量流失。所以,需要一個能使這兩方面長期保持平衡的動態(tài)方案。
2.3 有關(guān)節(jié)能方面的考慮
現(xiàn)有的一些激勵機制沒有明確調(diào)查參與者智能設備的電量水平,他們模擬的參與成本都是基于智能設備同樣電量水平、同樣滿電量和同樣帶寬使用率基礎上。其實,參與過程中的不便因素是群智感知系統(tǒng)的主要問題。據(jù)我們最近進行的一項在線問卷調(diào)查顯示:參與者移動設備的剩余電量和設備充電時間是左右參與者執(zhí)行感知任務意愿的兩個主要因素,而這兩個因素正影響他們的激勵期望。這種新的優(yōu)化目標催生了一個新的激勵機制,即根據(jù)參與者設備的剩余電量、設備使用度和運動軌跡來分配給參與者合適的獎勵以達到最大化各方利益的目的。
2.4 基于信譽度值的激勵機制
如圖2所示,信譽機制和激勵機制之間有著明顯的聯(lián)系。當參與者向平臺上傳感知數(shù)據(jù)之后,平臺會估計并量化這份數(shù)據(jù)的質(zhì)量,之后平臺會根據(jù)質(zhì)量值計算參與者的信譽度值并決定相應的激勵分配。參與者的信譽度值會影響到他今后的獎勵。例如,如果一個參與者經(jīng)常提供高質(zhì)量的數(shù)據(jù),那么他的信譽度值就會比其他人高。較高的信譽度值能為參與者換來額外的獎勵以激勵他今后多提供高質(zhì)量的數(shù)據(jù)。
2.5 競價閾值的合理設定
基于競拍方式的激勵機制的一個缺點是:平臺不得不接收所有競價或者用所有感知數(shù)據(jù)去計算得出數(shù)據(jù)質(zhì)量的合格閾值,進而決定去接受哪些數(shù)據(jù)。這樣參與者就需要等待較長的時間才能知道平臺的決定和獎勵。雖然這種方法似乎能在一定預算的前提下得到高質(zhì)量的數(shù)據(jù),但是參與者只能一直等待,如果競價失敗,參與者將得不到任何回報,這種方法并不利于維持參與者數(shù)量。Zhang和Zhao等人把這種方法叫做“線下競價”,同時他們都提出了另外一種“線上競價”的方法[14-15]。但是,這種方法仍然有它的缺點:他們在開始時就設定了價格門檻,或者根據(jù)第一批參與者的競價和數(shù)據(jù)質(zhì)量來決定價格門檻。由于在開始平臺沒有設定準確的競價或者數(shù)據(jù)質(zhì)量閾值,這就導致了第一批參與者或超出或低于他們應得的獎勵。這樣會浪費平臺的利潤或者降低感知數(shù)據(jù)的真實準確性。所以如何決定開始的競價閾值需要更深層次的研究。
3 結(jié)束語
激勵機制是群智感知系統(tǒng)中不可缺少的環(huán)節(jié)。文章先對最具代表性的3篇實驗類文章做了比較,內(nèi)容包括它們的實驗人數(shù)、持續(xù)時間的設定,使用的激勵策略以及實驗結(jié)果;然后對其進行了總結(jié);最后我們提出了對未來激勵機制的一些展望。
參考文獻
[1] LANE N D, et al. A Survey of Mobile Phone Sensing [J] IEEE Communications Magazine, 2010, 48(9): 140-150
[2] KANHERE S S. Participatory Sensing: Crowdsourcing Data from Mobile Smartphones in Urban Spaces[C]// Proceedings of IEEE MDM 2011, Lule, Sweden, 2011: 3-6
[3] YANG S, DESSAI P, VERMA M, and GERLA M. FreeLoc: Calibrationfree Crowdsourced Indoor Localization[C]// Proceedings of IEEE INFOCOM 2013, San Francisco, CA, USA, 2013: 2481-2489
[4] MASSUNG E, COYLE D, CATER K F, JAY M, and PRESIT C. Using Crowdsourcing to Support Pro-Environmental Community Activism[C]// in Proceedings of ACM SIGCHI 2013, Paris, France, 2013: 371-380
[5] MASON A D, MICHALAKIDIS G, and KRAUSE P J. Tiger Nation: Empowering Citizen Scientists[C]// in Proceedings of IEEE DEST 2012, Campione d'Italia, Italy, 2012: 1-5
[6] WANG Y, NAKAO A, and VASILAKOS A V. Heterogeneity Playing Key Role: Modeling and Analyzing the Dynamics of Incentive Mechanisms in Autonomous Networks [J]. ACM TAAS, 2012, 7(3): 31
[7] HUANG E, CROWCROFT J, and WASSELL I. Rethinking Incentives for Mobile ad hoc Networks[C]// in Proceedings of ACM SIGCOMM Workshop Practice Theory Incentives Network System 2004, 2004:191-196
[8] DOAN A, RAMAKRISHNAN R, and HALEVY A Y. Crowdsourcing Systems on the World-Wide Web [J]. Communications of the ACM, 2011, 54 (4): 86-96.doi: 10.1145/1924421.1924442
[9] AFLAKI S, MERATNIA N, BARATCHI M, and HAVINGA P J. Evaluation of Incentives for Body Area Network-Based Healthcare Systems[C]// in Proceedings of IEEE ISSNIP 2013, pp. 515-520
[10] SCEKIC O, TRUONG H L, and DUSTDAR S. Programming Incentives in Information Systems[C]//Advanced Information Systems Engineering, Springer Berlin Heidelberg, 2013: 688-703
[11] REDDY S, ESTRIN D, HANSEN M, and SRIVASTAVA M. Examining Micropayments for Participatory Sensing Data Collections[C]// in Proceedings of ACM UbiComp, 2010, pp. 33-36
[12] SCHWEIZER I, MEURISCH C, GEDEON J, BARTL R., and MUHLHAUSER M, Noisemap: Multi-Tier Incentive Mechanisms for Participative Urban Sensing[C]// in Proceedings of ACM PhoneSense 2012, Toronto, Canada, 2012: 9:1-9:5
[13] CHON Y, LANE N D, KIM Y, ZHAO F, and CHA H. A Large-Scale Study of Mobile Crowdsourcing with Smartphones for Urban Sensing Applications[C]//in Proceedings of ACM UbiComp 2013, Zurich, Switzerland, 2013: 1-10
[14] ZHANG X, et al. Free Market of Crowdsourcing: Incentive Mechanism Design for Mobile Sensing [J]. IEEE Transactions Parallel Distributed System, 2014, 25(12): 3190-3200
[15] ZHAO D, LI X.-Y, and MA H. How to Crowdsource Tasks Truthfully without Sacrificing Utility: Online Incentive Mechanisms with Budget Constraint[C]// in Proceedings of IEEE INFOCOM 2014, Toronto, Canada, 2014: 1213-1221