施笑畏, 黃瑤佳, 胡鴻韜, 宓為建, 牛延華
(1.上海海事大學(xué) 物流工程學(xué)院,上海 201306; 2.德馬格起重機(jī)械(上海)有限公司,上海 201199)
隨著互聯(lián)網(wǎng)通信技術(shù)的迅速發(fā)展、電子商務(wù)規(guī)模的急劇膨脹以及近年來物流業(yè)的蓬勃發(fā)展,網(wǎng)上購物給顧客帶來前所未有的便利,顧客足不出戶就可分享到數(shù)以千計的商品和服務(wù)信息,并從中選擇自己喜愛的商品或服務(wù).但同時隨著商品經(jīng)濟(jì)的繁榮,網(wǎng)絡(luò)提供給客戶的選擇急劇增長,電子商務(wù)帶來的便利性也被信息過載這個新困擾逐漸消耗.
個性化內(nèi)容推薦系統(tǒng)是一個解決信息過載并為用戶推薦個性化內(nèi)容的高效系統(tǒng),它根據(jù)用戶需求及其相關(guān)瀏覽行為等進(jìn)行分析,將用戶感興趣的內(nèi)容推薦給用戶,其核心和關(guān)鍵技術(shù)在于用戶興趣模型的建立.
從目前的研究成果來看,用戶的需求可以表現(xiàn)為顯性需求[1]和隱性需求[2].顯性需求主要依賴用戶對其興趣的準(zhǔn)確表達(dá),而隱性需求主要是通過分析挖掘用戶屬性(如年齡、收入、文化水平、職業(yè)等)、人機(jī)交互行為的歷史數(shù)據(jù)[3]及相關(guān)眼動特征[4]獲得的.要想準(zhǔn)確表達(dá)用戶興趣模型就必須同時考慮顯性需求和隱性需求.另一方面由于網(wǎng)絡(luò)海量信息的影響[5],用戶的喜好會隨時間和外界的影響發(fā)生變化.為挖掘用戶的興趣,提高用戶興趣模型的精度和效率以及用戶網(wǎng)上購物的滿意度,首先利用客戶體驗管理(Customer Experience Management,CEM)分析影響用戶網(wǎng)上購物的因素,然后運(yùn)用馬爾科夫鏈分析用戶的網(wǎng)上購物行為數(shù)據(jù),并結(jié)合眼動數(shù)據(jù),最終挖掘出主要影響因素以及各自所占的權(quán)重,為網(wǎng)上商家提供建設(shè)性意見并為用戶的個性化興趣建模提供相關(guān)理論依據(jù).
比較購物是細(xì)分出來的網(wǎng)上購物領(lǐng)域中的一個專業(yè)搜索引擎.比較購物網(wǎng)站的搜索結(jié)果比通用搜索引擎獲得的信息更加集中、全面.好的比較購物網(wǎng)站往往能及時且完整地抓取商品信息,使網(wǎng)絡(luò)用戶對市場上某類商品的價格變化、用戶評論、店鋪信用等一目了然.
目前,中國的比較購物環(huán)境尚未成熟,比較多的形式是“網(wǎng)上購物導(dǎo)航+網(wǎng)上購物社區(qū)”,購物搜索僅僅集成于此類網(wǎng)站中,暫可稱這種模式是國內(nèi)比較購物的雛形.現(xiàn)階段比較購物主要體現(xiàn)在社區(qū)評價,以網(wǎng)上店鋪與用戶的社區(qū)互動為主.一些用戶的體驗、產(chǎn)品測評也多數(shù)發(fā)布在社區(qū).一些網(wǎng)站雖然可以進(jìn)行初步的商品對比,但模式機(jī)械、程序繁瑣、推薦效果不理想,導(dǎo)致網(wǎng)站效率低下,成交額受到嚴(yán)重影響.要抓住顧客,就必須研究影響用戶決策的主要因素,使推薦信息具有針對性,以簡化用戶決策流程,提高效率,因此迫切需要對影響用戶網(wǎng)上購物決策的主要因素進(jìn)行研究,這對網(wǎng)上商家來說更是刻不容緩.根據(jù)網(wǎng)絡(luò)提供的信息,僅淘寶店鋪而言,上海2009年就有288 600家之多[6],但正常營業(yè)的只有三分之一,大部分中小型網(wǎng)上商家人氣不足、銷量低迷.研究網(wǎng)上購物決策的主要影響因素,給網(wǎng)上商家提供理論依據(jù)及建設(shè)性意見,對網(wǎng)上商家乃至電子商務(wù)行業(yè)意義重大.
在事件的發(fā)展過程中,若每次狀態(tài)的轉(zhuǎn)移都僅與前一時刻的狀態(tài)有關(guān),而與過去的狀態(tài)無關(guān),或者說狀態(tài)轉(zhuǎn)移過程是無后效性的,則稱這種狀態(tài)轉(zhuǎn)移過程為馬爾科夫過程.購物網(wǎng)站打開后,客戶就開始網(wǎng)上購物行為:眼睛掃視頁面、注視產(chǎn)品圖片、滾動頁面、鼠標(biāo)光標(biāo)移動和點擊等.這些行為沒有規(guī)律可循,相互之間也沒有太多的聯(lián)系,完全是隨用戶個體的興趣、需求、習(xí)慣等而改變,所以得到的數(shù)據(jù)都是動態(tài)的,且前后狀況之間都沒有關(guān)系,符合運(yùn)用馬爾科夫鏈分析的數(shù)據(jù)的特點.
本文用馬爾科夫鏈分析用戶的網(wǎng)上購物行為數(shù)據(jù),得到用戶各網(wǎng)上購物行為所占比例,研究的基本框架見圖1.首先通過CEM得到用戶的清晰反饋,初步得到影響用戶網(wǎng)上購物決策的影響因子;其次以采集到的行為數(shù)據(jù)結(jié)合馬爾科夫鏈算法挖掘主要影響因子;最后通過相關(guān)眼動參數(shù)和調(diào)查研究對主因子進(jìn)行確認(rèn)并分析主決策因子對網(wǎng)上購物的影響權(quán)重.
圖1 網(wǎng)上購物決策因子研究框架
為研究用戶網(wǎng)上購物過程中各影響因素所占比重,采用CEM[7]對各影響因素進(jìn)行系統(tǒng)分類,再運(yùn)用調(diào)查問卷對分類出的因素進(jìn)行選擇,從中找出最為重要的幾個影響因素,分析篩選出重要因素.本次調(diào)查得到有效問卷123份,根據(jù)CEM匯總分析這些數(shù)據(jù),得到影響用戶網(wǎng)絡(luò)購物決策的顯性因素,具體情況見表1.
表1 CEM匯總分析
分析發(fā)現(xiàn)品牌形象不只是用戶的關(guān)鍵體驗,也是目前網(wǎng)購做得最差的地方,計算出來的滿意度權(quán)重是-16分.另外,產(chǎn)品、價格、便利性也有一定的提升空間,所以品牌形象、產(chǎn)品、價格和便利性就是本次重點研究的影響用戶網(wǎng)購決策的4個因素.
本文利用java等技術(shù)記錄用戶的瀏覽行為,其優(yōu)點在于整個過程不需要用戶的主動參與,不需要中斷用戶的瀏覽操作,也不會給用戶帶來不良的瀏覽情緒.通過Live Record對實驗者在實驗中的操作進(jìn)行記錄,可以發(fā)現(xiàn)用戶在瀏覽時的行為主要包括以下幾個方面:滾動頁面、點擊鼠標(biāo)、移動光標(biāo)、其他(主要指用戶走神或與網(wǎng)上購物關(guān)聯(lián)不大的行為).
馬爾科夫預(yù)測法[8]的基本要求是狀態(tài)轉(zhuǎn)移概率矩陣必須具有一定的穩(wěn)定性.因此,必須具有足夠的統(tǒng)計數(shù)據(jù),才能保證預(yù)測的精度與準(zhǔn)確性.具有大量的統(tǒng)計數(shù)據(jù)是運(yùn)用馬爾科夫預(yù)測法的一個基本條件.本文隨機(jī)選取48位調(diào)查者作為本次研究的實驗者,在常用網(wǎng)上購物網(wǎng)站的日用品——洗發(fā)水網(wǎng)頁上實現(xiàn)購買行為.分別進(jìn)行2次及以上實驗,得到實驗者的行為數(shù)據(jù),滿足馬爾科夫預(yù)測法的基本條件.匯總數(shù)據(jù),將所有實驗數(shù)據(jù)求平均,算出網(wǎng)上購物行為所占比例,見表2.
表2 網(wǎng)上購物行為所占比例 %
為得到實驗者較為穩(wěn)定的網(wǎng)上購物行為數(shù)據(jù),進(jìn)行多次實驗并求其平均值,并將幾次實驗中各種行為之間的轉(zhuǎn)化情況記錄下來,見表3.
表3 實驗中網(wǎng)上購物行為轉(zhuǎn)化比例 %
3.2.1 創(chuàng)建初始轉(zhuǎn)移概率矩陣
設(shè)某一事件發(fā)展過程有E1,E2,…,En等n種可能的狀態(tài).記從Ei到Ej的狀態(tài)轉(zhuǎn)移概率矩陣為P,則
(1)
轉(zhuǎn)移概率矩陣中
(2)
由表3可得該實驗的一步轉(zhuǎn)移概率矩陣
3.2.2 決定初始狀態(tài)的市場概率矩陣
初始狀態(tài)概率矩陣
(3)
3.2.3 建立馬爾科夫鏈模型
由式(1)和(3)可得
(4)
運(yùn)用馬爾科夫鏈,得到用戶進(jìn)行網(wǎng)上購物操作中的各種行為終極狀態(tài)所占的比例,見表4.
表4 網(wǎng)上購物行為終極狀態(tài)所占比例 %
從實驗錄像中可以看出,實驗者網(wǎng)上購物行為與購物時受到的影響有直接聯(lián)系.每一個行為的產(chǎn)生都是由不同的因素所導(dǎo)致的,而同一個因素也可以導(dǎo)致不同行為的產(chǎn)生.[9]根據(jù)實驗錄像,將主要網(wǎng)上購物行為及其產(chǎn)生原因匯總于表5.
表5 不同因素導(dǎo)致的網(wǎng)上購物行為所占比例 %
將表4和5按乘法原理處理可以得到表6.從表6可得在影響網(wǎng)上購物的4個主要因素中,品牌形象所占比例最高,即在網(wǎng)上購物時優(yōu)先選擇信譽(yù)較高、可靠度高的網(wǎng)上購物網(wǎng)站,在購買產(chǎn)品時也會優(yōu)先考慮該產(chǎn)品的品牌、知名度,因為用戶覺得品牌是產(chǎn)品質(zhì)量的保證.其次是價格,標(biāo)有特價、折扣價的產(chǎn)品會更容易吸引用戶的興趣,會讓用戶去點擊了解商品.如果該商品有較高的性價比,就比較會被用戶放進(jìn)購物車.再其次是產(chǎn)品(產(chǎn)品圖片)的吸引力以及購買流程和付款收貨的便捷程度.
表6 結(jié)合影響因素的網(wǎng)上購物行為終極狀態(tài)比例 %
相關(guān)研究已經(jīng)表明眼動特征能在一定程度上反映用戶的興趣點所在.[10]通過研究網(wǎng)絡(luò)用戶的眼動特征,包括瞳孔直徑、第一次注視點、注視點分布、眼動軌跡[11]等從側(cè)面驗證網(wǎng)上購物者的興趣所在,從而進(jìn)一步提高本研究的正確性和精度.運(yùn)用眼動儀收集本研究中測試者的眼動數(shù)據(jù),記錄測試者在發(fā)生網(wǎng)上購物行為時的眼動特征,結(jié)合實時錄像分析測試者的興趣.
眼瞼情況[12]:記錄眼瞼變化及時間,同步比對影像,得到用戶感興趣的地方.注視情況[9]:記錄注視變化及時間,同步比對影像,得到用戶感興趣的地方.瞳孔情況[13]:記錄瞳孔直徑變化及時間,同步比對影像,得到用戶感興趣的地方.影像記錄:眼動儀在記錄以上參數(shù)變化的同時,還記錄每一秒用戶的參數(shù)變化.分析最后生成的Excel表格中時間以及對應(yīng)的參數(shù)變化和Live Record所記錄的用戶具體購物操作,就可以知道哪些地方是用戶的興趣點.利用SPSS對比眼瞼和瞳孔情況,采用曲線估計分析眼瞼和瞳孔數(shù)據(jù).選取實驗者在瀏覽和選購時的數(shù)據(jù)進(jìn)行分析.運(yùn)用SPSS可以得曲線估計圖2和3.
圖2 眼瞼曲線估計
圖3 瞳孔曲線估計
從圖2和3可以看出,測試者在看見自己感興趣的網(wǎng)頁時會全神注視,同時瞳孔會保持張大的狀態(tài).同時可知:當(dāng)單位眨眼數(shù)越小、瞳孔直徑比正常直徑大、一定時間內(nèi)不滾動頁面、眼睛注視同一片區(qū)域時,說明用戶對該信息感興趣.再根據(jù)影像記錄,匯總引起實驗者興趣的是哪類影響因素,得出其主要影響因素是品牌及價格.
為驗證本文分析的正確性,在人人網(wǎng)上發(fā)布網(wǎng)上購物決策影響因子調(diào)查問卷(問卷的對象是網(wǎng)上購物用戶).實得有效問卷235份,經(jīng)統(tǒng)計分析得到以下結(jié)論:品牌形象的權(quán)重為33%,價格的權(quán)重為20%,產(chǎn)品(產(chǎn)品圖片)的權(quán)重為15%,便利性的權(quán)重為11%.由此可知,實驗結(jié)論可較為準(zhǔn)確地反映影響網(wǎng)上購物行為的因素權(quán)重.
在網(wǎng)上購物的缺點上,認(rèn)為商品質(zhì)量低劣的用戶占56.25%,認(rèn)為到貨時間偏長和郵費(fèi)貴的用戶各占31.25%,認(rèn)為網(wǎng)上購物存在欺詐行為的占25%.這也是網(wǎng)上購物用戶一般在選購商品和服務(wù)時非??粗仄放菩蜗蟮闹饕?,他們認(rèn)為品牌商品有品質(zhì)保障并且售后服務(wù)到位.
根據(jù)實驗分析得到影響網(wǎng)上購物的主要因素的權(quán)重:首要因素是品牌形象、價格,其次是產(chǎn)品(產(chǎn)品圖片)、便利性,再其次是服務(wù)以及其他因素.雖本文將馬爾科夫鏈算法與一些相關(guān)算法結(jié)合,但仍存在缺陷,數(shù)據(jù)分析存在一定的誤差,值得用更為先進(jìn)的技術(shù)手段進(jìn)行進(jìn)一步的研究.
參考文獻(xiàn):
[1]RYEN W W. The use of implicit evidence for relevance feedback in Web retrieval[J]. Lecture Notes in Comput Sci, 2002, 2291: 449-479.
[2]ZIGORIS P, ZHANG Y. Bayesian adaptive user profiling with explicit & implicit feedback[C]//Proc 15th ACM Int Conf Inform & Knowledge Manage, ACM, 2006: 397-404.
[3]付關(guān)友. 基于瀏覽行為分析的用戶興趣挖掘[D]. 重慶: 重慶大學(xué), 2004.
[4]燕保珠. 眼動研究在網(wǎng)站可用性測試中的應(yīng)用[D]. 北京: 北京郵電大學(xué), 2011.
[5]施笑畏, 宓為建. 基于模糊邏輯的多級代理推薦系統(tǒng)[J]. 上海海事大學(xué)學(xué)報, 2011, 32(4): 71-75.
[6]王賢文, 徐申萌. 中國C2C淘寶網(wǎng)絡(luò)店鋪的地理分布[J]. 地理科學(xué)進(jìn)展, 2011, 30(12): 56-61.
[7]SCHMITT B H. Customer experience management: a revolutionary approach to connecting with your customers[M]. New Jersey: Wiley, 2003: 234-238.
[8]GILKS W R, RICHARDSON S, SPIEGELHALTER D J. Markov chain Monte Carlo in practice[M]. London: Chapman & Hall, 1996: 56-60.
[9]HUANG J, WHITE R W, DUMAIS S. No clicks, no problem: using cursor movements to understand and improve search[C]//Proc SIGCHI Conf Human Factors Computing Systems, ACM, 2011: 1225-1234.
[10]BALL L J, LUCAS E J, MILES J N V,etal. Inspection times and the selection task: what do eye-movements reveal about relevance effects? [J]. Q J Exp Psychol, 2003, 56(6): 1053-1077.
[11]DIXSON B J. Eye tracking reveals men’s appreciation of the female form[J]. Human Natural, 2010, 21: 355-370.
[13]GLAHOLT M G, WU M C, REINGOLD E M. Predicting preference from fixations[J]. PsychNology J, 2009, 7(2): 141-158.