詹明君++陳曉璇++肖祺
【摘 要】點擊流數(shù)據(jù)的出現(xiàn)和研究為電子商務(wù)組織的個性化服務(wù)的優(yōu)化提供了支持。現(xiàn)有的點擊流數(shù)據(jù)在電子商務(wù)上的研究多集中于對電子商務(wù)用戶的行為的建模,希望從中理解電子商務(wù)用戶的行為,以優(yōu)化自身的決策。本文使用內(nèi)容分析法,主要詳細地回顧了點擊流數(shù)據(jù)文獻中關(guān)于電子商務(wù)用戶行為的研究,補充完善了現(xiàn)有的基于點擊流數(shù)據(jù)關(guān)于電子商務(wù)用戶行為的文獻綜述,將基于點擊流數(shù)據(jù)如何分析電子商務(wù)用戶行為的研究文獻分成兩大部分闡述:電子商務(wù)用戶瀏覽路徑分析和用戶動態(tài)轉(zhuǎn)換行為,并對點擊流數(shù)據(jù)在電子商務(wù)用戶行為研究上的局限性和未來的研究趨勢作了預(yù)測和展望。
【關(guān)鍵詞】電子商務(wù);點擊流;用戶行為;動態(tài)轉(zhuǎn)換;預(yù)測和展望
1. 引言
伴隨著信息技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)使得實時、低成本以及隱性地收集用戶個人活動的詳細信息成為了可能。點擊流數(shù)據(jù)成為了一種研究網(wǎng)上消費者的新范式[1]。點擊流數(shù)據(jù)以一個完整,及時和精確地方式捕獲了各種各樣的信息。這些數(shù)據(jù)覆蓋了用戶的行為,例如瀏覽的路徑,購買的產(chǎn)品和點擊的廣告,這為研究者們和從業(yè)者們嘗試去了解用戶作出的選擇行為提供了很大的幫助。許多研究者已經(jīng)探究了來自于銷售單一類型產(chǎn)品的網(wǎng)站的點擊流數(shù)據(jù),例如汽車產(chǎn)品和書籍等。相對于獲取單一類型的網(wǎng)站點擊流數(shù)據(jù),從綜合性的電子商務(wù)網(wǎng)站上收集到的點擊流數(shù)據(jù)將會遠比這類數(shù)據(jù)復(fù)雜。電子商務(wù)網(wǎng)站的數(shù)據(jù)通常會封裝一個人的行為歷史的相當(dāng)多的細節(jié)信息,而且這過多的細節(jié)信息會使得數(shù)據(jù)集本身龐大而冗雜,導(dǎo)致了數(shù)據(jù)挖掘上的困難,因而點擊流數(shù)據(jù)的復(fù)雜性讓學(xué)者們止步難前,因此,厘清點擊流數(shù)據(jù)在電子商務(wù)網(wǎng)站用戶行為研究的發(fā)展和現(xiàn)狀,不僅對于往后電子商務(wù)網(wǎng)站用戶行為的研究,對于其他領(lǐng)域的研究也都具有非常重要的意義。
本文系統(tǒng)地回顧了點擊流數(shù)據(jù)和電子商務(wù)的發(fā)展相關(guān)關(guān)系。在這個基礎(chǔ)上,本文詳細地梳理了當(dāng)前點擊流數(shù)據(jù)在電子商務(wù)應(yīng)用中的不足,并提出即時地感知用戶的興趣的重要性,引出優(yōu)化個性化服務(wù)的方向,有助于學(xué)術(shù)領(lǐng)域和實踐領(lǐng)域系統(tǒng)地把握已有的研究成果,并在此基礎(chǔ)上開展進一步的研究。
本文的結(jié)構(gòu)安排如下:第二部分對電子商務(wù)網(wǎng)站上的點擊流路徑進行分析;第三部分對電子商務(wù)網(wǎng)站上的用戶購買轉(zhuǎn)換行為進行分析;第四部分綜述電子商務(wù)用戶的興趣挖掘和聚類算法研究;最后是總結(jié)與未來研究展望。
2.電子商務(wù)網(wǎng)站的點擊流路徑分析
2.1 電子商務(wù)網(wǎng)站的分類系統(tǒng)
電子商務(wù)的成功離不開大量數(shù)據(jù)的支持。任何公司或者組織的成功必然離不開決策的正確性,而點擊流數(shù)據(jù)就是這種正確性決策最可靠、最有效的數(shù)據(jù)基礎(chǔ)。當(dāng)前的電子商務(wù)網(wǎng)站如同雨后春筍,正因為意識到了點擊流數(shù)據(jù)所蘊含的巨大能量,使得如何更有效地利用點擊流數(shù)據(jù)已經(jīng)成為了現(xiàn)代商業(yè)競爭優(yōu)勢的必備利器。
在線商店運用多種信息如人口特征,購買歷史等來尋找消費者。如今數(shù)據(jù)越來越多,而對于點擊流數(shù)據(jù)的利用并不充分,點擊流數(shù)據(jù)不僅提供了用戶在瀏覽網(wǎng)頁時的頁面順序信息,還提供了他們閱覽時的路徑信息。
在人機交互的角度,考慮用戶在電子商務(wù)網(wǎng)站的目的,文獻[2]提出了一個分類方案作為電子商務(wù)網(wǎng)站的一個通用的分類系統(tǒng)。點擊流數(shù)據(jù)會潛在地成為一種非常充裕的數(shù)據(jù)資源的原因是每一個URL的全文或者HTML內(nèi)容都是已知的。使用分類系統(tǒng)是為了側(cè)重于對應(yīng)每一頁瀏覽的頁面的類別。每一個頁面都被分類為七個類別中的一個:主頁,帳戶,分類,產(chǎn)品,信息,購物車,訂單,以及進入/退出頁面。主頁是一個通用的新任務(wù)的起點。帳戶頁面是用來登錄,地址變更,以及查看訂單狀態(tài)的。分類頁面呈現(xiàn)的是商品、類別或者是搜索結(jié)果的列表。產(chǎn)品頁面包含了詳細的產(chǎn)品信息,產(chǎn)品的描述,價格信息,可用性和產(chǎn)品評論。購物車頁面是用于加入或刪除產(chǎn)品的,以及輸入購買信息。訂購頁面是表示一個已經(jīng)下單的確認頁面。進入/退出頁面表示一個時間段的開始或結(jié)束。但是這種分類系統(tǒng)會覆蓋了頁面內(nèi)容的其他信息,沒有考慮到廣告、圖形和文本信息等其他信息。
2.2 基于用戶路徑的分析模型
路徑信息可能包含了一個用戶的目標、知識以及興趣等信息。路徑從一個新的視角來預(yù)測消費者行為,具體而言,路徑對事件的次序進行了編碼,為購買作準備,而不是單獨地尋找一個購買的場合。大多研究的分類方式是較為粗糙的,僅對用戶的目標明確與否進行區(qū)分,但是這也暗示了根據(jù)一個用戶的路徑可以得知這個用戶的目標,并有可能預(yù)測未來的行為。
前人的研究中的選擇模型來從路徑中提取信息。但是沒有考慮準確性和連續(xù)性屬性。文獻[3]對對應(yīng)于網(wǎng)頁組任務(wù)的結(jié)論進行了建模,確實考慮了一些連續(xù)的信息,但他們通過任務(wù)對應(yīng)頁面的收集來對頁面層的行為進行建模,因而信息并不詳細。文獻[4]借鑒了過去的工作提出了一個新的選擇模型,考慮了準確性和連續(xù)性。特別地,他們還構(gòu)建了一個統(tǒng)計模型,訪問者在瀏覽網(wǎng)站的時候,它可以分析他們逐頁的瀏覽情況,并將自身的自回歸多項式概率模型與多元多項式模型和潛在組模型進行比較。
文獻[5]對用戶的瀏覽路徑進行了馬爾科夫描述,用類別的首字母作為縮寫簡潔地表示路徑。例如,字符串“HCPE”(Home,Category,Product,Exit)表示一個用戶從主頁開始搜索一本書,轉(zhuǎn)到分類頁面去查看結(jié)果,在考慮了個人產(chǎn)品后停留產(chǎn)品頁面,結(jié)束這個時間段。其中,此文通過假定一個用戶沒有瀏覽任何頁面持續(xù)時間為20分鐘來表示時間段的結(jié)束。但是并沒有對一個時間段間隔的定義作出較為合理的解釋,因為這將會導(dǎo)致用戶的瀏覽路徑變得不一樣;并加入了一個混合的過程,消費者的模型參數(shù)可以在一個時間段內(nèi)切換,以表明瀏覽行為有可能由于消費者當(dāng)前目標或心情而千差萬別并突然轉(zhuǎn)變。
文獻[4]提出的統(tǒng)計模型可以對未來的路徑進行概率評估,包括用戶是否會進行購買,并可以普遍用于預(yù)測網(wǎng)站上的任意路徑。例如,哪一類用戶更有可能會去瀏覽另一個產(chǎn)品的頁面,或者在接下來的五個點擊內(nèi)就完全離開這個網(wǎng)站了?并且這個模型可以被用于網(wǎng)頁設(shè)計和設(shè)置營銷混合變量,例如,如果知道一個用戶在這個網(wǎng)站購買的可能性較少,可以在頁面中通過加入有幫助的鏈接來動態(tài)地改變網(wǎng)站的設(shè)計;而對于有可能購買的用戶來說,網(wǎng)站可以變得更簡化。另外,使用這個模型的預(yù)測可以改善購買轉(zhuǎn)換率,它可以大幅提高運營利潤。但是他們只是單純地去了解序列信息的作用,所用數(shù)據(jù)為期1個月,并通過傳統(tǒng)的分類方案進行分析,這可能會導(dǎo)致研究結(jié)果不具備代表性。而該文提出的自回歸性可能提供了未來優(yōu)化此類概率模型研究的一個有趣的方向。
當(dāng)然網(wǎng)頁設(shè)計有很多方面,廣告和促銷是這個問題的重要元素。路徑分析并不是否定或者取代研究這些方方面面問題的需要。但對于購買行為的預(yù)測能力因?qū)Ш铰窂侥芊从秤脩裟繕硕玫礁纳?。結(jié)合消費者行為的結(jié)構(gòu)模型可能會對路徑信息有更好的使用。
3.電子商務(wù)網(wǎng)站的動態(tài)轉(zhuǎn)換行為
3.1 動態(tài)轉(zhuǎn)換行為定義
購買轉(zhuǎn)換指的是,網(wǎng)頁瀏覽者在一個網(wǎng)上零售商處瀏覽期間進行購買的百分比。這是一個電子網(wǎng)站的成功的一個關(guān)鍵指標,因為它提供了訪問者轉(zhuǎn)變?yōu)橄M者的一個度量。盡管電子商務(wù)的發(fā)展快速,網(wǎng)上購買轉(zhuǎn)換率仍然很低。一些大型的網(wǎng)上零售商如Amazon.com, 等的購買轉(zhuǎn)換率的范圍在1~2%。電子商務(wù)的管理者們希望了解影響了購買轉(zhuǎn)換率的因素,以及如何通過動態(tài)地適應(yīng)消費者的行為表現(xiàn)來提高他們的購買轉(zhuǎn)換率。
網(wǎng)上購物與線下購物的差異中最突出的特點是訪問虛擬商店所需的低廉交通成本。在線下購物行為的研究中,構(gòu)建消費者商店選擇和購買決策模型的一個重要部分是從一家店去到另一家或多家店的成本(包括有形成本和心理成本)。與此相反,客戶訪問在線商店網(wǎng)站實際上是無成本的。這對觀察到的行為有不少的影響。首先,因為成本要低得多,網(wǎng)上購物者更可能會沒有目的地訪問一間商店。在線下購物環(huán)境中,購物者僅僅是花費時間和精力去拜訪商店就會產(chǎn)生成本,他很少會空手回來。因此,我們注意到網(wǎng)上購物的轉(zhuǎn)換率很低。第二,訪問網(wǎng)站的低成本使得購物者可能會推遲購買的決定然后下次訪問再購買。相反地,在線下購買環(huán)境中,由于再次訪問的經(jīng)濟規(guī)模非常有限,所以購物者可能會急于完成購買以避免產(chǎn)生更多的交通費用。由于這些原因,我們更可能會看到在線購物者為了一個購買決策多次訪問同一家商店,即使是為了較低參與度的購買決策。
3.2 動態(tài)轉(zhuǎn)換行為的影響因素
文獻[6]構(gòu)建了一個概念化框架,在框架中購買概率是訪問效應(yīng)和購買閥值效應(yīng)的結(jié)果,但他們主要的研究焦點是對購買前考慮時間的影響因素的描述性分析,沒有對購買的轉(zhuǎn)換行為進行考慮。文獻[7]通過購買基數(shù)概率、對購買有正面效應(yīng)的訪問、對購買的負面購買閾值效應(yīng)、訪問效應(yīng)和購買閾值的差異性、隨著時間變化的效應(yīng)和從不購買的瀏覽者這六個部分構(gòu)建了個人層面的轉(zhuǎn)換行為概率模型。類似于文獻[8]的模型,Moe等人使用傾向基數(shù)和增量效應(yīng)來表示訪問凈效應(yīng),該模型明確提出了購物者差異以及隨著時間的動態(tài)變化。這個模型對轉(zhuǎn)換行為提供了一個更為有效和有用地檢測手段,但是其忽視了每次訪問中發(fā)生的不同的活動,如訪問序列,人口統(tǒng)計特征和網(wǎng)站設(shè)計等因素。
當(dāng)消費者熟悉了新的環(huán)境時,他們會累積更多的經(jīng)驗,從而減少需要累積足夠多的信息去購買的訪問量。然而同時這些用戶受到商店的影響就會越少,因此需要增加說服他們?nèi)ベ徺I的訪問量。訪問效應(yīng)和購買閥值的大小可能會隨著消費者在購物環(huán)境下的購物經(jīng)驗而變化。例如,在同個網(wǎng)站的重復(fù)訪問會對購物減少影響,因為消費者有可能習(xí)慣了環(huán)境的刺激。購物閥值可能會減少,因為消費者在重復(fù)購物中獲得了熟悉感,或者購物經(jīng)歷是舒適的,因此在將來再次購買的可能性會更高。在另一方面,有些人在早期的訪問就有可能性會購買(也許是為了體驗這個購買過程是怎樣的),但是隨著購買次數(shù)的增加,新鮮感會消退,他對購買的抵觸情緒有可能會增強;這似乎暗示了感知用戶興趣變化的重要性。
4. 結(jié)論與展望
本文使用內(nèi)容分析法,詳細地回顧了關(guān)于電子商務(wù)用戶行為的研究,補充完善了現(xiàn)有的基于點擊流數(shù)據(jù)關(guān)于電子商務(wù)用戶行為的文獻綜述。在這些文獻的基礎(chǔ)上,本文系統(tǒng)地回顧了點擊流數(shù)據(jù)和電子商務(wù)的理論和發(fā)展,闡述了電子商務(wù)網(wǎng)站的瀏覽路徑分析;并對其用戶的購買轉(zhuǎn)換行為進行分析;同時,本文詳細地梳理了感知用戶的興趣的重要性。這為學(xué)術(shù)界和實踐界系統(tǒng)理解已有研究成果提供了有效的幫助。
由于點擊流數(shù)據(jù)自身的海量性和復(fù)雜性,當(dāng)前學(xué)者們對其在電子商務(wù)用戶行為的研究還是很不完善的。第一,對于時間段間隔的定義還存在著爭議;第二,電子商務(wù)的其他分類方案可能會改變現(xiàn)有研究模型的預(yù)測準確度;第三,現(xiàn)有的研究雖然能夠分析用戶的瀏覽路徑,但用戶興趣的動態(tài)性變化,并不能針對地對用戶提供更優(yōu)質(zhì)的個性化服務(wù)。
綜上所述,未來的研究可以從以下幾個方面探討和闡述電子商務(wù)用戶的行為如何能在點擊流數(shù)據(jù)的支持下得到更深入的分析。
1. 更合理地定義時間段的間隔,即搜索周期。許多的研究對于時間段的間隔的定義都不一致,例如15分鐘,20分鐘等。沒有一個通用的標準將會使得收集到的數(shù)據(jù)分析結(jié)果有差異,我們難以分析這些差異造成的影響。因此,后續(xù)研究應(yīng)當(dāng)結(jié)合時間段即搜索周期的合理定義,防止錯誤的數(shù)據(jù)分析,以便得到更為優(yōu)化的研究結(jié)果。
2. 重視其他的電子商務(wù)分類系統(tǒng)開發(fā)?,F(xiàn)有研究多使用由文獻[2]提出的一個電子商務(wù)網(wǎng)站的通用分類系統(tǒng),或增加其分類,或減少其分類。但是這種通過頁面分類來抽象化網(wǎng)頁的行為,會導(dǎo)致關(guān)于頁面內(nèi)容的圖形和文本信息的損失。因此,其他的分類方案可能會改變現(xiàn)有研究模型的預(yù)測準確度。而局限于通用分類系統(tǒng)的原因,對于這個問題的探討在目前的研究是比較缺乏的。
3. 感知并挖掘用戶即時的意圖。對電子商務(wù)用戶的瀏覽路徑進行分析即是為了捕捉用戶的內(nèi)心活動。在電子商務(wù)企業(yè)的角度,留住老客戶,發(fā)覺潛在新客戶是他們的目標,而在用戶的角度,如何能從中獲取自己希望得到并對之滿意的服務(wù)是他們的需求。因此,感知用戶的動態(tài)興趣,并及時地推薦或獲取更優(yōu)質(zhì)的服務(wù)是未來十分重要的方向。
最后值得一提的是,從綜合性的電子商務(wù)網(wǎng)站上收集到的點擊流數(shù)據(jù)將會遠比現(xiàn)有的單一類型研究數(shù)據(jù)復(fù)雜。如何能有效地收集并利用這些點擊流數(shù)據(jù)也是一個難題。相信如何利用點擊流數(shù)據(jù)為電子商務(wù)用戶即時提供更有效地個性化服務(wù)是未來研究的重要方向,這不僅是電子商務(wù)企業(yè),也是用戶們希望看到的。
參考文獻:
[1] 李雙雙, 陳毅文, LiShuangshuang,等. 點擊流:一種研究網(wǎng)上消費者的新范式[J]. 心理科學(xué)進展, 2007, 15(4):715-720.
[2] Redish, Janice (2002), “Information-Rich Web Sites: Challenges and Opportunities”, www.redish.net/cmu.pdf. Last accessed October 2002.
[3] Sismeiro, Catarina and Randolph E. Bucklin (2003), “Modeling Purchase Behavior at an Ecommerce Website: A Conditional Probability Approach”, Anderson School at UCLA, Working Paper.
[4] Montgomery, A.L, et al., 2004. Modeling online browsing and path analysis using clickstream data. Marketing Science 23 (4), 579—595.
[5] Cadez, Igor, David Heckerman, Christopher Meek, and Padhraic Smyth (2000), “Visualization of Navigation Patterns on a Web Site Using Model Based Clustering”, Technical Report MSRTR- 00-18, Microsoft Research.
[6] Putsis, William P., Jr., Narasimhan Srinivasan. 1994. Buying or just browsing? The duration of purchase deliberation. J. Marketing Res. 31(August) 393—402.
[7] Moe, W.W., Fader, P.S., 2004. Dynamic conversion behavior at e-commerce sites.Management Science 50 (3), 326—335.
[8] Schmittlein, David C., Donald G. Morrison. 2003. A live baby or your money back: The marketing of in vitro fertilization procedures. Management Sci. 49(12) 1617—1635.