□ 王蓓蓓
(浙江理工大學 經濟管理學院,浙江 杭州 310018)
天貓、京東、亞馬遜等主流平臺提供的數據顯示,整體上服裝類電子商務的退貨率最高可達30%,居高不下的退貨率始終是困擾服裝電子商務企業(yè)的難題,洞察消費者退貨的原因并且進行分類標注,由此制定具有針對性的交易策略顯得格外重要。電商平臺的在線評論作為一種重要的消費信息來源,企業(yè)能從中得到消費者對產品和服務的反饋,對于企業(yè)的運營管理具有重要意義[1],因而受到國內外學者的普遍關注。以往的基于在線評論的研究聚焦于描述消費者的購物體驗或購買決策,缺乏對消費者退貨問題的討論。在線評論作為一種重要的新型信息來源,若能從中挖掘出消費者退貨信息,有利于電商企業(yè)更有針對性地優(yōu)化零售策略以降低退貨率。大部分研究傾向于利用在線評論的數量、分數、情緒、長度等特征屬性刻畫消費者的行為偏好。相對而言,利用評論文本挖掘退貨行為的關聯(lián)因素并且進行解釋的研究比較欠缺。在線評論直觀地表達了消費者對產品和服務各方面的描述和感受,Alec Minnema等[2]提出,在線評論文本可能蘊含著消費者退貨行為信息,能在一定程度上反映出消費者退貨意愿。為了驗證在線評論蘊含的消費者退貨信息的有用性,本文以在線評論為研究對象,挖掘其中蘊含的消費者退貨信息。不同程度的退貨意愿對消費者實際產生的退貨行為的影響也不同。一般來說,消費者的退貨意愿越高,其退貨的概率就越大;反之,消費者退貨的概率就越小。因此,分類討論消費者退貨意愿,對在線零售商有針對性地制定零售政策具有重大意義。
基于此,本文綜合運用LDA主題模型和機器學習方法探究消費者在不同退貨意愿的情況下對商品特征的選擇偏好的差異。相比現有的研究,本文的貢獻體現在以下幾個方面:第一,面向垂直電商退貨行為挖掘的進一步深入,是從描述性分析向可解釋性挖掘的推進,有利于更深刻地揭示退貨行為背后蘊含的關聯(lián)驅動機理。第二,綜合運用文本挖掘技術,從在線評論中挖掘出服裝電商退貨行為的關聯(lián)因素,開辟了新的退貨信息收集渠道,有利于服裝電商企業(yè)據此優(yōu)化退貨策略,進而減少非必要的退貨。第三,本文的研究從理論上驗證了Minnema提出的假設,揭示出不同的商品特征因素對消費者退貨意愿具有不同程度的影響,有利于服裝電商企業(yè)據此進行分類管理,使服裝電商的營銷策略更具有針對性和實效性。除此之外,立足于服裝電商企業(yè)對高退貨率的關切,論文從理論和實踐兩方面揭示在線評論挖掘對服裝電商運營的適用性和有效性,所得結論對降低服裝電商退貨率具有很好的指導意義。
本文屬于在線評論的主題挖掘研究范疇,相關研究均致力于從海量的信息和數據中挖掘出有價值的關鍵信息,挖掘在線評論中蘊含的退貨行為信息已取得一些進展。
劉紅文等[3]對54篇文獻中涉及的七組變量關系進行了系統(tǒng)檢驗,發(fā)現在線評論質量、消費者信任傾向、在線評論數量、評論者的情感傾向性、在線評論時效性、評論者資信度與消費者購買意愿均具有顯著正相關性。Nachiketa Sahoo等[4]發(fā)現評論數量過少時,消費者會購買多種替代品,選擇其中最合適的留下,并將其余產品退回,從而導致退貨率上升。Wang Yang等[5]發(fā)現商家提供的衣服合適性信息和用戶評論的合身參考信息相結合能降低退貨率。耿師導[6]通過量化在線產品評論研究消費者對退貨運費險的投保需求,發(fā)現根據消費者對商品的預期心理分布估計商品退貨情況,并制定合理的運費險定價策略,可減少退貨現象。Lohse等[7]發(fā)現正面在線評論會導致較低的退貨率及較高的銷售率和轉化率,而Alec Minnema[2]和Nachiketa Sahoo[4]則認為過于積極的評論或商家指定的評論會提高退貨率,因為積極的評論會讓消費者產生過高的期望,若實際產品達不到消費者預期就會發(fā)生退貨。
梳理現有的研究成果可以發(fā)現,在線評論數據會從不同的角度影響消費者退貨行為,在線評論與退貨行為存在一定程度的關聯(lián)。已有研究聚焦于以實證為支撐的描述性研究,以數據智能為支撐的解釋性研究相對欠缺?;诖?,本文主要以在線評論為研究對象,結合LDA主題模型與機器學習方法挖掘在線評論內容中影響消費者退貨意愿的信息。
在所有商品類別中,服裝鞋帽類商品退貨率一直居于首位,相關的評論數據十分豐富。如何從繁雜冗余的評論文本中凝練高價值信息,深入挖掘不同情況下,影響消費者退貨意愿的差異是本文的關鍵性問題。研究的基本思路如圖1所示,首先,采集主流服裝電商平臺在線評論數據,以經過質量校驗后的數據為樣本,進行LDA評論主題挖掘,提取消費者在討論退貨時關注的焦點。在此基礎上,通過word2vec訓練同義詞庫,整合并歸納與退貨關聯(lián)的產品特征因素。其次,為了分析不同退貨意愿的情況下消費者的選擇偏好,本文運用機器學習中的分類模型將退貨評論分成三種情況。具體步驟如下:抽取部分樣本數據并根據預先定義的規(guī)則標注數據,作為分類模型的訓練集,類別標簽分為退貨意愿高、退貨意愿中等以及退貨意愿低,將已標注數據分為訓練集和測試集,訓練多種分類器;根據評價指標選取最優(yōu)模型,再對未標注的數據進行分類。最后,分別對三種情況下,消費者選擇偏好進行統(tǒng)計分析,討論退貨意愿程度不同的消費者,關注的產品特征因素重要性是如何排序的,以此針對不同情況為在線零售商提供合適的政策或建議。
圖1 基于在線評論的服裝電商退貨意愿挖掘實驗框架
本文以評論文本為研究對象,利用主題模型判斷在線評論中是否包含消費者退貨信息。計算機領域的現有研究成果表明,LDA(Latent Dirichlet Allocation)[8]主題模型因其優(yōu)異的大規(guī)模語料處理能力、良好的降維能力和算法的擴展性逐漸成為主題挖掘領域的佼佼者,是當前最具活力的文本挖掘技術之一,具有十分廣泛的應用前景。LDA文檔主題生成模型由詞、主題和文檔三部分組成,其作用是以概率分布的形式給出評論集中每篇評論的主題分布和每個主題的詞分布,通過人工解讀每個主題高頻關鍵詞來歸納主題的實際意義。確定LDA模型的主題數對主題提取的效果具有至關重要的作用,若主題數過多,會導致主題之間相關性較高;若數量過少,則會出現主題關鍵詞信息雜亂無章,以致實驗結果太抽象而無法解讀。困惑度(Perplexity)是Blei等提出的并將其作為模型評判指標。部分學者如廖列法等[9]和劉江華[10]等采用最小化困惑度(Perplexity)指標確定主題個數。理論上,困惑度越小,模型的聚類效果越好,但僅用困惑度指標確定主題數缺乏邏輯嚴謹性,以致主題數過高,出現主題間辨識度不高的問題[11]。主題一致性(Topic Coherence)是另一種確定最優(yōu)主題數的指標[12-13],它通過衡量主題中高分詞語之間的語義相似度來為一個主題評分,CUMass是主題一致性指標之一。本文采取Wenxin Wang等[14]的方法,結合困惑度和主題一致性度量選取最優(yōu)主題數,確保LDA模型的主題提取結果具有準確性和可解釋性?;贚DA模型生成主題-詞多項式分布,概率較高的關鍵詞能較好地描述主題內容,本文選取排名前十的關鍵詞進行可視化分析。
在機器學習中,分類器的作用是在標記好類別的訓練數據集上預測一個新的觀察樣本的所屬類別。在監(jiān)督學習中,算法從已標記的數據中學習。在理解數據背后隱藏的規(guī)律之后,算法通過將模式與未標記的新數據關聯(lián)來確定新數據應該映射的對應類別標簽。構建分類器的步驟包括隨機選取訓練樣本集并人工標注類型、確定分類器的輸入特征、訓練評估不同的分類算法,根據評價指標選取最優(yōu)模型,最后對余下所有數據進行分類預測。本文為分類任務中的文本分類,文本分類是根據文本的特征將其劃分到已有的類別中。輸入是由評論分割而成的單個詞語,作為特征向量,輸出是評論的類別。
4.1.1 評論文本數據
本研究在線評論數據來自京東電商平臺。京東年度活躍購買用戶數達4.719億[15],作為國內知名的電商平臺,其數據具有代表性。本研究通過自主開發(fā)的網絡爬蟲工具采集京東電商平臺服裝評論數據作為分析對象,刪除重復、短句評論,最終得到120656條有效數據。為了聚焦退貨信息的挖掘,本文通過關鍵詞篩選出有關退貨的評論,如“退貨”“退款”等,一共獲得5413條退貨評論。然后對所得數據進行數據清洗,包括剔除噪音數據、分詞及去除停用詞操作。
4.1.2 LDA主題挖掘
消費者一般通過在線評論對商品的屬性進行反饋,為了獲取消費者在提及退貨問題時真實關切的問題,本文運用LDA模型以退貨評論為研究對象,挖掘在線評論中與退貨有關的商品特征。數據清洗之后,語料庫中的詞語大部分都具有明確的含義,此時主題提取的可解釋性更佳。運用第三小節(jié)所介紹的方法確定最優(yōu)主題數T,最終主題數T=11時,困惑度指標和一致性度量都在特定范圍內達到極值。理論上,LDA模型在此時的聚類效果最好。
LDA算法可以得到每個主題在所有詞上的概率分布,本文選擇概率排名前三十的部分關鍵詞進行歸納總結,結果如表1所示,T1~T11表示主題一到主題十一。分析LDA主題挖掘的結果可大致歸納出與消費者退貨有關的產品特征。根據各個主題的關鍵詞分布,可以推斷出消費者描述的退貨問題與消費者退貨意愿有關。如T1的關鍵詞“麻煩”“申請”“售后”“懶得”等詞,說明消費者在申請售后服務時,可能因為售后流程繁瑣復雜,加上自身惰性而選擇不退貨。T2的關鍵詞如“速度”“很快”等詞特別強調了物流速度與退貨的關系。根據關鍵詞“尺碼”“大小”“太大”等,可以推斷出商品大小的合適與否關系著消費者的退貨意愿。T11的特征詞清晰地表述了商品價格與消費者退貨存在關聯(lián),如“差價”“降價”“便宜”等詞。同樣的,其他主題的關鍵詞分布也能很好地概括消費者在談及退貨問題時主要討論的話題,最后共歸納總結為11個特征因素,分別為售后流程、物流、質量、尺碼、外觀、效果、服務態(tài)度、品牌、商品描述、產品做工以及價格。這些商品特征因素一定程度上能解釋部分與消費者退貨意愿有關的原因。
表1 LDA主題提取結果
為了呈現不同退貨意愿的情況下,消費者的選擇偏好差異以及各個特征因素的重要性,需要對所有退貨評論進行分類,類別標簽分為退貨意愿高、退貨意愿中等以及退貨意愿低。本文通過特定領域的數據集來構建分類器實現所有退貨評論的分類預測。構建分類器之前需要一批已經標注好的訓練樣本,因此,本研究通過人工標注得到訓練樣本。首先,組內標注成員統(tǒng)一根據退貨意愿程度的定義確定標注的規(guī)則:根據消費者對不同商品特征的描述及滿意度情況,并觀察消費者的退貨傾向性來判斷消費者的退貨意愿高低;其次,隨機抽取1650條數據,由三個人分別對樣本數據進行標注;最后,根據少數服從多數的原則確定最終的類別標簽,部分數據標注情況如表2所示。為了提高分類預測的準確性,本文選取被業(yè)內普遍認可的幾種機器學習分類器進行訓練,分別為高斯樸素貝葉斯模型(Gaussian Naive Bayes)、多元邏輯回歸模型、隨機森林以及LightGBM算法。通過比較各個模型的準確率、召回率及F1值,最后選取最優(yōu)模型分類剩余的退貨評論。將1650條文本作為輸入變量,每個輸入樣本對應的類別標簽作為輸出變量。樣本數據以8∶2的比例被分割成訓練集和測試集。為了減小數據劃分對模型效果的影響,本文通過引入k折交叉驗證的方法選擇最優(yōu)模型。最后四個模型在測試集上的表現如表3所示。
表2
表3 各分類器訓練效果
由表3可知,LightGBM算法訓練的分類器效果最好,因此本文利用此模型對剩余評論進行分類,一共得到4294條退貨意愿高的評論、550條退貨意愿中等的評論以及569條退貨意愿低的評論。由此可知,消費者在電商平臺發(fā)表的涉及退貨問題的評價大部分都有較強的退貨意愿。
基于分類器完成所有退貨評論對應的類別預測之后,為了分析不同程度退貨意愿的情況下,各特征因素的重要性排名,本文分別統(tǒng)計退貨意愿低、退貨意愿中等以及退貨意愿高這三類評論數據的11個特征因素的分布情況。
由于在線評論中消費者描述某個特征時,經常會用不同的詞語表達相同的意思,即同義詞,因此需要將與此類意思相近及對同一主體進行刻畫的關鍵詞合并成為新的特征因素。本文利用word2vec訓練同義詞模型,其原理是將詞匯表示成向量,計算兩個向量之間的相似度,若相似度較高,則歸為同一類詞語,訓練結果如表4所示。11個商品特征因素所對應的詞語大部分都表示相同的意思,說明訓練結果較好。這11個特征因素一定程度上可以解釋大部分消費者產生退貨意愿的原因。
表4 word2vec訓練結果
在此基礎上,分別統(tǒng)計三種情況下評論數據中的11個特征因素的分布情況。各個特征因素在三個類別的占比情況如圖2所示,橫軸表示各特征因素在所有特征因素中所占的比例,表現的是該特征因素對消費者退貨意愿的重要性。由圖2可知,整體來看,影響消費者退貨意愿的主要因素是做工、價格、描述、物流、大小、售后流程以及質量。其他因素如品牌對消費者退貨意愿影響不顯著。
圖2 各特征因素占比圖
對于退貨意愿低的情況,產品大小和質量對消費者的影響最大,其次是價格和商品描述,最后依次是售后流程、做工、物流、效果等。由訓練分類器所制定的標注規(guī)則可知,退貨意愿低的消費者在退貨條件寬松的情況下不傾向退貨甚至排斥退貨,說明消費者在在線評論中所描述的商品特征滿意度較高。由此可知,大小合適、高質量、價格優(yōu)惠的產品會降低消費者退貨意愿。另外,商家呈現給消費者的商品信息與實物差距越小,消費者的退貨意愿也越低。對于退貨意愿中等的情況,物流占比明顯高于其他特征因素,其次對消費者退貨意愿影響較大的特征分別為價格、大小、售后流程以及質量。退貨意愿中等的消費者對于退貨問題保持中立的態(tài)度,說明消費者所描述的問題沒有嚴重到需要使用退貨手段進行風險規(guī)避或是降低自身損失。物流作為商品的外部因素,在商品本身沒有重大缺陷時,消費者對產品和服務具有一定包容度。但由物流導致的商品損壞會讓消費者產生退貨意愿。最后,退貨意愿高的群體是零售商最需要關注的群體,這類消費者最關注產品大小、售后流程及質量,與退貨意愿低的群體最關注的產品特點存在多處重合,再一次驗證了產品大小和質量能否滿足消費者預期會很大程度影響消費者的退貨意愿。退貨意愿高的群體還特別關注售后流程,他們對零售商的售前、售后行為提出了更高的要求,若產品大小、質量或售后服務不符合消費者的期望,那么消費者退貨意愿也就越高。
本文以在線評論為研究對象,利用文本挖掘的方法,分析在線評論中的退貨信息。立足于Minnema的假設,驗證在線評論中蘊含的消費者退貨信息的有用性。同時在不同退貨意愿的情況下,分層次討論影響消費者退貨意愿的特征因素,以此細粒化消費者對商品特征的選擇偏好。研究表明:①在線評論蘊含著大量消費者退貨信息,能反應消費者退貨意愿,從理論上驗證了Minnema提出的假設,發(fā)現了用戶數據的新價值,為后續(xù)的研究開拓新思路;②通過機器學習訓練不同分類器,將有關退貨的在線評論分為退貨意愿低、中、高三種情況,最終得出,LightGBM算法的分類效果最好,能夠有效區(qū)分消費者的退貨意愿程度;③退貨意愿高往往是因為商品大小不合適、質量不可靠以及售后流程不完善,消費者真實的退貨行為很大可能是由這些因素驅動的。同樣的,合適的大小和高質量產品能降低消費者退貨意愿。另外,商品的做工、價格、描述和實際效果在一定程度上也會影響消費者退貨意愿。物流對消費者退貨傾向性的影響并不是很明顯,大部分消費者持中立態(tài)度。
綜上所述,在不同退貨意愿的情況下,消費者的選擇偏好也有所差異,因此,零售商應該有針對性地制定零售策略以降低消費者退貨意愿。在此,本文提出以下幾點政策建議以供參考:①規(guī)范員工培訓,提高客服服務水平以及完善售后流程。如制定合理的補償機制,在商品無重大缺陷的情況下,消費者購后出現問題時,通常首先與客服進行聯(lián)系,如果客服能及時有效地解決客戶問題或者給予補償,那么也能減少非必要的退貨情況;②商品表述以真實為主,不可過分美化商品。線上購物對比線下購物最大的劣勢就是消費者不能接觸實物進行判斷后再購買,因此,服裝電商企業(yè)應該盡量減小圖片與實物的差距。另外,提供全面完善的商品信息,如商品尺碼表、材料表等,可以減少消費者由于信息不確定導致錯誤的購買決策,進而退貨的情況;③企業(yè)需嚴格把控商品質量,若是為了降低成本而無法為消費者提供高品質的商品,那么也應制定合理的價格,做到商品價值與商品價格對等。大部分消費者認為只有買到物有所值或物超所值的商品才是一次成功的購物,若商品性價比高、質量可靠,那么消費者保留交易商品而不退貨的概率也會增加;④對于物流而言,電商企業(yè)和第三方物流企業(yè)應相互合作,提高商品配送的效率,保證商品流通過程中不受損壞,以減少消費者損失。雖然物流速度對消費者退貨意愿的影響不大,但是由物流原因造成商品實質性損壞也會使消費者退貨。因此,物流過程的首要任務是保證商品完好無損,在這個前提下,提高物流配送的速度能給消費者帶來較好的服務體驗。