陳 薇,張 莉
(北京信息科技大學 信息管理學院,北京 100192)
銷售預測作為規(guī)劃公司運營各個階段的基礎,以各種方式極大地影響著零售商和其他供應鏈上的成員,是動態(tài)市場需求下供應鏈管理的關鍵任務。有效的銷售預測有助于進行合理的庫存控制,改善供應鏈績效,降低總體成本。在全球競爭日益激烈的環(huán)境下,為降低成本、提高競爭力,銷量預測獲得了持續(xù)的關注。近年來,大數(shù)據(jù)技術的發(fā)展推動著各行業(yè)快速生成大量多源異構的數(shù)據(jù),如在線評論、網頁瀏覽點擊率等,使得消費者在進行購買決策時可以考慮在線口碑、網絡搜索工具等更多因素,意味著不斷有新的因素影響著銷量的波動。這給銷量預測帶來機會的同時也帶來了挑戰(zhàn)。因此,有必要總結、探索和探討當前銷量預測的研究趨勢,為未來的研究和實踐提供啟示。
文獻計量學是一種基于歷史出版物識別研究趨勢和熱點問題的定量分析方法[1]。到目前為止,文獻計量學分析已廣泛用于管理學、經濟學、模糊研究、國際商務等多個研究領域,而銷量預測的文獻計量學研究還幾乎空白。在已有研究中,李曉敏等[2]基于高涉入度產品的銷量預測進行了文獻計量學分析,指出要不斷運用大數(shù)據(jù)時代所帶來的信息資源以及現(xiàn)代技術手段進行預測分析。H.Niles Perera等[3]首次結合知識圖譜探討了判斷性預測方法對供應鏈中產品需求/銷售預測及其他決策的影響。但這些針對某一特定領域或特定方法進行的文獻計量分析無法全面覆蓋銷量預測整個研究領域。
為了對銷量預測研究進行全面的文獻計量分析,本文采用社會網絡和數(shù)理統(tǒng)計方法,對Web of Science數(shù)據(jù)庫中1998—2019年銷量預測相關的802篇文獻進行了文獻計量學分析,旨在探索:1)銷量預測研究的總體數(shù)量和趨勢;2)國家/地區(qū)的分布及合作,期刊的分布及共被引情況和該領域有影響力的作者和文獻;3)銷量預測當前的研究熱點和研究趨勢。
湯森路透公司開發(fā)的Web of Science(WoS)是最常用的文獻計量分析數(shù)據(jù)庫之一。它提供了引文分析中的標準記錄,并允許將完整的引文記錄下載到與大多數(shù)文獻計量學分析工具兼容的“.txt”文件中。本文樣本取自于WoS核心數(shù)據(jù)集,檢索主題為TS=(“sale*predict*” OR “sale*forecast*” OR “predict*sale*” OR “forecast* sale*”),文獻類型包括所有種類,時間跨度為1998—2019年。由于WoS核心數(shù)據(jù)集里檢索到的關于銷量預測主題最早的文章發(fā)表于1998年,因此樣本起始年為1998年,共獲得樣本文獻802篇。
社會網絡分析被廣泛用于文獻計量學研究中進行關鍵詞的共現(xiàn)及作者、機構和國家之間的學術合作分析。本文采用VOSviewer軟件對銷量預測文獻的期刊共被引和關鍵詞共現(xiàn)進行社會網絡分析和可視化。此外,應用CiteSpace軟件進行共被引文獻的主題聚類和可視化。結合兩個軟件各自的優(yōu)勢共同探索20多年來銷量預測領域的研究進展和理論熱點。
引文數(shù)量被視為反映論文質量的主要因素[4]。影響因子反映了近兩年期刊的平均年度引用量,代表了單個期刊的質量。h指數(shù)是一種評價學術成就的新方法,h代表“高引用次數(shù)”,一名科研人員的h指數(shù)是指他至多有h篇論文分別被引用了至少h次。人們普遍認為h指數(shù)可量化研究人員的學術產出數(shù)量與學術產出水平[5]。因此,本文統(tǒng)計引文數(shù)量、影響因子、h指數(shù)等指標,以識別主要研究國家/地區(qū)、期刊、有影響力的學者和文獻。
通過統(tǒng)計1998—2019年銷量預測相關的論文發(fā)表數(shù)量,獲得結果如圖1所示。由圖1可以看出,雖然論文數(shù)量在某些年份存在波動,但總體呈一個明顯增長的趨勢,表明了研究人員對銷量預測領域的持續(xù)關注。
圖1 歷年論文發(fā)表數(shù)量
從WoS數(shù)據(jù)庫中獲取的802篇銷量預測文獻共來自76個國家/地區(qū)。通過統(tǒng)計獲得文獻總量排名前5的國家/地區(qū),如表1所示。由表1可知,中國大陸發(fā)文量171篇,為發(fā)文量最多的國家/地區(qū),其次是美國(128篇),中國臺灣(78篇),英格蘭(66篇),澳大利亞(30篇)。中國臺灣近年來主要關注機器學習、神經網絡如LSTM、徑向基函數(shù)神經網絡等技術在銷量預測中的應用。雖然發(fā)文量排名第3,但中心性較低,說明與其他國家/地區(qū)的合作較少,僅與7個國家/地區(qū)合作發(fā)表了10篇文章。而主要關注零售產業(yè)銷量預測的英格蘭中心性排名第1,表明英格蘭在銷量預測研究方面的國際合作較多。中國大陸雖然發(fā)文量最多,但中心性和h指數(shù)都低于美國、英格蘭,說明中國大陸國際合作較少,且論文質量有待提高。美國發(fā)表文獻總量和中心性均排名第2,h指數(shù)和被引總頻次最高,表明美國在銷量預測領域具有一定的影響力。近年來中國、美國都關注于大數(shù)據(jù)對銷量預測的影響,除了不斷優(yōu)化各種神經網絡技術以提高銷量預測準確性以外,還全面考慮了數(shù)字化環(huán)境下銷量預測影響因素,探索了在線評論、用戶搜索行為等對銷量預測的影響。
表1 出版物總量排名前5的國家/地區(qū)
銷量預測的相關文獻收錄在635份期刊中。期刊涉及經濟、管理、計算機等多領域,表明銷量預測研究的多學科性質。本文統(tǒng)計了發(fā)文數(shù)量排名前5的期刊的影響因子,如圖2所示。
圖2 發(fā)文量排名前5的期刊
發(fā)文量排名前5的期刊發(fā)文數(shù)量僅占9.85%。由圖2可知,在銷量預測研究的相關期刊中,關注神經網絡等預測模型的期刊《Expert Systems with Applications》發(fā)文量最多,影響因子(5.448)在這5種期刊中排名第2,說明該期刊是銷量預測領域較為活躍和有影響力的期刊。期刊《International Journal of Forecasting》主要從供應鏈角度出發(fā)研究銷量預測,其發(fā)文量排名第2,但影響因子(3.964)相較其他4種期刊低。《International Journal of Production Economics》的影響因子(6.205)在這5種期刊中排名第1,說明它的影響力較大,該期刊更關注于零售等商業(yè)市場。
圖3為期刊的共被引網絡,節(jié)點越大,代表該期刊所發(fā)表的論文共被引的次數(shù)越多?!禘xpert Systems with Application》《European Journal of Operations Research》《Decision Support Systems》《International Journal of Production Economics》和《International Journal of Forecasting》在可視化圖譜中占據(jù)著顯著位置,這一方面是因為這些期刊發(fā)表的文獻量相對較多,另一方面也是因為這些期刊發(fā)表的文獻質量較高,所以被共引次數(shù)較多。
圖3 期刊的共被引網絡
文獻計量學的另一個顯著特征是能夠識別在學科或探究領域內形成論述的學者和論文[6]。本文按WoS索引出版物數(shù)量統(tǒng)計了排名前5的作者信息,如表2所示。有3名研究者來自中國,主要關注人工智能和遺傳算法。其中來自元智大學的Chang是銷量預測研究中最多產的研究者,h指數(shù)39,發(fā)表文獻被引總頻次4 384。他和Liu等[7]結合神經網絡、遺傳算法,建立了加權模糊案例推理(WFCBR)為主要預測模型的混合預測模型,以預測印刷線路板廠的未來銷售量。Kuo[8]不斷優(yōu)化徑向基函數(shù)神經網絡,同時也關注模糊神經網絡和免疫系統(tǒng)神經網絡在銷量預測中的應用。來自英格蘭的Fildes更關注供應鏈末端零售行業(yè)的銷量預測情況。Thomassey運用模糊邏輯、模糊推理系統(tǒng)優(yōu)化紡織工業(yè)的銷量預測??梢钥闯觯N量預測運用于各行各業(yè),每個行業(yè)的銷量預測影響因素也不相同,因此學者們在研究銷量預測時,通?;谀骋惶囟I域不斷優(yōu)化預測方法,提高預測效果。
表2 發(fā)文量排名前5的研究者
依據(jù)被引頻次列出了排名前10的文獻,如表3所示。其中6篇來自美國,這一結果再次證實了美國在銷量預測研究領域的影響力。銷量預測影響因素和銷量預測方法是銷量預測研究關注的重點,也是高被引文獻關注的重點。被引頻次最高的《Exploring the value of online product reviews in forecasting sales:The case of motion pictures》是中美學者Dellarocas C.、Zhang X.Q.和Awad N.F.[9]在2007年合作發(fā)表的文獻,它主要引入在線評論的影響因素以預測電影收入,并證實可大大提高其預測準確性。Dhar V.和Chang E.A.[10]檢測了互聯(lián)網生成內容(包括來自博客和社交網站的數(shù)據(jù))在預測音樂行業(yè)銷售中的有用性。Morwitz V.G.等[11]探索了多因素對購買決策的影響。Lilien等[12]指出從最前沿的用戶以及面臨更極端問題的其他市場用戶那里收集有關需求和解決方案的信息可以產生更好的銷售額。Porath C.L.和Bateman T.S.[13]認為有績效要求的目標導向可預測隨后的銷售業(yè)績,而無績效目標的導向會對銷售業(yè)績產生負面影響。Talukdar T.D.等[14]探索了新產品的銷量預測。在調整預測方面,Sanders N.R.[15]等關注于判斷性銷量預測的影響,Lawrence等[16]綜述了25年來判斷性調整對預測的影響并提出了發(fā)展方向。此外還探討了應用極限學習機(ELM)的新型神經網絡技術、組合預測等。
表3 被引頻次排名前10的文獻
2.5.1 文獻共被引分析
當兩篇論文同時出現(xiàn)在第3篇論文的引文中時,認為兩篇論文建立了共引關系。共引分析為文獻的知識結構和學術研究影響的廣度提供了更深刻的見解。本文選取CiteSpace軟件進行文獻的共被引分析,以探討銷量預測的知識結構和研究趨勢,分析結果如圖4和圖5所示。
由圖4可知,銷量預測的共引文獻被聚類為時裝銷量預測、預測區(qū)間、大數(shù)據(jù)、變量選擇、模糊邏輯、遺傳算法、模糊神經網絡、實證研究、模糊支持向量機和專家預測10個主題。圖5詳細地可視化了各聚類主題下文獻共被引的時間順序。通過觀察時間線視圖可知,在銷量預測早期的實證研究中,對模糊神經網絡、預測區(qū)間的探討較多,遺傳算法也不斷引入到銷量預測模型中。隨后專家預測、模糊支持向量機被廣泛應用于時裝零售的銷量預測。銷量預測為合理的庫存和生產計劃提供支持,是動態(tài)市場需求下供應鏈管理中的關鍵任務,對于生命周期很短的時裝零售行業(yè)尤為重要。因此時裝產業(yè)的銷量預測獲得持續(xù)關注。
圖4 共被引文獻聚類知識圖譜
圖5 文獻共被引的時間線視圖
值得注意的是,大數(shù)據(jù)單獨作為一個主題出現(xiàn)在聚類視圖中,而且由圖5可以清楚地看到,近年來大數(shù)據(jù)技術越來越多地應用到銷量預測中。大數(shù)據(jù)技術不僅用于銷量預測原始數(shù)據(jù)的收集和預處理,還可以優(yōu)化預測模型。如Cui R.等[17]對Facebook社交媒體信息進行大數(shù)據(jù)處理并實施多種機器學習方法來預測每日銷售額。Buyar V.和Abdel-Raouf A.[18]提出了一種基于卷積神經網絡的模型,該模型基于制藥公司的歷史大規(guī)模銷售數(shù)據(jù)預測其未來的銷售。人們已經認識到大數(shù)據(jù)的重要性。
2.5.2 關鍵詞分析
為進一步探索銷量預測的研究熱點,本文基于獲取的802篇銷量預測文獻進行關鍵詞的社會網絡分析,采用VOSviewer軟件繪制出關鍵詞共現(xiàn)的可視化圖譜。關鍵詞共2 900個,限定關鍵詞的共現(xiàn)次數(shù)大于等于5,共有159個關鍵詞滿足條件,如圖6所示。圖6節(jié)點和標簽的大小代表了關鍵詞共同出現(xiàn)的次數(shù)。節(jié)點和標簽越大,關鍵詞的共現(xiàn)頻次越高。由圖6可知,除銷量預測和預測外,模型、時間序列和神經網絡的共現(xiàn)頻次最高,這表明時間序列和神經網絡是建立銷量預測模型最常用的方法。盡管這3個關鍵詞出現(xiàn)的時間較早,但仍舊是銷量預測的經典方法,因此近年來學者不斷優(yōu)化這些預測方法,如采用遺傳算法優(yōu)化預測相關參數(shù),引入時間序列和神經網絡結合的方法預測銷量。LSTM等深度神經網絡近年來也被引入到銷量預測研究中。
圖6 關鍵詞共現(xiàn)網絡
在近年銷量預測研究的關鍵詞中,可以清楚地看到口碑(world of mouth,WoM)、電子商務、評論、情感分析、大數(shù)據(jù)、人工智能出現(xiàn)在圖譜的邊緣。隨著電子商務平臺的發(fā)展,在線評論已成為提供產品口碑信息的重要工具。在銷售預測中,分析和衡量在線評論十分有價值。它可以更準確地反應消費者的購買意愿和行為偏好。目前,許多學者運用自然語言處理、文本挖掘等技術探究在線評論中的情感信息對銷量預測的影響,情感分析也逐漸由單一的粗粒度情感分析向更細粒度的情感分析發(fā)展,如計算在線評論中產品各個屬性的情感得分,而不是僅計算在線評論的總情感分值。
此外,通過關鍵詞共現(xiàn)網絡,還可以發(fā)現(xiàn)銷量預測的關鍵詞主要圍繞著銷量預測的影響因素、銷量預測方法及銷量預測的效果展開。銷量預測的影響因素包括早期對市場特點、季節(jié)、價格、促銷的研究,以及近年來對在線評論、口碑等多源數(shù)據(jù)的探討。除了ANN神經網絡、極限學習機、機器學習、模糊預測、支持向量機、回歸分析等各種預測銷量方法,近年來學者還結合情感分析和大數(shù)據(jù)技術建立了融合情感分析的預測模型。在零售業(yè)務的有效運營中,預測未來的銷售是最重要的問題之一。銷量預測作為供應鏈環(huán)境中一個節(jié)點,準確的銷量預測對于組織和規(guī)劃生產、采購、運輸和勞動力至關重要,它為管理者的決策提供了重要依據(jù)。所以零售、決策支持、供應鏈也是共現(xiàn)頻次較高的關鍵詞。而且現(xiàn)有的預測依賴于各種預測模型,但仍舊會存在誤差,所以判斷性調整仍然是預測中重要的一部分,管理者需要根據(jù)其他因素對預測結果進行調整以提高預測的準確性。
本文通過文獻計量學分析提供了一個全景圖來描述銷量預測領域的發(fā)展趨勢和研究熱點:1)大數(shù)據(jù)技術的發(fā)展為銷量預測影響因素提供了更多源的數(shù)據(jù)集,這要求預測應考慮更多維度的數(shù)據(jù)對銷量預測的影響。越來越多學者關注在線評論、用戶搜索行為留下的數(shù)據(jù)如網頁瀏覽點擊率等多維指標對產品預測的影響。2)大數(shù)據(jù)技術、人工智能為提高銷量預測提供了技術支持。學者們不斷優(yōu)化和完善文本挖掘、深度神經網絡等新興技術以提高銷量預測的準確性。3)零售產業(yè)特別是周期短的時裝產業(yè)仍是銷量預測的重點研究領域。準確的銷量預測對于供應鏈上的各個環(huán)節(jié)至關重要。
在未來的銷量預測研究中,基于大數(shù)據(jù)、人工智能等技術,挖掘用戶生成評論及搜索行為留下的數(shù)據(jù)等多維度影響因素仍然是銷量預測的研究方向。雖然零售產業(yè)對銷量預測的要求更高,但不同行業(yè)產品的特征有所不同,銷量預測的影響因素和預測方法也就不同。依據(jù)產品特征,選擇合適的大數(shù)據(jù)方法,將情感分析融入到更多領域的預測中也是研究的趨勢。