李宇 何躍 吳中霞 唐琪雨 鄭灝鍵
摘 要:2020年春節(jié)以來,新冠疫情的逐漸惡化在很大程度上影響了消費(fèi)者的生鮮購買習(xí)慣,實(shí)現(xiàn)從農(nóng)貿(mào)市場向連鎖超市和生鮮電商平臺的轉(zhuǎn)變。因此,本研究利用Python語言抓取京東生鮮平臺生鮮商品銷量及新冠確診人數(shù),對數(shù)據(jù)進(jìn)行處理、存儲及可視化,將疫情指數(shù)、商品評論的數(shù)據(jù)進(jìn)行了展現(xiàn)和分析。據(jù)此提出“預(yù)測模型”,通過分析以上數(shù)據(jù)的變化與分布特點(diǎn)為生鮮電商平臺提供適當(dāng)?shù)匿N售、供應(yīng)方案,以期在將來某次應(yīng)急事件中能緩解平臺受到的沖擊,并使平臺從中發(fā)現(xiàn)商機(jī)。
關(guān)鍵詞:疫情;生鮮電商;預(yù)測模型;交易;python;可視化
一、文獻(xiàn)綜述
華南理工大學(xué)研究了生鮮電商產(chǎn)品特征對消費(fèi)者感知風(fēng)險(xiǎn)與購買意向的影響關(guān)系,通過實(shí)惠性、推介性、新奇性、便利性四方面構(gòu)建理論模型,得出其對生鮮銷售的影響關(guān)系;中國地質(zhì)大學(xué)研究了生鮮電商中冷鏈物流需求預(yù)測,通過灰色預(yù)測模型,根據(jù)各影響因素的變化趨勢的共同點(diǎn)或不同點(diǎn),從而檢測各個(gè)影響因素之間的關(guān)聯(lián)性;南京林業(yè)大學(xué)汽車與交通工程學(xué)院的姜曉紅曹慧敏,基于ARIMA模型的電商銷售預(yù)測及R語言,通過對未來的全國和區(qū)域性需求量進(jìn)行預(yù)測,能對產(chǎn)品的補(bǔ)貨安排提供理論指導(dǎo),對生產(chǎn)銷售的安排具有指導(dǎo)意義;而本次的研究,將目標(biāo)定位于銷量與疫情指數(shù)之間,具有現(xiàn)實(shí)意義,也為幫助平臺在疫情期間的良好發(fā)展貢獻(xiàn)了自己的價(jià)值。
二、背景
2020年突如其來的疫情打破了很多人的生活節(jié)奏,也改變了許多行業(yè)的結(jié)構(gòu)與發(fā)展方向。與2019年同期相比,今年春節(jié)期間,生鮮類APP的平均日活增幅及新用戶增幅達(dá)到2至3倍,疫情培養(yǎng)了用戶在網(wǎng)上購買生鮮商品的習(xí)慣,實(shí)現(xiàn)了生鮮電商用戶量和訂單量的快速增長,也暫時(shí)將生鮮電商從低谷中拉出。
通過對生鮮電商平臺疫情期間進(jìn)行PESTEL分析,了解平臺的外部宏觀環(huán)境,本文將有針對性地為平臺的發(fā)展做出預(yù)測、提供建議。使平臺實(shí)現(xiàn)精準(zhǔn)運(yùn)營并明確規(guī)劃其發(fā)展戰(zhàn)略。法律方面,為了促進(jìn)我國生鮮行業(yè)的快速發(fā)展,我國政府制定了行業(yè)相關(guān)的產(chǎn)業(yè)政策和法律法規(guī),如《電子商務(wù)法》等,明確了生鮮行業(yè)發(fā)展規(guī)劃方向,為行業(yè)的發(fā)展創(chuàng)造了較好的政策環(huán)境,為買賣雙方提供了保障,但也不可否認(rèn)還有一些售后的法律瓶頸需要解決;民生經(jīng)濟(jì)方面,疫情的暴發(fā)使得人們外出頻率驟減,購買成問題的生鮮產(chǎn)品作為生活中的必要品,為生鮮電商平臺帶來了巨大的流量,伴隨需求的增加,大多數(shù)人的購買行為也從線下轉(zhuǎn)移到線上;科技方面,由于市場規(guī)模擴(kuò)大、結(jié)構(gòu)轉(zhuǎn)變,對于行業(yè)相關(guān)技術(shù)的要求也相應(yīng)提高。冷鏈物流技術(shù)快速發(fā)展、無人配送正式開放等,都是疫情下生鮮電商行業(yè)的外部科技環(huán)境;社會文化趨向方面,消費(fèi)者對于飲食健康問題愈發(fā)關(guān)注,并且對食物的品質(zhì)和新鮮度的要求更加嚴(yán)格。
因此,本研究旨在為平臺提供一個(gè)預(yù)測模型,根據(jù)疫情的嚴(yán)重指數(shù)來量化影響生鮮電商平臺的因素,預(yù)測平臺發(fā)展方向并擬定供應(yīng)、銷售方案。
三、編程語言與技術(shù)介紹
該模型的設(shè)計(jì)主要是基于python語言的網(wǎng)絡(luò)爬蟲,并用pyecharts進(jìn)行可視化分析。網(wǎng)絡(luò)爬蟲,通過一定的規(guī)則策略,自動抓取、下載互聯(lián)網(wǎng)上網(wǎng)頁,再按照某些規(guī)則算法對這些網(wǎng)頁進(jìn)行數(shù)據(jù)抽取,形成所需要的數(shù)據(jù)集。而基于爬蟲,可以更準(zhǔn)確地獲取目標(biāo)數(shù)據(jù),再輔以MySQL數(shù)據(jù)庫儲存,python數(shù)據(jù)可視化展示與MATLAB擬合數(shù)據(jù),使得模型更清晰具體。
四、模型分析
數(shù)據(jù)選?。焊鶕?jù)艾媒咨詢所統(tǒng)計(jì)的“疫情暴發(fā)前與暴發(fā)期生鮮平臺食材銷量對比”,蔬果類同比增長近100%,肉蛋類增長近120%,故選取蔬果肉蛋(由于水產(chǎn)品屬于其中的肉類但有區(qū)別,故單獨(dú)呈現(xiàn)),再選取其統(tǒng)計(jì)的具體食材銷量在疫情前后同比增長高的食材,近20種。
而疫情暴發(fā)后,大年三十至正月初九,京東生鮮蔬菜獲得銷售和銷量的雙冠增長,銷售同比增長近450%。豬牛羊肉和禽肉蛋品等基本食材的銷售同比都超過了400%,豬肉同比去年春節(jié)增長超10倍。此外,餃子、包子、糕點(diǎn)等面點(diǎn)的全國銷量也超過了2019年“京東雙11”的規(guī)模,這一份答卷不僅為全國生鮮市場的供需穩(wěn)定持續(xù)助力,也展現(xiàn)了其在生鮮電商領(lǐng)域的領(lǐng)先地位,再加上其網(wǎng)站代碼較易爬取,故選取京東生鮮平臺為數(shù)據(jù)爬取對象。
1.模型微觀分析
(1)數(shù)據(jù)獲?。罕疚牡臄?shù)據(jù)主要來源是京東生鮮網(wǎng)站,整個(gè)過程通過Python語言編寫。數(shù)據(jù)爬取過程中,采用模擬請求登錄、Web自動化工具selenium模擬瀏覽器和多線程等技術(shù)手段。數(shù)據(jù)爬取后進(jìn)行采集分析,對數(shù)據(jù)進(jìn)行了清洗和轉(zhuǎn)換處理,并將其存入MySQL數(shù)據(jù)庫,最后通過pyecharts可視化庫對數(shù)據(jù)進(jìn)行直觀呈現(xiàn)與分析。
(2)框架構(gòu)建:該預(yù)測模型分析所需數(shù)據(jù)由三個(gè)步驟獲取,抓取生鮮品類——抓取各生鮮商品——抓取商品對應(yīng)評論。最后再用pyecharts實(shí)現(xiàn)數(shù)據(jù)可視化,可視化結(jié)果為疫情指數(shù)-時(shí)間圖和商品銷量-時(shí)間圖,matlab做回歸方程曲線圖。通過分析得出的圖像,為商家提供銷售預(yù)測模型,進(jìn)而使商家在再次經(jīng)歷類似災(zāi)難時(shí)能制訂出更具可行性的銷售方案。
(3)抓取數(shù)據(jù):首先,需要獲取京東生鮮網(wǎng)站生鮮商品品類,其次才能抓取品類里的各商品的具體信息,確定各店鋪該品類商品的評論數(shù)量,以此來估計(jì)商品銷量。該過程為:導(dǎo)入模塊—定義京東生鮮主頁—抓取網(wǎng)頁并解析—封裝品類名及url。
其次,在各品類信息基礎(chǔ)上,可進(jìn)一步抓取商品信息,主要是商品名稱和商品評論。在獲取商品信息時(shí),每頁總共60個(gè)商品,但其中有30個(gè)商品是通過Ajax加載出來的。為了解決這個(gè)問題,我們使用selenium模塊解決。selenium本質(zhì)是通過驅(qū)動瀏覽器,完全模擬瀏覽器的操作,比如跳轉(zhuǎn)、輸入、點(diǎn)擊、下拉等,來拿到網(wǎng)頁渲染之后的結(jié)果。
獲取商品店鋪和評論數(shù)的部分代碼如下:
該過程為定義品類url—定義瀏覽對象并訪問url+解析源碼,抓取url,評論數(shù)等。
最后,獲取評論時(shí)間,確定消費(fèi)者購買時(shí)間。當(dāng)爬蟲爬取速度過快或者次數(shù)過多,可能會出現(xiàn)被封IP的現(xiàn)象,導(dǎo)致抓取到的網(wǎng)頁源代碼為空。我們通過使用代理IP來解決這個(gè)問題,定義一個(gè)函數(shù),每次運(yùn)行這個(gè)函數(shù)都會通過API接口獲取一個(gè)新的IP地址,并以這個(gè)IP地址去訪問網(wǎng)址,這樣解決了IP被封的問題。其部分代碼如下:
該過程為獲取代理IP—定義函數(shù)—訪問評論頁并儲存
(4)數(shù)據(jù)存儲
本設(shè)計(jì)采用MySQL數(shù)據(jù)庫作為數(shù)據(jù)源存儲,MySQL是一種關(guān)系型數(shù)據(jù)庫管理系統(tǒng),關(guān)系數(shù)據(jù)庫將數(shù)據(jù)保存在不同的表中,而不是將所有數(shù)據(jù)放在一個(gè)大倉庫內(nèi),這樣就增加了速度并提高了靈活性。
MySQL所使用的SQL語言是用于訪問數(shù)據(jù)庫的最常用標(biāo)準(zhǔn)化語言。MySQL軟件采用了雙授權(quán)政策,分為社區(qū)版和商業(yè)版,由于其具有體積小、速度快、總體擁有成本低等特點(diǎn),本模型使用MySQL數(shù)據(jù)庫來存儲目標(biāo)數(shù)據(jù)。
該過程為導(dǎo)入驅(qū)動包—連接數(shù)據(jù)庫—定義執(zhí)行sql語句—關(guān)閉數(shù)據(jù)庫最終MySQL中共收集存儲了435402條評論信息數(shù)據(jù)。
2.模型宏觀分析:
(1)組成部分:
①銷量/時(shí)間圖:選取20種不同類別的熱賣商品,將其分為四類,以月份為橫坐標(biāo),評論數(shù)為縱坐標(biāo)。我們采取根據(jù)其評論數(shù)量反映銷售數(shù)量的方法,并做累積,顯示四大類的折線圖。該圖旨在幫助平臺確定商品出售時(shí)間及所需供應(yīng)的商品數(shù)量比例,穩(wěn)定供需關(guān)系,同時(shí)對商家也有一定的借鑒作用。
②疫情指數(shù)/時(shí)間圖:利用騰訊地圖官網(wǎng)的疫情實(shí)時(shí)數(shù)據(jù),以月份為單位,患者/全國人數(shù)為縱坐標(biāo),顯示折線圖,是用來聯(lián)系疫情指數(shù)與銷量的媒介。
③銷量/疫情圖及回歸方程:利用時(shí)間為媒介,以累積感染人數(shù)作為衡量疫情嚴(yán)重程度的指數(shù),將對應(yīng)疫情下的評論數(shù)用更直觀的圖像顯現(xiàn)出來,并設(shè)計(jì)方程,方便平臺在相應(yīng)疫情狀況下大致估測自己的銷量水平。
(2)購買力變化分析及產(chǎn)生的影響
根據(jù)上圖我們可以得到:①在感染人數(shù)累計(jì)達(dá)到6萬左右時(shí),生鮮商品評論量開始明顯上升;②蔬菜類的銷量增速為所有生鮮商品中最快的;③根據(jù)20種商品評價(jià)數(shù)的累計(jì)分析,疫情后的銷量(評價(jià)數(shù)為)約為疫情前的2倍左右。
疫情下外出頻率急劇降低,加上各大平臺通過自身商品、供應(yīng)鏈、物流配送、品牌戰(zhàn)略合作等優(yōu)勢,結(jié)合不定期發(fā)放優(yōu)惠券、舉辦促銷活動等優(yōu)惠手段互相競爭,使得疫情期間消費(fèi)者的購買力遠(yuǎn)大于往年同期。
另外,客觀因素還有季節(jié)性滯銷、社會交通發(fā)展程度、信息技術(shù)發(fā)展程度等。例如在冬季,消費(fèi)者更傾向于選擇各種肉類等可以補(bǔ)充能量的生鮮類產(chǎn)品,在春秋季節(jié)購買水果的群體占比就較大。社會交通發(fā)展程度是針對物流方面,隨著社會經(jīng)濟(jì)的不斷發(fā)展,公路、鐵路、航空等運(yùn)輸方式的里程、貨物量、吞吐量這類指標(biāo)不斷攀升,對中國電商的物流配送起到了直接重要的推動作用。信息技術(shù)是電商發(fā)展的命脈,沒有互聯(lián)網(wǎng)的普及,沒有電商基礎(chǔ)設(shè)施和網(wǎng)點(diǎn)的建設(shè),也不可能有如今蓬勃發(fā)展的電商行業(yè)。
最后,生鮮電商的交易水平與平臺自身發(fā)展相關(guān)性最大。創(chuàng)新和改進(jìn)供應(yīng)鏈,如永輝超市啟動的“田間尋貨源”方案,加大了供應(yīng)鏈的協(xié)同程度;完善運(yùn)營體系,如每日優(yōu)鮮通過小程序與社交群,交易額度同比增長300%等;增強(qiáng)用戶體驗(yàn)感,如永輝線下門店中,生鮮品旁的二次加工服務(wù);除此之外,發(fā)達(dá)的物流體系,數(shù)字化技術(shù),產(chǎn)品的質(zhì)量等都是影響交易量的重要因素。
五、價(jià)值
當(dāng)重大災(zāi)難事件來臨時(shí),各行各業(yè)將受到不同程度的沖擊,因此,預(yù)判企業(yè)發(fā)展方向、提前制定應(yīng)對方案與風(fēng)險(xiǎn)防范措施能有效緩解其帶來的影響。本文將此次疫情的京東生鮮平臺數(shù)據(jù)作為預(yù)測模型的數(shù)據(jù)基礎(chǔ),通過數(shù)據(jù)獲取、處理、可視化等方式,為生鮮電商平臺提供可作用于災(zāi)難事件下的預(yù)測模型。該模型描述了某疫情指數(shù)下對應(yīng)的多類生鮮產(chǎn)品的銷量,為平臺解決了以下問題:
1.難以把控購入量和時(shí)間,由此導(dǎo)致倉庫的積壓或是不足。
(1)平臺可根據(jù)不同疫情指數(shù)定位到相應(yīng)銷量區(qū)間,確定市場需求量的大致范圍,進(jìn)而根據(jù)市場需求量及企業(yè)內(nèi)外部環(huán)境等因素來確定供應(yīng)量并推測進(jìn)貨時(shí)間,在不同疫情指數(shù)時(shí)期有針對性地供應(yīng)適量的產(chǎn)品,提高平臺的供應(yīng)鏈運(yùn)轉(zhuǎn)效率。
(2)根據(jù)銷量曲線,合理調(diào)整成本,減少庫存積壓和虧本兜售的情況。
2.難以確定類似疫情來臨之時(shí)的生鮮熱銷品。由于模型中樣本的選取來自艾媒咨詢中疫情前后同比增長率高的產(chǎn)品,平臺可根據(jù)各品類生鮮產(chǎn)品的銷量曲線以及季節(jié)等外部因素,利用銷量與疫情指數(shù)的對應(yīng),在相應(yīng)的疫情狀況下進(jìn)一步確定合理的貨物購入、出售與存儲方案,有利于制定切實(shí)可行的銷售預(yù)案并將其應(yīng)用于類似的市場情況中。
3.難以把控人員的在線數(shù)量及商品監(jiān)管問題,造成平臺運(yùn)營成本增高
利用疫情指數(shù)/時(shí)間圖確定平臺商品的安全監(jiān)管程度,及相應(yīng)的運(yùn)營物流措施,及時(shí)調(diào)整工作人員的工作安排(所需工廠在線員工/總員工數(shù)量、合理采用多平臺的共享員工模式來進(jìn)行短期人力輸出)由于不同疫情指數(shù)下,銷量不同,所需要的人員數(shù)量也不同,平臺根據(jù)該模型可以適當(dāng)?shù)娜藛T配置和準(zhǔn)確的生產(chǎn)銷售方案,提高企業(yè)內(nèi)部的工作效率,維持企業(yè)內(nèi)部的穩(wěn)定運(yùn)轉(zhuǎn)。
六、不足之處
當(dāng)然模型還有一定的不足之處:
1.操作性:構(gòu)建非此次疫情的模型圖,需要定期運(yùn)行代碼,并存入數(shù)據(jù)庫做間斷性記錄,運(yùn)行時(shí)間較長,需平臺相關(guān)人員自行評估,操作較繁瑣,但可以起到加強(qiáng)平臺風(fēng)險(xiǎn)防范的作用。
2.準(zhǔn)確性:由于京東平臺對任何一家店鋪的銷量都是不公開的,所有銷量數(shù)據(jù)均為店鋪隱私,該模型只能利用評論數(shù)預(yù)測商品銷量,又由于不同產(chǎn)品之間的評論與銷量比值不一致(但由于針對的均為生鮮產(chǎn)品,幅度變化范圍較小,所以有一定的借鑒意義),在高峰或低谷所對應(yīng)的時(shí)間可能會有一定偏差。
3.兼容性:
(1)該代碼當(dāng)前產(chǎn)出的折線圖及回歸方程,只適合于類似“新冠肺炎”這種導(dǎo)致人們居家、無法外出的情況,且時(shí)間在春節(jié)前后,若非該種情況,平臺只能通過定期運(yùn)行代碼,根據(jù)疫情指數(shù)進(jìn)行預(yù)測。
(2)由于為了更準(zhǔn)確地找到熱銷區(qū)間,樣本選取是根據(jù)艾媒咨詢披露的2020年疫情前后同比增長率較大的商品,所以銷售產(chǎn)品也限于當(dāng)期熱銷產(chǎn)品,商家的商品供應(yīng)還應(yīng)結(jié)合季節(jié)、溫度、產(chǎn)量等因素作出合理預(yù)測。
4.其他影響因素:預(yù)測模型較片面地用此次疫情的數(shù)據(jù)進(jìn)行可視化,未考慮季節(jié)、溫度、平臺等重要因素。季節(jié)決定了當(dāng)季的時(shí)令水果以及消費(fèi)者的購買傾向,溫度會影響到生鮮產(chǎn)品的保存狀況,對冷鏈物流技術(shù)的應(yīng)用程度有較大的偏差。并且,鑒于本研究只抓取了京東生鮮平臺的數(shù)據(jù)進(jìn)行分析,無法準(zhǔn)確地描繪其余結(jié)構(gòu)與模式有別于京東生鮮的平臺銷售曲線,無法直接應(yīng)用于各種生鮮電商平臺。
七、結(jié)束語
本文提出生鮮電商平臺預(yù)測模型,意在為平臺發(fā)展規(guī)劃、風(fēng)險(xiǎn)規(guī)避提出建議。然而,生鮮電商行業(yè)的發(fā)展還需要政府的大力支持和平臺內(nèi)部的創(chuàng)新與突破。歲末年初蔓延至全國各地的新型冠狀病毒肺炎,顯現(xiàn)了生鮮電商市場的巨大潛力。隨著生鮮農(nóng)產(chǎn)品流通領(lǐng)域政策環(huán)境以及電商環(huán)境持續(xù)向好,生鮮消費(fèi)加速線上化,生鮮電商將完善在全國范圍內(nèi)的布局。
參考文獻(xiàn):
[1]疫情下生鮮電商成亮點(diǎn):京東生鮮春節(jié)銷售同比增長215%,賣出近15000噸生鮮產(chǎn)品[EB/OL].https://www.iimedia.cn/c460/68587.html.
[2]楊澤赟,谷勵(lì).疫情沖擊下的商業(yè)模式嬗變——生鮮電商在疫情中的逆勢而上[J].現(xiàn)代營銷(經(jīng)營版),2020(04):116-117.
[3]洪濤.2020上半年中國農(nóng)產(chǎn)品電商發(fā)展報(bào)告[J].中國商論,2020(15):1-10.