国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

考慮產(chǎn)品特征屬性的替代性需求預(yù)測(cè)方法

2021-03-01 09:29高峻峻倪子玥
關(guān)鍵詞:缺貨需求預(yù)測(cè)排序

高峻峻,倪子玥

(上海大學(xué)悉尼工商學(xué)院,上海 201800)

近年來,隨著電子商務(wù)的高速發(fā)展,越來越多的企業(yè)在互聯(lián)網(wǎng)平臺(tái)上開辟銷售渠道.然而,由于網(wǎng)絡(luò)零售與線下實(shí)體零售存在差異,從而產(chǎn)生了很多管理問題,例如高庫存、高缺貨、物流成本高等.因此,對(duì)用戶需求進(jìn)行準(zhǔn)確預(yù)測(cè)成為重要研究課題,對(duì)于企業(yè)本身的供應(yīng)鏈控制具有積極的影響.

線上產(chǎn)品類別豐富,同一品類內(nèi)部產(chǎn)品具備很高的相似性,它們之間會(huì)存在很強(qiáng)的替代作用,即對(duì)于一個(gè)給定的品類,消費(fèi)者事先確定一個(gè)最喜歡的產(chǎn)品,但當(dāng)該產(chǎn)品不再被售賣或缺貨時(shí),消費(fèi)者有一定的概率選擇其他產(chǎn)品作為替代[1].因此,在進(jìn)行產(chǎn)品需求預(yù)測(cè)時(shí),有必要考慮相似產(chǎn)品替代帶來的需求影響.

在產(chǎn)品替代研究方面,鄰近替代的方式被認(rèn)為最接近真實(shí)情況[2].目前關(guān)于鄰近替代率估計(jì)方法的研究相對(duì)較少,已有主要研究成果如下:一是認(rèn)為鄰近替代率可以被描述為消費(fèi)者的初始偏好概率和消費(fèi)者忠誠度的函數(shù)[3];二是以產(chǎn)品的相似度作為替代率的估計(jì)值,產(chǎn)品越相似,替代可能性就越高,文獻(xiàn)[4]提出一種產(chǎn)品加權(quán)屬性估計(jì)法.基于第二點(diǎn),文獻(xiàn)[5]又提出采用加權(quán)歐式距離對(duì)替代率估計(jì)進(jìn)行優(yōu)化,以解決屬性權(quán)重受到人為因素干擾的問題.

在需求預(yù)測(cè)研究方面,較為常見的是傳統(tǒng)的時(shí)間序列統(tǒng)計(jì)模型,例如平均移動(dòng)、指數(shù)平滑、Holt-Winter[6]、自回歸移動(dòng)平均(autoregressive integrated moving average,ARIMA)模型[7]等.這些方法的特點(diǎn)在于需求數(shù)據(jù)符合線性特點(diǎn)或者具有很明顯的趨勢(shì)性、季節(jié)性特征.針對(duì)非線性的需求數(shù)據(jù),一些學(xué)者也提出了基于機(jī)器學(xué)習(xí)的方法,例如支持向量機(jī)[8]、隨機(jī)森林[9]、神經(jīng)網(wǎng)絡(luò)[10]等,實(shí)驗(yàn)結(jié)果表明,機(jī)器學(xué)習(xí)的方法具有更強(qiáng)的適應(yīng)性,預(yù)測(cè)精度也更為精準(zhǔn).

在對(duì)替代性需求的研究方面,文獻(xiàn)[4]構(gòu)建了一種需求模型:產(chǎn)品i 的有效需求=初始需求+基于品類的替代需求+基于缺貨的替代需求.“基于品類的替代需求”是指當(dāng)消費(fèi)者的第一選擇是產(chǎn)品j,但因產(chǎn)品j 未被包含在該類產(chǎn)品中從而轉(zhuǎn)向選擇產(chǎn)品i 的需求量.“基于缺貨的替代需求”是指消費(fèi)者因產(chǎn)品j 缺貨而轉(zhuǎn)向選擇產(chǎn)品i 的需求量.

本工作采用文獻(xiàn)[4]的替代性需求模型,引入自適應(yīng)提升(adaptive boosting,Adaboost)的需求預(yù)測(cè)方法,進(jìn)行初始需求的刻畫.然后,基于文獻(xiàn)[4]中的替代性需求公式,對(duì)其中產(chǎn)品屬性值的刻畫及鄰近產(chǎn)品的選擇進(jìn)行優(yōu)化,即通過邏輯回歸(logistic regression,LR)算法預(yù)測(cè)暢銷概率,依據(jù)自動(dòng)賦權(quán)的產(chǎn)品屬性值進(jìn)行排序,從而選取屬性值相近的產(chǎn)品作為鄰近產(chǎn)品.最后,基于文獻(xiàn)[4]所提供的替代率估計(jì)公式及替代性需求刻畫公式,構(gòu)建出一種更優(yōu)的考慮產(chǎn)品特征屬性的替代性需求預(yù)測(cè)模型.

1 鄰近替代品選擇

1.1 問題描述

隨著市場(chǎng)競(jìng)爭(zhēng)的日益加劇,產(chǎn)品品類越來越豐富,同一品牌下多個(gè)產(chǎn)品的產(chǎn)品屬性(如顏色、尺寸、規(guī)格)具備一定的相似性.當(dāng)產(chǎn)品不再被售賣或是該產(chǎn)品缺貨時(shí),消費(fèi)者會(huì)有一定的概率選擇其他屬性相似的產(chǎn)品作為替代,即當(dāng)某個(gè)產(chǎn)品因故無法被售賣時(shí),其需求會(huì)轉(zhuǎn)移到其他產(chǎn)品[11].

定義1 (鄰近替代) 當(dāng)產(chǎn)品可以按照一些屬性值進(jìn)行排序時(shí),消費(fèi)者一般會(huì)選擇那些和首選商品差別不大的商品作為替代,此類替代被稱作鄰近替代.

在實(shí)際應(yīng)用中,會(huì)根據(jù)消費(fèi)者替代意愿與產(chǎn)品屬性相似度相結(jié)合的方式來估計(jì)產(chǎn)品的品類及缺貨替代率[4].具體實(shí)現(xiàn)方法如下:首先,對(duì)產(chǎn)品集合中的每個(gè)產(chǎn)品提取相關(guān)的屬性(如顏色、規(guī)格、價(jià)格);其次,對(duì)每個(gè)屬性給予權(quán)重,從而給出一個(gè)加權(quán)后的屬性值,將產(chǎn)品按照加權(quán)后屬性值由大到小排列,可以確定每個(gè)產(chǎn)品的鄰近替代品.這里屬性值的權(quán)重通常由銷售人員經(jīng)驗(yàn)獲得,受到人為因素干擾較大.因此,本工作采取數(shù)據(jù)驅(qū)動(dòng)的方式自動(dòng)確定屬性權(quán)重,提出一種基于暢銷預(yù)測(cè)的產(chǎn)品屬性值排序方法.

通常而言,對(duì)于屬性的權(quán)重賦值需要基于各屬性對(duì)消費(fèi)者決策的正向影響程度,即能夠刺激消費(fèi)者進(jìn)行消費(fèi)的力度.銷售人員可以結(jié)合需求、售價(jià)、市場(chǎng)環(huán)境等因素,根據(jù)經(jīng)驗(yàn)判斷同一品類下的產(chǎn)品哪些為暢銷品,哪些為非暢銷品,從而可以將產(chǎn)品屬性值作為特征,建立暢銷預(yù)測(cè)模型.而通過機(jī)器學(xué)習(xí)的方式可以確定產(chǎn)品各個(gè)屬性的權(quán)重和最終的產(chǎn)品屬性值.

1.2 暢銷概率預(yù)測(cè)模型

本工作采用邏輯回歸模型作為分類預(yù)測(cè)模型,通過將暢銷預(yù)測(cè)轉(zhuǎn)換為二值分類問題,對(duì)輸入的變量進(jìn)行線性加權(quán)分類,輸出二分類的概率值[12].

邏輯回歸算法的描述如下:假設(shè)有數(shù)據(jù)集D={Xi,Yi},i=1,2,···,N,其中Xi為一個(gè)樣本點(diǎn),包含{x1,x2,···,xn}多個(gè)變量屬性,Yi∈{0,1}表示預(yù)測(cè)類別.邏輯回歸可以表達(dá)為如下概率公式:

式中:θTx為屬性變量的線性組合;θ為變量的權(quán)重集合,線性加權(quán)組合公式為

接下來,基于極大似然估計(jì)推導(dǎo)得到損失函數(shù):

通常采取梯度下降的方式求解最小損失函數(shù)值下的最佳屬性權(quán)重,

式中:α為學(xué)習(xí)步長.以求偏導(dǎo)的方式經(jīng)過迭代獲取最優(yōu)的θ 權(quán)重集合.

本工作將產(chǎn)品的屬性作為特征,暢銷與否作為預(yù)測(cè)類別.經(jīng)過數(shù)據(jù)訓(xùn)練學(xué)習(xí)后得到各屬性的權(quán)重集合,以及各個(gè)產(chǎn)品的暢銷概率值.根據(jù)概率值對(duì)產(chǎn)品進(jìn)行排序,可獲得每個(gè)產(chǎn)品的鄰近替代產(chǎn)品.

2 鄰近替代率估計(jì)

得到產(chǎn)品排序以及鄰近替代關(guān)系后,可以對(duì)替代率進(jìn)行估計(jì).替代率主要包括兩種:一是基于品類的替代(assortment based,AB);二是基于缺貨的替代(stock-out based,SB).K¨ok[1]對(duì)這兩種替代機(jī)制進(jìn)行了清晰地描述:基于品類的替代是指商店不再售賣某一類產(chǎn)品時(shí),消費(fèi)者的需求轉(zhuǎn)移到了其他在售品上;基于缺貨的替代是指消費(fèi)者看中了某一個(gè)產(chǎn)品,有最喜歡產(chǎn)品的概念,但是商店此時(shí)該產(chǎn)品缺貨,消費(fèi)者購買了另一個(gè)類似的產(chǎn)品.

2.1 基于品類的替代率估計(jì)

2.2 基于缺貨的替代率估計(jì)

當(dāng)產(chǎn)品j 缺貨時(shí),定義產(chǎn)品i 對(duì)于產(chǎn)品j 的替代概率為αij,參考文獻(xiàn)[4]的做法,本工作定義該階段替代率的計(jì)算公式為

式中:αi可以被描述為產(chǎn)品i 的加權(quán)屬性值.

3 需求預(yù)測(cè)模型

3.1 Adaboost 回歸

Adaboost 回歸(Adaboost.R2)是一種Boosting 思想的集成學(xué)習(xí)方法[14].該方法首先從原始數(shù)據(jù)中訓(xùn)練出一個(gè)基分類器,根據(jù)其在樣本預(yù)測(cè)上的誤差來增加權(quán)重,并使用改變權(quán)重后的樣本重新訓(xùn)練基分類器.如此重復(fù),直到基學(xué)習(xí)器達(dá)到了預(yù)先設(shè)置的數(shù)目,最終將這些基學(xué)習(xí)器進(jìn)行加權(quán)集成,得到最終的輸出結(jié)果.本工作使用回歸決策樹作為基分類器.算法具體描述如下.

(1) 建立訓(xùn)練集T={Xi,Yi},i=1,2,···,N,這里Yi∈R;確定最大迭代次數(shù)N;初始化樣本權(quán)重wi=1,i=1,2,···,m.

建立回歸決策樹模型H(Xi)→Yi;

計(jì)算每個(gè)訓(xùn)練樣本的線性損失:

更新權(quán)重:wi→wiβ(1?Li).

(3) 針對(duì)輸入樣本Xi,每一棵決策樹都會(huì)有一個(gè)預(yù)測(cè)結(jié)果Ht,t=1,2,···,T,得到最終輸出

3.2 初始需求與有效需求

假設(shè)每個(gè)產(chǎn)品每周的初始需求Di服從正態(tài)分布,則其方差和均值可以估計(jì),記為δi和μi.沿用文獻(xiàn)[4]的公式,

式中:Di為基于Adaboost 模型所得的初始需求;為考慮了兩種替代性需求后的有效需求;EIi和ESi分別表示核心需求下產(chǎn)品i 的預(yù)期庫存水平和預(yù)期缺貨量[4];pj為產(chǎn)品j 是否被選擇的布爾決策參數(shù);αij和βij為第2 節(jié)已提及的基于缺貨的替代率和基于品類的替代率.

綜上所述,本工作所構(gòu)建的產(chǎn)品需求預(yù)測(cè)方法,可以看作是在基于Adaboost.R2 進(jìn)行需求預(yù)測(cè)后,依據(jù)鄰近產(chǎn)品間的替代效果對(duì)預(yù)測(cè)結(jié)果進(jìn)行有效調(diào)節(jié),從而得到最終的需求預(yù)測(cè)結(jié)果.流程如圖1 所示,其中產(chǎn)品均依據(jù)暢銷屬性值進(jìn)行排序,屬性值最接近的2 個(gè)產(chǎn)品即為相互的鄰近產(chǎn)品.

圖1 需求預(yù)測(cè)框架Fig.1 Framework of demand forecasting

步驟1 提取所預(yù)測(cè)產(chǎn)品的每周需求相關(guān)特征,包括前四周平均銷量、上周銷量、促銷影響因子、季節(jié)性因子等,預(yù)測(cè)目標(biāo)為本周需求,拆分訓(xùn)練集和測(cè)試集.

步驟2 通過Adaboost.R2 對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行訓(xùn)練預(yù)測(cè),得到預(yù)測(cè)數(shù)據(jù).

步驟3 根據(jù)經(jīng)LR 暢銷預(yù)測(cè)建模后的產(chǎn)品排序結(jié)果確定該產(chǎn)品的鄰近替代產(chǎn)品,并估計(jì)出品類替代和缺貨替代的替代率.

步驟4 基于替代率對(duì)步驟2 的預(yù)測(cè)結(jié)果進(jìn)行調(diào)節(jié),得到最終的需求預(yù)測(cè)結(jié)果.調(diào)節(jié)方法參見式(8).

4 實(shí)驗(yàn)結(jié)果分析

4.1 數(shù)據(jù)及參數(shù)描述

以下實(shí)驗(yàn)基于某手表廠商從2015 年下半年到2017 年底共18 萬在線銷售數(shù)據(jù),共涉及536款產(chǎn)品.

在基于產(chǎn)品屬性的鄰近替代率估計(jì)任務(wù)中,本工作提取了價(jià)格帶、殼圈尺寸、時(shí)尚度、機(jī)芯、材料賣點(diǎn)、表盤厚度、表殼形狀、表帶、表盤顏色、上市天數(shù)這10 個(gè)產(chǎn)品屬性特征,用于LR 暢銷預(yù)測(cè)排序建模.邀請(qǐng)銷售人員人工判斷哪些產(chǎn)品屬于暢銷產(chǎn)品,暢銷產(chǎn)品占比20%左右.LR 模型的評(píng)價(jià)指標(biāo)采用受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)值[15],該值越接近1,說明選擇的預(yù)測(cè)模型效果越佳.

在需求預(yù)測(cè)階段,本工作借鑒傳統(tǒng)需求預(yù)測(cè)方法,將該手表的銷售計(jì)劃轉(zhuǎn)化為按自然周的需求預(yù)測(cè)問題.提取的預(yù)測(cè)特征包括本周需求、前四周平均需求、前四周實(shí)際需求、促銷影響因子、淡季影響因子等,以預(yù)測(cè)下周需求情況.預(yù)測(cè)模型采用10 棵回歸決策樹模型進(jìn)行Adaboost 學(xué)習(xí)預(yù)測(cè);用于效果對(duì)比的支持向量機(jī)回歸(support vector regression,SVR)模型,采用默認(rèn)的徑向基函數(shù)(radial basis function,RBF).模型的評(píng)價(jià)指標(biāo)采用平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE)和擬合優(yōu)度R2[16].

式中:At是真實(shí)值;Ft是預(yù)測(cè)值.MAPE 表征了真實(shí)值和預(yù)測(cè)值的誤差,并且考慮了誤差和真實(shí)值之間的比例,是常見的用于評(píng)價(jià)回歸模型的指標(biāo),其值越小,說明模型預(yù)測(cè)準(zhǔn)確率越高;而擬合優(yōu)度R2表達(dá)的是回歸模型能解釋的因變量變異性的百分比,其值越接近1,說明模型擬合得越好.

4.2 結(jié)果分析

4.2.1 替代率估計(jì)結(jié)果

針對(duì)536 款產(chǎn)品進(jìn)行基于LR 的暢銷預(yù)測(cè),預(yù)測(cè)評(píng)估結(jié)果如圖2 所示.模型在測(cè)試集上的AUC 值可以達(dá)到0.87,說明模型可以較好地對(duì)產(chǎn)品的暢銷概率進(jìn)行預(yù)測(cè).

圖2 暢銷預(yù)測(cè)ROC 評(píng)價(jià)曲線Fig.2 ROC curve of good-selling prediction

通過LR 模型擬合后可以得到產(chǎn)品屬性的權(quán)重,表1 列出了屬性中排名前五的屬性及其權(quán)重大小.

表1 產(chǎn)品屬性權(quán)重Top5Table 1 Weight of Top5 product attributes

本工作從536 款產(chǎn)品中選取5 款暢銷產(chǎn)品用于進(jìn)一步分析,經(jīng)過暢銷預(yù)測(cè)后,5 款暢銷產(chǎn)品的排序如表2 所示.通過暢銷概率的方式進(jìn)行產(chǎn)品排序后,根據(jù)1.1 節(jié)的定義,將排序在每個(gè)產(chǎn)品前面和后面的產(chǎn)品,定義為其鄰近產(chǎn)品.

表2 產(chǎn)品暢銷概率排序Table 2 Ranking based on probability of good-selling

進(jìn)一步可以估計(jì)出產(chǎn)品間的替代率.基于品類的替代率為

基于缺貨的替代率為

4.2.2 銷售量預(yù)測(cè)結(jié)果

上述實(shí)驗(yàn)采用前100 周的數(shù)據(jù)用于訓(xùn)練模型,后21 周數(shù)據(jù)用于測(cè)試,并且對(duì)比了傳統(tǒng)SVR,Adaboost.R2 和本工作提出的通過替代率調(diào)節(jié)后的Ada.Sub 3 個(gè)算法.MAPE 與R2均為后21 周的預(yù)測(cè)效果指標(biāo),對(duì)比結(jié)果如表3 所示.可以明顯看到,Adaboost.R2 在MAPE 上比SVR 平均減少了9.248%,擬合優(yōu)度R2平均提升了0.364,效果顯著;而經(jīng)過替代率調(diào)節(jié)后,Ada.Sub 的預(yù)測(cè)值又比Adaboost.R2 在MAPE 上降低了1.392%,R2則進(jìn)一步提升至平均0.742 的解釋性水平.圖3 給出了MAPE 和R2兩個(gè)指標(biāo)效果的對(duì)比分析,可以很明顯看出Ada.Sub 在預(yù)測(cè)精度上的優(yōu)勢(shì).

圖3 預(yù)測(cè)指標(biāo)對(duì)比分析Fig.3 Comparison and analysis of prediction index

以產(chǎn)品C 為例,圖4 展示了預(yù)測(cè)的趨勢(shì)結(jié)果.從圖中可以看到,預(yù)測(cè)結(jié)果能夠基本判斷出產(chǎn)品需求的變化趨勢(shì),對(duì)廠商供應(yīng)鏈提前備貨具有一定的指導(dǎo)意義.

圖4 產(chǎn)品C 預(yù)測(cè)趨勢(shì)Fig.4 Forecast trend of product C

5 結(jié)束語

本工作針對(duì)考慮產(chǎn)品替代率的需求預(yù)測(cè)問題進(jìn)行了研究,提出了一種基于邏輯回歸的方法對(duì)產(chǎn)品暢銷預(yù)測(cè)的屬性值進(jìn)行排序,并對(duì)相鄰產(chǎn)品間的替代率進(jìn)行估計(jì).本方法得到的屬性值權(quán)重為模型訓(xùn)練所得,解決了傳統(tǒng)屬性權(quán)重受人為因素干擾的問題.同時(shí),還建立了基于Adaboost 的需求預(yù)測(cè)模型,就替代率估計(jì)對(duì)預(yù)測(cè)結(jié)果進(jìn)行了進(jìn)一步精準(zhǔn)調(diào)節(jié).實(shí)驗(yàn)結(jié)果表明,融合了產(chǎn)品替代率的Ada.Sub 模型具有較高的需求預(yù)測(cè)精度,優(yōu)于傳統(tǒng)的基于支持向量機(jī)的預(yù)測(cè)模型.此外,本方法也為企業(yè)需求預(yù)測(cè)提供了一種有效的新思路、新方法.下一步將結(jié)合產(chǎn)品銷售大數(shù)據(jù),進(jìn)一步研究和拓展需求預(yù)測(cè)的精度和廣度.

猜你喜歡
缺貨需求預(yù)測(cè)排序
作者簡(jiǎn)介
空氣顯卡新成員 RX6700XT開賣
淺談需求預(yù)測(cè)在企業(yè)中的應(yīng)用
恐怖排序
基于BP神經(jīng)網(wǎng)絡(luò)的濟(jì)南市物流需求預(yù)測(cè)
基于灰色模型對(duì)上海市電力需求預(yù)測(cè)分析研究
節(jié)日排序
“缺貨”等十四則
我是誰
破解賣場(chǎng)缺貨迷局
焉耆| 中牟县| 水富县| 大冶市| 正定县| 城口县| 武强县| 资溪县| 大方县| 西城区| 九台市| 桐城市| 永兴县| 宜川县| 潼南县| 云梦县| 德安县| 萝北县| 丹东市| 无极县| 筠连县| 衡南县| 延吉市| 麟游县| 五大连池市| 双江| 正阳县| 高尔夫| 偃师市| 沧源| 邹平县| 米林县| 额尔古纳市| 延长县| 高雄市| 河曲县| 阿克| 德令哈市| 游戏| 澄城县| 贞丰县|