錢竹
(數(shù)碼設(shè)計(jì)雜志社社長、總編輯)
全渠道零售,即在所有線上和線下渠道整合營銷、客戶關(guān)系管理,以及庫存管理的崛起產(chǎn)生了大量的關(guān)聯(lián)數(shù)據(jù),大大增強(qiáng)了數(shù)據(jù)驅(qū)動型決策的重要性和能力。
在這篇文章里, 我們將描述一個(gè)假想的收入管理平臺,這一平臺基于零售商的數(shù)據(jù)并控制零售策略的很多方面,如價(jià)格、營銷和倉儲。
我們專注在將經(jīng)濟(jì)學(xué)框架和數(shù)據(jù)挖掘方法的組合有以下兩個(gè)主要的原因:
我們可以從經(jīng)濟(jì)學(xué)教科書上找到上百個(gè)與零售有關(guān)的經(jīng)濟(jì)學(xué)模型,因?yàn)殛P(guān)于市場、折扣、競爭等問題在上個(gè)世紀(jì)得到了深入的研究。然而,許多模型都是高度參數(shù)化的(即嚴(yán)格的由帶有有限參數(shù)的公式所定義)并且不能足夠靈活而精確地對現(xiàn)實(shí)世界的問題建模。但數(shù)據(jù)挖掘提供了很多非參數(shù)建模技術(shù),可以幫助創(chuàng)建靈活而實(shí)用的模型。在最近十年里,也有許多成功的平衡抽象模型和機(jī)器學(xué)習(xí)技術(shù)的文章和案例研究已經(jīng)發(fā)表。
快速的數(shù)據(jù)循環(huán)使得在現(xiàn)代零售業(yè)中可以使用相對簡單的模型做出更加準(zhǔn)確的預(yù)測,因?yàn)樾∫?guī)模增量式的預(yù)測一般而言要比大決策更加容易。
例如,因?yàn)閷τ谝粋€(gè)新的顛覆性產(chǎn)品在消費(fèi)者心中的感知價(jià)值是未知的,要計(jì)算它的最優(yōu)價(jià)格是很困難的。但是根據(jù)需求和庫存水平實(shí)時(shí)調(diào)整促銷價(jià)格則是相對容易的。有一些成功的商業(yè)解決方案對價(jià)格優(yōu)化就幾乎丟棄了經(jīng)濟(jì)學(xué)模型,簡單的根據(jù)銷售閉環(huán)的反饋情況來決定價(jià)格的上升和下降。
以上兩點(diǎn)意味著在零售業(yè)自動化決策和動態(tài)優(yōu)化具有很高的潛力,因此我們專注于研究這個(gè)領(lǐng)域。本文很大篇幅用于綜述零售業(yè)者和研究人員發(fā)表的成果,這些成果都是他們在綜合應(yīng)用抽象經(jīng)濟(jì)學(xué)模型和數(shù)據(jù)挖掘方法構(gòu)建實(shí)際的決策和優(yōu)化系統(tǒng)中產(chǎn)生的。
本文主要受到 3 個(gè)案例研究的啟發(fā),分別出自 Albert Heijn,荷蘭最大的連鎖超市,Zara,一家國際服裝零售商,以及 RueLaLa,一家創(chuàng)新在線時(shí)尚零售商。我們同樣綜合了來自 Amazon、Netflix、LinkedIn 和許多獨(dú)立研究者和商業(yè)項(xiàng)目的結(jié)果。同時(shí),我們避免使用那些缺乏實(shí)踐支持的學(xué)術(shù)結(jié)果。
我們的研究主要著眼于與收入管理相關(guān)的優(yōu)化問題,包括營銷和定價(jià)等問題。更加特殊的數(shù)據(jù)挖掘應(yīng)用,如供應(yīng)鏈優(yōu)化和欺詐檢測, 數(shù)據(jù)挖掘過程實(shí)現(xiàn)的細(xì)節(jié)(如模型質(zhì)量的驗(yàn)證)則不在這我們研究的范疇內(nèi)。
我們首先引入一個(gè)簡單的框架將零售商的行為,利潤和數(shù)據(jù)聯(lián)系在一起。此框架將作為更統(tǒng)一的方式來描述分析問題。
本文的主體部分探討了一系列與零售業(yè)相關(guān)的優(yōu)化問題。我們將在不同章節(jié)逐個(gè)介紹這些問題。每個(gè)章節(jié)會簡要描述問題,并提供一組業(yè)務(wù)案例和應(yīng)用,以及詳細(xì)介紹如何將問題分解成經(jīng)濟(jì)學(xué)模型和數(shù)據(jù)挖掘任務(wù),使得可以通過數(shù)值優(yōu)化方法來解決業(yè)務(wù)問題。然后,我們會有一個(gè)章節(jié)專門討論這些方法在實(shí)際應(yīng)用中的可期的經(jīng)濟(jì)收益。 最后,總結(jié)部分會對這些問題之間的依賴關(guān)系進(jìn)行討論,從而闡明一般的原則和關(guān)鍵點(diǎn)。
本文介紹了6個(gè)主要與營銷和定價(jià)相關(guān)的優(yōu)化問題,這些問題都能夠應(yīng)用數(shù)據(jù)挖掘技術(shù)來解決。盡管這些問題非常不同,但我們嘗試建立了一般性的框架來幫助設(shè)計(jì)求解所需的優(yōu)化和數(shù)據(jù)挖掘任務(wù)。
該框架的基本思想是用一個(gè)經(jīng)濟(jì)指標(biāo),例如毛利率作為優(yōu)化目標(biāo),并將這一目標(biāo)作為零售商行為(如營銷活動或者分類調(diào)整)的函數(shù)。
同時(shí)計(jì)量經(jīng)濟(jì)學(xué)目標(biāo)也是數(shù)據(jù)的一個(gè)函數(shù),即計(jì)量經(jīng)濟(jì)模型應(yīng)該被零售商的特性參數(shù)化,從而在其輸出中產(chǎn)生一個(gè)數(shù)值,如毛利率。
例如,某零售商在計(jì)劃一個(gè)郵件營銷活動??尚械男袆涌臻g可被定義為一組對于每個(gè)客戶發(fā)送/不發(fā)送決策集合,而活動的毛利率則決定于營銷動作(有些人會接受激勵而另一些人不會)以及給定客戶的期望收入和郵件成本。這一方法可以更形式化的由如下公式表達(dá):
此公式里G是可用于分析的數(shù)據(jù),是零售業(yè)者行為和決策空間, 是計(jì)量經(jīng)濟(jì)模型函數(shù),其參數(shù)是d和A,而A0是最優(yōu)策略。這一框架由文獻(xiàn)[JK98]整理提出。
模型G的設(shè)計(jì)十分依賴于問題本身。在大部分情況下,對毛利率建模和優(yōu)化都是合理的。但是,有些情況下其他的目標(biāo)也是有可能的,就如下一章探討的響應(yīng)建模。同時(shí)需要注意的是優(yōu)化問題(1)也跟時(shí)間有關(guān)系,因?yàn)榄h(huán)境會隨著如新產(chǎn)品的上架、競爭對手的行動等因素變化,零售業(yè)者自己的行為也會產(chǎn)生影響。
數(shù)據(jù)挖掘在這一優(yōu)化問題中的角色是非常重要的,因?yàn)橛?jì)量模型G通常都比較復(fù)雜且必須基于數(shù)據(jù)通過回歸等數(shù)據(jù)挖掘技術(shù)學(xué)習(xí)確定。
在某些情況下因?yàn)閺?fù)雜性太高(如用戶的行為很難精確預(yù)測)或者因?yàn)闊o法將現(xiàn)有數(shù)據(jù)做外推(如對于完全新的服務(wù)),模型是無法完全確定的。這時(shí),可以用A/B測試和問卷調(diào)查來獲得額外的數(shù)據(jù)來改進(jìn)模型的精度。
1.1.1 問題描述
在廣告或者特價(jià)優(yōu)惠活動中,需要決定將一些資源投放給一些客戶。而這些資源都是有成本的,如郵寄印制商品的目錄的資金成本,或者一些負(fù)面效應(yīng)(如使得用戶取消郵通知訂閱)。
同時(shí), 這些資源將會影響用戶的決策,如促使他們更多地消費(fèi)或者購買更高價(jià)值的產(chǎn)品。其目標(biāo)是找到一組最靠譜的候選客戶,對他們投入資源后能夠使得業(yè)績最大化。
投入的資源可以是同質(zhì)的(如所有參加的客戶都得到同樣的激勵)也可以是個(gè)性化的。在后一種情況下,零售業(yè)者將對每個(gè)不同的客戶提供不同的激勵如不同產(chǎn)品的優(yōu)惠券來最大化總體的收益目標(biāo)。
1.1.2 應(yīng)用
響應(yīng)建模被廣泛的應(yīng)用在營銷和客戶關(guān)系管理上:
確定特定的折扣、優(yōu)惠券和特價(jià),需要識別出客戶對這些激勵的反應(yīng)。
有這對性的郵件促銷、活動和贈品(如4S店提供的免費(fèi)太陽眼鏡)通常需要識別出最優(yōu)價(jià)值的客戶來降低營銷費(fèi)用??蛻敉炝粲?jì)劃需要識別出那些可能會離開但可以通過激勵來改變主意的客戶。例如,電商可以向那些放棄購物車或者離開搜索會話的客戶發(fā)送特價(jià)優(yōu)惠。
在線目錄和搜索結(jié)果可以根據(jù)客戶對某些商品的的喜好來重新調(diào)整。
響應(yīng)建模幫助優(yōu)化了電郵促銷來避免不必要的垃圾郵件,這些垃圾郵件可能會讓客戶取消郵件訂閱。
1.1.3 求解
基于以上的討論,我們現(xiàn)在可以認(rèn)識到這個(gè)問題就是資源分配的優(yōu)化問題,而優(yōu)化問題由一個(gè)目標(biāo)函數(shù)驅(qū)動。一個(gè)最基本的方法是根據(jù)每個(gè)客戶的響應(yīng)概率和期望凈價(jià)值來對促銷活動的整體利潤建模。
這里 Pr(R│u;I) 是給定客戶u對激勵I(lǐng)的響應(yīng)概率,g(u|R)) 是這個(gè)客戶響應(yīng)的激勵的凈價(jià)值,而c則是激勵的成本。公式中第一項(xiàng)是響應(yīng)從響應(yīng)用戶獲得的凈收益,而第二項(xiàng)則是對應(yīng)在沒有響應(yīng)的客戶上的期望損失。目標(biāo)是通過找到一組最有可能響應(yīng)活動并能貢獻(xiàn)高利潤的客戶子集來最大化G。因?yàn)楣?(2) 可以約簡如下:
這里 E{g|u;I} 表示對給定客戶在假定他會接受激勵的情況下的毛利率的數(shù)學(xué)期望,而客戶的選擇標(biāo)準(zhǔn)則要符合以下條件:
同時(shí),最優(yōu)的客戶子集 U 可以定義為最大化毛利率的子集:
我們也可以以隨機(jī)分配激勵為基準(zhǔn)的凈值最大化。為此,我們假設(shè)參與該次營銷活動的客戶數(shù)固定為 |U|。首先,我們將公式 (5) 展開,顯示的包括對于隨機(jī)選取的 |U| 個(gè)客戶的營銷活動的期望毛利率。
此處 E{g|I} 是所有客戶上的平均凈價(jià)值。這一平均凈價(jià)值是常數(shù),因此在 |U| 確定的情況下在目標(biāo)函數(shù)中可以被略去。因此,公式(5)在固定 的情況下同樣可以得到(6):
然而,文獻(xiàn) [VL02]提出這一模型存在一定的缺陷,因?yàn)樵撃P推蛴谝子诮邮芗畹目蛻簦鴽]有考慮那些有沒有激烈都會貢獻(xiàn)同樣利潤的的客戶。為解決這一 缺陷,我們需要根據(jù)以下四種情況來計(jì)算客戶集合 U 的毛利率:
G1 - 根據(jù)公式(5)選擇 U 并向中所有客戶發(fā)送激勵
G2 - 隨機(jī)選擇 U 并向 U 中所有客戶發(fā)送激勵
G3 - 根據(jù)公式(5)選擇 U 但是不發(fā)送任何激勵
G4 - 隨機(jī)選擇 U 但是不發(fā)送任何激勵
公式(5)是最大化 之差即相較于隨機(jī)投放的提升度。另一種方法是優(yōu)化,這一目標(biāo)函數(shù)不僅僅度量相較于隨機(jī)投放的提升度同時(shí)還考慮去除掉在同樣的客戶集合上不做任何激勵的提升度。在此情況下,公式(5)變?yōu)槿缦滦问剑?/p>
此處最后一項(xiàng)對應(yīng)的是未被激勵的客戶的期望凈價(jià)值。這一方法被稱為差分響應(yīng)分析或者提升度建模由文獻(xiàn) [BE09]提出。
值得注意的是,公式(5)和(8)都不是通過最大化營銷費(fèi)用來優(yōu)化的??紤]如下情況,每個(gè)響應(yīng)的用戶可以貢獻(xiàn) 100 美元的凈利潤,而激勵費(fèi)用為1 美元。如果一個(gè)客戶組有 100 萬客戶,其中有 0.5% 的潛在響應(yīng)者,則花費(fèi)最大的營銷活動是對每個(gè)客戶都做觸達(dá)則最終將損失 50 萬美元(總的響應(yīng)者貢獻(xiàn)的 50 萬美元凈價(jià)值減去活動費(fèi)用 100 萬美元)。
公式(8)對于各種類型的價(jià)格折扣特別重要(優(yōu)惠券、臨時(shí)價(jià)格折扣、特價(jià))。考慮如下問題:“一個(gè)零售商應(yīng)該向每天都買蘋果的人提供蘋果優(yōu)惠券嗎?” 根據(jù)公式(5),回答是肯定的。因?yàn)檫@個(gè)人很有可能會使用優(yōu)惠券。
然而,更可能的是這個(gè)客戶用更低的價(jià)格購買了同樣數(shù)量的蘋果,根本上這會降低零售商的利潤。公式(8)考慮了默認(rèn)的客戶行為從而消除了這一問題。我們在下一節(jié)將繼續(xù)討論價(jià)格區(qū)分問題因?yàn)檫@一是個(gè)復(fù)雜的問題遠(yuǎn)超了公式(8)范疇。
公式(5)和(8)中凈收入的數(shù)學(xué)期望能夠基于過去客戶對激勵是否接受的歷史數(shù)據(jù)用分類或者回歸模型來確定。這一問題可能是非常有挑戰(zhàn)性的,特別是當(dāng)需要評估的激勵與過往出現(xiàn)過的都存在某種程度上的差異。
在這種情況下,全規(guī)模的活動上線之前需要在一個(gè)客戶測試組上進(jìn)行測試。另外,對于零售業(yè)者而言毛利率并非唯一的關(guān)鍵指標(biāo)。在公式(5)和(8)中使用的毛利率度量關(guān)心的是第一次付款后即時(shí)的匯報(bào),從客戶關(guān)系管理的角度看這是非常簡單的視角。
零售業(yè)者還會關(guān)心其他不同的度量,度量上的多元性是如此巨大以至于有一門專門研究這個(gè)問題的經(jīng)濟(jì)學(xué)分支 - 傾向性建模[SG09, LE13]- 這一學(xué)科發(fā)展了不同的模型來預(yù)測用戶未來的行為。最重要的傾向性模型包括:
生命價(jià)值預(yù)測。生命價(jià)值模型是估計(jì)一個(gè)客戶在其生命周期內(nèi)可以貢獻(xiàn)的收入或者利潤總額。這一指標(biāo)對于那些目標(biāo)為獲取新客的營銷活動而言是很重要的。
錢包份額預(yù)測。錢包份額模型用來估計(jì)用戶對于某些類型商品,如雜貨或者服飾,在某一零售商及其在各競爭對手那花錢的比例。這一度量能夠揭示哪些客戶具有貢獻(xiàn)高收入的潛力,因?yàn)檫@一模型能夠用在忠誠計(jì)劃和提升使用的營銷活動中。
類型擴(kuò)展傾向。該模型估計(jì)首次購買某一類型的商品后,從休閑產(chǎn)品轉(zhuǎn)換到奢侈品的可能性。這一模型能夠幫助設(shè)計(jì)目的是獲得使用擴(kuò)展的活動。
流失傾向。這一模型估計(jì)客戶從給定零售商流失并轉(zhuǎn)換到競爭對手的可能性。如果客戶具有較高的流失傾向則可以定向進(jìn)行挽留活動。例如,一個(gè)零售商可以識別出那些放棄了在線購物車或者退出了搜索會話但是提供一定折扣或者贈品后會改變主意的客戶。
購物習(xí)慣改變傾向。每個(gè)客戶的購物習(xí)慣最終確定了其對一個(gè)零售商的價(jià)值,即客戶的購買頻率、購買什么產(chǎn)品、購買什么類型的產(chǎn)品等等。這些習(xí)慣通常是穩(wěn)定的,一旦零售商改變一個(gè)客戶的分層,這個(gè)分層將會持續(xù)。
因此,零售業(yè)者通常對找到那些對改變習(xí)慣比較開放的客戶感興趣, 如那些從一個(gè)城市遷移到另一個(gè)城市的人群, 從學(xué)校畢業(yè)的學(xué)生, 剛剛結(jié)婚的人群等等。一個(gè)典型的例子是預(yù)測客戶是否在懷孕早期 [DG12]因?yàn)樾律恼Q生會顯著的改變客戶的購物行為。
以上模型都能夠嵌入類似公式(8)的公式來代替毛利率目標(biāo)。我們在后面的小節(jié)中將針對討價(jià)格差異化的情況下對折扣的響應(yīng)傾向建模的情況仔細(xì)探討傾向性建模。關(guān)于傾向性建模的更多細(xì)節(jié)可以參考 [FX06]和 [SG09]兩本書。
這一框架也能夠擴(kuò)展到在多個(gè)可能的激勵方案中選擇最優(yōu)的方案。例如,一個(gè)零售商可以估計(jì)對于兩個(gè)激烈方案 A 和 B(例如巧克力冰激淋和香草冰激淋)的期望表現(xiàn)然后對于給定的用戶可以根據(jù)以下標(biāo)準(zhǔn)[WE07]來選擇最優(yōu)的選項(xiàng):
最后,值得注意的是響應(yīng)建模是與客戶分群緊密耦合的:
響應(yīng)建模能夠用來檢驗(yàn)通過聚類行程的客戶分群的可行性。一個(gè)分群應(yīng)該對特定的營銷計(jì)劃有持續(xù)的響應(yīng)。
傾向性模型是基于客戶數(shù)據(jù)訓(xùn)練得到的回歸和分類模型。客戶分群可以參考對于主要回歸量的分析結(jié)果。另一方面,從聚類結(jié)果中也可以發(fā)現(xiàn)合理的傾向性模型。
1.2.1 問題說明
一組激勵中的每一項(xiàng)激勵對應(yīng)著一個(gè)產(chǎn)品或者其他目錄項(xiàng)目。展示這些激勵并不直接與費(fèi)用成本相關(guān),但是只有有限數(shù)量的激勵能夠展示給用戶。從這個(gè)角度來說,每個(gè)激勵的展示都會占用一定的屏幕空間或者客戶的注意力,所以給客戶提供的某個(gè)激勵的負(fù)面激勵能夠被機(jī)會成本的損失來度量。在這樣的目標(biāo)下就需要將激勵的子集對于每個(gè)客戶而言都是個(gè)性化的(如網(wǎng)站上的推薦)從而最大化群體的購買表現(xiàn)。
1.2.2 應(yīng)用
該問題最典型的應(yīng)用有推薦系統(tǒng), 個(gè)性化搜索結(jié)果, 和定向廣告。 此外還有一些其他重要的應(yīng)用:
廠商贊助折扣可以歸為這類問題,因?yàn)榱闶凵虒畹某杀静魂P(guān)心(由廠商覆蓋這部分成本), 他們僅關(guān)心有效的定向。廠商贊助的活動被廣泛的應(yīng)用在很多零售細(xì)分領(lǐng)域,如雜貨店或者百貨商店,因?yàn)檫@些廠商市場份額的提升有很重的依賴。
交叉銷售的營銷能也夠從推薦模型中獲益,因?yàn)橐恍┩扑]技術(shù)能夠揭示出客戶畫像中的隱含維度,如生活方式。這些能力對于跨類之間的推薦是特別有用的,可以基于客戶服飾方面的消費(fèi)行為向客戶推薦家居或者廚具。
推薦系統(tǒng)可以將用戶的購買和瀏覽歷史概括為心理學(xué)畫像,因此乏味的著裝品味或者運(yùn)動型的生活方式能夠量化測量。同樣的技術(shù)也可以根據(jù)競爭者銷售產(chǎn)品的來對競爭者畫像,就像根據(jù)客戶購買來對客戶畫像。一些推薦算法能夠基于文本描述來區(qū)分產(chǎn)品的心理維度,如生活方式等。所以商家可以利用它們來評估產(chǎn)品描述,也可以用來獲得關(guān)于產(chǎn)品定位的適當(dāng)措辭的建議。
特別需要注意的是盡管推薦通常被認(rèn)為是線上服務(wù)特有的,但其所產(chǎn)生的基本原則和技術(shù)對于零售業(yè)的許多方面也是非常重要的。因?yàn)檫@些技術(shù)致力于揭示客戶對產(chǎn)品興趣的隱含關(guān)系。而這是零售商最基本的任務(wù)。
1.2.3 解決方案
推薦系統(tǒng)在過去20年是非常受關(guān)注的研究領(lǐng)域,[JZ10, RR10]兩本書提供了對幾十種在各種論文,演講和白皮書中提出的推薦算法和技術(shù)的系統(tǒng)化視角。
某種程度上,推薦技術(shù)的高度多樣性在于一些實(shí)現(xiàn)推薦時(shí)遇到的挑戰(zhàn),如客戶評分的稀疏性,計(jì)算的可擴(kuò)展性,以及缺乏新物品和客戶的信息。
顯然,我們無法在本節(jié)中綜述哪怕一下部分方法和算法,而且在此處探討這些也沒有太多的意義,因?yàn)檫@樣的綜述俯拾皆是。相反我們將關(guān)注于驅(qū)動設(shè)計(jì)推薦系統(tǒng)的目標(biāo)和效用函數(shù)而基本上忽略這一問題的算法和技術(shù)側(cè)的細(xì)節(jié)。
從計(jì)量經(jīng)濟(jì)學(xué)的觀點(diǎn)來看,推薦系統(tǒng)問題與電商和全渠道商業(yè)在很多零售領(lǐng)域的興起帶來銷售品類的快速擴(kuò)張是緊密相關(guān)。大的平類增加了很多非暢銷產(chǎn)品,每一個(gè)產(chǎn)品的銷售量和貢獻(xiàn)的收入都是很少的,但是這個(gè)“長尾”的總體貢獻(xiàn)是非常顯著的。
傳統(tǒng)推薦技術(shù)如推廣最暢銷的商品不能有效利用非暢銷商品的潛力,這就需要更巧妙的推薦方法在數(shù)百萬他或者她從未探索過的產(chǎn)品中對其進(jìn)行引導(dǎo)。
因?yàn)槲覀冎饕P(guān)注模型對客戶在產(chǎn)品上的偏好的描述,我們將從根據(jù)效用函數(shù)的復(fù)雜性從簡單到負(fù)責(zé)來介紹使用最廣的推薦技術(shù)。 我們將依據(jù)如下圖所示的推薦技術(shù)層次分類圖。這個(gè)層次分類綜合了推薦系統(tǒng)的常用分類,但也不是完全一致:
(1)單一目標(biāo)
讓我們從單一目標(biāo)推薦任務(wù)的基本定義開始,這一定義被廣泛的應(yīng)用在推薦系統(tǒng)的文獻(xiàn)之中。零售商向用戶群體 U={u_1,...,u_m } 銷售物品J={j_1,...,j_n }。評分函數(shù) R:J×U 表示一個(gè)用戶對一個(gè)物品的觀點(diǎn)從負(fù)面(“不喜歡”)到正面(“喜歡”),通常使用數(shù)字來表示。
一些用戶和物品對的評分值可以基于用戶的評分或者通過分析購買歷史,網(wǎng)站訪問記錄來估計(jì)。推薦任務(wù)則可以被定義為對給定用戶-物品對(u,j)評分值r_(u,j)的預(yù)測。
有兩種方法可以解決評級預(yù)測問題:通過查找與特定用戶過去喜歡的項(xiàng)目相似的項(xiàng)目來獨(dú)立估計(jì)每個(gè)用戶的評分; 也可以通過對來自與給定用戶類似的用戶的評分進(jìn)行平均來估計(jì)評分。這兩種方法分別被稱為內(nèi)容過濾和協(xié)作過濾。
(2)內(nèi)容過濾
內(nèi)容過濾的主要思想是基于對用戶過往對于產(chǎn)品的偏好,行為和購買。盡管不可以對內(nèi)容過濾做不同的解釋, 我們選擇將其作為分類問題[PZ07]來強(qiáng)調(diào)數(shù)據(jù)挖掘的應(yīng)用:
每個(gè)用戶可以被視作一個(gè)對物品預(yù)測評分的回歸模型。一個(gè)特殊的例子是可以用二分類將物品分為兩個(gè)類別 - “喜歡”和“不喜歡”。
一個(gè)用戶的畫像就是上面介紹的回歸模型的一個(gè)實(shí)例。這一模型使用該用戶的已知評分(顯示評分,購買歷史等等)來訓(xùn)練。
給指定用戶的推薦物品列表是通過對所有目錄物品采用該用戶對應(yīng)的回歸模型預(yù)測評分然后選擇那些估計(jì)評分最高的物品子集來獲得的。
盡管以上的過程似乎是是比較直接的,但是實(shí)際上確實(shí)非常挑戰(zhàn)的。因?yàn)橛脩艉臀锲肥歉静煌膶?shí)體,而且要找到一種可以直接將物品轉(zhuǎn)換成回歸模型可以使用的用戶偏好這種微妙的東西。
最主要的問題是存貨屬性諸如品牌、物品名,或者價(jià)格對于衡量物品對用戶的效用是根本不夠的。盡管一些客戶能夠被滿足忠于某品牌或價(jià)格取件的特征,但是需要更多微妙而有信息的維度如生活方式或者品味來描述觀察到的模式和共性。
這些隱式的維度對于如電影、書籍、音樂,甚至是如服飾這樣的有形物品都是非常重要的。零售商可以用如下的方法基于標(biāo)準(zhǔn)的分類技術(shù)來對帶有隱含維度的物品打標(biāo)簽 [GH02]:
例如,服裝可以用諸如時(shí)髦、保守、運(yùn)動等標(biāo)簽來標(biāo)識。
標(biāo)準(zhǔn)產(chǎn)品屬性(如文本描述)旨在向客戶提供特定的營銷信息,因此它們隱含地包含了一些無形的屬性。因此,人工評分項(xiàng)目的物品子集可以用于構(gòu)建將從產(chǎn)品屬性映射到隱含維度的分類模型。例如,可以使用貝葉斯分類方法來估計(jì)描述在隱含屬性值出現(xiàn)時(shí)詞出現(xiàn)的條件概率 Pr(詞項(xiàng)描述 | 隱含屬性值)。物品然后可以通過計(jì)算后驗(yàn)概率 Pr(隱式屬性值 | 項(xiàng)目描述)來自動分類沒有人工評分的商品。
一般化的來看,內(nèi)容過濾和物品建模實(shí)際是信息檢索任務(wù),所以許多的為恩本挖掘和搜索技術(shù)(例如,[MA08]的綜述所提到的)可以被用來構(gòu)建推薦系統(tǒng)。我們在此略過這些細(xì)節(jié),因?yàn)閺挠?jì)量經(jīng)濟(jì)的角度來看這些都不是最重要的部分。
協(xié)同過濾.前面部分提到的隱含維度的問題具有重要意義,此問題可以引導(dǎo)我們了解推薦技術(shù)的第二個(gè)系列。這個(gè)問題源于根本無法嚴(yán)格的對人的口味和傾向建模。
協(xié)同過濾是一種自然的,也許是唯一不需要對系統(tǒng)進(jìn)行很多人工工作的解決方案 - 推薦決策中對"人的因素"的需求通過其他用戶的反饋來滿足。
最基本的協(xié)同過濾模型 [RE04, BR98]直接由用戶之間的相似度度量來定義:
此處 r_u,j 為用戶 u 對 j 物品的評分,U 是所有用戶的集合或者啟發(fā)式選取的給定用戶的鄰近用戶,λ 是規(guī)范化系數(shù),sim(u,v) 是兩個(gè)用戶之間
的相似度度量, 而是戈丁用戶的平均評分:
假設(shè) J_u 是一組用戶評分過的物品。公式 (10) 使用的平均用戶評分概念來建模用戶比其他用戶在打分傾向上是偏高還是偏低,因?yàn)樗麄冇械囊蟾哂械囊蟮?。雖然不是絕對必要,這一修正在實(shí)踐是上非常重要并在最開始實(shí)現(xiàn)協(xié)同過濾時(shí)就被廣泛應(yīng)用了。
一般用余弦距離或者皮爾森相關(guān)系數(shù)來計(jì)算評分向量 J_u 和 J_v 之間的相似度。此外,文獻(xiàn) [ER98, SU09]介紹了很多對于此基本相似度度量進(jìn)行調(diào)整的多種方法來改進(jìn)使用中的性能。
模型(10)存在一些顯著的缺陷,首先這一模型的計(jì)算復(fù)雜性(與物品和用戶數(shù)量成正比)很高,其次用戶的評分是非常稀疏的。評分的稀疏性是指每個(gè)用戶都只會對很小一部分物品進(jìn)行評分,所以在計(jì)算向量 J_u 和向量J_v 的相似度時(shí)經(jīng)常會出現(xiàn)沒有重合的元素,這會降低推薦的質(zhì)量。
例如,眾所周知 Amazon[SA01]和 Netflix[YK08]的評分矩陣中的評分缺失率達(dá)到 99%。為了克服這一限制,基于用戶的模型(10)在通常被概念上非常相似的基于物品的模型 [SA01, YK08]所取代:
其中物品之間的相似度度量是基于那些在兩個(gè)物品上都有評分的用戶的基準(zhǔn)評分來計(jì)算的?;鶞?zhǔn)評分同時(shí)考慮了用戶偏差(用戶的平均評分值相較于整體評分的偏差)以及物品偏差(物品的平均評分相較于整體評分的偏差)。
值得注意的是,有一簡單的方法來實(shí)現(xiàn)公式(12),此方法通過尋找頻繁項(xiàng)集(被頻繁一起購買的物品)并基于在頻繁項(xiàng)集的同現(xiàn)來計(jì)算相似度。這一方法因其簡單被視為“窮人的推薦引擎”[RE03]。
模型(10)和(12)屬于所謂最近鄰模型,這些模型通過分析相似的用戶或者物品的鄰居來估計(jì)他們的評分。這一系列的算法也包括很多變種的技術(shù) [SU09]通過使用跟緊湊的概率模型或者其他近似方法來取代計(jì)算開銷昂貴的檢查鄰居的方法。
盡管最近鄰模型是一種被諸如亞馬遜等領(lǐng)先的零售商驗(yàn)證過的推薦技術(shù)。但在根本上這些技術(shù)還是在根本上具有在內(nèi)容過濾中就有的隱含維度所帶來的問題。前面考慮的用戶之間和物品之間的相似度度量對于揭示用戶和無偏之間的復(fù)雜關(guān)系,其能力是有限的。
這與信息檢索里面的同義搜索和多義搜索棉面臨的問題是類似的,要揭示搜索者的實(shí)際意圖,并將其意圖翻譯成文本和查詢之間的相似度是非常挑戰(zhàn)的事情。
為了解決這一問題,一種被稱為隱含語義分析的的技術(shù)被提出來[DR90]。該方法被提出來 10 年后被用來設(shè)計(jì)推薦系統(tǒng) [SA00],并開創(chuàng)了一類新隱含因子模型。
隱含因子模型主要的思想能夠被描述如下:評分函數(shù) R 能夠被表達(dá)成m×n 矩陣(m 是用戶數(shù),n 是產(chǎn)品數(shù)), 其中的元素是評分值。這可以被當(dāng)作一個(gè)線性空間問題。
推薦任務(wù)則可以被重新定義為用其他評分向量的組合來計(jì)算用戶評分向量。實(shí)際上,公式(10)自然的就是一種權(quán)重由相似度函數(shù)定義的評分制的線性組合。然而,問題是評分矩陣缺失評分而稀疏,因偏見和隨機(jī)因素通常帶有噪音,而且基于物品維度則限制了揭示用戶品味的能力,而品味通常是與一組物品相關(guān)而不是與單個(gè)物品相關(guān)。
換句話說, 被散落在巨大的低密度矩陣中并混有一定程度噪音的信號智能通過研究隱含模式才能顯示出來。隱含因子模型的思想是用低維度的基來近似一個(gè)高維線性空間。這有助于達(dá)成以下目標(biāo):
1)較少的維度能夠幫助把信號的能量集中,則每個(gè)基向量對評分估計(jì)的貢獻(xiàn)都是顯著的。它通過丟棄簡單的不適應(yīng)這些較小的基啊的波動來減少噪聲。
2)基本的計(jì)算過程可以被設(shè)計(jì)來產(chǎn)生有著最少依賴的基向量,從而有效的揭示用戶品味的主要傾向,這些傾向每個(gè)對應(yīng)一個(gè)基向量。例如,Netflix 用這一方法來預(yù)測電影評分 [YK08, YK09]時(shí), 系統(tǒng)產(chǎn)生的維度清晰的對應(yīng)著諸如喜劇,男女等坐標(biāo)軸。
集合中的每個(gè)點(diǎn)沿著 R_1 和 R_2 維度都有著很大的坐標(biāo)值并顯示出數(shù)據(jù)的復(fù)雜而不規(guī)則的結(jié)構(gòu)。然而,在另一個(gè)坐標(biāo)系 B 中則揭示了數(shù)據(jù)可以被維度 B_1 有效描述,而維度 B_2 則并不重要,這暗示了這是一個(gè)一維的隱含因子模型。
某種程度上,隱含因子模型能夠與離散余弦變換 (DCT) 相比較,離散余弦變換被用在圖像壓縮算法諸如 JPEG 中來用少量的諧波來近似圖片。
以上的思考鏈引導(dǎo)我們到如下的隱含因子的形式化模型。首先選擇維數(shù)bn,m 并將每個(gè)用戶和物品都當(dāng)作該維度空間中的一個(gè)向量。我們將用戶 u的向量標(biāo)識為 p_uR^b, ∈物品 j 的向量標(biāo)識為 q_jR^b∈。這些向量是基于評分舉證計(jì)算 R 得到的,計(jì)算過程中通過某種辦法讓向量 b 的個(gè)分量都對應(yīng)到上面所述的一個(gè)隱含維度。
因此,用戶和物品都可以在同樣的主題下進(jìn)行編碼,同時(shí)評分可以通過計(jì)算兩個(gè)向量的內(nèi)積,即將向量的維度兩兩對應(yīng)相乘然后求和得到:
有許多不同的方法來計(jì)算用戶和物品的隱含因子向量 p_u 和 q_j。最直接的方法就是用奇異值分解 (SVD) 對評分矩陣 R 進(jìn)行分解。然而,基于計(jì)算穩(wěn)定性和復(fù)雜性的考慮,在實(shí)踐中一般使用迭代的梯度瞎講優(yōu)化方法[YK09]。
下圖展示了卷積(10)和(13)之間的區(qū)別。左邊對于給定物品的稀疏的評分向量與稀疏度相似的給定用戶做卷積得到評分估計(jì)。而在右邊,評分是通過計(jì)算兩個(gè)降維后且能量密度很好的向量的卷積得到的。
(3)多目標(biāo)
以上討論的推薦方法本質(zhì)上都是由一個(gè)單一目標(biāo)驅(qū)動,這一目標(biāo)是提供最好的語義匹配或者預(yù)測偏好評分。然而,推薦精度并不是推薦系統(tǒng)設(shè)計(jì)的唯一考慮,零售商可能有興趣對綜合多個(gè)有沖突的目標(biāo)在一起給用戶提供推薦。
例如,食品雜貨商可能有興趣提升具有較短貨架期的易腐食物的銷量,時(shí)尚商店可能希望推廣贊助品牌或當(dāng)季款,更多的零售商可以從推薦較高利潤率的產(chǎn)品或考慮產(chǎn)品庫存水平避免以避免缺貨來獲得更好收益。
文獻(xiàn) [JW10]提出了多目標(biāo)推薦系統(tǒng)并在 LinkedIn[RP12]中做了大規(guī)模驗(yàn)證。在 LinkedIn 的例子中, 其主要的目標(biāo)是給候選人推薦語義上匹配的工作機(jī)會,其次是顯示找工作的行為。[RP12]描述了該方法,將推薦任務(wù)定義為如下的優(yōu)化問題:
此處:
ˉr 是由底層推薦系統(tǒng)基于語義匹配和相關(guān)性產(chǎn)生的原生推薦向量,ˉr 中的第 j 個(gè)元素表示的是第 j 個(gè)產(chǎn)品的相關(guān)性分值(或排序)。
ˉf 是二級特征值向量,ˉf 中的第個(gè)元素對應(yīng)的是第 j 個(gè)產(chǎn)品在次要目標(biāo)上對應(yīng)的分值。例如,這一向量可以產(chǎn)品的毛利率。
R(·) 是組合排序函數(shù)其綜合了 ˉr 和 ˉf 形成一個(gè)新的物品排序平衡了兩個(gè)目標(biāo)。
g(·) 表示度量推薦系統(tǒng)性能的整體效用函數(shù)。
E{} 對所有推薦效果的平均。
(·)_(1...K) 表示的是前 K 個(gè)具有最高分?jǐn)?shù)的元素,這里 K 是給用戶推薦的物品數(shù)。例如,如果 ˉr 中包括在冊的所有 n 個(gè)產(chǎn)品的推薦分,則ˉr_(1..K) 對應(yīng)的是 K 個(gè)最值得推薦的產(chǎn)品。
dist(·) 是度量兩個(gè)推薦向量之間的差異的距離函數(shù),而 c 是這一差異的限制閾值。根據(jù) [RP12], 一個(gè)合理而實(shí)際的距離度量是兩個(gè)分值向量直方圖的平方誤差和。
上述優(yōu)化問題的主要事項(xiàng)是是增加混合了次要目標(biāo)的相關(guān)度分值的綜合推薦的效用,但是對原聲的相關(guān)性推薦結(jié)果和綜合推薦結(jié)果的差異做懲罰來保證不會為了最求次要目標(biāo)而完全犧牲相關(guān)性。
函數(shù) R(·) 的設(shè)計(jì)需要包括可調(diào)整的參數(shù)來調(diào)節(jié)兩個(gè)目標(biāo)的權(quán)重并決定哪個(gè)是主要的優(yōu)化目標(biāo)。這一方法可以直接的擴(kuò)展到多于兩個(gè)目標(biāo)的情況。
我們能夠使用大量的例子來展示上述優(yōu)化模型是可以適配到實(shí)際的問題中去的。首先,考慮零售商要將收入目標(biāo)整合到推薦分值里的情況。
整體的效用函數(shù)可以被期望毛利率定義,設(shè) m(p)[0,1]∈為物品 p 的規(guī)范化毛利率,而被購買的概率則由排序位置的倒數(shù)表示(即在推薦列表里排序越低的的物品,其轉(zhuǎn)化概率越低)。
此處是概率規(guī)范化常數(shù)。綜合排序函數(shù)可以被定義為如下:
其中 β 是一個(gè)控制相關(guān)性和選取高毛利率產(chǎn)品之間的權(quán)衡的參數(shù)。這一參數(shù)決定了優(yōu)化問題(17)的主要目標(biāo)。
根據(jù)次要目標(biāo)重新排序的另一個(gè)例子是促銷特色商品,如打折產(chǎn)品或易腐貨物。效用函數(shù)可以指定為特選產(chǎn)品在有 K 個(gè)推薦項(xiàng)的推薦列表中的平均個(gè)數(shù)。
此處 F(·) 是特選標(biāo)志當(dāng)物品是特選時(shí)為 1,不是則為 0。綜合排序函數(shù)組合了相關(guān)性分值和特選標(biāo)志,通過參數(shù) β 來權(quán)衡哪個(gè)是主要的優(yōu)化目標(biāo)。
以上的排序函數(shù)能夠直接擴(kuò)展到整合多個(gè)分離的特征,每個(gè)特征對最終排序分值的貢獻(xiàn)尤其對應(yīng)的權(quán)衡參數(shù)(所有參數(shù)需要聯(lián)合起來優(yōu)化):
關(guān)于問題(17)的數(shù)值優(yōu)化算法的細(xì)節(jié)可以在 [RP12]中找到。
1.3.1 問題定義
零售商為客戶提供一組產(chǎn)品。對給定產(chǎn)品的需求依賴于許多因素,包括產(chǎn)品本身的特性如價(jià)格或品牌,同類產(chǎn)品競爭對手的價(jià)格, 促銷活動,甚至是天氣。該問題的目標(biāo)是整合這些因素來構(gòu)建需求模型并且允許進(jìn)行假設(shè)分析以預(yù)測對價(jià)格變化的響應(yīng),品類的擴(kuò)充和減少,計(jì)算最佳庫存水平,并分配貨架空間單位。
1.3.2 應(yīng)用
在本節(jié)中我們將討論需求預(yù)測核心問題。這一問題可以被考慮為一個(gè)建造模塊,該模塊要求對影響需求的行為或者庫存水平的限制建模:
價(jià)格優(yōu)化,促銷活動計(jì)劃, 以及定向折扣。品類管理和計(jì)劃。庫存水平優(yōu)化。
需求預(yù)測模型通常應(yīng)用在市場營銷活動設(shè)計(jì)中,因?yàn)檫@些模型能夠解釋需求回歸量的影響。例如,一個(gè)需求預(yù)測模型可以揭示某一產(chǎn)品的價(jià)格敏感性(當(dāng)價(jià)格變化時(shí)需求有多少變化)與包裝大小和和銷售區(qū)域的人口特性緊密相關(guān),這就暗示了可以在不同的商店使用不同的價(jià)格并對不同包裝的產(chǎn)品設(shè)定不同的單位毛利率。
我們將在后面的章節(jié)中把需求預(yù)測模型用在價(jià)格優(yōu)化和品類計(jì)劃問題上。
1.3.3 解決方案
需求預(yù)測可以被認(rèn)為是一個(gè)相對簡單的數(shù)據(jù)挖掘問題,只需要建立一個(gè)回歸模型并用歷史數(shù)據(jù)進(jìn)行評估。然而,設(shè)計(jì)回歸模型則不是那么簡單的事情,因?yàn)樾枨笫艿胶芏嘤兄鴱?fù)雜依賴關(guān)系的因素的影響。
在本節(jié)中,我們將研究文獻(xiàn) [KOK07]為 Albert Heijn(一家荷蘭的連鎖超市)構(gòu)建并驗(yàn)證的回歸模型。這一模型基于早期的營銷研究如 [BG92],以及時(shí)尚零售商如 RueLaLa[JH14]和 Zara[CA12]的實(shí)踐,這些實(shí)踐中應(yīng)用了相似的模型。
然而,重要的是要理解不同的優(yōu)化問題需要不同的需求預(yù)測模型并且?guī)缀醪豢赡軜?gòu)建通用的需求模型來整合各種不同的需求影響因子。
我們從以下對一給定產(chǎn)品的需求模型開始:
此處:
V 是在給定時(shí)間窗口內(nèi)顧客到訪商店的數(shù)量,例如一天。
Pr(purchase | visit) 是客戶在逛商店期間購買任意商品的概率。
Pr(j | purchase) 是當(dāng)客戶發(fā)生購買時(shí)在所有可選項(xiàng)中選擇產(chǎn)品的概率。
E{Q | j;purchase} 是當(dāng)客戶選擇了產(chǎn)品并購買時(shí)購買數(shù)量(單位數(shù)量)的數(shù)學(xué)期望。
公式(22)中的所有因素都可以用店鋪的歷史交易數(shù)據(jù)來估計(jì)。需求通常與日期(周幾、節(jié)假日等)和店鋪(大小、鄰近區(qū)域的人口統(tǒng)計(jì)情況等等)相關(guān),所以我們引入下標(biāo) t 和 h 來分別表示日期和店鋪,而估計(jì)的需求就是這些參數(shù)的函數(shù)。
另外,商店屬性,如大小、位置和平均消費(fèi)者的收入可以納入模型作為回歸。根據(jù) [KOK07],商店訪客的數(shù)量可以建模如下:
此處 Tt 是天氣溫度,Wt 是天氣舒適度指數(shù)(濕度、陰晴等),Bti 和 Eti分別是表示一天是星期幾和公共假期的 0/1 啞變量,H 是公共假期的天數(shù),而 α 是回歸系數(shù)。
購買事件是一個(gè)二值變量(購買/沒有購買),所以我們可以用一個(gè)標(biāo)準(zhǔn)的建模方法 - 將購買概率用一個(gè) Sigmoid 函數(shù)來表達(dá)并從數(shù)據(jù)估計(jì)指數(shù)參數(shù):
則 x 的回歸模是:
此處 Ajht 是啞變量,產(chǎn)品 j 在促銷時(shí)值為 1 否則為 0,Nh 是所有產(chǎn)品的數(shù)量,而 β4 對應(yīng)的是促銷產(chǎn)品占整體銷售產(chǎn)品中的百分比。
Pr(j | purchase) 的估計(jì)則更為棘手一些??蛻暨x擇建模在本質(zhì)上是計(jì)量經(jīng)濟(jì)問題,是一個(gè)特別的經(jīng)濟(jì)學(xué)研究分支——選擇建模理論。選擇建模理論證明了多項(xiàng) logit 模型(MNL)是有效的方法來對多個(gè)選項(xiàng)中選擇的概率進(jìn)行建模。
此處會 i 迭代遍歷所有產(chǎn)品,yj 是一個(gè)參數(shù)變量。類似于購買事件的概率,我們對參數(shù) yj 建立了一個(gè)回歸模型:
此處系數(shù) Γn+1 和 數(shù) Γn+2 由所有產(chǎn)品共享,Rjht 和 R 分別是單個(gè)產(chǎn)品的價(jià)格和產(chǎn)品的平均價(jià)格,而 Ajht 和 A 是促銷啞變量和平均促銷率,如上面對購買可能性回歸模型描述的那樣。
最后,單位產(chǎn)品的平均銷售數(shù)量可以建模如下:
通過將上述模型代入根表達(dá)式(22),可以得到完全特別的需求預(yù)測模型。這一模型可以根據(jù)零售商的業(yè)務(wù)用例來調(diào)整,這些跳幀個(gè)可以通過增加更多的解釋性變量如營銷事件來完成。
1.4.1 問題定義
零售商向客戶提供一組產(chǎn)品時(shí),針對每個(gè)用戶都制定不同的價(jià)格來最大化整體的收入。另外,該問題可以重新定義為提供定向折扣從而在基線價(jià)格上改變價(jià)格。
1.4.2 應(yīng)用
價(jià)格差異被廣泛的應(yīng)用在零售業(yè)并且存在非常多種顯性和隱性的形式:
優(yōu)惠券,店鋪級價(jià)格分區(qū),和折扣都是價(jià)格差異的例子。
價(jià)格區(qū)分與通過數(shù)量折扣來提升銷售是相關(guān)的。
動態(tài)定價(jià)能用價(jià)格差異的原則和模型來增量的調(diào)整價(jià)格。
盡管我們在問題的定義中暗示了是細(xì)粒度的個(gè)體定價(jià)方式,但是這是非常極端的情況更多常見的方法是對大的客戶分群設(shè)置不同的價(jià)格。
1.4.3 解決方案
價(jià)格區(qū)分是最基礎(chǔ)的經(jīng)濟(jì)和營銷問題[SM11],因此
此處 G 是利潤,Q 是銷售數(shù)量,P 是單位價(jià)格,V 是可變的單位成本(大致相當(dāng)于零售商拿到的批發(fā)價(jià)格),而是固定成本如管理成本。公式(29)中的價(jià)格和銷量是互相依賴的,因?yàn)殡S著價(jià)格的提高需求會下降,反之亦然。價(jià)格和銷量的關(guān)系通??梢杂靡粋€(gè)線性函數(shù)來逼近,這一函數(shù)具有一個(gè)一般被稱為需求彈性的系數(shù):
換言之, 需求彈性是需求量的百分比變化與價(jià)格的百分比變化的比率。公式(29)和(30)可以可視化如下:
需求曲線是一條由需求彈性和零售商利潤定義的斜線,數(shù)值上等價(jià)于(Po-V) · Q0,此處 P0 是由零售商設(shè)定的單位產(chǎn)品價(jià)格。一方面,當(dāng)價(jià)格接近可變成本時(shí)利潤趨近于 0,雖然銷售量很高。
另一方面,高價(jià)格將導(dǎo)致銷售量下降,結(jié)果利潤也會變得很小。這基本上意味著價(jià)格服從于一個(gè)數(shù)值優(yōu)化問題,并且零售商可以用統(tǒng)計(jì)技術(shù)來估計(jì)需求彈性并找到使得公式(29)最大化的最優(yōu)價(jià)格。
這一方法,即所謂計(jì)量價(jià)格優(yōu)化的實(shí)用性是比較有限的 [SM11]因?yàn)橛止剑?9)表達(dá)的模型過于簡化了市場行為并丟棄了在競爭市場中一些重要的影響價(jià)格-數(shù)量關(guān)系的因素。例如,價(jià)格大幅度下降可能會引發(fā)競爭對手降低整個(gè)行業(yè)價(jià)格的對稱反應(yīng),所以所有的市場參與者最終都會處于一個(gè)銷售量和利潤都較低的狀況。
盡管計(jì)量價(jià)格優(yōu)化有很多局限性,但公式(29-30)揭示了價(jià)格差異的本質(zhì)。對于任意一個(gè)價(jià)格, 無論它有多優(yōu)化,這一價(jià)格都是一種折衷。因?yàn)橐恍┛蛻魰驗(yàn)檫@一價(jià)格太貴而放棄購買,盡管他們可能愿意以更低的在 P0 和V 之間的價(jià)格(依然對兩種利潤是正向貢獻(xiàn))購買該產(chǎn)品。
此外,一些客戶可以容忍高于 P0 的價(jià)格,盡管他們產(chǎn)生的銷售量會相對較小。在這兩種情況下,零售商無法獲取位于需求曲線和可變成本線圍成的三角區(qū)域之中的額外利潤。
價(jià)格差異是一種自然的方法來克服單一常規(guī)價(jià)格的限制,通過根據(jù)客戶的付款意愿將客戶分群并向不同的客戶群體提供不同的價(jià)格。考慮一個(gè)這種策略的特殊情況,在前一圖表的常規(guī)價(jià)格外補(bǔ)充了一個(gè)較高的溢價(jià)(注意與單一價(jià)格策略相比利潤區(qū)域如何增加):
這一考慮帶來了零售商如何把相同的產(chǎn)品以不同的價(jià)格賣給不同的客戶這一挑戰(zhàn)性問題。一般而言,這需要在具有不同付費(fèi)意愿的客戶之間設(shè)置區(qū)隔以使得高付費(fèi)意愿的客戶不能以為低付費(fèi)意愿客群設(shè)定的價(jià)格來付費(fèi)。零售商可以使用如下幾種區(qū)隔機(jī)制:
店鋪區(qū)域:連鎖零售商店一般都位于不同的社區(qū)內(nèi),這些社區(qū)具有不同的平均家庭收入、平均家庭規(guī)模、最近競爭商店距離等人口屬性和競爭性因素。這就自然對客戶的價(jià)格敏感性以及尋找替代供應(yīng)商的能力或者意愿做了區(qū)分。這使得零售商可以在店鋪的級別上在不同區(qū)域設(shè)置不同的價(jià)格。
包裝大小:諸如軟飲料或化妝品之類的快速消費(fèi)品(FMCG)具有較高的周轉(zhuǎn)率,消費(fèi)者自然可以選擇是頻繁購買少量產(chǎn)品或者儲存大量的產(chǎn)品。這種權(quán)衡也受到諸如家庭規(guī)模等人口因素的影響。這一機(jī)制通過購買大型或小型包裝的意愿來創(chuàng)建區(qū)隔,并為不同包裝尺寸設(shè)置不同的單位邊際價(jià)格。買一送一(BOGO)優(yōu)惠也與此機(jī)制有關(guān)。
促銷活動:客戶可以根據(jù)他們是否愿意等待較低價(jià)格還是以正常價(jià)格立即購買來區(qū)分。此種客戶分群方式被廣泛應(yīng)用于服飾領(lǐng)域,在該領(lǐng)域季節(jié)性促銷是主要的營銷機(jī)制之一。
優(yōu)惠券:許多客戶不會愿意以常規(guī)價(jià)格來購買某一產(chǎn)品,但是當(dāng)有折扣價(jià)時(shí)卻會考慮購買。因此零售商可以從折扣中獲得額外的客戶,盡管他們貢獻(xiàn)的毛利率相較于那些以正常價(jià)格購買的產(chǎn)品的客戶較低。另一方面,向太過廣泛的受眾提供折扣可能是有害的,因?yàn)槟切┰敢庖哉r(jià)格購買的客戶也會使用折扣(當(dāng)沒有折扣的時(shí)候)。前面章節(jié)中討論過的響應(yīng)建模技術(shù)有助于解決這一問題。然而有一種 19 世紀(jì)就存在的傳統(tǒng)解決方案——優(yōu)惠券。優(yōu)惠券代表需要付出一定努力才能賺取或兌換的價(jià)格折扣(例如,客戶必須在報(bào)紙上找到它,剪下來并在商店出示),這就通過花費(fèi)時(shí)間和精力獲得折扣的意愿區(qū)分了客戶。
銷售渠道:不同的銷售渠道自然代表不同的區(qū)隔,因?yàn)榭蛻魧徺I渠道的選擇與他們的支付意愿密切相關(guān)。例如,與在雜貨店購買相同葡萄酒的顧客相比,酒類商店顧客的價(jià)格敏感性一直較低 [CU13]。
盡管這些技術(shù)已經(jīng)應(yīng)用很久了,但是要建立一個(gè)完整的折扣優(yōu)化模型是非常挑戰(zhàn)的。并且,據(jù)我們所知,所有現(xiàn)有的模型都有這樣或者那樣的局限性。在本節(jié)剩下的部分我們考慮兩個(gè)價(jià)格差異模型,這兩個(gè)模型是根據(jù)美國超市(特別是 Safeway 在芝加哥子公司的數(shù)據(jù))的數(shù)據(jù)設(shè)計(jì)并在這些數(shù)據(jù)上做過驗(yàn)證的。
(1)基于數(shù)量和地點(diǎn)的差異
文獻(xiàn) [KJ05]提出了這一模型,該模型的目標(biāo)是聯(lián)合優(yōu)化基于包裝大小的數(shù)量折扣和店鋪級別的區(qū)域價(jià)格。這一模型與我們在需求預(yù)測章節(jié)中討論的模型非常相似,只是該模型引入了更多的包裝大小和折扣參數(shù)。
讓我們考慮這樣一種情況,一個(gè)零售商運(yùn)營多個(gè)店鋪,銷售的某種產(chǎn)品也有幾種品牌,產(chǎn)品的規(guī)格也有幾種,例如可口可樂和百事可樂分別有 2 聽裝、4 聽裝和 6 聽裝。目標(biāo)是優(yōu)化每種包裝的單位產(chǎn)品價(jià)格,這里假設(shè)單位產(chǎn)品價(jià)格是可以根據(jù)產(chǎn)品規(guī)格和店鋪來調(diào)整。我們從標(biāo)準(zhǔn)的多元邏輯特模型(multinomial logit - MNL)開始,這一模型在前一節(jié)需求預(yù)測中討論過。
它表示顧客在時(shí)間 t 在商店 s 購買產(chǎn)品 j 的概率,J 是產(chǎn)品的數(shù)量(所有品牌的所有規(guī)格加上)。時(shí)間以相對較長的時(shí)間間隔(如周)進(jìn)行測量。參數(shù)變量 x 可以使用以下回歸模型進(jìn)行估計(jì):
此處 zj 是產(chǎn)品規(guī)格,Pjts 是價(jià)格,djts 是折扣力度(單位美元),ruts 整合了諸如最近競爭商店等競爭性因素,而 fjts 則整合了環(huán)境變化因素如天氣。因此, 回歸參數(shù) αk 基本上對應(yīng)著客戶對品牌、規(guī)格的偏好、對價(jià)格的敏感性、對折扣的響應(yīng)度、對競爭者的偏好、對變化因素的敏感性,以及折扣對價(jià)格敏感性的影響等等。
文獻(xiàn) [KJ05]認(rèn)為促銷案例中的價(jià)格敏感性回歸模型應(yīng)該比以上僅用一個(gè)回歸量來表達(dá)價(jià)格敏感性更復(fù)雜,因?yàn)榭蛻魰卸诜e產(chǎn)品的情況,這就使得過去的促銷會提高其對當(dāng)前產(chǎn)品價(jià)格的敏感性。這一方面可以通過將相應(yīng)的回歸器分解為兩個(gè)部分來建模,如下所示:
以上公式中 α3 是平均敏感度而第二項(xiàng)則表示記憶效應(yīng)。其中 W 是表示歷史深度,即過去的周數(shù),p0 表示常規(guī)價(jià)格,而 p 是實(shí)際的折后價(jià)格。類似的,也有觀點(diǎn)認(rèn)為對促銷的敏感性也與最近的促銷有關(guān):
此處 wj 是最近的促銷活動過去的周數(shù)。促銷敏感性對 wj 依賴基于以下假設(shè),兩次促銷之間的周期越長,則對促銷的響應(yīng)度越高。
公式(31)允許我們預(yù)測銷售量,所以價(jià)格優(yōu)化問題能夠根據(jù)公式(29)分時(shí)間周期來定義:
以上公式中 cjt 表示批發(fā)價(jià)格,而 Qjt 表示預(yù)測的銷售量。此處的優(yōu)化約束條件是為了避免由市場競爭或者客戶行為等主要因素的變化引起的劇烈的價(jià)格變化和偏移。
文獻(xiàn) [KJ05]提出了這一特殊的約束條件,這一約束要求優(yōu)化后的產(chǎn)品份額加權(quán)平均價(jià)格(表示產(chǎn)品的市場份額)不會超過優(yōu)化前的份額加權(quán)平局價(jià)格(表示原始價(jià)格)。這一優(yōu)化問題(35)可以在店鋪水平上得到求解,這意味著在規(guī)格和地點(diǎn)上都可以做差異化,或者僅在連鎖店級別上來差異化數(shù)量折扣。
(2)個(gè)性化折扣和優(yōu)惠券
盡管上面的模型在店鋪層面做價(jià)格差異也隱含了客戶層次上的價(jià)格差異,但是這一模型不是為單個(gè)客戶的折扣優(yōu)化來設(shè)計(jì)的。接下來我們考慮文獻(xiàn) [JT13]提出的另一種模型,這一模型是為了專門優(yōu)化個(gè)性化折扣和優(yōu)惠券的。這一模型的主要優(yōu)勢是它不僅是優(yōu)化折扣的粒度,同時(shí)也嘗試為指定用戶提供折扣的最優(yōu)時(shí)間和折扣的最優(yōu)有效期。這些時(shí)間屬性上的優(yōu)化思想來自于以下假設(shè):一個(gè)客戶購買的概率不是隨時(shí)間恒定的,而是會隨著時(shí)間變化的,因此對每一個(gè)用戶而言都存在最優(yōu)的折扣時(shí)間窗口。
這一模型的主要缺陷是其只能對特定品牌如廠商促銷來進(jìn)行優(yōu)化,而不能用于品類管理。你為了對折扣的時(shí)間屬性建模,假設(shè)對產(chǎn)品的折扣力度為d,我們將客戶 u 在時(shí)間 t 購買產(chǎn)品的概率分解為購買產(chǎn)品的概率和客戶在在時(shí)刻 t 購買的概率乘積:
對給定產(chǎn)品的購買概率密度函數(shù)能夠用公式(31)中用過的 MNL 的模型來估計(jì)。在時(shí)刻時(shí)購買的概率密度函數(shù)在文獻(xiàn) [JT13]中由厄蘭分布來建模:
此處參數(shù)變量 yu 可以用回歸模型來估計(jì),該回歸模型與公式(31)中用來估計(jì)參數(shù)變量的類似,會用一個(gè)回歸量來描述折扣力度,因此之后可以對其進(jìn)行優(yōu)化。
上面定義的購買概率使得我們能夠?qū)o定客戶的銷售量 Qu 作為折扣力度(以美元為單位)、折扣起始時(shí)間、和折扣周期的函數(shù)來建模:
以上推導(dǎo)可以使得我們導(dǎo)出如下毛利率優(yōu)化問題:
這里 m 是在正常價(jià)格下的毛利率。以上公式中的第一項(xiàng)對應(yīng)著收入,收入由三個(gè)方面組成(促銷前的收入、促銷期間的收入和促銷后的收入);第二項(xiàng)對應(yīng)著營銷活動的成本。下圖描述了這一優(yōu)化問題:
頂部的第一個(gè)圖顯示了客戶 u 購買的概率密度函數(shù)曲線,此圖中對于給定產(chǎn)品在正常價(jià)格時(shí)的銷量對應(yīng)著 S0 區(qū)域。一個(gè)固定的永久折扣增加的銷量對應(yīng)的區(qū)域?yàn)?S1,因此總收入和促銷成本(如中間的圖所示)是與 S0 和S1 成正比的。
時(shí)間優(yōu)化的促折銷使得收入與 S0+S2 成正比, 其成本與 S02+S2(如底部的圖所示)。固定折扣促銷和時(shí)間優(yōu)化的促銷之間的這種差異表明在概率密度函數(shù)具有某些數(shù)量性質(zhì)時(shí)存在利用時(shí)間優(yōu)化來改善毛利率的潛力。
1.5.1 問題定義
零售商向客戶提供一組產(chǎn)品時(shí),針對每個(gè)用戶都制定不同的價(jià)格來最大化整體的收入。另外,該問題可以重新定義為提供定向折扣從而在基線價(jià)格上改變價(jià)格。
零售商準(zhǔn)備一次促銷活動,即對某個(gè)或者一組特定商品進(jìn)行有時(shí)限的折扣。對促銷活動的規(guī)劃需要估計(jì)到下列有關(guān)的值:
哪些產(chǎn)品的庫存需要避免在活動結(jié)束前缺貨?
什么樣的價(jià)格會最大化收入?價(jià)格可以考慮是一個(gè)恒定值或者是一個(gè)從活動開始到結(jié)束不同時(shí)間段的函數(shù)。
我們將考慮庫存水平是預(yù)先確定的,零售商試圖計(jì)算最優(yōu)價(jià)格這種情況。這是時(shí)尚零售商在處理季節(jié)性清倉和款式翻新 [JH14, CA12]中遇到的典型問題。這一問題可以以不同的方式來定義,如將需求預(yù)測和價(jià)格優(yōu)化作為獨(dú)立的問題來處理,也可以同時(shí)優(yōu)化庫存水平和價(jià)格,總之其目的是最大化收入。
1.5.2 應(yīng)用
促銷活動的規(guī)劃在零售中有如下的應(yīng)用:
清倉和季節(jié)性促銷是時(shí)尚零售業(yè)中的主要應(yīng)用。
某些商業(yè)模式如快閃零售(也被稱為彈出零售)只有促銷活動一種銷售方式。
快消品和易腐品的零售商可以使用促銷活動策劃來調(diào)整銷售節(jié)奏與產(chǎn)品保質(zhì)期同步 。
1.5.3 解決方案
動態(tài)需求預(yù)測和價(jià)格優(yōu)化是經(jīng)濟(jì)學(xué)中所研究的基礎(chǔ)問題,被稱為收入管理。收入管理的理論在書籍如 [TA05]中有很好的闡釋和系統(tǒng)化的介紹。在服務(wù)業(yè)中的預(yù)定服務(wù),如機(jī)票、體育場座位、酒店房間、租車等等場景中可以找到收入管理自動化的最先進(jìn)和最有效率的例子。要理解這些技術(shù)可以如何在零售領(lǐng)域中使用,我們來考察由 RueLaLa(一個(gè)時(shí)尚零售商)提出來的方法論。
我們假設(shè)一個(gè)零售商計(jì)劃對 N 個(gè)產(chǎn)品或者產(chǎn)品組(產(chǎn)品組中的產(chǎn)品價(jià)格相同,如不同口味的酸奶,或者不同花色的 T 恤)進(jìn)行打折。設(shè) P 為價(jià)格集合,該集合包含每個(gè)產(chǎn)品可以設(shè)定的價(jià)格。在實(shí)踐中,P 通常是根據(jù)業(yè)務(wù)規(guī)則組成的比較小集合。例如,價(jià)格下限可以根據(jù)零售商的盈利水平定義為29.90, 價(jià)格調(diào)整幅度根據(jù)心理價(jià)格可以設(shè)定為 5 美元,則 P=$29.9,$34.9,$39.9,$44.9,$49.9。
假設(shè)促銷活動中的所有產(chǎn)品或者產(chǎn)品組都有某些共同點(diǎn),例如同屬于相同的類目“女鞋”或者“平安夜食品”,因此對一個(gè)產(chǎn)品的需求潛在的依賴于其他可替代產(chǎn)品的價(jià)格。
通過引入變量 S,其等于所有參與促銷活動的競爭產(chǎn)品(產(chǎn)品組)的價(jià)格之和,而對某一產(chǎn)品估計(jì)的期望需求則為數(shù)學(xué)期望 E{Q | i,pj,S},此處 Q是表示需求量的隨機(jī)變量,i=1,2,……,N 是產(chǎn)品的索引,而 j =1,2,……,|P| 是單個(gè)產(chǎn)品或產(chǎn)品組的價(jià)格。既然 Q 與產(chǎn)品價(jià)格 S 和都相關(guān),這就隱含地包含了產(chǎn)品價(jià)格與可替代產(chǎn)品的評價(jià)價(jià)格的比值對需求和其彈性都是有影響的。
現(xiàn)在我們可以在假設(shè) S 為固定的并對所有可能的 S 求解這一優(yōu)化問題[JH14]:
當(dāng)產(chǎn)品 i 的價(jià)格為 pj 時(shí),二值變量 δi,j0∈,1 為 1,否則為 0。上述優(yōu)化問題中的目標(biāo)函數(shù)可以自然地表達(dá)為促銷活動的收入。第一項(xiàng)約束保證每個(gè)產(chǎn)品的價(jià)格都在 P 之中(原文可能有問題),而第二項(xiàng)約束保證所有產(chǎn)品的價(jià)格之和為 S。其他關(guān)于庫存水平的約束也可以加入到優(yōu)化問題中來。
以上的優(yōu)化問題需對需求 E{Q | i,pj,S} 做估計(jì),這可以用前面章節(jié)中做需求預(yù)測和價(jià)格分群的技術(shù)來解決。然而,需要非常注意到缺貨(而且是可取的)是促銷活動中非常典型的情況,因此對很多產(chǎn)品的需求預(yù)測建模所要用到的歷史數(shù)據(jù)都是被截?cái)嗟摹?/p>
正如 [JH14]中所建議的那樣,可以通過使用在此前促銷期間沒有缺貨的產(chǎn)品的數(shù)據(jù)為不同產(chǎn)品類別構(gòu)建畫像來解決此問題,并使用這些畫像來調(diào)整相應(yīng)類別的需求曲線。
1.6.1 問題定義
零售商根據(jù)類目銷售產(chǎn)品。一個(gè)類目表示一組相對內(nèi)聚的產(chǎn)品,這些產(chǎn)品有很多共同點(diǎn)(如“甜點(diǎn)”、“女式牛仔”等),所以客戶有可能在他們的首選產(chǎn)品因某些原因缺貨時(shí)愿意用另一產(chǎn)品來替代。
產(chǎn)品缺貨的主要原因有永久性的品種減少(如因?yàn)橛邢薜呢浖芸臻g)和暫時(shí)的性的售罄。類目管理的目標(biāo)是利用替代效用用優(yōu)化方法計(jì)算出一個(gè)產(chǎn)品子集,這一子集在滿足物理約束如可用的貨架空間的情況下可以最大化毛利率。
1.6.2 應(yīng)用
品類管理是一項(xiàng)相對專業(yè)化的工作,但是當(dāng)目標(biāo)是優(yōu)化一個(gè)產(chǎn)品類目的整體收益而不是一個(gè)單一產(chǎn)品的收益時(shí),它也會涉及到在促銷優(yōu)化問題中存在的替代效應(yīng)問題。零售商一般情況下對類目的整體收益的關(guān)心程度遠(yuǎn)勝于對單個(gè)產(chǎn)品的優(yōu)化,因此在本節(jié)中討論的方法可以被用在很多不同的應(yīng)用中以實(shí)現(xiàn)最優(yōu)解決方案。本節(jié)研究的模型可以直接應(yīng)用于以下類目管理方式:
倉庫的產(chǎn)品庫存水平優(yōu)化。一個(gè)特別重要的應(yīng)用是對易腐產(chǎn)品的庫存管理,這需要考慮到保質(zhì)期和過去產(chǎn)品造成的潛在損失。
優(yōu)化貨架的布局來調(diào)整相關(guān)產(chǎn)品的份額。
類目規(guī)劃(在類目中加入或者移除哪些產(chǎn)品)
1.6.3 解決方案
從計(jì)量經(jīng)濟(jì)學(xué)的角度來看,類目管理問題是由收益遞減規(guī)律引起的?;蛘吒唧w地說,收入和成本與類目的規(guī)模關(guān)系是不同的,總的趨勢是消費(fèi)者購買能力在某個(gè)時(shí)候達(dá)到飽和,同時(shí)由于店鋪面積和其他運(yùn)營成本的增加,成本持續(xù)增長:
這一趨勢引出了類目優(yōu)化問題。這是一個(gè)非常具有挑戰(zhàn)性的問題,因?yàn)樗枰獙φ麄€(gè)類目中所有產(chǎn)品之間的相互依賴關(guān)系建模。然而,盡管面臨這些挑戰(zhàn),在 [KOK07]中已經(jīng)提出了一種切實(shí)可行的類目優(yōu)化模型,并在荷蘭的連鎖超市 Albert Heijn 中應(yīng)用。在研究這一方法之前,我們先引入下列符號:
N={1,2,……,J} - 零售商給用戶提供的一個(gè)類目下面的最大產(chǎn)品集合,即所有品類。
fi{0∈,1,2,……} - 產(chǎn)品 j 的庫存水平。零售商通過選擇 f 為 0(產(chǎn)品不出現(xiàn)在品類中)或者非 0 來優(yōu)化品類。
F0 - 統(tǒng)一庫存單位度量下的庫存總?cè)萘?。這里有個(gè)假設(shè)是所有產(chǎn)品的庫存水平之和不能超過 F0。庫存總?cè)萘靠梢杂蓚}庫或者店鋪的可用貨架空間所約束。
NhN - 店鋪 h 的品類,是總品類的子集。
dj 表示產(chǎn)品 j 的原始需求率(當(dāng)所有 N 品類都展示給客戶時(shí)有多少顧客會選擇該產(chǎn)品)
Dj - 觀察到的產(chǎn)品的需求率(每天因?yàn)樵家庠富蛘咛娲?yīng)而實(shí)際選擇產(chǎn)品 j 的數(shù)量)。對給定產(chǎn)品觀察到的需求與原始需求和其他產(chǎn)品的可獲得性(替代效應(yīng))有關(guān)系,其可以被視為函數(shù):
Dj({f1,……,fJ},{d1,……,dJ})
使用上述符號,品類優(yōu)化問題可以形式化如下:
其中毛利率 Gj 是給定產(chǎn)品和其對應(yīng)的觀測需求的函數(shù)。這一函數(shù)很大程度上與零售商的商業(yè)模式有關(guān),所以我們下面介紹一些通用的函數(shù)模板,基于這些模板可以根據(jù)實(shí)際的使用情況來定制毛利率函數(shù):
公式(42)將觀測需求乘以毛利率 m,這是對毛利潤最簡單的建模方式。該公式隱含假設(shè)了補(bǔ)貨及時(shí)而沒有缺貨的情況。雜貨這樣的快消品正是屬于這種情況,但是在其他領(lǐng)域如服飾則必須如公式(43)那樣考慮缺貨的情況。銷售易腐貨物的零售商還要考慮貨損,公式(44)通過引入單位損失變量 L 來對此進(jìn)行建模。
為討論方便,后面我們假設(shè)所有產(chǎn)品的補(bǔ)貨都是及時(shí)的,所以缺貨是不可能或者是可忽略的。因此我們可以將 j{0∈,1} 作為二值變量來表示產(chǎn)品是否在類目中。更復(fù)雜的處理缺貨的模型可以在 [KOK07]中找到。
要解決(41)中的優(yōu)化問題,我們需要定義觀測需求函數(shù)。在無缺貨假設(shè)下,需求函數(shù)可按照下面公式來建模:
其中 αk-j 是產(chǎn)品 k 被產(chǎn)品 j 替換的概率。上述公式是比較自明的:第一項(xiàng)是原始需求,而第二項(xiàng)是所有被從類目中移除的產(chǎn)品的累計(jì)替代需求。
公式(45)需要估計(jì)替代概率 αk-j 和原始需求率 dj。為了做這些估計(jì),我們假設(shè)下列變量是已知的(我們已經(jīng)在本文的前面章節(jié)討論過需求預(yù)測):
Qjh,jNh ∈– 每個(gè)客戶在店鋪對產(chǎn)品的需求。假設(shè) Kh 是一天內(nèi)進(jìn)過店鋪 h 的客戶數(shù)量, 則 Dj = Kh*Qjh。
Q0jh,jNh ∈- 每個(gè)客戶在店鋪 h 具有全品類產(chǎn)品時(shí)的需求(假設(shè)商店的品類是全的)。因?yàn)槠奉慅R全所以不存在替代效應(yīng),因此 Q0jh 就是原始需求。
估計(jì)替代率 αk-j 是比較困難的事情因?yàn)楫a(chǎn)品集合 J 中有多達(dá)不同 J2的替代率。不過,[KOK07]找到了下述客戶行為的簡化模型,在實(shí)踐中這一模型有足夠的精度并僅需要用一個(gè)而不是 J2 個(gè)變量:如果產(chǎn)品 k 買不到,客戶會選擇其第二選擇產(chǎn)品來替代的概率為 δ,這一概率對一個(gè)類目下的所有產(chǎn)品都是一樣的,則客戶不買任何東西的概率為(1- δ)。這一模型引出了如下替代率的簡單公式:
為了估計(jì) δ, 我們將給定店鋪的總需求定義為 Qjh(可由歷史數(shù)據(jù)來估計(jì))之和,
另一方面,該值也可以根據(jù)公式(6.5)估計(jì)如下:
現(xiàn)在 δ 可以通過最小化總需求的實(shí)際值和預(yù)測值之間的差異來估計(jì):
求解優(yōu)化問題(41)的下一步是計(jì)算公式(45)中使用的原始需求率。我們首先注意到店鋪 h 對 N 中所有產(chǎn)品的總需求可以按如下方式計(jì)算:
其中 Vh 是每天到訪店鋪 h 的客戶總數(shù)。在公式(50)中,所有 Q0jh 之和乘以 Vh 表示在給定全品類時(shí)的的總需求。然而的值時(shí)針對擁有全品類的店鋪估計(jì)得的,其值時(shí)與給定店鋪相關(guān)(如地點(diǎn),店鋪面積等等)而沒有被建模的。這可以通過公式(47)估計(jì)的類目需求和從公式(48)預(yù)測的需求比值來補(bǔ)償調(diào)整。
在一個(gè)品類有限的店鋪,總需求是以下兩個(gè)部分的和:對給定店鋪品類中存在的商品的需求和對中其他產(chǎn)品的需求。兩部分的比率可以由表示如下:
自然的,Th*rh 表示對品類中存在的產(chǎn)品的需求分額,而(1- Th*rh)則表示對不在品類中的產(chǎn)品的需求份額。最后,我們對單一產(chǎn)品的需求可以當(dāng)作是總需求的一部份來計(jì)算:
所有公式(52)和(49)中的系數(shù)都可以根據(jù)數(shù)據(jù)來估計(jì),因此我們可以把所有公式展開到原始優(yōu)化問題(41)中,則這個(gè)問題可以使用提出的數(shù)值方法來求解。
公式(41)將為每個(gè)產(chǎn)品都產(chǎn)生一個(gè)假定的最有庫存水平 fj。這些庫存水平值可以用來調(diào)整庫存和優(yōu)化貨架布局。值得注意的是該模型使得零售商可以做假設(shè)分析來評估對品類和庫存水平的改變會如何影響毛利率。
例如,零售商可以畫出毛利率根據(jù)給定產(chǎn)品或者產(chǎn)品組的庫存水平變化的函數(shù)曲線。這些曲線對易腐產(chǎn)品尤其具有描述性,因?yàn)槊适峭购瘮?shù),當(dāng)庫存水平為 0 時(shí)函數(shù)值為 0,而當(dāng)庫存水平過高時(shí)毛利率因?yàn)楫a(chǎn)品過期造成的損失也會為 0,毛利率的最優(yōu)值是在兩種極端情況之間。
如果缺乏上述被討論的優(yōu)化方法的財(cái)務(wù)表現(xiàn)方面的數(shù)據(jù),我們對這些方法和對應(yīng)的數(shù)據(jù)問題的概述將是不完整的。盡管這些數(shù)據(jù)是不難獲取的,但對此我們?nèi)匀恍枰?jǐn)慎對待,因?yàn)樨?cái)務(wù)表現(xiàn)與零售商的商業(yè)模型機(jī)密相關(guān),并且事實(shí)上我們無法隔離其他環(huán)境因素如市場增長或者競爭對手的行動對優(yōu)化問題的影響。
除此之外,這些數(shù)字可能因很多因素而有很大的差異,所以本文中我們的目標(biāo)只是提供一些基準(zhǔn),使得讀者可以對優(yōu)化的潛在幅度有所了解。以下列表收集了一些關(guān)于這些優(yōu)化方法對財(cái)務(wù)影響的實(shí)例:
響應(yīng)模型廣泛用于整個(gè)營銷過程,從零售到推廣活動 [EP13]。經(jīng)常有報(bào)道稱,與隨機(jī)投放相比,響應(yīng)模型可以將推廣活動的收益率提高 20-30%,而提升模型可以帶來 15% 左右的實(shí)質(zhì)性提升或在其他方法都不起作用的困難的情況下實(shí)現(xiàn)盈利 [PS08]。
在 RueLaLa 的實(shí)踐中對 [JH14]中提出的營銷活動優(yōu)化進(jìn)行了全面評估,得出的一般結(jié)論是,綜合優(yōu)化模型比之前使用的啟發(fā)式算法能提高約 10% 的收入。 [CA12]中提出的并經(jīng) Zara 驗(yàn)證過的事件優(yōu)化模型聲稱可提供5.8% 的收入增長。
類目管理框架已在 Albert Heijn 進(jìn)行了驗(yàn)證,以優(yōu)化 37 個(gè)商店中 25個(gè)子類別的分類。發(fā)現(xiàn)在這 25×37 = 1295 個(gè)情況中,使用傳統(tǒng)方法有 701 個(gè)不理想,在使用了新的類目管理方法進(jìn)行優(yōu)化后可以提高約 6.2% 的毛利率。
最后,值得注意的是,大多數(shù)這里討論的優(yōu)化方法不會顯著的影響零售商的成本,因此收入的提升大概率的直接帶來凈利潤的提升。
在前面的章節(jié)中我們概述了一些零售相關(guān)的計(jì)量經(jīng)濟(jì)學(xué)問題,給出了其應(yīng)用和用例,并且闡述了可以應(yīng)用到這些問題上的數(shù)據(jù)分析方法和優(yōu)化模型。在最后的一節(jié)中,我們將把上述這些模型聯(lián)系起來以提供一個(gè)全景式的總結(jié)。
由點(diǎn)到面:
本文的主要目的是描繪完全依賴于數(shù)據(jù)挖掘和數(shù)值優(yōu)化的決策自動化框架。因此,將這個(gè)框架可視化為一個(gè)消費(fèi)數(shù)據(jù)并產(chǎn)生可執(zhí)行動作和決策的管道是合理的。
首先,我們可以將數(shù)據(jù)探索和知識發(fā)現(xiàn)流程放入一個(gè)單獨(dú)的層級中,該層級主要使用無監(jiān)督學(xué)習(xí)算法,并且主要依靠人為因素來評估數(shù)據(jù)挖掘結(jié)果,例如客戶群或者是購買產(chǎn)品的頻繁項(xiàng)集。
雖然這些過程在實(shí)踐中非常重要,但它們很難集成到自動優(yōu)化過程中來,因?yàn)槟J降陌l(fā)掘通常依賴于手工流程而且通常相比于增量式優(yōu)化它對戰(zhàn)略決策更有用。不過這一層的輸出可以配置到下游的過程中,例如,新發(fā)現(xiàn)的客戶群可用于定義新的傾向模型或引入并優(yōu)化專屬折扣。
接下來的兩層分別與建模和優(yōu)化有關(guān)。廣義而言,建模層的基本目標(biāo)是提供一個(gè)全面的消費(fèi)者模型,定量描述他或她的價(jià)格敏感性,對活動和折扣的響應(yīng)傾向,用一種產(chǎn)品替代另一種產(chǎn)品的意愿,對推薦的接受度,等等。
但是在實(shí)踐中建立這樣一個(gè)全面的模型是非常困難的,所以我們使用多種專用模型來處理不同的問題。然而,需要指出的是,這種想象中的消費(fèi)者模型涉及到所有類型的優(yōu)化問題,因此獲取有關(guān)客戶行為各個(gè)方面的全面數(shù)據(jù)至關(guān)重要。
優(yōu)化層的主要挑戰(zhàn)是多目標(biāo)的聯(lián)合優(yōu)化。聯(lián)合優(yōu)化對計(jì)算來說是一個(gè)嚴(yán)重的挑戰(zhàn),而且最重要的是聯(lián)合優(yōu)化受到底層預(yù)測模型能力的限制,所以幾乎所有的優(yōu)化技術(shù)都只能處理一個(gè)或兩個(gè)目標(biāo)。
我們把這些層都放到下圖中。組件之間存在許多可能的依賴關(guān)系和相互作用,因此我們僅展示了一個(gè)與響應(yīng)建模相關(guān)的樣例程流,以免圖變得過于混亂。
定價(jià)的重要性
在這些不同的問題和目標(biāo)中,我們需要非常重視定價(jià)決策以及所有于定價(jià)有著直接或間接關(guān)系的的優(yōu)化問題。讓我們用一個(gè)經(jīng)典例子來說明定價(jià)決策的重要性。會議一下企業(yè)利潤的基本公式:
其中 Q 是銷售量,P 是價(jià)格,V 是可變成本,而 C 表示固定成本。假設(shè)一個(gè)服裝零售商每月以 40 美元的單價(jià)銷售 10 萬件服裝,假設(shè)每件服裝的批發(fā)價(jià)是 25 美元而固定成本為一個(gè)月 50 萬美元。我們可以計(jì)算銷售量、價(jià)格、可變成本和固定成本在變化百分之一的情況下是如何影響利潤的:
在這個(gè)例子中,我們可以看到定價(jià)對利潤的影響比其他變量大得多。盡管這是一個(gè)過于簡單和任意的例子,這一模式在眾多不同行業(yè)的不同企業(yè)中存在。這使我們得到如下結(jié)論:零售商應(yīng)特別關(guān)注與定價(jià)(折扣、個(gè)性化價(jià)格、動態(tài)定價(jià)等)有關(guān)的優(yōu)化方法以及支持這些方法的數(shù)據(jù)挖掘流程。
我們也注意到全渠道零售可以給自動定價(jià)優(yōu)化帶來新的機(jī)會。既然價(jià)格差異是最有力的定價(jià)技術(shù)之一,則定價(jià)優(yōu)化的理想環(huán)境是為每一個(gè)客戶提供顯示或隱式(折扣)的個(gè)性化價(jià)格,而且所有的價(jià)格是可以動態(tài)調(diào)整的。數(shù)字渠道恰好提供了這些條件,其中每個(gè)客戶都有自己獨(dú)立和動態(tài)的對零售商的視圖。
隱含維度的重要性:
如我們已經(jīng)提到的,許多零售業(yè)中的優(yōu)化問題與用戶的行為模型是內(nèi)在相關(guān)的。在個(gè)人客戶層面建立這種模型的能力是數(shù)據(jù)挖掘技術(shù)帶來的最重要的好處之一,也是一對一營銷的關(guān)鍵推動力。
客戶建模的最復(fù)雜的例子可以在推薦系統(tǒng)中找到,這些系統(tǒng)通常使用隱式維度的概念來捕捉客戶和產(chǎn)品的心理特征。這一概念非常的重要,它可能遠(yuǎn)遠(yuǎn)超出推薦系統(tǒng)的范圍,但據(jù)我們所知,它并沒有如期望的那樣在其他應(yīng)用中被廣泛應(yīng)用。這使我們得出這樣一個(gè)結(jié)論,即整體的優(yōu)化系統(tǒng)可以將推薦領(lǐng)域的最先進(jìn)的技術(shù)應(yīng)用到那些不常見的應(yīng)用中而受益。
在零售業(yè)中實(shí)現(xiàn)完全的自動化決策是極具雄心的。甚至可以說,在實(shí)踐中想要衡量這些優(yōu)化方法的表現(xiàn)幾乎是不可能的,因?yàn)橛^察到的收益提升可能與市場趨勢,競爭對手的行動,顧客品味的變化以及其他因素相關(guān)。
這個(gè)問題在經(jīng)濟(jì)學(xué)教科書中被稱為內(nèi)生性問題,這對于數(shù)據(jù)驅(qū)動優(yōu)化技術(shù)的研發(fā)者和用戶來說都是一個(gè)巨大的挑戰(zhàn),而且即使看起來成功的案例也會受到該問題的挑戰(zhàn)而顯得其結(jié)果沒那么可靠。
盡管如此,在過去的十年中,主要的零售商一直在尋求將數(shù)據(jù)挖掘與數(shù)值優(yōu)化技術(shù)結(jié)合在一起的技術(shù)的整體解決方案。這種先進(jìn)的系統(tǒng)將是企業(yè)數(shù)據(jù)管理演進(jìn)的下一個(gè)階段,它將遵循對數(shù)據(jù)倉庫的共識并大量采用數(shù)據(jù)學(xué)科學(xué)方法。