国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

動(dòng)態(tài)定價(jià)在線上銷售模式中的研究

2023-10-16 14:28吳錦超顧孟迪
上海管理科學(xué) 2023年5期
關(guān)鍵詞:湯普森搖臂零售商

吳錦超 顧孟迪

(上海交通大學(xué) 安泰經(jīng)濟(jì)與管理學(xué)院,上海 200030)

0 引言

由于受2020年席卷全球的疫情影響,人們更接受以線上的行為方式代替線下,例如在線辦公、在線教育、在線會(huì)議等,這對(duì)于發(fā)展成熟的線上銷售模式也是一種較大的利好。以此為契機(jī),線上銷售模式下的問(wèn)題再次成為研究的熱點(diǎn)。從實(shí)踐意義的角度,全新的線上銷售的衍生模式處于不斷探索與發(fā)展中,例如利用視頻直播導(dǎo)流與粉絲經(jīng)濟(jì)的直播帶貨模式,以及對(duì)于海購(gòu)服務(wù)不斷探索的跨境電商模式。在線上銷售模式的發(fā)展與演變過(guò)程中,如何切實(shí)地提升廠商所獲得的收益尤為值得關(guān)注。

本文基于線上銷售的場(chǎng)景,解決的是在給定的銷售周期內(nèi)廠商應(yīng)該如何規(guī)劃定價(jià)方案來(lái)獲得預(yù)期較高的累計(jì)收入的問(wèn)題。在定價(jià)方案的制定上主要利用了動(dòng)態(tài)定價(jià)的手段充分地挖掘用戶的消費(fèi)者剩余,而在方案的實(shí)現(xiàn)上則是利用了機(jī)器學(xué)習(xí)的方式,將在多臂賭博機(jī)問(wèn)題中得到廣泛應(yīng)用的湯普森采樣算法遷移到了動(dòng)態(tài)定價(jià)問(wèn)題上。在該基礎(chǔ)上對(duì)用戶群體進(jìn)行了分群研究,期望針對(duì)不同消費(fèi)能力的用戶制定出不同的價(jià)格以最大化消費(fèi)者剩余。在制定了定價(jià)方案后,又對(duì)于方案整體的落地可行性進(jìn)行了進(jìn)一步研究與分析。

1 文獻(xiàn)綜述

1.1 收入管理問(wèn)題

收入管理問(wèn)題最早起源于航空業(yè),其主要解決的是:針對(duì)具有易逝品性質(zhì)的飛機(jī)票,如何在不確定的需求下實(shí)現(xiàn)收益最大化的問(wèn)題。從更寬泛的角度,收入管理問(wèn)題解決的是:如何在適當(dāng)?shù)臅r(shí)刻,將適當(dāng)?shù)漠a(chǎn)品以適當(dāng)?shù)膬r(jià)格賣給適當(dāng)?shù)挠脩簟鹘y(tǒng)的收入管理問(wèn)題主要是根據(jù)歷史數(shù)據(jù)推斷出需求函數(shù)的分布,再在該需求函數(shù)的基礎(chǔ)上進(jìn)行最優(yōu)化問(wèn)題的求解。但其主要存在的問(wèn)題是:需求函數(shù)反映的是歷史的需求,而收入管理問(wèn)題面向的是未來(lái)的可能需求,因而在時(shí)間拓展性上可能存在估計(jì)誤差。而解決該問(wèn)題所提出的方法為需求學(xué)習(xí),即假設(shè)需求函數(shù)的形式可以從歷史數(shù)據(jù)中推斷出來(lái),但包含未知參數(shù),并利用銷售的新數(shù)據(jù)不斷對(duì)參數(shù)與函數(shù)的分布進(jìn)行更新。對(duì)于越來(lái)越成熟的線上零售行業(yè),隨著數(shù)據(jù)實(shí)時(shí)獲取能力的提升,需求學(xué)習(xí)方法對(duì)于需求函數(shù)的估計(jì)問(wèn)題可以實(shí)現(xiàn)更高頻的迭代。

1.2 動(dòng)態(tài)定價(jià)在收入管理領(lǐng)域的應(yīng)用

作為收入管理的重要實(shí)現(xiàn)方式,動(dòng)態(tài)定價(jià)也被廣泛采用。動(dòng)態(tài)定價(jià)最初來(lái)源于經(jīng)濟(jì)學(xué)中的價(jià)格歧視原理,即同一件產(chǎn)品針對(duì)不同消費(fèi)者制定不同的價(jià)格,通過(guò)挖掘消費(fèi)者剩余以增加收入。隨著經(jīng)濟(jì)社會(huì)的發(fā)展,動(dòng)態(tài)定價(jià)的內(nèi)容也在不斷地拓展,包括相同產(chǎn)品在不同的市場(chǎng)需求下的定價(jià)不同,相同產(chǎn)品在不同庫(kù)存水平下的定價(jià)不同等。Elmaghraby和Keskinocak認(rèn)為動(dòng)態(tài)定價(jià)得到廣泛應(yīng)用的原因有:1)線上行為產(chǎn)生更多的用戶行為數(shù)據(jù),可以更好地輔助決策;2)價(jià)格調(diào)整的菜單成本在不斷降低;3)更多的算法與模型得到應(yīng)用,從而更高效地實(shí)現(xiàn)策略。

1.3 動(dòng)態(tài)定價(jià)在零售業(yè)中的應(yīng)用

已經(jīng)有部分文獻(xiàn)針對(duì)動(dòng)態(tài)定價(jià)在零售業(yè)中的應(yīng)用進(jìn)行研究。Gabriel和Bitran驗(yàn)證了針對(duì)隨機(jī)需求的最優(yōu)化定價(jià)問(wèn)題可以通過(guò)Hamilton-Jacobi-Bellman方程求解,但在實(shí)際應(yīng)用時(shí)的效果有限。Elmaghraby與Keskinocak對(duì)考慮庫(kù)存的零售問(wèn)題的動(dòng)態(tài)定價(jià)進(jìn)行研究,并按照三個(gè)維度劃分問(wèn)題:1)是否可以補(bǔ)貨(R/NR);2)需求是否隨時(shí)間變化(D/I);3)用戶是否短視(M/S)。An和Fromm針對(duì)動(dòng)態(tài)定價(jià)在電子商務(wù)中的應(yīng)用優(yōu)勢(shì)進(jìn)行研究。Ferreira和Simchi-Levi則是引入湯普森采樣算法分析了帶庫(kù)存約束的收益管理問(wèn)題并進(jìn)行后悔值上界的求解。

本文所使用的研究方法參考了針對(duì)電子商務(wù)領(lǐng)域的研究與Ferreira和Simchi-Levi提出的將湯普森采樣算法遷移至動(dòng)態(tài)定價(jià)領(lǐng)域的思想,并在原先研究的基礎(chǔ)上,對(duì)用戶群體預(yù)先進(jìn)行分群,從而對(duì)不同消費(fèi)能力的用戶制定不同的價(jià)格以最大化收益。在制定了定價(jià)方案后,又對(duì)方案的落地能力與可行性進(jìn)行了分析。

2 理論分析

2.1 湯普森采樣算法

在針對(duì)多搖臂賭博機(jī)問(wèn)題的研究中,湯普森于1933年提出了一種基于貝葉斯理論的算法,被稱為湯普森采樣算法(Thompson Sampling)。盡管比較早期就已經(jīng)提出,但是由于其缺乏后悔值上界的理論證明,與后驗(yàn)分布的反復(fù)更新對(duì)于計(jì)算能力的高要求,而一直未被廣泛采用。直到若干篇文獻(xiàn)提出,對(duì)于多搖臂賭博機(jī)問(wèn)題可以采用湯普森抽樣算法進(jìn)行決策,并與其他的UCB1、MOSS算法等相比,湯普森抽樣算法在模擬實(shí)驗(yàn)中有著更低的后悔值,之后才被較為廣泛地接受與使用。

湯普森采樣的原理是基于貝塔分布,貝塔分布包含兩個(gè)參數(shù),一般寫(xiě)作X~Beta(α,β)。貝塔分布可以理解為事件的概率分布,當(dāng)事先不了解隨機(jī)事件的概率分布時(shí),通過(guò)確定合適的參數(shù),該分布可以給出所有事件出現(xiàn)的概率。

2.2 湯普森采樣算法在經(jīng)典問(wèn)題中的應(yīng)用

湯普森采樣算法針對(duì)多搖臂賭博機(jī)問(wèn)題具有較為成熟的理論研究。

多搖臂賭博機(jī)問(wèn)題的描述:賭博機(jī)有K個(gè)搖臂,在用戶選擇某個(gè)搖臂后,賭博機(jī)有一定概率吐出一枚硬幣,該概率的數(shù)值未知,并且不同搖臂之間的概率值不相等。該優(yōu)化問(wèn)題是使得用戶搖動(dòng)N次搖臂之后,得到的累計(jì)硬幣數(shù)量盡可能多。

參數(shù)假設(shè):決策階段n=1,2,3,…,N;搖臂k=1,2,3,…,K;搖臂k在決策階段n的累計(jì)執(zhí)行成功次數(shù)為αk(n);搖臂k在決策階段n的累計(jì)執(zhí)行失敗次數(shù)為βk(n);搖臂k在決策階段n的采樣值為θk(n)。

步驟1):對(duì)每個(gè)搖臂k,令αk(1)=0,βk(1)=0。

步驟2):在每個(gè)決策階段n下,根據(jù)分布Beta(αk(n)+1,βk(n)+1)進(jìn)行K次采樣θk(n)。

步驟3):在每個(gè)決策階段n下,所選擇的搖臂a(n)= argmax (θk(n)),并記錄回報(bào)值rn。

步驟4):若rn=1,則αa(n)(n+1)=αa(n)(n)+1;若rn=0,則βa(n)(n+1)=βa(n)(n)+1。

步驟5):循環(huán)步驟2)至步驟4),直至達(dá)到最大決策階段N。

3 問(wèn)題描述與建模

3.1 問(wèn)題描述

本文所分析的是線上零售的業(yè)務(wù)場(chǎng)景:在一個(gè)給定的銷售季度內(nèi),零售商通過(guò)調(diào)整產(chǎn)品的定價(jià)與分析用戶畫(huà)像來(lái)最大化該銷售季度的總收入。

在建模過(guò)程中,將一個(gè)銷售季度拆分成T個(gè)階段,并假設(shè)在每個(gè)階段零售商銷售N件產(chǎn)品。在產(chǎn)品價(jià)格上,假設(shè)存在K個(gè)定價(jià)分別為{p1,p2,…,pk},其中pk是一個(gè)長(zhǎng)度為N的向量,用來(lái)表示所有產(chǎn)品的某種定價(jià)策略。具體而言,對(duì)于產(chǎn)品i,有pk=(p1k,p2k,…,pNk),其中pik是該策略下對(duì)產(chǎn)品i的定價(jià)。根據(jù)動(dòng)態(tài)定價(jià)的文獻(xiàn),還引入了價(jià)格上限p∞,表示在該價(jià)格下用戶完全沒(méi)有購(gòu)買(mǎi)產(chǎn)品的需求。記P(t)=(P1(t),P2(t),…,PN(t)) 表示零售商在某一個(gè)階段采取的價(jià)格,并且滿足P(t)∈{p1,p2,…,pk,p∞}。

用戶則是在每個(gè)階段根據(jù)零售商的產(chǎn)品價(jià)格做出相應(yīng)的購(gòu)買(mǎi)決策,記D(t)=(D1(t),D2(t),…,DN(t)) 表示用戶在某一個(gè)階段的產(chǎn)品需求量。假定對(duì)于給定的P(t)=pk,需求D(t)是根據(jù)累積分布函數(shù)F(x1,x2,…,xn;pk,θ)形成的概率分布的采樣值,其中θ為未知參數(shù),體現(xiàn)需求分布的類型已知但參數(shù)未知。

根據(jù)用戶畫(huà)像,可以通過(guò)該季度前的用戶消費(fèi)數(shù)據(jù),將用戶聚類成M個(gè)大類。對(duì)于不同類型的用戶群體,假定其需求函數(shù)的分布相同但是未知參數(shù)θ不同,記θ=(θ1,θ2,…,θM),并且利用價(jià)格歧視對(duì)每個(gè)類型的用戶分別進(jìn)行定價(jià),從而最大化該季度下每個(gè)產(chǎn)品在每個(gè)用戶群體中的總收入。

3.2 問(wèn)題類比

可以將該場(chǎng)景下的零售商的動(dòng)態(tài)定價(jià)問(wèn)題與傳統(tǒng)的多搖臂賭博機(jī)問(wèn)題進(jìn)行類比,其中零售商對(duì)于每類客戶的每個(gè)產(chǎn)品的價(jià)格簇對(duì)應(yīng)于搖臂,相應(yīng)的收入則對(duì)應(yīng)于搖動(dòng)搖臂后的獎(jiǎng)勵(lì)。

對(duì)于每一個(gè)群體的收入最大化問(wèn)題,可以采用湯普森采樣在多搖臂賭博機(jī)問(wèn)題中的應(yīng)用來(lái)進(jìn)行建模。

3.3 問(wèn)題建模

先根據(jù)用戶在目標(biāo)季度前的行為數(shù)據(jù)對(duì)用戶群體進(jìn)行聚類分析,再對(duì)每一類用戶采用如下的最優(yōu)化模型進(jìn)行求解。

對(duì)目標(biāo)季度內(nèi)的每一個(gè)階段進(jìn)行如下步驟(t=1,2,…,T):

步驟1):根據(jù)歷史數(shù)據(jù)確定未知參數(shù)θ(t)的分布情況Θ(t)。

步驟2):在每個(gè)決策階段t下,根據(jù)相應(yīng)分布對(duì)未知參數(shù)θ(t)進(jìn)行采樣。

步驟3):對(duì)每種定價(jià)pk,根據(jù)其歷史數(shù)據(jù)確定產(chǎn)品需求與定價(jià)間關(guān)系的函數(shù)分布類型F(x1,x2,…,xn;pk,θ),代入θ(t)的采樣值后,計(jì)算產(chǎn)品的平均需求dk。

步驟4):在每個(gè)決策階段t,求解如下的最優(yōu)化問(wèn)題,其中xk表示最終價(jià)格是給定K個(gè)價(jià)格的線性組合的形式:

xk≥0,k∈[K]

步驟5):增加當(dāng)前階段需求的實(shí)際值,并更新參數(shù)θ(t)的分布情況Θ(t)。

步驟6):循環(huán)步驟2)至步驟5),直至達(dá)到最大決策階段T。

為了解釋在動(dòng)態(tài)定價(jià)場(chǎng)景下探索與利用困境,可以考慮以下簡(jiǎn)化場(chǎng)景:對(duì)某一類型的用戶,在某個(gè)階段,假定采取p1的定價(jià)策略在需求函數(shù)的先驗(yàn)分布下可以獲得最高的預(yù)期收益,那采取貪婪策略的零售商會(huì)以概率為1采取p1的定價(jià)策略。但是該做法是在預(yù)測(cè)的前提下可以獲得最高的收益,但是無(wú)法保證在真實(shí)的情況下同樣能夠獲得最高的收益,從而引出了探索利用困境的問(wèn)題,即零售商應(yīng)該通過(guò)何種定價(jià)策略,在充分利用當(dāng)前最優(yōu)價(jià)格的情形下(對(duì)應(yīng)于利用階段),對(duì)于非當(dāng)前最優(yōu)的價(jià)格進(jìn)行探索實(shí)踐(對(duì)應(yīng)于探索階段),從而在平衡利用與探索的過(guò)程中進(jìn)行更優(yōu)的定價(jià)決策。

4 數(shù)值仿真

4.1 數(shù)值案例

下面將圍繞一個(gè)零售商銷售商品的定價(jià)策略的具體數(shù)值案例,分析湯普森采樣算法在動(dòng)態(tài)定價(jià)中的應(yīng)用效果。為了簡(jiǎn)單起見(jiàn),考慮零售商在一個(gè)銷售周期內(nèi)只能銷售一種產(chǎn)品,零售商定價(jià)方案的集合是已經(jīng)預(yù)先決策的,并且不考慮定價(jià)方案間的線性組合。為了對(duì)湯普森采樣的結(jié)果進(jìn)行進(jìn)一步分析,還引入了兩種常見(jiàn)的貪婪算法進(jìn)行對(duì)比。

在數(shù)值案例中,假定零售商在一整個(gè)銷售周期內(nèi)只銷售一種產(chǎn)品,并根據(jù)產(chǎn)品在市場(chǎng)上的歷史表現(xiàn)與目標(biāo)客戶的群體畫(huà)像,預(yù)先制定了定價(jià)方案。零售商對(duì)于產(chǎn)品在不同價(jià)格下的需求函數(shù)的類型是已知的,其場(chǎng)景對(duì)應(yīng)的是零售商針對(duì)一款具體的產(chǎn)品對(duì)用戶進(jìn)行定價(jià)并投放。因?yàn)橛脩舻倪x擇可以簡(jiǎn)化為購(gòu)買(mǎi)或不購(gòu)買(mǎi),所以對(duì)于需求函數(shù)采用的是二項(xiàng)分布,而二項(xiàng)分布參數(shù)的含義則是用戶采取購(gòu)買(mǎi)行為的概率,也可以理解為用戶期望需求的大小。其流程是針對(duì)同類型的用戶,按照先后順序分別對(duì)不同的用戶制定不同的價(jià)格,以實(shí)現(xiàn)獲得的期望總收入最高。

其中,價(jià)格的集合為{¥19.8,¥28.8,¥36.8,¥41.8},理論平均需求為d(¥19.8)=0.8,d(¥28.8)=0.6,d(¥36.8)=0.3,d(¥41.8)=0.2。該需求的參數(shù)對(duì)應(yīng)的是理論值,在不斷變化定價(jià)并觀察用戶反饋的過(guò)程中,一步步地對(duì)理論值的大小進(jìn)行預(yù)測(cè),從而使預(yù)測(cè)值更為接近理論值。

4.2 仿真涉及的相關(guān)算法

在數(shù)值檢驗(yàn)中采用的三種算法如下:

樸素貪婪算法:屬于該問(wèn)題下的貪婪算法中的一種,在此次數(shù)值模擬中該算法也作為所有算法的基準(zhǔn)。該算法將銷售周期切分成兩個(gè)部分,在第一個(gè)周期內(nèi)全部進(jìn)行探索,在第二個(gè)周期內(nèi)直接根據(jù)之前累計(jì)收益最高的定價(jià)方案進(jìn)行應(yīng)用。這就是被稱為樸素的原因,也使該算法在現(xiàn)實(shí)場(chǎng)景下經(jīng)常被使用。

ε-貪婪算法:基于樸素貪婪算法進(jìn)行調(diào)整,希望對(duì)于探索與利用階段的劃分進(jìn)行平衡。其先在(0, 1)之間選擇一個(gè)較小的數(shù)值作為ε,每個(gè)決策階段是:以ε的概率進(jìn)行探索,即在所有價(jià)格方案中隨機(jī)挑選出一個(gè)價(jià)格;以(1-ε)的概率進(jìn)行利用,即選擇截至當(dāng)前平均收益最大的價(jià)格方案。該算法在基準(zhǔn)貪婪算法的基礎(chǔ)上,進(jìn)行了探索與利用階段的劃分。

湯普森采樣算法:按照2.3中的建模過(guò)程,在每一位新增用戶進(jìn)行購(gòu)買(mǎi)選擇之后,會(huì)對(duì)所有定價(jià)下的期望需求值進(jìn)行預(yù)測(cè),并且挑選出價(jià)格與期望需求乘積最大的定價(jià)方案,并對(duì)下一位用戶采用該定價(jià)方案。

4.3 仿真結(jié)果的分析

數(shù)值仿真的結(jié)果見(jiàn)圖1,其中第一根線代表的是湯普森采樣算法,第二根線代表的是ε-貪婪算法,第三根線代表的是樸素貪婪算法。在參數(shù)制定方面,對(duì)ε-貪婪算法將ε的數(shù)值定為0.3,對(duì)樸素貪婪算法將前30%的周期數(shù)用于探索階段并且在各個(gè)價(jià)格方案間平分總次數(shù),將后70%的周期數(shù)用于利用階段。

圖1 三種算法的不同定價(jià)策略的數(shù)值仿真結(jié)果

其中,圖1的橫軸代表不同的周期數(shù),并在作圖階段進(jìn)行了對(duì)數(shù)處理。圖1的縱軸代表了不同方案的收益占理論最大收益的百分比,在該問(wèn)題的數(shù)據(jù)下,單個(gè)用戶在不同價(jià)格下的理論收益等于價(jià)格與對(duì)應(yīng)期望收益的乘積,具體的數(shù)值為集合{¥15.84, ¥17.28, ¥11.04, ¥8.36},取最大值¥17.28,其代表理論情況下的最佳方案是對(duì)所有用戶都采用¥28.8的定價(jià),而其所對(duì)應(yīng)的理論最大收益則是其與周期總數(shù)的乘積,為17.28T。而縱軸的數(shù)值則代表了每個(gè)方案的收益占理論最大收益17.28T的百分比。為了降低數(shù)值計(jì)算過(guò)程中的隨機(jī)性,在具體方案收益的計(jì)算中選取的是相應(yīng)條件下10次取值的平均值。

分析圖1可以得到以下結(jié)論:1)在最終的累計(jì)收益上,湯普森采樣算法優(yōu)于ε-貪婪算法、樸素貪婪算法,并且湯普森采樣算法在各個(gè)周期數(shù)下都具有明顯的優(yōu)勢(shì)。2)不同算法的累計(jì)收益均是隨著周期數(shù)的增加而遞增的,但是其邊際增長(zhǎng)不斷降低。3)對(duì)湯普森采樣算法的表現(xiàn)進(jìn)行具體的分析,當(dāng)周期數(shù)為100時(shí),其預(yù)期收益占理論最大收益的百分比已經(jīng)達(dá)到82%;當(dāng)周期數(shù)為1000時(shí),其占比達(dá)到了94%;當(dāng)周期數(shù)為10000時(shí),其占比已經(jīng)高達(dá)98%,已經(jīng)非常接近于理論最大收益,可以作為理論最大收益的一種有效的近似計(jì)算方式。

4.4 預(yù)先對(duì)用戶群體進(jìn)行劃分

根據(jù)仿真的結(jié)果可知,湯普森算法相較于其他貪婪算法在最終的效果上有顯著的優(yōu)勢(shì)。在采用湯普森算法之前,同樣可以根據(jù)用戶在目標(biāo)季度前的行為數(shù)據(jù)對(duì)用戶群體進(jìn)行聚類分析,再對(duì)每一類用戶進(jìn)行單獨(dú)求解,并對(duì)于每一類型的用戶制定不同的定價(jià)策略,從而利用價(jià)格歧視的方式為零售商獲得更高的總收入。

考慮為購(gòu)買(mǎi)力更強(qiáng)的用戶制定出更高的定價(jià)策略方案。假定可以通過(guò)用戶的歷史行為數(shù)據(jù)將用戶分成低端用戶、中端用戶、高端用戶三類,并且類型占比分別為70%、20%、10%。簡(jiǎn)單起見(jiàn),不再新增其他的價(jià)格方案,仍舊沿用原先的定價(jià)策略集合{¥19.8,¥28.8,¥36.8,¥41.8},但是對(duì)在每個(gè)價(jià)格下的理論平均需求的大小進(jìn)行調(diào)整,具體數(shù)值見(jiàn)表1。

表1 不同類型用戶在不同定價(jià)下的理論平均需求的數(shù)值

數(shù)值的設(shè)定需要滿足按照不同類型用戶的權(quán)重加權(quán)后的用戶總體需求與原先的設(shè)定保持一致,即對(duì)于用戶總體的理論平均需求的大小滿足d(¥19.8)=0.8,d(¥28.8)=0.6,d(¥36.8)=0.3,d(¥41.8)=0.2。而在算法的選擇上,直接采取效果較優(yōu)的湯普森采樣算法對(duì)于不同用戶類型各自按照上節(jié)中的數(shù)值仿真方式預(yù)測(cè)其收益,具體的數(shù)值仿真結(jié)果見(jiàn)圖2與圖3。圖2與圖3中橫坐標(biāo)均是周期數(shù)的對(duì)數(shù)值,不同的是各自的縱坐標(biāo)。圖2的縱坐標(biāo)是不同類型用戶的預(yù)期收益占其各自理論最大收益的百分比,因而均小于100%;圖3的縱坐標(biāo)則為了之后的累加操作而進(jìn)行了基數(shù)的調(diào)整,其代表的是不同類型用戶的預(yù)期收益占原先用戶總體理論最大收益的百分比,考慮到中端與高端用戶的消費(fèi)能力更強(qiáng),其相應(yīng)的理論最大收益均高于原先用戶總體的理論最大收益,因而其縱坐標(biāo)取值會(huì)大于100%。

圖2 用戶分群后的預(yù)期收益情況

圖3 用戶分群后的預(yù)期收益情況 (調(diào)整基數(shù)后)

根據(jù)圖3中調(diào)整基數(shù)后的低端用戶、中端用戶與高端用戶的預(yù)期收益占比,按照其相應(yīng)的權(quán)重{0.7,0.2, 0.1}進(jìn)行加權(quán)累加后,作為聚類方式下用戶總體的預(yù)期總收益,并將其與原先的用戶總體的預(yù)期總收益進(jìn)行對(duì)比,結(jié)果見(jiàn)圖4。從圖4中可以發(fā)現(xiàn)聚類后用戶總體的預(yù)期總收益均高于聚類前的結(jié)果,增加幅度達(dá)到了10%以上,因而可以部分驗(yàn)證廠商根據(jù)歷史行為數(shù)據(jù)對(duì)用戶進(jìn)行分類后的預(yù)期收益會(huì)顯著更高。

圖4 聚類前后用戶總體的預(yù)期總收益對(duì)比

5 落地性分析

在方案的落地性分析中聚焦于兩點(diǎn):1)如何讓用戶在價(jià)格歧視下,降低對(duì)于價(jià)格的感知能力;2)如何在現(xiàn)實(shí)應(yīng)用中實(shí)現(xiàn)多次定價(jià)。

針對(duì)問(wèn)題一,目前行業(yè)內(nèi)的做法主要是在產(chǎn)品的統(tǒng)一原始價(jià)格上進(jìn)行價(jià)格的再次包裝,從而降低用戶對(duì)于產(chǎn)品價(jià)格的感知能力。包裝價(jià)格的手段有隨機(jī)抽取優(yōu)惠券、完成任務(wù)獲得額外補(bǔ)貼等形式。具體分析數(shù)值案例中產(chǎn)品的階梯定價(jià)有{¥19.8,¥28.8,¥36.8,¥41.8},而可以采用的手段則是將產(chǎn)品的原始價(jià)格定為¥50,再分別設(shè)立4折、5.8折、7.4折、8.4折的優(yōu)惠券供用戶隨機(jī)抽取,從而實(shí)現(xiàn)階梯定價(jià)的目的。在該場(chǎng)景下,這樣就可以更好地讓用戶接受同一產(chǎn)品不同定價(jià)的設(shè)定。

6 結(jié)論與展望

本文具體分析了在有限的銷售周期內(nèi)基于動(dòng)態(tài)定價(jià)的收入管理問(wèn)題,其解決的問(wèn)題場(chǎng)景是:使得零售商在該銷售周期內(nèi)獲得盡可能高的累計(jì)收入。為了更貼近現(xiàn)實(shí)場(chǎng)景,假定了零售商在銷售周期開(kāi)始之前并不知曉各個(gè)價(jià)格下的用戶平均需求,但可以通過(guò)用戶群體的歷史購(gòu)買(mǎi)行為得到包含未知參數(shù)的需求函數(shù)的分布。本文的主要貢獻(xiàn)在于遷移應(yīng)用了湯普森采樣算法,通過(guò)動(dòng)態(tài)定價(jià)的方式設(shè)計(jì)了一套定價(jià)策略以幫助零售商實(shí)現(xiàn)更高的累計(jì)收入,在該基礎(chǔ)上采取了預(yù)先的用戶聚類,并提出了方案的落地方式。在數(shù)值仿真的過(guò)程中,采用湯普森采樣算法的預(yù)期總收入好于傳統(tǒng)的啟發(fā)式算法,展現(xiàn)了以湯普森采樣為代表的機(jī)器學(xué)習(xí)算法在收入管理領(lǐng)域中的應(yīng)用價(jià)值,并且采取預(yù)先用戶聚類的方案也顯著好于原方案。根據(jù)本文的算法所提出的定價(jià)策略是:在每一個(gè)單位定價(jià)周期內(nèi),通過(guò)算法選擇出隨機(jī)數(shù)的最大值所對(duì)應(yīng)的候選項(xiàng)作為該階段的定價(jià),并更新該候選項(xiàng)的貝塔分布。循環(huán)給定次數(shù)之后,完成該優(yōu)化問(wèn)題的完整定價(jià)策略。而在策略的可落地性上,可以采用包裝后的價(jià)格歧視方案來(lái)降低用戶的價(jià)格感知能力,并且對(duì)于用戶群體采取分批逐次定價(jià)的方式更好地實(shí)現(xiàn)了價(jià)格的多次調(diào)整。

對(duì)未來(lái)的工作還存在一些可以繼續(xù)深入研究的方向:其一是進(jìn)一步針對(duì)用戶群體劃分的準(zhǔn)確度與最終預(yù)期總收入之間的定量關(guān)系;其二是進(jìn)一步考慮情境關(guān)系下的湯普森采樣算法(Contextual Thompson Sampling)在收入管理問(wèn)題上的應(yīng)用,并與傳統(tǒng)的湯普森采樣算法進(jìn)行對(duì)比分析;其三是與零售商合作進(jìn)行實(shí)證研究,進(jìn)一步探索該策略在實(shí)際場(chǎng)景下的有效性。

猜你喜歡
湯普森搖臂零售商
柴油機(jī)搖臂與搖臂軸粘連原因分析及改進(jìn)
專利名稱:電腦機(jī)箱沖壓廢料回收裝置及操作方法
一種加工搖臂裝置銷孔的工藝
完形填空兩篇
會(huì)做生意的湯普森
因情緒失控而被毀的競(jìng)選
卷首語(yǔ)
國(guó)產(chǎn)品牌,零售商這樣說(shuō)……
零售商都在做自有品牌化妝品,如何才能脫穎而出?
汽車搖臂中頻電磁感應(yīng)加熱爐控制系統(tǒng)設(shè)計(jì)