摘要:超市購物日漸成為人們生活中不可或缺的重要組成部分,因此超市購物行為研究也顯得較為重要。本文采用Apriori關(guān)聯(lián)規(guī)則算法分析超市購物清單中商品之間的關(guān)系,通過算法中兩個重要指標(biāo)支持度與置信度之間的關(guān)系來衡量商品之間的關(guān)聯(lián)關(guān)系,經(jīng)過算法分析獲得具有強(qiáng)相關(guān)性的產(chǎn)品組合。該結(jié)果可用于指導(dǎo)超市商品放置,超市購買指導(dǎo)等。
關(guān)鍵詞:超市商品;關(guān)聯(lián)規(guī)則分析;Apriori
中圖分類號:TP311.1 文獻(xiàn)識別碼:A文章編號:2096-3157(2020)04-0003-02
一、引言
隨著時代的發(fā)展,人們的物質(zhì)生活質(zhì)量日益提高,超市中商品質(zhì)量和商品種類也呈現(xiàn)快速增漲趨勢,顧客可以在超市選擇購買的商品數(shù)量也隨之增加。超市中人流量非常大,超市購物也成為人們?nèi)粘=?jīng)濟(jì)生活中的重要組成部分。針對超市商品關(guān)聯(lián)關(guān)系的分析也顯得尤為重要,如果超市商品關(guān)聯(lián)關(guān)系強(qiáng),則可以將這些商品擺放在同一位置,為超市管理者擺放商品提供依據(jù)。
基于上述背景,本文主要介紹Apriori算法關(guān)聯(lián)規(guī)則以及其計(jì)算每種籃子的獲利能力中的應(yīng)用。眾多研究者應(yīng)用Apriori算法分析市場籃子,并且研究者為了得到更加準(zhǔn)確的數(shù)據(jù)在算法上進(jìn)行多種改進(jìn)研究,因此Apriori算法在分析超市購物習(xí)慣的研究中準(zhǔn)確可靠。在數(shù)據(jù)經(jīng)過預(yù)期處理后,利用Apriori算法對每種籃子中商品進(jìn)行數(shù)據(jù)挖掘并且研究其相關(guān)性,從而得到顧客選擇購買商品間的關(guān)聯(lián)規(guī)則,進(jìn)一步分析購買商品的變動情況,可以為商家的營銷策略變動提供決策支持。
本文第二部分將對于Apriori算法分析超市商品關(guān)聯(lián)規(guī)則文章進(jìn)行介紹;第三部分將對實(shí)驗(yàn)數(shù)據(jù)的選取和預(yù)處理進(jìn)行相關(guān)介紹;第四部分講解利用Python編程,求解得到結(jié)果并對結(jié)果進(jìn)行分析;第五部分為總結(jié)全文,提出 Apriori算法在超市關(guān)聯(lián)規(guī)則關(guān)系分析中具有重要作用。
二、文獻(xiàn)綜述
本部分研究三篇相關(guān)文獻(xiàn),為本文研究提供理論支撐。
高正紅[1]通過對數(shù)據(jù)的分析得出的結(jié)論如下:通過分析數(shù)據(jù)之間的關(guān)系可以預(yù)測未來的發(fā)展趨勢,以便管理人員作出正確的決策,為企業(yè)節(jié)省大量開支,提高企業(yè)利潤。
鮑娜[2]在論文中表明,隨著人們生活水平的提高,網(wǎng)上超市被越來越多的人所利用,網(wǎng)上超市的產(chǎn)品組合也越來越受到關(guān)注。該論文利用Apriori算法對網(wǎng)上超市的商品組合進(jìn)行挖掘,以女性購買者所購買的商品作為數(shù)據(jù)進(jìn)行收集,利用Apriori算法找出出現(xiàn)次數(shù)最多的商品組合并最終得到最優(yōu)的產(chǎn)品組合。該商品組合對網(wǎng)上超市的發(fā)展有一定的指導(dǎo)性作用。
董陽光[3]通過將關(guān)聯(lián)規(guī)則算法應(yīng)用在數(shù)據(jù)挖掘中,可以從超市的購物記錄中找到放置在購物籃中的商品之間的關(guān)系,分析顧客的購物習(xí)慣,并幫助零售商了解顧客經(jīng)常購買哪些產(chǎn)品,以便幫助他們制定更好的營銷策略。利用這種關(guān)聯(lián)規(guī)則,我們可以更具有針對性地指導(dǎo)超市工作人員進(jìn)行商品的擺放,在方便顧客進(jìn)行商品挑選的同時,增加營業(yè)收入,實(shí)現(xiàn)消費(fèi)者與供應(yīng)商的互利共贏。
三、商品數(shù)據(jù)收集與關(guān)聯(lián)規(guī)則算法介紹
1.商品數(shù)據(jù)收集
本文從Kaggle網(wǎng)站上獲取美國某超市的顧客購物清單,其中包含7501組客戶購物數(shù)據(jù),每組購物數(shù)據(jù)分別代表客戶某次購物行為購買的商品種類以及數(shù)量,其中最長的一組數(shù)據(jù)包含20種商品,最短的一組數(shù)據(jù)包含2種商品。
2.數(shù)據(jù)預(yù)處理
本文采用Python進(jìn)行數(shù)據(jù)預(yù)處理以及算法運(yùn)算。Python的Apriori庫要求我們的數(shù)據(jù)集采用列表的形式,因此將整個數(shù)據(jù)集設(shè)置成一個很大的列表,數(shù)據(jù)集中的每個事務(wù)都是外部大列表中的內(nèi)部列表,散亂的數(shù)據(jù)將被整理的更加清晰,有條理。形式如下:[[transaction1],[transaction2],…,[transaction7501]]。表1為我們的部分?jǐn)?shù)據(jù)示例:
3.介紹Apriori關(guān)聯(lián)規(guī)則
Apriori算法是關(guān)聯(lián)規(guī)則算法是非常經(jīng)典的一種數(shù)據(jù)挖掘的算法,應(yīng)用廣泛。它包含兩個重要概念:
(1)支持度(support):代表兩個事件A,B同時發(fā)生的概率,support=P(AB)。
(2)置信度(confidence):代表在事件A發(fā)生的前提下,事件B發(fā)生的概率,conficence=P(B|A)。
使用Apriori算法分析市場籃子目的是在包含不同產(chǎn)品的事務(wù)的數(shù)據(jù)集上使用Apriori算法理解關(guān)聯(lián)規(guī)則及其度量。舉個例子,市場籃子分析可能幫助管理者優(yōu)化不同商品的布局。如果一個顧客買牛奶可能也會同時注意到買面包,他們將牛奶靠近或者遠(yuǎn)離面包可能會對銷售兩項(xiàng)商品都有幫助。市場籃子分析可以通過識別產(chǎn)品之間的關(guān)聯(lián)來完成,稱為關(guān)聯(lián)規(guī)則挖掘。
四、利用Apriori算法挖掘超市商品間關(guān)聯(lián)規(guī)則
結(jié)果分析。本文采用Python編程實(shí)現(xiàn)Apriori算法挖掘超市商品間的關(guān)聯(lián)規(guī)則,使用python根據(jù)所收集到的數(shù)據(jù)進(jìn)行總結(jié)分析得出如下結(jié)論(部分結(jié)果展示):
由表2可看出,“牛肉末”與“香草和胡椒”兩種商品的支持度最高,因此這兩種商品有較高的關(guān)聯(lián)度。說明消費(fèi)者同時購買這兩種商品的概率最大,因此在超市儲備貨物時可以將這兩種商品同時考慮。另外,這兩種商品的置信度為32.35,說明購買“香草和胡椒”的客戶中有32.35%的客戶會購買牛肉末,這是一個很高的比例,因此超市可以考慮將這兩種商品放在一起銷售,建議超市管理者將這兩種商品的貨架擺放在比較鄰近的位置,因此當(dāng)顧客購買“牛肉末”的同時有很大的概率顧客會選擇購買“香菜和胡椒”;同理當(dāng)顧客購買“香菜和胡椒”的同時也會有很大的概率去選擇同時購買“牛肉末”?;蛘咴谏碳腋慊顒訒r免費(fèi)贈送其中一件商品,以達(dá)到增加另一件商品銷量的目的。
五、結(jié)語
隨著人們物質(zhì)生活質(zhì)量日益提高,超市中商品質(zhì)量和商品種類也呈現(xiàn)快速增漲趨勢,顧客可以在超市選擇購買的商品數(shù)量也隨之增加。本文嘗試通過消費(fèi)者的購物數(shù)據(jù),挖掘超市商品之間的關(guān)聯(lián)規(guī)則,通過查看顧客在商品購買過程中的行為習(xí)慣,來發(fā)現(xiàn)商品之間的關(guān)聯(lián)規(guī)則,繼而為超市管理者制定相應(yīng)的營銷策略提供依據(jù)。市場購物籃分析可以幫助管理者優(yōu)化不同的商店布局,對于相關(guān)性比較高的商品,例如如果購買牛肉末的顧客也傾向于同時購買番茄醬,那么將牛肉末放在番茄醬附近或?qū)γ婵赡苡兄谠黾舆@兩種產(chǎn)品的銷售。
參考文獻(xiàn):
[1]高正紅,沈?qū)W利.Apriori算法在超市決策中的應(yīng)用[J].長春工程學(xué)院學(xué)報(bào):自然科學(xué)版,2007,(1):63~66.
[2]鮑娜,張德賢.基于Apriori算法的網(wǎng)上超市產(chǎn)品組合研究[J].福建電腦,2008,(1):64~65.
[3]董陽光.基于Apriori算法的關(guān)聯(lián)規(guī)則超市購物推薦算法研究[J].中國戰(zhàn)略新興產(chǎn)業(yè),2017,(48).
作者簡介:
周冠茜,北京市第十三中學(xué)學(xué)生。