国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于全文索引技術(shù)的超市商品的關(guān)聯(lián)分析

2015-04-21 02:38:26盧喜利周月鵬
微型電腦應(yīng)用 2015年6期
關(guān)鍵詞:礦泉水貨架關(guān)聯(lián)度

盧喜利,周月鵬

基于全文索引技術(shù)的超市商品的關(guān)聯(lián)分析

盧喜利,周月鵬

超市的貨架擺放、商品陳列,在一定程度上影響了商品的銷售。通過(guò)對(duì)銷售數(shù)據(jù)的分析,挖掘出商品之間的關(guān)聯(lián)程度,進(jìn)而確定商品在貨架上的擺放位置,便于購(gòu)物者就近選擇,有利于提高超市的銷售額。雖然,在分析數(shù)據(jù)過(guò)程中可以通過(guò)精確查詢得到某兩種或幾種商品之間的關(guān)系,但同類型商品和某種其它商品之間的關(guān)系就不能通過(guò)精確查詢得到。全文索引技術(shù)是目前搜索引擎的關(guān)鍵技術(shù),由于商品種類繁多,在分析過(guò)程中使用全文索引技術(shù)可以減少系統(tǒng)開(kāi)銷,提高檢索效率和精準(zhǔn)度。

全文索引;關(guān)聯(lián)度;檢索;挖掘

0 引言

隨著信息技術(shù)的發(fā)展,各個(gè)超市在運(yùn)營(yíng)過(guò)程中產(chǎn)生大量的銷售數(shù)據(jù)記錄,一般情況下這些記錄都保存在數(shù)據(jù)庫(kù)中,沒(méi)有被充分利用。通過(guò)關(guān)聯(lián)技術(shù)挖掘銷售數(shù)據(jù)間的關(guān)聯(lián)關(guān)系,科學(xué)合理的利用歷史數(shù)據(jù),找出交易數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。

超市管理者在制定商品在貨架上擺放位置的策略,在一定程度上影響著超市的銷售額和利率。沃爾瑪將啤酒和尿不濕放在一起,顯著提高了銷售量就是一個(gè)成功的案例。通過(guò)對(duì)顧客購(gòu)買(mǎi)商品歷史信息的分析,挖掘出顧客在購(gòu)買(mǎi)商品過(guò)程中商品之間的關(guān)聯(lián)關(guān)系,調(diào)整商品位置,使商品擺放搭配更加科學(xué)合理,將類型不同但用途關(guān)聯(lián)的商品陳列在一起,增加了不同商品之間購(gòu)買(mǎi)的機(jī)會(huì),擴(kuò)大銷售范圍和規(guī)模,增加銷售額和利潤(rùn)[1]。

1 商品關(guān)聯(lián)度分析

1.1 定義分析

關(guān)聯(lián)分析又稱關(guān)聯(lián)挖掘,就是在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項(xiàng)目集合或?qū)ο蠹现g的頻繁模式、因果、關(guān)聯(lián)或相關(guān)性結(jié)構(gòu)。也可以說(shuō),關(guān)聯(lián)分析是用來(lái)發(fā)現(xiàn)有關(guān)交易的數(shù)據(jù)庫(kù)中不同商品(項(xiàng))之間的聯(lián)系[2]。

關(guān)聯(lián)分析是一種應(yīng)用型很強(qiáng)的分析技術(shù),通過(guò)分析發(fā)現(xiàn)存在于大量數(shù)據(jù)集中的關(guān)聯(lián)性或相關(guān)性,從而描述了一個(gè)事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式[3]。

關(guān)聯(lián)分析是從大量數(shù)據(jù)中發(fā)現(xiàn)項(xiàng)集之間有用的關(guān)聯(lián)和相關(guān)聯(lián)系。關(guān)聯(lián)分析的一個(gè)典型例子是購(gòu)物籃分析。該過(guò)程通過(guò)發(fā)現(xiàn)顧客每次購(gòu)買(mǎi)的不同商品之間的聯(lián)系,分析超市商品之間的關(guān)聯(lián)程度[4]。通過(guò)了解哪些商品頻繁地被顧客同時(shí)購(gòu)買(mǎi),這種關(guān)聯(lián)的發(fā)現(xiàn)可以幫助零售商調(diào)整貨架上商品的擺放位置。

通過(guò)數(shù)據(jù)庫(kù)的關(guān)聯(lián)分析可以得出“由于某些事件的發(fā)生而引起另外一些事件的發(fā)生”之類的規(guī)則。如“67%的顧客在購(gòu)買(mǎi)啤酒的同時(shí)也會(huì)購(gòu)買(mǎi)尿布”,因此通過(guò)合理的啤酒和尿布的貨架擺放或捆綁銷售可提高超市的服務(wù)質(zhì)量和效益。1.2關(guān)聯(lián)度計(jì)算

在超市商品集合中,利用組合方法從歷史記錄中選取兩類商品,然后從購(gòu)物記錄中通過(guò)全文索引進(jìn)行檢索,某種商品組合占該種商品百分比達(dá)到一定程度時(shí)將這兩種或者幾種商品在貨架上擺在一起,便于購(gòu)物者就近選擇[5],也可以增加銷售額。

數(shù)據(jù)庫(kù)中用來(lái)保存商品購(gòu)買(mǎi)信息的表格包括八個(gè)字段,分別是編號(hào)(SerialId)、收銀員編號(hào)(UserId)、流水號(hào)(SerialNum)、商品編號(hào)(GoodId)、商品名稱(GoodName)、購(gòu)買(mǎi)數(shù)量(Amount)、購(gòu)買(mǎi)時(shí)間(PayTime)、備注(Memo)。編號(hào)是表格中主鍵,長(zhǎng)整形且自增,用來(lái)唯一標(biāo)識(shí)一條記錄;收銀員編號(hào)用來(lái)確定操作的工作人員;流水號(hào)是每次購(gòu)買(mǎi)的一個(gè)編號(hào),每一次消費(fèi)的多數(shù)商品會(huì)有一個(gè)對(duì)應(yīng)的編號(hào);商品編號(hào)和商品名稱是商品的信息;購(gòu)買(mǎi)數(shù)量是某種商品一次購(gòu)買(mǎi)的數(shù)量;購(gòu)買(mǎi)時(shí)間是消費(fèi)時(shí)間。在創(chuàng)建全文索引的過(guò)程中,索引字段是商品名稱(GoodName)。

在查詢過(guò)程中,通過(guò)輸入?yún)?shù)@pName1和@pName2進(jìn)行查詢,內(nèi)部?jī)蓚€(gè)子查詢分別得到消費(fèi)記錄中的商品,包含@pName1名稱的商品和包含@pName2名稱的商品的流水號(hào),兩個(gè)批次編號(hào)取交集,外層查詢得到的就是同時(shí)購(gòu)買(mǎi)兩種商品的流水號(hào),最外層的查詢得到交集中記錄的條數(shù)賦值給@pCount1。

第一個(gè)查詢

第二個(gè)查詢

第一個(gè)查詢得到同時(shí)購(gòu)買(mǎi)@pName1的商品和@pName2的商品數(shù)量,通過(guò)第二個(gè)子查詢得到購(gòu)物商品名中僅包含@pName1的商品數(shù)量,將符合條件的數(shù)值賦值給@pCount2,通過(guò)@pCount1和@pCount2得到@pName1的商品和@pName2的商品的關(guān)聯(lián)度,然后將兩個(gè)商品名和對(duì)應(yīng)的關(guān)聯(lián)度存到另一個(gè)表格Result中,Result表有三個(gè)字段,分別是@pName1、@pName2和關(guān)聯(lián)度。

通過(guò)上面兩部分代碼得到了某兩種商品之間的關(guān)聯(lián)度。每個(gè)商品都有一個(gè)對(duì)應(yīng)的編號(hào)(GoodId),通過(guò)商品編號(hào)進(jìn)行循環(huán)的嵌套,每取一個(gè)商品編號(hào),查出對(duì)應(yīng)的商品名稱,分別給@pName1和@pName2進(jìn)行賦值,然后進(jìn)行查詢。外層循環(huán)執(zhí)行一次就可以得到@pName1名稱的商品和所有商品之間的關(guān)聯(lián)度,將結(jié)果保存在Result表中。

可以結(jié)合季節(jié)性以及消費(fèi)習(xí)慣進(jìn)行整合,同時(shí)關(guān)注銷售,適時(shí)進(jìn)行調(diào)整。根據(jù)需要可以將分析的時(shí)間確定為一個(gè)月、三個(gè)月或者半年。從Result表中取出比較結(jié)果,當(dāng)關(guān)聯(lián)度高于某個(gè)指定的閾值時(shí),在貨架商品擺放時(shí)可以考慮將這些商品擺放在一起。

2 結(jié)果分析

從商品中抽取部分進(jìn)行分析,選取的樣品包括:怡寶礦泉水、農(nóng)夫山泉礦泉水、康師傅礦泉水、老壇酸菜牛肉面、康師傅牛肉面、蘋(píng)果、背包、紙巾。

在商品集合中,三個(gè)牌子的礦泉水都屬于一類,如果使用精確查詢進(jìn)行匹配商品的關(guān)聯(lián)度,就可以得到某個(gè)牌子的礦泉水和某個(gè)牌子的方便面之間的關(guān)聯(lián)程度。有時(shí)顧客在買(mǎi)這些商品的過(guò)程中,只是要買(mǎi)該類商品,不一定看是什么牌子的,這樣的關(guān)聯(lián)就不是很科學(xué)。當(dāng)牌子很多,某兩種關(guān)聯(lián)度很高的商品通過(guò)查詢得到的關(guān)聯(lián)度不是很高,不能將兩類商品放在一起,影響了商品的銷售。

不管是哪個(gè)牌子的礦泉水都包含“礦泉水”這個(gè)關(guān)鍵詞,不管是哪個(gè)方便面都包含“方便面”這個(gè)關(guān)鍵詞,在操作過(guò)程中就可以使用like關(guān)鍵詞進(jìn)行檢索,但like的檢索效率很低,當(dāng)數(shù)據(jù)量很大的時(shí)候檢索時(shí)間是不能忍受的。全文索引技術(shù)是目前搜索引擎的關(guān)鍵技術(shù),由于商品種類繁多,在分析過(guò)程中使用全文索引技術(shù)可以減少系統(tǒng)開(kāi)銷,提高檢索效率和精準(zhǔn)度。對(duì)比情況如表1所示:

表1 like查詢和全文索引檢索結(jié)果對(duì)比

通過(guò)測(cè)試結(jié)果可以看出,當(dāng)數(shù)據(jù)量非常大的時(shí)候,全文索引的查詢速度比like的查詢速度快很多。超市銷售的數(shù)據(jù)是海量的,這樣如果使用like進(jìn)行查詢就遠(yuǎn)不如使用全文索引技術(shù)的效率高。

每次分析之后,將結(jié)果保存在Result表中;再次分析后首先將Result表中數(shù)據(jù)備份到Result_History表中,然后刪除Result表中原有記錄刪除,將新結(jié)果保存在Result表中。每次分析的結(jié)果都保留在歷史表中,通過(guò)對(duì)歷史表數(shù)據(jù)的分析,可以看出商品關(guān)聯(lián)度的走向,是遞增的或遞減的趨勢(shì),可以對(duì)銷售情況進(jìn)行預(yù)測(cè)。

4 總結(jié)

針對(duì)目前超市中的需求,本文設(shè)計(jì)了從歷史記錄中挖掘商品關(guān)聯(lián)度的方法,為企業(yè)和超市提供科學(xué)合理的門(mén)店布局、貨架擺放、商品陳列、關(guān)聯(lián)推薦和促銷等管理決策。促進(jìn)顧客購(gòu)物,從而提高超市的銷量和競(jìng)爭(zhēng)力[1]。

[1]楊豐梅,李夢(mèng).一種帶記憶性的零售商品關(guān)聯(lián)度分析方法[J].系統(tǒng)工程理論與實(shí)踐,2014.

[2]梁鋒.數(shù)據(jù)挖掘技術(shù)在壽險(xiǎn)客戶流失中的應(yīng)用[J].電子科學(xué)技術(shù),2015.

[3]錢(qián)勤,張瑊.用于入侵檢測(cè)及取證的冗余數(shù)據(jù)刪減技術(shù)研究[J].計(jì)算機(jī)科學(xué),2014.

[4]楊秀萍.大數(shù)據(jù)下關(guān)聯(lián)規(guī)則算法的改進(jìn)及應(yīng)用[J].計(jì)算機(jī)與現(xiàn)代化,2014.

[5]朱峰.基于視景仿真的3D購(gòu)物系統(tǒng)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2014.

Correlation Analysis of Supermarket Goods Based on Full Text Indexing Technology

Lu Xili,Zhou Yuepeng
(Institute of information science and engineering,Shaoguan University,Shaoguan,512005,Guangdong,China)

The placement of shelves and commodity display can affect the sales of the goods to some extent.Mine the correlation between the commodities through the analysis of sales data,and then confirm the placement of commodities on the shelves for the convenience of shoppers’proximity selection.It is advantageous to increase sales of the supermarket.Although the relationships between two or more than two types of commodities can be obtained by exact queries in the process of data analysis,the relationships between the same type of goods and some other commodities can’t be obtained by the same approach.Full text indexing technology is the key technology of the present search engine.Due to the wide variety of goods,it can reduce the system cost and improve the retrieval efficiency and accuracy in the analysis process with full text indexing techniques.

Full-text Index;Correlation;Retrieval;Mining

TP311

A

1007-757X(2015)06-0059-02

2015.03.31)

廣東省教育廳“質(zhì)量工程”建設(shè)項(xiàng)目(粵教高函〔2014〕97號(hào));廣東省高等教育教學(xué)改革項(xiàng)目(GDJG20142436);韶關(guān)學(xué)院教育教學(xué)改革研究重點(diǎn)項(xiàng)目(SYJY20131404);廣東省自然科學(xué)基金資助項(xiàng)目(2014A030307029);廣東省高等學(xué)??萍紕?chuàng)新(重點(diǎn))項(xiàng)目(2013KJCX0168);韶關(guān)學(xué)院教育教學(xué)改革研究青年項(xiàng)目(SYJY20141561);廣東省哲學(xué)社會(huì)科學(xué)項(xiàng)目(GD13XGL29);廣東省普通高校特色創(chuàng)新項(xiàng)目(2014KTSCX171)

盧喜利(1982-),女,河南省焦作人,韶關(guān)學(xué)院,信息科學(xué)與工程學(xué)院,助教,碩士,研究方向:物聯(lián)網(wǎng)技術(shù)和數(shù)據(jù)挖掘,韶關(guān),512005

周月鵬(1982-),男,河南省平頂山人,韶關(guān)學(xué)院,信息科學(xué)與工程學(xué)院,講師,碩士,研究方向:物聯(lián)網(wǎng)技術(shù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù),韶關(guān),512005

猜你喜歡
礦泉水貨架關(guān)聯(lián)度
云上阿爾山礦泉水
法人(2023年9期)2023-12-01 14:50:12
邵國(guó)勝:實(shí)現(xiàn)從“書(shū)架”到“貨架”的跨越
投資無(wú)人貨架適合嗎?
基于灰色關(guān)聯(lián)度的水質(zhì)評(píng)價(jià)分析
百歲來(lái)天然礦泉水純凈好喝
澳洲容瀾礦泉水
基于灰關(guān)聯(lián)度的鋰電池組SOH評(píng)價(jià)方法研究
電化學(xué)阻抗法預(yù)測(cè)油脂貨架期
特定貨物運(yùn)輸貨架設(shè)計(jì)
河南科技(2014年24期)2014-02-27 14:19:36
基于灰色關(guān)聯(lián)度的公交線網(wǎng)模糊評(píng)價(jià)
河南科技(2014年16期)2014-02-27 14:13:25
乌拉特后旗| 台山市| 鹿泉市| 乐清市| 宕昌县| 马鞍山市| 连南| 东港市| 政和县| 吉首市| 秀山| 北宁市| 濮阳市| 绥德县| 玉溪市| 昭苏县| 兰西县| 抚松县| 普洱| 曲靖市| 京山县| 普兰店市| 吴堡县| 江陵县| 交口县| 武鸣县| 云和县| 泾川县| 福安市| 两当县| 泌阳县| 星座| 北票市| 新泰市| 武威市| 龙游县| 安阳市| 万安县| 沂水县| 克什克腾旗| 博野县|