程麗麗
(臺州職業(yè)技術學院,浙江臺州318000)
隨著計算機網(wǎng)絡技術和數(shù)據(jù)庫技術的高速發(fā)展,為網(wǎng)絡商店的繁盛提供了技術的支持、交易的平臺和豐富的資源。網(wǎng)絡商店已經(jīng)由小規(guī)模不斷發(fā)展為大規(guī)模,而傳統(tǒng)的網(wǎng)絡商店的人工管理方式,已經(jīng)無法適應快速發(fā)展的需求。越來越多的網(wǎng)絡商店考慮使用電子化的信息管理系統(tǒng)來代替人工管理方式,提高運營效率,增加收益。
傳統(tǒng)的信息管理系統(tǒng)中數(shù)據(jù)庫技術的應用往往將關注的重點放在如何進行日常業(yè)務的處理、如何實現(xiàn)數(shù)據(jù)的收集、查詢、存儲、統(tǒng)計、處理等功能,更多的是數(shù)據(jù)事務系統(tǒng)。隨著網(wǎng)絡商店的數(shù)量不斷遞增,規(guī)模不斷擴大,對系統(tǒng)的要求不是僅局限于數(shù)據(jù)的一般事務處理,而是如何借助系統(tǒng),把原始的銷售經(jīng)營數(shù)據(jù)轉(zhuǎn)化為網(wǎng)絡商店決策支持的價值信息,獲取最大的競爭優(yōu)勢,搶占市場。
數(shù)據(jù)倉庫技術的應用則能夠解決目前網(wǎng)絡商店經(jīng)營者思考的問題,彌補傳統(tǒng)的數(shù)據(jù)庫技術在分析應用、決策支持上的缺陷[1],快速、準確、高效地從大量的歷史數(shù)據(jù)、報表、單據(jù)中萃取信息,獲得知識。數(shù)據(jù)倉庫是研究和解決從數(shù)據(jù)庫中獲取信息的問題,是決策支持系統(tǒng)和聯(lián)機分析應用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境,它的特點是面向主題的、集成的、穩(wěn)定的和時變的[2]。數(shù)據(jù)倉庫是分析系統(tǒng)的數(shù)據(jù)平臺,為用戶提供分析和決策的支持,把有價值的分析數(shù)據(jù)從事務處理環(huán)境中提取出來進行重新組織,同時建立分析處理的環(huán)境[3]。
目前網(wǎng)絡商店數(shù)量急速增加,經(jīng)營者與客戶是一種距離交易方式,這和實體店的面對面交易方式有很大的不同,提高網(wǎng)店的點擊率、吸引顧客的眼球、獲得良好的信譽評價、提高網(wǎng)店的等級等等都是網(wǎng)店經(jīng)營者所關心的問題。如何將利益最大化、如何摸清市場需求、如何組織銷售行為、如何控制庫存、如何尋找最優(yōu)供應商、如何分析客戶群等等都成為了經(jīng)營者亟待解決的問題。
數(shù)據(jù)倉庫可以保證對業(yè)務數(shù)據(jù)的便捷訪問,解決負責的問題。通過對大量原始數(shù)據(jù)的分析,幫助網(wǎng)絡商店經(jīng)營者解決最關心、最敏感的問題,這些問題中可能是如何選擇商品打造爆款、熱銷款;如何對商品進行布局設計、組合設計,以提高銷量;如何控制庫存,保證爆款熱銷商品的有效供應,如何對滯銷商品進行庫存清倉;如何對市場需求進行預測,保證商品采購的合理提前期;如何對商品評價結(jié)果進行分析,尋找客戶最關心的問題,并解決問題。
這些問題,可以通過建立基于數(shù)據(jù)倉庫的網(wǎng)絡商店決策支持系統(tǒng),利用數(shù)據(jù)挖掘技術,獲得有價值的決策信息,在日益激烈的網(wǎng)絡商店競爭中脫穎而出。
數(shù)據(jù)倉庫是在原有的數(shù)據(jù)庫系統(tǒng)的基礎上,利用抽取、轉(zhuǎn)換、裝載等方法去分析、集成和挖掘現(xiàn)有的數(shù)據(jù)資源,為管理者提供決策支持[4]。數(shù)據(jù)倉庫體系結(jié)構(gòu)由三部分組成,分別是數(shù)據(jù)獲取、數(shù)據(jù)存儲管理和數(shù)據(jù)展現(xiàn),基于數(shù)據(jù)倉庫的網(wǎng)絡商店決策支持系統(tǒng)體系結(jié)構(gòu)如圖1。
在該三層結(jié)構(gòu)中,我們把它分為四個部分,分別為:處理對象、核心構(gòu)件、手段方法、工具。
(1)處理對象。也就是數(shù)據(jù)源,數(shù)據(jù)源作為該系統(tǒng)的處理對象,是整個系統(tǒng)數(shù)據(jù)的源泉。一般分為企業(yè)的內(nèi)部信息和外部信息,在這里數(shù)據(jù)源主要包括:計劃信息、銷售信息、庫存信息、采購信息、物流信息、客戶信息、供應商信息和評價、流量信息等。
(2)核心構(gòu)件。數(shù)據(jù)倉庫是整個系統(tǒng)的核心部分。其關鍵在于對數(shù)據(jù)進行存儲和管理。數(shù)據(jù)倉庫的組織方式與傳統(tǒng)的數(shù)據(jù)庫有所不同,它能夠決定對外部數(shù)據(jù)的表現(xiàn)形式[5]。要選擇產(chǎn)品和技術來建立數(shù)據(jù)倉庫,需要從數(shù)據(jù)倉庫技術特點入手,對現(xiàn)有的業(yè)務系統(tǒng)的數(shù)據(jù)進行抽取、清理,并有效集成。
(3)手段方法。借助數(shù)據(jù)挖掘和聯(lián)機分析,聯(lián)機分析主要是對需要的數(shù)據(jù)進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,并發(fā)現(xiàn)趨勢[6]。數(shù)據(jù)挖掘主要是面向具體的應用,并不是簡單的數(shù)據(jù)處理和操作,它能夠為某一個具體的應用尋找可行的、合理的方案,為各級決策者提供支持,提高效益,節(jié)約成本。
(4)工具。工具主要是指前端工具,主要包括各種報表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉庫或數(shù)據(jù)集市的應用開發(fā)工具[7]。其中數(shù)據(jù)分析工具主要針對OLAP服務器,報表工具、數(shù)據(jù)挖掘工具主要針對數(shù)據(jù)倉庫。
基于數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)主要采用了自底向上的開發(fā)模式,由數(shù)據(jù)驅(qū)動,以技術支撐,滿足應用需求,逐漸完善的開發(fā)過程,可根據(jù)用戶的反饋信息調(diào)整應用需求。
數(shù)據(jù)倉庫是面向主題的、集成的、隨時間不斷變化的數(shù)據(jù)集合,對庫存信息、采購信息、物流信息、客戶信息、供應商信息、評價流量信息等業(yè)務數(shù)據(jù)進行重組。
對于網(wǎng)絡商店數(shù)據(jù)倉庫來講,其主要數(shù)據(jù)源有兩個:一個是來源于網(wǎng)絡商店的外部,例如:物流信息、客戶信息、供應商信息、評價流量信息,這些信息對于網(wǎng)絡商店來講一般是只讀的;另一個是來源于網(wǎng)絡商店內(nèi)部,例如:計劃信息、銷售信息、庫存信息、采購信息等,這些數(shù)據(jù)來源于不同的對象,如電子商務平臺、網(wǎng)絡商店管理系統(tǒng)等。
網(wǎng)絡商店數(shù)據(jù)倉庫的維度設計,從供應鏈的角度來看,其維度設計如下表1。
表1 維度設計表
在這些維度項中,可以將2個或2個以上的維護組合,分析出可供決策的信息。例如,時間維可和商品維進行組合分析,得出某種商品的銷售、庫存、采購的變化。再如,商品維、時間維和流量維組合分析,得出某種商品的流量變化等等。可以為網(wǎng)絡商店管理者提供某種商品的銷售預測情況,提供決策支持。
粒度是數(shù)據(jù)倉庫中數(shù)據(jù)單元的細節(jié)程度或綜合程度的級別。它可以對數(shù)據(jù)或數(shù)據(jù)綜合所使用的時間段參數(shù)進行記錄,決定了數(shù)據(jù)倉庫中所存儲的數(shù)據(jù)在時間上的級別和詳細程度。
在進行粒度設計時數(shù)據(jù)可以是最原始的數(shù)據(jù)(關注細節(jié)的),也可以是匯總數(shù)據(jù),例如1周的、1月的、1季度的、半年的、1年的等等。數(shù)據(jù)的粒度隨著時間跨度的增大而逐漸變粗。時間細化程度越高,粒度越小,時間細化程度越低,粒度越大。
針對網(wǎng)絡商店自身的特點,將銷售分析、庫存分析、采購分析問題中的粒度進行如下表2劃分。
表2 粒度設計表
多維數(shù)據(jù)模型由多維數(shù)據(jù)結(jié)構(gòu)和多維數(shù)據(jù)操作組成。多維數(shù)據(jù)模型是由星形模型、雪花模型和星座模型構(gòu)建,它是OLAP的邏輯模型。通過維度設計,尋找需要觀察的特定角度,而每一個維的粒度就是維的層次數(shù)。維中的成員就代表該維上的一個確定取值。以時間維為例,其粒度有日期、周數(shù)、月份、季度、年、節(jié)假日。月份粒度上有1到12個月,季度有1到4季度。再如在商品維上粒度商品類別有新品、折扣品、清倉品等。多維數(shù)據(jù)模型多采用多維數(shù)組的表現(xiàn)形式:(維1,維2,維3……,維n,變量)。
在基于數(shù)據(jù)倉庫的網(wǎng)絡商店決策支持系統(tǒng)中,將主題分為三個:銷售主題、倉庫主題、采購主題,其星型模型如下圖2。
在基于數(shù)據(jù)倉庫的網(wǎng)絡商店決策支持系統(tǒng)體系結(jié)構(gòu)中前臺工具可以提供報表生成工具,借助諸如交互式窗口、聯(lián)機幫助、向?qū)浇缑娴确绞?,幫助用戶定義各種復雜的報表,實現(xiàn)多維分析、隨機查詢、統(tǒng)計分析等功能,在滿足現(xiàn)有數(shù)據(jù)源的基礎上,為不同決策層提供相對有價值數(shù)據(jù)的提取、轉(zhuǎn)換、展現(xiàn)[8]。通過數(shù)據(jù)分析展現(xiàn)工具對數(shù)據(jù)倉庫中的數(shù)據(jù)進行挖掘和多維分析、匯總,并以報表、圖表、交互式界面的形式展現(xiàn)給決策者,決策者可以很直觀地看到分析的結(jié)果。針對用戶的不同對工具進行合理選擇,可以對可變報表、固定報表進行在線分析處理。
數(shù)據(jù)倉庫可以有效地彌補傳統(tǒng)數(shù)據(jù)庫在分析型應用上的缺陷,從歷史數(shù)據(jù)中獲取有價值的信息。利用數(shù)據(jù)挖掘技術解決網(wǎng)絡商店管理過程中有關決策支持方面的諸多問題。
第一,商品的擺放、搭配。在這里可以選擇商品銷售活動(促銷)為維度對銷售主題進行分析,將商品的擺放、搭配放在一起。也可以選擇時間作為維度對銷售主題進行分析,將同一段時間內(nèi),銷售量相似的商品擺放、搭配在一起,并可考慮參加相同的銷售活動。
第二,爆款商品的選擇??梢酝ㄟ^改進的BP算法、聚類算法對同一個時間段內(nèi)的商品銷售量進行分析,找出暢銷商品和滯銷商品,分析商品的發(fā)展規(guī)律,對市場的變化進行分析,選擇順應市場變化的商品,并對爆款商品進行挖掘、開發(fā)、設計、打造,同時控制滯銷商品。
第三,商品銷售活動(促銷)策略選擇??山柚鷽Q策樹、因果圖的方法分析購買某種商品的客戶行為,根據(jù)其購買行為對客戶群進行分組、針對客戶的屬性,例如,性別、年齡等有針對性地策劃廣告和促銷活動。也可針對商品在某一時間段內(nèi)的銷售情況或商品本身的屬性,設計促銷活動。例如,對于大單客戶可設計贈送會員卡、積分等方式,刺激這類客戶的二次甚至多次消費。對于新客戶,可設計贈送小禮品等方式。提高網(wǎng)店的瀏覽量和人氣。
第四,銷售預測??蛇x擇時間維,對商品的銷售情況進行分析,爆款商品保證庫存充足,滯銷商品采取促銷活動,清空庫存。并根據(jù)市場需求情況進行預測,提前補足庫存,提前設計促銷活動。
第五,庫存動態(tài)控制。選擇時間作為庫存監(jiān)控的維度,分析庫存隨時間的變化情況。計算商品的安全庫存、最大庫存,通過庫存動態(tài)控制保證資金的最大程度流通。
第六,采購分析。這里采購分析包含供應商選擇,商品詢價,成本計算等等。建立供應商評估體系,結(jié)合時間維度變化、商品維度變化對供應商選擇進行支持。
在目前激烈的網(wǎng)絡商店競爭環(huán)境中,建立基于數(shù)據(jù)倉庫的決策支持系統(tǒng),對數(shù)據(jù)進行挖掘、分析,為管理者提供快速、高效、方便、準確的決策支持。通過對源數(shù)據(jù)庫的數(shù)據(jù)進行抽取、轉(zhuǎn)換后裝載到數(shù)據(jù)倉庫中去。本文對基于數(shù)據(jù)倉庫的網(wǎng)絡商店決策支持系統(tǒng)進行研究,構(gòu)建其體系結(jié)構(gòu)。同時對維度、粒度、多維數(shù)據(jù)模型進行設計,實現(xiàn)數(shù)據(jù)倉庫建模。提供一個信息集成和決策的平臺,實現(xiàn)對信息進行聯(lián)機分析處理,構(gòu)建數(shù)據(jù)分析環(huán)境,將原始的經(jīng)營數(shù)據(jù)轉(zhuǎn)化為商業(yè)決策信息,獲取競爭優(yōu)勢。
[1]王柳靖,黎勇,王一川.基于內(nèi)容管理的煙草企業(yè)信息倉庫系統(tǒng)[J].計算機工程,2010,36(23):40-43,46.
[2]張波,耿在丹,杜保強.基于數(shù)據(jù)倉庫的學生信息管理決策系統(tǒng)[J].實驗室研究與探索,2009,(12):59-62.
[3]馬剛,劉天時,程國建.基于數(shù)據(jù)倉庫技術的醫(yī)院信息系統(tǒng)應用研究[J].西安石油大學學報(自然科學),2010,(7):99-102.
[4]李潔,楊金會,滕振芳.數(shù)據(jù)倉庫及數(shù)據(jù)挖掘技術在超市中的應用[J].吉林工程技術師范學院學報,2010(2):248-250.
[5]王炳雪,陳元忠.基于模糊邏輯的多維時序軟關聯(lián)規(guī)則挖掘[J].計算機工程,2011,37(10):35-37.
[6]譚鋒奇,李洪奇,孟照旭等.數(shù)據(jù)挖掘方法在石油勘探開發(fā)中的應用研究[J].石油地球物理勘探,2010,(1):85-91.
[7]魏德志,洪聯(lián)系,林麗娜等.一種基于HGA和數(shù)據(jù)挖掘的AMG模型[J].計算機工程,2012,38(7):99-101.
[8]張維群.數(shù)據(jù)挖掘研究和應用的現(xiàn)狀與前景[J].統(tǒng)計與信息論壇,2004,(01):95-96.