陳銀鳳
(內(nèi)蒙古財經(jīng)大學(xué) 計算機信息管理學(xué)院,內(nèi)蒙古 呼和浩特 010070)
隨著科學(xué)技術(shù)的迅猛發(fā)展,信息化程度快速增長,信息過量就成為人們不得不面對的問題。如何在海量的信息中及時發(fā)現(xiàn)有用的知識,提高信息利用率,顯然成為人們當(dāng)前亟待解決的問題。數(shù)據(jù)挖掘技術(shù)應(yīng)運而生,并越來越顯現(xiàn)出其強大的生命力。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又潛在有用的信息和知識的過程[1]。即數(shù)據(jù)挖掘產(chǎn)生的前提是需要從多年積累的大量數(shù)據(jù)中找出隱藏在其中的、有用的信息和規(guī)律。某些具有特定應(yīng)用問題和應(yīng)用背景的領(lǐng)域是最能體現(xiàn)數(shù)據(jù)挖掘作用的應(yīng)用領(lǐng)域,例如運輸業(yè)、金融業(yè)、保險業(yè)、零售業(yè)、醫(yī)療、行政司法、工業(yè)部門等社會部門以及科學(xué)和工程研究單位等。
由于數(shù)據(jù)挖掘技術(shù)的不斷成熟,其逐漸開始被物流企業(yè)所重視。目前,很多物流企業(yè)內(nèi)部都實現(xiàn)了信息化,伴隨著物流業(yè)務(wù)的處理過程會產(chǎn)生大量的數(shù)據(jù),數(shù)據(jù)存儲技術(shù)越來越成熟,對物流信息的處理速度也越來越快,還有現(xiàn)階段已產(chǎn)生大量數(shù)據(jù)挖掘算法,如聚類檢測、決策樹方法、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、關(guān)聯(lián)分析方法、基于記憶的推理算法等,這些為數(shù)據(jù)挖掘在物流業(yè)中的應(yīng)用提供了基礎(chǔ)保證。
物流企業(yè)競爭異常激烈,要想在眾多企業(yè)之中脫穎而出,就要實現(xiàn)企業(yè)的信息化建設(shè),并有效利用數(shù)據(jù)挖掘技術(shù),收集大量數(shù)據(jù),幫助企業(yè)實時了解市場的動態(tài),及時針對快速變化的環(huán)境做出響應(yīng),通過分析預(yù)測,抓住各種重要商機。如利用收集的數(shù)據(jù)可以預(yù)測客戶行為,推算當(dāng)前物品種類的流通數(shù)量、客戶與物品間的內(nèi)在關(guān)聯(lián)等,便于物流企業(yè)的管理人員及時制定決策,有利于在對物品的數(shù)量準(zhǔn)備、存儲方式、合理配送等一系列物流過程中有效利用資源,最大限度地提高物流信息管理的工作效率,節(jié)約成本,縮短配送周期,更透徹了解客戶來改善并強化對客戶的服務(wù)。數(shù)據(jù)挖掘技術(shù)還能有效促進物流企業(yè)的業(yè)務(wù)處理過程重組,實現(xiàn)規(guī)模優(yōu)化經(jīng)營。通過合理使用數(shù)據(jù)挖掘技術(shù),企業(yè)可以提高自身的競爭力,促進我國物流行業(yè)向更高水平發(fā)展。
聚類檢測方法是最早的數(shù)據(jù)挖掘技術(shù)之一,也稱為無指導(dǎo)的知識發(fā)現(xiàn)或無監(jiān)督學(xué)習(xí)。聚類生成的組叫簇,簇是數(shù)據(jù)對象的集合。聚類檢測的過程就是使同一個簇內(nèi)的任意兩個對象之間具有較高的相似性,不同的簇的兩個對象之間具有較高的相異性。用于數(shù)據(jù)挖掘的聚類檢測方法有:劃分的方法、層次的方法、基于密度的方法、基于網(wǎng)絡(luò)的方法和基于模型的方法等。
決策樹主要應(yīng)用于分類和預(yù)測,提供了一種展示類似在什么條件下會得到什么值的規(guī)則的方法,一個決策樹表示一系列的問題,每個問題決定了繼續(xù)下去的問題會是什么。決策樹的基本組成包括決策節(jié)點、分支和葉子,頂部的節(jié)點稱為“根”,末梢的節(jié)點稱為“葉子”。數(shù)據(jù)挖掘中決策樹是一種經(jīng)常采用的技術(shù),常用的算法有CHAID、CART、Quest、ID3和C5.0等。決策樹適合于處理非數(shù)值型數(shù)據(jù),但如果生成的決策樹過于龐大,會對結(jié)果的分析帶來困難,因此需要在生成決策樹后再對決策樹進行剪枝處理,最后將決策樹轉(zhuǎn)化為規(guī)則,用于對新事例進行分類。
神經(jīng)網(wǎng)絡(luò)方法越來越受到人們的關(guān)注,主要因為它為解決大復(fù)雜度問題提供了一種相對來說比較有效的簡單方法。人工神經(jīng)網(wǎng)絡(luò)方法主要用于分類、聚類、特征挖掘、預(yù)測等方面。它通過向一個訓(xùn)練數(shù)據(jù)集學(xué)習(xí)和應(yīng)用所學(xué)知識,生成分類和預(yù)測的模式。對于數(shù)據(jù)是不定性的和沒有任何明顯模式的情況,應(yīng)用人工神經(jīng)網(wǎng)絡(luò)算法比較有效。人工神經(jīng)網(wǎng)絡(luò)方法仿真生物神經(jīng)網(wǎng)絡(luò),其基本單元模仿人腦的神經(jīng)元,被稱為節(jié)點;同時利用鏈接連接節(jié)點,類似于人腦中神經(jīng)元之間的連接。人工神經(jīng)網(wǎng)絡(luò)方法主要有:前饋式網(wǎng)絡(luò)、反饋式網(wǎng)絡(luò)和自組織網(wǎng)絡(luò)。
遺傳算法模仿人工選擇培育良種的思路,從一個初始規(guī)則集合開始,迭代地通過交換對象成員(雜交、基因突變)產(chǎn)生群體(繁殖),評估并擇優(yōu)復(fù)制(物競天擇、適者生存),優(yōu)勝劣汰逐代積累計算,最終得到最有價值的知識集。遺傳算法能夠產(chǎn)生一群優(yōu)良后代,這些后代力求滿足適應(yīng)性,經(jīng)過若干代的遺傳,將得到滿足要求的后代,即問題的解。
世界上的許多事物相互間都存在著“關(guān)系”,如四通八達的鐵路、公路將城市連接在一起;處方將醫(yī)生與病人聯(lián)系在一起等。關(guān)聯(lián)分析方法特別適合于從關(guān)系中挖掘知識。關(guān)聯(lián)分析方法包含關(guān)聯(lián)發(fā)現(xiàn)、序列模式發(fā)現(xiàn)和類似的時序發(fā)現(xiàn)等。
基于記憶的推理算法使用一個模型的已知實例來預(yù)測未知的實例,使用基于記憶的推理算法時,要求預(yù)先已有一個已知的數(shù)據(jù)集(稱作基本數(shù)據(jù)集或訓(xùn)練數(shù)據(jù)集),并且已知這個數(shù)據(jù)集中記錄的特征。當(dāng)需要評估一條新記錄時,該算法在已知數(shù)據(jù)集中找到和新記錄類似的記錄(稱為“鄰居”),然后使用鄰居的特征對新記錄預(yù)測和分類[1]。
隨著市場競爭的加劇、企業(yè)精細化管理愿望的增強,以及先進技術(shù)方法的開發(fā)應(yīng)用,對數(shù)據(jù)進行挖掘利用已成為物流企業(yè)推出商品、爭取客戶、增加利潤、提升自我競爭力的突破口。物流企業(yè)產(chǎn)生的數(shù)據(jù)量龐大、更新快,并且來源多樣化,通過對這些數(shù)據(jù)進行有效挖掘,可以確定客戶群,并推出有競爭力的商品。商品具有一定的生命周期,一旦該商品進入市場,其銷售量和利潤都會隨時間的推移而發(fā)生變化。不同階段,商品的生產(chǎn)、配送、銷售策略各不相同,這需要提前進行生產(chǎn)計劃、生產(chǎn)作業(yè)安排及提前配置庫存和提前制定運輸策略,即物流企業(yè)要注重商品的生命周期,合理地控制庫存和安排運輸,對不同的商品對象建立相應(yīng)的預(yù)測模型。物流企業(yè)可以通過聚類分析作為市場預(yù)測的手段,為決策提供依據(jù)[2]。
物流中心選址是構(gòu)建物流體系過程中極為重要的部分,其主要是求解運輸成本、變動處理成本和固定成本等之和的最小化問題。選址需要考慮中心點如何分布和中心點數(shù)量等,尤其是多中心選址的問題。多中心選址是指在一些已知的備選地點中選出一定數(shù)目的地點來設(shè)置物流中心,使形成的物流網(wǎng)絡(luò)的總代價(主要指費用)最低。在實際操作中,當(dāng)問題規(guī)模變得很大或者要考慮一些市場因素(如顧客需求量)時,數(shù)學(xué)規(guī)劃就存在一些困難。針對這一問題,可以用數(shù)據(jù)挖掘中分類樹的方法來解決。
電子商務(wù)的快速發(fā)展,使得現(xiàn)代物流管理對倉儲的要求越來越高。合理安排商品的存儲、擺放商品,提高揀貨效率、壓縮商品的存儲成本、提供更多客戶自定義產(chǎn)品和服務(wù)、提供更多的增值服務(wù)等是當(dāng)前物流管理者必須思考的問題。利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析方法可以幫助優(yōu)化倉庫的存儲。關(guān)聯(lián)分析方法的主要目的就是挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。
配送路徑的選取直接影響著物流企業(yè)的配送效率。物流配送體系中,管理人員需要采取有效的配送策略以提高服務(wù)水平、降低整體運輸成本。首先,要解決配送路徑問題。配送路徑是車輛確定到達客戶的路徑,每一客戶只能被訪問一次且每條路徑上的客戶需求量之和不能超過車輛的承載能力。其次,提高配送車輛的有效利用率。如果在運輸過程中車輛空載或不能充分利用車輛的運送能力,就會增加物流企業(yè)的運輸費用。最后還要考慮商品的規(guī)格大小和利潤價值的高低。遺傳算法可以對物流的配送路徑進行優(yōu)化,它可以把在局部優(yōu)化時的最優(yōu)路線繼承下來,應(yīng)用于整體,而其他剩余的部分則結(jié)合區(qū)域周圍的剩余部分(即非遺傳的部分)進行優(yōu)化,輸出送貨線路車輛調(diào)度的動態(tài)優(yōu)化方案。
物流管理也是實現(xiàn)對客戶服務(wù)的一種管理活動,所以有必要對客戶進行分析,使企業(yè)能對目標(biāo)客戶群采取有針對性的且高效的促銷措施,以更快的速度更高的準(zhǔn)確度和更出色的客戶服務(wù),滿足客戶個性化的需求,建立并保持客戶忠誠度,增加企業(yè)的銷售額,降低企業(yè)的營銷成本??蛻舴治鍪且罁?jù)收集到的關(guān)于客戶的數(shù)據(jù)來了解客戶的需求,分析客戶特征,評估客戶價值,從而為客戶制定相應(yīng)的營銷策略與資源配置計劃。通過定性與對比的應(yīng)用,對客戶特征進行準(zhǔn)確的概念描述,物流企業(yè)能夠充分挖掘出客戶價值。通過數(shù)據(jù)挖掘還可以找到流失客戶的共同特征,可以在那些具有相似特征的客戶未流失之前進行針對性的彌補。
在物流業(yè)中,可以有效利用數(shù)據(jù)挖掘技術(shù)解決很多問題,但其不能解決物流決策中出現(xiàn)的所有問題。如果不能將特殊領(lǐng)域的物流業(yè)務(wù)邏輯與數(shù)據(jù)挖掘技術(shù)結(jié)合起來,數(shù)據(jù)挖掘的分析效果和效益就不可能達到最佳值。數(shù)據(jù)挖掘技術(shù)在物流業(yè)中的應(yīng)用,一般需要考慮以下三個因素:熟練掌握數(shù)據(jù)挖掘技術(shù)的專業(yè)人才;選擇適合的數(shù)據(jù)挖掘工具和方法,建立適合企業(yè)的數(shù)據(jù)挖掘系統(tǒng);保證數(shù)據(jù)挖掘中數(shù)據(jù)源具有準(zhǔn)確性及代表性。具體運用數(shù)據(jù)挖掘技術(shù)時還應(yīng)該注意以下問題:
當(dāng)前流行的數(shù)據(jù)挖掘工具,很多是由國外公司研發(fā),如IBM開發(fā)的QUEST系統(tǒng)、SGI開發(fā)的Mineset系統(tǒng)等。由于國內(nèi)外物流環(huán)境存在差異,直接引進這些挖掘工具,可能會與我國的市場和企業(yè)不太適應(yīng),所以物流企業(yè)的管理人員要從保證這些工具可以準(zhǔn)確反應(yīng)本企業(yè)的經(jīng)營狀況角度出發(fā),在引進國外的相關(guān)系統(tǒng)時著重考慮定制問題,只有這樣才能充分發(fā)揮數(shù)據(jù)挖掘技術(shù)的潛能。
數(shù)據(jù)挖掘的本質(zhì)是從大量已有的數(shù)據(jù)中找出有價值的信息,這些數(shù)據(jù)存儲在數(shù)據(jù)庫中。物流企業(yè)一般在建立管理信息系統(tǒng)時就已經(jīng)選擇了某一數(shù)據(jù)庫產(chǎn)品。因此,應(yīng)用數(shù)據(jù)挖掘技術(shù)首先要考慮數(shù)據(jù)挖掘系統(tǒng)與已有數(shù)據(jù)庫系統(tǒng)是否集成,這樣便于利用該企業(yè)已有的數(shù)據(jù)庫中的數(shù)據(jù)。也只有這樣才能充分利用已有數(shù)據(jù),降低企業(yè)成本,更好地服務(wù)于物流企業(yè)的經(jīng)營活動。
數(shù)據(jù)挖掘技術(shù)人員在工作中所選用的技術(shù)和方法會直接影響到數(shù)據(jù)模型的準(zhǔn)確度,其專業(yè)素養(yǎng)和能力對于數(shù)據(jù)挖掘的實施起到至關(guān)重要的作用。所以相關(guān)技術(shù)人員的綜合素質(zhì)能力決定了數(shù)據(jù)挖掘工作能否順利開展。因此,要求這類技術(shù)人員一般具備很高的綜合素質(zhì),首先要有良好的計算機、統(tǒng)計等知識的功底;其次要熟悉掌握一定的物流知識,懂得物流行業(yè)的基本流程和運作理念。但目前很多物流企業(yè)對這樣的技術(shù)人員沒有足夠的重視,所以作為物流企業(yè)的決策者要注重高素質(zhì)人才的引進,加強技術(shù)人員的培訓(xùn)教育。
目前,很多物流企業(yè)業(yè)務(wù)種類繁多,旗下都包含多個不同的業(yè)務(wù)子系統(tǒng),這些業(yè)務(wù)子系統(tǒng)會產(chǎn)生大量數(shù)據(jù),致使物流企業(yè)必須建立龐大的數(shù)據(jù)庫,這雖然會給日后的數(shù)據(jù)挖掘提供很好的數(shù)據(jù)源,但隨之也出現(xiàn)了一些問題,如數(shù)據(jù)的質(zhì)量、數(shù)據(jù)完整性和數(shù)據(jù)一致性問題等,會導(dǎo)致數(shù)據(jù)挖掘技術(shù)人員不得不投入大量的時間和精力去凈化和處理所提取的數(shù)據(jù),很難集中精神去構(gòu)建模型。如何保證數(shù)據(jù)質(zhì)量,是企業(yè)成功實施數(shù)據(jù)挖掘的一個技術(shù)關(guān)鍵點。
數(shù)據(jù)挖掘技術(shù)在物流業(yè)中應(yīng)用不斷普及,更多的物流企業(yè)意識到數(shù)據(jù)挖掘?qū)τ跊Q策支持的重要性,尤其在對市場預(yù)測、解決選址、倉儲、配送和客戶分析等問題方面發(fā)揮出很大的作用。我國物流企業(yè)在數(shù)據(jù)挖掘應(yīng)用方面還處于起步階段,但這些企業(yè)可以結(jié)合自身的實際情況,從最基本的數(shù)據(jù)挖掘技術(shù)應(yīng)用做起,隨著物流行業(yè)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)將會為管理決策提供更加強大的支持功能,為物流企業(yè)的發(fā)展保駕護航。
[1] 安淑芝.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社,2005.
[2] 梅鋼.數(shù)據(jù)挖掘技術(shù)在物流管理中的應(yīng)用[J].湖北第二師范學(xué)院學(xué)報,2012,29(2):64-67.
[3] 孫俊玲.淺析數(shù)據(jù)挖掘技術(shù)在現(xiàn)代物流管理中的應(yīng)用[J].河南財政稅務(wù)高等專科學(xué)校學(xué)報,2009(3):45-47.