江蘇經(jīng)貿(mào)職業(yè)技術(shù)學院 阮衛(wèi)華
近幾年,物聯(lián)網(wǎng)的概念已經(jīng)深入到人們生活的很多方面,世界上很多國家已經(jīng)將物聯(lián)網(wǎng)作為各國戰(zhàn)略性產(chǎn)業(yè)振興的一部分。物聯(lián)網(wǎng)(The Internet of Things,IOT)概念最早出現(xiàn)于20世紀90年代末的麻省理工學院,其定義是把所有物品通過射頻識別、紅外感應(yīng)器、全球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備與互聯(lián)網(wǎng)連接起來,進行信息交換和通訊,實現(xiàn)智能化識別、定位、跟蹤、監(jiān)控和管理。物聯(lián)網(wǎng)最為核心的技術(shù)是無線身份識別(RFID)技術(shù),通俗地講,也可以簡單地把物聯(lián)網(wǎng)認為就是物物相連的互聯(lián)網(wǎng)。
工業(yè)和信息化部于2012年2月14日發(fā)布的《“十二五”物聯(lián)網(wǎng)發(fā)展規(guī)劃》中提出,2015年我國要在物聯(lián)網(wǎng)核心技術(shù)研發(fā)與產(chǎn)業(yè)化、關(guān)鍵標準研究與制定、產(chǎn)業(yè)鏈條建立與完善、重大應(yīng)用示范與推廣等方面取得顯著成效,初步形成創(chuàng)新驅(qū)動、應(yīng)用牽引、協(xié)同發(fā)展、安全可控的物聯(lián)網(wǎng)發(fā)展格局。毫無疑問,如果“物聯(lián)網(wǎng)”時代來臨,人們的日常生活將發(fā)生翻天覆地的變化。
數(shù)據(jù)挖掘技術(shù)(Data Mining)也叫做知識發(fā)現(xiàn),所謂數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中發(fā)現(xiàn)對人們有價值的概念、模式和規(guī)律等,它是一個揭示出隱含的、先前未知的并有潛在價值的信息的過程。它是一門交叉科學,主要涉及數(shù)據(jù)庫技術(shù)、人工智能、機器學習、統(tǒng)計學、信息檢索和模式識別等領(lǐng)域,有十分廣闊的應(yīng)用前景。隨著物聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)挖掘技術(shù)也必然會在物聯(lián)網(wǎng)得到廣泛運用。
作為一個完整的數(shù)據(jù)挖掘過程,其是個很龐大的系統(tǒng),主要結(jié)構(gòu)如圖1所示,主要分為以下幾個部分:
(1)確定業(yè)務(wù)對象。在進行數(shù)據(jù)挖掘之前,最重要的一步就是要明確業(yè)務(wù)問題并且弄清數(shù)據(jù)挖掘的目的,然后再找數(shù)據(jù)的來源。數(shù)據(jù)挖掘的來源很多,只要具備大量數(shù)據(jù)的來源都可以進行挖掘,雖然最后的結(jié)構(gòu)是不可預(yù)測的,但要探索的問題必須是可以預(yù)見的,否則進行數(shù)據(jù)挖掘時是不會成功的。
(2)數(shù)據(jù)預(yù)處理。由于數(shù)據(jù)的來源很多,其中包含很多的數(shù)據(jù)信息,在確定了數(shù)據(jù)來源后,必須首先對數(shù)據(jù)信息進行數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理一般包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約四個處理過程。
(3)數(shù)據(jù)的轉(zhuǎn)換。將數(shù)據(jù)轉(zhuǎn)換成一個分析模型,這個分析模型是針對挖掘算法建立的,建立一個真正適合挖掘算法的分析模型是數(shù)據(jù)挖掘成功的關(guān)鍵。
(4)數(shù)據(jù)挖掘過程。對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進行挖掘,除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。
(5)模式評估。解釋并評估結(jié)果,其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會用到可視化技術(shù)。根據(jù)某種興趣度量,識別表示知識的真正有趣的模式。
(6)知識的同化。使用可視化和知識表示技術(shù),向用戶提供挖掘的知識。
(7)用戶界面。最后需要將數(shù)據(jù)挖掘的結(jié)果展示給用戶,提供給用戶適當?shù)牟僮鹘缑孢M行操作,以得到相關(guān)的結(jié)果。
物聯(lián)網(wǎng)作為一門新興技術(shù),發(fā)展還處于初級階段,在技術(shù)、市場、客戶等多個方面還面臨著諸多問題。在我國宏觀經(jīng)濟調(diào)控政策的指導(dǎo)下,經(jīng)濟快速增長的推動下,一旦物聯(lián)網(wǎng)大規(guī)模普及,小巧而又智能的傳感器加裝到無數(shù)的物品上,用于動物、植物、機器等物品的傳感器與電子標簽及配套接口裝置數(shù)量將大大超乎于尋常想象。因此,隨著物聯(lián)網(wǎng)在人們生活中各個方面的廣泛應(yīng)用,已經(jīng)為數(shù)據(jù)挖掘技術(shù)的運用奠定了基礎(chǔ),主要有以下幾個方面。
對于是否是現(xiàn)代物流企業(yè),最重要的衡量標準之一就是企業(yè)信息化程度的高低,因此對于現(xiàn)代物流企業(yè)來說,大力發(fā)展物流信息化,是現(xiàn)代物流企業(yè)的主要發(fā)展趨勢。以物聯(lián)網(wǎng)技術(shù)為依托,以企業(yè)的供應(yīng)鏈作為基礎(chǔ),構(gòu)建企業(yè)的信息服務(wù)平臺,這將是第三方物流企業(yè)信息化的一個發(fā)展方向。在信息平臺建設(shè)中引入物聯(lián)網(wǎng)技術(shù),借助物聯(lián)網(wǎng)技術(shù)的優(yōu)勢,可以有效改善企業(yè)物流作業(yè)的配送業(yè)務(wù)和車輛運輸?shù)认到y(tǒng)的效率和準確性。
隨著近幾年企業(yè)對物流信息化的重視,投入了一定的資金進行物流基礎(chǔ)設(shè)施的購買和更新,為物聯(lián)網(wǎng)的應(yīng)用提供了硬件方面的支持,同時,企業(yè)根據(jù)其自身的特點選擇相應(yīng)的物流技術(shù)構(gòu)建了企業(yè)的信息服務(wù)平臺。但在市場競爭中,物流企業(yè)必然會和不同的行業(yè)打交道,比如海關(guān)等,而不是一個單獨的個體,因此,建立一個物流公共信息平臺是必然的趨勢。同時,公共信息平臺的構(gòu)建也為企業(yè)使用物聯(lián)網(wǎng)奠定了一定的基礎(chǔ)。
海量的數(shù)據(jù)積累是數(shù)據(jù)挖掘技術(shù)實施的一個重要的前提條件。不容置疑,物聯(lián)網(wǎng)已經(jīng)處于數(shù)據(jù)爆炸階段,數(shù)據(jù)量已開始呈幾何級數(shù)增長,每天都會產(chǎn)生大量的數(shù)據(jù)。特別是超大規(guī)模數(shù)據(jù)庫在物聯(lián)網(wǎng)的使用,使數(shù)據(jù)被自動加速積累。對于如此巨大的數(shù)據(jù),由于人們的能力有限,無法分析處理所有的數(shù)據(jù),因此陷入了數(shù)據(jù)豐富、信息貧乏的局面。為了不讓數(shù)據(jù)被浪費,要從海量數(shù)據(jù)中找出對人們有價值的信息知識,只能依靠數(shù)據(jù)挖掘技術(shù),通過專業(yè)機構(gòu)的數(shù)據(jù)質(zhì)量評價體系來實現(xiàn)。
由于物聯(lián)網(wǎng)的運用十分廣泛,不僅僅運用在物流管理方面,也被廣泛運用到了政府工作、智能交通、環(huán)境保護、公共安全、消防、工業(yè)測試、老人護理、個人以及個人健康等多個領(lǐng)域。國際電信聯(lián)盟于2005年的一份報告曾這樣描述“物聯(lián)網(wǎng)”時代的圖景:當司機出現(xiàn)操作失誤時汽車會自動語音報警;當主人出門時公文包會提醒主人需帶哪些物品;衣服會“告訴”洗衣機因衣服材質(zhì)和顏色不同選擇什么樣的水溫和清洗方式等等。物聯(lián)網(wǎng)把新一代IT技術(shù)運用到各行各業(yè)中,使得各行各業(yè)操作更智能化與人性化。
不管是物聯(lián)網(wǎng)的運用,還是數(shù)據(jù)挖掘技術(shù)的運用,都離不開計算機技術(shù)的發(fā)展。日新月異的計算機硬件發(fā)展可以說始終是超越人類的應(yīng)用需求,超越人類的需求欲望。在硬件方面已經(jīng)生產(chǎn)出來強大的多處理器計算機,具有更快和更大的計算能力和并行體系結(jié)構(gòu),在軟件方面已經(jīng)出現(xiàn)了超大規(guī)模數(shù)據(jù)庫,例如商業(yè)數(shù)據(jù)倉庫和計算機自動收集的數(shù)據(jù)記錄,為物聯(lián)網(wǎng)的運用以及數(shù)據(jù)挖掘技術(shù)的運用奠定了基礎(chǔ)。
目前,物流人才的缺少嚴重地限制了物流在我國的發(fā)展。我國現(xiàn)有的物流人才已經(jīng)遠遠滿足不了未來物流業(yè)發(fā)展的需求。對此,國內(nèi)物流企業(yè)要以自身為基礎(chǔ),按現(xiàn)代物流的內(nèi)在要求來加強企業(yè)員工的素質(zhì)并強化其的服務(wù)能力,同時重視人才的引進,大力培養(yǎng)符合企業(yè)的高素質(zhì)人才。
近幾年,我國一些高校也注意到這些問題,已經(jīng)開始陸續(xù)設(shè)立物流專業(yè),可是這樣的高校還十分少,但隨著物聯(lián)網(wǎng)的發(fā)展,相關(guān)的人才也比以前有了大量的增加,必將推動物流產(chǎn)業(yè)和物聯(lián)網(wǎng)的發(fā)展。
數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。從物聯(lián)網(wǎng)在企業(yè)中的廣泛運用可以看出,數(shù)據(jù)挖掘技術(shù)用于物聯(lián)網(wǎng)的條件已經(jīng)基本具備,可以在以下幾個方面運用數(shù)據(jù)挖掘技術(shù)。
物聯(lián)網(wǎng)作為新興技術(shù),其應(yīng)用正在極大地改變著人們的生活,其在產(chǎn)品質(zhì)量監(jiān)督和管理方面的運用正日益受到人們的關(guān)注。目前我國的質(zhì)量監(jiān)管系統(tǒng)還不完善,層出不窮的奶粉作假、食品添加劑事件、工程不達標和藥品不合格,若由政府質(zhì)檢部門直接干預(yù),在物聯(lián)網(wǎng)技術(shù)的基礎(chǔ)上建立了追溯系統(tǒng)。隨著質(zhì)量監(jiān)管系統(tǒng)的使用,會產(chǎn)生大量的相關(guān)數(shù)據(jù),通過數(shù)據(jù)挖掘技術(shù)可以從中找到影響質(zhì)量的環(huán)節(jié),幫助政府質(zhì)檢部門改進內(nèi)部質(zhì)量管理。
對于物流企業(yè)來說,物聯(lián)網(wǎng)的普及及運用,為企業(yè)進一步降低成本帶來了新的機遇。物聯(lián)網(wǎng)的使用,使物流企業(yè)借助RFID和互聯(lián)網(wǎng)等無線數(shù)據(jù)通信技術(shù),實現(xiàn)了每個商品的識別和跟蹤。所有的數(shù)據(jù)存放到數(shù)據(jù)庫中,可以通過數(shù)據(jù)挖掘技術(shù)發(fā)掘物流各個環(huán)節(jié)的潛在信息,比如運輸、倉儲和管理等環(huán)節(jié),為企業(yè)管理者的管理提供必要的參考信息,能夠大大減少企業(yè)的物流成本,提高服務(wù)效率。同時,幫助企業(yè)發(fā)現(xiàn)每個部門的人員配置是否合理,以及車輛安排是否合理等問題,從而幫助企業(yè)管理者做出人員變動和車輛安排等一系列原本繁瑣冗余的決定。
成本的消耗是企業(yè)十分關(guān)注的一個問題,所謂成本是指產(chǎn)品的空間移動或時間占有中所耗費的各種人力勞動和物化勞動的貨幣表現(xiàn),它的產(chǎn)生十分復(fù)雜,涉及企業(yè)運作的各個環(huán)節(jié),因此,企業(yè)想要減少成本的支出是個十分復(fù)雜的過程。通過數(shù)據(jù)挖掘技術(shù)可以為企業(yè)合理分配資源提供信息,從而幫助企業(yè)減少成本的支出,降低總成本,為企業(yè)帶來更大收益。通過數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)挖掘可以發(fā)現(xiàn)客戶和企業(yè)之間一些內(nèi)在關(guān)聯(lián),從而改進企業(yè)的一些環(huán)節(jié),更主動、更好地為客戶提供相關(guān)服務(wù)。
對于企業(yè)來說,客戶對企業(yè)服務(wù)的滿意度十分重要,它可以從兩個方面來改善:主動服務(wù)和被動服務(wù)。主動服務(wù)主要是指信息服務(wù)的智能化,主動提供客戶需要的一些信息服務(wù)。被動服務(wù)主要是是指通過分析客戶需求信息,使用數(shù)據(jù)挖掘技術(shù)發(fā)掘客戶潛在需要的信息服務(wù)。兩者是相輔相成、相互依賴的關(guān)系。主動服務(wù)能夠為被動服務(wù)提供相關(guān)的數(shù)據(jù),以便進行進一步的數(shù)據(jù)挖掘使用,而被動服務(wù)能夠為主動服務(wù)提供信息參考,以便企業(yè)增加新的服務(wù)項目。
隨著物聯(lián)網(wǎng)的廣泛應(yīng)用,必然帶來海量的數(shù)據(jù)信息,如何查找出有用的信息是一個亟待解決的問題,而數(shù)據(jù)挖掘技術(shù)就是從海量數(shù)據(jù)中發(fā)現(xiàn)具備一定規(guī)律性并又難為人們通過簡單判斷而得到的知識。因此,如何更好地利用這些海量的數(shù)據(jù)信息,將是物聯(lián)網(wǎng)應(yīng)用后的一個重要問題,而數(shù)據(jù)挖掘技術(shù)正是解決這個問題的一個很好的方法,將來一定會被廣泛運用到物聯(lián)網(wǎng)中。
[1] 魏光興,盧曉霞.基于物聯(lián)網(wǎng)的物流業(yè)發(fā)展對策研究[J].江蘇商論,2011(04).
[2] 董云鵬.數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用[J].現(xiàn)代情報,2006(11).