摘 要:目前,大數(shù)據成為政府、企業(yè)等組織機構最重要的資產之一。通過SaaS服務、云技術,依托BDP商業(yè)數(shù)據平臺,研究商業(yè)數(shù)據分析及挖掘模型,并在企業(yè)中進行推廣與應用,幫助企業(yè)利用數(shù)據驅動管理,提升經營績效。
關鍵詞:SaaS;云技術;商業(yè)數(shù)據;數(shù)據分析及挖掘
一、引言
麥肯錫研究報告《大數(shù)據:下一個創(chuàng)新、競爭和生產率的前沿》(2011)中指出數(shù)據已經逐漸成為每個行業(yè)的基礎性資源,對于海量數(shù)據的挖掘、分析,預示著新的生產率增長浪潮的到來。2012年美國公布了“大數(shù)據研發(fā)計劃”。歐盟對科學數(shù)據基礎設施建設投資1億多歐元,并將數(shù)據信息化基礎設施建設作為Horizon 2020計劃的優(yōu)先項目之一。
2015年9月,國務院印發(fā)《促進大數(shù)據發(fā)展行動綱要》,截止2017年1月底,我國有37個省市專門出臺大數(shù)據發(fā)展規(guī)劃及行動計劃。但國內企業(yè),真正以數(shù)據分析為決策依據的,主要集中在銀行、保險、電信和電商行業(yè),尚未擴充到運營管理的所有領域。商業(yè)企業(yè)為了在激烈的市場競爭中取得優(yōu)勢,利用數(shù)據分析及挖掘技術,為一系列決策提供科學可靠的依據將勢在必行。
二、應用價值與優(yōu)勢
1.數(shù)據分析及挖掘模型應用價值
全球數(shù)據供應量在2012年已達2800萬億GB,但上述數(shù)據中僅有0.5%被用于分析。預計到2020年,人均數(shù)據量將達5,247GB。目前,部分大型企業(yè)投入幾千萬甚至上億的成本進行信息化建設,如利用SAP、ERP、CRM進行數(shù)據分析,但部門之間數(shù)據沒有打通,平臺數(shù)據不能共享,不能及時支撐業(yè)務需求。隨著市場競爭的加劇,消費者需求越來越高,對企業(yè)經營管理者提出更高的要求,需要將分散的數(shù)據聚合在一起,并對這些數(shù)據進行高效分析及挖掘。數(shù)據分析及挖掘模型的應用能夠幫助企業(yè)解決上述問題,實現(xiàn)多維度數(shù)據的系統(tǒng)分析,及時發(fā)現(xiàn)異常并提出改善方案,幫助企業(yè)實現(xiàn)智能化的決策支持。
2.商業(yè)數(shù)據平臺優(yōu)勢
(1)一站式數(shù)據管理與分析
從各種內部數(shù)據,到各種SaaS應用、互聯(lián)網平臺、再到需要監(jiān)控的各類外部數(shù)據,幾百種的數(shù)據源,一鍵式進行接入,進行數(shù)據處理、分析、挖掘,并多終端可視化呈現(xiàn),能夠對數(shù)據進行全價值鏈的管理。
(2)靈活易用的可視化分析
只需要接入數(shù)據源的源數(shù)據,不需要任何的預處理就可以對數(shù)據做任意維度的多維分析,簡單拖拽就可以通過數(shù)據獲得業(yè)務洞察,沒有任何技術基礎的人都可以自助進行數(shù)據分析。
(3)億行數(shù)據、秒級響應
構建完備的數(shù)據服務器集群,提供強大穩(wěn)定的數(shù)據計算能力,上億行的數(shù)據,1秒鐘可以響應。
三、關鍵技術與主要應用
1.關鍵技術
采用業(yè)界最新的分布式架構,云計算輕松處理海量數(shù)據。數(shù)據庫兼容+自采集,實現(xiàn)全數(shù)據整合。數(shù)據對接--數(shù)據集中化管理,賬號直連--支持SQL Server, Oracle, MySQL; API對接--通過API進行數(shù)據寫入;零散數(shù)據存在EXCEL表格中的,可以直接導入BDP中使用。細顆粒鉆取,多維度關聯(lián)交互。
快速拖拽靈活分析建模,點選配置實現(xiàn)數(shù)據統(tǒng)計分析。手機、PC同步,數(shù)據排名、預警推送,驅動業(yè)務流。采用業(yè)界最新技術,性能不斷優(yōu)化升級,物理安全(超五星級的數(shù)字北京機房)、組織安全(賬戶系統(tǒng)和數(shù)據系統(tǒng)相互隔離)、加密安全技術(等同于銀行加密技術等級)、認證安全(烏云24小時安全監(jiān)測)。
2.主要應用
打通企業(yè)常用的數(shù)據庫,包括MySQL、SQLServer、Oracle等主流數(shù)據庫;連通上百度、新浪、微信等百家主流的網絡營銷推廣平臺;對接在線客服平臺;連接百度統(tǒng)計、CNZZ等應用統(tǒng)計數(shù)據;導入EXCEL、CRM、ERP等企業(yè)日常經營管理數(shù)據;匯總移動應用排名數(shù)據、本地生活指數(shù)等公共數(shù)據。通過數(shù)據源進行數(shù)據接入后,對進入的數(shù)據進行多表關聯(lián)、數(shù)據聚合、追加合并、SQL創(chuàng)建、二維轉一維、提取數(shù)據等數(shù)據處理技術,對分散數(shù)據源的數(shù)據進行建模。并進行可視化的結果分析和呈現(xiàn),以及對結果的向下鉆取進行原因追溯。
對于企業(yè)經營管理的關鍵指標進行預警設置??梢栽陬A警條件被觸發(fā)的第一時間通過電腦或者手機接收到信息,方便企業(yè)管理層與決策層進行實時決策。對數(shù)據做任意多維分析,根據企業(yè)沉淀的數(shù)據資源進行未來一段時期的預測。構建完備的數(shù)據服務器集群,提供強大穩(wěn)定的數(shù)據計算能力,提高響應速度。
四、模型構建與應用
1.商業(yè)數(shù)據分析及挖掘模型構建
通過將企業(yè)生產數(shù)據、銷售數(shù)據、客戶數(shù)據、財務數(shù)據等商業(yè)數(shù)據導入到BDP商業(yè)數(shù)據平臺,對各種數(shù)據進行存儲及管理、建模并計算分析,然后以可視化圖表方式呈現(xiàn)給需要數(shù)據的企業(yè)進行分析管理決策。如圖1所示:
2.商業(yè)數(shù)據分析及挖掘模型應用
首先收集客戶需求,然后提取客戶數(shù)據源、導入商業(yè)數(shù)據平臺,接著在商業(yè)數(shù)據平臺建立數(shù)據分析與挖掘模型并設計計算邏輯、平臺自動運轉計算,最后平臺輸出可視化圖表及分析結果,指導商業(yè)企業(yè)制定戰(zhàn)略規(guī)劃,并進行相應的管理決策。
例如:某食品企業(yè)需要利用BDP商業(yè)數(shù)據平臺對現(xiàn)有的經營狀況進行改進,需完成幾個步驟:
步驟一,提出企業(yè)初始需求,如:對于現(xiàn)有sku的保質期內的進銷存分析精度不夠,分析周期過長,分析成果無法指導經營;對于門店拓展缺少數(shù)據作為指導;技術團隊人員緊缺,需要改進現(xiàn)有的經營狀況;
步驟二,業(yè)務洞察:分析數(shù)據收集不夠全面,缺少間接數(shù)據;對于現(xiàn)狀問題要及時發(fā)現(xiàn)、鎖定、調整;對于商品庫存結構分析 需要進行全面的即時性分析,便于指導送配貨;使用BDP機器學習算法分析商品連帶率、成交率、客單價等;
步驟三,搭建數(shù)據平臺架構:將EXCEL數(shù)據、公開數(shù)據、第三方平臺數(shù)據,及會員管理系統(tǒng)、ERP系統(tǒng)中的數(shù)據進行整合,搭建大數(shù)據平臺,進行商品分析、業(yè)務監(jiān)控與分析、會員數(shù)據分析、各部門KPI考核、成本控制、銷售預測;
步驟四,解決方案核心分析場景:銷售分析,數(shù)據實時更新,店長實時查看各門店銷售排名;多維度分析:客單量、同比、環(huán) 比、新老門店對比等;促銷情況分析;商品分析:商品分類分析,各類商品利潤貢獻,商品與會員的交叉分析;會員分析:會員系統(tǒng)RFM數(shù)據分析模型,會員新增情況、會員分布情況分析,會員消費習慣分析;
步驟五,解決方案數(shù)據分析指標體系分解,如圖2所示:
步驟六,平臺成果展示,如圖3所示:
步驟七,移動端隨時獲取最新數(shù)據,如圖4所示:
五、結語
常規(guī)的數(shù)據分析系統(tǒng)對數(shù)據源進行抽取、轉換需要耗費大量時間。隨著數(shù)據量迅速增長,大部分企業(yè)面臨用戶量、并發(fā)量大,業(yè)務需求變化快,響應速度差,數(shù)據技術人員短缺,各部門信息不透明等挑戰(zhàn)。數(shù)據系統(tǒng)癱瘓、數(shù)據口徑不一等問題層出不窮。數(shù)據分析及挖掘模型的應用能夠幫助企業(yè)解決上述問題,實現(xiàn)多維度數(shù)據的系統(tǒng)分析,及時發(fā)現(xiàn)異常并提出改善方案,幫助企業(yè)實現(xiàn)智能化的決策支持。
隨著互聯(lián)網不斷發(fā)展,基于SaaS和云技術的數(shù)據分析及挖掘服務將逐漸演變?yōu)閿?shù)據分析的新熱點。基于這兩種技術而研發(fā)的商業(yè)數(shù)據分析及挖掘模型必將廣泛應用于各行各業(yè),如交通、醫(yī)療、統(tǒng)計領域。其在商業(yè)企業(yè)的應用也將更加成熟。
參考文獻:
[1]任惠琳.商業(yè)企業(yè)營銷數(shù)據挖掘及營銷數(shù)據統(tǒng)計分析系統(tǒng)的有效構建[J].現(xiàn)代商業(yè),2013,(31).
[2]王益萍,琚春華.基于分布式數(shù)據挖掘的連鎖商業(yè)企業(yè)經營決策分析[J].商業(yè)研究,2006,(20).
[3]楊京,王效岳,白如江,祝娜.大數(shù)據背景下數(shù)據科學分析工具現(xiàn)狀及發(fā)展趨勢[J].情報理論與實踐,2015,(3).
[4]任新社,陳靜遠.關于數(shù)據挖掘研究現(xiàn)狀及發(fā)展趨勢的探究[J].信息通信,2016,(2).
[5]劉紹清,黃章樹.數(shù)據挖掘商業(yè)應用平臺的需求分析[J].計算機系統(tǒng)應用,2007,(6).
作者簡介:彭楚鈞,女,湖南網絡工程職業(yè)學院講師,碩士,研究方向:電子商務、網絡營銷;楊麗光,女,湖南領度信息技術有限公司,營銷總監(jiān),研究方向:大數(shù)據營銷、電子商務;通信作者:胡欣怡,女,湖南網絡工程職業(yè)學院,工程師,碩士,研究方向:網絡營銷;聶磊,男,湖南領度信息技術有限公司,總經理,研究方向:大數(shù)據營銷、電子商務