摘要:對數(shù)據(jù)進行高效的分析挖掘并可視化地展現(xiàn)其背后潛藏的商業(yè)價值在今天顯得尤為重要,擁有豐富的工具包與活躍開源社區(qū)的Python是許多商業(yè)數(shù)據(jù)分析者的首選。文章介紹了利用Python的cufflinks庫來實現(xiàn)動態(tài)可視化繪圖,使得對電商運營的監(jiān)控與決策更為直觀、清晰和及時。
關(guān)鍵詞:商業(yè)智能;數(shù)據(jù)可視化;Python;cufflinks
中圖分類號:TP3-05 文獻標識碼:A 文章編號:1006-8228(2020)08-72-03
0 引言
互聯(lián)網(wǎng)時代電商的崛起,使零售行業(yè)的競爭變得越來越激烈,線上線下結(jié)合已成為企業(yè)運營的方向和潮流。為了洞悉零售與電商的運營,傳統(tǒng)的財務(wù)報表管理已不適應(yīng)潮流,需要更精細直觀的數(shù)據(jù)化管理。經(jīng)濟學(xué)中最經(jīng)典的概念“看不見的手”正在被另外一個更加重要的概念“看得見的數(shù)據(jù)”所替代。合理高效的分析,挖掘與可視化數(shù)據(jù),對企業(yè)掌握市場環(huán)境、營銷流量,運營管理等很有幫助[1],這也將最大程度上實現(xiàn)數(shù)據(jù)與商業(yè)的賦能。隨著近年來商業(yè)智能(Businesslntelligence,以下簡稱BI)的崛起,Python語言在網(wǎng)絡(luò)爬蟲,機器學(xué)習(xí),數(shù)據(jù)可視化等領(lǐng)域的價值日漸增長[2]。
1 Python中的動態(tài)數(shù)據(jù)可視化工具
Python的Matplotlib與Seaborn兩個繪圖庫可繪制精美的靜態(tài)可視化圖片。但對于要求較高的時間序列類型的繪圖,靜態(tài)的數(shù)據(jù)可視化繪圖已無法很好的滿足精細化時段的查看與同步分析。Bokeh,pyecharts與Plotly是實現(xiàn)動態(tài)數(shù)據(jù)可視化的幾大常用Python庫,其中Plotly是一個用于Python的交互式、基于瀏覽器的高級聲明式繪圖庫,它擁有所有Python繪圖庫中最全的API和最強大的交互工具,支持科學(xué)、統(tǒng)計學(xué)、金融、地理、3D等多個領(lǐng)域多種樣式的圖表,被廣泛應(yīng)用于印刷出版物和創(chuàng)建網(wǎng)站。pyecharts則是由百度開源的數(shù)據(jù)可視化Echarts與Python語言結(jié)合而來,亦能很好的實現(xiàn)常見的動態(tài)圖表并將其部署至主流的Web框架中。但美中不足的是,這幾大常用的Python庫都存在可視化代碼冗長和需要比較繁瑣的額外函數(shù)來進行繪圖的缺點。作為Plotly的包裝器,Cufflinks通過將所有的繪圖方法都封裝到類似Pandas繪圖對象的plot0方法iplot0中,很好的解決了這個問題,但它卻常常被人忽略。本文結(jié)合常見的商務(wù)案例,采用Python的Cufflinks實現(xiàn)了僅用一行代碼就能畫出簡潔、美觀、多樣的交互式圖表。
2 利用Python的cufflinks庫進行數(shù)據(jù)可視化
周權(quán)重指數(shù)是以某段銷售周期內(nèi)的歷史日銷售額數(shù)據(jù)為基礎(chǔ),以周為單位,進行權(quán)重分析處理的一種管理工具,它是一個相對概念,每個企業(yè)都不盡相同,一般介于7.0-14.0之間。值越大表示該企業(yè)或者店鋪的日銷售額波動幅度越大。周權(quán)重指數(shù)是零售店鋪用來量化各種銷售狀況、銷售事件的管理工具,非常強大。單位權(quán)重值則是日銷售除以日權(quán)重指數(shù)的結(jié)果,該指標解決了“時間標準”沒有可對比性的原則(如周一與周六的銷售額對比),如果一個零售店鋪的每日銷售額是絕對服從周權(quán)重指數(shù)的規(guī)律,那對應(yīng)的權(quán)重曲線則將是一條絕對的水平直線,但是這種情況根本不可能出現(xiàn),所以正常的權(quán)重值曲線是一條圍繞某個值變化的曲線,正是這種變化給我們提供了去洞悉某些營運現(xiàn)象的可能[1]。
本例的數(shù)據(jù)集為2019年8月廣州某服裝店的銷售數(shù)據(jù),經(jīng)過清洗與處理后再使用Python的cufflinks庫來來進行動態(tài)可視化,可實現(xiàn)及時直觀監(jiān)控異常銷售情況。
2.1 數(shù)據(jù)預(yù)覽
案例數(shù)據(jù)集中的部分數(shù)據(jù)見表1。
2.2 代碼實現(xiàn)與繪圖結(jié)果
兩家店鋪的權(quán)重值曲線的時間序列折線圖的繪制代碼如下,結(jié)果如圖1和圖2所示。
#注釋:繪制折線圖與箱型圖 df.iplot(kind=line,x=[時間】,y=['店鋪1權(quán)重值曲線,
店鋪2日權(quán)重值曲線】,colors=['blue,green'l) df.iplot(kind='box,y=[店鋪1權(quán)重值曲線,店鋪2日權(quán)重值
曲線】,legend=False,title=兩店鋪該月每日權(quán)重值分布)
2.3 代碼分析
Python的Cufflinks代碼簡潔,與Python中的Pandas繪圖非常類似,在iplot0函數(shù)中添加的參數(shù)與pandas中的plot繪圖方式大同小異,但cufflinks的成圖在解決常見的中文橫縱坐標顯示及圖片樣式背景問題的同時還可根據(jù)鼠標的拖動而顯示橫坐標對應(yīng)的動態(tài)數(shù)值,更方便查看指定日期的對應(yīng)數(shù)值,另外,圖示右上角的功能區(qū)還可實現(xiàn)時間段的選擇并縮放(即查看具體的時間段),一鍵下載與橫縱坐標的調(diào)整,功能齊全并兼具了高級美感,圖示右下角的轉(zhuǎn)換功能還可實現(xiàn)一鍵轉(zhuǎn)Plotly繪圖并部署至Web框架中[3]。
2.4 圖片結(jié)果分析
從上面的折線圖可以看出,八月份大部分的時間兩家店鋪的單位權(quán)重曲線都比較平穩(wěn),并未出現(xiàn)頻繁波動。但店鋪1出現(xiàn)了較為明顯的月末踩剎車現(xiàn)象(零售業(yè)專業(yè)術(shù)語),原因可能是:①店鋪已經(jīng)或即將完成了當(dāng)月的目標,員工心態(tài)上出現(xiàn)了松懈;②員工們擔(dān)心本月銷售額完成得過多將導(dǎo)致下月目標被拔高,進而有意識或無意識的放松了心態(tài);③發(fā)現(xiàn)月底目標無法達成于是破罐破摔的踩剎車;④店鋪員工藏匿銷售,本該本月錄入系統(tǒng)的銷售,人為轉(zhuǎn)移到下月初才錄入系統(tǒng)。反觀店鋪2,則出現(xiàn)了明顯的月初放松現(xiàn)象,原因可能為:①上月末拼得太兇,本月初習(xí)慣性地心態(tài)放松幾天;②上月末有虛增銷售額的現(xiàn)象,本月初將虛增部分做退貨處理。總而言之,無論是月初放松還是月末踩剎車,抑或是月中出現(xiàn)上述的兩種現(xiàn)象,都會對銷售的最大化造成傷害。通過直觀清晰的動態(tài)可視化繪圖,相關(guān)管理者可以及時發(fā)現(xiàn)問題,商討解決方案。
3 結(jié)束語
數(shù)據(jù)可視化的本質(zhì)在于將數(shù)據(jù)以圖形化的方式呈現(xiàn),讓觀眾有視覺化思考的能力,放在若干年前,其實就是EXCEL與PPT的結(jié)合。但隨著相關(guān)技術(shù)的成熟和人們對閱讀體驗的需求更新,大量的數(shù)據(jù)可視化工具應(yīng)運而生。數(shù)據(jù)可視化的需求場景中,一種是“看”,即主要作用是展示匯報,是信息的獲取,讓管理者、營運者、業(yè)務(wù)人員更好的獲取相關(guān)信息;另一種是“用”,主要目的在于交互管理,是數(shù)據(jù)的應(yīng)用。越來越多的信息系統(tǒng)中加入了數(shù)據(jù)可視化的內(nèi)容,給應(yīng)用程序帶來了很大的易用性和可理解性。但是對不同領(lǐng)域的數(shù)據(jù)進行可視化展示時,圖表設(shè)計往往與領(lǐng)域數(shù)據(jù)相結(jié)合,無法獨立出來,帶來了大量重復(fù)性工作。在用傳統(tǒng)的可視化開發(fā)工具時,人們需要花費大量精力來編寫程序,影響了系統(tǒng)的開發(fā)效率。針對這一問題,本文提出的Pythoncufflinks庫方法可用十分簡潔且易于理解的語句實現(xiàn)動態(tài)數(shù)據(jù)可視化展示,并將其應(yīng)用到商業(yè)智能領(lǐng)域中數(shù)據(jù)的前端展示。在熟悉常用的圖形與繪圖方式后,還可根據(jù)企業(yè)或個人需求開發(fā)成動態(tài)數(shù)據(jù)可視化模板,并將其單獨封裝在自己定制的Python庫中,只需根據(jù)需求添加或修改部分參數(shù),便可又好又快的實現(xiàn)大量復(fù)雜的繪圖操作。
參考文獻(References):
[1]黃承明.數(shù)據(jù)化管理[M].電子工業(yè)出版社,2014.
[2]王媛媛.B/S模式下數(shù)據(jù)可視化研究及其在商業(yè)智能中的應(yīng)用[D].河北工業(yè)大學(xué),2007.
[3]羅博煒.基于Plrthon的數(shù)據(jù)可視化[J|.信息記錄材料,2019.12:72-74.
★基金項目:本文獲廣東省高校高等教育教學(xué)改革項目“基于雙螺旋結(jié)構(gòu)模型的創(chuàng)新創(chuàng)業(yè)協(xié)同育人機制探索與實踐”( GDJX2017011);五邑大學(xué)2019年度省級大學(xué)生創(chuàng)新訓(xùn)練項目(S201911349055)
作者簡介:羅博煒(1998-),男,江西人,本科,主要研究方向:大數(shù)據(jù)分析。