国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Tableau的商業(yè)數(shù)據(jù)可視化分析

2018-01-04 12:02黃亮戴小鵬王奕
電腦知識(shí)與技術(shù) 2018年29期
關(guān)鍵詞:數(shù)據(jù)可視化

黃亮 戴小鵬 王奕

摘要:人類利用形象思維獲取視覺(jué)符號(hào)中所蘊(yùn)含的信息并發(fā)現(xiàn)規(guī)律,進(jìn)而獲得科學(xué)發(fā)現(xiàn)。本文在Tableau軟件作為可視化平臺(tái)的基礎(chǔ)上,借助于數(shù)據(jù)插值、數(shù)據(jù)擬合、SOM神經(jīng)網(wǎng)絡(luò)算法對(duì)可視化數(shù)據(jù)進(jìn)行分析,利用某商場(chǎng)的全球銷售數(shù)據(jù)對(duì)數(shù)據(jù)進(jìn)行可視化研究,并根據(jù)可視化的結(jié)果得到相應(yīng)的決策結(jié)論。

關(guān)鍵詞:Tableau;SOM算法;數(shù)據(jù)可視化

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)29-0014-02

1 引言

數(shù)據(jù)可視化[1]于上個(gè)世紀(jì)五十年代左右出現(xiàn),最出名的代表是計(jì)算機(jī)創(chuàng)造出了圖形圖表,1987年,布魯斯·麥考梅克等撰寫(xiě)的《科學(xué)計(jì)算可視化》加快了可視化技術(shù)的發(fā)展,第一次將科學(xué)計(jì)算中的可視化稱之為科學(xué)可視化。20世紀(jì)90年代初期,出現(xiàn)了信息可視化。目前將科學(xué)可視化與信息可視化都?xì)w為數(shù)據(jù)可視化。數(shù)據(jù)可視化是信息時(shí)代人們對(duì)于邏輯思維形象化需求的產(chǎn)物,在數(shù)據(jù)呈現(xiàn)爆炸增長(zhǎng),社會(huì)快速發(fā)展的潮流中,數(shù)據(jù)的處理是很重要的一個(gè)研究方向,其中數(shù)據(jù)可視化的研究是數(shù)據(jù)處理重要的一個(gè)方面,本文借助Tableau軟件,利用某商場(chǎng)的全球商業(yè)數(shù)據(jù)進(jìn)行可視化研究,為數(shù)據(jù)可視化的進(jìn)程增添了部分理論依據(jù)。

2 數(shù)據(jù)可視化平臺(tái)的選取

可視化工具產(chǎn)品從使用方法的角度來(lái)說(shuō),可以分為工具開(kāi)箱即用與代碼開(kāi)發(fā)使用方式兩種[2],下面舉例說(shuō)明幾個(gè)常見(jiàn)的可視化工具[3]。

從上表的比較中,結(jié)合每一種數(shù)據(jù)可視化開(kāi)發(fā)工具的優(yōu)缺點(diǎn),本文考慮到數(shù)據(jù)可視化研究的另外一個(gè)重點(diǎn)還有數(shù)據(jù)處理的部分,因此選擇了簡(jiǎn)單易操作的Tableau軟件來(lái)進(jìn)行數(shù)據(jù)可視化,因?yàn)門(mén)ableau做數(shù)據(jù)可視化研究不需要太多的編程經(jīng)驗(yàn),編程人員可以集中到數(shù)據(jù)操作的模塊。

3 數(shù)據(jù)可視化數(shù)據(jù)來(lái)源與分析

3.1 數(shù)據(jù)來(lái)源

數(shù)據(jù)的來(lái)源是利用某商場(chǎng)的全球銷售的數(shù)據(jù),這部分?jǐn)?shù)據(jù)包含的字段多,數(shù)據(jù)量大,符合數(shù)據(jù)可視化研究的基本條件,因此選擇商業(yè)數(shù)據(jù)作為數(shù)據(jù)可視化研究的基礎(chǔ)數(shù)據(jù)。

3.2 數(shù)據(jù)處理與分析

Tableau軟件對(duì)數(shù)據(jù)的處理之前需要對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的處理,綜合商業(yè)數(shù)據(jù)的數(shù)據(jù)特點(diǎn),主要采用三種數(shù)據(jù)處理的方法,分別是數(shù)據(jù)插值、數(shù)據(jù)擬合和SOM算法。

3.2.1 數(shù)據(jù)插值

3.2.2 數(shù)據(jù)擬合

數(shù)據(jù)擬合是用連續(xù)曲線近似地刻畫(huà)或比擬平面上離散點(diǎn)組所表示的坐標(biāo)之間的函數(shù)關(guān)系的一種數(shù)據(jù)處理方法[5]。用連續(xù)的函數(shù)來(lái)分析離散的數(shù)據(jù)的一種常規(guī)的數(shù)據(jù)處理的方法,在科學(xué)研究或者實(shí)際生產(chǎn)過(guò)程中,可以把觀測(cè)或者實(shí)驗(yàn)得到的數(shù)據(jù)對(duì)(xi,yi)(i=1,2,...,m),其中xi各不相同,對(duì)應(yīng)的yi也各不相同,人們希望有這樣一個(gè)函數(shù)能夠經(jīng)過(guò)實(shí)驗(yàn)所得的這些點(diǎn)數(shù)據(jù),至少無(wú)限逼近這些點(diǎn)數(shù)據(jù),從而達(dá)到一種擬合的效果,我們把這個(gè)通過(guò)這些點(diǎn)或者無(wú)限逼近這些點(diǎn)的這個(gè)函數(shù)成為擬合函數(shù)。得到擬合函數(shù)以后,可以對(duì)數(shù)據(jù)中的異常值或者缺失值進(jìn)行剔除或者填充,這個(gè)數(shù)據(jù)處理的方法,在數(shù)據(jù)可視化的過(guò)程中顯得尤為重要。

3.2.3 SOM算法

SOM[6-7]實(shí)現(xiàn)多維數(shù)據(jù)可視化的方法是把一個(gè)高維空間的數(shù)據(jù)信息通過(guò)降低維度的方法達(dá)到能夠可視化的目的,SOM算法主要是實(shí)現(xiàn)降低維度的運(yùn)算,低維數(shù)據(jù)的空間可以分為若干個(gè)規(guī)格網(wǎng)格部分,規(guī)格網(wǎng)格要表示高維數(shù)據(jù)的信息,為了實(shí)現(xiàn)著這個(gè)目標(biāo),可以假設(shè)低維空間的網(wǎng)格由大約M個(gè)單元構(gòu)成,單元j都有一個(gè)與高維信息維數(shù)相同的原型矢量(protrdype vector)mj=[mj1,...,mjd],該單元在網(wǎng)格中的位置rj是固定的。SOM的訓(xùn)練過(guò)程實(shí)際是調(diào)整原型矢量數(shù)據(jù)的過(guò)程,可以通過(guò)訓(xùn)練得到原型矢量對(duì)應(yīng)到低維空間,從而低維空間表示高維的信息。SOM算法是自組織神經(jīng)網(wǎng)絡(luò)的相關(guān)知識(shí),在訓(xùn)練權(quán)值和閾值的過(guò)程中實(shí)現(xiàn)降維的對(duì)應(yīng)法則,為數(shù)據(jù)可視化的維度變化提供算法支持。

4 數(shù)據(jù)可視化數(shù)據(jù)顯示

本文利用某商場(chǎng)的全球商業(yè)數(shù)據(jù)進(jìn)行數(shù)據(jù)可視化處理,圖1是商品類別銷售情況隨地域分布情況的可視化研究,由圖可以看出,非洲市場(chǎng)的銷售量較低,因此可以得出非洲市場(chǎng)是該商場(chǎng)的潛在市場(chǎng);圖2是銷售商品在一年中的銷售變化趨勢(shì)情況分析,從圖中可以得出銷售情況在四年中每一年的銷售情況的基本分布為一到五月增長(zhǎng)平緩,六月銷售量有上升趨勢(shì),七月銷售額有下降趨勢(shì),八月到十二月基本保持較高的銷售額,因此該公司可以根據(jù)此變化趨勢(shì)采取相應(yīng)的措施,在五月開(kāi)始增加儲(chǔ)貨量,為后續(xù)的銷售提供充足的貨源。

圖3中以坐標(biāo)圖的形式展現(xiàn)了辦公用品,技術(shù)和家具的利潤(rùn)隨裝運(yùn)成本的變化趨勢(shì)情況,其中從圖中易得出無(wú)論是家具、技術(shù)還是辦公用品,都有利潤(rùn)和裝運(yùn)成本較低的情況出現(xiàn),且辦公用品的分布相對(duì)集中,而技術(shù)的分布相對(duì)分散。圖4是以地圖的形式展現(xiàn)銷售額和利潤(rùn)的地域分布情況,從圖中明顯可以得出無(wú)論是銷售額還是利潤(rùn),在西歐地區(qū)都有較大的數(shù)據(jù)量。

5 結(jié)束語(yǔ)

數(shù)據(jù)可視化[8]的研究在利用了Tableau作為軟件平臺(tái),同時(shí)借助于數(shù)據(jù)插值算法,數(shù)據(jù)擬合算法,和SOM神經(jīng)網(wǎng)絡(luò)算法的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行可視化,可以從圖片的形象化視角來(lái)理解抽象的邏輯化視角數(shù)據(jù),用戶可以通過(guò)圖片、表格等直觀明了的角度看待數(shù)據(jù),及時(shí)為正確的決策提供有力的建議和指導(dǎo),在一定程度上促進(jìn)了經(jīng)濟(jì)的發(fā)展和社會(huì)的和諧穩(wěn)定。

參考文獻(xiàn):

[1] 陳明. 大數(shù)據(jù)可視化分析[J]. 計(jì)算機(jī)教育, 2015(5):94-97.

[2] 曾悠. 大數(shù)據(jù)時(shí)代背景下的數(shù)據(jù)可視化概念研究[D]. 浙江大學(xué), 2014.

[3] 任永功, 于戈. 數(shù)據(jù)可視化技術(shù)的研究與進(jìn)展[J]. 計(jì)算機(jī)科學(xué), 2004, 31(12):92-96.

[4] 吳健生, 王仰麟, 曾新平,等. 三維可視化環(huán)境下礦體空間數(shù)據(jù)插值[J]. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版), 2004, 40(4):635-641.

[5] 伊?xí)詵|, 孫鵬. 基于小波分析的神經(jīng)網(wǎng)絡(luò)在遙感測(cè)溫?cái)?shù)據(jù)擬合中的應(yīng)用[J]. 測(cè)繪與空間地理信息, 2017, 40(5):8-10.

[6] 芮小平, 張立強(qiáng). 基于SOM的多維信息可視化研究[J]. 應(yīng)用基礎(chǔ)與工程科學(xué)學(xué)報(bào), 2011,19(3):379-388.

[7] 陳萬(wàn)振, 張予瑤, 蘇一丹,等. 貝葉斯正則化的SOM聚類算法[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2017, 38(1):127-131.

[8] 姜玉哲. 農(nóng)業(yè)傳感數(shù)據(jù)可視化研究與實(shí)現(xiàn)[D]. 黑龍江大學(xué), 2016.

【通聯(lián)編輯:唐一東】

猜你喜歡
數(shù)據(jù)可視化
可視化:新媒體語(yǔ)境下的數(shù)據(jù)、敘事與設(shè)計(jì)研究
我國(guó)數(shù)據(jù)新聞的發(fā)展困境與策略研究
用戶數(shù)據(jù)統(tǒng)計(jì)挖掘與展示
沈阳市| 太康县| 福贡县| 汶川县| 滕州市| 澜沧| 蕉岭县| 阿拉善左旗| 连云港市| 塔城市| 新安县| 东方市| 夹江县| 咸阳市| 子洲县| 定兴县| 苏尼特左旗| 济源市| 安宁市| 聂拉木县| 元谋县| 苍南县| 酒泉市| 旬邑县| 正阳县| 运城市| 贵定县| 宿松县| 西藏| 洪江市| 扬州市| 平果县| 新竹县| 肇源县| 甘孜县| 华坪县| 民和| 龙游县| 冷水江市| 上杭县| 黄大仙区|