楊麗君
摘要:當(dāng)前對于數(shù)據(jù)有效的處理和分析研究逐漸受到重視,而數(shù)據(jù)可視化又是數(shù)據(jù)分析中一項最重要的方法。對此,基于圖形語法的優(yōu)勢提出一種新的數(shù)據(jù)可視化方法設(shè)計,通過對數(shù)據(jù)的轉(zhuǎn)換及圖形標(biāo)記、圖形可視化編碼以及標(biāo)度及坐標(biāo)系變換,實現(xiàn)對數(shù)據(jù)可視化的轉(zhuǎn)換。通過對比實驗驗證,該方法與傳統(tǒng)數(shù)據(jù)分析方法相比具有更高的交互率,可以為數(shù)據(jù)分析提供更加快速的可視化幫助。
關(guān)鍵詞:圖形語法;數(shù)據(jù);可視化;交互性
中圖分類號:TP311.5 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2020)13-0277-02
數(shù)據(jù)可視化是一種借助于人類眼睛的快速視覺感知以及人類大腦的智能認(rèn)知能力的技術(shù),利用數(shù)據(jù)可視化技術(shù)可以有效地傳遞、交流清晰的數(shù)據(jù)。目前已經(jīng)存在的數(shù)據(jù)挖掘方法和數(shù)據(jù)統(tǒng)計分析,對于海量、復(fù)雜的數(shù)據(jù)進(jìn)行處理往往是對數(shù)據(jù)的簡化,只會造成數(shù)據(jù)的傳遞出現(xiàn)偏差。而數(shù)據(jù)可視化則是對數(shù)據(jù)中所有的結(jié)構(gòu)及細(xì)節(jié)進(jìn)行還原,提高數(shù)據(jù)處理的精度。圖形語法是可以讓用戶通過結(jié)構(gòu)簡單的語法搭建出眾多不同類型的數(shù)據(jù)可視化圖像或表格,并且在圖形語法當(dāng)中還包含了眾多用于統(tǒng)計和分析的工具,支持坐標(biāo)系的構(gòu)建,讓使用者可以自主的構(gòu)建需要的圖像或表格。
1基于圖形語法的數(shù)據(jù)可視化方法設(shè)計
本文設(shè)計的基于圖形語法的數(shù)據(jù)可視化方法是以數(shù)據(jù)到圖形空間的映射為基礎(chǔ),利用圖形語法完成有數(shù)據(jù)轉(zhuǎn)換為圖形的過程,從下至上,由最基礎(chǔ)的數(shù)據(jù)元素生成更高級的元素嘲?;趫D形語法的數(shù)據(jù)可視化方法的具體思路為:首先利用圖形語法對數(shù)據(jù)轉(zhuǎn)換為圖形的形式,再對圖形進(jìn)行標(biāo)記,最后對圖形進(jìn)行可視化的編碼實現(xiàn)數(shù)據(jù)可視化,根據(jù)不同用戶的需要還可對其進(jìn)行相應(yīng)的標(biāo)度和坐標(biāo)系變換處理。下文將對上述基于圖形語法的數(shù)據(jù)可視化方法的過程進(jìn)行詳細(xì)的說明。
1.1基于圖形語法的數(shù)據(jù)轉(zhuǎn)換及圖形標(biāo)記
從圖形語法的角度出發(fā),一個統(tǒng)計的圖形就可以看作是由數(shù)據(jù)到幾何圖形轉(zhuǎn)變、映射得來的。通過圖形語法將數(shù)據(jù)的統(tǒng)計進(jìn)行轉(zhuǎn)換,最終根據(jù)實際需求繪制在特定坐標(biāo)系當(dāng)中,通過多個不同的數(shù)據(jù)組合成不同的子集圖形,最終構(gòu)成完成的數(shù)據(jù)可視化圖形。數(shù)據(jù)可視化圖形當(dāng)中最核心的部分是可視化的數(shù)據(jù)部分,其次是通過數(shù)據(jù)在變化過程中產(chǎn)生的相應(yīng)圖形屬性的映射。對于數(shù)據(jù)的轉(zhuǎn)換,首先要將海量的數(shù)據(jù)信息輸入到同一個數(shù)據(jù)框架當(dāng)中,在數(shù)據(jù)框架中包含了數(shù)據(jù)的屙l生以及相應(yīng)的數(shù)值,圖1為數(shù)據(jù)框架的集合結(jié)構(gòu)組成。
數(shù)據(jù)框架當(dāng)中的每一條數(shù)據(jù)都包好了其自身的屬性以及數(shù)值,將數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)框架的形式,其中每一行都可以表示為一條記錄內(nèi)容,在圖形語法當(dāng)中數(shù)據(jù)框架中的每一列都代表一個變量,想要表示多維度的數(shù)據(jù)可以通過多列疊加的方式處理。數(shù)據(jù)框架本身是一個通過數(shù)據(jù)列存儲的數(shù)據(jù)格式,因此對數(shù)據(jù)的轉(zhuǎn)換操作更加方便。數(shù)據(jù)向數(shù)據(jù)框架轉(zhuǎn)換關(guān)系具體可表示為:在計算機(jī)當(dāng)中輸入相應(yīng)的數(shù)據(jù)屬性及數(shù)值,通過轉(zhuǎn)換后只需輸入相應(yīng)的數(shù)據(jù)屬性即可得到相應(yīng)的數(shù)據(jù)屬性數(shù)值。在數(shù)據(jù)框架當(dāng)中還包含大量的數(shù)據(jù)操作,方便使用在根據(jù)具體需要對數(shù)據(jù)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換操作包括:映射、過濾、排列、集合、分組等,從而完成對數(shù)據(jù)到圖形的轉(zhuǎn)換。
在對數(shù)據(jù)進(jìn)行可視化轉(zhuǎn)換過程中,還需要對轉(zhuǎn)換后的圖形進(jìn)行標(biāo)記,通過圖形的標(biāo)記可以直接決定最終生成的圖形或圖表的類型。基于圖形語法的規(guī)范性圖像轉(zhuǎn)換沒有特定的圖形或圖表要求。因此,在對圖形進(jìn)行標(biāo)記時只需要利用更加細(xì)小的粒度實現(xiàn)對圖像的標(biāo)記,通過不同圖形標(biāo)記的組合得到多種不同類型的數(shù)據(jù)表達(dá)含義。將圖形和圖表看作是圖形標(biāo)記集合的標(biāo)記對象,在圖形語法當(dāng)中沒有對特定的圖形進(jìn)行定義,因此本文為圖形標(biāo)記與傳統(tǒng)圖表之間的關(guān)系進(jìn)行如表1所示的定義。
在實際操作過程中,本文基于圖形語法的數(shù)據(jù)可視化方法的圖形標(biāo)記定義只需要用到表1中的前六種圖形標(biāo)記類型即可完成對絕大多數(shù)數(shù)據(jù)的可視化處理。
1.2圖形可視化編碼
完成對數(shù)據(jù)額轉(zhuǎn)換及圖形標(biāo)記后,還需要通過對圖形進(jìn)行可視化編碼,從而實現(xiàn)對數(shù)據(jù)的可視化映射圖形的建立。由于人們在對可視化的感知是通過人的視覺完成的,因此,本文在對數(shù)據(jù)可視化方法進(jìn)行設(shè)計時,首先基于人類視覺感官的編碼原則對數(shù)據(jù)進(jìn)行可視化元素映射。通過圖形可視化編碼可以是海量數(shù)據(jù)信息更易被用戶理解,數(shù)據(jù)本身的含義也更加生動、直觀的表現(xiàn)。本文提出的可視化數(shù)據(jù)圖像編碼是由圖形和視覺屬性共同構(gòu)成的通道,利用圖形語法實現(xiàn)由數(shù)據(jù)維度到數(shù)據(jù)可視化元素的映射,可以隔年直觀且有效的表現(xiàn)出數(shù)據(jù)本身的性質(zhì)及信息。再通過控制圖形語法的視覺通道使數(shù)據(jù)的維度能夠在圖形的視覺屬性上得到映射,可以更加準(zhǔn)確地反映出數(shù)據(jù)屬性中的定量信息,通過兩種不同作用的通道實現(xiàn)對海量數(shù)據(jù)信息的完整可視化表達(dá)。
利用圖形語法實現(xiàn)對不同數(shù)據(jù)類型的圖表的表達(dá)可通過不同的圖形標(biāo)記實現(xiàn),由于圖形在繪制的過程中會產(chǎn)生不同的形狀,因此通道中與圖形相對應(yīng)的數(shù)據(jù)屬性映射方法不同時,最終生成的圖形形狀也不同。
圖形標(biāo)記點可以直接用三角形、圓形或矩形表示;圖形標(biāo)記線可以用折線、曲線以及虛線表示;圖形標(biāo)記多邊形可可以用實心的多邊形,也可以用只有邊框輪廓的空心多邊形表示。通過構(gòu)建對應(yīng)關(guān)系,形成了具有特定意義的圖形標(biāo)記,通過形狀的選擇決定了各個視覺通道當(dāng)中的圖形屬相的映射,通過圖形形狀確定應(yīng)該選擇圖形標(biāo)記。
本文基于圖形語法的數(shù)據(jù)可視化方法的圖形可視化編碼實際上是利用表現(xiàn)能力更強(qiáng)的視覺通道實現(xiàn)對數(shù)據(jù)中重要屬性及數(shù)值的可視化編碼。視覺通道中的性質(zhì)類型決定著不同數(shù)據(jù)所應(yīng)用的不同通道,根據(jù)數(shù)據(jù)實際包含的含義選擇適當(dāng)?shù)囊曈X通道可以對海量數(shù)據(jù)信息更加完整的表達(dá),從而實現(xiàn)對海量數(shù)據(jù)信息的可視化。
1.3標(biāo)度及坐標(biāo)系變換
完成對圖形的可視化編碼后,基于圖形語法的數(shù)據(jù)可視化方法基本完成,但還可根據(jù)企業(yè)當(dāng)中對數(shù)據(jù)信息的實際需要對圖形進(jìn)行標(biāo)度和坐標(biāo)系轉(zhuǎn)換。標(biāo)度是指從定義領(lǐng)域向數(shù)值領(lǐng)域映射的函數(shù)處理方法。利用相應(yīng)的方法構(gòu)建輸入的數(shù)據(jù)數(shù)值向可視化數(shù)據(jù)轉(zhuǎn)變的映射函數(shù),從而方便用戶根據(jù)具體內(nèi)容對數(shù)據(jù)進(jìn)行可視化展現(xiàn)。標(biāo)度作為由數(shù)據(jù)領(lǐng)域向圖形領(lǐng)域過渡的橋梁,主要負(fù)責(zé)對初始數(shù)據(jù)信息到區(qū)間[0,1]的轉(zhuǎn)化作用,由初始數(shù)據(jù)向區(qū)間內(nèi)繼續(xù)轉(zhuǎn)化的過程稱之為歸一化操作。在轉(zhuǎn)化的過程中,標(biāo)度的類型是隨著數(shù)據(jù)的類型不斷改變的,對于數(shù)據(jù)的分類大致可分為兩種,一種是離散型的數(shù)據(jù),一種是連續(xù)型的數(shù)據(jù),其中離散型數(shù)據(jù)又可分為有規(guī)律的和無規(guī)律的兩種。
在本文設(shè)計的數(shù)據(jù)可視化方法當(dāng)中的坐標(biāo)系與傳統(tǒng)意義上的坐標(biāo)系不同,在圖形語法中坐標(biāo)系主要用于描述數(shù)據(jù)信息是如何通過映射方式轉(zhuǎn)化為圖形的,在本文方法中用到的坐標(biāo)系為極坐標(biāo)、地圖投影以及笛卡爾坐標(biāo)三種。其中地圖投影坐標(biāo)系需要用戶將數(shù)據(jù)中帶有地理坐標(biāo)的數(shù)據(jù)以本文上述方式轉(zhuǎn)變?yōu)槎S空間中的坐標(biāo)。在三種坐標(biāo)系當(dāng)中都包含對圖像的平移、旋轉(zhuǎn)和鏡像的操作,用戶可進(jìn)行自由的操作實現(xiàn)對數(shù)據(jù)全方位的可視化,提高了數(shù)據(jù)的多樣性和靈活性。
2實驗論證分析
為了詳述本文提出的基于圖形語法的數(shù)據(jù)可視化方法,下面將通過對比實驗的形式,完成本文數(shù)據(jù)可視化方法與傳統(tǒng)數(shù)據(jù)分析方法交互性驗證的實驗。
2.1實驗準(zhǔn)備
首先建立兩個初始狀態(tài)完全相同的分析模型,其中一個添加本文設(shè)計的數(shù)據(jù)可視化方法,并將其設(shè)置為實驗組;另一個添加傳統(tǒng)數(shù)據(jù)分析方法,并將其設(shè)置為對照組。分別在兩個分析模型中添加相同的數(shù)據(jù)信息,并模擬用戶對數(shù)據(jù)的使用以及數(shù)據(jù)的展示效果。通過兩個分析模型的不斷迭代輸出最終的實驗結(jié)果。
2.2實驗結(jié)果及分析
分別將兩個分析模型的實驗結(jié)果進(jìn)行記錄,并通過結(jié)果計算出兩種數(shù)據(jù)展示方法與用戶之間的交互率,并繪制成如圖2所示的實驗結(jié)果對比曲線。
通過進(jìn)行60次的迭代后,從圖2中可以明顯看出,實驗組的交互率整體呈現(xiàn)出上升的趨勢,而對照組在完成20次迭代后交互率呈現(xiàn)出了明顯的下降趨勢。因此,通過對比實驗的形式進(jìn)一步證明了,本文提出的基于圖形語法的數(shù)據(jù)可視化方法具有更高的交互性,可以更加完整地向用戶展示數(shù)據(jù)中包含的所有信息,將其應(yīng)用到企業(yè)的實際運行當(dāng)中,更有利于企業(yè)的發(fā)展。
3結(jié)束語
本文針對目前數(shù)據(jù)信息對企業(yè)發(fā)展的重要性,提出了一種基于圖形語法的數(shù)據(jù)可視化方法,通過對比實驗進(jìn)一步驗證該方法具有更高的交互性。隨著圖形語法本身的不斷發(fā)展,在未來還可以用于解決更多的數(shù)據(jù)問題,在后續(xù)的研究中,還將針對圖形語法實現(xiàn)對數(shù)據(jù)動態(tài)可交互的可視化圖形生成方面進(jìn)行更加深入的研究。