文/徐海波 李朝陽
數(shù)據(jù)可視化是一種技術(shù),在視覺傳達(dá)過程中能夠直觀、生動、有效的將信息傳遞給人們,引起人們的心理反應(yīng),幫助讀者理解。數(shù)據(jù)可視化的終極意義是催生觀點(diǎn)的生成、推動決策。大數(shù)據(jù)時(shí)代,數(shù)據(jù)生成速度快,積累的數(shù)據(jù)體量龐大,如何從數(shù)據(jù)礦藏中提煉輔助決策的數(shù)據(jù),通過人機(jī)交互,幫助管理者在非結(jié)構(gòu)化任務(wù)中作出決策是一個(gè)重要課題。隨著數(shù)據(jù)驅(qū)動的決策分析越來越受到政府機(jī)構(gòu)、企事業(yè)單位的高度關(guān)注,使用數(shù)據(jù)視覺化技術(shù)的決策支持系統(tǒng)建設(shè)不斷開展。
圖1:離港航班24小時(shí)流量時(shí)序圖
決策支持系統(tǒng)(Decision Support System,簡稱DSS)是以計(jì)算機(jī)技術(shù)、仿真技術(shù)和信息技術(shù)為手段,針對半結(jié)構(gòu)化的決策問題,支持決策活動的具有智能作用的人機(jī)系統(tǒng)。
該系統(tǒng)能夠?yàn)闆Q策者提供所需的數(shù)據(jù)、信息和背景資料,幫助明確決策目標(biāo)和進(jìn)行問題的識別,通過人機(jī)交互功能進(jìn)行分析、比較和判斷,為正確的決策提供必要的支持。它通過與決策者的一系列人機(jī)對話過程,為決策者提供各種可靠方案,檢驗(yàn)決策者的要求和設(shè)想,從而達(dá)到支持決策的目的。
該系統(tǒng)所支持的主要對象是半結(jié)構(gòu)化和非結(jié)構(gòu)化的決策(即不能完全用數(shù)學(xué)公式、數(shù)學(xué)模型來求解)。決策支持系統(tǒng)只是支持用戶,而不是代替用戶判斷。它的一部分分析可由計(jì)算機(jī)自動進(jìn)行,但需要用戶的節(jié)點(diǎn)判斷和參與,主要特征為:
圖2:按國內(nèi)、國際分類的航班流量時(shí)序圖
(1)主要針對用戶經(jīng)常面臨的非結(jié)構(gòu)化或半結(jié)構(gòu)化、說明不夠充分的問題;
(2)把模型或分析技術(shù)與傳統(tǒng)的數(shù)據(jù)存取及檢索技術(shù)結(jié)合起來;
(3)人機(jī)交互方式使用,為用戶提出有效的數(shù)據(jù)查詢并在管理系統(tǒng)的支持下,評估用戶的查詢條件和查詢結(jié)果,指導(dǎo)用戶更佳查詢;
(4)強(qiáng)調(diào)對環(huán)境及用戶決策方法改變的敏捷性;
(5)決策支持系統(tǒng)為用戶或管理人員制定決策提供支持。
使用各種統(tǒng)計(jì)分析和控制分析模型,進(jìn)行多層面和更復(fù)雜的分析和計(jì)算,發(fā)現(xiàn)趨勢(旅客流量增長趨勢、年度旅客吞吐量預(yù)測、地方經(jīng)濟(jì)對旅客出行方式的影響等);通過查詢獲取重要內(nèi)容詳細(xì)信息;確定事項(xiàng)優(yōu)先級和內(nèi)部管理規(guī)則,支持組織內(nèi)部各管理層決策。為用戶和管理人員有效的幫助。
每個(gè)業(yè)務(wù)系統(tǒng)將包括相應(yīng)業(yè)務(wù)(旅客流量、地方經(jīng)濟(jì)、投資、政策法規(guī)、收入等)的輔助決策系統(tǒng),并在分業(yè)務(wù)的支持下輔助決策支持系統(tǒng)。
數(shù)據(jù)可視化(DataVisualization)技術(shù)是利用計(jì)算機(jī)圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來,并進(jìn)行交互處理的理論、方法和技術(shù)。
用戶(stakeholder)既是數(shù)據(jù)的生產(chǎn)者,也是數(shù)據(jù)的使用者,然而用戶獲取和存儲的原始數(shù)據(jù)總是雜亂無章的??傊⒉皇撬腥硕伎梢岳斫庖环輳?fù)雜的數(shù)據(jù)報(bào)告,但人人都會看圖。要想數(shù)據(jù)達(dá)到生動有趣、讓人一目了然的效果,就需要借助數(shù)據(jù)可視化。數(shù)據(jù)可視化是和數(shù)據(jù)分析、數(shù)據(jù)挖掘等方法的有效補(bǔ)充。
數(shù)據(jù)圖表開發(fā)者根據(jù)用戶需求,對多維數(shù)據(jù)進(jìn)行切片,旋轉(zhuǎn),通過人機(jī)交互,最終呈現(xiàn)給用戶簡介、直觀的圖形或圖像,展現(xiàn)數(shù)據(jù)力量,幫助用戶發(fā)現(xiàn)未知信息,促動用戶觀點(diǎn)的生成、助力管理者決策的產(chǎn)生。本﹒施奈德曼(BEN SHNEIDERMAN)說“先總覽,再縮放并篩選,然后按需尋找細(xì)節(jié)”。數(shù)據(jù)可視化可以恢復(fù)數(shù)據(jù)集的真實(shí)結(jié)構(gòu),乃至極大的增強(qiáng)數(shù)據(jù)的全局結(jié)構(gòu)和數(shù)據(jù)的具體細(xì)節(jié),通過獲得數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系、發(fā)現(xiàn)數(shù)據(jù)對整體結(jié)果影響的模式,使管理者獲得對整體結(jié)果的洞察。
數(shù)據(jù)可視化的目的是最大化數(shù)據(jù)價(jià)值,其本質(zhì)意義就是幫助用戶(stakeholder)理解數(shù)據(jù)和推動用戶決策。可把數(shù)據(jù)理解為一個(gè)支點(diǎn),數(shù)據(jù)可視化技術(shù)即是杠桿,兩者結(jié)合,可以撬動用戶決策,助力企業(yè)價(jià)值增長。數(shù)據(jù)可視化是充分展現(xiàn)數(shù)據(jù)力量的重要工具。以下介紹幾種可視化的應(yīng)用示例。
圖1的設(shè)計(jì)采用散點(diǎn)圖(scatter plots)綜合熱力圖(heat map)的展現(xiàn)形式,橫坐標(biāo)為時(shí)間,縱坐標(biāo)為離港人數(shù),每個(gè)數(shù)據(jù)元素代表一個(gè)航班,顯示隨著時(shí)間的推移生成的航班數(shù)量及旅客人數(shù)。圖1可以判斷出(1)8時(shí)至10時(shí)為該日上午的航班出港高峰,下午17時(shí)至18時(shí)為該日下午的航班出港高峰時(shí)段,下午13時(shí)至14時(shí)為該日白天出港航班較少的時(shí)段;(2)航班載客人數(shù)在150人至200人之間聚集;(3)凌晨2時(shí)至6時(shí),機(jī)場離港航班以貨運(yùn)為主;(4)能夠快速定位到貨機(jī)、大型客機(jī)、小型客機(jī)的起飛時(shí)段。圖2在圖1的基礎(chǔ)上,用顏色增加了航班屬于國內(nèi)航班還是國際航班的維度。圖3的設(shè)計(jì)采用樹形圖(treemap),顯示當(dāng)日各航司的航班數(shù)量,且航司之間橫向比較,更為直觀。從數(shù)據(jù)可視化的技術(shù)分類角度來講,圖1、圖2為基于幾何的可視化技術(shù),圖3為基于層次的可視化技術(shù)。
圖3:當(dāng)日各航司航班數(shù)量的比較
圖4:2018年前十大機(jī)場旅客吞吐量、貨郵吞吐量、起降架次展現(xiàn)
從圖4可以看出,旅客吞吐量排名最高的為北京首都機(jī)場,貨郵吞吐量排名最高的為上海浦東機(jī)場,杭州機(jī)場貨郵吞吐量排名優(yōu)于旅客吞吐量排名且取得了貨運(yùn)較優(yōu)的成績。圖4使用了氣泡圖的方式,氣泡圖與散點(diǎn)圖類似,繪制時(shí)將一個(gè)變量放在橫軸,另一個(gè)變量放在縱軸,而第三個(gè)變量則用氣泡的大小來表示以,允許以二維方式繪制包含三個(gè)變量的圖表。圖4展現(xiàn)了旅客吞吐量、貨郵吞吐量、起降架次三個(gè)維度,展示效果優(yōu)于條形圖和直方圖。
本文研究了數(shù)據(jù)可視化在決策支持系統(tǒng)中的重要性和應(yīng)用。從筆者業(yè)務(wù)環(huán)境分析了數(shù)據(jù)可視化的設(shè)計(jì)實(shí)現(xiàn)方式。數(shù)據(jù)可視化促進(jìn)了管理人員對信息的認(rèn)知,讓復(fù)雜的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)更易于理解, 從而影響決策,為企業(yè)、為社會、為個(gè)人生活帶來實(shí)際價(jià)值。