張曉天, 張平靜
(中遠(yuǎn)海運(yùn)科技股份有限公司, 上海 200135)
航運(yùn)企業(yè)動(dòng)態(tài)數(shù)據(jù)可視化方法研究
張曉天, 張平靜
(中遠(yuǎn)海運(yùn)科技股份有限公司, 上海 200135)
大數(shù)據(jù)時(shí)代的來(lái)臨使得數(shù)據(jù)作為一種無(wú)形的資產(chǎn)受到越來(lái)越多企業(yè)的重視。當(dāng)前航運(yùn)企業(yè)正處于十分激烈的市場(chǎng)競(jìng)爭(zhēng)環(huán)境中,大數(shù)據(jù)已成為航運(yùn)企業(yè)洞悉市場(chǎng)規(guī)律、贏得生存和發(fā)展先機(jī)的新武器。通過(guò)對(duì)R語(yǔ)言動(dòng)態(tài)數(shù)據(jù)可視化技術(shù)進(jìn)行分析,結(jié)合航運(yùn)企業(yè)數(shù)據(jù)管理和決策支持的現(xiàn)狀,構(gòu)建一套表現(xiàn)具備時(shí)間和空間雙重維度數(shù)據(jù)的可視化方法,可幫助企業(yè)更直觀地發(fā)現(xiàn)數(shù)據(jù)中隱藏的規(guī)律。
R語(yǔ)言;數(shù)據(jù)可視化;數(shù)據(jù)地圖
“大數(shù)據(jù)”在當(dāng)今的商業(yè)社會(huì)中扮演著越來(lái)越重要的角色,貫穿于企業(yè)運(yùn)營(yíng)的整個(gè)生命周期,關(guān)乎企業(yè)的生存和發(fā)展,受到越來(lái)越多企業(yè)的重視。如何依托當(dāng)前先進(jìn)的大數(shù)據(jù)技術(shù)挖掘出海量數(shù)據(jù)背后蘊(yùn)含的價(jià)值,是每個(gè)現(xiàn)代企業(yè)都必須面對(duì)和思考的問(wèn)題。
1.1航運(yùn)業(yè)大數(shù)據(jù)發(fā)展趨勢(shì)分析
大數(shù)據(jù)時(shí)代來(lái)臨是當(dāng)今社會(huì)一股不可逆轉(zhuǎn)的潮流,越來(lái)越多的企業(yè)開(kāi)始關(guān)注數(shù)據(jù)資產(chǎn)的價(jià)值。現(xiàn)代航運(yùn)企業(yè)一般經(jīng)歷了多年的企業(yè)信息化建設(shè),具備比較完善的數(shù)據(jù)采集和管理?xiàng)l件,在多年的運(yùn)營(yíng)過(guò)程中收集了大量的數(shù)據(jù)。這些數(shù)據(jù)具有維度多、頻度密、帶有時(shí)間和空間等屬性,能真實(shí)地反映企業(yè)經(jīng)營(yíng)的健康狀況和市場(chǎng)規(guī)律,使得航運(yùn)企業(yè)具備大數(shù)據(jù)分析的基礎(chǔ)。此外,企業(yè)如何在坐擁龐大數(shù)據(jù)資產(chǎn)的同時(shí),建立一種有效利用數(shù)據(jù)產(chǎn)生附加價(jià)值的手段,是在大數(shù)據(jù)背景下每個(gè)企業(yè)都在思考的問(wèn)題。借助大數(shù)據(jù)技術(shù),通過(guò)全面細(xì)致地分析生產(chǎn)數(shù)據(jù),航運(yùn)企業(yè)可實(shí)現(xiàn)航線和船舶的精準(zhǔn)運(yùn)營(yíng),掌握全球不同地區(qū)的運(yùn)力部署情況,明確各港口的貨物運(yùn)輸需求量,進(jìn)而優(yōu)化航線配置、提升準(zhǔn)班率。同時(shí),借助大數(shù)據(jù)分析技術(shù)可優(yōu)化班輪的航線速度,節(jié)約船舶的燃油消耗,降低企業(yè)運(yùn)營(yíng)成本[1]。此外,數(shù)據(jù)可視化技術(shù)的研究近年來(lái)愈發(fā)火熱,借助先進(jìn)的數(shù)據(jù)可視化技術(shù)能更加直觀地揭示數(shù)據(jù)中隱含的商業(yè)規(guī)律和潛在商業(yè)價(jià)值,能幫助企業(yè)推進(jìn)商業(yè)模式的創(chuàng)新,這對(duì)同質(zhì)化競(jìng)爭(zhēng)激烈的航運(yùn)業(yè)而言十分重要。
1.2航運(yùn)企業(yè)數(shù)據(jù)利用問(wèn)題
Z集裝箱航運(yùn)企業(yè)成立于1997年,是全球領(lǐng)先的集裝箱班輪運(yùn)輸企業(yè),其信息化建設(shè)至今,已在公司的日常運(yùn)營(yíng)過(guò)程中積累大量數(shù)據(jù)。一份海運(yùn)合同的履行,從制訂班期、客戶訂艙開(kāi)始,到客戶提貨、結(jié)清費(fèi)用,整個(gè)過(guò)程步驟眾多,涉及到的數(shù)據(jù)主要有航次信息、客戶資料、船舶信息、集裝箱動(dòng)態(tài)、提單數(shù)據(jù)、合同信息和費(fèi)用信息等。這些數(shù)據(jù)不僅在企業(yè)內(nèi)部各系統(tǒng)之間流轉(zhuǎn),還通過(guò)主流EDI格式與海關(guān)、碼頭及收發(fā)貨人等外部單位交互。企業(yè)為存儲(chǔ)和管理這些運(yùn)營(yíng)數(shù)據(jù),必須投入一定的資源,而數(shù)據(jù)價(jià)值卻得不到充分挖掘,企業(yè)在數(shù)據(jù)管理中的投入和產(chǎn)出嚴(yán)重不成比例,使得企業(yè)管理成本增加。
造成數(shù)據(jù)價(jià)值難以產(chǎn)生的一個(gè)重要原因是沒(méi)有有效的數(shù)據(jù)分析和展現(xiàn)方式。目前Z航運(yùn)企業(yè)內(nèi)部數(shù)據(jù)分析和展現(xiàn)方式主要有以下2種。
1.2.1 使用Microsoft Excel
目前Z航運(yùn)企業(yè)內(nèi)部數(shù)據(jù)管理仍有一部分需借助Microsoft Excel來(lái)完成,有些是人工制作的Excel表格,有些是借助業(yè)務(wù)系統(tǒng)導(dǎo)出的表格(見(jiàn)圖1)。Excel表格的優(yōu)勢(shì)在于方便、易用和硬件環(huán)境要求低,而其不足之處在于需投入一定的人力進(jìn)行表格制作,數(shù)據(jù)的展現(xiàn)方式有限(如無(wú)法準(zhǔn)確展現(xiàn)具有時(shí)空維度的數(shù)據(jù)),同時(shí)無(wú)法滿足復(fù)雜的數(shù)據(jù)建模要求。
1.2.2 業(yè)務(wù)系統(tǒng)導(dǎo)出固定報(bào)表
多年的信息化建設(shè)使得Z航運(yùn)企業(yè)建立有十分完備的業(yè)務(wù)系統(tǒng),這些業(yè)務(wù)系統(tǒng)是企業(yè)業(yè)務(wù)數(shù)據(jù)的主要入口,在輔助業(yè)務(wù)正常運(yùn)行的同時(shí),承擔(dān)著對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行初級(jí)分析和展示的任務(wù)。在系統(tǒng)的建設(shè)過(guò)程中,企業(yè)管理層不斷地對(duì)業(yè)務(wù)系統(tǒng)提出各種數(shù)據(jù)上報(bào)的要求,因此業(yè)務(wù)系統(tǒng)內(nèi)逐步開(kāi)發(fā)出滿足各種統(tǒng)計(jì)上報(bào)要求的報(bào)表。但是,受制于業(yè)務(wù)系統(tǒng)的架構(gòu)設(shè)計(jì),這些上報(bào)報(bào)表格式固定,僅能完成對(duì)數(shù)據(jù)的匯總、篩選和排序等初級(jí)分析工作,沒(méi)有更加直觀、生動(dòng)的展現(xiàn)形式,因此也不能有效挖掘數(shù)據(jù)價(jià)值。
綜上所述,當(dāng)前這種數(shù)據(jù)管理現(xiàn)狀造成企業(yè)投入的資金和擁有的數(shù)據(jù)資產(chǎn)的雙重浪費(fèi),選擇一套簡(jiǎn)單高效的大數(shù)據(jù)分析方法是航運(yùn)企業(yè)的當(dāng)務(wù)之急。R語(yǔ)言在開(kāi)發(fā)之初就被用來(lái)進(jìn)行數(shù)據(jù)分析,具有簡(jiǎn)單的語(yǔ)法、豐富的函數(shù)和擴(kuò)展包,支持復(fù)雜的數(shù)據(jù)模型及豐富的可視化技術(shù),可應(yīng)用到航運(yùn)企業(yè)的大數(shù)據(jù)分析工作中。
2.1R語(yǔ)言與可視化技術(shù)
對(duì)于人類而言,視覺(jué)帶來(lái)的感受往往更加直接,人們?cè)诜治龃罅繑?shù)據(jù)時(shí)更傾向于依托視覺(jué)的方式。因此,創(chuàng)造出很多數(shù)據(jù)可視化工具,諸如Google Spreadsheets,IBM Many Eyes,Tableau Software等。然而,這些工具主要關(guān)注快速、方便和美觀等特點(diǎn),適合小數(shù)據(jù)量及新人使用,當(dāng)數(shù)據(jù)量級(jí)增大,需做可定制化的深入分析并輸出印刷品質(zhì)的圖像時(shí),這些工具可能無(wú)法滿足要求。因此,需借助可編程語(yǔ)言的可視化技術(shù),例如R語(yǔ)言。
R語(yǔ)言從誕生之初就是為數(shù)據(jù)分析設(shè)計(jì)的,不僅是一門程序化語(yǔ)言,更是一整套數(shù)據(jù)分析的解決方案。R語(yǔ)言最大的特點(diǎn)是免費(fèi)、開(kāi)源,且使用非常靈活。此外,R語(yǔ)言包含十分豐富的擴(kuò)展包,從數(shù)據(jù)模型、分析工具,到繪圖工具、數(shù)據(jù)接口等,幾乎全部包含,方便統(tǒng)計(jì)人員應(yīng)對(duì)各種統(tǒng)計(jì)場(chǎng)景。以ggplot2為代表的一系列繪圖包為R語(yǔ)言數(shù)據(jù)可視化提供了強(qiáng)大的支持。
ggplot2繪圖包由Hadley Wickham開(kāi)發(fā),經(jīng)過(guò)多年的演化完善逐漸成為R語(yǔ)言數(shù)據(jù)可視化技術(shù)的主流選擇。ggplot2具有美觀優(yōu)雅的圖形外觀和極其強(qiáng)大的語(yǔ)法特性,采用圖層和映射的設(shè)計(jì)理念,允許用戶分層構(gòu)建和修改圖形,將數(shù)據(jù)屬性映射到視覺(jué)屬性,這些特性使得ggplot2能以非常簡(jiǎn)潔的語(yǔ)法來(lái)構(gòu)建復(fù)雜的圖形,非常精細(xì)地控制可視化的展現(xiàn)方式,同時(shí)保持很高的繪圖品質(zhì)[2]。
2.2數(shù)據(jù)地圖技術(shù)
地圖作為分析空間數(shù)據(jù)的一種傳統(tǒng)方法,在當(dāng)今的大數(shù)據(jù)時(shí)代依然值得關(guān)注。對(duì)于包含地理信息的空間數(shù)據(jù),將其與地圖上的經(jīng)緯度坐標(biāo)相結(jié)合,能在地圖上直觀地展現(xiàn)數(shù)據(jù)的空間分布,便于人們通過(guò)眼睛直接發(fā)現(xiàn)數(shù)據(jù)及其分布中蘊(yùn)含的規(guī)律。要繪制數(shù)據(jù)地圖,需依托詳細(xì)的地理測(cè)繪信息,特別是地理坐標(biāo)信息。最常用的一種方法是利用第三方提供的地圖API,例如Google和Microsoft地圖。然而,這種地圖的定制化程度很低,其外觀與原生的Google和Microsoft地圖基本沒(méi)有區(qū)別,無(wú)法滿足特定統(tǒng)計(jì)場(chǎng)景下的主題要求。
為應(yīng)對(duì)企業(yè)環(huán)境下多樣性的數(shù)據(jù)地圖需求,很多第三方機(jī)構(gòu)或個(gè)人開(kāi)發(fā)靈活而詳細(xì)的矢量地理信息庫(kù),為數(shù)據(jù)地圖開(kāi)發(fā)者提供更加靈活的解決方案。這其中最重要、應(yīng)用最廣泛的就是Shapefile格式文件。Shapefile是美國(guó)環(huán)境系統(tǒng)研究所開(kāi)發(fā)的一種空間數(shù)據(jù)格式,目前已成為地理信息軟件領(lǐng)域的一種開(kāi)放標(biāo)準(zhǔn)。Shapefile由一系列包含位置信息的矢量幾何圖形組成,由于是矢量圖形,因此任意縮放都不會(huì)影響輸出圖像的質(zhì)量。
Natural Earth是一個(gè)由志愿者開(kāi)發(fā)的公共區(qū)域地圖數(shù)據(jù)集,已得到北美制圖信息協(xié)會(huì)的支持,該數(shù)據(jù)集提供1∶10 000 000,1∶50 000 000和1∶110 000 000等3種比例的Shapefile格式矢量地圖文件。作為一個(gè)定制化地圖開(kāi)發(fā)便捷資源的提供方,Natural Earth不像用于科學(xué)研究和軍事用途的地圖數(shù)據(jù),其從設(shè)計(jì)之初就是為滿足地圖繪制者從事與生產(chǎn)作業(yè)相關(guān)的制圖工作,且這種工作可使用多種多樣的軟件應(yīng)用來(lái)實(shí)現(xiàn)。Natural Earth地圖數(shù)據(jù)庫(kù)包含文化矢量數(shù)據(jù)主題、物理矢量數(shù)據(jù)主題和光柵數(shù)據(jù)主題等三大數(shù)據(jù)主題(見(jiàn)圖2~圖4),其中:文化矢量數(shù)據(jù)主題包含國(guó)家、區(qū)域、省份、居民區(qū)、城市區(qū)域、公園和保護(hù)區(qū)、太平洋島國(guó)及水域邊界等內(nèi)容;物理矢量數(shù)據(jù)主題主題包含海岸線、陸地、海洋、群島、珊瑚礁、河流湖泊、冰川、南極冰架及經(jīng)緯度等內(nèi)容;光柵數(shù)據(jù)主題主題則包含衛(wèi)星測(cè)繪得到的大陸、洋底的混合地形數(shù)據(jù)。由于Natural Earth地圖數(shù)據(jù)庫(kù)包含的數(shù)據(jù)種類繁多、內(nèi)容詳細(xì),可滿足大部分定制化地圖開(kāi)發(fā)的要求。
3.1收集和處理數(shù)據(jù)
R語(yǔ)言擁有豐富的擴(kuò)展包,允許使用者以多種方式收集數(shù)據(jù)。R語(yǔ)言支持從鍵盤直接輸入數(shù)據(jù),使用者也可從文本文件、Microsoft Excel和Access、多種統(tǒng)計(jì)軟件、特殊格式的文件及關(guān)系型數(shù)據(jù)庫(kù)中導(dǎo)入數(shù)據(jù)[3]。
對(duì)于企業(yè)級(jí)應(yīng)用,特別是在已存在大型數(shù)據(jù)庫(kù)的情況下,通過(guò)設(shè)置數(shù)據(jù)庫(kù)驅(qū)動(dòng)來(lái)允許R語(yǔ)言訪問(wèn)外部數(shù)據(jù)庫(kù)是一種常用且高效的手段,同時(shí)可發(fā)揮SQL語(yǔ)言和R語(yǔ)言各自的優(yōu)勢(shì)。R語(yǔ)言的優(yōu)勢(shì)在于對(duì)數(shù)據(jù)進(jìn)行分析,而SQL語(yǔ)言的優(yōu)勢(shì)在于數(shù)據(jù)管理。在檢索原始數(shù)據(jù)時(shí),可使用SQL語(yǔ)言對(duì)數(shù)據(jù)進(jìn)行清洗,例如篩選、匯總、排序及空值轉(zhuǎn)換等操作,然后將整理好的數(shù)據(jù)導(dǎo)入到R語(yǔ)言中進(jìn)行分析。要在R語(yǔ)言中使用SQL語(yǔ)言訪問(wèn)外部數(shù)據(jù)庫(kù),首先需加載RODBC包并設(shè)置數(shù)據(jù)庫(kù)連接。在編寫(xiě)SQL語(yǔ)言腳本進(jìn)行數(shù)據(jù)抽取之前,要明確從業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)抽取數(shù)據(jù)的維度,排除不必要的信息,需抽取的業(yè)務(wù)信息主要有預(yù)計(jì)離港時(shí)間、箱量(TEU)、目的港名稱和目的港所屬國(guó)家代碼,其中箱量按月份匯總,并進(jìn)行標(biāo)準(zhǔn)化處理,按箱型轉(zhuǎn)換為統(tǒng)一的計(jì)量單位TEU,以方便統(tǒng)計(jì)計(jì)算。在從業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫(kù)抽取數(shù)據(jù)時(shí),還進(jìn)行一些基本的數(shù)據(jù)清洗工作,例如過(guò)濾目的港名稱為空的數(shù)據(jù)等很可能是錯(cuò)誤數(shù)據(jù)或非出口業(yè)務(wù)數(shù)據(jù),然后將數(shù)據(jù)按預(yù)計(jì)離港時(shí)間排序(見(jiàn)圖6)。
3.2導(dǎo)入Shapefile地理信息
為展現(xiàn)出口箱量在全球的分布情況,選擇Natural Earth提供的陸地多邊形矢量數(shù)據(jù)集(ne_10m_land.shp),該數(shù)據(jù)集以標(biāo)準(zhǔn)的Shapefile格式存儲(chǔ)大陸及主要島嶼的海岸線數(shù)據(jù),不包含行政區(qū)劃分界,以避免數(shù)據(jù)地圖上圖形過(guò)于復(fù)雜,導(dǎo)致觀察者難以獲取地圖傳遞的信息(見(jiàn)圖7)。此外,為在地圖背景上繪制相關(guān)目的港的位置,還需導(dǎo)入港口經(jīng)緯度數(shù)據(jù),這里選擇Natural Earth提供的全球主要居民區(qū)坐標(biāo)數(shù)據(jù)集(ne_10m_populated_places.shp),而非港口坐標(biāo)數(shù)據(jù)集,主要是因?yàn)椴⒎撬袠I(yè)務(wù)的目的港都是主要港口,可能涉及內(nèi)陸點(diǎn),因此居民區(qū)坐標(biāo)數(shù)據(jù)要比全球主要港口數(shù)據(jù)更加全面(見(jiàn)圖8)。通過(guò)加載maptools擴(kuò)展包,R語(yǔ)言就可讀取該數(shù)據(jù)集對(duì)應(yīng)的Shapefile格式文件,使用readShapePoly命令讀取陸地多邊形矢量數(shù)據(jù)集,使用readShapePoints命令讀取居民區(qū)坐標(biāo)數(shù)據(jù)集,文件讀取后還需轉(zhuǎn)換為數(shù)據(jù)框才可用于繪制矢量地圖。居民區(qū)坐標(biāo)數(shù)據(jù)集導(dǎo)入之后,由于一些居民區(qū)會(huì)有多個(gè)距離不遠(yuǎn)的坐標(biāo),因此需去掉多余坐標(biāo),只需保留1個(gè)即可,以避免在整合箱量數(shù)據(jù)和坐標(biāo)數(shù)據(jù)時(shí)出現(xiàn)重復(fù)。
地理信息數(shù)據(jù)導(dǎo)入后,還需將集裝箱出口業(yè)務(wù)數(shù)據(jù)和地理信息數(shù)據(jù)整合到一起,匹配的依據(jù)是地名和國(guó)家代碼,例如Alexandria,Queenstown,Richmond等地名在不同國(guó)家均存在,因此用符合ISO 3166標(biāo)準(zhǔn)的2位國(guó)家代碼加以區(qū)分。此外,在匹配時(shí)還需去掉地名中的空格,并統(tǒng)一為大寫(xiě)字符,以保證匹配正確。
整合之后的數(shù)據(jù)混合在一個(gè)數(shù)據(jù)集中,為針對(duì)不同目的港的箱量數(shù)據(jù)進(jìn)行數(shù)據(jù)可視化繪制,需對(duì)出口箱量數(shù)據(jù)按目的港名稱進(jìn)行分組,并分解為以目的港名稱命名的多個(gè)子數(shù)據(jù)集。分組之后,并非所有港口在整個(gè)統(tǒng)計(jì)時(shí)間范圍內(nèi)都有箱量數(shù)據(jù),有些港口可能因?yàn)樨浽椿蚱渌獠恳蛩?,?dǎo)致部分月份缺少所需數(shù)據(jù)。因此,需將缺少的字段補(bǔ)全,統(tǒng)計(jì)月份按照時(shí)間順序補(bǔ)全,箱量賦值為0,港口名稱、國(guó)家代碼和經(jīng)緯度與其他記錄相同。
3.3繪制動(dòng)態(tài)數(shù)據(jù)地圖
3.3.1 繪制地圖背景
使用已導(dǎo)入的陸地多邊形矢量數(shù)據(jù)集繪制世界地圖背景,為體現(xiàn)一種簡(jiǎn)約、素雅的可視化風(fēng)格,地圖背景整體呈淺色,海洋部分使用白色填充,陸地部分使用灰色填充,同時(shí)設(shè)置陸地部分的透明度為60%。使用主題設(shè)置函數(shù)theme()去掉背景網(wǎng)格線、坐標(biāo)軸及坐標(biāo)軸標(biāo)題及圖例,并調(diào)節(jié)圖形顯示高度以便隱藏南北極,得到的世界地圖背景(見(jiàn)圖9)。
3.3.2 繪制各目的港箱量分布
ggplot2擴(kuò)展包最強(qiáng)大的地方在于可單獨(dú)控制、添加和刪除組件,因此將每個(gè)目的港數(shù)據(jù)集作為一個(gè)繪圖組件單獨(dú)繪制,方便對(duì)每個(gè)港口展現(xiàn)的美學(xué)特征進(jìn)行調(diào)整。將數(shù)據(jù)的展現(xiàn)圖形設(shè)置為紅色圓環(huán),圓環(huán)的大小反映數(shù)據(jù)的大小。由于不同港口的箱量數(shù)據(jù)差異很大,直接顯示會(huì)導(dǎo)致有些港口的圖形過(guò)大,覆蓋其他港口的圖形;此外,有些港口的圖形只是一個(gè)微小的點(diǎn),很難觀察其演變趨勢(shì),需對(duì)箱量數(shù)據(jù)進(jìn)行對(duì)數(shù)轉(zhuǎn)換,對(duì)數(shù)轉(zhuǎn)換不會(huì)消除數(shù)據(jù)的趨勢(shì)和相關(guān)關(guān)系,而是壓縮數(shù)據(jù)的尺度,使數(shù)據(jù)變得更加平穩(wěn),轉(zhuǎn)換前提是數(shù)據(jù)中不包含負(fù)數(shù)。
3.3.3 生成GIF動(dòng)畫(huà)
GIF動(dòng)畫(huà)在本質(zhì)上是很多張圖片按一定的順序逐幀播放的結(jié)果,這里生成的GIF動(dòng)畫(huà)也是基于該原理。從2010年1月—2016年3月,每個(gè)月繪制1張所有港口在該月份箱量的分布圖,就得到75幀圖片,然后通過(guò)ImageMagick軟件將75幀圖片組合生成GIF動(dòng)畫(huà),設(shè)置每幀動(dòng)畫(huà)時(shí)間間隔為0.12 s,并增加每幀動(dòng)畫(huà)的日期顯示,得到最終的動(dòng)態(tài)數(shù)據(jù)地圖(見(jiàn)圖10)。為方便說(shuō)明,只截取動(dòng)態(tài)圖中的一部分來(lái)說(shuō)明。
從全球分布來(lái)看,Z航運(yùn)企業(yè)的出口箱量流向分布主要集中在歐洲、北美和東南亞,東亞的日本和韓國(guó)也是貨物的主要出口國(guó)。歐洲一直是Z航運(yùn)企業(yè)出口箱量的主要流向,是企業(yè)收入的主要來(lái)源之一。由圖10可知,北歐、波羅的海沿岸國(guó)家一直保持著穩(wěn)定的箱量水平,地中海國(guó)家的箱量經(jīng)過(guò)了一個(gè)早期的發(fā)展階段,特別是意大利箱量的增加成為歐洲的亮點(diǎn)。
對(duì)于經(jīng)營(yíng)集裝箱班輪的航運(yùn)企業(yè)而言,北美也是其重點(diǎn)經(jīng)營(yíng)的區(qū)域之一。由圖10可知,Z航運(yùn)企業(yè)出口到美西和美東的箱量呈現(xiàn)出不同的特點(diǎn)。美西區(qū)域的箱量主要集中在幾個(gè)大的港口,且常年保持穩(wěn)定;美東區(qū)域的箱量在集中在幾個(gè)大的港口的同時(shí),隨著時(shí)間的推移逐漸新增一些較小的箱量分布點(diǎn),很可能是因?yàn)榧哟罅嗣罇|航線的開(kāi)發(fā)力度??傮w來(lái)看,北美區(qū)域的箱量經(jīng)歷了一個(gè)初期的增長(zhǎng)過(guò)程,并持續(xù)保持穩(wěn)定,為企業(yè)的發(fā)展提供了持續(xù)的收入來(lái)源。
此外,南美西岸的箱量穩(wěn)中有增,南美東岸市場(chǎng)的箱量呈下滑趨勢(shì),而東南亞、中東、黑海、西部非洲和新西蘭等地區(qū)的箱量分布也呈現(xiàn)出增長(zhǎng)的趨勢(shì),這與這些地區(qū)的經(jīng)濟(jì)發(fā)展及Z航運(yùn)企業(yè)積極開(kāi)辟新市場(chǎng)等因v
動(dòng)態(tài)數(shù)據(jù)地圖非常清晰地展現(xiàn)出Z航運(yùn)企業(yè)從2010年到2016年全球出口集裝箱箱量的分配情況及發(fā)展趨勢(shì),分析的基礎(chǔ)是企業(yè)生產(chǎn)經(jīng)營(yíng)中產(chǎn)生的數(shù)據(jù),因此其展現(xiàn)出來(lái)的內(nèi)容也是真實(shí)、客觀的,企業(yè)的管理者在此基礎(chǔ)上做出的決策將更加科學(xué)、合理,真正做到在數(shù)據(jù)驅(qū)動(dòng)下的決策。
通過(guò)對(duì)企業(yè)動(dòng)態(tài)數(shù)據(jù)可視化進(jìn)行研究可知,對(duì)大量數(shù)據(jù)進(jìn)行有效組織,從多個(gè)角度對(duì)數(shù)據(jù)進(jìn)行剖析和開(kāi)發(fā),運(yùn)用色彩化的圖形圖像來(lái)表現(xiàn)具有復(fù)雜維度的數(shù)據(jù),能成為信息傳達(dá)和溝通的一種有效手段[4]。通過(guò)繪制動(dòng)態(tài)圖像可表現(xiàn)數(shù)據(jù)在一定時(shí)間范圍內(nèi)的變化情況,使人們更容易發(fā)現(xiàn)數(shù)據(jù)中隱藏的季節(jié)規(guī)律和時(shí)間趨勢(shì);將其與數(shù)據(jù)地圖結(jié)合起來(lái),非常有利于展現(xiàn)同時(shí)具有時(shí)空特征的數(shù)據(jù)。此外,大數(shù)據(jù)的分析方法盤活了企業(yè)的數(shù)據(jù)資產(chǎn),幫助企業(yè)的管理者發(fā)現(xiàn)問(wèn)題、做出科學(xué)合理的決策,使企業(yè)對(duì)數(shù)據(jù)管理的投入產(chǎn)生新的價(jià)值。
隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)呈爆發(fā)式增長(zhǎng)。在電子技術(shù)和信息技術(shù)的幫助下,航運(yùn)企業(yè)在日常運(yùn)營(yíng)過(guò)程中獲得數(shù)據(jù)的手段越來(lái)越多,例如通過(guò)船舶雷達(dá)與感應(yīng)裝置時(shí)刻獲得船舶運(yùn)行狀態(tài)與水文信息,通過(guò)RFID技術(shù)、GPS技術(shù)和多功能傳感器技術(shù)獲得集裝箱的運(yùn)輸狀態(tài),通過(guò)EDI數(shù)據(jù)交互、互聯(lián)網(wǎng)技術(shù)獲得業(yè)務(wù)數(shù)據(jù)等。航運(yùn)企業(yè)擁有非常廣闊的大數(shù)據(jù)應(yīng)用場(chǎng)景,如何開(kāi)發(fā)新的大數(shù)據(jù)分析和可視化技術(shù)、充分挖掘數(shù)據(jù)中蘊(yùn)含的價(jià)值,是值得航運(yùn)企業(yè)不斷思考和探索的課題。
[1] 李舜,新常態(tài)下航運(yùn)企業(yè)的商業(yè)模式創(chuàng)新[J].交通企業(yè)管理,2015(12):19-21.
[2] CHANG W. R Graphics Cookbooks[M]. 北京: 人民郵電出版社, 2014.
[3] KABACOFF R I. R in Action:Data Analysis and Graphics with R[M]. 北京:人民郵電出版社, 2013:158.
[4] 彭戎軒.數(shù)據(jù)可視化技術(shù)應(yīng)用趨勢(shì)與類型分析[J].西部資源,2015(6):84-85.
VisualizationofShippingCompanyDatawithR
ZHANGXiaotian,ZHANGPingjing
(COSCO SHIPPING Technology Co., Ltd., Shanghai 200135, China)
Big Data era is coming, and more and more enterprises are increasingly paying attention to the intangible assets. Shipping companies are in a very competitive market environment, and Big Data has become a new weapon for them to gain insights into the market and find the opportunities of survival and development. This paper analyzes the dynamic data visualization technology in R, and presents the implementation of time-space 2-dimentional visualization of shipping data, particularly for data management and decision-making support of shipping companies.
R; data visualization; data map
TP311
A
2017-06-05
張曉天(1984—),男,遼寧錦州人,助理工程師,碩士,主要從事集裝箱航運(yùn)系統(tǒng)工作。
1674-5949(2017)03-0077-08