文/陳瑋琳 席 文 羅 濤
本文通過(guò)研究數(shù)據(jù)可視化技術(shù)的發(fā)展現(xiàn)狀,分析數(shù)據(jù)可視化在軍隊(duì)檔案利用、管理過(guò)程中的應(yīng)用模式與作用,并對(duì)其需要把握的問(wèn)題進(jìn)行剖析,從而加強(qiáng)檔案數(shù)據(jù)分析挖掘水平,進(jìn)一步提升軍隊(duì)檔案利用效率
可視化技術(shù)能夠?qū)Ⅲw量巨大的抽象數(shù)據(jù)轉(zhuǎn)換為直觀、形象、可識(shí)別的圖形、圖像、視頻或動(dòng)畫,提高用戶對(duì)數(shù)據(jù)的深刻認(rèn)知與使用效率?!皵?shù)據(jù)可視化的作用在于格物致知,即從看見物體到獲取知識(shí)[1]”。而檔案數(shù)據(jù)涉及范圍廣,時(shí)間跨度大,關(guān)聯(lián)性強(qiáng),屬性內(nèi)容抽象龐雜、應(yīng)用頻繁,檔案數(shù)據(jù)的可視化應(yīng)用研究,對(duì)提高檔案數(shù)據(jù)利用效率、增強(qiáng)軍隊(duì)檔案工作“為戰(zhàn)服務(wù)”能力,具有重要意義。
隨著信息技術(shù)的高速發(fā)展,各類數(shù)據(jù)呈爆炸趨勢(shì)增長(zhǎng)。Tianhan Zhang認(rèn)為,面對(duì)龐雜的數(shù)據(jù),如果可以直接將數(shù)據(jù)轉(zhuǎn)化為圖像,則分析將會(huì)很容易[2]。Jake R Carlson等早在2011年就已將數(shù)據(jù)可視化能力作為數(shù)據(jù)素養(yǎng)核心能力體系之一對(duì)待,更加凸顯出數(shù)據(jù)可視化的重要性[3]。
張蒞坤認(rèn)為:“數(shù)據(jù)可視化將數(shù)據(jù)的各個(gè)屬性值以多維數(shù)據(jù)的形式表示,使人們可以從不同的維度觀察數(shù)據(jù),從而對(duì)數(shù)據(jù)進(jìn)行更深入的觀察和分析。”[4]
程佳軍、游宏梁等認(rèn)為,數(shù)據(jù)可視化既是數(shù)據(jù)分析過(guò)程的支撐工具,又是數(shù)據(jù)應(yīng)用的重要出口,是數(shù)據(jù)分析的重要支撐技術(shù)[5]。
目前,檔案數(shù)據(jù)在利用及分析過(guò)程中存在檢索輸出數(shù)據(jù)量大、關(guān)聯(lián)性不強(qiáng),篩選和展示條件單一等問(wèn)題,不利于檔案的高效利用。筆者認(rèn)為,數(shù)據(jù)可視化是一種成熟的數(shù)據(jù)分析工具,能夠?qū)㈩愋投鄻?、結(jié)構(gòu)各異、分散復(fù)雜的數(shù)據(jù)表達(dá)轉(zhuǎn)換為直觀、個(gè)性化的圖像表達(dá),有效提高檔案信息分析利用效率。
目前,軍隊(duì)檔案數(shù)據(jù)在轉(zhuǎn)化為編研利用成果的過(guò)程中仍采用如圖1所示的原始方式,該方式僅執(zhí)行數(shù)據(jù)檢索指令,用戶需要在眾多檢索結(jié)果中自行逐一篩選并統(tǒng)計(jì)自己所需內(nèi)容。該種方式既降低使用者的使用體驗(yàn),又易造成數(shù)據(jù)錯(cuò)漏,降低檔案利用效率。(圖1)
圖1 檔案利用的過(guò)程
軍隊(duì)檔案數(shù)據(jù)可視化主要應(yīng)用于檔案數(shù)據(jù)編研利用的“輸出”環(huán)節(jié),能夠有效輔助使用者作出相應(yīng)決策。如圖2所示,使用者通過(guò)將適宜的可視化工具與個(gè)性化需求相結(jié)合,建立檔案數(shù)據(jù)分類檢索與關(guān)聯(lián)分析模型,對(duì)檔案數(shù)據(jù)進(jìn)行深入分析利用,可有效提高編研利用工作效率。(圖2)
圖2 檔案可視化利用的過(guò)程
其中,實(shí)現(xiàn)軍隊(duì)檔案數(shù)據(jù)可視化有三個(gè)關(guān)鍵步驟:
其一,系統(tǒng)篩選,即檔案數(shù)據(jù)清洗。其主要目的是根據(jù)檔案的利用目標(biāo),對(duì)異構(gòu)、分散的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化、標(biāo)準(zhǔn)化處理,為最終檔案數(shù)據(jù)的可視化呈現(xiàn)提供數(shù)據(jù)質(zhì)量支撐。
其二,可視化轉(zhuǎn)換,即檔案數(shù)據(jù)可視化展現(xiàn)形式的匹配。其主要目的是根據(jù)數(shù)據(jù)含義及用戶可視化呈現(xiàn)需求匹配最終的可視化展現(xiàn)形式,也決定了檔案數(shù)據(jù)含義表現(xiàn)得是否充分,是否便于用戶深刻理解。
其三,可視化呈現(xiàn),這是檔案數(shù)據(jù)可視化應(yīng)用過(guò)程中系統(tǒng)在前臺(tái)輸出的最終結(jié)果,能夠有效提升檔案數(shù)據(jù)價(jià)值,幫助用戶對(duì)檔案數(shù)據(jù)本質(zhì)含義的理解,提高分析利用效率。
2.1 過(guò)濾清洗冗余數(shù)據(jù)
在輸入檢索條件檢索相關(guān)檔案數(shù)據(jù)時(shí),通過(guò)使用數(shù)據(jù)可視化工具,將符合檢索條件的檔案數(shù)據(jù)按照相關(guān)性大小進(jìn)行可視化處理,用戶只需根據(jù)需求進(jìn)行選擇即可。這不僅降低了查詢響應(yīng)時(shí)間,還能為下一步檔案編研利用打下良好基礎(chǔ),避免人工檢索可能造成的錯(cuò)漏。
2.2 加強(qiáng)檔案資源聚合
用戶可使用數(shù)據(jù)可視化工具,將檔案信息數(shù)據(jù)進(jìn)行提取、分類后,存入檔案知識(shí)數(shù)據(jù)庫(kù)中,再結(jié)合用戶需求,對(duì)檔案信息進(jìn)行分析和挖掘[6],使其按照需求以圖像、視頻等方式呈現(xiàn)。如圖3所示,數(shù)據(jù)可視化使零散的檔案信息被重新整合,數(shù)據(jù)間關(guān)聯(lián)性和聚合度顯著增強(qiáng),不僅能夠提升檔案信息的交互性,充分挖掘檔案信息資源,還能根據(jù)用戶具體需求實(shí)現(xiàn)檔案信息個(gè)性化挖掘“一人一策”,最大程度發(fā)揮檔案利用效能。(圖3)
圖3 數(shù)據(jù)可視化應(yīng)用于檔案資源聚合
2.3 提升服務(wù)保障能力
對(duì)檔案信息數(shù)據(jù)進(jìn)行可視化處理的最終目的是提升檔案服務(wù)保障能力。隨著軍隊(duì)檔案服務(wù)保障要求向“為戰(zhàn)服務(wù)”的方向發(fā)展,軍隊(duì)檔案管理與利用也應(yīng)進(jìn)一步提升技術(shù)水平。如圖4所示,數(shù)據(jù)可視化工具能夠應(yīng)用于檔案管理全壽命周期,在檔案管理的各個(gè)階段對(duì)檔案現(xiàn)狀和檔案數(shù)據(jù)分析利用進(jìn)行有效控制。(圖4)
圖4 數(shù)據(jù)可視化應(yīng)用于檔案管理全壽命過(guò)程
數(shù)據(jù)可視化工具要在軍隊(duì)檔案領(lǐng)域持續(xù)深度有效應(yīng)用,仍需把握好以下幾個(gè)方面問(wèn)題:
數(shù)據(jù)可視化工具能否在軍隊(duì)檔案利用過(guò)程中發(fā)揮最大效能,取決于數(shù)據(jù)質(zhì)量的高低。這需要對(duì)檔案數(shù)據(jù)在其產(chǎn)生到歸檔的全過(guò)程進(jìn)行嚴(yán)格的質(zhì)量管控。
在檔案形成環(huán)節(jié),應(yīng)當(dāng)注重檔案質(zhì)量管控,確保歸檔文件主體完整、內(nèi)容可靠、能夠長(zhǎng)期保存;在檔案征集管理環(huán)節(jié),應(yīng)當(dāng)注重檔案主體質(zhì)量管控,確保檔案資料鑒定準(zhǔn)確、保管妥當(dāng),數(shù)字化檔案數(shù)據(jù)符合標(biāo)準(zhǔn)、要素齊全;在檔案服務(wù)利用環(huán)節(jié),應(yīng)注重檔案元數(shù)據(jù)管控,確保檔案數(shù)據(jù)格式合規(guī)、調(diào)用便利。
檔案部門應(yīng)當(dāng)加強(qiáng)檔案數(shù)據(jù)管理,保證數(shù)據(jù)可視化工具能在數(shù)據(jù)保密安全的前提下為軍隊(duì)各項(xiàng)工作任務(wù)提供最大范圍、最大程度的支撐保障。主要應(yīng)從以下四個(gè)方面考慮:
(1)精準(zhǔn)定密。軍隊(duì)檔案涉密程度深,涉及領(lǐng)域廣。為確保檔案能夠真正實(shí)現(xiàn)高效利用服務(wù),避免因失泄密導(dǎo)致的決策失誤、保障失利,檔案管理人員必須結(jié)合檔案原密級(jí)和相關(guān)規(guī)章制度,嚴(yán)格精準(zhǔn)鑒定被利用檔案密級(jí),嚴(yán)防在檔案數(shù)據(jù)可視化服務(wù)利用過(guò)程中因定密失誤而造成的失泄密問(wèn)題。
(2)跨網(wǎng)安全。從保密安全的角度出發(fā),目前各軍隊(duì)檔案館間信息數(shù)據(jù)利用形式仍為物理隔離、單向傳送,這種模式為檔案數(shù)據(jù)跨單位數(shù)據(jù)調(diào)用帶來(lái)不便。隨著軍隊(duì)檔案利用模式逐漸向一體化、共享型方向發(fā)展,軍隊(duì)檔案信息數(shù)據(jù)未來(lái)將逐漸走出局域網(wǎng)限制,轉(zhuǎn)化為跨網(wǎng)共享模式。該模式下,需格外注重?cái)?shù)據(jù)傳輸安全,可使用網(wǎng)閘等跨網(wǎng)信息數(shù)據(jù)交換設(shè)備,保證在不同網(wǎng)絡(luò)安全區(qū)之間、物理隔離網(wǎng)絡(luò)之間實(shí)現(xiàn)數(shù)據(jù)的安全傳輸[7],確保聯(lián)合作戰(zhàn)下檔案數(shù)據(jù)可視化工具能夠科學(xué)運(yùn)行、安全保障。
(3)授權(quán)分享。為在方便利用的同時(shí)保障本單位檔案信息數(shù)據(jù)安全,提高檔案數(shù)據(jù)挖掘分析和可視化呈現(xiàn)質(zhì)量,檔案管理單位可在本單位共享平臺(tái)上對(duì)不同檔案利用人員和單位賦予相應(yīng)的檔案使用權(quán)限,在保證檔案信息數(shù)據(jù)充分利用前提下,對(duì)檔案信息數(shù)據(jù)調(diào)用情況進(jìn)行把關(guān),對(duì)被利用檔案數(shù)據(jù)及時(shí)回收,在提高檔案利用效果的同時(shí)保證檔案信息數(shù)據(jù)的保密安全。
(4)日志記錄。檔案信息數(shù)據(jù)在使用時(shí)應(yīng)做好數(shù)據(jù)調(diào)用、數(shù)據(jù)管理、身份賦權(quán)等方面的日志記錄,嚴(yán)格確保數(shù)據(jù)安全,為數(shù)據(jù)信息追溯提供依據(jù)。
檔案數(shù)據(jù)可視化工具應(yīng)當(dāng)不斷迭代更新以適應(yīng)任務(wù)需求和科技水平的不斷變化,在此期間應(yīng)處理好以下幾個(gè)方面的關(guān)系:
(1)處理好通用性與專業(yè)性的關(guān)系
檔案數(shù)據(jù)可視化工具在迭代更新期間,首先應(yīng)當(dāng)保證應(yīng)用的通用性,使不同角色的用戶都能夠使用該應(yīng)用處理大部分常見任務(wù),但針對(duì)各軍兵種的不同專業(yè)特色,也應(yīng)在此基礎(chǔ)之上兼顧好應(yīng)用的專業(yè)性,按照不同單位、不同任務(wù)群體量身設(shè)計(jì)不同的特色應(yīng)用模塊,以擴(kuò)大應(yīng)用用戶覆蓋面,保障各單位不同的任務(wù)需求。
(2)處理好繼承性與創(chuàng)新性的關(guān)系
應(yīng)不斷收集用戶使用體驗(yàn)數(shù)據(jù),結(jié)合前沿技術(shù)發(fā)展對(duì)應(yīng)用功能和使用體驗(yàn)不斷升級(jí),在保留用戶反饋良好的功能的基礎(chǔ)之上,及時(shí)做好刪繁就簡(jiǎn)、去粗取精的工作,并及時(shí)引入新技術(shù)、新算法,不斷推陳出新,根據(jù)用戶需求推出新的應(yīng)用模塊,以適應(yīng)用戶需求、科技發(fā)展等日新月異的變化。
(3)處理好便捷性與安全性的關(guān)系
檔案數(shù)據(jù)可視化工具能夠使數(shù)據(jù)分析基礎(chǔ)較差的檔案工作人員也可以輕松對(duì)檔案數(shù)據(jù)信息進(jìn)行分析挖掘,因此用戶前臺(tái)操作便捷、使用門檻低。但由此也帶來(lái)了數(shù)據(jù)安全方面的問(wèn)題,增加了失泄密風(fēng)險(xiǎn)。在應(yīng)用迭代更新的過(guò)程中,應(yīng)當(dāng)對(duì)身份驗(yàn)證、身份賦權(quán)、日志記錄、數(shù)據(jù)維護(hù)和數(shù)據(jù)提取等方面做好維護(hù)升級(jí),全力保障后臺(tái)檔案數(shù)據(jù)安全不被泄露。
本文從分析數(shù)據(jù)可視化技術(shù)應(yīng)用現(xiàn)狀入手,探索了數(shù)據(jù)可視化工具在軍隊(duì)檔案管理中的應(yīng)用過(guò)程與作用,并對(duì)軍隊(duì)檔案可視化應(yīng)用需把握的問(wèn)題進(jìn)行了深入分析。今后,隨著科學(xué)技術(shù)的進(jìn)一步飛速發(fā)展,數(shù)據(jù)可視化工具必將成為軍隊(duì)檔案管理利用的重要手段之一。