国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

博物館大數(shù)據(jù)運(yùn)用初探
——以上海博物館數(shù)據(jù)中心項(xiàng)目為例

2017-08-10 11:49
關(guān)鍵詞:上海博物館藏品博物館

劉 健

(上海博物館,上海 200003)

?

·論 壇·

博物館大數(shù)據(jù)運(yùn)用初探
——以上海博物館數(shù)據(jù)中心項(xiàng)目為例

劉 健

(上海博物館,上海 200003)

對(duì)博物館數(shù)字化建設(shè)來(lái)說(shuō),大數(shù)據(jù)的運(yùn)用是一個(gè)無(wú)可避免的話題。為廣泛發(fā)揮大數(shù)據(jù)在博物館業(yè)務(wù)工作中的作用,從上海博物館的數(shù)據(jù)中心項(xiàng)目入手,闡述了數(shù)據(jù)中心如何在加強(qiáng)收集和存儲(chǔ)博物館各項(xiàng)數(shù)據(jù)同時(shí),緊緊圍繞數(shù)據(jù)采用智能化的分析手段,挖掘更加有價(jià)值的信息。利用大數(shù)據(jù)對(duì)業(yè)務(wù)進(jìn)行分析,加工形成有用的數(shù)據(jù)模型,進(jìn)而為形成博物館數(shù)字化運(yùn)營(yíng)管理體系打下了初步的基礎(chǔ)。本研究介紹了數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用情況,并提出了博物館大數(shù)據(jù)建設(shè)未來(lái)的發(fā)展思路。

博物館;大數(shù)據(jù);應(yīng)用;發(fā)展

0 引 言

在人類(lèi)從IT(Information Technology,信息技術(shù))時(shí)代走向DT(Data Technology,數(shù)據(jù)處理技術(shù))時(shí)代的過(guò)程中,大數(shù)據(jù)的運(yùn)用是一個(gè)無(wú)可避免的話題。DT的核心,是關(guān)于數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)新,也就是基于海量數(shù)據(jù)的價(jià)值挖掘?yàn)橹匦牡膭?chuàng)新體系及模式。對(duì)于博物館來(lái)說(shuō),通過(guò)對(duì)博物館所有的屬于文化歷史遺產(chǎn)一部分的藏品資源數(shù)據(jù)和公眾的文化需求數(shù)據(jù)及行為數(shù)據(jù)進(jìn)行收集、分析、挖掘和整合運(yùn)用,為博物館進(jìn)行公眾教育、文化傳播、科學(xué)研究、征集收藏等任務(wù)提供新的平臺(tái)、內(nèi)容和形式的支持,并為博物館的精準(zhǔn)化管理提供數(shù)據(jù)支持。同時(shí),從一定程度上增加博物館本身的收藏研究方向以及展示角度,塑造基于大數(shù)據(jù)基礎(chǔ)上的博物館工作新模式,也應(yīng)該是博物館數(shù)字化建設(shè)中的應(yīng)有之義。出于以上考慮,近期上海博物館開(kāi)始進(jìn)行有關(guān)博物館大數(shù)據(jù)應(yīng)用的嘗試,初步成果就是上海博物館數(shù)據(jù)中心的建立。

1 博物館大數(shù)據(jù)

“大數(shù)據(jù)”指的是一個(gè)體量特別大、數(shù)據(jù)類(lèi)別特別多的數(shù)據(jù)集,并且這樣的數(shù)據(jù)集已經(jīng)無(wú)法用傳統(tǒng)的數(shù)據(jù)庫(kù)工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理。提到博物館大數(shù)據(jù),首先會(huì)想到的是藏品數(shù)據(jù),或者更進(jìn)一步想到的是觀眾的數(shù)據(jù)。如果以宜粗不宜細(xì)為原則,以博物館的功能為導(dǎo)向,博物館數(shù)據(jù)可以分為以藏品為核心產(chǎn)生的藏品數(shù)據(jù)(包括藏品本體的編目數(shù)據(jù)、檢測(cè)數(shù)據(jù)、研究數(shù)據(jù)、保管使用數(shù)據(jù)等)、以博物館業(yè)務(wù)行為需要產(chǎn)生的管理數(shù)據(jù)(包括博物館日常管理流程所產(chǎn)生的數(shù)據(jù)、舉辦各類(lèi)活動(dòng)所匯聚的數(shù)據(jù)、與社會(huì)各方發(fā)生聯(lián)系所形成的數(shù)據(jù)等)、以博物館各類(lèi)傳播活動(dòng)、數(shù)字化傳播工具及其反饋機(jī)制所構(gòu)成的傳播數(shù)據(jù)和以觀眾行為為基礎(chǔ)所累積的觀眾數(shù)據(jù)這四大類(lèi)。在數(shù)據(jù)的力量日益受到重視的今天,數(shù)據(jù)能否成為博物館工作的推動(dòng)力,成為博物館躍上新臺(tái)階的助推器,則在很大程度上取決于對(duì)博物館大數(shù)據(jù)的運(yùn)用。1989年,美國(guó)管理學(xué)家羅素·艾可夫(Russell L Ackoff)在《從數(shù)據(jù)到智慧》(From Data to Wisdom)一文中,構(gòu)建了著名的DIKW體系[1],清楚闡述了數(shù)據(jù)(Data)、信息(Information)、知識(shí)(Knowledge)及智慧(Wisdom)之間的相互關(guān)系(圖1)。其中,最底層的數(shù)據(jù)是基礎(chǔ)的數(shù)值;越向上,數(shù)據(jù)的相關(guān)性就越強(qiáng),價(jià)值也相應(yīng)提升,而智慧的數(shù)據(jù)將擁有相當(dāng)?shù)恼Z(yǔ)義判定和一定的邏輯推理的能力。由此來(lái)觀察目前傳統(tǒng)博物館體系里常見(jiàn)的數(shù)據(jù)模式應(yīng)用,則會(huì)發(fā)現(xiàn)很少有處于DIKW體系的第三層和第四層的數(shù)據(jù)應(yīng)用。如何通過(guò)數(shù)據(jù)價(jià)值的提升,從而發(fā)現(xiàn)新的可供利用的視角和方向,正是努力的方向。通過(guò)10多年的數(shù)字化建設(shè)工作,上海博物館目前已積聚了并依然在不斷聚集著數(shù)量相當(dāng)可觀的數(shù)據(jù)。因此,如何將目前上海博物館已有的數(shù)據(jù)整合、挖掘并予以展示,是上海博物館數(shù)字化建設(shè)工作所應(yīng)面對(duì)的。上海博物館數(shù)據(jù)中心項(xiàng)目就是希望在將數(shù)據(jù)集中存儲(chǔ)的同時(shí)構(gòu)建出信息資源的體系,再按照一定的方式和規(guī)則對(duì)資源數(shù)據(jù)進(jìn)行歸并、處理、篩選,將數(shù)字資源匯集后管理利用并進(jìn)行初步的挖掘分析,然后采用新穎的多媒體交互展示方式對(duì)數(shù)據(jù)進(jìn)行展示,最終達(dá)到利用數(shù)據(jù)資源、數(shù)據(jù)分析、數(shù)據(jù)展示產(chǎn)生新的博物館效益的目的。此項(xiàng)目的主要難點(diǎn),就內(nèi)容來(lái)說(shuō),一是博物館大數(shù)據(jù)的收集整理和結(jié)構(gòu)化,二是博物館不同數(shù)據(jù)之間的智能關(guān)聯(lián)、挖掘和主題的推理;從技術(shù)上來(lái)說(shuō),則是在于智能無(wú)線數(shù)據(jù)采集技術(shù)、大數(shù)據(jù)分析與智能推理技術(shù)以及大數(shù)據(jù)可視化這幾個(gè)方面。從項(xiàng)目的完成情況看,這幾個(gè)難題在項(xiàng)目設(shè)計(jì)和實(shí)施過(guò)程中得到了較好地解決。

圖1 DIKW體系模型[1]

2 項(xiàng)目建設(shè)情況和創(chuàng)新點(diǎn)

項(xiàng)目要求以博物館觀眾服務(wù)和專(zhuān)業(yè)研究為導(dǎo)向,結(jié)合上海博物館運(yùn)行現(xiàn)狀,探索建立統(tǒng)一的數(shù)字資源管理和展示平臺(tái)的可能性。根據(jù)國(guó)家一級(jí)博物館運(yùn)行評(píng)估指標(biāo)體系,不斷優(yōu)化數(shù)字中心運(yùn)行評(píng)估指標(biāo)模型,模型涵蓋展館、展覽、藏品、觀眾等核心指標(biāo),描述博物館信息資源及其載體,構(gòu)建、挖掘、分析呈現(xiàn)信息資源及核心指標(biāo)之間的相互聯(lián)系,及時(shí)準(zhǔn)確在以上幾個(gè)方面反映出上海博物館實(shí)時(shí)運(yùn)行狀況。為上海博物館今后的精準(zhǔn)化管理、大數(shù)據(jù)挖掘以及可視化展示工作的進(jìn)一步發(fā)展打下基礎(chǔ)。系統(tǒng)要求具有與上海博物館現(xiàn)有應(yīng)用系統(tǒng)的信息共享與管理,具有高度的集成性及可視化的信息圖展示功能,同時(shí)留有一定冗余,能滿足今后系統(tǒng)不斷更新升級(jí)的需要。由此,從數(shù)據(jù)的視角去重構(gòu)博物館的數(shù)字運(yùn)用和管理是這一項(xiàng)工作的重點(diǎn):系統(tǒng)之間的暢通聯(lián)接,各類(lèi)價(jià)值數(shù)據(jù)的清洗和挖掘,采集觀眾行為數(shù)據(jù)、建立量化的評(píng)估數(shù)據(jù)模型的研究,這些都是本次項(xiàng)目工作的核心。

數(shù)據(jù)中心是一個(gè)綜合性的管理展示平臺(tái),需要將上海博物館現(xiàn)有內(nèi)外網(wǎng)的系統(tǒng)整合到統(tǒng)一的平臺(tái)上,因此在設(shè)計(jì)之初就必須要充分考慮到各個(gè)系統(tǒng)間直接的接口調(diào)用與整合問(wèn)題。在設(shè)計(jì)過(guò)程中充分考慮各連接系統(tǒng)接口所涉及的應(yīng)用擴(kuò)展情況,給各個(gè)接口定義web service接口規(guī)范,并采用目前業(yè)內(nèi)比較廣泛使用的XML、EXCEL等格式數(shù)據(jù)作為主要的數(shù)據(jù)傳輸載體來(lái)進(jìn)行數(shù)據(jù)交換,讓需要展示的系統(tǒng)都有統(tǒng)一的傳輸格式傳送到顯示大屏上來(lái)。同時(shí)也注重?cái)?shù)據(jù)傳輸過(guò)程中數(shù)據(jù)的中斷和反饋機(jī)制,以保證了數(shù)據(jù)的穩(wěn)定性。另外,在整體頁(yè)面展示的設(shè)計(jì)上也是完全依照屏幕的大小和尺寸來(lái)量身定做,使設(shè)計(jì)的頁(yè)面風(fēng)格、布局與大屏的整體相協(xié)調(diào)。

這一項(xiàng)目包含了多個(gè)系統(tǒng)的功能,功能設(shè)計(jì)見(jiàn)圖2。具體的功能包括:

圖2 數(shù)據(jù)中心首頁(yè)

1) 觀眾流量展示。實(shí)時(shí)顯示到館的總?cè)舜螖?shù)、每個(gè)入口人數(shù)、每個(gè)出口人數(shù)。2)網(wǎng)站訪問(wèn)狀況的展示。包括實(shí)時(shí)的點(diǎn)擊量、訪問(wèn)來(lái)源分布等。3)藏品數(shù)據(jù)的展示。包括博物館藏品總體情況,以及藏品類(lèi)型、年代、庫(kù)房等分類(lèi)統(tǒng)計(jì);顯示博物館藏品出入庫(kù)的一般情況,如藏品修復(fù)、保護(hù)等。同時(shí)涵蓋物聯(lián)監(jiān)測(cè)展示,顯示本館內(nèi)物聯(lián)網(wǎng)監(jiān)測(cè)各項(xiàng)運(yùn)行狀態(tài)。4)機(jī)房設(shè)備運(yùn)行展示。顯示網(wǎng)絡(luò)、主機(jī)、安全等設(shè)備運(yùn)行狀態(tài)。5)明清家具館AP接入人數(shù)展示。實(shí)時(shí)展示當(dāng)前明清家具館內(nèi)的觀眾數(shù)量情況和他們的移動(dòng)軌跡,以及在家具館停留15min和30min以上的人數(shù),以及具體熱門(mén)展品前人數(shù)累計(jì)和時(shí)間累計(jì)的情況等(圖3)。6)具體某一特展的展示。除了相關(guān)特展的基本情況顯示外,還通過(guò)比較有特展和無(wú)特展時(shí)候人員的變化狀況來(lái)試圖探索其中的規(guī)律性。另外,還能關(guān)聯(lián)了解特展期間網(wǎng)站、APP、微信等傳播系統(tǒng)上的關(guān)注人員的變化情況。7)單一文物的展示。在基于藏品基本信息的介紹的前提下,將具體文物的地理信息、功能詮釋、修復(fù)的數(shù)據(jù)進(jìn)行了有效的整合,使單件藏品的介紹在時(shí)間和空間上都得到了有效的延伸;并通過(guò)數(shù)據(jù)挖掘,將附著于藏品上的顯性信息和隱性信息以多媒體形式展示出來(lái)。該項(xiàng)目的創(chuàng)新點(diǎn)主要表現(xiàn)在以下4個(gè)方面。

圖3 明清家具館實(shí)時(shí)數(shù)據(jù)顯示

2.1 基于網(wǎng)狀可自我量化的數(shù)據(jù)模型

結(jié)合博物館運(yùn)行現(xiàn)狀設(shè)計(jì)了螺旋式上升評(píng)估指標(biāo)模型方案,整個(gè)項(xiàng)目的數(shù)據(jù)涵蓋展館、展覽、藏品、觀眾、活動(dòng)、微環(huán)境等核心指標(biāo),描述博物館信息資源及其載體,構(gòu)建、挖掘、分析呈現(xiàn)信息資源及核心指標(biāo)之間的相互聯(lián)系,及時(shí)準(zhǔn)確、全面綜合地反映了上海博物館實(shí)時(shí)運(yùn)行狀況[2](圖4)。同時(shí)利用信息可視化手段,提供個(gè)性化的觀眾分析報(bào)告、藏品統(tǒng)計(jì)報(bào)告、設(shè)備運(yùn)行報(bào)告等新形式的服務(wù),包括觀眾流量可視化展示、網(wǎng)站訪問(wèn)可視化展示、藏品數(shù)據(jù)可視化展示、物聯(lián)監(jiān)測(cè)可視化展示、設(shè)備運(yùn)行可視化展示。另外還提供觀眾基礎(chǔ)屬性分析、觀眾信息反饋分析、展區(qū)觀眾行為分析、綜合評(píng)估的設(shè)計(jì)與開(kāi)發(fā)。

2.2 基于時(shí)空數(shù)據(jù)的服務(wù)創(chuàng)新

大數(shù)據(jù)之所以強(qiáng)大,還因?yàn)樗峁┝诵碌挠^察角度和新的研究方向。例如,就觀眾數(shù)據(jù)而言,首先,觀眾服務(wù)是一款典型雙向的數(shù)據(jù)應(yīng)用,用戶既是數(shù)據(jù)消費(fèi)者(使用導(dǎo)覽等信息),又是數(shù)據(jù)生產(chǎn)者(產(chǎn)生用戶行為信息),兩者同等重要。其次,這是

圖4 博物館數(shù)據(jù)整體模型框架(第一級(jí))

一項(xiàng)高頻度的數(shù)據(jù)應(yīng)用,按博物館的人流量及用戶游覽時(shí)間,會(huì)在每天的參觀周期內(nèi)產(chǎn)生大量的數(shù)據(jù),這個(gè)數(shù)據(jù)既會(huì)有宏觀面的大數(shù)據(jù),也會(huì)有體現(xiàn)個(gè)性化的小數(shù)據(jù)。第三,用戶是分層的,不同的用戶感興趣的信息數(shù)據(jù)是存在差異化的?;跀?shù)據(jù)的復(fù)雜性,開(kāi)發(fā)的系統(tǒng)使用空間信息為主線對(duì)數(shù)據(jù)進(jìn)行組織構(gòu)造,以圖層的模式將數(shù)據(jù)的接入或表現(xiàn)進(jìn)行劃分:底圖即為博物館物理的樓層圖;不同的圖層代表了不同的信息視圖邏輯,可接入不同的數(shù)據(jù)源或數(shù)據(jù)類(lèi)型,也可能會(huì)面向不同的用戶數(shù)據(jù)需求提供完整的功能邏輯;POI(point of interest,信息點(diǎn))以矢量形式標(biāo)注詳細(xì)數(shù)據(jù),也可用于動(dòng)態(tài)數(shù)據(jù)的標(biāo)注,如實(shí)時(shí)流動(dòng)的參觀者位置。圖層式的模式不僅使數(shù)據(jù)視圖更直觀,用戶的使用操作更便捷,還易于數(shù)據(jù)擴(kuò)展和數(shù)據(jù)切分,今后還可通過(guò)圖層增加團(tuán)隊(duì)視圖等(圖5)。

圖5 博物館觀眾導(dǎo)覽系統(tǒng)的主要圖層

2.3 基于多元價(jià)值的數(shù)據(jù)挖據(jù)

面對(duì)龐雜的原始數(shù)據(jù),系統(tǒng)采用了HDFS(The Hadoop Distributed File System,分布式文件系統(tǒng))、MapReduce(做大數(shù)據(jù)處理軟件框架)、Hive(數(shù)據(jù)倉(cāng)庫(kù)工具)等中間件構(gòu)建了一套完善的大數(shù)據(jù)系統(tǒng),通過(guò)對(duì)定位系統(tǒng)、App、環(huán)境傳感(物聯(lián)網(wǎng))、互聯(lián)網(wǎng)的數(shù)據(jù)進(jìn)行清洗、融合和轉(zhuǎn)換處理,形成了HDFS的數(shù)據(jù)集,提供多樣化的大數(shù)據(jù)服務(wù),處理過(guò)程見(jiàn)圖6。

圖6 源數(shù)據(jù)分析處理圖

目前,系統(tǒng)已經(jīng)在觀眾行為大數(shù)據(jù)集的基礎(chǔ)上實(shí)現(xiàn)對(duì)觀眾反饋、參觀熱點(diǎn)分析、停留時(shí)間、關(guān)注內(nèi)容、社交行為進(jìn)行綜合分析。此外還能提供:觀眾分布及軌跡分析、展館區(qū)域熱圖、重點(diǎn)展位詳細(xì)分析、現(xiàn)場(chǎng)駐留及關(guān)注度分析等;舉辦展覽的線下參觀數(shù)據(jù)(平日數(shù)、實(shí)時(shí)人數(shù)、學(xué)生數(shù)等)、線上數(shù)據(jù)(網(wǎng)站瀏覽量、網(wǎng)站預(yù)約量、微信瀏覽量、微信關(guān)注量、APP下載量等)等。通過(guò)大數(shù)據(jù)分析可以發(fā)現(xiàn)其中的規(guī)律、關(guān)聯(lián),甚至可以推理用戶的行為模式。

2.4 基于國(guó)家標(biāo)準(zhǔn)的評(píng)估指標(biāo)體系

為了進(jìn)一步發(fā)揮數(shù)據(jù)的作用,利用大數(shù)據(jù)分析及其可視化工具有效地從龐雜的業(yè)務(wù)數(shù)據(jù)中提煉出數(shù)據(jù)內(nèi)涵,發(fā)掘內(nèi)在關(guān)聯(lián)。根據(jù)國(guó)家制訂的《一級(jí)博物館運(yùn)行評(píng)估指標(biāo)體系》,結(jié)合博物館運(yùn)行情況提供不同的評(píng)估指標(biāo)模型設(shè)計(jì)方案。比如根據(jù)評(píng)估指標(biāo)中的陳列、科研、文化交流、數(shù)字化、文創(chuàng)、教育活動(dòng)及媒體關(guān)注這樣幾個(gè)大的指標(biāo)項(xiàng),為單個(gè)藏品做了一個(gè)來(lái)自社會(huì)維度的藏品社會(huì)利用評(píng)估體系的模型,根據(jù)藏品利用中不同指標(biāo)的權(quán)重、屬性、數(shù)據(jù)給出了評(píng)價(jià)的量化數(shù)值,嘗試采用從量化數(shù)據(jù)角度來(lái)展示藏品的社會(huì)效益,雖然未必完全準(zhǔn)確和有效,但是通過(guò)不斷的摸索和校正,相信數(shù)據(jù)的價(jià)值會(huì)逐步顯現(xiàn)。總之,本項(xiàng)目通過(guò)大數(shù)據(jù)分析與可視化技術(shù)的運(yùn)用,使之成為博物館深化應(yīng)用、提升應(yīng)用層次、強(qiáng)化管理能力的有效手段。數(shù)據(jù)中心在加強(qiáng)收集和存儲(chǔ)博物館各項(xiàng)數(shù)據(jù)同時(shí),還需緊緊圍繞數(shù)據(jù)采用智能化的分析手段,挖掘更加有價(jià)值的信息。并利用大數(shù)據(jù)對(duì)業(yè)務(wù)進(jìn)行分析,加工形成有用的數(shù)據(jù),進(jìn)而為形成博物館數(shù)字化運(yùn)營(yíng)管理體系打下了初步的基礎(chǔ)(圖7)。

圖7 單個(gè)藏品的可視化數(shù)據(jù)和評(píng)估模型

3 博物館大數(shù)據(jù)建設(shè)未來(lái)的發(fā)展

大數(shù)據(jù)技術(shù)必將給博物館帶來(lái)深刻的影響,大數(shù)據(jù)技術(shù)及思維也將改變傳統(tǒng)博物館的存在模式和工作理念,改變博物館業(yè)務(wù)的思路和流程,突破博物館對(duì)資源的壟斷。未來(lái)的博物館大數(shù)據(jù)之路還很漫長(zhǎng),這條路該如何走,以下3點(diǎn)是未來(lái)發(fā)展必須考慮的,也將是進(jìn)行數(shù)據(jù)中心后續(xù)建設(shè)中所應(yīng)該有所作為的。

3.1 數(shù)據(jù)結(jié)構(gòu)知識(shí)化

當(dāng)博物館數(shù)字化建設(shè)開(kāi)始發(fā)生從以系統(tǒng)為中心到以用戶為中心的轉(zhuǎn)變時(shí),數(shù)據(jù)的知識(shí)化問(wèn)題就被自然地提了出來(lái)。所謂知識(shí)化首先就是將雜亂的數(shù)據(jù)改變成結(jié)構(gòu)化的實(shí)體知識(shí),甚至可以順著知識(shí)圖譜探索建構(gòu)更深入、廣泛和完整的知識(shí)體系,進(jìn)而激發(fā)用戶發(fā)現(xiàn)意料之外的知識(shí)。換而言之,真正的大數(shù)據(jù)應(yīng)用應(yīng)該體現(xiàn)在數(shù)據(jù)挖掘的深度。正如宋新潮先生所說(shuō)[3]:“把過(guò)去、現(xiàn)在以及未來(lái)的大量文物數(shù)據(jù),整合為有機(jī)知識(shí)體系,提煉為可高效利用的知識(shí)。從而更好地實(shí)現(xiàn)博物館的教育和研究功能,使博物館真正成為‘虛擬世界的真實(shí)性源泉’和數(shù)字時(shí)代知識(shí)的創(chuàng)造、生產(chǎn)機(jī)構(gòu)。”如果說(shuō)藏品的本體數(shù)據(jù)也就是它的基本信息還構(gòu)不成大數(shù)據(jù)研究的條件,但若能與公眾大數(shù)據(jù)以及其他社會(huì)類(lèi)數(shù)據(jù),比如像各類(lèi)的學(xué)術(shù)性平臺(tái)數(shù)據(jù)進(jìn)行智能關(guān)聯(lián),有效整合,形成關(guān)聯(lián)數(shù)據(jù),就能夠形成資源挖掘和主題推理的條件,從而能夠使博物館專(zhuān)業(yè)人員在大數(shù)據(jù)的條件下便捷、有效地利用這些資源。這里的關(guān)鍵在于藏品知識(shí)庫(kù)的建立。什么是藏品知識(shí)庫(kù),它與現(xiàn)在一般所用的藏品管理系統(tǒng)還有所不同。最大的特點(diǎn)在于它能為一件藏品建立比較完整的知識(shí)體系,更注重關(guān)聯(lián)性而非僅是結(jié)果。也就是說(shuō),將基于數(shù)據(jù)的應(yīng)用發(fā)展到基于知識(shí)的應(yīng)用。當(dāng)然,構(gòu)建并非孤立進(jìn)行。在知識(shí)庫(kù)的構(gòu)建過(guò)程中,需要實(shí)現(xiàn)多數(shù)據(jù)源的知識(shí)融合。比如通過(guò)藏品數(shù)據(jù)的原始積累,再將文物藏品的本體數(shù)據(jù)與該文物的海量的、多源的、異構(gòu)的數(shù)據(jù)(如考古、地理、環(huán)境、測(cè)試、文獻(xiàn)、學(xué)術(shù)研究),通過(guò)自然語(yǔ)言處理、大數(shù)據(jù)分析以及計(jì)量學(xué),軟件科學(xué)等組織起來(lái),同時(shí)也可與不同格式、不同結(jié)構(gòu)的數(shù)據(jù)間建立關(guān)聯(lián)。如文物藏品的文字信息、二維與三維信息、影像甚至聲音之間的相互聯(lián)系、附屬關(guān)系等;并在不同的應(yīng)用模型間相互映射和自由索引切換,最終形成能夠支撐文物藏品研究的知識(shí)呈現(xiàn)體系。這種聯(lián)系和模型疊加,既是博物館數(shù)據(jù)資源整合的基礎(chǔ),也是博物館數(shù)據(jù)應(yīng)用的重要支撐。國(guó)際上也已經(jīng)有一些這方面的嘗試,也有了不少有效的工具。其重要的一個(gè)網(wǎng)絡(luò)基礎(chǔ)就是語(yǔ)義網(wǎng)的應(yīng)用。比如大英博物館的探索空間(research space)就是基于語(yǔ)義網(wǎng)的一個(gè)成功嘗試。而這一切,都離不開(kāi)關(guān)聯(lián)數(shù)據(jù)和數(shù)據(jù)的開(kāi)放。

3.2 數(shù)據(jù)資源開(kāi)放化

目前社會(huì)上對(duì)博物館的資源開(kāi)放的呼聲很高,尤其是藏品資源。但在實(shí)體資源還不具備開(kāi)放的條件下,加快開(kāi)放數(shù)字資源是緩解這一需求的有效方法之一,也是博物館進(jìn)行數(shù)字化建設(shè)的本質(zhì)所在。當(dāng)然,即使是數(shù)字資源的開(kāi)放也不可能一蹴而就,還是會(huì)有一個(gè)過(guò)程。但在學(xué)術(shù)應(yīng)用領(lǐng)域,這一過(guò)程實(shí)在有加快的必要。比如前面所提到的數(shù)據(jù)關(guān)聯(lián)。要發(fā)布關(guān)聯(lián)數(shù)據(jù),按照互聯(lián)網(wǎng)的發(fā)明人——Berners-Lee T[4]的說(shuō)法,就應(yīng)遵循4個(gè)原則:1)使用URI作為任何事物的標(biāo)識(shí)名稱;2)使用HTTP URI (網(wǎng)絡(luò)上的統(tǒng)一資源標(biāo)識(shí)符)使任何人都可以訪問(wèn)這些標(biāo)識(shí)名稱;3)當(dāng)有人訪問(wèn)某個(gè)標(biāo)識(shí)名稱時(shí),提供有用的信息;4)盡可能提供相關(guān)的URI,以使人們可以發(fā)現(xiàn)更多的事物。其實(shí)質(zhì)就是開(kāi)放數(shù)據(jù),如果沒(méi)有數(shù)據(jù)的開(kāi)放,所謂的有機(jī)知識(shí)體系的形成就是空中樓閣。如果說(shuō)數(shù)據(jù)采集是博物館大數(shù)據(jù)應(yīng)用的物質(zhì)基礎(chǔ),那么數(shù)據(jù)開(kāi)放就是它的行為準(zhǔn)則,而這更多地取決于博物館人思維的轉(zhuǎn)變。早在2002年,圖書(shū)情報(bào)界就達(dá)成了布達(dá)佩斯開(kāi)放存取先導(dǎo)計(jì)劃(BOAI,Budapest Open Access Initiative),要求實(shí)現(xiàn)對(duì)學(xué)術(shù)期刊資源的開(kāi)放存取。由此計(jì)劃逐漸衍生出了開(kāi)放數(shù)據(jù)的概念。與開(kāi)放存取一樣,開(kāi)放數(shù)據(jù)的目的也是消除共享障礙,賦予用戶的使用權(quán)利。即如開(kāi)放數(shù)據(jù)手冊(cè)[5]所言:“開(kāi)放數(shù)據(jù)是一類(lèi)可以被任何人免費(fèi)使用、再利用、再分發(fā)的數(shù)據(jù)——在其限制上,頂多是要求署名和使用類(lèi)似的協(xié)議再分發(fā)”。但與一般的共享概念不同的是開(kāi)放數(shù)據(jù)更注重對(duì)數(shù)據(jù)的“再利用、再分發(fā)”,即通過(guò)對(duì)數(shù)據(jù)的聚集、整合,從中實(shí)現(xiàn)數(shù)據(jù)價(jià)值的“增值”:一是數(shù)據(jù)通過(guò)開(kāi)放完成了二次生產(chǎn),從而使應(yīng)用價(jià)值增加;二是從獲取者的角度來(lái)看,有更多的人能夠得到這些開(kāi)放數(shù)據(jù)及其傳遞出的價(jià)值,由此產(chǎn)生信息共享空間的增值。當(dāng)然,更為重要的是,在這一理念的引導(dǎo)下,博物館可以突破本館和本行業(yè)的限制,實(shí)現(xiàn)館藏資源與外部資源的互聯(lián),從而使信息流的采集、整理、發(fā)布與使用者的利用、收藏、互動(dòng)之間能夠形成一個(gè)閉合的數(shù)據(jù)資源鏈,且不同的結(jié)點(diǎn)都可以進(jìn)行資源的共享。在博物館界,開(kāi)放數(shù)據(jù)在歐美也有所使用,如上文已介紹的大英博物館,還有歐盟的Europeana項(xiàng)目等。但在國(guó)內(nèi)還很少見(jiàn)到有這方面的應(yīng)用。

3.3 數(shù)據(jù)研究平臺(tái)化

在博物館數(shù)字化建設(shè)的過(guò)程中,數(shù)字化研究始終是處于被遺忘的角落?;诰W(wǎng)絡(luò)在一個(gè)開(kāi)放的學(xué)術(shù)圈內(nèi)進(jìn)行協(xié)作研究,是數(shù)字化時(shí)代知識(shí)創(chuàng)新的一個(gè)重要機(jī)制和運(yùn)作形式。實(shí)際上,在博物館累積了龐大的數(shù)字資源和能量以后,如果在具備了前面所述知識(shí)化和開(kāi)放化的前提下,博物館應(yīng)該考慮嘗試以數(shù)字資源為主要對(duì)象的數(shù)字化研究工作,建立起以協(xié)作研究為主的科研數(shù)字平臺(tái)。即根據(jù)博物館科研活動(dòng)的特點(diǎn),基于網(wǎng)絡(luò)化管理,以數(shù)字資源的整合、共享、科研工具的共有為前提,以數(shù)字化研究手段的普遍應(yīng)用為基礎(chǔ)而形成的一個(gè)開(kāi)放式的研究平臺(tái)。平臺(tái)將建立藏品研究數(shù)據(jù)庫(kù)(知識(shí)庫(kù))及相應(yīng)的查詢接口,按照數(shù)字化的格式編制成相互關(guān)聯(lián)的數(shù)據(jù)集合,其搜索模塊將直接檢索到與研究相關(guān)的知識(shí)單元,如概念、表格、數(shù)據(jù)、事件、多媒體等。未來(lái)的科研數(shù)字平臺(tái)將集科研、資源、管理于一體。其中,博物館科研人員無(wú)疑是系統(tǒng)運(yùn)行的主導(dǎo),通過(guò)角色劃分或權(quán)限分配來(lái)規(guī)范不同人員的操作內(nèi)容和范圍;以科研人員的研究特點(diǎn)來(lái)思考系統(tǒng)功能架構(gòu)的構(gòu)成,系統(tǒng)將支持各類(lèi)數(shù)字化的研究手段和策略,同時(shí)構(gòu)建出規(guī)范、開(kāi)放、安全、基于服務(wù)的新型網(wǎng)絡(luò)化科學(xué)研究環(huán)境,并運(yùn)用網(wǎng)絡(luò)技術(shù)提供了一種嶄新的科研協(xié)作模式。這樣一個(gè)平臺(tái)的建立,它的好處是顯而易見(jiàn)的:首先它可以打破目前博物館研究中普遍存在的學(xué)術(shù)孤島現(xiàn)象,為外腦的引入與社會(huì)性協(xié)作建立了條件。其次是可以發(fā)揮網(wǎng)絡(luò)的互聯(lián)特點(diǎn),進(jìn)行最大限度的數(shù)字資源的整合。其三是能起到弭平博物館中久存的文理鴻溝的效果。很多人都擔(dān)心人文學(xué)科對(duì)數(shù)字化的不適應(yīng)。事實(shí)上,在人文學(xué)科中,“數(shù)字人文(Digital Humanities)”已經(jīng)日益流行,即“借助數(shù)字科技方能進(jìn)行的人文研究”。2016年美國(guó)新媒體聯(lián)盟的《地平線報(bào)告》(博物館教育篇)中,就在一年內(nèi)會(huì)采用的技術(shù)里首次明確提出了數(shù)字人文技術(shù)的概念。數(shù)字人文研究目前常見(jiàn)采用的技術(shù)方法,如歷史地理的可視化、采用歷史文獻(xiàn)的文本挖掘與詞頻分析及考古學(xué)方面的圖像解析、色彩還原和數(shù)字重建等等,也在國(guó)外博物館的各領(lǐng)域中逐漸開(kāi)始得到應(yīng)用??傊瑪?shù)據(jù)研究平臺(tái)化的形成,將給博物館帶來(lái)符合社會(huì)發(fā)展趨勢(shì)的改變及隨勢(shì)增長(zhǎng)的契機(jī)。同時(shí)這也將是博物館大數(shù)據(jù)建設(shè)的一個(gè)必然結(jié)果。

4 結(jié)論

上海博物館數(shù)據(jù)中心項(xiàng)目的建設(shè)使博物館的數(shù)字化建設(shè)工作邁上了一個(gè)新的臺(tái)階。首先,此次建設(shè)初步實(shí)現(xiàn)了各類(lèi)不同來(lái)源、格式、類(lèi)型數(shù)據(jù)的融合,建立起了統(tǒng)一的數(shù)字資源聚合管理平臺(tái);其二,通過(guò)多媒體展示屏,以多屏組合方式實(shí)現(xiàn)顯示內(nèi)容的自由布局組合,將復(fù)雜的數(shù)據(jù)以圖形、圖像、多媒體等各種形式做了效果良好的可視化呈現(xiàn),形成了統(tǒng)一的數(shù)字資源展示平臺(tái);第三,是對(duì)藏品數(shù)據(jù)、展覽數(shù)據(jù)、觀眾數(shù)據(jù)進(jìn)行嘗試性挖掘,并建立起了初步的量化評(píng)價(jià)模型,成為博物館大數(shù)據(jù)挖掘平臺(tái)的一個(gè)雛形。上海博物館的這一探索將對(duì)國(guó)內(nèi)博物館大數(shù)據(jù)的應(yīng)用和發(fā)展起到積極的推進(jìn)作用。

[1] Russell L Ackoff. From data to wisdom[J]. J Appl Syst Anal,1989(16):3-9.

[2] 童 茵.博物館數(shù)據(jù)創(chuàng)新公共服務(wù)體系的研究[J].軟件產(chǎn)業(yè)與工程, 2016(6):54-56. TONG Yin. The research of innovation public services architecture of museum data[J].Software Ind Eng,2016(6):54-56.

[3] 博物館智慧化之路——數(shù)據(jù)知識(shí)化與呈現(xiàn)方式[EB/OL].[2017-03-10] http://huadong.artron.net/20160103/n807071.html.

[4] Berners-Lee T. Linked data[DB/OL].[2016-10-17].http://www.w3.org/DesignIssues/LinkedData.html.

[5] Open data handbook[R/OL].[2016-07-03]. http://opendatahand-book.org/zh_CN /what-is-open-data/index.html.

(責(zé)任編輯 馬江麗)

On the use of big data in museums ——Shanghai Museum Data Center project as an example

LIU Jian

(ShanghaiMuseum,Shanghai200003,China)

The use of “big data” is an inevitable consequence of museum digitization efforts. Starting with the Data Center project of the Shanghai Museum, this paper sets forth how Data Center reinforces the collection and storage of museum’s data as well as employs intelligent analytical methods based on the data to dig more deeply into valuable information with the purpose of playing an extensive role in the museum’s operation. Big data methods analyze the museum’s daily operation to form a useful data model and to lay a preliminary foundation for the digitization operation framework of the museum. This work also introduces the effective data mining tools and proposes future big data development strategies for museum use.

Museum; Big data; Application; Development

2016-12-19;

2017-03-20 基金項(xiàng)目:國(guó)家科技支撐計(jì)劃資助(2006BAK20B03) 作者簡(jiǎn)介:劉 健(1962—),男,上海大學(xué)文學(xué)院歷史系考古與博物館專(zhuān)業(yè),本科,研究方向?yàn)椴┪镳^數(shù)字化研究,E-mail: liujian@shanghai-museum.org

1005-1538(2017)03-0097-07

N28; N37

A

猜你喜歡
上海博物館藏品博物館
抱樸齋藏品
李杰森藏品
林安國(guó)藏品
譚禮藏品
論上海博物館收藏的兩面珍貴銅鏡
上海博物館藏滬籍前賢文籍經(jīng)眼錄
高齋雋友
——胡可敏捐贈(zèng)文房供石展將于 4 月 29 日在上海博物館拉開(kāi)帷幕 !
博物館
博物館IP授權(quán)的理論與實(shí)踐——以上海博物館為例
露天博物館
田阳县| 荔波县| 团风县| 石阡县| 临沧市| 长沙县| 同心县| 桐乡市| 儋州市| 库尔勒市| 萍乡市| 岑巩县| 叶城县| 城市| 奉贤区| 寿光市| 襄樊市| 江油市| 石景山区| 临城县| 伊宁市| 钟山县| 鱼台县| 宁城县| 新竹市| 罗定市| 莆田市| 德钦县| 汕头市| 辽中县| 疏勒县| 铅山县| 阳山县| 定襄县| 万安县| 定兴县| 徐闻县| 吉木萨尔县| 勃利县| 高尔夫| 静海县|