国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)字人文的檔案信息資源開(kāi)發(fā)模式構(gòu)建和實(shí)施研究

2018-01-24 12:01朱令俊南京大學(xué)信息管理學(xué)院
浙江檔案 2018年12期
關(guān)鍵詞:人文數(shù)字資源

朱令俊/南京大學(xué)信息管理學(xué)院

1 基于數(shù)字人文的檔案信息資源開(kāi)發(fā)模式的提出

數(shù)字人文是指圍繞人文社科領(lǐng)域特定研究對(duì)象、知識(shí)本體數(shù)字化保存和應(yīng)用而進(jìn)行的信息資源采集、加工、組織、服務(wù)、研究、教育等活動(dòng)的總稱。數(shù)字人文依托數(shù)字化、數(shù)據(jù)管理、數(shù)據(jù)分析、可視化、VR/AR、機(jī)器學(xué)習(xí)等技術(shù)[1],實(shí)現(xiàn)人文研究的理念革新、資源整合、機(jī)制融合、協(xié)同創(chuàng)新。從數(shù)字技術(shù)角度而言,數(shù)字人文是數(shù)字技術(shù)與人文學(xué)科交叉的學(xué)術(shù)活動(dòng)領(lǐng)域,是數(shù)字資源在人文學(xué)科中的系統(tǒng)化應(yīng)用?;跀?shù)字人文的背景,檔案信息資源開(kāi)發(fā)主要由開(kāi)發(fā)客體、開(kāi)發(fā)技術(shù)與開(kāi)發(fā)平臺(tái)三部分組成。

1.1 開(kāi)發(fā)客體:數(shù)字檔案資源/檔案數(shù)據(jù)庫(kù)

數(shù)字檔案資源依托計(jì)算機(jī)技術(shù)、掃描技術(shù)、OCR(Optical Character Recognition,簡(jiǎn)稱OCR,光學(xué)字符識(shí)別)技術(shù)、數(shù)字?jǐn)z像技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、多媒體等技術(shù)條件實(shí)現(xiàn)形成和儲(chǔ)存,形成有序結(jié)構(gòu)的檔案數(shù)據(jù)庫(kù),是構(gòu)造基于數(shù)字人文的檔案信息資源開(kāi)發(fā)模式的基礎(chǔ)。

1.2 開(kāi)發(fā)技術(shù):數(shù)字工具

檔案信息資源開(kāi)發(fā)需要對(duì)大規(guī)模的非結(jié)構(gòu)化數(shù)字檔案資源進(jìn)行清理過(guò)濾,對(duì)所采集的有效信息進(jìn)行文本化與結(jié)構(gòu)化處理。數(shù)字工具是參與檔案信息資源的處理、分析、呈現(xiàn)等全過(guò)程的重要媒介,為基于數(shù)字人文的檔案信息資源開(kāi)發(fā)提供技術(shù)支持。從數(shù)字人文理念出發(fā),數(shù)字工具主要作用于檔案信息資源開(kāi)發(fā)中文本編碼、語(yǔ)義分析、時(shí)間表、網(wǎng)絡(luò)分析、可視化處理、空間分析和地圖制作幾方面。常見(jiàn)的數(shù)字工具有歷史地理信息系統(tǒng)(History Geography Information System, HGIS)、關(guān)聯(lián)數(shù)據(jù)(Linked Data)、數(shù)據(jù)清洗工具Open Refine、文本可視化分析工具TextArc等,使固化的檔案領(lǐng)域具有生命力和交互性的文化產(chǎn)品。

1.3 開(kāi)發(fā)平臺(tái):數(shù)字人文網(wǎng)絡(luò)基礎(chǔ)設(shè)施

數(shù)字人文網(wǎng)絡(luò)基礎(chǔ)設(shè)施分為三個(gè)層次,核心層為文獻(xiàn)資源及其服務(wù)機(jī)構(gòu);中間層由基金會(huì)、資源庫(kù)、計(jì)算設(shè)施、機(jī)構(gòu)存儲(chǔ)、系統(tǒng)平臺(tái)、工具軟件、領(lǐng)域?qū)<液蛿?shù)據(jù)科學(xué)家構(gòu)成,是網(wǎng)絡(luò)基礎(chǔ)設(shè)施的主體部分;外圍層是成果發(fā)布、社會(huì)交互、影響輻射的門戶或平臺(tái)[2]。網(wǎng)絡(luò)基礎(chǔ)設(shè)施主要提供支持?jǐn)?shù)據(jù)獲取、存儲(chǔ)、管理、整合、挖掘、可視化的技術(shù),以及其他計(jì)算與信息處理服務(wù)研究的環(huán)境,便于數(shù)字人文框架的總體布局與可持續(xù)性開(kāi)發(fā)。

從人文學(xué)科角度而言,基于數(shù)字人文的檔案信息資源開(kāi)發(fā)具有七大特征:面向主題,即面向單一主題聚類、資源整合、集成創(chuàng)新;關(guān)注本體,即注重語(yǔ)義分析效率,提供用于查詢推導(dǎo)的豐富語(yǔ)義信息,提高自動(dòng)化程度;基于數(shù)字倉(cāng)儲(chǔ),即基于知識(shí)本體的數(shù)字檔案資源的采集、加工、組織和保存,并為對(duì)應(yīng)用戶群體提供集成化、專業(yè)化、精確化、智能化、互動(dòng)性服務(wù)的信息系統(tǒng)及相關(guān)資源的總和;跨媒介互動(dòng),即通過(guò)建立邏輯整合交互系統(tǒng),使海量信息在不同媒介之間交叉?zhèn)鞑ダ?,?shí)現(xiàn)全方位、遠(yuǎn)距離、及時(shí)性的互動(dòng)體驗(yàn);跨領(lǐng)域整合,即打破學(xué)科領(lǐng)域壁壘,拓展檔案開(kāi)發(fā)深度、廣度,加強(qiáng)與其他領(lǐng)域研究的關(guān)聯(lián)度;多機(jī)構(gòu)協(xié)同,即更加注重跨業(yè)態(tài)、多機(jī)構(gòu)的協(xié)同合作與創(chuàng)新,跨界集成資源、技術(shù)、平臺(tái)、管理和服務(wù)優(yōu)勢(shì),實(shí)現(xiàn)資源整合、技術(shù)支持、業(yè)務(wù)共享等開(kāi)發(fā)實(shí)踐;持續(xù)性開(kāi)發(fā),即迎合社會(huì)變化與需求及時(shí)更新迭代,保證檔案開(kāi)發(fā)價(jià)值的時(shí)效性。

2 基于數(shù)字人文的檔案信息資源開(kāi)發(fā)的案例研究

2.1 案例概述

當(dāng)前,國(guó)外學(xué)者密切關(guān)注數(shù)字人文與檔案結(jié)合的項(xiàng)目,其中歐洲聯(lián)合數(shù)字檔案基礎(chǔ)設(shè)施(Collaborative European Digital Archive Infrastructure, CENDARI)[3]與威尼斯時(shí)光機(jī)器[4]兩大項(xiàng)目作為數(shù)字人文檔案項(xiàng)目的典范,對(duì)研究基于數(shù)字人文的檔案信息資源開(kāi)發(fā)具有參考價(jià)值。

CENDARI項(xiàng)目是歐盟資助為期四年的項(xiàng)目,該項(xiàng)目主要由計(jì)算機(jī)信息學(xué)家、歷史學(xué)家和檔案學(xué)家合作整理、加工、開(kāi)發(fā)歐洲各國(guó)檔案文獻(xiàn)資源而成,利用OAIPMH協(xié)議庫(kù)和API(應(yīng)用程序編程接口),Atom(文本代碼編輯器),CKAN(開(kāi)源數(shù)據(jù)門戶軟件)開(kāi)發(fā)工具,基于EAG(制度層面)、EAD(采集)、MODS(項(xiàng)目級(jí))等開(kāi)放平臺(tái)。作為強(qiáng)大的檔案虛擬研究基礎(chǔ)設(shè)施和人文研究虛擬工作空間,CENDARI旨在通過(guò)內(nèi)容管理與歷史數(shù)據(jù)可視化幫助學(xué)者開(kāi)展跨機(jī)構(gòu)、跨國(guó)界研究。威尼斯時(shí)光機(jī)器項(xiàng)目是瑞士洛桑聯(lián)邦理工學(xué)院和意大利威尼斯大學(xué)合作項(xiàng)目,該項(xiàng)目時(shí)間跨度長(zhǎng)達(dá)十年,主要由數(shù)字人文專家、計(jì)算機(jī)科學(xué)家、歷史學(xué)家、檔案工作者共同開(kāi)發(fā)威尼斯國(guó)家檔案館檔案,利用斷層(CT)掃描技術(shù)、語(yǔ)義編碼、人工智能、機(jī)器學(xué)習(xí)技術(shù)、可視化技術(shù)、云技術(shù)等,借助結(jié)構(gòu)分析、功能預(yù)測(cè)、基于語(yǔ)音識(shí)別的語(yǔ)言模型、云端平臺(tái)等工具,虛擬重構(gòu)中世紀(jì)威尼斯歷史風(fēng)物、地理面貌、文化習(xí)俗等多層次的社會(huì)全貌,旨在幫助研究者獲取存儲(chǔ)在威尼斯國(guó)家檔案館的大量數(shù)據(jù),并構(gòu)建中世紀(jì)威尼斯的社會(huì)網(wǎng)絡(luò)關(guān)系。

結(jié)合上述案例比較分析,本文提出構(gòu)建一個(gè)假設(shè)性的開(kāi)發(fā)架構(gòu),用于描述基于數(shù)字人文的檔案信息資源開(kāi)發(fā)的邏輯過(guò)程與基本軌跡:在開(kāi)發(fā)目標(biāo)的規(guī)劃設(shè)計(jì)下,開(kāi)發(fā)主體明確開(kāi)發(fā)客體的用戶需求,借助開(kāi)發(fā)工具和開(kāi)發(fā)平臺(tái)進(jìn)行技術(shù)處理,客體以多種形式向服務(wù)對(duì)象發(fā)布開(kāi)發(fā)成果,并依據(jù)交互反饋機(jī)制后續(xù)完善。

2.2 模式要素簡(jiǎn)析

一是開(kāi)發(fā)目標(biāo)。開(kāi)發(fā)者在開(kāi)發(fā)前首先需要明確兩個(gè)問(wèn)題,即通過(guò)開(kāi)發(fā),檔案信息資源(即開(kāi)發(fā)客體)會(huì)呈現(xiàn)什么效果或結(jié)果?用戶(即服務(wù)對(duì)象)通過(guò)檔案開(kāi)發(fā)可以得到什么?在此基礎(chǔ)上考慮后續(xù)開(kāi)發(fā)的技術(shù)可行性、經(jīng)濟(jì)可行性、環(huán)境可行性,精確選擇主題和服務(wù)對(duì)象,并圍繞開(kāi)發(fā)目標(biāo)制定和完善開(kāi)發(fā)方案。二是開(kāi)發(fā)主體。數(shù)字人文背景下的檔案信息資源開(kāi)發(fā)主體更具多元化和復(fù)雜性,且呈現(xiàn)出明顯的跨學(xué)科、跨領(lǐng)域特征,需要綜合考量學(xué)科背景多元化、跨部門跨領(lǐng)域協(xié)作、資源與用戶特性三項(xiàng)因素。三是開(kāi)發(fā)客體。檔案信息資源需要經(jīng)過(guò)海量篩選、綜合評(píng)估、充分了解后方能被確定為開(kāi)發(fā)客體,在開(kāi)發(fā)中對(duì)其可用性、有用性、完整性需要有更高要求,從而細(xì)化開(kāi)發(fā)任務(wù)和目標(biāo),提供開(kāi)發(fā)效率。四是服務(wù)對(duì)象。開(kāi)發(fā)的最終目的是服務(wù)利用,服務(wù)對(duì)象與開(kāi)發(fā)目標(biāo)相適應(yīng)。即明確為哪一類用戶群體使用,并與開(kāi)發(fā)客體形成交互反饋機(jī)制。而在數(shù)字人文背景下,服務(wù)對(duì)象需要更具目標(biāo)明確性和交互性,推進(jìn)數(shù)字人文的深入。五是開(kāi)發(fā)工具與開(kāi)發(fā)平臺(tái)。為實(shí)現(xiàn)數(shù)字人文愿景,在搭建高效安全的開(kāi)發(fā)工具和強(qiáng)大穩(wěn)定的開(kāi)放平臺(tái)的基礎(chǔ)上,需要明確三個(gè)問(wèn)題,即開(kāi)發(fā)需要哪些技術(shù)、技術(shù)如何應(yīng)用開(kāi)發(fā)、如何展現(xiàn)技術(shù)紅利,幫助了解檔案信息資源開(kāi)發(fā)人員和設(shè)計(jì)人員多種開(kāi)發(fā)語(yǔ)言和開(kāi)發(fā)技術(shù)需求,實(shí)現(xiàn)高難度、多樣化、模擬環(huán)境的檔案項(xiàng)目開(kāi)發(fā)任務(wù)。

2.3 實(shí)施原則

為科學(xué)合理、有序高效地開(kāi)發(fā)檔案信息資源,除了構(gòu)建基于數(shù)字人文的檔案信息資源開(kāi)發(fā)模式,還要明確檔案信息資源開(kāi)發(fā)模式的實(shí)施原則:一是以檔案為中心,建構(gòu)數(shù)字人文開(kāi)發(fā)框架,搭建開(kāi)放、包容、前沿的多學(xué)科交流平臺(tái);二是保護(hù)檔案實(shí)體,注重檔案可持續(xù)使用,實(shí)現(xiàn)機(jī)制運(yùn)行下的實(shí)體檔案與數(shù)字檔案協(xié)調(diào)有序;三是技術(shù)創(chuàng)新,構(gòu)造數(shù)字交互環(huán)境,擁抱技術(shù)力量;四是跨界融合,創(chuàng)新開(kāi)發(fā)途徑,促成產(chǎn)學(xué)研一體化;五是互動(dòng)共生,探索可復(fù)制、可推廣的實(shí)踐經(jīng)驗(yàn)。

3 基于數(shù)字人文的檔案信息資源開(kāi)發(fā)實(shí)施策略

3.1 技術(shù):變革的契機(jī)與挑戰(zhàn)

技術(shù)是資源利用和服務(wù)供給的支撐力量,是檔案開(kāi)發(fā)的重要?jiǎng)恿Α;跀?shù)字人文的檔案信息資源開(kāi)發(fā)在技術(shù)層面包含數(shù)字化技術(shù)、數(shù)據(jù)管理技術(shù)、數(shù)據(jù)管理技術(shù)、數(shù)據(jù)分析技術(shù)、可視化技術(shù)、VR/AR技術(shù)、機(jī)器學(xué)習(xí)技術(shù)。以數(shù)據(jù)分析技術(shù)為例,該技術(shù)對(duì)檔案信息資源進(jìn)行分析研究,涉及內(nèi)容挖掘、時(shí)序分析、社會(huì)關(guān)系分析、歷史地理空間分析等,能夠重新組織構(gòu)建檔案信息資源所反映的社會(huì)網(wǎng)絡(luò)與歷史軌跡。哈佛大學(xué)地理研究中心開(kāi)發(fā)了地理信息平臺(tái)“世界地圖計(jì)劃”(WorldMap),將歷史文獻(xiàn)與古地圖上的地理描述予以定位、歸納,使公眾對(duì)信息進(jìn)行編輯與可視化管理[5]。在平臺(tái)中,古代中國(guó)地圖包含環(huán)境、氣候、邊界、能源、交通、教育、語(yǔ)言、人口等信息,借助數(shù)據(jù)分析技術(shù)提供結(jié)構(gòu)化、可視化的數(shù)據(jù)呈現(xiàn),能夠在地圖上清晰地標(biāo)注有關(guān)信息,例如標(biāo)注古代中國(guó)受蝗蟲(chóng)災(zāi)害影響的地區(qū)、全國(guó)各省男女受教育的平均年限等信息[6]。

3.2 服務(wù):本質(zhì)的回歸與拓展

服務(wù)是技術(shù)加工和資源利用的保障,是檔案開(kāi)發(fā)的價(jià)值歸宿。數(shù)字人文框架下的檔案信息資源開(kāi)發(fā)不同于傳統(tǒng)檔案信息資源開(kāi)發(fā),本質(zhì)在于檔案機(jī)構(gòu)或研究人員的工作理念發(fā)生了轉(zhuǎn)變,由被動(dòng)“提供”變?yōu)橹鲃?dòng)“服務(wù)”,從而創(chuàng)新檔案服務(wù)方式。服務(wù)主要從兩大方面實(shí)現(xiàn),即開(kāi)放式推送和個(gè)性化定制。在開(kāi)放式推送方面可借助平臺(tái)網(wǎng)絡(luò)優(yōu)勢(shì),開(kāi)啟檔案開(kāi)發(fā)傳播新形式。如美國(guó)國(guó)家檔案與文件署在Twitter、Facebook、YouTube等社交媒體上積極推廣檔案動(dòng)圖GIF系列,形成良性循環(huán)的信息生態(tài)圈;里士滿大學(xué)數(shù)字研究實(shí)驗(yàn)室牽頭創(chuàng)建在線信息中心,提供美國(guó)“居住警示區(qū)域”信息,將全美社區(qū)按照安全系數(shù)標(biāo)注為不同等級(jí),從“最佳”到“危險(xiǎn)”,使用者可以搜索150幅地圖和對(duì)5000個(gè)社區(qū)的描述信息[7]。由此形成良性信息生態(tài)圈,拓展與提升檔案文化與開(kāi)發(fā)成果的覆蓋面和影響力,實(shí)現(xiàn)檔案信息資源的社會(huì)價(jià)值。數(shù)字人文還影響著檔案信息資源開(kāi)發(fā)的內(nèi)容傳播與呈現(xiàn)方式,在個(gè)性化定制方面,通過(guò)融入全新的技術(shù)如全景技術(shù)、地理信息系統(tǒng)、APP端應(yīng)用服務(wù)、微信小程序等實(shí)現(xiàn)檔案信息的實(shí)時(shí)展示,以耳目一新的方式展現(xiàn)與傳遞檔案文化。

3.3 資源:生態(tài)的融合與重構(gòu)

資源是技術(shù)加工和服務(wù)供給的基礎(chǔ),是檔案開(kāi)發(fā)的物質(zhì)前提。資源在構(gòu)建信息生態(tài)圈和聯(lián)接公共部門、研究機(jī)構(gòu)與公眾上具有舉足輕重的作用。在數(shù)字人文的支持下,積極建構(gòu)“大檔案觀”理念,使檔案信息資源能夠全方位、無(wú)遺漏、多形式地呈現(xiàn)。在重塑檔案信息生態(tài)圈時(shí),可整合檔案館、圖書(shū)館、博物館的館藏資源,建立統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),解決單館存在的“信息孤島”問(wèn)題,最大程度地發(fā)揮三館資源優(yōu)勢(shì)。通過(guò)跨界合作的方式重構(gòu)檔案信息資源,與各類電視節(jié)目聯(lián)合制作以檔案資料為背景的紀(jì)錄片或?qū)n}節(jié)目,如中央電視臺(tái)國(guó)際頻道的《國(guó)寶檔案》節(jié)目,利用檔案資源優(yōu)勢(shì),重新整合加工,還原歷史,賦予檔案呈現(xiàn)于公眾面前又一新形式。除此之外,檔案部門還可以與商業(yè)機(jī)構(gòu)、文化遺產(chǎn)保護(hù)機(jī)構(gòu)等組織主動(dòng)合作,保護(hù)檔案資源,合理挖掘開(kāi)發(fā)檔案信息價(jià)值,如近現(xiàn)代中國(guó)蘇州絲綢檔案入選《世界記憶名錄》,可通過(guò)開(kāi)展記憶工程項(xiàng)目和檔案非物質(zhì)文化遺產(chǎn)的保護(hù)、傳播、交流等實(shí)踐,與全社會(huì)共享檔案成果,擴(kuò)大檔案受眾群體與檔案文化影響力。

猜你喜歡
人文數(shù)字資源
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
資源回收
答數(shù)字
人文紹興
資源再生 歡迎訂閱
數(shù)字看G20
人文社科
誰(shuí)來(lái)教“醫(yī)學(xué)人文”課
讓人文光輝照耀未來(lái)
台山市| 定陶县| 双柏县| 舟曲县| 华阴市| 咸丰县| 唐山市| 于都县| 城市| 蒲江县| 翼城县| 青州市| 观塘区| 桦甸市| 紫金县| 昭平县| 盐津县| 衡水市| 赤峰市| 新源县| 图木舒克市| 运城市| 裕民县| 海丰县| 沅陵县| 宿迁市| 泽普县| 信阳市| 漠河县| 宜宾县| 柘荣县| 疏勒县| 洛宁县| 天气| 汉寿县| 台东县| 永康市| 永兴县| 丽江市| 广南县| 望都县|