国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字人文環(huán)境下歷史文獻(xiàn)資源共建共享模式新探

2021-06-24 10:21夏翠娟賀晨芝劉倩倩朱武信
圖書與情報(bào) 2021年1期
關(guān)鍵詞:數(shù)字人文模式研究

夏翠娟 賀晨芝 劉倩倩 朱武信

摘 ? 要:數(shù)字人文的勃興為GLAM領(lǐng)域的資源共建共享提出了新的需求。文章以上海圖書館“中文古籍聯(lián)合目錄及循證平臺(tái)”“中國家譜知識(shí)服務(wù)平臺(tái)”“人名規(guī)范庫”“歷史文獻(xiàn)眾包平臺(tái)”為例,介紹數(shù)字人文環(huán)境下新的歷史文獻(xiàn)資源共建共享模式,主要包括“資源與服務(wù)全托管模式”“資源與服務(wù)半托管模式”“聯(lián)合編目模式”“數(shù)據(jù)中心模式”“開放鏈接模式”“眾包模式”等六種,隨后分析比較其適用范圍和可行的技術(shù)方案。通過實(shí)踐案例論證了解決數(shù)字人文環(huán)境下GLAM領(lǐng)域的資源共建共享問題,利用以技術(shù)的手段作為政策和機(jī)制的補(bǔ)充,提供一種技術(shù)驅(qū)動(dòng)的低成本資源共建共享途徑。

關(guān)鍵詞:數(shù)字人文;資源共建共享;最佳實(shí)踐;模式研究

中圖分類號(hào):G122 ? 文獻(xiàn)標(biāo)識(shí)碼:A ? DOI:10.11968/tsyqb.1003-6938.2021008

New Exploration on the Co-construction and Sharing Mode of Historical Literature Resources in the Digital Human Environment

Abstract The development of Digital Humanities has brought forward new demands for Resource Co- Construction and Sharing in GLAM. Taking the "Chinese Ancient Books Union Catalogue and Evidence-based Platform", "Chinese Genealogy Knowledge Service Platform", "Authority Names Database" and "Historical Document Crowd-sourcing Platform" as examples, this paper explores the mode of co-construction and sharing of historical literature resources in the digital humanities environment, including six modes. The paper analyzes and compares the application scope and feasible technical solutions. Through practical cases, the paper demonstrates that the problems of resource co construction and sharing in GLAM field under the digital human environment can be solved by technical means as a supplement to policies and mechanism.

Key words digital humanities; resource co construction and sharing; best practice; mode research

1 ? 引言

圖書館界對(duì)于資源共建共享歷來十分重視,建國以來各種多機(jī)構(gòu)合作修纂聯(lián)合目錄如《中國叢書綜錄》《中國古籍善本書目》《中國古籍總目》《中國家譜總目》等工作起到了摸清家底的作用,為新世紀(jì)伊始數(shù)字圖書館建設(shè)大潮中數(shù)字化歷史文獻(xiàn)資源的共建共享打下了基礎(chǔ)。21世紀(jì)初互聯(lián)網(wǎng)時(shí)代的到來,對(duì)網(wǎng)絡(luò)環(huán)境下文獻(xiàn)資源共建共享的研究達(dá)到一個(gè)高峰,從現(xiàn)狀調(diào)查和反思[1],到管理機(jī)制[1]、運(yùn)行模式[2],再到實(shí)踐[3]進(jìn)行了全方位的探討。由國家(原)文化部、財(cái)政部共同發(fā)起并組織實(shí)施的三項(xiàng)重大公共數(shù)字文化工程(簡稱“三大工程”),即“全國文化信息資源共享工程”“數(shù)字圖書館推廣工程”和“公共電子閱覽室計(jì)劃”,在公共文化服務(wù)體系的資源共建共享方面取得了一定的成就,初步完成了信息基礎(chǔ)設(shè)施建設(shè),在資源建設(shè)方面也制定了系統(tǒng)性的資源數(shù)字化加工、數(shù)字對(duì)象管理、資源描述、長期保存的標(biāo)準(zhǔn)規(guī)范,為不同機(jī)構(gòu)間的資源共建共享奠定了一定的基礎(chǔ)。高校圖書館經(jīng)過中國高等教育文獻(xiàn)保障系統(tǒng)(CALIS)、大學(xué)數(shù)字圖書館國際合作計(jì)劃(CADAL)等項(xiàng)目在高校圖書館界的資源共建共享等方面也取得了類似的成就。

國家十四五規(guī)劃提出實(shí)施文化產(chǎn)業(yè)數(shù)字化戰(zhàn)略,上海市全面推進(jìn)城市數(shù)字化轉(zhuǎn)型,強(qiáng)調(diào)以新技術(shù)廣泛應(yīng)用為重點(diǎn),大力提升城市創(chuàng)新能級(jí)。而隨著“數(shù)智時(shí)代”的到來和數(shù)字人文的興起,為數(shù)字人文研究提供“數(shù)據(jù)基礎(chǔ)設(shè)施”支撐和數(shù)字學(xué)術(shù)環(huán)境保障成為歷史文獻(xiàn)資源開發(fā)利用的目的之一?!皵?shù)據(jù)基礎(chǔ)設(shè)施”需要充分體現(xiàn)資源覆蓋全,數(shù)據(jù)規(guī)模大,覆蓋時(shí)間長,地域范圍廣,描述粒度小、維度多等特點(diǎn),以支持全網(wǎng)域(Webb-scale)的數(shù)據(jù)調(diào)度、融合和自動(dòng)化的分析、統(tǒng)計(jì),以及大規(guī)模數(shù)據(jù)的可視化。這就對(duì)歷史文獻(xiàn)資源的共建共享提出了更高的要求。數(shù)字圖書館時(shí)代以三大工程為代表的資源共建共享都有著自上而下的政策和管理驅(qū)動(dòng)的特點(diǎn),成本較高。數(shù)智技術(shù)不僅為數(shù)字資源的管理加工提供了更為高效的平臺(tái)和工具,也改變了資源收藏者的觀念,對(duì)資源使用者催生了新的需求,而能否通過新技術(shù)的應(yīng)用,為跨機(jī)構(gòu)的協(xié)同共建和開放共享提供更為便捷輕型的解決方案,滿足實(shí)際情況下各個(gè)機(jī)構(gòu)對(duì)資源共建共享的不同需求,提供靈活的選擇,正是本文試圖通過家譜、古籍、人名規(guī)范庫、眾包等數(shù)字人文項(xiàng)目實(shí)踐來探討的問題。

2 ? 文獻(xiàn)調(diào)研

為避免重復(fù)建設(shè)和服務(wù)的均等化,資源的共建共享是必然的需求[4]。我國自“十二五”時(shí)期開始加強(qiáng)對(duì)公共數(shù)字文化資源建設(shè)的重視,并推出大量涉及公共數(shù)字文化資源整合的策略[5]。隨著三大工程的實(shí)施,各地政府推出地方數(shù)字文化網(wǎng)站、資源共享平臺(tái)(中心),建設(shè)地方特色數(shù)字資源,但由于各地建設(shè)技術(shù)不一、數(shù)據(jù)結(jié)構(gòu)各異,造成總體內(nèi)容不成體系、無法互鏈共享、更新維護(hù)欠佳等問題,也難以為公眾提供全面高質(zhì)量的數(shù)字文化資源服務(wù)[6-7]。

國外資源共建共享項(xiàng)目起步于上世紀(jì)90年代,至今已推出各類較為成熟的跨機(jī)構(gòu)、跨地域歷史文獻(xiàn)資源共建共享平臺(tái),如歐盟的Europeana、紐約公共圖書館的DPLA、法國國家圖書館的Gallica、澳大利亞國家圖書館的Trove、美國國會(huì)圖書館主導(dǎo)開發(fā)的WDL等,集合了不同機(jī)構(gòu)的大量數(shù)字文化資源,為公眾提供一站式服務(wù)[8]。

資源建設(shè)方面,各平臺(tái)以規(guī)范的數(shù)據(jù)格式上傳資源、遵循約定協(xié)議關(guān)聯(lián)整合等方式匯聚資源。Europeana制定了EDM數(shù)據(jù)模型(Europeana data model)以語義技術(shù)融合各類資源元數(shù)據(jù),不同機(jī)構(gòu)自行加工數(shù)據(jù),將符合要求的資源元數(shù)據(jù)上傳至平臺(tái)[9]。Gallica則根據(jù)參與機(jī)構(gòu)數(shù)字化能力提供不同的建設(shè)方式,除了提供基于OAI-PMH協(xié)議的資源共建方式外,還為資源尚未數(shù)字化的機(jī)構(gòu)提供數(shù)字化服務(wù)并將其納入平臺(tái),對(duì)于資源已數(shù)字化但沒有獨(dú)立數(shù)字資源發(fā)布平臺(tái)的機(jī)構(gòu),在將其資源納入平臺(tái)的同時(shí),還提供基于Gallica平臺(tái)、在界面設(shè)計(jì)(配色)上根據(jù)機(jī)構(gòu)意愿個(gè)性化定制的數(shù)字資源發(fā)布平臺(tái)建設(shè)服務(wù)[10]。Trove在機(jī)構(gòu)與機(jī)構(gòu)共建數(shù)據(jù)的基礎(chǔ)上,引入了基于用戶貢獻(xiàn)的眾包理念,邀請(qǐng)用戶通過文獻(xiàn)標(biāo)引、全文抄錄的方式與機(jī)構(gòu)共同建設(shè)資源數(shù)據(jù)[11]。

資源共享與服務(wù)方面,在提供資源統(tǒng)一檢索門戶的基礎(chǔ)上,部分網(wǎng)站還提供了更為深入的知識(shí)服務(wù)、數(shù)據(jù)開放服務(wù)。WDL的資源元數(shù)據(jù)都可點(diǎn)擊關(guān)聯(lián)至相關(guān)檢索結(jié)果,Gallica提供與主題作者等相關(guān)的資源推薦,通過不同資源間的關(guān)聯(lián)提高資源利用率與可見度。WDL還利用國際圖象相互操作框架支持圖像資源的共享、關(guān)聯(lián)與再利用。DPLA和Europeana除了常規(guī)的服務(wù)平臺(tái)以外,還有專業(yè)版服務(wù)平臺(tái),通過開放Search API、Record API、IIIF APIs、SPARQL、OAI-PMH Service等各類資源接口提供數(shù)據(jù)開放服務(wù)[12-13]。

3 ? 數(shù)字人文環(huán)境下歷史文獻(xiàn)資源共建共享模式——實(shí)踐探索

圖書館參與數(shù)字人文項(xiàng)目的最初出發(fā)點(diǎn)是利用新技術(shù)更好地整合開發(fā)館藏資源,尤其是用活用好珍貴的歷史文獻(xiàn)資源,以為研究者提供更好的數(shù)字學(xué)術(shù)支撐環(huán)境,以上海圖書館為例,其作為研究型公共圖書館,需要利用數(shù)據(jù)可視化、AR、VR等技術(shù)拉近專業(yè)性較強(qiáng)的歷史文獻(xiàn)資源與普通大眾的距離,從總體上提高資源的利用率。上海圖書館的數(shù)字人文項(xiàng)目建設(shè)始于2014年,從上圖的特色資源家譜開始,利用以關(guān)聯(lián)數(shù)據(jù)、知識(shí)圖譜為主的語義萬維網(wǎng)(Semantic Web)技術(shù),融合597家館藏機(jī)構(gòu)和眾多私人收藏者的家譜元數(shù)據(jù)記錄、專家的研究成果(姓氏、祠堂、家規(guī)家訓(xùn))、相關(guān)的網(wǎng)絡(luò)資源、人名詞典,基于本體(Ontology)建模的方法重組整合數(shù)據(jù),建成“中國家譜知識(shí)服務(wù)平臺(tái)”,在提供更好的文獻(xiàn)查閱服務(wù)之外還提供數(shù)據(jù)驅(qū)動(dòng)的知識(shí)服務(wù),為使該平臺(tái)成為一個(gè)不斷生長的有機(jī)體,還開發(fā)了在線捐贈(zèng)、在線識(shí)譜、在線修譜、聯(lián)合編目等各種眾包功能,吸納用戶貢獻(xiàn)內(nèi)容。經(jīng)過數(shù)年的探索實(shí)踐,上海圖書館建設(shè)了手稿、檔案、古籍、紅色文獻(xiàn)等文獻(xiàn)知識(shí)庫,并以人名規(guī)范庫等知識(shí)庫作為不同機(jī)構(gòu)、不同類型的文獻(xiàn)的數(shù)據(jù)鏈接中心和知識(shí)共享中心,形成了將各種文獻(xiàn)庫和知識(shí)庫融為為一體的人文數(shù)據(jù)基礎(chǔ)設(shè)施。在這個(gè)過程中,不可避免地涉及到跨機(jī)構(gòu)的資源共建共享的問題,根據(jù)各個(gè)機(jī)構(gòu)的資源管理服務(wù)政策、現(xiàn)狀和需求,探索了不同的資源共建共享模式。在“中國家譜知識(shí)服務(wù)平臺(tái)”中,探索了“聯(lián)合編目模式”和“眾包模式”;在“中文古籍聯(lián)合目錄及循證平臺(tái)”中探索了“資源與服務(wù)全托管模式”、“資源與服務(wù)半托管模式”和“開放鏈接”模式;而人名規(guī)范庫則是通過一個(gè)人物實(shí)體作為“數(shù)據(jù)中心”,來鏈接來自不同機(jī)構(gòu)和不同類型的文獻(xiàn)資源;“歷史文獻(xiàn)眾包平臺(tái)”則是一個(gè)旨在為不同機(jī)構(gòu)、不同種類的歷史文獻(xiàn)提供眾包項(xiàng)目分發(fā)、管理和回收的綜合性眾包平臺(tái),面向個(gè)人用戶,支持元數(shù)據(jù)編目和全文圖像抄錄成文本,是典型的“眾包模式”。

3.1 ? ?資源與服務(wù)全托管模式

“資源與服務(wù)全托管模式”是指資源收藏機(jī)構(gòu)無獨(dú)立的特藏資源服務(wù)站點(diǎn),將要服務(wù)的資源元數(shù)據(jù)和數(shù)字化全文掃描影像提交給托管機(jī)構(gòu),由托管機(jī)構(gòu)負(fù)責(zé)進(jìn)行數(shù)據(jù)加工和格式轉(zhuǎn)換及系統(tǒng)開發(fā),在云平臺(tái)上提供元數(shù)據(jù)和數(shù)字化全文掃描影像服務(wù),并支持功能開發(fā)及后續(xù)維護(hù)(數(shù)據(jù)更新、站點(diǎn)維護(hù)管理等)。

如澳門大學(xué)圖書館與上海圖書館的古籍項(xiàng)目合作就是采用資源與服務(wù)全托管模式。澳門大學(xué)圖書館將其館藏2480種古籍的MARC元數(shù)據(jù)和數(shù)字化全文掃描影像托管給上海圖書館,上海圖書館數(shù)字人文團(tuán)隊(duì)對(duì)元數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和知識(shí)提取,提取元數(shù)據(jù)中的作品、版本、責(zé)任者等信息,按照上圖古籍本體的知識(shí)結(jié)構(gòu)進(jìn)行重組和RDF格式轉(zhuǎn)換,對(duì)PDF格式的古籍掃描影像進(jìn)行IIIF的轉(zhuǎn)換,并在上圖中文古籍聯(lián)合目錄及循證平臺(tái)(http://gj.library.sh.cn)上為澳門大學(xué)圖書館發(fā)布了單獨(dú)的古籍目錄站點(diǎn),直接在云端為該館讀者提供獨(dú)立的古籍館藏服務(wù)站點(diǎn)(https://gj.library.sh.cn/org/mcu)。澳門大學(xué)圖書館可以自行對(duì)該站點(diǎn)的界面外觀、高級(jí)檢索字段、詳情頁面顯示的字段、排序規(guī)則等進(jìn)行個(gè)性化設(shè)置(見圖1),也可對(duì)資源和用戶進(jìn)行維護(hù)和管理。平臺(tái)支持澳門大學(xué)圖書館管理員對(duì)資源元數(shù)據(jù)進(jìn)行查詢修改、館藏導(dǎo)出或新增資源的批量上傳,以上設(shè)置和維護(hù)也可全權(quán)委托上海圖書館。

同時(shí),澳門大學(xué)圖書館也可共享平臺(tái)提供的1400余家機(jī)構(gòu)館藏目錄一站式檢索的“聯(lián)合目錄”功能,和融合各種聯(lián)合目錄、史志目錄、官修目錄、私家目錄和避諱字、藏印、刻工等各種外掛知識(shí)庫的“循證研究”功能,以及還原各種古籍目錄并提供全文檢索和閱覽的“古籍目錄”功能等。

這種模式適用于資源收藏機(jī)構(gòu)無暇投入人力自行開發(fā)館藏資源服務(wù)站點(diǎn),其優(yōu)點(diǎn)是資源托管機(jī)構(gòu)成熟的技術(shù)方案和開發(fā)經(jīng)驗(yàn),能快速按既有流程完成開發(fā),提高了開發(fā)的效率,雙方的數(shù)據(jù)深度融合形成規(guī)?;瘍?yōu)勢;由于采用一致的數(shù)據(jù)模型和技術(shù)方案,確保了雙方資源整合時(shí)數(shù)據(jù)標(biāo)準(zhǔn)和技術(shù)架構(gòu)的統(tǒng)一,避免了不同技術(shù)體系帶來的互操作障礙;此外,資源集中存儲(chǔ),服務(wù)在云端,在后續(xù)的更新和維護(hù)上,也有一定的便利性。

3.2 ? ?資源與服務(wù)半托管模式

資源與服務(wù)半托管模式是指資源收藏機(jī)構(gòu)已有獨(dú)立的特藏資源服務(wù)站點(diǎn),但將要建設(shè)的元數(shù)據(jù)和數(shù)字化全文掃描影像提交給資源托管機(jī)構(gòu),由后者負(fù)責(zé)進(jìn)行數(shù)據(jù)加工和格式轉(zhuǎn)換,在云平臺(tái)上提供元數(shù)據(jù)和數(shù)字化全文掃描影像服務(wù),以及平臺(tái)功能開發(fā)及后續(xù)的維護(hù)(資源更新、站點(diǎn)維護(hù)管理等),云平臺(tái)的服務(wù)作為前者已有服務(wù)站點(diǎn)的補(bǔ)充。

如柏克萊加州大學(xué)東亞圖書館與上海圖書館的合作就是采用資源與服務(wù)半托管模式。前者曾將館藏的清乾隆六十年以前所有中文刻本及稿、鈔、校本編著為《柏克萊加州大學(xué)東亞圖書館中文古籍善本書志》公開出版,其中收錄該館所藏中文古籍善本802種,每種書志的著錄非常詳細(xì)和完善,包括書名、卷數(shù)、著者、版本、冊(cè)數(shù)、行款、版匡高廣、牌記、刻工、寫工、原書序跋、著者仁履、內(nèi)容提要、版本考訂、收藏或經(jīng)眼者批校題跋、收藏概況、鈐印等項(xiàng),為反映海外圖書館漢籍收藏的一本重要工具書。上海圖書館以此書為基礎(chǔ)與柏克萊加州大學(xué)東亞圖書館進(jìn)行合作,雙方商定,前者為后者提供中文古籍聯(lián)合目錄與循證平臺(tái)的所有登錄用戶可訪問的內(nèi)容和服務(wù),后者允許前者將802種善本書志的內(nèi)容數(shù)據(jù)化后融入中文古籍聯(lián)合目錄和循證平臺(tái)。

上海圖書館數(shù)字人文團(tuán)隊(duì)對(duì)善本書志進(jìn)行了結(jié)構(gòu)化、數(shù)據(jù)清洗和知識(shí)提取,提取元數(shù)據(jù)中的分類、作品、版本、責(zé)任者、鈐印等信息,按照上海圖書館古籍本體的知識(shí)結(jié)構(gòu)進(jìn)行重組和RDF格式轉(zhuǎn)換,融入中文古籍聯(lián)合目錄及循證平臺(tái)。并對(duì)該館提供的279種全文掃描影像進(jìn)行IIIF轉(zhuǎn)換,在上海圖書館的中文古籍聯(lián)合目錄及循證平臺(tái)上發(fā)布了單獨(dú)的柏克萊加州大學(xué)東亞圖書館古籍目錄站點(diǎn)(https://gj.library.sh.cn/org/bkl),為該館讀者提供獨(dú)立的善本書志目錄全文檢索和部分全文掃描影像的IIIF服務(wù)。柏克萊加州大學(xué)東亞圖書館可以自行對(duì)站點(diǎn)的主頁進(jìn)行個(gè)性化設(shè)置和資源維護(hù)。同時(shí),根據(jù)柏克萊加州大學(xué)東亞圖書館的要求:善本書志的內(nèi)容無條件地公開訪問,但數(shù)字化全文掃描影像則只供雙方用戶在局域網(wǎng)訪問。針對(duì)此需求,平臺(tái)采用IP控制和用戶權(quán)限控制的方式,支持雙方的用戶通過統(tǒng)一用戶登錄后,在IP控制的范圍內(nèi),訪問“中文古籍聯(lián)合目錄及循證平臺(tái)”上的所有向登錄用戶開放的內(nèi)容和功能,而除數(shù)字化全文掃描影像外的全部內(nèi)容,不登錄也可以訪問。

這種模式適用于收藏機(jī)構(gòu)有一定的信息化和開發(fā)能力,但希望托管機(jī)構(gòu)提供更好的服務(wù)作為已有服務(wù)的補(bǔ)充。針對(duì)收藏機(jī)構(gòu)在數(shù)字化全文掃描影像服務(wù)策略上的不同需求,托管機(jī)構(gòu)需提供靈活的服務(wù)方式。如上海圖書館中文古籍聯(lián)合目錄及循證平臺(tái)就支持對(duì)數(shù)字化全文掃描圖像的訪問權(quán)限進(jìn)行靈活的控制,如可配置的IP控制、用戶角色權(quán)限控制、針對(duì)某種古籍單獨(dú)的權(quán)限控制等。

3.3 ? ?聯(lián)合編目模式

2018年,上海圖書館主持的國家哲學(xué)社會(huì)科學(xué)基金重大課題“ 編纂《1949年以來中國家譜總目》(18ZDA329)”立項(xiàng)。該課題的創(chuàng)新點(diǎn)之一是,充分利用互聯(lián)網(wǎng)+分布式工作的思維和上海圖書館數(shù)字人文項(xiàng)目建設(shè)已有的成果,在中國家譜知識(shí)服務(wù)平臺(tái)已有的新家譜目錄數(shù)據(jù)基礎(chǔ)上,由上海圖書館研發(fā)家譜聯(lián)合編目系統(tǒng),支持參與新家譜總目編纂的各家機(jī)構(gòu)基于一致的著錄規(guī)范,在同一系統(tǒng)在線協(xié)同聯(lián)合編目,編目數(shù)據(jù)實(shí)時(shí)與中國家譜知識(shí)服務(wù)平臺(tái)同步,一邊協(xié)同編目,一邊就能向各個(gè)收藏機(jī)構(gòu)和廣大用戶提供服務(wù)。新家譜目錄編目完成后,由系統(tǒng)按照書本式目錄的格式生成《1949年以來中國家譜總目》草稿。

家譜聯(lián)合編目系統(tǒng)(http://jplb.library.sh.cn)于2020年3月研發(fā)完成開始投入使用,截至2021年2月,已有56家機(jī)構(gòu)參與聯(lián)合編目,已完成1800余種家譜的著錄。系統(tǒng)支持不同的機(jī)構(gòu)遵循一致的著錄規(guī)范進(jìn)行編目。在著錄界面提供詳細(xì)的著錄范例,并對(duì)字段內(nèi)容,字段格式、字段長度按照著錄規(guī)范進(jìn)行自動(dòng)數(shù)據(jù)校驗(yàn)。系統(tǒng)支持著錄查重,著錄人員在著錄之前需先查重,如查到手頭待著錄的家譜已有其它機(jī)構(gòu)著錄過,則只需添加本機(jī)構(gòu)館藏信息如索書號(hào)、冊(cè)數(shù)、是全本還是殘本等說明。一方面減少了著錄人員的工作量,另一方面提升了家譜目錄數(shù)據(jù)的質(zhì)量,有利于系統(tǒng)按作品-實(shí)例-單件(復(fù)本)這樣的結(jié)構(gòu)生成書本式目錄,減輕了總目編纂人員的工作負(fù)擔(dān)。系統(tǒng)支持流程控制和質(zhì)量控制。編目工作的整個(gè)生命周期分為草稿,待初審,待定審三種狀態(tài)。著錄人員在著錄過程中,可以提交,也可以暫存為草稿。提交后,著錄工作單發(fā)送到機(jī)構(gòu)專家初審,機(jī)構(gòu)專家負(fù)責(zé)本機(jī)構(gòu)著錄工作的質(zhì)量控制,確認(rèn)無誤后,提交到編委會(huì)專家。編委會(huì)專家對(duì)各個(gè)機(jī)構(gòu)的著錄結(jié)果以出版的要求進(jìn)行第二次質(zhì)量控制,對(duì)有問題的著錄工作單進(jìn)行修改,確認(rèn)完成定審操作。定審后,數(shù)據(jù)就會(huì)實(shí)時(shí)同步到家譜知識(shí)服務(wù)平臺(tái)提供服務(wù)。除了單條目錄著錄外,系統(tǒng)也支持批量查重、批量數(shù)據(jù)導(dǎo)入、批量數(shù)據(jù)導(dǎo)出功能。

“聯(lián)合編目模式”適用于歷史文獻(xiàn)資源聯(lián)合目錄的共建共享,其優(yōu)點(diǎn)在于數(shù)據(jù)加工規(guī)范和格式的一致性,和在線協(xié)同工作方式的高效性,可以極大地避免重復(fù)建設(shè),提高工作效率。但系統(tǒng)的研發(fā)維護(hù)成本較高、對(duì)系統(tǒng)穩(wěn)定性和用戶體驗(yàn)要求較高。

3.4 ? ?數(shù)據(jù)中心模式

“數(shù)據(jù)中心模式”是從多源異構(gòu)數(shù)據(jù)中采集數(shù)據(jù),在云端建設(shè)統(tǒng)一的數(shù)據(jù)中心中,記錄數(shù)據(jù)來源,反過來再根據(jù)其來源鏈接處于不同網(wǎng)域中的資源,關(guān)聯(lián)開放數(shù)據(jù)云(Linked Open Data Cloud)即是一種典型的數(shù)據(jù)中心模式。

上海圖書館在數(shù)字人文的項(xiàng)目建設(shè)中,將人名、地名、時(shí)間、事件數(shù)據(jù)從不同的資源中抽取出來,分別建設(shè)了人名規(guī)范庫,地理名詞表,歷史紀(jì)年表,歷史文化事件知識(shí)庫,作為鏈接不同資源的數(shù)據(jù)中心。其中人名規(guī)范庫建設(shè)的初衷是提供互聯(lián)網(wǎng)環(huán)境下人名規(guī)范控制,后來逐步成為多源異構(gòu)資源的數(shù)據(jù)鏈接中心?,F(xiàn)已收錄人物共133萬余人,來自上海圖書館的中國家譜知識(shí)服務(wù)平臺(tái)、中文古籍聯(lián)合目錄及循證平臺(tái)、手稿檔案知識(shí)庫、上海年華系列專題庫、革命(紅色)文獻(xiàn)服務(wù)平臺(tái),融合了國家圖書館人名規(guī)范檔、哈佛大學(xué)中國歷代人物傳記資料庫(CBDB)、各種人名大辭典的數(shù)據(jù),另有浦東區(qū)圖書館、華東師范大學(xué)圖書館、韜奮紀(jì)念館等機(jī)構(gòu)也提供了部分人物數(shù)據(jù)。

人名規(guī)范庫作為數(shù)據(jù)中心體現(xiàn)在兩個(gè)方面,一是開放數(shù)據(jù)鏈接,通過一個(gè)人物鏈接到不同機(jī)構(gòu)不同網(wǎng)域中的資源,包括文獻(xiàn)資源、相關(guān)人物、故居等,以“馮契”的人物信息頁面為例,打開頁面,可以看出其小傳數(shù)據(jù)來自《中國近現(xiàn)代人物名號(hào)大辭典》、國家圖書館人名規(guī)范檔和華東師范大學(xué)名師庫,并鏈接到上海圖書館的各種館藏資源,以及其社會(huì)網(wǎng)絡(luò)關(guān)系中的人物(見圖2);二是開放數(shù)據(jù)服務(wù),人名規(guī)范庫作為上海圖書館歷史人文數(shù)據(jù)基礎(chǔ)設(shè)施的一部分,提供API、Sparql Endpoint、內(nèi)容協(xié)商等方式將人物信息封裝成數(shù)據(jù)消費(fèi)接口,供其他機(jī)構(gòu)或個(gè)人通過程序調(diào)用,按需獲取數(shù)據(jù),并用于自己的應(yīng)用環(huán)境中。

3.5 ? ?開放鏈接模式

開放鏈接模式是指資源收藏機(jī)構(gòu)與資源托管機(jī)構(gòu)在元數(shù)據(jù)層面進(jìn)行資源的共建共享,資源托管機(jī)構(gòu)負(fù)責(zé)對(duì)元數(shù)據(jù)進(jìn)行加工和平臺(tái)功能開發(fā),資源收藏機(jī)構(gòu)自行進(jìn)行資源掃描全文部分的開發(fā)并以開放鏈接的方式提供服務(wù)。

如哈佛大學(xué)哈佛燕京圖書館與上海圖書館的古籍項(xiàng)目合作就是采用開放鏈接的模式。哈佛燕京圖書館藏中文善本古籍特藏,一直以質(zhì)量之高、數(shù)量之大著稱于世,為方便海內(nèi)外學(xué)者便捷地利用這些資料進(jìn)行研究,哈佛大學(xué)燕京圖書館在特藏文獻(xiàn)資源的整理和服務(wù)方面也一直走在新技術(shù)應(yīng)用的前沿,有自己古籍館藏資源服務(wù)站點(diǎn),采用IIIF公開發(fā)布了數(shù)字化全文掃描影像,提供在線閱覽、標(biāo)注和下載服務(wù),古籍文獻(xiàn)有獨(dú)立的URL(http://nrs.harvard.edu/urn-3:FHCL:3622194),可全網(wǎng)域訪問和定位。故與上海圖書館合作時(shí),哈佛燕京圖書館將中文善本元數(shù)據(jù)記錄共享給上海圖書館,上海圖書館技術(shù)團(tuán)隊(duì)對(duì)其進(jìn)行了進(jìn)一步地?cái)?shù)據(jù)清洗和知識(shí)提取,提取元數(shù)據(jù)中的類別、作品、版本、責(zé)任者、索書號(hào)、IIIF全文瀏覽頁面鏈接等信息,按照上圖古籍本體的知識(shí)結(jié)構(gòu)進(jìn)行重組和RDF格式轉(zhuǎn)換,在上圖古籍聯(lián)合目錄及循證平臺(tái)上發(fā)布了單獨(dú)的哈佛燕京圖書館古籍目錄站點(diǎn)(https://gj.library.sh.cn/org/harvard),并在每種古籍的元數(shù)據(jù)詳情頁面加入哈佛燕京圖書館古籍的IIIF服務(wù)URL,鏈接到其已有的IIIF全文瀏覽頁面。通過這樣的合作,哈佛大學(xué)的用戶也可共享“中文古籍聯(lián)合目錄及循證平臺(tái)”上的所有開放內(nèi)容和功能。

若收藏機(jī)構(gòu)已對(duì)館藏資源進(jìn)行了一定程度的數(shù)字化或信息化開發(fā),無需重復(fù)建設(shè),且有提升影響力或提高資源利用率的意愿,可采用開放鏈接的合作模式,在元數(shù)據(jù)層面達(dá)成機(jī)構(gòu)間資源的融合與共享,以支持資源的統(tǒng)一檢索。這種合作模式的前提是收藏機(jī)構(gòu)在資源的信息化開發(fā)上有一定的成果并為每種資源提供開放訪問的URL和相應(yīng)的服務(wù)界面。

3.6 ? ?眾包模式

眾包模式是指公共文化機(jī)構(gòu)采用“眾包”的理念和用戶貢獻(xiàn)內(nèi)容(UGC)的技術(shù),充分吸納公眾的認(rèn)知盈余來實(shí)現(xiàn)共建共享。機(jī)構(gòu)將數(shù)字資源及建設(shè)需求發(fā)布至公共平臺(tái),公眾根據(jù)要求自發(fā)地進(jìn)行如抄錄、校對(duì)、標(biāo)引、捐贈(zèng)等工作,用戶貢獻(xiàn)的內(nèi)容由專家審核收集整理并發(fā)布至服務(wù)平臺(tái),取之于公眾,用之于公眾。上海圖書館的“歷史文獻(xiàn)眾包平臺(tái)”“中國家譜知識(shí)服務(wù)平臺(tái)”即是采用眾包模式進(jìn)行資源共建共享的例子。

歷史文獻(xiàn)眾包平臺(tái)構(gòu)建了一個(gè)既面向大眾又面向機(jī)構(gòu)的文獻(xiàn)資源共建共享平臺(tái),邀請(qǐng)公共文化機(jī)構(gòu)發(fā)布文獻(xiàn)圖像資源及元數(shù)據(jù)、吸引大眾參與文獻(xiàn)全文抄錄及元數(shù)據(jù)深度標(biāo)引,促進(jìn)大眾與文化機(jī)構(gòu)共同加工建設(shè)數(shù)字資源、分享再利用建設(shè)成果。平臺(tái)支持為不同的資源自定義元數(shù)據(jù)元素集,支持不同機(jī)構(gòu)上傳不同類型歷史文獻(xiàn)圖像資源及元數(shù)據(jù)信息,以任務(wù)的形式打包發(fā)布至平臺(tái)。大眾在平臺(tái)的任務(wù)廣場頁面(見圖3)選擇感興趣的文獻(xiàn)資源進(jìn)行全文抄錄、元數(shù)據(jù)字段標(biāo)引等數(shù)據(jù)加工。對(duì)于用戶貢獻(xiàn)內(nèi)容的質(zhì)量控制,平臺(tái)采用專家審核制度進(jìn)行人工審核修訂并將修訂結(jié)果反饋貢獻(xiàn)者,所有通過審核的數(shù)據(jù),都將作為資源發(fā)布機(jī)構(gòu)用于建設(shè)數(shù)字人文項(xiàng)目的數(shù)據(jù)基礎(chǔ),實(shí)現(xiàn)細(xì)粒度的、基于文獻(xiàn)內(nèi)容的服務(wù)。

借助該平臺(tái),上海圖書館與南京大學(xué)合作舉辦了“文化遺產(chǎn)數(shù)字化”競賽,將上海圖書館館藏“盛宣懷檔案”文獻(xiàn)發(fā)布至任務(wù)廣場,請(qǐng)南京大學(xué)組織高校學(xué)生參與文本抄錄。競賽吸引了南京大學(xué)、復(fù)旦大學(xué)、南開大學(xué)等多家高校的63位學(xué)生參與,最終完成256件文獻(xiàn)的文本抄錄工作。截止2020年年底,平臺(tái)發(fā)布手稿、信函、章程、諭旨等多種類型文獻(xiàn)資源627件,參與建設(shè)用戶200余人,完成全文抄錄422件,所有完成抄錄文獻(xiàn)都可在眾包平臺(tái)中閱覽全文。

“中國家譜知識(shí)服務(wù)平臺(tái)”的眾包模式資源共建共享體現(xiàn)在上傳家譜、在線識(shí)譜、在線修譜這三個(gè)功能,邀請(qǐng)大眾與機(jī)構(gòu)一起豐富家譜資源、并對(duì)家譜數(shù)據(jù)進(jìn)行深加工。

上傳家譜(在線捐贈(zèng))區(qū)別于郵件寄送、到館捐贈(zèng)等傳統(tǒng)家譜捐獻(xiàn)路徑,為大眾提供了便捷、規(guī)范的家譜捐獻(xiàn)窗口,同時(shí)方便了捐獻(xiàn)者和受贈(zèng)機(jī)構(gòu)。用戶只需根據(jù)網(wǎng)站規(guī)定格式上傳家譜影像圖片并提供譜籍地、責(zé)任者、裝訂等家譜信息即可捐獻(xiàn)家譜,為便于用戶理解,平臺(tái)為每個(gè)填寫字段都提供了說明文字及參考樣例,上傳家譜影像圖片也支持多種圖像格式。上傳后的家譜將交由家譜整理研究專家審核,通過審核的家譜即可設(shè)為館藏,數(shù)據(jù)進(jìn)入知識(shí)服務(wù)平臺(tái)對(duì)外提供服務(wù)。

在線修譜功能服務(wù)于有家譜修纂需求的用戶,提供規(guī)范化的家譜內(nèi)容輸入和世系表編輯,支持多人協(xié)作,并能按照不同的家譜體例如歐式、蘇式、寶塔式、牒記式,由系統(tǒng)自動(dòng)生成出版格式。

在線識(shí)譜是集眾人之力對(duì)平臺(tái)開放的數(shù)字化家譜全文中的世系表進(jìn)行文本化、結(jié)構(gòu)化,以便于生成可視化的家族樹或?yàn)檠芯空咛峁┝炕治龅慕Y(jié)構(gòu)化數(shù)據(jù)。世系表是家譜最重要的內(nèi)容之一,記錄歷代家族成員信息、成員關(guān)系、大事記等,蘊(yùn)藏了大量的信息,可為家譜數(shù)字人文分析提供大量數(shù)據(jù)依據(jù)。但由于譜系圖結(jié)構(gòu)復(fù)雜,傳統(tǒng)的文本識(shí)別方式僅能識(shí)別出文字但無法識(shí)別出結(jié)構(gòu)化的個(gè)人信息和人與人之間的關(guān)系,不能滿足其數(shù)據(jù)化需求,在線識(shí)譜功能支持廣大用戶協(xié)同識(shí)別世系表,獲得結(jié)構(gòu)化數(shù)據(jù),加速家世系表數(shù)據(jù)化進(jìn)程。

4 ? 結(jié)語

數(shù)字人文的勃興為GLAM領(lǐng)域的資源共建共享提出了新的需求,數(shù)字人文注重的不僅是資源的數(shù)字化,更是資源內(nèi)容的數(shù)據(jù)化和數(shù)據(jù)的大規(guī)模、全量級(jí)、細(xì)粒度、長時(shí)間和大空間的覆蓋,以及在此基礎(chǔ)上建設(shè)以資源、數(shù)據(jù)、知識(shí)為核心、以可持續(xù)性和開放性為保障、以滿足多樣化個(gè)性化的用戶需求為導(dǎo)向的數(shù)據(jù)基礎(chǔ)設(shè)施。過去那種自上而下的依賴政策和管理機(jī)制來實(shí)現(xiàn)不同機(jī)構(gòu)之間資源共建共享的方式已不能滿足需求。本文試圖通過上海圖書館的數(shù)字人文項(xiàng)目建設(shè)的實(shí)踐,探討一種利用現(xiàn)代信息技術(shù)自下而上地實(shí)現(xiàn)不同機(jī)構(gòu)甚至是團(tuán)體和個(gè)人之間的歷史文獻(xiàn)資源共建共享的路徑。總結(jié)提煉出的六種歷史文獻(xiàn)資源共建共享的模式,未必能解決資源共建共享中的所有問題,但有望能為業(yè)界提供另一種角度、另一種思路和參考案例。

參考文獻(xiàn):

[1] ?高波,劉茲恒,于麗鳳.網(wǎng)絡(luò)環(huán)境下我國圖書館信息資源共建共享現(xiàn)狀調(diào)查報(bào)告[J].中國圖書館學(xué)報(bào),2001,27(4):48-52.

[2] ?高波.文獻(xiàn)信息資源共建共享模式新論[J].中國圖書館學(xué)報(bào),2002(6):25-28.

[3] ?袁海波,孟連生.網(wǎng)絡(luò)環(huán)境下信息資源共建共享的實(shí)踐——兼述國家科技圖書文獻(xiàn)中心的建設(shè)與發(fā)展[J].情報(bào)學(xué)報(bào),2002,21(1):57-62.

[4] ?肖希明,完顏鄧鄧.以公共數(shù)字文化資源整合促進(jìn)基本公共文化服務(wù)均等化[J].圖書館,2015(11):22-25,31.

[5] ?肖希明,盧世晴.公共數(shù)字文化資源整合政策體系探討[J].圖書館,2015(9):1-5.

[6] ?韋楠華,吳高.公共數(shù)字文化資源共建共享現(xiàn)狀、障礙及對(duì)策研究[J].圖書館建設(shè),2018(9):18-26.

[7] ?吳高.地方公共數(shù)字文化特色資源建設(shè)現(xiàn)狀調(diào)查與思考——以全國文化信息資源共享工程省級(jí)分中心特色數(shù)字資源建設(shè)為例[J].圖書館建設(shè),2016(1):39-46.

[8] ?張??。哐?,周秀霞.國內(nèi)外數(shù)字資源發(fā)現(xiàn)平臺(tái)比較研究——以Trove,DPLA,Europeana,WDL和文津搜索為例[J].國家圖書館學(xué)刊,2018,27(1):86-96.

[9] ?Share your data[EB/OL].[2021-02-04].https://pro.europeana.eu/share-your-data/.

[10] ?Rapport dactivité 2019[EB/OL].[2021-02-04].https://www.bnf.fr/fr/ra2019-gallica-et-la-politique-de-diffusion-numerique-des-collections#bnf-l-offre-documentaire-et-les-fonctionnalit-s.

[11] ?Trove[EB/OL].[2021-02-04].https://trove.nla.gov.au/.

[12] ?李金芮,楊蕾.國外公共數(shù)字文化資源整合項(xiàng)目服務(wù)方式調(diào)查分析[J].圖書與情報(bào),2015(1):22-26.

[13] ?Our APIs[EB/OL].[2021-02-04].https://pro.europeana.eu/page/apis.

作者簡介:夏翠娟,女,上海圖書館研究館員,研究方向:元數(shù)據(jù)、知識(shí)本體、知識(shí)組織、關(guān)聯(lián)數(shù)據(jù)、數(shù)字人文、文化記憶;賀晨芝,女,上海圖書館工程師,研究方向:數(shù)字人文;劉倩倩,女,上海圖書館館員,研究方向:數(shù)字人文;朱武信,男,上海圖書館工程師,研究方向:數(shù)字人文。

本文系國家哲學(xué)社會(huì)科學(xué)基金項(xiàng)目“支撐城市記憶項(xiàng)目的‘?dāng)?shù)據(jù)基礎(chǔ)設(shè)施理論建構(gòu)與實(shí)踐探索”(項(xiàng)目編號(hào):19BTQ007 )研究成果之一。

收稿日期:2021-02-18;責(zé)任編輯:柴若熔

猜你喜歡
數(shù)字人文模式研究
數(shù)字人文時(shí)代公共圖書館經(jīng)典閱讀推廣研究
數(shù)字人文目標(biāo)下圖書館信息服務(wù)模式研究
數(shù)字學(xué)術(shù)與公眾科學(xué):數(shù)字圖書館新生態(tài)
跨界與融合:全球視野下的數(shù)字人文
跨界與融合:全球視野下的數(shù)字人文
大規(guī)模古籍文本在中國史定量研究中的應(yīng)用探索
多元文化教育背景下的國際學(xué)校主題班會(huì)模式研究
服裝設(shè)計(jì)智能化趨向及模式研究
基于精細(xì)化理念的沈陽市鄉(xiāng)村規(guī)劃編制與建設(shè)管理模式研究
高校內(nèi)部控制的定位與模式研究
锡林郭勒盟| 绵阳市| 治县。| 兴海县| 革吉县| 松滋市| 辽中县| 大足县| 上犹县| 阿瓦提县| 龙口市| 大关县| 武安市| 横峰县| 井研县| 延川县| 牙克石市| 满洲里市| 左权县| 博野县| 马公市| 静宁县| 左贡县| 博乐市| 昌都县| 海阳市| 石嘴山市| 内乡县| 怀安县| 达州市| 武清区| 怀集县| 沛县| 甘洛县| 淮南市| 古蔺县| 乌苏市| 平阳县| 宿迁市| 高青县| 三门县|