摘 要 借助數(shù)字技術(shù)對(duì)口述文獻(xiàn)進(jìn)行數(shù)字化,加強(qiáng)對(duì)口述資源的管理與利用,不僅是對(duì)口述歷史進(jìn)行搶救性記錄的重要措施,而且也是促進(jìn)歷史文化傳承與發(fā)展的新途徑。論文從文化驅(qū)動(dòng)、技術(shù)驅(qū)動(dòng)、理念驅(qū)動(dòng)三個(gè)方面論述了圖書館口述文獻(xiàn)數(shù)字化的必要性,認(rèn)為圖書館口述文獻(xiàn)數(shù)字化應(yīng)堅(jiān)持規(guī)范性、真實(shí)性、實(shí)用性、效率性、安全性等原則,論述了開展口述文獻(xiàn)數(shù)字化的具體方法,以期為當(dāng)前口述文獻(xiàn)數(shù)字化實(shí)踐提供借鑒與參考。
關(guān)鍵詞 口述文獻(xiàn);口述歷史;數(shù)字化
分類號(hào) G253
DOI 10.16810/j.cnki.1672-514X.2022.03.007
Discussion on the Digital Strategy of Oral Literature in the Library
Feng Yun
Abstract Digitizing oral literature with the digital technology and platform management to enhance the utilization of oral resources, which is not only an important measure to record oral history, but also a new way to promote the inheritance and development of history and culture. The paper discusses the necessity of digitization driving force from culture, technology and conception, considering that the digitization of library oral literature should adhere to the principles of standardization, authenticity, practicality, efficiency and safety, and discusses the specific method of developing oral literature digitization in order to provide reference for the current practice of oral literature digitization.
Keywords Oral literature. Oral history. Digitalize.
0 引言
口述歷史文獻(xiàn)(以下簡(jiǎn)稱“口述文獻(xiàn)”)是以筆錄、錄音、視頻等方式對(duì)訪談?wù)哌M(jìn)行口述采訪而形成的具有保存價(jià)值的原始資料。圖書館口述文獻(xiàn)收藏與整理實(shí)踐隨著口述歷史的興起不斷發(fā)展。20世紀(jì)40年代,口述歷史因其在歷史研究中的突出作用而在美國(guó)興起,其標(biāo)志是1948年歷史學(xué)家艾倫·內(nèi)文斯在美國(guó)哥倫比亞大學(xué)成立口述歷史研究室,該研究室所在的巴特勒?qǐng)D書館就致力于口述文獻(xiàn)的收藏與整理。隨后,口述歷史開始蔓延到東歐、非洲、亞洲、拉丁美洲等地,并廣泛被運(yùn)用于歷史學(xué)、社會(huì)學(xué)、人類學(xué)、新聞學(xué)等研究,又逐步擴(kuò)展到普通公眾個(gè)人和家庭口述歷史的記錄。隨著口述歷史項(xiàng)目的大量開展,口述文獻(xiàn)收藏與整理成為眾多圖書館、檔案館等文獻(xiàn)保存機(jī)構(gòu)的新命題。艾倫·斯溫曾就改進(jìn)圖書檔案工作提出建議:“如果檔案和圖書館想對(duì)自己的用戶進(jìn)行利益相關(guān)性與影響性的研究,那么就必須通過對(duì)口述歷史進(jìn)行積極的收集與開發(fā),以尋找和識(shí)別用戶所需要的資源。”[1]在計(jì)算機(jī)、互聯(lián)網(wǎng)和新媒體技術(shù)快速發(fā)展的今天,數(shù)字技術(shù)已經(jīng)廣泛滲透于口述歷史的采集、保存、加工、整理以及利用的各個(gè)環(huán)節(jié),可以說,口述歷史已經(jīng)邁入一個(gè)全新的數(shù)字時(shí)代,文本與非文本數(shù)字對(duì)象的相互交織使口述歷史呈現(xiàn)出一幅壯麗的數(shù)字記憶景觀[2]。借助數(shù)字技術(shù)與平臺(tái)對(duì)口述文獻(xiàn)進(jìn)行數(shù)字化,加強(qiáng)對(duì)口述資源的管理與利用,不僅是對(duì)口述歷史進(jìn)行搶救性記錄的重要措施,而且也是促進(jìn)歷史文化傳承與發(fā)展的新途徑。
1 研究現(xiàn)狀
隨著圖書館口述文獻(xiàn)收集與整理工作的逐漸展開,一些研究者開始總結(jié)口述文獻(xiàn)收藏與整理的經(jīng)驗(yàn),對(duì)口述文獻(xiàn)基礎(chǔ)理論、口述文獻(xiàn)收集與整理、口述文獻(xiàn)資源建設(shè)與利用等方面進(jìn)行了諸多探討。在基礎(chǔ)理論研究方面,丁海英分析了口述文獻(xiàn)的概念、性質(zhì)與價(jià)值[3];胡愛民、朱海燕等分析了口述文獻(xiàn)的發(fā)展、價(jià)值,以及高校圖書館圖書館開展口述文獻(xiàn)工作的重要意義[4]。在口述文獻(xiàn)收集與整理方面,全根先先生論述了口述文獻(xiàn)收集中口述史采訪在前期準(zhǔn)備、采訪過程、文本轉(zhuǎn)錄與編輯處理中應(yīng)該注意的問題[5],以及口述采訪中文獻(xiàn)收集工作的策略[6]。在口述文獻(xiàn)資源建設(shè)與利用方面,張一從資源采集模式、內(nèi)容主題分布、獲取方式等方面對(duì)我國(guó)圖書館口述文獻(xiàn)資源庫(kù)建設(shè)狀況進(jìn)行了調(diào)研,分析其特點(diǎn)與存在的問題,提出了加強(qiáng)我國(guó)圖書館口述文獻(xiàn)資源庫(kù)建設(shè)的建議[7]。田苗、韓尉等介紹了國(guó)內(nèi)外口述史機(jī)構(gòu)以及口述歷史項(xiàng)目的開展,重點(diǎn)介紹了中國(guó)記憶項(xiàng)目中心以及所開展“中國(guó)圖書館界重要人物專題”口述文獻(xiàn)建設(shè)情況,對(duì)圖書館口述文獻(xiàn)共建和機(jī)構(gòu)啟動(dòng)相關(guān)工作提供了重要參考[8]。以上研究說明我國(guó)圖書館界已經(jīng)深刻認(rèn)識(shí)到口述文獻(xiàn)工作的重要性,并由相關(guān)實(shí)踐引發(fā)了對(duì)理論研究的思考,但對(duì)口述文獻(xiàn)數(shù)字化的基本理論研究方面還有待拓展,特別是在口述資源元數(shù)據(jù)方案方面的論述還值得進(jìn)一步推進(jìn)。本研究選取口述文獻(xiàn)數(shù)字化為研究對(duì)象,論述口述文獻(xiàn)數(shù)字化的必要性、原則與方法,以期為我國(guó)圖書館口述文獻(xiàn)數(shù)字化工作提供理論依據(jù)。
2 圖書館口述文獻(xiàn)數(shù)字化的必要性
口述文獻(xiàn)數(shù)字化,是指以數(shù)字技術(shù)為手段,將現(xiàn)有口述文獻(xiàn)轉(zhuǎn)化為能夠供計(jì)算機(jī)識(shí)別與處理的數(shù)字化口述資源的過程與方法。隨著數(shù)字化技術(shù)日益廣泛和深入的應(yīng)用,在一定程度上變革了口述歷史采集、整理、管理、共享與傳播的方式。依托先進(jìn)的數(shù)字技術(shù),構(gòu)建口述文獻(xiàn)數(shù)字化平臺(tái),對(duì)于搶救與保存即將逝去的歷史記憶、構(gòu)建我國(guó)口述記憶資源庫(kù)以及促進(jìn)口述資源的共享利用均有重要意義??傮w來講,推進(jìn)圖書館口述文獻(xiàn)數(shù)字化工作,緣于文化、技術(shù)與理念三方面力量的驅(qū)動(dòng)。
2.1 文化驅(qū)動(dòng)
文化是一個(gè)國(guó)家、一個(gè)民族的靈魂,而保存人類文化遺產(chǎn)是圖書館的首要社會(huì)職能。從一定意義上來說,歷史即是文化。美國(guó)文化學(xué)家愛爾烏德認(rèn)為:“文化是由傳遞而普遍遺留下去的,并且漸次連接于語(yǔ)言媒介的團(tuán)體傳說中。因此,文化在團(tuán)體中,是一種累積的東西,而文化之對(duì)于個(gè)人則是一種和同伴交互影響后,所獲得或?qū)W習(xí)的思想行動(dòng)的習(xí)慣。”[9]由此可見,文化的形成離不開傳遞與累積,而口述歷史的特點(diǎn)是通過口述的方式達(dá)到歷史記憶的挖掘與傳遞,由此構(gòu)成文化累積的重要基礎(chǔ)。因此,口述歷史在一定程度上也是一種重要的文化資源。特別是對(duì)于那些無(wú)文字民族歷史來說,其歷史文化主要依靠神話、故事、民間傳說、歌謠、諺語(yǔ)來傳承,口述歷史在傳承本民族歷史文化方面的作用尤為突出。此外,口述歷史由于其活態(tài)傳承性,也是重要的非物質(zhì)文化遺產(chǎn)。然而,隨著科技經(jīng)濟(jì)的快速發(fā)展以及現(xiàn)代化進(jìn)程的加快,眾多民族的非物質(zhì)文化遺產(chǎn)與口頭文化遺產(chǎn)正在消亡。通過數(shù)字化的方式及時(shí)對(duì)非遺文化以及口頭文化進(jìn)行記錄與保存,將有利于搶救文化遺產(chǎn),創(chuàng)新文化傳承方式。
2.2 技術(shù)驅(qū)動(dòng)
在口述歷史的發(fā)展過程中,口述歷史與數(shù)字技術(shù)早已密不可分。從口述歷史由錄音時(shí)代、錄像時(shí)代到網(wǎng)絡(luò)時(shí)代的發(fā)展歷程來看[10],技術(shù)始終是推動(dòng)口述歷史實(shí)踐前進(jìn)的重要力量。甚至可以說,技術(shù)是窺探口述歷史發(fā)展史的一面鏡子,口述歷史的發(fā)展即是一部技術(shù)變遷史。隨著信息技術(shù)的發(fā)展以及口述歷史項(xiàng)目的廣泛開展,數(shù)字技術(shù)已經(jīng)覆蓋了口述歷史收集與管理的全過程,數(shù)字化記錄、數(shù)字化存儲(chǔ)、數(shù)字化管理、數(shù)字化獲取與利用已經(jīng)成為數(shù)字時(shí)代口述歷史的重要特征。數(shù)字技術(shù)的不斷更迭與發(fā)展,已經(jīng)成為用戶獲取信息、文化與知識(shí)的重要載體與工具,不斷革新著文化傳遞和傳承的方式。為了滿足現(xiàn)代用戶的文化需求與體驗(yàn)感,亟需借用現(xiàn)代技術(shù)使口述歷史產(chǎn)品和成果以人們喜聞樂見的形式產(chǎn)出與呈現(xiàn)。在以數(shù)字化技術(shù)為支撐的數(shù)字信息潮流到來之際,融合新數(shù)字技術(shù),構(gòu)建口述歷史數(shù)字化平臺(tái),已經(jīng)成為口述歷史發(fā)展的必然選擇。
2.3 理念驅(qū)動(dòng)
縱觀我國(guó)圖書館事業(yè)發(fā)展,理念是推動(dòng)圖書館發(fā)展轉(zhuǎn)型變革的重要因素。從根本上說,圖書館服務(wù)理念與發(fā)展理念的轉(zhuǎn)變,為圖書館口述文獻(xiàn)數(shù)字化提供了動(dòng)力。從服務(wù)理念來講,圖書館開展口述文獻(xiàn)數(shù)字化工作,是變“被動(dòng)服務(wù)”為“主動(dòng)服務(wù)”的重要表現(xiàn)。傳統(tǒng)圖書館主要以文獻(xiàn)收藏為主,多圍繞靜態(tài)的紙質(zhì)資源提供服務(wù),而數(shù)字化口述文獻(xiàn)工作本身就是圖書館為滿足讀者需求、擴(kuò)充特色館藏的主動(dòng)過程,數(shù)字化后所生成的口述資源最終以文本、音頻、視頻、圖片、動(dòng)畫等多種方式呈現(xiàn),成為一種可以被收聽或欣賞的動(dòng)態(tài)立體化資源,滿足讀者多元化、多層次文化需求,體現(xiàn)了圖書館由被動(dòng)轉(zhuǎn)向主動(dòng)的服務(wù)理念轉(zhuǎn)變。從圖書館發(fā)展理念來看,積極拓展圖書館工作領(lǐng)域,開展口述文獻(xiàn)數(shù)字化工作是圖書館可持續(xù)發(fā)展的重要措施。開展口述文獻(xiàn)數(shù)字化工作不僅可以有效促進(jìn)記憶資源的數(shù)字化傳播與傳承,提升用戶數(shù)字素養(yǎng),為歷史研究提供更多的智力支撐等,而且在一定程度上有助于拓展圖書館的業(yè)務(wù)工作范圍與服務(wù)內(nèi)容,增強(qiáng)圖書館的核心競(jìng)爭(zhēng)力。
3 圖書館口述文獻(xiàn)數(shù)字化的原則
圖書館對(duì)口述文獻(xiàn)進(jìn)行數(shù)字化的根本目的是為了最大限度挖掘和發(fā)揮口述資源的價(jià)值。為了確保口述文獻(xiàn)數(shù)字化的質(zhì)量,在數(shù)字化的過程中應(yīng)力求實(shí)現(xiàn)口述資源準(zhǔn)確、方便、快捷地利用,保證口述資源能與其他數(shù)字平臺(tái)資源實(shí)現(xiàn)共享,滿足用戶獲取和利用的需求。在數(shù)字化的過程中,為了提升數(shù)字化的效率,并促進(jìn)口述數(shù)字資源的共建共享,應(yīng)堅(jiān)持以下原則。
3.1 規(guī)范性原則
規(guī)范性要求是開展口述文獻(xiàn)數(shù)字化的基本要求,也是確保口述文獻(xiàn)可用性的基本條件。只有在行業(yè)標(biāo)準(zhǔn)規(guī)范的框架下進(jìn)行口述文獻(xiàn)數(shù)字化,才能最大限度地挖掘口述資源的利用價(jià)值。當(dāng)前在數(shù)字化領(lǐng)域已經(jīng)出臺(tái)了基本的要求和規(guī)范,如在檔案數(shù)字化方面,國(guó)家檔案局于2005年4月30日發(fā)布了檔案行業(yè)標(biāo)準(zhǔn)《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》(DA/T31-2005)[11]。隨著口述歷史實(shí)踐在國(guó)內(nèi)外的陸續(xù)開展,一些口述歷史數(shù)字化方面的規(guī)范和參考文件也相繼出臺(tái)。例如,美國(guó)口述歷史協(xié)會(huì)制定了旨在規(guī)范口述訪談開展的《口述歷史的原則和最優(yōu)實(shí)踐》,我國(guó)國(guó)家圖書館所開展的中國(guó)記憶項(xiàng)目也制定了《口述史料采訪規(guī)范》《影像資源采集規(guī)范》等標(biāo)準(zhǔn)規(guī)范??谑鑫墨I(xiàn)必須按照既定的技術(shù)模式、文件格式和標(biāo)準(zhǔn)進(jìn)行數(shù)字化,并盡可能采用通用標(biāo)準(zhǔn)。2017年國(guó)家檔案館頒布了行業(yè)標(biāo)準(zhǔn)《口述史料采集與管理規(guī)范》(DA/T 59—2017),對(duì)口述史料資源的采集規(guī)劃(包括采集范圍、采集主題、采集方案)、采集流程(包括確定口述者、采集準(zhǔn)備、采集實(shí)施、采集整理)、口述史料的收集方式、口述史料的保存與管理利用等方面作了較為明確和詳盡的要求,并在文后附有規(guī)范性附錄《口述史料采集協(xié)議書》 《采集信息表》以及《口述史料機(jī)讀目錄數(shù)據(jù)庫(kù)機(jī)構(gòu)及字段一覽表》,為口述文獻(xiàn)整理與編目提供有益參考[12]。
3.2 真實(shí)性原則
口述歷史之所以被歷史研究重視,就是因?yàn)槠渚哂袩o(wú)可替代的真實(shí)性,能夠如實(shí)反映真實(shí)的社會(huì)意識(shí)與存在,為接近更可靠、更可信的歷史提供了可能。數(shù)字化是對(duì)原始口述文獻(xiàn)信息的存在形式的轉(zhuǎn)變,使其轉(zhuǎn)換成能被數(shù)字設(shè)備解讀的數(shù)字形式。這種轉(zhuǎn)變依賴于對(duì)原始資料的忠誠(chéng)度,而隨意的數(shù)字化將導(dǎo)致數(shù)字化內(nèi)容與原件內(nèi)容不一致的情況,造成口述文獻(xiàn)某種程度的失真,從而大大降低口述資源的利用價(jià)值。因此,在對(duì)口述文獻(xiàn)進(jìn)行數(shù)字化過程中,必須嚴(yán)格堅(jiān)守真實(shí)性原則。具體來講,在采訪的過程中應(yīng)如實(shí)記錄口述者的敘述,在整理過程,尤其是對(duì)口述文獻(xiàn)進(jìn)行數(shù)字化轉(zhuǎn)錄過程中,必須遵照口述者的錄音原文,不能隨意刪減和杜撰,最大程度還原口述者的訪談?dòng)涗洝?/p>
3.3 實(shí)用性原則
口述歷史數(shù)字化的目的是為了更便于用戶利用,應(yīng)從實(shí)用性出發(fā),明確口述文獻(xiàn)數(shù)字化的目的以及受眾目標(biāo),有效評(píng)估口述資源對(duì)歷史研究和其他用戶的利用價(jià)值,從而制定相應(yīng)的數(shù)字化方案。用戶對(duì)口述資源的利用方式有多種,如轉(zhuǎn)錄抄本、音頻、視頻、照片、索引或其他材料,因此,口述數(shù)字資源應(yīng)盡可能以多種形式進(jìn)行創(chuàng)建。
3.4 效率性原則
口述文獻(xiàn)數(shù)字化工作是一項(xiàng)需要耗費(fèi)人力、物力和財(cái)力的工程,尤其是對(duì)于圖書館、檔案館等口述歷史保存機(jī)構(gòu)來講,往往面臨著數(shù)字化經(jīng)費(fèi)不足、專業(yè)人員緊缺的困境。因此,在口述文獻(xiàn)的數(shù)字化上,應(yīng)最大限度地物盡其用,充分提升數(shù)字化的效率。應(yīng)在充分調(diào)研的基礎(chǔ)上選擇最優(yōu)化的數(shù)字化方案,包括最優(yōu)化的工作流程、最合理的文件格式、最有效的數(shù)字存儲(chǔ)模式以及高效、經(jīng)濟(jì)的數(shù)字化系統(tǒng)[11]。在此基礎(chǔ)上,促進(jìn)口述文獻(xiàn)數(shù)字化專業(yè)化與社會(huì)化相結(jié)合。一般來講,一些大型的口述歷史保存機(jī)構(gòu)通過自主研發(fā)或是購(gòu)買的方式擁有口述歷史資源數(shù)字化管理應(yīng)用的數(shù)字化平臺(tái),如美國(guó)肯塔基大學(xué)圖書館的Louie B. Nunn口述歷史中心自主研發(fā)了口述歷史元數(shù)據(jù)同步器系統(tǒng),并在多個(gè)圖書館得到推廣應(yīng)用[13]。然而,對(duì)于一些小型的口述歷史保存機(jī)構(gòu)來講,由于經(jīng)費(fèi)有限,或是技術(shù)力量支撐不夠,需要通過相互合作或通過外部的數(shù)字化公司來解決數(shù)字化任務(wù),從而降低口述文獻(xiàn)數(shù)字化的成本。
3.5 安全性原則
口述歷史的數(shù)字化過程也涉及到數(shù)據(jù)安全的問題。由于硬盤故障、服務(wù)器故障、軟件更新、黑客攻擊、數(shù)據(jù)損壞等問題,極易導(dǎo)致數(shù)據(jù)讀取的失敗或是丟失,而不加限制的訪問也會(huì)產(chǎn)生數(shù)字版權(quán)糾紛等問題。因此,在數(shù)字化的過程中,應(yīng)充分考慮到以上問題,做好數(shù)據(jù)庫(kù)的兼容、軟件更新、數(shù)據(jù)的備份和存儲(chǔ)以及訪問權(quán)限的管理等,同時(shí),所有工作人員需簽署保密協(xié)議,建設(shè)單位與受訪人、相關(guān)文獻(xiàn)提供者需簽訂相關(guān)授權(quán)書及法律協(xié)議,尊重受訪者權(quán)益,保證所有口述歷史數(shù)據(jù)資源處于安全的使用環(huán)境。
4 圖書館開展口述文獻(xiàn)數(shù)字化的方法
圖書館對(duì)口述歷史文獻(xiàn)進(jìn)行數(shù)字化過程中,一般來說,應(yīng)將其所有信息完整地準(zhǔn)確記錄下來,不僅要為用戶提供最為真實(shí)而完整的信息,也要便于用戶利用與檢索,滿足用戶對(duì)口述資源的多樣化需求。
4.1 根據(jù)口述文獻(xiàn)類型,選擇合適的數(shù)字化技術(shù)方案
一般來講,口述文獻(xiàn)的類型包括以紙質(zhì)印刷形態(tài)存在的口述訪談轉(zhuǎn)錄抄本以及以錄音、錄像形態(tài)存在的口述采訪記錄,此外,還包括與口述歷史項(xiàng)目主題相關(guān)的其他背景性資料,如照片、個(gè)人手稿、信件等,涉及文本、圖片以及音像資料等多種類型。對(duì)于不同類型的口述文獻(xiàn),應(yīng)選用具有針對(duì)性的數(shù)字化技術(shù)方案。對(duì)于紙質(zhì)印刷型口述文獻(xiàn),可采用鍵盤輸入或文字識(shí)別技術(shù)轉(zhuǎn)換為能夠被計(jì)算機(jī)識(shí)別的數(shù)字文本。對(duì)于音像類型的聲音和錄像口述文獻(xiàn),可采用標(biāo)準(zhǔn)的數(shù)字化音視頻文件格式對(duì)其進(jìn)行轉(zhuǎn)換。例如,常用純文本格式為txt,格式化文本格式為doc、wps、rtf等,音視頻文件格式常用的是WAV格式,音頻使用最多的是MP3格式。應(yīng)注意的是,每一種音視頻格式都需要相應(yīng)的編碼軟件和播放軟件,出于口述資源永久保存的考慮,應(yīng)選擇具有強(qiáng)有力支軟件支撐和技術(shù)支持的數(shù)字格式標(biāo)準(zhǔn),以便用戶能夠正常播放與使用[14]。
4.2 確定合理的數(shù)字化采集策略
所謂口述資源的采集,是指根據(jù)特定需求和目的,將分散的口述資源采集與積聚起來的過程。口述資源采集是后續(xù)資源開發(fā)與利用的重要基礎(chǔ)。在對(duì)口述文獻(xiàn)進(jìn)行數(shù)字化的過程中,除了將現(xiàn)有紙質(zhì)與音像類型的口述文獻(xiàn)采用數(shù)字化技術(shù)手段轉(zhuǎn)化為數(shù)字資源外,還可借助數(shù)字化采集軟件與平臺(tái)直接生成口述資源。國(guó)外口述歷史領(lǐng)域已經(jīng)涌現(xiàn)一大批專業(yè)的口述資源數(shù)字化采集工具,如 Oracle APEX、StoryCorps、Historymaker等。這些軟件和平臺(tái)在各個(gè)口述歷史項(xiàng)目中被廣泛采用,受到用戶的一致好評(píng)。其中,Oracle Application Express (APEX)在線資源采集平臺(tái)由美國(guó)民俗中心的職業(yè)民俗項(xiàng)目自主研發(fā),提供了一個(gè)強(qiáng)大的數(shù)據(jù)化平臺(tái),能夠?qū)崿F(xiàn)對(duì)全國(guó)各個(gè)機(jī)構(gòu)和用戶口述資源的分布式采集[15]。截至2019年7月,職業(yè)民俗項(xiàng)目已收藏來自世界各地超過600萬(wàn)張照片、手稿、錄音和動(dòng)態(tài)圖像,并將所采集的資源提交給美國(guó)國(guó)會(huì)圖書館保存,在官方網(wǎng)站上進(jìn)行發(fā)布并提供利用[16]。近年來,網(wǎng)絡(luò)應(yīng)用程序(App)的開發(fā)與應(yīng)用極大地方便了個(gè)人制作口述歷史。美國(guó)民間口述歷史推動(dòng)機(jī)構(gòu)故事團(tuán)(StoryCorps)于2015年發(fā)布了免費(fèi)手機(jī)應(yīng)用程序“StoryCorps”,用戶通過下載安裝StoryCorps程序就可以實(shí)現(xiàn)個(gè)人口述歷史的制作和分享,分步實(shí)現(xiàn)口述歷史的在線采集、編輯、保存與分享[17]。Historymakers則提供了另外一種采集口述歷史的視角和方式,系統(tǒng)收集了9000余小時(shí)的非裔美國(guó)人口述訪談,并采用先進(jìn)的歸檔方式將口述訪談進(jìn)行數(shù)字化,對(duì)音頻片段(而不是整個(gè)采訪)創(chuàng)建檔案含義以及常識(shí)性索引,并與其他口述歷史訪談進(jìn)行鏈接[18]。在移動(dòng)終端與媒體技術(shù)日益發(fā)展的今天,可通過開發(fā)或是引進(jìn)成熟的數(shù)字資源采集軟件或平臺(tái),加大口述資源的采集力度。
4.3 設(shè)計(jì)科學(xué)合理的元數(shù)據(jù)方案
口述數(shù)字資源通常以數(shù)據(jù)庫(kù)的方式進(jìn)行存儲(chǔ)、展示與利用,以對(duì)象數(shù)據(jù)與元數(shù)據(jù)兩種形式存在。對(duì)象數(shù)據(jù)是指數(shù)字化的文本、圖像、聲音、影像等,主要描述口述資源的類型;元數(shù)據(jù)是指關(guān)于數(shù)據(jù)的數(shù)據(jù),主要用來描述和管理對(duì)象數(shù)據(jù)[19]。因此,選擇科學(xué)合理的元數(shù)據(jù)方案對(duì)于口述資源的管理與利用至關(guān)重要。目前,口述資源組織與描述方案主要有都柏林核心(DC)、MARC21、資源描述與檢索(Resource Description and Access,RDA)等。元數(shù)據(jù)“關(guān)聯(lián)”能夠較好地將不同類型的資源進(jìn)行整合和鏈接,更加適合數(shù)字網(wǎng)絡(luò)環(huán)境下口述資源的編目與描述,因此日益成為口述歷史資源編目的最佳選擇。我國(guó)目前已有的口述歷史數(shù)據(jù)庫(kù)更傾向于利用元數(shù)據(jù)進(jìn)行口述數(shù)字資源的組織,例如中國(guó)國(guó)家圖書館的“中國(guó)記憶”、美國(guó)的 Mountain west digital library、Florida Voices 均采用 DC進(jìn)行口述資源的編目與描述[20]。為了便于口述資源的共享與利用,可基于都柏林核心元數(shù)據(jù)構(gòu)建合適我國(guó)數(shù)字資源管理環(huán)境的元數(shù)據(jù)方案。從口述資源利用的角度來講,元數(shù)據(jù)應(yīng)能夠呈現(xiàn)口述資源的全貌,包括對(duì)口述歷史訪談內(nèi)容的描述、對(duì)背景信息的描述,并兼顧使用版權(quán)方面的考慮。基于以上考慮,口述歷史資源元數(shù)據(jù)可分為三個(gè)部分:基礎(chǔ)部分、擴(kuò)展部分與補(bǔ)充部分。其中,基礎(chǔ)部分是指描述口述歷史資源的常規(guī)內(nèi)容,一般包括題名、主題詞、摘要、關(guān)鍵詞、所屬類別、口述者、語(yǔ)種、采訪時(shí)間、采訪地點(diǎn)、訪談時(shí)長(zhǎng)、資源類型、比特率、分辨率、文件大小等,擴(kuò)展部分包括口述者簡(jiǎn)介、典藏地點(diǎn)、整理上傳者、抄本記錄、抄本鏈接等,補(bǔ)充部分包括使用條款、權(quán)限限制、推薦引用格式、其他作品等,詳見表1。
4.4 選擇合適的數(shù)字內(nèi)容管理系統(tǒng)
在數(shù)字環(huán)境下,口述資源集合需要選擇合適的數(shù)字內(nèi)容管理系統(tǒng)進(jìn)行口述數(shù)字資源的采集、保存、組織與提供利用[21]。數(shù)字內(nèi)容管理系統(tǒng)(Digital Content Management Systems,DCMS)是在線管理數(shù)字內(nèi)容(文本、圖像、音頻和視頻等)并提供在線展示的一種方式,用戶可對(duì)數(shù)字對(duì)象進(jìn)行添加、更改或做其他的處理[22]。目前,常用的口述歷史內(nèi)容管理系統(tǒng)主要有WordPress、Drupal、Omeka 、CONTENTdm等。不同的內(nèi)容管理系統(tǒng)各有特點(diǎn),其應(yīng)用范圍不同,有的用于大型口述歷史數(shù)字資源的收藏,而有的適用于構(gòu)建小型的口述歷史數(shù)據(jù)庫(kù)和展示音頻文件。其中,WordPress因其具有強(qiáng)大的開源社區(qū)以及多樣化的插件功能,通常用于大型口述歷史前端網(wǎng)站與口述收藏樣本的展示。例如,美國(guó)肯塔基大學(xué)的數(shù)字時(shí)代的口述歷史(Oral History in the Digital Age,OHDA)[23]網(wǎng)站就是應(yīng)用WordPress所創(chuàng)建。Drupal最顯著的功能是其高度的靈活性與擴(kuò)展性,擁有處理大量數(shù)字對(duì)象集合的能力,通常用于大型的口述歷史項(xiàng)目,成為圖書館、檔案館、博物館圖書館口述歷史項(xiàng)目的首選[24]。美國(guó)伊利諾伊州博物館“音像谷倉(cāng)”口述歷史項(xiàng)目( Illinois State Museum oral history project, Audio-Video Barn)就是基于Drupal平臺(tái)所創(chuàng)建,用于記錄和保存伊利諾伊州農(nóng)業(yè)和農(nóng)村生活的口述歷史。為了提供靈活的導(dǎo)航和利用,該項(xiàng)目使用數(shù)字索引軟件剪裁器,將每個(gè)口述訪談音頻或視頻按照主題剪輯成為長(zhǎng)度在30秒到12分鐘不等的片段,并按照受控詞表對(duì)每個(gè)片段進(jìn)行主題索引,最后將數(shù)據(jù)導(dǎo)入到Drupal平臺(tái),通過該平臺(tái)所支持的插件模塊進(jìn)行口述訪談的顯示、組織、搜索等[25]。Omeka是一款能夠進(jìn)行數(shù)字收藏共享和創(chuàng)建豐富數(shù)字收藏在線展覽的開源網(wǎng)絡(luò)出版平臺(tái),其主要特點(diǎn)在于免費(fèi)、易于安裝、界面友好且擁有靈活多變的元數(shù)據(jù)功能,能夠快速將口述歷史收藏在網(wǎng)上進(jìn)行發(fā)布,并允許用戶自由開發(fā)和使用插件以滿足個(gè)性化定制的需要[26]。對(duì)于圖書館、博物館、檔案館以及個(gè)人用戶來說,Omeka是管理和展示口述歷史數(shù)字集合的極好選擇。例如,由美國(guó)佛羅里達(dá)州政府、圖書館和信息部門聯(lián)合開展的佛羅利達(dá)記憶項(xiàng)目就是應(yīng)用Omeka所創(chuàng)建,該口述項(xiàng)目已經(jīng)成為目前Omeka最大的公共項(xiàng)目之一[27]。因此,選擇何種口述數(shù)字資源內(nèi)容管理系統(tǒng)取決于所擁有的資源數(shù)量以及建立數(shù)據(jù)庫(kù)的目的。
目前我國(guó)尚未開發(fā)設(shè)計(jì)出統(tǒng)一的口述歷史數(shù)字內(nèi)容管理系統(tǒng),大部分還是采用傳統(tǒng)的數(shù)字圖書館管理系統(tǒng),存在功能單一、利用效率不高等問題,難以滿足復(fù)雜的管理和利用需要。因此,為了提升口述歷史資源庫(kù)建設(shè)水平,可考慮與軟件公司聯(lián)合開發(fā)專業(yè)的平臺(tái)和系統(tǒng),也可以在對(duì)國(guó)內(nèi)外口述資源管理平臺(tái)和系統(tǒng)進(jìn)行調(diào)研的基礎(chǔ)上,結(jié)合自身需求購(gòu)買或引進(jìn)適合自身的專業(yè)化平臺(tái)和系統(tǒng)。
4.5 口述數(shù)字資源的安全管理
出于口述歷史法律與倫理層面的考慮,圖書館在口述文獻(xiàn)數(shù)字化過程中應(yīng)著重注意口述數(shù)字資源的安全管理問題。安全管理包括口述資源保存的安全,以及獲取與利用的安全。為了保證口述資源免遭黑客攻擊以及非法使用,通常要對(duì)口述資源的建設(shè)與利用實(shí)施權(quán)限管理,通過設(shè)置管理者的權(quán)限、不同用戶組的權(quán)限以及不同版本使用權(quán)限等來保護(hù)口述資源的安全使用。權(quán)限管理包括酌情提供或限制訪問權(quán)限,并隨著版權(quán)和安全級(jí)別的變化而改變?cè)L問權(quán)限。特別是在涉及保護(hù)問題的情況下,一些口述文獻(xiàn)保存機(jī)構(gòu)還利用元數(shù)據(jù)來對(duì)口述資源進(jìn)行管理加密、水印、數(shù)字簽名等,將版權(quán)、倫理、安全與隱私等問題充分考慮其中。例如,美國(guó)民俗中心在使用 APEX 在線平臺(tái)采集職業(yè)民俗口述文獻(xiàn)過程中,為了確保該平臺(tái)免遭非法用戶訪問,對(duì)平臺(tái)設(shè)定了用戶身份驗(yàn)證和訪問控制等權(quán)限。同時(shí),與美國(guó)國(guó)會(huì)圖書館建立服務(wù)器托管關(guān)系,通過該平臺(tái)軟件所采集的所有口述資源將由美國(guó)國(guó)會(huì)圖書館的IT協(xié)議進(jìn)行備份,口述資源在遭遇非法攻擊或意外災(zāi)害時(shí),可通過美國(guó)國(guó)會(huì)圖書館服務(wù)器上的備份進(jìn)行快速恢復(fù),從而確保了口述資源的安全性[28]。
綜上所述, 圖書館開展口述文獻(xiàn)數(shù)字化工作緣于文化、技術(shù)以及理念的共同驅(qū)動(dòng),對(duì)口述文獻(xiàn)進(jìn)行數(shù)字化工作的開展應(yīng)堅(jiān)持規(guī)范性、真實(shí)性、實(shí)用性、效率性、安全性等原則,確保口述資源建設(shè)能夠方便、快捷地供用戶所使用。當(dāng)前我國(guó)圖書館界對(duì)口述資源的數(shù)字存儲(chǔ)和傳播尚處于摸索發(fā)展階段, 與新媒體技術(shù)、數(shù)字人文技術(shù)等先進(jìn)技術(shù)的融合度較低,因此需要進(jìn)一步轉(zhuǎn)變思維方式,加強(qiáng)口述歷史資源數(shù)據(jù)庫(kù)的構(gòu)建,促進(jìn)口述歷史的多樣化展示與傳播。
參考文獻(xiàn)
SWAIN E D.Oral history in the archives: its documentary role in the twenty-first century[J].The American Archivist.2003(1):139-158.
馮云.數(shù)字時(shí)代口述歷史的價(jià)值與問題[J].圖書館建設(shè),2021(3):26-33.
丁海英.口述文獻(xiàn)及其價(jià)值[J].群文天地,2012(19):122-125.
胡愛民,朱海燕,李師龍.高校圖書館開展口述文獻(xiàn)資源建設(shè)的意義、價(jià)值和策略[J].圖書館工作與研究,2016(7):100-104.
全根先.口述史采訪需要注意的幾個(gè)問題[J].圖書館理論與實(shí)踐,2019(1):10-15.
全根先.口述史采訪中的文獻(xiàn)收集工作[J].高校圖書館工作,2019(6):27-32.
張一.網(wǎng)絡(luò)環(huán)境下我國(guó)圖書館口述文獻(xiàn)資源庫(kù)建設(shè)調(diào)研與分析[J].圖書館工作與研究,2017(12):54-61.
田苗,韓尉,戴曉曄.口述史學(xué)科發(fā)展背景下的中國(guó)圖書館界口述文獻(xiàn)建設(shè)概述[J].圖書情報(bào)知識(shí),2020(5):34-41.
鐘兆麟.文化進(jìn)化論[M].上海:世界書局,1932:11.張?jiān)婈?yáng).從錄音機(jī)到萬(wàn)維網(wǎng):口述歷史技術(shù)載體的變遷及其影響[J].高校圖書館工作,2018(3):52-56.
趙明赫.概論檔案信息數(shù)字化的目的和要求[J].黑龍江史志,2013(9):56.
丁鈺鑌.《口述史料采集與管理規(guī)范》解讀[J].中國(guó)檔案,2018(10):22-23.
馮云,張孝飛.社區(qū)口述歷史:高校圖書館創(chuàng)新發(fā)展的新領(lǐng)地[J].圖書館工作與研究,2019(5):14-18.
周拴龍. 文獻(xiàn)數(shù)字化理論與技術(shù)[M]. 北京:線裝書局, 2007:205-206.
GROCE N , LYONS B. Designing a national online oral history collecting initiative: the occupational folklore project at the American folklife center[J]. Oral History Review, 2013(1):54-66.
Collections & Research Services: The Archive of Folk Culture[EB/OL].[2021-04-28].https://www.loc.gov/folklife/archive.html.
StoryCorps[EB/OL].[2021-04-30].https://storycorps.org/about/.
TEBEAU M. Case study: “visualizing oral history”[EB/OL].[2021-04-30].http://ohda.matrix.msu.edu/2012/06/visualizing-oral-history/.
趙捷,蘆曉,張金治.地方文獻(xiàn)數(shù)字化的實(shí)現(xiàn)方法與途徑[J].數(shù)字與縮微影像,2007(2):1-4.
胡立耘.基于口述歷史的圖書館延伸服務(wù)[J].圖書館,2015(12):15-22.
陳鶴杰,喬?hào)|亮,秦必瑜. 構(gòu)建具有“數(shù)字內(nèi)容管理”特色的信息管理與信息系統(tǒng)專業(yè)[A]. 北京市高等教育學(xué)會(huì)[C]//著力提高高等教育質(zhì)量,努力增強(qiáng)高校創(chuàng)新與服務(wù)能力——北京市高等教育學(xué)會(huì)2007年學(xué)術(shù)年會(huì)論文集(上冊(cè)).北京:北京市高等教育學(xué)會(huì),2008:6.
REHBERGER D. Getting oral history online: Collections management applications[J].Oral History Review,2013(1):83-94.
Oral history in the digital age[EB/OL].[2021-04-29].http://ohda.matrix.msu.edu/.
Drupal[EB/OL].[2021-04-30]https://www.drupal.org/.
Sharing stories: putting the Illinois State Museum audio-video barn on-line[EB/OL].[2021-04-30].http://www.archimuse.com/mw2010/papers/schroeder/schroeder.html.
Omekal[EB/OL].[2021-04-30].https://omeka.org/.
邱建華.Omeka系統(tǒng)在數(shù)字人文研究中的應(yīng)用剖析[J].情報(bào)探索,2019(10):104-109.
張義,張渝珩. 基于在線平臺(tái)的美國(guó)民俗中心職業(yè)民俗口述文獻(xiàn)采集研究[J]. 圖書館雜志, 2020(2): 98-104.