程妹芳(漳州師范學(xué)院 圖書館,福建 漳州 363000)
《閩方言文獻(xiàn)數(shù)據(jù)庫》是漳州師范學(xué)院圖書館自建的特色資源庫,是中國高等教育文獻(xiàn)保障體系(CALIS)三期專題特色數(shù)據(jù)庫子項(xiàng)目之一。本數(shù)據(jù)庫以建設(shè)具有國內(nèi)先進(jìn)資源整合體系和服務(wù)平臺為指導(dǎo)思想,利用北京快威公司研發(fā)的DIPS數(shù)字文獻(xiàn)處理系統(tǒng)為技術(shù)支撐,主要以漳州師范學(xué)院圖書館特色館藏文獻(xiàn)為資源基礎(chǔ),以全文數(shù)據(jù)為重點(diǎn),同時(shí)擴(kuò)展整合海峽兩岸及東南亞閩方言語言學(xué)科的中外文圖書、期刊、方言文學(xué)作品、視頻、音頻、課件、網(wǎng)站等各類型資源,建成“輯目索引庫”、“圖書全文庫”、“研究論文庫”、“方言文學(xué)庫”、“其他資料庫”等五部分資源子庫。
(1)有利于資源的集中整合與組織。從地域廣度來說,閩方言是我國最早流傳海外,傳播國家最多、流域最廣的方言語種之一,文獻(xiàn)史料遍布福建、臺灣、廣東、海南、浙江等省份和港澳地區(qū)、日、美、英、東南亞多個(gè)國家和地區(qū)。從時(shí)間跨度而言,自1403年第一部閩方言文獻(xiàn)《滿剌加國譯語》[1]問世至今已有600多年,文獻(xiàn)積存較多,涉及專著、論文、辭典、教材、教會文獻(xiàn),[2]以及用閩方言創(chuàng)作的文藝作品等,呈跨國性、散見性、稀有性、多語種等特征。閩方言文獻(xiàn)數(shù)據(jù)庫的建設(shè)跨越地域與時(shí)空,將散落各地的與閩方言相關(guān)的文獻(xiàn)盡可能的搜集齊全,集中資源,整合信息,將其打造成為閩方言文獻(xiàn)集散地。
(2)有利于資源的保存與描述。閩方言被稱為古漢語的“活化石”,不管是閩東方言還是閩南方言,亦或是莆仙方言,都保存了自唐宋以來大量的古漢語印記,是重要的文化資源,也是珍貴的非物質(zhì)文化遺產(chǎn)。閩方言文獻(xiàn)數(shù)據(jù)庫的建設(shè),將全面科學(xué)地描寫、展現(xiàn)、揭示閩方言實(shí)態(tài),記錄和保存閩方言資料,有效地傳承閩文化,展示閩方言生態(tài)文化區(qū)語言真實(shí)面貌。同時(shí)也將較全面、客觀地再現(xiàn)閩方言的傳播區(qū)域與傳播途徑,再現(xiàn)閩方言的學(xué)術(shù)研究發(fā)展歷程,凸顯以閩南方言為代表的中華語言文化在臺灣、東南亞等國家和地區(qū)的久遠(yuǎn)影響。
(3)有利于資源的開發(fā)與服務(wù)。通過對閩方言相關(guān)文獻(xiàn),以及閩方言語料與方言文藝作品等科學(xué)、合理、有序的知識整理與組織,利用現(xiàn)代信息技術(shù)和數(shù)據(jù)庫技術(shù),開發(fā)建設(shè)成專題數(shù)據(jù)庫,填補(bǔ)了國內(nèi)外閩方言專題文獻(xiàn)數(shù)據(jù)庫建設(shè)的空白,提高了文獻(xiàn)資源的有效利用率,促進(jìn)了福建省語言文獻(xiàn)資源的數(shù)字信息化進(jìn)程和資源共享,大大加強(qiáng)了方言文化生態(tài)區(qū)的開發(fā)與建設(shè),更好地為海西區(qū)域經(jīng)濟(jì)文化發(fā)展服務(wù)。
(4)有利于區(qū)域語言規(guī)劃研究與決策?!胺窖允且环N區(qū)域性語言?!薄罢Z言規(guī)劃的區(qū)域性與語言的區(qū)域性有關(guān)?!盵3]閩方言的區(qū)域性尤為突出,它主要流行于福建省、臺灣省、海南省、廣東潮汕與雷州半島、浙江蒼南等地,通行于日、美、英、東南亞等多個(gè)國家和地區(qū)的華人華僑。在福建省內(nèi)則有閩東方言、閩南方言、閩北方言、閩中方言、莆仙方言等五大互不相通的次方言。而本數(shù)據(jù)庫的建設(shè),則較為全面的掌握閩方言的語言實(shí)態(tài),系統(tǒng)地揭示閩方言的發(fā)展歷程與傳播流域,為閩方言區(qū)域語言規(guī)劃研究提供基礎(chǔ)性資料保障與決策依據(jù)。
(1)數(shù)據(jù)庫目標(biāo)定位準(zhǔn)確。通過前期的調(diào)研,與專家學(xué)者的多次討論論證,確定數(shù)據(jù)庫的建庫目標(biāo),即盡可能多的將散落在各地的與閩方言相關(guān)的文獻(xiàn)資源搜集齊全,建設(shè)成由目錄索引、文本、圖像、音視頻、課件等文獻(xiàn)類型組成的資源數(shù)據(jù)庫,使其成為閩方言文獻(xiàn)集散地。以全息數(shù)據(jù)為重點(diǎn),整合海峽兩岸及東南亞閩方言語言學(xué)科的中外文各類型資源,形成元數(shù)據(jù)和對象數(shù)據(jù)。積極參與到CALIS特色數(shù)據(jù)庫建設(shè)中,將本數(shù)據(jù)庫的信息資源上傳CALIS特色資源元數(shù)據(jù)倉儲中心,有效地補(bǔ)充了CALIS的信息資源。
(2)數(shù)據(jù)庫大綱設(shè)計(jì)明晰。這是特色庫建設(shè)首先要確定的重要一環(huán),設(shè)計(jì)特色庫體系和欄目,需依數(shù)據(jù)類型、文獻(xiàn)內(nèi)容、數(shù)據(jù)量等因素綜合考慮,合理規(guī)劃,力求結(jié)構(gòu)清晰,層次分明,分類準(zhǔn)確。詳見下表。
表 閩方言文獻(xiàn)數(shù)據(jù)庫大綱目次
(3)元數(shù)據(jù)標(biāo)準(zhǔn)和建庫系統(tǒng)與CALIS銜接。毋庸置疑,數(shù)據(jù)庫的標(biāo)準(zhǔn)規(guī)范對各高校圖書館建設(shè)特色數(shù)據(jù)庫是至關(guān)重要的。閩方言文獻(xiàn)數(shù)據(jù)庫根據(jù)國家科技部科技基礎(chǔ)性工作專項(xiàng)資金重點(diǎn)項(xiàng)目《我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)》的研究成果,[4]結(jié)合閩方言文獻(xiàn)自身的特點(diǎn),制定漳州師范學(xué)院圖書館《閩方言文獻(xiàn)數(shù)據(jù)庫元數(shù)據(jù)結(jié)構(gòu)與著錄準(zhǔn)則》,并嚴(yán)格按照這個(gè)標(biāo)準(zhǔn)來規(guī)范建庫。建庫系統(tǒng)采用通過CALIS認(rèn)證的北京快威公司研發(fā)的DIPS數(shù)字文獻(xiàn)處理系統(tǒng),在本系統(tǒng)的各項(xiàng)功能基礎(chǔ)上擬定建庫技術(shù)方案,再按照建庫方案與建庫標(biāo)準(zhǔn)逐步實(shí)施建設(shè),在實(shí)踐過程中不斷予以修正完善。
(4)數(shù)據(jù)庫文獻(xiàn)選取范圍廣泛。從資源種類與文獻(xiàn)類型兩方面進(jìn)行合理界定,盡可能做到文獻(xiàn)內(nèi)容“專”、“精”、“全”,表現(xiàn)形式豐富化。資源種類凡與特色庫主題密切相關(guān)的內(nèi)容都盡可能收集。具體而言,從基本的語料字音、詞匯、俗語、民諺到歌謠、童謠、謎語、故事、劇本、曲藝等方言說唱話語資料;從報(bào)刊雜志所刊載的各色研究性與非研究性閩方言相關(guān)文章到各種研討會中發(fā)表的閩方言相關(guān)會議論文、項(xiàng)目報(bào)告以及學(xué)位論文;從教會文獻(xiàn)、辭書、教材、專著到與閩方言發(fā)展傳播相關(guān)的史料文獻(xiàn),從紙本文獻(xiàn)掃描數(shù)字化到網(wǎng)絡(luò)電子文獻(xiàn),均為閩方言數(shù)據(jù)庫文獻(xiàn)資源數(shù)據(jù)選取的對象。文獻(xiàn)類型的載體形式有目錄、文摘、全文、圖像、音頻、視頻、課件、多媒體等多種類型數(shù)據(jù)信息。
(5)精心采集資源,用心加工建庫。多渠道、多途徑廣泛采集相關(guān)資源。首先,充分利用館藏特色資源,將現(xiàn)有館藏資源數(shù)字化;其次,向社會和個(gè)人征集相關(guān)資源;其三,搜索、挖掘、提煉、整合網(wǎng)絡(luò)資源;其四,從商業(yè)數(shù)據(jù)庫中遴選數(shù)據(jù);其五,派遣骨干館員到福建省內(nèi)各地、潮汕、海南、臺灣、東南亞等國家地區(qū)收集相關(guān)資料。
資料收集后,對所有收集而來的數(shù)據(jù)進(jìn)行篩選,通過掃描、拍照、錄入、格式轉(zhuǎn)換、文本全息化等各種技術(shù)手段和加工方式,對采集來的各種類型和格式的原始資料進(jìn)行數(shù)據(jù)深加工、資源整合、歸類存檔,并按照《閩方言文獻(xiàn)數(shù)據(jù)庫元數(shù)據(jù)結(jié)構(gòu)與著錄準(zhǔn)則》對數(shù)字化文獻(xiàn)進(jìn)行元數(shù)據(jù)標(biāo)引、描述、組織、索引、入庫。利用知識組織的方法,將無序、分散的資源內(nèi)容建設(shè)成含目錄索引、文摘數(shù)據(jù)、全文數(shù)據(jù)三級資源庫,對文獻(xiàn)資源進(jìn)行全面揭示。
(6)Web發(fā)布與訪問服務(wù)功能不斷提升。利用DIPS軟件系統(tǒng),建立Web發(fā)布平臺。設(shè)計(jì)簡潔明了的特色庫發(fā)布界面,含一級子庫信息、數(shù)據(jù)更新時(shí)間以及各子庫實(shí)時(shí)訪問點(diǎn)擊量展示等;建立詳細(xì)的分類導(dǎo)航樹,形象而直觀地揭示文獻(xiàn)資源完整的體系;設(shè)置一般分類導(dǎo)航檢索與高級全文檢索系統(tǒng),供用戶方便快捷地查找數(shù)字資源。數(shù)據(jù)庫采用目前國內(nèi)各高校較為通用的IP認(rèn)證與賬戶認(rèn)證兩者相結(jié)合的訪問方式,校園網(wǎng)內(nèi)采用IP認(rèn)證自動登入,校園網(wǎng)外采用注冊賬號(用戶名/密碼)認(rèn)證登入。數(shù)據(jù)庫面向終端用戶24小時(shí)全天候開放,免費(fèi)提供數(shù)據(jù)瀏覽、全文信息檢索、原文獲取、文獻(xiàn)傳遞、網(wǎng)上咨詢等服務(wù)。
作為CALIS三期特色數(shù)據(jù)庫的建設(shè)成果,本數(shù)據(jù)庫項(xiàng)目完成后,全部元數(shù)據(jù)及文摘級數(shù)據(jù)均免費(fèi)提供給CALIS,提供基于WEB方式的公開免費(fèi)檢索;提供OAI服務(wù),以方便CALIS全國高校專題特色數(shù)據(jù)庫中心門戶收割全部元數(shù)據(jù)。CALIS成員館的用戶可通過CALIS中心門戶直接訪問、利用本數(shù)據(jù)庫。數(shù)據(jù)庫中不涉及知識產(chǎn)權(quán)的內(nèi)容直接提供全文,涉及知識產(chǎn)權(quán)的內(nèi)容以文獻(xiàn)傳遞服務(wù)方式提供全文。
(7)及時(shí)更新數(shù)據(jù),注重日常維護(hù)。閩方言文獻(xiàn)數(shù)據(jù)庫將數(shù)據(jù)更新常態(tài)化、制度化,除寒暑假外,基本做到月更新,確保數(shù)據(jù)庫文獻(xiàn)的時(shí)效性和新穎性。重視數(shù)據(jù)庫日常維護(hù),實(shí)時(shí)做好數(shù)據(jù)保存,并及時(shí)備份。加強(qiáng)對服務(wù)器系統(tǒng)的安全管理,有效保障數(shù)據(jù)的安全性。
(1)閩方言文獻(xiàn)數(shù)據(jù)庫是一個(gè)學(xué)科性很強(qiáng)的數(shù)據(jù)庫,需要有專業(yè)學(xué)科知識的支持。在數(shù)據(jù)庫的選題、目標(biāo)定位、大綱體系設(shè)置、資源采集篩選、功能設(shè)計(jì)等各個(gè)環(huán)節(jié),均聘請有關(guān)專家學(xué)者參與論證指導(dǎo)。特別是在數(shù)據(jù)庫建設(shè)之初,科學(xué)合理地制定特色數(shù)據(jù)庫的建設(shè)目標(biāo)、價(jià)值取向、整體規(guī)劃、工作流程、實(shí)施步驟等,是非常重要的。建庫過程中時(shí)常與專家學(xué)者保持聯(lián)系,在專家學(xué)者的全程參與、系統(tǒng)把關(guān)下完成建庫。力求保證選題的價(jià)值性、數(shù)據(jù)的權(quán)威性和可靠性、大綱體系與功能結(jié)構(gòu)的合理性,避免“走彎路”。
(2)統(tǒng)一的建庫標(biāo)準(zhǔn)規(guī)范和合理的建庫團(tuán)隊(duì)是建設(shè)高質(zhì)量數(shù)據(jù)庫的兩大保障。規(guī)范統(tǒng)一的元數(shù)據(jù)著入標(biāo)準(zhǔn)是數(shù)據(jù)庫實(shí)現(xiàn)資源共享的一大前提。閩方言文獻(xiàn)數(shù)據(jù)庫建設(shè)團(tuán)隊(duì)依據(jù)國家科技部的科研成果和CALIS中心的元數(shù)據(jù)標(biāo)準(zhǔn),建立健全建庫工作所需的各項(xiàng)規(guī)范準(zhǔn)則與規(guī)章制度,如《閩方言文獻(xiàn)數(shù)據(jù)庫元數(shù)據(jù)結(jié)構(gòu)與著錄準(zhǔn)則》《建庫人員崗位職責(zé)》等,確保有章可循,有標(biāo)準(zhǔn)可依。在建庫過程中嚴(yán)格執(zhí)行數(shù)據(jù)庫建設(shè)規(guī)范和元數(shù)據(jù)標(biāo)引著錄細(xì)則,遵循崗位職責(zé),才能確保數(shù)據(jù)庫的建設(shè)質(zhì)量。在此基礎(chǔ)上,結(jié)構(gòu)合理、素質(zhì)優(yōu)良、業(yè)務(wù)精湛、富有協(xié)作精神的建庫隊(duì)伍,是建設(shè)高質(zhì)量特色數(shù)據(jù)庫的重要人才支持與保證。閩方言文獻(xiàn)數(shù)據(jù)庫的建庫團(tuán)隊(duì)是由研究閩方言的專家學(xué)者、會講閩方言的館員、英語專業(yè)的館員以及熟悉數(shù)據(jù)庫技術(shù)的館員等骨干力量組成。在工作中群策群力,明確各建庫人員的崗位職責(zé),合理分工,團(tuán)結(jié)協(xié)作。
(1)建庫標(biāo)準(zhǔn)規(guī)范有待完善,部分元數(shù)據(jù)取值、格式不夠規(guī)范。這個(gè)問題的起因一是由于部分海外數(shù)據(jù)不易獲取,如一些海外古籍本身就缺失必備元素,無法復(fù)原;還有一些網(wǎng)絡(luò)資源,雖然文獻(xiàn)價(jià)值較高,但一些必備元素?zé)o法追溯考證,致使文檔資料不完整,部分元數(shù)據(jù)缺失。二是在數(shù)據(jù)庫建設(shè)中,由于人手不足,請勤工助學(xué)的學(xué)生參與部分期刊元數(shù)據(jù)著錄及圖書掃描和加工工作,導(dǎo)致有些數(shù)據(jù)不夠規(guī)范。三是由于本數(shù)據(jù)庫從最初構(gòu)思建庫、收集資料到如今的初具規(guī)模歷時(shí)多年,許多數(shù)據(jù)在開始收集時(shí)并未按照現(xiàn)在的標(biāo)準(zhǔn)規(guī)范來標(biāo)引,又經(jīng)多人之手,導(dǎo)致小部分?jǐn)?shù)據(jù)模糊。
解決該問題的途徑可分兩步走。一是逐條檢查有問題數(shù)據(jù),多渠道、多途徑追溯復(fù)原,進(jìn)一步規(guī)范完善數(shù)據(jù)。二是參與CALIS三期特色數(shù)據(jù)庫建設(shè)工作,積極向它們的標(biāo)準(zhǔn)規(guī)范靠攏。學(xué)習(xí)CALIS專題特色庫的建庫標(biāo)準(zhǔn)規(guī)范,對本數(shù)據(jù)庫建設(shè)具有重要的指導(dǎo)意義。作為一所普通高校圖書館,我們?nèi)狈μ厣珨?shù)據(jù)庫建設(shè)的理論指導(dǎo),在平臺搭建、庫結(jié)構(gòu)定義、系統(tǒng)發(fā)布等方面缺少建設(shè)成功數(shù)據(jù)庫的實(shí)踐經(jīng)驗(yàn)。而CALIS專題特色數(shù)據(jù)庫建設(shè)的標(biāo)準(zhǔn)規(guī)范與成功建庫經(jīng)驗(yàn)正是值得我們學(xué)習(xí)與借鑒的最好個(gè)案。雙管齊下,一手抓標(biāo)準(zhǔn),一手抓數(shù)據(jù)質(zhì)量,無疑將極大的完善、提升本數(shù)據(jù)庫的知識組織與資源整合水平。
(2)數(shù)據(jù)庫有效利用率有待提高。由于本特色庫的建庫專題性較強(qiáng),具有一定的使用針對性,加之缺乏宣傳,師生讀者對數(shù)據(jù)庫的知曉程度不太高,雖然在海內(nèi)外閩方言研究界擁有一定的讀者群,廣東、海南、香港、澳門、臺灣、馬來西亞、新加坡、日本等國家和地區(qū)都有學(xué)者前來訪問,但數(shù)據(jù)庫的利用價(jià)值還遠(yuǎn)未得到充分發(fā)揮。
解決該問題的方法有二。一是從自身建庫質(zhì)量入手,進(jìn)一步挖掘資源、更新數(shù)據(jù),提高數(shù)據(jù)庫的生命活力。二是進(jìn)一步加強(qiáng)數(shù)據(jù)庫的宣傳與推廣力度。今后將嘗試采用打電話、發(fā)E-Mail、郵寄數(shù)據(jù)庫大綱等推送服務(wù)的形式,將數(shù)據(jù)庫的內(nèi)容、特點(diǎn)以及更新信息主動、及時(shí)推送給研究閩語的專家、學(xué)者。
[1]林連通.《閩方言研究專題文獻(xiàn)輯目索引1403-2003》跋[M]//張嘉星.閩方言研究專題文獻(xiàn)輯目索引1403-2003.北京:社會科學(xué)文獻(xiàn)出版社,2004:729.
[2]張嘉星.傳教士與閩南方言辭書[J].文獻(xiàn),2006(1):183-189.
[3]薄守生,賴慧玲.當(dāng)代中國語言規(guī)劃研究[M].北京:中國社會科學(xué)出版社,2009:2.
[4]張曉林,等.我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范[EB/OL].[2012-05-08].http://cdls.nstl.gov.cn.