国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于用戶需求的口述資料數(shù)據(jù)庫功能設(shè)計

2017-01-31 04:27首小琴廣東省惠州學(xué)院
浙江檔案 2017年9期
關(guān)鍵詞:檢索資料數(shù)據(jù)庫

首小琴/廣東省惠州學(xué)院

隨著口述史研究在我國的逐步深入,我國檔案界逐步開展了口述資料數(shù)據(jù)建設(shè)實踐,并積累了一定數(shù)量的口述資料數(shù)據(jù)。遺憾的是,在當前網(wǎng)絡(luò)信息技術(shù)迅猛發(fā)展的環(huán)境下和構(gòu)建服務(wù)型檔案館的要求下,如何以建設(shè)數(shù)據(jù)庫的方式對口述資料進行管理與開發(fā)并提供服務(wù),這一課題始終沒有得到足夠的重視。嚴格來說,目前我國檔案界尚無可供用戶使用的口述資料數(shù)據(jù)庫;反觀國際圖書檔案界和國內(nèi)圖書館界,其口述資料數(shù)據(jù)庫建設(shè)都已取得較多成果。因此,加強口述資料數(shù)據(jù)庫建設(shè)對我國檔案界顯得尤為緊迫。需要指出的是,功能設(shè)計作為數(shù)據(jù)庫設(shè)計的核心內(nèi)容,是口述資料數(shù)據(jù)庫建設(shè)的重要任務(wù)。筆者就口述資料數(shù)據(jù)庫功能設(shè)計作一探討。

1 口述資料數(shù)據(jù)庫及其功能

口述資料數(shù)據(jù)庫是指以口述資料數(shù)據(jù)為主要內(nèi)容的,具有數(shù)據(jù)輸入、輸出與管理等功能的數(shù)據(jù)庫,它是管理口述資料數(shù)據(jù)的載體和平臺,也是開發(fā)利用口述資料數(shù)據(jù)的重要平臺。在當前服務(wù)型社會的環(huán)境下和以人為本的社會理念下,口述資料數(shù)據(jù)庫建設(shè)的宗旨是為用戶提供口述資料數(shù)據(jù)服務(wù),滿足用戶的利用需求。因此,口述資料數(shù)據(jù)庫的功能設(shè)計應(yīng)始終以滿足用戶的各類需求為核心。這要求在設(shè)計口述資料數(shù)據(jù)功能時,要著重分析用戶需要什么類型的口述資料數(shù)據(jù),并且認真思考如何便捷地獲取和共享這些數(shù)據(jù)等。

2 口述資料數(shù)據(jù)庫用戶需求調(diào)研

筆者嘗試通過問卷調(diào)查方式初步了解用戶需求,同時采用網(wǎng)絡(luò)搜索、文獻查詢、郵件和電話聯(lián)系等調(diào)研方式,對國外尤其是美國口述資料數(shù)據(jù)庫和我國圖書館界口述資料數(shù)據(jù)庫的建設(shè)情況進行了考察。這里先論述問卷調(diào)查情況。本次問卷調(diào)查對象主要是筆者所在單位惠州學(xué)院的教師和學(xué)生,為使調(diào)研對象對問卷有初步了解,在問卷調(diào)查之前已簡單介紹了口述資料及數(shù)據(jù)庫的概念、特性、作用與價值等。本次問卷調(diào)查總計發(fā)放問卷260份,收回有效問卷232份。本問卷共設(shè)置7個問題,包括1道主觀題與6道客觀選擇題,主要涉及口述資料數(shù)據(jù)庫的數(shù)據(jù)類型、數(shù)據(jù)檢索、數(shù)據(jù)獲取和數(shù)據(jù)共享等幾類內(nèi)容。問卷調(diào)查結(jié)果如下:關(guān)于“你是否對口述資料數(shù)據(jù)庫建設(shè)感興趣”,52%的人表示感興趣,31%的人表示不感興趣,17%的人未做出明確選擇,表示“不知道”;關(guān)于“你還希望口述資料數(shù)據(jù)庫提供其他什么功能”,有38人填寫“評論、點贊、互動交流”等功能,有5人填寫了其他內(nèi)容,還有189人未作填寫。

由于問卷調(diào)查的范圍和數(shù)據(jù)量非常有限,我們并不能據(jù)此發(fā)現(xiàn)我國口述資料數(shù)據(jù)庫的用戶需求特征。為此筆者結(jié)合其他調(diào)研數(shù)據(jù)進行闡述,力求更全面、更精準地反映口述資料數(shù)據(jù)用戶需求的特征。

2.1 數(shù)據(jù)類型需求存在多樣性

不同用戶對口述資料數(shù)據(jù)類型的需求各不相同。一般而言,學(xué)者希望從數(shù)據(jù)庫中獲得口述文本用于研究?!凹偃艨梢赃x擇,研究者選的一定是抄本,而不是錄音帶。”[1]而普通用戶尤其是年輕用戶偏愛選擇較為生動直觀的口述視頻和音頻,他們往往對閱讀篇幅較大的口述文本缺乏耐心。另外,同一用戶群體對口述資料數(shù)據(jù)的類型也有不同的需求,如研究生利用口述資料時可能利用文本進行研究,也可能利用音頻、視頻進行研究;再如針對同一用戶群體的“希望口述資料數(shù)據(jù)庫提供哪些類型的數(shù)據(jù)”的問題上,選擇“視頻”的占14%,“音頻”占10%,“文本”占8%,“以上都是”占68%,這樣的結(jié)果顯示了用戶對口述資料數(shù)據(jù)庫數(shù)據(jù)類型的需求并不是單一的,而是多樣的。據(jù)調(diào)查,目前美國的一些檔案館應(yīng)用戶要求,已經(jīng)將口述資料文本連同音頻、圖片等其他資料上傳到數(shù)據(jù)庫里,供用戶選擇利用。

2.2 檢索字段的多元化

就“希望口述資料數(shù)據(jù)庫提供哪些檢索字段”這一問題看,有13%的受訪者選擇“口述訪談主題”,4%選擇“受訪者”,2%選擇“采訪時間”的,選擇“以上都是”的占81%,從這里可看出用戶對口述資料數(shù)據(jù)庫檢索字段的需求呈現(xiàn)多元化。不同用戶對檢索字段的選擇有不同的偏愛和習慣,如有些用戶傾向于用“訪問時間”檢索,有些用戶習慣用“訪談主題”檢索,還有的用戶更偏向于選擇“受訪者”檢索,可以看出用戶對檢索字段的需求具有多元化特點,這對數(shù)據(jù)庫檢索功能設(shè)計提出了相應(yīng)的要求。以美國班克羅夫特圖書館的口述資料數(shù)據(jù)庫為例,該數(shù)據(jù)庫囊括了近100個口述歷史項目上萬份訪談記錄的數(shù)據(jù)資料,為了適應(yīng)不同用戶的檢索習慣,每份數(shù)據(jù)都有詳細的元數(shù)據(jù)描述,用戶在檢索時可以選擇題名、項目、受訪者、出版日期、主題范圍、訪談日期等字段[2]。

2.3 數(shù)據(jù)獲取與共享途徑有新變化

傳統(tǒng)獲取數(shù)據(jù)的方式包括在線瀏覽和下載,隨著近年來新媒體技術(shù)的進一步發(fā)展,越來越多的用戶嘗試利用新媒體平臺獲取口述資料數(shù)據(jù),如通過微博、微信、騰訊QQ、博客等的共享和推送等獲取數(shù)據(jù),數(shù)據(jù)獲取途徑有新變化。問卷調(diào)查中“你希望通過哪種途徑獲取口述資料數(shù)據(jù)庫中的數(shù)據(jù)?”的問題,選擇“瀏覽”的受訪者占41%,“下載”占37%,“共享”占15%,“推送”占7%??梢娺x擇“瀏覽”“下載”的受訪者較多,但也有越來越多的受訪者選擇“共享”“推動”的方式獲取數(shù)據(jù)。為進一步觀察用戶共享數(shù)據(jù)的方式,我們設(shè)置了“你希望通過哪個媒體共享信息數(shù)據(jù)?”這一問題,結(jié)果顯示,通過“微信”共享數(shù)據(jù)的受訪者占51%,QQ占28%,微博占18%,其他占3%。可見,數(shù)據(jù)的獲取與共享途徑有新變化。

2.4 著作權(quán)保護意識不高

由于我國口述資料工作還處于起步的階段,著作權(quán)保護工作滯后,用戶的著作權(quán)保護意識不高。“當前,我國口述資料工作中普遍存在著重采集利用、輕著作權(quán)保護的現(xiàn)象?!眴柧碚{(diào)查中“你認為是否應(yīng)對某些數(shù)據(jù)設(shè)置獲取權(quán)限?”的問題,選擇“應(yīng)該”的受訪者僅占21%,而選擇“不應(yīng)該”的占了40%,“適度”占32%,“不關(guān)心”占7%,這說明當前我國用戶口述資料著作權(quán)保護意識較低。我國圖書館界也存在這樣的問題,筆者經(jīng)過調(diào)查發(fā)現(xiàn),我國主要圖書館口述資料文獻數(shù)據(jù)庫網(wǎng)站上,基本沒有羅列關(guān)于著作權(quán)保護的說明或設(shè)置相關(guān)措施。同時,筆者通過發(fā)送郵件、電話聯(lián)系的方式對一些圖書館進行調(diào)研,發(fā)現(xiàn)這些圖書館尚未采取措施保護口述文獻數(shù)據(jù)庫的著作權(quán)。

3 基于用戶需求的口述資料數(shù)據(jù)庫功能設(shè)計

3.1 數(shù)據(jù)輸入功能

口述資料區(qū)別于傳統(tǒng)檔案的一個方面,是其在載體形式方面具有多樣性,既可以是視頻、音頻,也可以轉(zhuǎn)錄成文本,有的口述資料還配有相關(guān)的圖片、實物等資料。調(diào)研結(jié)果顯示,用戶對口述資料數(shù)據(jù)類型的需求具有多樣性特征。這就要求在數(shù)據(jù)庫建設(shè)中要重視數(shù)據(jù)輸入功能,充分考慮各種類型口述資料數(shù)據(jù)的特點,有針對性地選擇使用方便、功能完善、運行可靠、容易維護、兼容性強的數(shù)據(jù)庫網(wǎng)絡(luò)系統(tǒng),將文本、圖像、聲音等多種格式的信息數(shù)據(jù)建立邏輯聯(lián)系,集成為具有實時交互性特征的系統(tǒng)。在這一方面,我國國家圖書館在“中國記憶”項目“中國記憶專題數(shù)據(jù)庫”的建設(shè)過程中積累了一定經(jīng)驗,自2012年該項目正式啟動以來,數(shù)據(jù)庫不僅采集了文本資料,還采集了相關(guān)照片、實物等資料。截至2014年12月,該數(shù)據(jù)庫已收入20余個口述專題,積累了超過40TB的原始影像數(shù)據(jù),并保存有大量實物、非正式出版物等相關(guān)資料[3]。筆者發(fā)現(xiàn),美國國會圖書館建立了退伍軍人口述資料數(shù)據(jù)庫,其數(shù)據(jù)類型不僅包括口述錄音、錄像、抄本,還囊括了照片、回憶錄、文書檔案等其他的資料,同時也提供了相關(guān)的數(shù)據(jù)鏈接,可以滿足用戶的多方需求[4]。

3.2 數(shù)據(jù)獲取功能

讓用戶從口述資料數(shù)據(jù)庫中獲取目標數(shù)據(jù),是口述資料數(shù)據(jù)庫建設(shè)的最終目的。如何設(shè)計口述資料數(shù)據(jù)庫的數(shù)據(jù)獲取功能,是本次設(shè)計的重點。從調(diào)研中我們發(fā)現(xiàn),用戶希望獲取數(shù)據(jù)的方式是多元化的。大英圖書館在建設(shè)口述資料數(shù)據(jù)庫時充分考慮到了這一點,其數(shù)據(jù)庫提供了不同途徑的數(shù)據(jù)獲取途徑:利用圖書館的OPAC進行檢索;到圖書館利用專門的聲音服務(wù)設(shè)備Sound Server觀看視頻材料或收聽音頻材料;瀏覽訪問或在線下載部分口述歷史記錄;通過用戶進行共享傳播等[5]。通過對國外數(shù)據(jù)庫進行考察可以發(fā)現(xiàn),很多建設(shè)較為成熟的口述資料數(shù)據(jù)庫都提供了如檢索、訪問、下載和共享推送等多元化的數(shù)據(jù)獲取途徑。筆者認為,數(shù)據(jù)獲取功能應(yīng)包括檢索功能、訪問功能、下載功能和共享推送功能等。

3.2.1 檢索功能

“數(shù)據(jù)庫使得對口述歷史內(nèi)容的檢索更為深入,用戶的獲取更為快捷。”[6]因此,檢索功能設(shè)計對于口述資料數(shù)據(jù)庫的建設(shè)而言至關(guān)重要。通過調(diào)研,我們得知用戶希望在檢索時能夠通過不同的字段進行檢索,因此口述資料數(shù)據(jù)庫的檢索窗口設(shè)計應(yīng)從用戶需求出發(fā),提供包括文本、視頻、音頻和圖片等在內(nèi)的多媒體檢索,并能夠從集合層次、單件層次和內(nèi)容層次上進行檢索,還可對用戶進行獲取權(quán)限控制;既能夠提供多層次、多角度的查詢與檢索途徑,還可以提供單字段、多字段組合查詢方法。

3.2.2 瀏覽訪問功能

用戶通過瀏覽訪問的方式查閱數(shù)據(jù)庫中的內(nèi)容,從而獲取目標口述資料數(shù)據(jù),這是數(shù)據(jù)獲取的最基本方式。在美國,國會圖書館、國家醫(yī)學(xué)圖書館、國家農(nóng)業(yè)圖書館、各地的公共圖書館和高校圖書館都積累了豐富的口述歷史數(shù)據(jù),美國數(shù)字公共圖書館項目更是整合了各種存儲機構(gòu)非正式出版的文獻數(shù)據(jù),并建立了口述專題數(shù)據(jù)庫,將抄本和磁帶轉(zhuǎn)換成數(shù)字聲音和視頻記錄并在線展示,此舉促進了這些數(shù)據(jù)的利用與共享[7]。

3.2.3 下載功能

美國的很多口述資料數(shù)據(jù)庫都具備資料下載功能,但因不同用戶的需求不同,這一功能有一定的限制。由于網(wǎng)絡(luò)傳播的不確定性和口述資料著作權(quán)保護的需要,當前我國很多口述資料數(shù)據(jù)庫不具備下載功能。筆者建議,為了滿足用戶利用需求,可在保護口述資料著作權(quán)前提下設(shè)計數(shù)據(jù)下載功能。

3.2.4 共享推送功能

互聯(lián)網(wǎng)技術(shù)和新媒體技術(shù)的發(fā)展,為用戶獲取與共享口述資料數(shù)據(jù)信息提供了便利。“盡管將口述歷史納入社交媒體當中需要相當?shù)娜肆εc物力數(shù)據(jù),但是其積極作用也是不言而喻的,這不僅有助于推廣與分享來自檔案館或圖書館等實體空間的口述歷史數(shù)據(jù),同時還能夠以新的方式實現(xiàn)口述歷史工作者與公眾乃至他們之間的相互聯(lián)系與交流?!盵8]從調(diào)研中可以看到,當前用戶對數(shù)據(jù)獲取的途徑有新變化,即越來越多的用戶通過新媒體獲取數(shù)據(jù)。同時通過網(wǎng)絡(luò)調(diào)研,筆者發(fā)現(xiàn)美國的很多圖書館運用多種社交媒體對口述資料信息進行推廣傳播,使美國民眾足不出戶就可以了解到相關(guān)口述資料信息和最新的口述歷史項目。其中,美國國會圖書館退伍軍人口述資料數(shù)據(jù)庫可將用戶檢索到的口述資料信息進行推送,或者共享到社交網(wǎng)絡(luò)上;美國班克羅夫特圖書館同時運用Twitter、Facebook、YouTube、Sound Cloud、Instagram、Blog等6種網(wǎng)絡(luò)社交媒體對口述資料進行推廣[9]。在國內(nèi),國家圖書館的“中國記憶”口述資料數(shù)據(jù)庫與騰訊QQ、微博、人人網(wǎng)進行合作,用戶可以將自己喜歡的信息通過這些新媒體進行傳播、推送[10]。筆者建議,口述資料數(shù)據(jù)在功能設(shè)計時,要結(jié)合用戶需求,充分利用新媒體的傳播優(yōu)勢;要注重口述資料數(shù)據(jù)庫共享推送功能的設(shè)計,如設(shè)置“共享”“推送”按鈕,促進口述資料信息的傳播共享。

3.3 交流互動功能

在問卷調(diào)查有一道“你還希望口述資料數(shù)據(jù)庫提供其他什么功能”的主觀調(diào)研題,有38人填寫“評論、點贊、互動交流”等功能,這正反映出用戶對數(shù)據(jù)庫交流互動功能的重視。“美國口述歷史數(shù)據(jù)庫和網(wǎng)絡(luò)展覽一般都設(shè)置了推送和共享功能,一旦用戶瀏覽過某些口述資料,網(wǎng)站將根據(jù)用戶的大數(shù)據(jù),分析出用戶的喜好與利用規(guī)律,并據(jù)此定期向用戶推送數(shù)據(jù)庫中的數(shù)據(jù)。同時用戶在瀏覽口述歷史檔案數(shù)據(jù)過程中,一旦發(fā)現(xiàn)自己感興趣的,可通過YouTube、Facebook等社交媒體共享給其他的用戶群體?!盵11]美國班克羅夫特圖書館口述資料數(shù)據(jù)庫專門設(shè)置了“批判式利用”功能,無論對于訪談的原始錄音還是完整的抄本,利用者都可以就其準確性、真實性等提出看法,但質(zhì)疑者必須提供確鑿的證據(jù)和準確的信息來源,圖書館工作人員在確認之后會進行修改或校注。筆者認為,在數(shù)據(jù)庫建設(shè)中加入交流、評論等互動功能,此舉將有利于促進口述資料數(shù)據(jù)的良性共建。當前,我國圖書館界在設(shè)計口述資料數(shù)據(jù)庫的功能時,已經(jīng)考慮提供給用戶更多參與互動的機會,如設(shè)置在線征集口述資料數(shù)據(jù)的功能,由用戶創(chuàng)建標簽、發(fā)表評論、上傳相關(guān)內(nèi)容。這樣做有利于充分利用口述資料,并使得用戶積極主動地參與口述資料數(shù)據(jù)建設(shè)之中。

4 檔案部門實現(xiàn)口述資料數(shù)據(jù)庫功能的若干要求

4.1 要豐富口述資料數(shù)據(jù)并對數(shù)據(jù)進行管理

豐富的口述資料數(shù)據(jù)是數(shù)據(jù)庫功能實現(xiàn)的重要前提,檔案部門必須高度重視口述資料的資源建設(shè)工作,及時收集多種類型的口述資料,特別要抓緊收集瀕臨消亡的珍貴口述資料。同時必須對數(shù)據(jù)庫中的口述資料進行一定的管理,尤其是要做好口述資料數(shù)據(jù)的元數(shù)據(jù)描述和著錄標引工作,這是實現(xiàn)數(shù)據(jù)庫檢索功能的基本前提。“無論是把口述歷史數(shù)據(jù)納入圖書館的編目系統(tǒng)還是獨立建設(shè)數(shù)據(jù)庫,都需要設(shè)計精心考量過的元數(shù)據(jù)方案?!盵12]此外,在元數(shù)據(jù)描述中,背景研究越多、標引越準確、標引層次越豐富、粒度越細,越能提供更高質(zhì)量的數(shù)據(jù)。為此,應(yīng)提供盡量詳盡的元數(shù)據(jù),還應(yīng)采用標準的元數(shù)據(jù)框架、編碼以及受控詞表,確保高效檢索并實現(xiàn)不同檢索系統(tǒng)之間的兼容。具體操作時,可根據(jù)業(yè)務(wù)需要確定編目的標引深度,并參考國家圖書館名稱規(guī)范庫和分類主題詞表。

4.2 要提供信息技術(shù)保障

口述資料數(shù)據(jù)庫功能的實現(xiàn),需要利用到多種技術(shù)手段。檔案部門作為口述資料數(shù)據(jù)的需求提供方,一方面應(yīng)善于學(xué)習當前主要的信息技術(shù),了解其功能與特點,這樣才能提出合理的、具有一定前瞻性的設(shè)計需求;另一方面要善于與技術(shù)部門合作,共同實現(xiàn)數(shù)據(jù)庫的各項功能。

4.3 要強化隱私權(quán)與著作權(quán)保護

口述資料作為口述者的回憶內(nèi)容,是口述者過去經(jīng)歷的原始記錄,往往涉及口述者的隱私;口述者作為口述資料的著作權(quán)主體之一,理應(yīng)享有相關(guān)各種權(quán)益。檔案部門在提供口述資料數(shù)據(jù)利用時,有責任對口述者的隱私權(quán)與著作權(quán)進行保護[13],這也是實現(xiàn)數(shù)據(jù)庫功能的重要途徑。從問卷調(diào)查中可以看出,用戶的著作權(quán)意識普遍偏低,數(shù)據(jù)庫建設(shè)隨時面臨著作權(quán)侵權(quán)和隱私泄露的風險,甚至會因著作權(quán)糾紛而引發(fā)法律糾紛。當前,美國口述歷史機構(gòu)的做法是通過簽訂協(xié)議和利用技術(shù)手段等方式保護著作權(quán),這或許能為我們提供破解難題的思路。

注釋與參考文獻:

[1][美]唐納德·里奇.大家來做口述歷史[M].北京:當代中國出版社,2006:52.

[2]The Bancroft library [EB/OL].[2016-10-01]http://www.lib.berkeley.edu/libraries/bancroft-library/oral-history-center.

[3]廖永霞.中國記憶項目數(shù)據(jù)組織初探[J].國家圖書館學(xué)刊 ,2015(1):17-27.

[4]The library of congress [EB/OL].[2016-10-07].http://memory.loc.gov/diglib/vhp/html/search/search.html.

[5][7]胡立耘.基于口述歷史的圖書館延伸服務(wù)[J].圖書館 ,2015(12):15-22.

[6]李若云.流媒體技術(shù)在圖書館口述歷史數(shù)據(jù)庫中的應(yīng)用 [J].現(xiàn)代情報 ,2009(8):37-40.

[8]楊祥銀.數(shù)字化革命與美國口述史學(xué)[J].社會科學(xué)戰(zhàn)線 ,2016(3):106-120.

[9]The Bancroft library [EB/OL].[2016-10-01]http://www.lib.berkeley.edu/libraries/bancroft-library/oral-history-center/social-media.

[10]國家圖書館.“中國記憶”口述數(shù)據(jù)專題庫[EB/OL].[2017-02-12] http://www.nlc.cn/dsb_zt/xzzt/dbkrlj/.

[11]王玉龍.基于案例分析的美國口述歷史檔案資源網(wǎng)絡(luò)開發(fā)與利用[J].檔案與建設(shè),2017(2):21-24.

[12]廖永霞.中國記憶項目數(shù)據(jù)組織初探[J].國家圖書館學(xué)刊 ,2015(1):17-27.

[13]張一,謝蘭玉.網(wǎng)絡(luò)環(huán)境下美國圖書館開展口述歷史用戶服務(wù)的路徑及經(jīng)驗[J].圖書館建設(shè),2017(3):66-73.

猜你喜歡
檢索資料數(shù)據(jù)庫
Party Time
PAIRS & TWOS
JUST A THOUGHT
瑞典專利數(shù)據(jù)庫的檢索技巧
一種基于Python的音樂檢索方法的研究
淺議專利檢索質(zhì)量的提升
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫