国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中文老報紙數(shù)據(jù)庫的建設(shè)研究

2018-12-17 07:52王靜沈立力
河南圖書館學(xué)刊 2018年10期
關(guān)鍵詞:元數(shù)據(jù)時報數(shù)據(jù)庫

王靜 沈立力

關(guān)鍵詞:《時報》;中文老報紙;數(shù)據(jù)庫;元數(shù)據(jù)

摘要:《時報》作為近代上海三大報之一,在中國近代史與新聞史上影響深遠?!度珖鴪罂饕芬劳猩虾D書館豐富的館藏資源,在完成《時報》的數(shù)字化加工后,推出了中國近代中文報紙全文數(shù)據(jù)庫——《時報》。文章以《時報》數(shù)據(jù)庫建設(shè)為例,介紹了《時報》數(shù)據(jù)庫的建設(shè)流程,并從正文、廣告、圖片三大類型資源的元數(shù)據(jù)著錄規(guī)則入手,重點闡述了該庫的資源揭示與知識組織,并分析了《時報》數(shù)據(jù)庫的功能構(gòu)建情況,以期為中文老報紙乃至近代文獻數(shù)字資源的建設(shè)提供一定的借鑒和參考。

中圖分類號:G250.74文獻標識碼:A文章編號:1003-1588(2018)10-0106-03

1815年出版的《察世俗每月統(tǒng)紀傳》是第一個以中國人為閱讀對象的中文近代化報紙,以此為起點至1949年,在中國出版的報紙被稱為近代中文報紙,即老報紙。據(jù)統(tǒng)計,現(xiàn)存老報紙應(yīng)有近萬種[1]。老報紙作為真實記錄當時歷史和特殊社會轉(zhuǎn)型期思想文化的主要載體,極具思想文化價值和史料價值。隨著數(shù)字化技術(shù)的發(fā)展,老報紙資源逐步呈現(xiàn)在世人面前。但由于各機構(gòu)對老報紙內(nèi)容建設(shè)缺乏溝通,存在較為嚴重的重復(fù)建設(shè),且缺乏統(tǒng)一的元數(shù)據(jù)著錄標準,致使老報紙的內(nèi)容未能得到很好的揭示。

1《時報》數(shù)據(jù)庫的建設(shè)情況

《時報》是近代上海老牌中文報紙,創(chuàng)刊于1904年,1939年??媸?5年,與《申報》《新聞報》并列為近代上海三大報。該報注重時評,刊載小說眾多,后期更有大量的體育新聞與圖片報道,內(nèi)容豐富,特色鮮明,使讀者可以穿越百年的時光隧道觸摸歷史的脈動?!稌r報》是由中國人自己創(chuàng)辦的,歷史長久且影響深遠?!稌r報》開創(chuàng)了多個第一,如是第一個創(chuàng)辦??娜請?,其影響延伸至文藝、教育、出版等眾多領(lǐng)域,時代意義可見一斑[2]。

《全國報刊索引》依托上海圖書館豐富的館藏資源,采用先進的大幅面掃描設(shè)備,精心完成了《時報》的數(shù)字化加工處理工作,共計14.18萬版,正文篇數(shù)約180萬篇,廣告篇數(shù)84萬余篇,圖片篇數(shù)5萬余篇,推出了中國近代中文報紙全文數(shù)據(jù)庫——《時報》,為廣大讀者了解和研究《時報》提供了全面而系統(tǒng)的資料,并實現(xiàn)了該資源的共享。該數(shù)據(jù)庫將正文、廣告、圖片三大類型分開著錄,并制定了各種類型的元數(shù)據(jù)著錄標準及細則,實現(xiàn)了對文獻內(nèi)容的深度標引,對文獻內(nèi)容進行全面而又有效的揭示,這種資源組織方式為用戶提供了極大的便利,充分發(fā)揮了資源的價值。

2《時報》數(shù)據(jù)庫建設(shè)流程

《全國報刊索引》在建設(shè)《時報》數(shù)據(jù)庫前從用戶需求出發(fā),經(jīng)充分調(diào)研后根據(jù)老報紙的研究價值及可操作性對上海圖書館館藏的中文老報紙進行選題,在進行內(nèi)部論證及向?qū)<易稍兒螅罱K確定了中文老報紙的開發(fā)對象——《時報》。為了更好地對《時報》的資源進行揭示及知識組織,《全國報刊索引》制定了各類型資源的元數(shù)據(jù)著錄規(guī)則,并根據(jù)元數(shù)據(jù)著錄規(guī)則對《時報》的資源進行數(shù)字化加工處理。由于受人力、物力等限制,目前《全國報刊索引》依托上海圖書館的館藏資源,數(shù)字化加工處理工作采取外包形式,由專業(yè)的數(shù)字化生產(chǎn)制作商完成[3],通過招投標確定外包方進行合作,外包方根據(jù)《全國報刊索引》提供的元數(shù)據(jù)著錄規(guī)則完成數(shù)字化加工后,再由《全國報刊索引》對數(shù)據(jù)進行驗收。為了提升用戶體驗及提高資源利用率,《全國報刊索引》對用戶需求進行跟蹤和調(diào)研后,根據(jù)用戶需求開發(fā)系統(tǒng),設(shè)計數(shù)據(jù)庫結(jié)構(gòu)框架及完善數(shù)據(jù)庫功能,并進行調(diào)試和發(fā)布。

3《時報》數(shù)據(jù)庫的資源揭示與知識組織

筆者對國內(nèi)外的知識組織案例進行調(diào)研后發(fā)現(xiàn),標引深度日益加深,趨向深入文獻內(nèi)容?!稌r報》等中文老報紙內(nèi)容豐富、版面多樣,這就使元數(shù)據(jù)的著錄變得較為復(fù)雜。目前的老報紙數(shù)據(jù)庫普遍只對基礎(chǔ)信息進行標引,缺乏對報紙中圖片的題名、圖中人名、廣告標題、廣告發(fā)布人、廣告對象等信息進行深度標引[4]。中文老報紙的內(nèi)容一般分為正文和廣告,部分正文內(nèi)容會附有圖片,為了更好地揭示報紙數(shù)字化文本的內(nèi)容,《全國報刊索引》對報紙的文中圖片也進行了著錄,著錄的圖片主要是內(nèi)容獨立或附有文字說明的圖片。中文老報紙元數(shù)據(jù)的著錄分三種類型:正文元數(shù)據(jù)、廣告元數(shù)據(jù)及圖片元數(shù)據(jù)?!稌r報》數(shù)據(jù)庫建設(shè)初期,關(guān)鍵步驟之一就是制定正文、廣告、圖片三大類型的元數(shù)據(jù)著錄標準及細則,該標準及細則不僅要全面揭示《時報》的內(nèi)容,同時還要考慮其通用性,能適用于其他老報紙資源。因此,《全國報刊索引》在都柏林核心元數(shù)據(jù)規(guī)范的基礎(chǔ)上,大量查閱《時報》等中文老報紙,總結(jié)其出版、內(nèi)容等方面的規(guī)律,最終制定出三大類型的元數(shù)據(jù)標準及細則。

3.1正文元數(shù)據(jù)著錄

目前,《時報》的正文元數(shù)據(jù)著錄項有將近40個,除標題、責(zé)任者、責(zé)任者單位、責(zé)任者著作方式、卷期信息、版次等基礎(chǔ)著錄項外,為了更深入地揭示資源,《全國報刊索引》還對新聞的來源、發(fā)布地、發(fā)布時間、題中人名、欄目等信息均進行了著錄。此外,《時報》的專刊和特刊眾多,如《教育周刊》《婦女周刊》《醫(yī)學(xué)周刊》《實業(yè)周刊》《汽車周刊》《圖畫周刊》等,針對這一特點,《全國報刊索引》擴展了附屬報名這一著錄項,用于對正文內(nèi)容所屬報紙正刊的附屬報紙名稱進行著錄,包括增刊、副刊、特刊、紀念刊、專刊等,為后續(xù)報名沿革的揭示打下良好的基礎(chǔ)。

《時報》內(nèi)容涵蓋面極廣,為了更好地進行知識組織,《全國報刊索引》對《時報》正文內(nèi)容所屬的主題進行分類,即對資源進行深度標引,實現(xiàn)豐富的檢索和聚類等,因此增加了類別這一著錄項,同時制定正文類別細則,主要有:①“評論”類別?!稌r報》設(shè)有“時評一”“時評二”“時評三”三個專欄,配合每日重大新聞發(fā)表時事短評,言簡意賅,貼合時局,針砭時弊。在其影響下,其他報紙也紛紛效仿,因而這種時事評論在其他中文老報紙中也常出現(xiàn),因此設(shè)立這一類別。②“小說”“詩歌”“散文”“劇本”類別。當時的報刊雜志登載小說是一種風(fēng)尚[5],《時報》等老報紙刊載的文學(xué)作品內(nèi)容豐富多樣,尤其是小說、詩歌等眾多,因此設(shè)立這些類別。③“通信”類別。《時報》開辟有“特約通信”“北京特約通信”等,其他各報紛起效仿,如《申報》的“飄萍通信”、《新聞報》的“一葦通信”等[6],因此設(shè)立這一類別。④“原報導(dǎo)讀”類別?!稌r報》多期報紙中的題名為“提要”“尚有本埠新聞轉(zhuǎn)入后頁”“本報今日第四張教育周刊閱者注意”“本報今日第四張婦女周刊閱者注意”等,對報紙內(nèi)容進行概括或引導(dǎo),因此設(shè)立這一類別。此外,《全國報刊索引》還設(shè)有“消息”“編輯部來信”“公文”等類別。

王靜,沈立力:中文老報紙數(shù)據(jù)庫的建設(shè)研究3.2廣告元數(shù)據(jù)著錄

廣告作為一種史料記錄社會生活的點滴,是還原歷史的重要線索[7],因此對廣告元數(shù)據(jù)的著錄也應(yīng)盡量揭示其內(nèi)容特色。目前,《時報》的廣告元數(shù)據(jù)著錄項有將近20個,除廣告標題、卷期信息、頁碼、版次等基礎(chǔ)著錄項外,《全國報刊索引》還對廣告對象、廣告語、廣告發(fā)布者、廣告欄目等信息進行了著錄。中文老報紙的廣告包羅萬象,為了更好地揭示廣告內(nèi)容,《全國報刊索引》對廣告對象進行劃分,制定了廣告類別細則。

《全國報刊索引》查閱《時報》及《新聞報》(《新聞報》是近代中國刊登廣告最多的著名商業(yè)大報,亦被稱為“廣告報”[8])等老報紙后,制定了廣告元數(shù)據(jù)類別細則,主要有:①“百貨零售”類別?!稌r報》幾乎每天都有永安、先施、新新、麗華等百貨公司的廣告,因此設(shè)立這一類別。②“煙草”類別。在國貨運動的影響下,各香煙廠商宣傳推廣其產(chǎn)品的主要方式就是在報紙上投放廣告?!稌r報》刊登的香煙廣告數(shù)量大、品牌多,而且非常醒目,甚至獨占頭版;《新聞報》等中文老報紙上的香煙廣告也不勝枚舉,涉及面廣,影響較大,因此設(shè)立這一類別。③“醫(yī)療保健”類別?!稌r報》等老報紙刊登有大量的醫(yī)藥廣告,數(shù)量多、版面大,表現(xiàn)手法豐富多樣。廣告發(fā)布者除有個人診所和醫(yī)館外,還有醫(yī)院、藥房以及經(jīng)營藥品的洋行等,廣告內(nèi)容主要是各種藥品、疾病、偏方秘術(shù)等,如性藥廣告、婦科廣告、戒煙廣告等,因此設(shè)立這一類別。④“文化教育”類別。學(xué)校招生、圖書出版等方面的廣告是《時報》廣告的主要內(nèi)容,商務(wù)印書館和中華書局等出版社的廣告經(jīng)常出現(xiàn)在《時報》等老報紙的重要版面,因此設(shè)立這一類別。⑤“交通運輸”類別?!稌r報》《新聞報》等老報紙經(jīng)常登載運輸公司的啟事或聲明,如上海交通運輸公司、鴻安輪船公司、太平車行、云飛汽車等,以及列車運行時刻表、輪船時刻表以及汽車時刻表等各種運輸工具的運營信息,因此設(shè)立這一類別。⑥“招聘人才”類別。《時報》多期刊登題名為“待聘”“征求”“征求人才”“招請人才”等廣告,因此設(shè)立這一類別。⑦“鐘表珠寶”類別?!稌r報》登載各鐘表行、銀樓、珠寶號等公司的廣告,因此設(shè)立這一類別。此外,《全國報刊索引》還設(shè)有“房地產(chǎn)”“金融保險”“拍賣”“建筑裝飾”等類別。

3.3圖片元數(shù)據(jù)著錄

為了更好地揭示老報紙的內(nèi)容,《全國報刊索引》對報紙中的圖片也進行了著錄。目前,《時報》的圖片元數(shù)據(jù)著錄項有將近20個,包括圖片標題、圖片類別、卷期、頁碼、版次等信息?!度珖鴪罂饕丰槍D片類別這一主觀著錄項制定了圖片類別細則,主要有:①“書法”類別。《時報》刊登的圖片部分題名為“書法”,其內(nèi)容大多為某人題字,此外還包括與書法相關(guān)的信息,如學(xué)生的書法成績及評語等,因此設(shè)立這一類別。②“地圖”類別?!稌r報》刊登的圖片部分題名為地圖或某地區(qū)的地圖,因此設(shè)立這一類別。③“漫畫”類別。《時報》刊登的圖片部分題名為“漫畫”或“漫畫/版畫”,因此設(shè)立這一類別。此外,《全國報刊索引》還設(shè)有“照片”“歌譜”等類別。

4《時報》數(shù)據(jù)庫的功能構(gòu)建

4.1文獻檢索

檢索功能是用戶使用數(shù)據(jù)庫最直接的工具,其操作的便捷性和豐富性直接影響用戶對數(shù)據(jù)庫的體驗。目前,《時報》數(shù)據(jù)庫已實現(xiàn)網(wǎng)絡(luò)資源共享,用戶可通過普通檢索、高級檢索及專業(yè)檢索等多種渠道進行文獻檢索。豐富、全面的檢索字段為用戶提供了極大的便利:在正文內(nèi)容方面,數(shù)據(jù)庫可利用的檢索字段包括題名、作者、作者單位、文獻來源、新聞來源、新聞發(fā)布地以及全字段等;在圖片內(nèi)容方面,除全字段和文獻來源外,數(shù)據(jù)庫可利用的檢索字段還包括圖片標題、圖片責(zé)任者、圖片說明等;在廣告內(nèi)容方面,除全字段和文獻來源外,數(shù)據(jù)庫可利用的檢索字段還包括廣告標題、廣告發(fā)布者、廣告語以及廣告產(chǎn)品等。此外,《時報》數(shù)據(jù)庫還可按時間范圍進行檢索,為保證文獻查全率,還支持文獻繁簡檢索轉(zhuǎn)換。用戶通過數(shù)據(jù)庫的索引導(dǎo)出功能,還可以將檢索結(jié)果,如文獻的題名、報名、出版時間等信息導(dǎo)出和保存。

4.2文獻導(dǎo)航

科學(xué)合理的導(dǎo)航對中文老報紙數(shù)據(jù)庫的建設(shè)及應(yīng)用具有重要的作用,這直接關(guān)系到老報紙數(shù)據(jù)庫的使用效率及館藏資源的利用率。目前,中國近代中文報紙全文數(shù)據(jù)庫通過首字母導(dǎo)航和檢索兩種方式設(shè)立文獻導(dǎo)航。用戶不僅可以按照刊名拼音首字母或英文刊名的首字母進行檢索,還可以通過輸入中文老報紙信息,如報紙名稱、創(chuàng)刊時間、出版社、出版地等進行檢索。該數(shù)據(jù)庫對每期報紙都提供整本瀏覽和篇名瀏覽功能,整本瀏覽功能可完整呈現(xiàn)報紙原件的全貌,并可在全屏狀態(tài)下對該版報紙進行放大或縮??;篇名瀏覽功能則完整地羅列出各期報紙收錄的所有文章篇名,使用戶一目了然。此外,該數(shù)據(jù)庫還提供日期選擇功能、版面目錄信息功能、縮略圖功能等。

4.3聚類功能

《全國報刊索引》在建設(shè)《時報》數(shù)據(jù)庫初期就制定了規(guī)范、詳細的元數(shù)據(jù)著錄規(guī)則,并依照該著錄規(guī)則進行數(shù)字化加工處理,同時通過多重校驗確保數(shù)據(jù)質(zhì)量。因此,《時報》數(shù)據(jù)庫具備豐富的檢索字段,可以快速、準確地查找文獻,可實現(xiàn)正文、圖片和廣告三種文獻類別的分類檢索,并可以根據(jù)不同的文獻類別將檢索結(jié)果進行個性化聚類。正文、圖片和廣告的聚類項均包括文獻類型、文獻來源及出版時間。此外,正文聚類項還包括全文狀態(tài)、作者、正文類別、文章欄目、新聞來源及新聞發(fā)生地等;廣告聚類項還包括廣告類別和廣告發(fā)布者等,通過個性化的聚類和圖形化的展現(xiàn)方式為用戶提供優(yōu)質(zhì)的服務(wù)。

4.4全文查閱和文獻定位功能

《時報》數(shù)據(jù)庫提供每篇文獻的全文閱覽服務(wù),用戶可通過整本瀏覽和篇名瀏覽等功能,查閱和下載其所需的文獻資源。同時,該數(shù)據(jù)庫實現(xiàn)了報紙的熱區(qū)精準定位,并對每篇文獻提供預(yù)覽功能,用戶通過預(yù)覽功能和報紙的熱區(qū)精準定位查閱某篇文獻時,該篇文獻即可通過熱區(qū)分色顯示方式展示報紙的原貌。

參考文獻:

[1]楊敏.近代中國報紙數(shù)字資源的建設(shè)和利用研究[J].圖書館工作與研究,2014(6):60-64.

[2]尹婷.上?!稌r報》??芯縖D].南昌:南昌大學(xué),2014.

[3]劉洪梅,梅顥,郭薇.外文老報紙篇名數(shù)字化項目外包后的數(shù)據(jù)質(zhì)量監(jiān)控[J].中國高新技術(shù)企業(yè),2017(11):119-121.

[4]楊敏.新中國成立前老報紙數(shù)據(jù)庫的比較研究[J].科技情報開發(fā)與經(jīng)濟,2014(7):157-160.

[5]劉永文,陳曉鳴.《時報》:頗具時代特色的小說傳媒(1904—1911)[J].江漢論壇,2006(2):113-117.

[6]余玉.從體裁到題材:上?!稌r報》新聞業(yè)務(wù)變革及效應(yīng)探析[J].南昌大學(xué)學(xué)報(人文社會科學(xué)版),2017(4):83-90.

[7]楊朕宇.《新聞報》廣告與近代上海休閑生活的建構(gòu)(1927—1937)[D].上海:復(fù)旦大學(xué),2009.

[8]陸依君.“東方之泰晤士”的傳承與揭示:《新聞報》數(shù)字資源的特色及價值[J].浙江檔案,

2017(4):56-58.

(編校:徐黎娟)第38卷第10期河南圖書館學(xué)刊2018年10月

收稿日期:2018-09-01

作者簡介:陳驪(1969—),長治醫(yī)學(xué)院館員。

猜你喜歡
元數(shù)據(jù)時報數(shù)據(jù)庫
老飛人
數(shù)據(jù)庫
基于來源的組織機構(gòu)元數(shù)據(jù)構(gòu)建研究
《京華時報》2017年1月1日起休刊
元數(shù)據(jù)與社會化標簽在微視頻搜索中的應(yīng)用
高等院校智慧校園建設(shè)規(guī)劃與實現(xiàn)
潮流時報
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫