国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

以數(shù)據(jù)庫視角淺析圖書館數(shù)據(jù)化

2018-11-09 10:24徐勇
科技視界 2018年18期
關(guān)鍵詞:數(shù)據(jù)表流通館藏

徐勇

【摘 要】圖書館數(shù)據(jù)化是一門古老而新興的事業(yè),用現(xiàn)代的數(shù)據(jù)分析方法分析圖書館的數(shù)據(jù),是讓圖書館事業(yè)煥發(fā)新活力的有效途徑。基于此,本文試圖說明圖書館數(shù)據(jù)化的方式和方法,助力圖書館事業(yè)的發(fā)展。

【關(guān)鍵詞】圖書館;數(shù)據(jù)庫;數(shù)據(jù)化

中圖分類號: G250.7 文獻標識碼: A 文章編號: 2095-2457(2018)18-0071-002

DOI:10.19694/j.cnki.issn2095-2457.2018.18.031

【Abstract】Library datamation is an ancient and emerging enterprise,Using modern data analysis method to analyze library data is effective way to make library cause new vitality.Based on this,this paper attempts to explain the way and the method of library datamation,boost the development

【Key words】Library; Data base; Digital

0 引言

在21世紀的今天,信息飛速產(chǎn)生和沉淀,數(shù)據(jù)量呈幾何式爆炸增長,各種數(shù)據(jù)分析和數(shù)據(jù)管理工具應(yīng)運而生,對數(shù)據(jù)進行分析得出非凡的結(jié)論,正在逐漸成為新的工作模式。圖書館是讀者和信息之間的溝通橋梁,是人類獲取信息的重要途徑之一。對圖書館的數(shù)據(jù)進行順應(yīng)時代發(fā)展的處置,是使圖書館事業(yè)煥發(fā)活力的新途徑。

1 數(shù)據(jù)化理論

在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中大數(shù)據(jù)指不用隨機分析法這樣的捷徑,而采用所有數(shù)據(jù)進行分析處理的方法。在大數(shù)據(jù)背景下,數(shù)據(jù)樣本=數(shù)據(jù)總體,即全數(shù)據(jù)模式。數(shù)據(jù)化是指一種把現(xiàn)象轉(zhuǎn)變?yōu)榭芍票矸治龅牧炕问降倪^程,通過數(shù)據(jù)化,萬千事物均可轉(zhuǎn)化為數(shù)據(jù)形式。通常,數(shù)據(jù)化包含收集數(shù)據(jù)、整理數(shù)據(jù)和存儲數(shù)據(jù)等步驟,數(shù)據(jù)化一般均以數(shù)據(jù)分析為目的,最終為工作業(yè)務(wù)服務(wù)。圖書館數(shù)據(jù)化是將圖書館業(yè)務(wù)工作以數(shù)據(jù)表格形式量化的過程。數(shù)據(jù)分析一般是指用適當?shù)慕y(tǒng)計方法有目的地收集數(shù)據(jù)、分析數(shù)據(jù),使之成為信息的過程。由此我們得到了數(shù)據(jù)化的一般閉合流程,即:工作業(yè)務(wù)-數(shù)據(jù)化-數(shù)據(jù)分析-工作業(yè)務(wù)。如上可知,完成圖書館數(shù)據(jù)化,是為了用數(shù)據(jù)分析的方法揭示和分析圖書館業(yè)務(wù)流程的特點和彼此間的關(guān)系,為圖書館事業(yè)的發(fā)展提供數(shù)據(jù)支撐。

關(guān)系是圖書館工作的重要特征之一,因此圖書館數(shù)據(jù)化的結(jié)果一般用關(guān)系型數(shù)據(jù)庫來存儲,在這個數(shù)據(jù)庫中,數(shù)據(jù)按不同類型形成不同的數(shù)據(jù)表在分析使用中,數(shù)據(jù)表間用不同的特征值(主鍵)聯(lián)絡(luò),形成特定的數(shù)據(jù)鏈條。詳見圖表1。

從圖表1中可以看出,我們可以把館藏數(shù)據(jù)、流通數(shù)據(jù)和參考咨詢數(shù)據(jù)通過數(shù)據(jù)鏈條鏈接到一起,實現(xiàn)我們自己需要的查詢和分析目標。在同一個數(shù)據(jù)表中存儲同類型的數(shù)據(jù),在不同的數(shù)據(jù)表間用相應(yīng)的字段鏈接,使整個數(shù)據(jù)庫數(shù)據(jù)形成一個整體,方便查詢使用。

2 圖書館數(shù)據(jù)

按照圖書館業(yè)務(wù)流程和數(shù)據(jù)分析的需要,本文將圖書館數(shù)據(jù)分為三個大類:館藏數(shù)據(jù)、流通數(shù)據(jù)、統(tǒng)計數(shù)據(jù)。館藏數(shù)據(jù)是文獻資源建設(shè)成果的最終體現(xiàn);流通數(shù)據(jù)反映了文獻資源建設(shè)的質(zhì)量;統(tǒng)計數(shù)據(jù)是除館藏數(shù)據(jù)、流通數(shù)據(jù)之外所有能反映圖書館事業(yè)的數(shù)據(jù)的總稱。

2.1 館藏數(shù)據(jù)

一般地,圖書館館藏資源包括圖書、期刊、報紙、學(xué)位論文、古籍善本、特藏專藏、工具書、年鑒、電子出版物、縮微資料、視聽資料等。這些文獻資源按照相應(yīng)的文獻著錄規(guī)則著錄后形成館藏。需要注意到的是,本文中的館藏數(shù)據(jù),并不是指文獻著錄形成的marc數(shù)據(jù),而是數(shù)據(jù)化館藏以后形成的表格數(shù)據(jù),它的大部分字段和marc數(shù)據(jù)的內(nèi)容相同,包括了題名和責任說明、標準號、版本、出版發(fā)行、載體形態(tài)、叢編、附注、主題分析、索取號等,同時也包含條形碼號、記錄修改者、記錄修改時間等。詳見圖表2。

在本表中,簡單設(shè)計了館藏數(shù)據(jù)的存儲格式,它包括了所有的題名和責任說明項,在數(shù)據(jù)庫中,可以比用marc數(shù)據(jù)更方便地統(tǒng)計和分析,載體、附注和主題詞也是同樣的道理。比如主題詞有網(wǎng)絡(luò)經(jīng)濟和通俗讀物兩個,它們以“;”分隔,用數(shù)據(jù)庫的方法可以將這兩個詞分離出來,供我們查詢使用。這和在常規(guī)的圖書管理系統(tǒng)中查詢關(guān)鍵詞是同樣的原理。

在文獻入藏之前,有一個采訪過程,采訪是圖書館工作中非常重要的工作流程,它直接決定了文獻資源建設(shè)的質(zhì)量。采訪數(shù)據(jù)和館藏數(shù)據(jù)在結(jié)構(gòu)和內(nèi)容上的區(qū)別均不大,區(qū)別在于采訪數(shù)據(jù)可以用不同的字段做主鍵建立不同的數(shù)據(jù)表。一般的采訪表是以標準書號作為主鍵,如以題名為主鍵,可以建立同名書的采訪表;以責任者為主鍵,可以建立同作者作品庫采訪表等。詳見圖表3。

在文獻采訪過程中,用不同的采訪表與館藏數(shù)據(jù)表作比較,可以明確重復(fù)采購和查缺補缺。因此,建設(shè)一個數(shù)據(jù)完善的、具備不同采訪表的采訪數(shù)據(jù)庫是非常必要和必須的。同時,采訪數(shù)據(jù)庫的建設(shè)是一個長期的隨時間累積的過程,需要有專門的專業(yè)人員負責。

2.2 流通數(shù)據(jù)

流通工作是圖書館和讀者之間溝通的橋梁,流通工作中產(chǎn)生的數(shù)據(jù)直接反映的文獻資源建設(shè)的質(zhì)量。流通數(shù)據(jù)常用結(jié)構(gòu)見圖表4。

一般地,讀者表主要包括姓名、性別、讀者證號、讀者類型、讀者單位、借閱量、借閱期限等。在流通數(shù)據(jù)表中,通常以索取號和讀者證號為主要檢索途徑,它們鏈接著館藏文獻表和讀者表。因為文獻在流通過程中,會產(chǎn)生借閱和零借閱。

對于一段時期內(nèi)的零借閱,原因一般有兩點,一是采訪過程中沒有做好讀者需求分析和文獻入藏價值分析,造成誤購;二是流通過程中沒有做好文獻流通分析和讀者借閱分析,導(dǎo)致閱讀推廣活動缺乏針對性,沒有為好書找到讀者。

對于有借閱史的文獻來說,文獻借閱信息和讀者借閱信息是相輔相成、必不可少的。在這里,讀者表對應(yīng)館藏文獻表,館藏文獻表對應(yīng)文獻借閱表,所以分析單本文獻、一類文獻和所有文獻的借閱史和讀者表,可以知道文獻受歡迎程度和讀者分布,如一般地,男性讀者偏愛武俠小說而女性讀者偏愛言情小說,又如圖書館的文獻總是文學(xué)類借閱量多而專業(yè)類相對較少。所以,借閱數(shù)據(jù)和館藏數(shù)據(jù)的互動,可以為文獻副本量的確定和新書薦購、閱讀推廣等活動提供指導(dǎo)方向。

2.3 統(tǒng)計數(shù)據(jù)

圖書館是一個生長著的有機體,除去傳統(tǒng)的館藏數(shù)據(jù)和流通數(shù)據(jù),還有許多其他的數(shù)據(jù),對圖書館的數(shù)據(jù)化是有用的。如建筑面積、閱覽空間、讀者數(shù)量、辦館層次、自動化設(shè)備等硬件數(shù)據(jù),也有自動化軟件、科技查新、參考咨詢、學(xué)科服務(wù)、館際互借、電子資源等軟件資源,這些數(shù)據(jù)關(guān)系著圖書館的硬件建設(shè)和內(nèi)涵建設(shè)。同時我們注意到,這些數(shù)據(jù)在數(shù)據(jù)化過程中的格式是各不相同的,所以要在需求的前提下單獨設(shè)計相應(yīng)的數(shù)據(jù)格式。如下圖表5。

圖表5是參考咨詢數(shù)據(jù)形成的一個表格,它反映了讀者、咨詢時間和咨詢方向等信息,它可以跟讀者表鏈接,以此說明讀者的基本情況。也可以跟館藏數(shù)據(jù)表鏈接,統(tǒng)計和分析在本課題下的文獻建設(shè)情況等。如上的每一種跟圖書館相關(guān)的事物均可以設(shè)計相應(yīng)的數(shù)據(jù)化表格并做數(shù)據(jù)收集,但某些數(shù)據(jù)收集和表格設(shè)計工作又是困難的。如讀者閱覽文獻的過程是讀者對文獻檢索挑選的過程,這個過程的數(shù)據(jù)對于圖書館了解讀者動態(tài)、把握讀者閱讀興趣非常有幫助。但是目前對于讀者閱覽數(shù)據(jù)的收集,盡管有先進的門禁系統(tǒng),但我們?nèi)匀粺o法判斷讀者經(jīng)過門禁系統(tǒng)后在圖書館呆了多久、讀者進圖書館是借閱文獻或者是自由活動等。所以對于某些特定數(shù)據(jù)的收集,需要我們有更多的思考和辦法。將這些特定數(shù)據(jù)整理起來,形成一個有機的整體,對圖書館各項事業(yè)的發(fā)展是一種有力的呈現(xiàn)和支撐。

3 結(jié)語

本文中的所有數(shù)據(jù)表格均為簡單的截取一條數(shù)據(jù),實際上,萬千條經(jīng)過數(shù)據(jù)化的圖書館數(shù)據(jù)就這樣匯集在一起,形成一個龐大的數(shù)據(jù)庫系統(tǒng),它們彼此獨立又彼此聯(lián)系,共同構(gòu)成了圖書館事業(yè)發(fā)展的數(shù)據(jù)支撐。

在《信息簡史》一文中,作者寫到:“萬物源于比特”。而圖書館本身就是一個信息的集散中心,數(shù)據(jù)化是對文獻載體和存儲空間進行的量化,它一般不涉及文獻的具體內(nèi)容。而數(shù)字化是指把模擬數(shù)據(jù)轉(zhuǎn)換成用0和1表示的二進制碼的過程,它恰好處理的是文獻的內(nèi)容。所以圖書館的數(shù)據(jù)化和數(shù)字化優(yōu)勢互補,共同作用使圖書館呈現(xiàn)出它的信息本質(zhì),即信息中介。信息的傳遞性讓圖書館數(shù)據(jù)化有了根本的動力,也是在大數(shù)據(jù)技術(shù)蓬勃發(fā)展的今天,讓圖書館數(shù)據(jù)化有了分析和處理的解決之道。

本文是作者在圖書館數(shù)據(jù)化領(lǐng)域的初步嘗試,水平有限,錯誤難免,權(quán)作拋磚引玉,希望有志同道合者與本人溝通,為圖書館事業(yè)的發(fā)展略盡綿力。

【參考文獻】

[1]詹姆斯·格雷克.信息簡史[M].北京:人民郵電出版社,2013,7.

[2]維克托·邁爾-舍恩伯格.大數(shù)據(jù)時代[M].浙江人民出版社,2015,039.

猜你喜歡
數(shù)據(jù)表流通館藏
館藏
博物館的生存之道:館藏能否變賣?
圣物的流通——蕃尼古道上的尼泊爾鎏金銅佛流通考察
基于列控工程數(shù)據(jù)表建立線路拓撲關(guān)系的研究
知還印館藏印選——古印篇
“流通空間”的中西方比較
圖表
商貿(mào)流通
基于VSL的動態(tài)數(shù)據(jù)表應(yīng)用研究
The Japanese keiretsu system
襄樊市| 沅江市| 大厂| 黎城县| 阿克苏市| 镇巴县| 泸州市| 仪征市| 辽宁省| 乐山市| 西乌珠穆沁旗| 肃宁县| 大理市| 政和县| 宜都市| 惠来县| 丰都县| 达州市| 台北县| 河间市| 肥西县| 台前县| 公安县| 长春市| 罗城| 曲麻莱县| 马关县| 德州市| 芦溪县| 大兴区| 耒阳市| 南陵县| 阿巴嘎旗| 金秀| 云梦县| 巍山| 安吉县| 许昌县| 新泰市| 上犹县| 无棣县|