国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從關鍵詞統(tǒng)計分析看我國圖書情報界數據庫建設研究

2009-11-19 09:16昌建納
現代情報 2009年9期
關鍵詞:統(tǒng)計

昌建納

〔摘 要〕以VIP和CNKI為數據源,運用關鍵詞統(tǒng)計方法分析我國圖書情報界關于數據庫建設研究論文的主題內容和研究特征。結果表明:研究主題集中于各類型數據庫的建設實踐方面,注重建庫資料來源、質量控制和現代科學技術的應用研究,網絡數據庫、知識產權是近期研究的熱點和難點??傮w研究特征,微觀層面的經驗總結性探索居多,宏觀層面理論指導性研究偏少,數據庫建設研究內容隨時代發(fā)展變化而變化。

〔關鍵詞〕關鍵詞統(tǒng)計;圖書情報界;數據庫建設研究

〔中圖分類號〕G350 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)09-0143-05

Study on Construction Database in Library and Information

Science in China from Keyword StatisticsChang Jianna

(Library,Yunna University,Kunming 650091,China)

〔Abstract〕Taking VIP & CNKI as the statistical source,this paper made a statistic and analysis about contents and trends of research papers of construction database in library and information science in china by applying keyword statistics.The results showed that:focus on various types of construction database,database origins,quality control and the application of modem science and technology,and net word database and intellectual property rights were the hotspots and tough issues.Study on overall characteristic display the macro-level study of theory was not more as micro-level experience and exploration,and this study content of development with time change.

〔Key words〕keyword statistics;library and information science;construction database research

我國數據庫建設已有30余年歷史,經過引進、學習、借鑒國外數據庫理論成果的起步階段(1975-1979年),研究和自建中文數據庫的發(fā)展階段(1980-1993年),以1993年2月我國第一家專業(yè)數據庫公司——“萬方數據庫公司”的成立為標志,進入了成熟實用及飛速發(fā)展階段(1993年-至今)[1]。目前代表性數據庫有:國家圖書館的《中國國家書目數據庫》、中國科學院的《西文期刊聯合目錄庫》、清華同方的《中國期刊全文數據庫》等。此外,國內各行業(yè)根據科學發(fā)展和研究的需要建立了大批專業(yè)數據庫,各圖書情報機構也根據自身需求建立了各種內容的書目、文摘、全文、多媒體等類型數據庫。與此同時,關于數據庫建設的研究也隨之興起,為了解國內圖書情報界關于數據庫建設研究的發(fā)展脈絡和研究的總體特征。本文借助網絡資源數據進行統(tǒng)計,分析這一研究領域的主題內容和發(fā)展趨勢,展示當前研究的特點,以利于今后的繼續(xù)研究。

1 數據獲取與處理

采用《中文科技期刊數據庫》和《中國學術期刊全文數據庫》為數據來源庫,考慮到數據庫的建設還可以用構建、建立、創(chuàng)建、自建等詞匯表述,以T=數據庫*T=建*U=(圖書+情報)為檢索式,在《中文科技期刊數據庫》中檢出論文1 570篇,再以數據庫and建and(圖書or情報)進行主題檢索,在《中國學術學術期刊全文數據庫》中檢出1 211篇(檢索時間為2008年月10月)。將檢出的論文下載,合并后剔除重復以及無關論文,共1 556篇。

關鍵詞是表達文獻主題概念的自然語言詞匯,某學科相關文獻關鍵詞的分布頻次與特征能顯示該學科的總體內容特征,研究內容之間的內在聯系,學術研究的發(fā)展脈絡與發(fā)展方向,學術研究的重點與熱點等[2]。本文選用單關鍵詞統(tǒng)計。把論文關鍵詞導入Excel工作表,利用表格查找功能查關鍵詞,將出現頻率>10次的詞匯按頻次的高低列表。以高頻關鍵詞和研究論文內容相結合方式進行論文研究主題的分析,考查我國圖書情報界關于數據庫建設研究的現狀、研究特點和發(fā)展變化,為今后的繼續(xù)研究提供參考。

2 研究論文的關鍵詞統(tǒng)計分析

關于我國圖書情報界數據庫建設這一專題研究,從其研究論文的關鍵詞詞頻統(tǒng)計表中可見,出現頻率最高的關鍵詞是數據庫,其次為建設,表明高頻關鍵詞與研究主題相吻合。具體研究內容可分為下述方面:

2.1 數據庫類型研究

由表1可見,特色數據庫和書目數據庫是被研究最多的2種數據庫類型。特色文獻數據庫是建庫單位根據自身特色文獻資源和用戶特定需求開發(fā)、有著獨特內容的數據庫,具有專業(yè)學科、區(qū)域特征、地方文化、館藏特色等諸多特點。特色文獻數據庫的建立是建庫單位深層次開發(fā)文獻資源,為用戶提供特色服務的重要手段,也是資源共享的基礎,因而是數據庫建設研究極為關注的問題。關鍵詞出現頻率十分高,尤其是進入21世紀以來增多;統(tǒng)計還發(fā)現關于書目數據庫的建設研究主要集中在上世紀80~90年代,書目數據庫的建立對于充分揭示館藏,為用戶快捷查找所需資料提供便利,也是圖書館實現自動化管理的前提和保障。為滿足自動化系統(tǒng)對目錄數據的要求,1980年北京成立了MARC協(xié)作組為制定中國的機讀目錄探索經驗,1990年正式發(fā)行中國機讀目錄,高校和省市圖書館分別開始了中文書目的建設[3]。書目數據庫建設的研究也隨之興起,所以關鍵詞詞頻也較高。與之相關的高頻關鍵詞還有:機讀目錄、聯合目錄、回溯書目、目錄數據庫、計算機編目、MARC等等;全文數據庫也是高頻關鍵詞之一,全文數據庫的建成可以滿足用戶獲取文獻資料原文的需求,是數據庫建設追求的完美目標,近年來與之相對應的研究增多;專題數據庫指關于某一特定學科、特定主題或某一專門問題的數據集合,專題數據庫建設可提供專業(yè)性、專題性服務,是圖書館開展專題信息服務的最佳體現。關于專題研究的內容十分廣泛,可從數據庫資料來源研究中窺見一斑,專題數據庫出現的頻率也高。此外,還有下述幾種數據庫建設的研究較多。

學位論文是高校圖書館的特色館藏,不公開出版,與學校的學科密切結合,反映學校各專業(yè)領域發(fā)展水平、研究進展,具有很高的學術價值和情報價值。關于學位論文庫建設研究的內容有:學位論文庫建設的總體設計、元數據標準、數據庫功能、建設流程和實現方法、闡述建庫實踐過程和經驗、探討建庫引發(fā)的種種問題、進行國內外學位論文庫的比較研究等等。

我國古籍記錄了中華民族五千年的歷史進程,是中華各民族文化積淀的載體,是研究傳統(tǒng)文化的信息資源寶庫,品種和數量極為豐富。古籍數據庫建設研究包括了反映館藏或古籍善本的特藏庫、突出地方特色的書目庫、專題庫和全文庫的建庫實踐,以及在數據庫建設中關于古籍收錄的范圍、分類與主題標引、著錄標準、數據庫建設方案、數據庫系統(tǒng)結構、建庫質量控制等內容。

期刊主要登載學術論文,由于其內容具有新穎、有獨創(chuàng)性、學術性強、時效快等特點,成為用戶尤其是研究型用戶需求的文獻資料。針對外文期刊價格昂貴、收藏不易等特點,期刊數據庫建設的研究主要涉及外文刊,中文刊次之,目錄庫較多,尤其是聯合目錄,而全文庫少。許多建庫單位開展了建立外刊聯合目錄數據庫的研究,探討合作建庫等問題。

在我國55個少數民族中,有古文字或現存文字的少數民族不在少數,更有大量歷代關于少數民族的研究資料,所以民族文獻數據庫建設研究也引起了關注,具體包括:西北、西南、湘西等地區(qū)的少數民族文獻,以及畬、黎、滿、赫哲等民族文獻數據庫建設研究。

2.2 數據庫建設的資料來源研究

表1數據顯示,數據庫建設的資料來源包括各種文獻資源、信息資源、各地方文獻、古籍、民族文獻、學位論文、特色文獻、專題文獻、特色館藏、數字資源、網絡資源等等。實際上這些高頻關鍵詞涵蓋的內容和范圍十分廣泛,具體包括了諸如:張騫研究、西夏文獻、宋代文獻、清史圖錄、民族研究文獻、族譜、客家文獻、華僑華人文獻信息、農業(yè)信息、林業(yè)文獻、海洋資源、水產科技、食品古籍、中醫(yī)藥典籍、民族古籍、藏文古籍、白族文獻、青藏高原、石油地質學、枸杞文獻、苗族醫(yī)藥、抗戰(zhàn)文化、姑蘇橋文化、臨川文化、茶文化、地方特色文化、貨幣圖片等等。資料來源種類繁多,不勝枚舉,說明我國文獻資源浩瀚、學科種類繁多、文獻類型復雜、分布面極廣、歷史積淀深厚,數據庫建設資料來源的研究題材十分豐富,囊括了歷史、地理、文化、專業(yè)學科等各類資源。由于建庫資料來源的選擇關系到數據庫建設的質量和應用效果,各圖書情報機構分別就各種文獻信息資源的內容范圍、資源特色、資源價值判斷、收集方式等問題展開了廣泛而深入研究。

2.3 關于數據庫建設機構

統(tǒng)計表明,與數據庫建設研究最多的相關機構是高校圖書館。數字資源建設歷來是高校圖書館資源開發(fā)與信息服務的目標,尤其是近十年。1998年中國高等教育文獻保障體系(CALIS)建成啟動以來,高校圖書館的數字化建設也同步快速發(fā)展,CALIS于1999年7月設立CALIS特色數據庫和導航建設項目組以來,高校自建特色專題數據庫明顯增多。以學位論文庫為例,經過“九五”建設CALIS學位論文文獻數據庫數量累計達10萬余條[4]。2003年9月CALIS“學位論文全文數據庫”項目正式啟動后,學位論文數據庫建設更是突飛猛進,相應的研究也大量涌現;公共圖書館這一關鍵詞檢出頻率不高,與論文關鍵詞的選詞有關,如北京圖書館、上海圖書館、中山圖書館、遼寧省圖書館等用公共圖書館作為關鍵詞檢不出來,實際上公共圖書館對于數據庫建設的研究也很多;與高校圖書館不同,情報機構在早期的數據庫建設中發(fā)揮很大了作用。上世紀70年代末到80年代中期,計算機在情報機構中應用開始了中文文獻數據庫的建設,有了中國科學技術信息研究所的萬方數據庫和國家科委西南信息中心的維普數據庫[5]。從文獻綜述中也可看到情報機構的數據庫建設成果[6]。足見情報機構對數據庫建設和研究的重視。

2.4 數據庫建設目的和意義研究

從表1中列出的關鍵詞:自動化、資源共享、共建共享、資源建設、資源開發(fā)、數字化、數字圖書館、情報檢索、信息服務、信息檢索等等,說明了數據庫建設目的和意義的研究內容。即利用現代化技術手段開發(fā)各種文獻信息資源,進行資源的數字化轉換處理,建成各類型數據庫或數字圖書館,提高圖書館自動化管理水平,利用網絡以便不受時間空間的限制向用戶提供更好的情報檢索和信息服務。數據庫建設離不開文獻資源的數字化,數據庫建設的終極目標就是實現資源的共建共享。大多數論文都涉及到了數據庫建設目的和意義的研究,但缺乏深入系統(tǒng)的探討。

2.5 數據庫質量控制研究

與數據庫質量控制相關的高頻關鍵詞有:標準化、規(guī)范化、質量控制、標引、元數據、MARC、數據質量、數據庫管理等等。其中標準化居首位,表明文獻的標準化是數據庫建成后資源共享的前提和基礎,缺乏建庫的標準和規(guī)范,就不可能有協(xié)作建設和資源共享,標準和規(guī)范是數據庫建設質量控制的核心。標引是深入揭示文獻內容,提供多途徑檢索的重要手段,標引質量高低與檢索查準率密切相關,關于標引的研究較多,如:主題標引、關鍵詞標引、分類標引等。元數據是關于數據的內容質量、狀況和其他信息的描述,為各種形態(tài)的數字化信息單元和資源集合提供規(guī)范、普遍的描述方法和檢索工具,對促進數據的規(guī)范管理、使用和共享均有重要作用。圖書館在文獻數據庫建設中對元數據標準的應用比較廣泛,目前應用最普遍的是MARC標準,主要用于書目庫的書目記錄數據。在圖書館對網絡資源的整合中采用了DC元數據標準。伴隨著數據庫建設文獻類型的變化和數據庫的擴展,將開始選用其他元數據標準。由于標準化和規(guī)范化保證數據庫運行的可靠、系統(tǒng)、兼容性,因此許多論文對數據庫建設中描述語言和標引語言的應用,以及國際國內通用標準的采用進行了大量的深入研究。

2.6 現代化技術應用與數據庫管理研究

隨著現代化技術在圖書情報領域內廣泛深入的應用。網絡環(huán)境、WEB、網絡化、網絡數據庫、計算機應用、ILAS等關鍵詞數量增加?;ヂ摼W從形成到今天,廣泛而深刻地影響和改造著我們的社會,圖書情報界也不例外,網絡成為現代信息資源存貯、交流和利用的主要載體,網絡為數據庫發(fā)展提供獨特的優(yōu)勢和無窮的潛力,數據庫通過網絡傳播使用,在網絡環(huán)境下實現其價值,為用戶提供遠程信息檢索服務。上世紀末以來網絡數據庫的建設升溫,與之相應的研究也隨之增加,成為研究的熱點。同樣,計算機在圖書館內的應用,使數據庫的建設和發(fā)展成為可能,相應的研究也伴隨出現。深圳圖書館自動化集成系統(tǒng)ILAS在1991年8月正式開通并全面運行后,在全國各類型圖書館中使用,許多圖書館利用該系統(tǒng)提供的自建數據庫功能建立古籍、學位論文、會議論文題錄等數據庫,并分別撰文探討利用ILAS的建庫研究工作。

數據庫管理研究主要集中在數據庫制作管理、操作系統(tǒng)軟硬件選用等方面,關鍵詞包括軟件、TPI、管理系統(tǒng)、數據庫管理、圖書館管理、計算機管理等等。軟件是數據庫管理的工具,指利用數據庫技術對數據進行存貯、追加、置換、刪除、檢索等操作。這方面的研究包括Micro CDS/ISIS軟件、CALIS中心的建庫軟件、丹誠軟件、Ztrans軟件在各種數據庫建設中的應用等等。數據庫制作研究還包括:論述研發(fā)學位論文數據庫管理系統(tǒng)的設計方案和技術路線。探討基于TPI的數據庫管理平臺設計的專題文獻數據庫建庫中遇到的技術難題,以及TPI在學位論文庫建設中的應用。探討TPS面向文本數據庫管理系統(tǒng)為平臺的數據庫建設問題。以PDF文件自動構建全文數據庫的設計。利用Word的VBA合并不同結構數據庫的方法和Word Perfect字處理軟件在英文文摘數據庫建設中的應用介紹。在WEB中采用ASP建立數據庫查詢。利用CGI建造WEB數據庫系統(tǒng)的中間件技術以及Java技術建立專題數據庫?;赬ML的web挖掘技術在特色數據庫建設中的應用等研究。

2.7 知識產權研究

伴隨著文獻資源的數字化進程的推進,知識產權問題已成為數據庫建設中值得關注的研究熱點,因而增強知識產權的保護意識,完善相應的法律法規(guī),在遵循現有法律的前提下,合法解決版權、著作權問題是數據庫建設中的難點。相應的關鍵詞有:知識產權、版權、著作權。研究內容包括:針對數據庫建設及使用中涉及的版權問題進行分析研究,提出規(guī)避版權風險和解決問題的策略。闡述特色數據庫建設中涉及的著作權問題及解決途徑。探討建設學位論文全文數據庫中易引發(fā)的著作權問題,及在實踐中克服著作權的困擾。研究利用著作權法對著作權的限制性規(guī)定來進行數據庫建設。提出數據庫建設不僅涉及著作權保護問題,同時也要做好數據庫本身的著作權保護。對國內影響較大的中文圖書數據庫的版權建設進行比較研究,論述自建數據庫和服務中涉及的知識產權問題,提出利用法律保護自建數據庫自主知識產權的建議等等。

3 小 結

3.1 數據庫建設研究的總體特征

我國數據庫建設事業(yè)從自發(fā)、分割狀態(tài)下起步,國家調控不力,數據庫建設各自為政,建庫規(guī)模小、全國性大型數據庫少、專業(yè)面窄、結構單一、標準不統(tǒng)一、橫向聯系少、整體諧調差、重復建設多、自用數據庫多、共享性差。數據庫建設研究也真實地反映了數據庫建設的工作情況。綜觀我國圖書情報界數據庫建設研究,大量的研究論文只立足本系統(tǒng)、本行業(yè)、本地區(qū)、本單位的資源和需求進行數據庫建設的目的、意義、必要性、可行性、規(guī)范和方法、建庫步驟、技術以及出現問題和解決對策的探討,大多為經驗總結性探索,屬于微觀層面的研究。從宏觀層面探討我國數據庫建設的理論思想、指導原則、戰(zhàn)略規(guī)劃、建設目標、管理體制、建庫模式、運作方式、發(fā)展狀況的研究不足。雖然數據庫建設研究內容多種多樣,體現了圖書情報工作鮮明的實踐性特征,但完整的理論體系未能產生,導致不能有效指導實踐、更好的促進數據庫建設研究的發(fā)展??傮w特征為應用研究居多,理論研究偏少。

3.2 數據庫建設研究特點

我國數據庫建設歷經30余年發(fā)展,建設成果引起眾多研究者的關注。在圖書情報界,研究的重點主要集中于數據庫各種資料來源的范圍、價值、特點和收集方式,特色庫、書目庫、專題庫、古籍庫和學位論文庫等各類型數據庫的建設實踐。注重數據庫建設過程中的質量控制和現代技術在建庫中的應用等研究。

隨著我國信息基礎設施的建設和完善,文獻資源數字化進程的加快,資源共建共享意識增強,網絡數據庫、數字圖書館成為近期的研究熱點。

在數據庫建設和服務中涉及的知識產權保護是一個較為復雜的問題,因而成為數據庫建設研究的難點。

弱勢論題有下述方面:對數據庫建設的評價研究開展極少,僅有《期刊數據庫建設工作與質量評價》、《特色數據庫系統(tǒng)建設評價指標分析》等有限的幾篇論文探討這一主題。從用戶需求出發(fā)建好數據庫應該是數據庫建設的立足點,滿足用戶需求的數據庫才具有存在價值,但這一專題研究有所欠缺。通過與國外數據庫的比較研究來透視我國數據庫建設存在問題的研究同樣不足??茖W評價性文獻數據庫如科學引文數據庫建設研究偏少。

3.3 數據庫建設研究變化趨勢

伴隨現代科學技術發(fā)展和網絡環(huán)境成熟,數據庫建設研究從早期的書目數據庫、文摘數據庫向全文數據庫轉化,從光盤數據庫建設向網絡數據庫、多媒體數據庫建設轉化。建庫過程中元數據的選用由單一變?yōu)槎喾N。隨著數字資源建設工作在高校圖書館的開展,越來越多的高校圖書館加入到數據庫建設研究工作中。1992年國家科委把“科技情報”改為“科技信息”,情報檢索這一術語逐漸被信息服務取代。隨著我國法律制度的健全,“知識產權”、“版權”、“著作權”等詞匯逐漸增加。數據庫建設中現代化技術應用與日俱增,新概念和新技術的引入,新關鍵詞出現,老關鍵詞的減少,反映了數據庫建設研究內容隨時代發(fā)展變化而變化,并將繼續(xù)發(fā)生變化。

參考文獻

[1]黃俊貴.數據庫資源建設述略[J].北京圖書館館刊,1998,(1):97-103.

[2]邱均平,等.國內外情報學研究研究重點及其演進[J].圖書館論壇,2005,(6):71-76.

[3]查成泰.中文書目數據庫建設概論[J].高校文獻信息學刊,1994,(3):28-31.

[4]趙陽,姜愛蓉.“CALIS學位論文全文數據庫”的建設實踐[J].大學圖書館學報,2006,(4):48-52.

[5]孟連生.簡評90年代中國文獻數據庫建設[J].情報科學,1999,(3):306-310.

[6]卓香棖.我國自建計算機情報檢索系統(tǒng)數據庫綜述[J].情報學刊,1990,(2):118-124.

猜你喜歡
統(tǒng)計
高中數學《統(tǒng)計》淺析
道路運輸行業(yè)統(tǒng)計工作研究
淺談統(tǒng)計數據質量控制
2008—2015我國健美操科研論文的統(tǒng)計與分析
泗洪县| 霍山县| 吴堡县| 东安县| 喀喇沁旗| 噶尔县| 闵行区| 岳阳县| 改则县| 汉寿县| 郴州市| 城口县| 炉霍县| 扎鲁特旗| 连城县| 五河县| 连江县| 司法| 峨眉山市| 武威市| 东乌珠穆沁旗| 桃源县| 博客| 永城市| 栖霞市| 晋中市| 白玉县| 枣阳市| 神木县| 奉新县| 康定县| 聂荣县| 涿州市| 庄河市| 上蔡县| 确山县| 阳朔县| 灵宝市| 莱阳市| 阳高县| 浮山县|