韓璐 曾月蓉 王影 鄧文榮
摘要:通過對國內(nèi)三大中文期刊數(shù)據(jù)庫平臺數(shù)據(jù)內(nèi)容、檢索功能、聚類分析等三個方面的對比分析,說明了三大數(shù)據(jù)庫平臺的共性與個性化特點,為用戶選擇購買、平臺使用提供判定依據(jù)。
關(guān)鍵詞:中文期刊數(shù)據(jù)庫 ;數(shù)據(jù)內(nèi)容;檢索功能;聚類分析;對比分析
中圖分類號:G250 文獻標識碼:A 文章編號:1009-3044(2018)19-0006-04
目前,科研機構(gòu)、公共圖書館、高校圖書館使用最多、利用率最高的中文學(xué)術(shù)期刊資源服務(wù)平臺主要有三種:中國知網(wǎng)的(以下簡稱知網(wǎng)期刊)、重慶維普(以下簡稱維普期刊)和萬方數(shù)據(jù)資源系統(tǒng)(以下簡稱萬方期刊)。這三大中文期刊數(shù)據(jù)資源服務(wù)平臺文獻分類豐富,收錄期刊數(shù)量多,內(nèi)容更新速度快,用戶廣泛。對比三大期刊平臺建設(shè),雖然數(shù)據(jù)資源內(nèi)容有重復(fù)、平臺功能和技術(shù)、個性化服務(wù)特點有類似,但各自有特色,尤其對近年來知識組織與信息聚類技術(shù)、可視化技術(shù)的發(fā)展,各個平臺的側(cè)重點出現(xiàn)明顯差異,給相關(guān)機構(gòu)使用造成一定的困擾。三大平臺早期版本對比分析已經(jīng)有不少研究成果,內(nèi)容主要集中在數(shù)據(jù)情況、基本檢索功能等比較分析上,由于當時平臺還未推出更多的知識服務(wù)功能,所以沒有這方面的比較分析。本文主要是針對三大平臺的數(shù)據(jù)資源組織和知識服務(wù)功能進行分析對比,為用戶在平臺使用、選擇引進時提供參考。
1 三大中文期刊平臺內(nèi)容對比分析
1.1 數(shù)據(jù)情況對比
1.1.1 學(xué)科范圍及資源特色
從表1可看出,三大期刊數(shù)據(jù)庫中“維普期刊”的學(xué)科分類最為細致。三者相同之處在于學(xué)科范圍都涵蓋自然科學(xué)、工程技術(shù)、人文科學(xué)等領(lǐng)域,同類型產(chǎn)品數(shù)據(jù)內(nèi)容存在同質(zhì)化現(xiàn)象,因此不可避免地存在重復(fù)。 除了傳統(tǒng)的學(xué)術(shù)論文外,分類及延伸產(chǎn)品也有很多重復(fù)和交叉。在資源收錄方面,三大期刊數(shù)據(jù)庫各有其針對性的發(fā)展方向和價值特色,都有一定的使用客戶群,這是三大期刊數(shù)據(jù)庫可以共生共存,共發(fā)展的原因。
1.1.2 收錄數(shù)量、收錄年限
將三大期刊數(shù)據(jù)庫按收錄年份及種類進行對比(如表2)可見,維普期刊收錄的種類最多,尤其是現(xiàn)刊的收錄種數(shù)為三者之首;三者對比核心期刊收錄完整率相差無幾,但維普收錄率最高為100%;三者在獨家授權(quán)期刊方面:知網(wǎng)期刊種類最多,其次是維普期刊且大部分為內(nèi)部刊物;三者在優(yōu)先出版刊物方面:萬方期刊最多,其次是知網(wǎng)期刊,維普期刊暫時無優(yōu)先出版刊物。從期刊收錄年限對比而言,知網(wǎng)期刊在三者中占據(jù)優(yōu)勢,大部分可加回溯至創(chuàng)刊時間。
從上表可以看出三大期刊數(shù)據(jù)在資源上的差異:知網(wǎng)期刊工具書檢索功能強大,涵蓋范圍廣,在工具書方面形成了另外兩者無法比擬的優(yōu)勢,有強大的整合能力,對于不同數(shù)據(jù)類型都可系統(tǒng)分類,細化有序。維普期刊力求多元化發(fā)展,產(chǎn)品具有類型的優(yōu)勢,自有特色數(shù)據(jù)庫,自建的方志、科技視頻、中國醫(yī)學(xué)會期刊等數(shù)據(jù)庫特色非常明顯,因此有一定的競爭力。萬方期刊集中在主力產(chǎn)品《中文科技期刊數(shù)據(jù)庫》上,專注于期刊文獻的收錄和二次加工,其收錄的期刊更全,很多內(nèi)部發(fā)行刊物、地方刊物、行業(yè)刊物都有收錄。
1.2 出版時效
數(shù)據(jù)內(nèi)容能及時更新是用戶選擇的重要因素,數(shù)據(jù)庫平臺出版周期短,說明該數(shù)據(jù)庫出版時效快,更體現(xiàn)了優(yōu)先價值。從如下表3可見,知網(wǎng)期刊和維普期刊可以做到每日更新,而萬方在時效性方面較前兩者差距不小。
1.3 數(shù)據(jù)庫導(dǎo)航
在數(shù)據(jù)庫功能上看,知網(wǎng)期刊具有學(xué)科導(dǎo)航,期刊導(dǎo)航,首字母導(dǎo)航。學(xué)科分類為十大專輯,各大專輯又進一步按層次劃分為168個專題,專題庫再劃分更為細微的子專題,所有文獻均按專業(yè)學(xué)科分類編輯,整個數(shù)據(jù)庫劃分為若干類應(yīng)用性、針對性極強的專業(yè)化數(shù)據(jù)庫,形成一個合理的面相專業(yè)對象的知識結(jié)構(gòu),給用戶提供一個簡潔明了的導(dǎo)航檢索體系。期刊導(dǎo)航中,核心期刊按2014年版“中文核心期刊要目總覽”核心期刊表分類,只包括被2014年版“中文核心期刊要目總覽”收錄的期刊。“世紀期刊”按期刊的知識內(nèi)容分類,只包括1994年之前出版的期刊。期刊的影響因子按《中國學(xué)術(shù)期刊影響因子年報(2016版)》結(jié)果顯示。
維普期刊具有學(xué)科導(dǎo)航,期刊導(dǎo)航,地區(qū)導(dǎo)航,首字母導(dǎo)航四種導(dǎo)航方式。其中學(xué)科分35個學(xué)科大類,又進一步劃分為457個學(xué)科小類,給用戶提供一個嚴謹、規(guī)范、科學(xué)的導(dǎo)航檢索體系。期刊導(dǎo)航按照刊名途徑組織數(shù)據(jù),給用戶提供刊名檢索導(dǎo)航體系,其中刊名不僅按照學(xué)科來聚集,也有按照首字母來聚集;地區(qū)導(dǎo)航按照全國31個省份及其下屬地市來進行導(dǎo)航。
萬方期刊具有學(xué)科導(dǎo)航、地區(qū)導(dǎo)航、首字母導(dǎo)航三種分類導(dǎo)航方式。學(xué)科分類包括8大學(xué)科體系,94個學(xué)科小類;地區(qū)導(dǎo)航按全國31個省份來聚集期刊;首字母導(dǎo)航按照期刊名的字母來聚集期刊。
1.4 檢索功能分析
三大期刊數(shù)據(jù)庫根據(jù)不同的用戶需要,開發(fā)設(shè)置了具有相應(yīng)特色的檢索功能,雖在檢索方式相差不多,但是在檢索功能設(shè)置方面,都更側(cè)重于自己的功能特色及方向,將三者的檢索功能細化列表比較而言(如下表),可以看出:知網(wǎng)期刊的檢索功能更全面,更細化,范圍廣,檢索方式、路徑更靈活,多元化,用戶可以更方便、更準確地檢索到所需的文章,在三大數(shù)據(jù)庫中檢索功能最強、最方便,維普其次,萬方相對較弱些。
1.5 檢索結(jié)果處理對比
從下表4相比較可見,三大期刊數(shù)據(jù)平臺檢索處理功能從顯示、標記、排序、保存四個方面對比,維普的顯示格式最多,顯示的字段也較其他兩個要全面,萬方排序功能最有熱點時效性,從結(jié)果保存功能上看,三大期刊數(shù)據(jù)平臺具有共性和各自特點。
2 知識服務(wù)功能
三大期刊平臺近年來最大的特點是針對檢索結(jié)果開發(fā)的聚類展示功能。其主要是通過對檢索結(jié)果以不同的方式進行聚類分析,輔之以聚類圖譜等方式,給用戶呈現(xiàn)更為清晰的檢索結(jié)果集及知識結(jié)構(gòu)情況。聚類展示功能通常又分為基于整體檢索結(jié)果和基于文章兩種聚類分析。各個平臺由于數(shù)據(jù)字段情況不同,可以實現(xiàn)的聚類分析功能就各不相同,知網(wǎng)期刊的由于字段內(nèi)容最豐富,可以實現(xiàn)的聚類分析內(nèi)容最多。其次是維普期刊數(shù)據(jù)庫,聚類分析相對較少的是萬方期刊數(shù)據(jù)庫,這與其數(shù)據(jù)庫字段相對較少有關(guān)。表5是三大平臺的檢索結(jié)果聚類分析特點對比。
下圖1展示了知網(wǎng)期刊基于關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò),共現(xiàn)網(wǎng)絡(luò)體現(xiàn)了包含相關(guān)關(guān)鍵詞的文獻可能關(guān)相關(guān)關(guān)系。圖2展示了維普期刊高頻主題共現(xiàn)關(guān)系,主題共現(xiàn)可以輔助讀者了解相關(guān)主題的相關(guān)性。圖3展示了萬方期刊的知識脈絡(luò)發(fā)展狀況,有助于讀者了解相關(guān)主題領(lǐng)域的隨時間進展狀況。
如上三張圖展示說明,信息挖掘與聚類技術(shù)的發(fā)展使三大平臺逐步向知識服務(wù)過渡,平臺功能發(fā)生了本質(zhì)飛躍,數(shù)據(jù)資源的種類也較以前更加豐富,資源的組織形式也更加富有特點。
3 結(jié)論
三大中文期刊數(shù)據(jù)庫作為最重要的中文期刊資源,在高校、公共圖書館、科研機構(gòu)廣受重視,檢索數(shù)量和全文下載量都非常驚人,成為科技人員必不可少的科研輔助工具。因此,文獻資源建設(shè)人員隨時在關(guān)注其情況變化,為資源的引進做出決策判斷。
通過對比分析發(fā)現(xiàn),三大期刊平臺在數(shù)據(jù)內(nèi)容、檢索功能、知識服務(wù)功能等方面都各具特點:
1) 數(shù)據(jù)內(nèi)容方面。維普期刊的品種最豐富,尤其是收錄了很多機構(gòu)的內(nèi)部出版物,具有重要的參考價值;知網(wǎng)期刊對期刊文章的標引數(shù)據(jù)字段最全,除了常見字段外,還標注了大量特殊字段,給讀者更多的檢索選擇。另外知網(wǎng)期刊收錄的期刊回溯年限較早,已逐步超過了維普期刊收錄年限;萬方期刊數(shù)據(jù)相對來說標注的主要是基本字段。
2) 檢索功能方面。知網(wǎng)期刊的數(shù)據(jù)字段最為豐富,可提供的檢索字段最多。資源導(dǎo)航功能最為豐富,可以保存用戶的檢索歷史,在引文關(guān)聯(lián)檢索方面具有強大功能;維普期刊檢索功能也較為豐富,但在字段檢索、引文方面的功能不如知網(wǎng)期刊數(shù)據(jù)庫;萬方期刊數(shù)據(jù)庫在字段檢索、檢索策略、數(shù)據(jù)導(dǎo)航、引文關(guān)聯(lián)等方面最為簡單。
3) 知識挖掘與服務(wù)功能。知識挖掘與服務(wù)主要是通過聚類分析與圖譜展示作為主要體現(xiàn)形式。知網(wǎng)期刊數(shù)據(jù)庫在知識挖掘與聚類分析方面功能最豐富,基于檢索結(jié)果集有8種聚類功能,基于文章有8種聚類分析;維普期刊基于檢索結(jié)果集有8種聚類分析,基于文章有4種聚類分析。萬方數(shù)據(jù)基于檢索結(jié)果集有4種聚類分析,基于文章有5種聚類分析。
總的來說,三大期刊數(shù)據(jù)在資源品種和服務(wù)功能上具有明顯差異:知網(wǎng)期刊力求多元化發(fā)展,產(chǎn)品具有類型的優(yōu)勢,自有特色數(shù)據(jù)庫,自建的工具書、地方志、科技視頻、中國醫(yī)學(xué)會期刊等數(shù)據(jù)庫特色非常明顯,充分體現(xiàn)了數(shù)字期刊網(wǎng)絡(luò)出版與網(wǎng)絡(luò)服務(wù)的特點。維普期刊專注于期刊文獻的收錄和二次加工,其收錄的期刊更全,很多內(nèi)部發(fā)行刊物、地方刊物、行業(yè)刊物都有收錄,這是其內(nèi)容上的優(yōu)勢和特點。相對來說,萬方期刊在資源品種和功能服務(wù)上相對較少一些,但其收錄了大量獨家期刊,如萬方醫(yī)學(xué)期刊,是行業(yè)的不二之選。隨著信息技術(shù)、數(shù)據(jù)庫技術(shù)、聚類與可視化技術(shù)的發(fā)展,三大中文期刊服務(wù)平臺都在資源品種收集、服務(wù)功能方面不斷在競爭中進步,帶給用戶更加豐富的、更具特點的使用體驗,用戶可以根據(jù)自己的需求選擇適合自己的平臺。