張靜梅 鄭繼剛
摘要:Googlescholar和讀秀學(xué)術(shù)搜索是兩種常用的學(xué)術(shù)搜索引擎。從資源覆蓋范圍、檢索功能、檢索效果和個性化服務(wù)等方面對這兩種搜索引擎進行比較和分析,使用戶更好的了解這兩種學(xué)術(shù)搜索引擎的特點和搜索特性,從而更好的利用。
關(guān)鍵詞:Googlescholar;讀秀學(xué)術(shù)搜索;比較;分析
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2012)33-8095-03
隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和信息量的激增,用戶要從龐大而無序的網(wǎng)絡(luò)信息中查找自己所需要的信息猶如大海撈針,搜索引擎成為解決這一難題的有效工具。但通用搜索引擎往往無法滿足用戶的專業(yè)信息需求,于是,專業(yè)資源搜索引擎應(yīng)運而生。專業(yè)資源搜索引擎的目標是針對某一特定領(lǐng)域、特定人群或特定需求提供有一定價值的信息和相關(guān)服務(wù)[1]。在學(xué)術(shù)搜索領(lǐng)域,Googlescholar和讀秀學(xué)術(shù)搜索都是用戶較常使用的專業(yè)資源搜索引擎。
1Googlescholar與讀秀學(xué)術(shù)搜索簡介
Googlescholar是2004年Google公司推出的免費學(xué)術(shù)搜索工具。它不僅從Google收集的上百億個網(wǎng)頁中篩選了具有學(xué)術(shù)價值的內(nèi)容,而且通過與傳統(tǒng)資源出版商合作獲取大量的文獻資源,使用戶能夠從學(xué)術(shù)出版者、專業(yè)團體、預(yù)印本庫、大學(xué)范圍內(nèi)以及從網(wǎng)絡(luò)上檢索獲得特定的學(xué)術(shù)文獻,包括來自所有研究領(lǐng)域的同行評審論文、學(xué)位論文、摘要、圖書、預(yù)印本、技術(shù)報告等。2006年,Google公司將Googlescholar擴展至中文學(xué)術(shù)文獻領(lǐng)域,專門面向中文的學(xué)術(shù)搜索服務(wù)BETA版正式上線,為中文用戶帶來了更多的方便。
讀秀學(xué)術(shù)搜索是2006年超星公司在其海量資源的基礎(chǔ)上推出的一個大型知識搜索及文獻服務(wù)平臺,旨在為用戶“打造獲取知識資源的捷徑”。其后臺是一個海量全文數(shù)據(jù)及元數(shù)據(jù)組成的超大型數(shù)據(jù)庫,是由海量圖書、期刊、報紙、會議論文、學(xué)位論文、標準、專利及視頻等學(xué)術(shù)資源組成的龐大的知識系統(tǒng)[2]。讀秀學(xué)術(shù)搜索可實現(xiàn)與圖書館館藏資源數(shù)據(jù)整合,實現(xiàn)一站式檢索館藏紙質(zhì)圖書、電子圖書和期刊等各種異構(gòu)資源。2008年超星公司推出讀秀的附屬產(chǎn)品“Medalink”外文搜索引擎,整合了125種外文數(shù)據(jù)庫,并實現(xiàn)與中文學(xué)術(shù)搜索間自由切換,同時滿足用戶的中外文學(xué)術(shù)信息需求。
2Googlescholar與讀秀學(xué)術(shù)搜索檢索性能對比
2.1收錄范圍
Googlescholar的檢索對象主要包括四種類型的學(xué)術(shù)資源:(1)網(wǎng)上免費學(xué)術(shù)資源,如大學(xué)、協(xié)會、學(xué)會等機構(gòu)網(wǎng)站和學(xué)者個人網(wǎng)站上的學(xué)術(shù)資源。(2)開放存取期刊網(wǎng)站上的期刊及全文信息。(3)收費電子資源數(shù)據(jù)庫中的索引或文摘信息。有研究顯示,Googlescholar收錄了來自世界29個頂級學(xué)術(shù)出版商和大學(xué)出版社提供的內(nèi)容,覆蓋了SpfingerLink的68%,CambridgeJournalsOnline的94%,SociologicalAbstracts的44%等[3]。中文的知網(wǎng)、維普、萬方等數(shù)據(jù)庫也與Googlescholar合作,提供期刊論文的題錄信息。(4)鏈接圖書館館藏信息。Google公司向圖書館發(fā)出免費鏈接邀請,可提供面向這些圖書館資源的鏈接和查詢。到目前為止,全球已有100多家圖書館加入Googlescholar的圖書館鏈接,通過Googlescholar檢索可定位到這些圖書館的書目信息。
讀秀學(xué)術(shù)搜索的文獻來源以超星公司的海量數(shù)據(jù)資源為保障,可為用戶提供260萬種圖書書目信息、170萬種圖書全文、8億頁(圖書、期刊)全文資料、1.9億條元數(shù)據(jù)、5000萬條期刊元數(shù)據(jù)、2000萬條報紙、100萬個人物簡介、1000萬個詞條解釋等。其中文圖書的收錄時間范圍廣泛,從20世紀20年代民國初期的圖書,到目前最新出版的圖書,時間跨度近90年,占已出版圖書的90%以上,并且以每年10萬種以上的圖書更新速度增長[4]。
2.2數(shù)據(jù)組織方式
Googlescholar將各種分散的數(shù)據(jù)不分學(xué)科都集中到一個資源庫,將網(wǎng)上繁雜的學(xué)術(shù)信息進行整合。用戶進行查詢時,缺省是對整個資源庫進行查詢,可實現(xiàn)多種類、多學(xué)科學(xué)術(shù)信息資源的一站式檢索。
讀秀學(xué)術(shù)搜索通過與圖書館系統(tǒng)掛接,實現(xiàn)圖書館各類資源在讀秀平臺上的整合,將館藏紙質(zhì)圖書、電子圖書、期刊等各種圖書異構(gòu)資源整合于同一平臺,實現(xiàn)讀者對圖書資源需求的一站式解決。同時,讀秀還支持區(qū)域及全國范圍內(nèi)所有用戶的館藏記錄,可直觀地揭示其他圖書館的收藏情況。此外,讀秀基于元數(shù)據(jù)整合的多面搜索還提供一些實用的輔助功能以實現(xiàn)多種學(xué)術(shù)信息資源的一站式檢索,當(dāng)檢索任何關(guān)鍵詞時同時可得到與之相關(guān)的圖書、期刊、報紙、會議論文、學(xué)位論文、工具書、詞條、人物、網(wǎng)頁及圖片、視頻、專利、標準等信息,便于讀者全面了解檢索內(nèi)容。
2.3更新周期
Googlescholar的文獻來源包括網(wǎng)頁資源和數(shù)據(jù)庫資源,網(wǎng)頁資源更新較快,Google搜索引擎每天會定時掃描網(wǎng)頁,確定是否有需要更新的內(nèi)容。目前Google沒有明確公布其收錄數(shù)據(jù)庫資源的更新周期,但通常Googlescholar的檢索內(nèi)容要比出版商或數(shù)據(jù)庫提供商的數(shù)據(jù)滯后一些,即新的數(shù)據(jù)較少,較多的是一些出版年份較早的數(shù)據(jù),如Vine通過實驗指出,Googlescholar中的PubMed的記錄要比MED.LINE中的實際數(shù)據(jù)滯后1年[5]。讀秀學(xué)術(shù)搜索的更新周期較快,就數(shù)據(jù)庫而言取決于數(shù)據(jù)庫出版商的更新周期,時滯要比Googlescholar短得多。
2.4檢索方法和功能設(shè)置
Googlescholar采用自然語言檢索,不支持主題檢索或受控詞表檢索。自然語言檢索不需要用戶記憶復(fù)雜的主題詞表,簡單易用;但同時,沒有主題詞的支持,則有可能使檢索的精確度下降。讀秀學(xué)術(shù)搜索支持主題檢索,在檢索精確度上優(yōu)于Googlescholar。此外,Googlescholar和讀秀學(xué)術(shù)搜索都支持布爾邏輯檢索和檢索限制,讀秀還能提供瀏覽檢索和二次檢索。
Googlescholar的檢索方式包括一般檢索、高級檢索和個性化檢索三種。一般檢索提供關(guān)鍵詞檢索、時間限制和Google支持的捷徑搜索命令;高級檢索提供一些限制項供用戶選擇,包括字段限定、時間限定、資源來源限定、著者限定和每頁結(jié)果顯示數(shù)限定等;個性化檢索通過學(xué)術(shù)搜索設(shè)置來實現(xiàn),在學(xué)術(shù)搜索設(shè)置中,用戶可以根據(jù)自己的需要設(shè)置圖書館鏈接,查看與Googlescholar合作的特定圖書館的相關(guān)資源,也可以設(shè)置檢索結(jié)果與文獻管理軟件(EndNot、BibTex等)的鏈接,將檢索結(jié)果直接導(dǎo)入相應(yīng)的文獻管理軟件,此外用戶還可以根據(jù)自己的喜好設(shè)置界面語言、搜索語言、結(jié)果顯示條數(shù)、窗口瀏覽方式等,滿足用戶的個性化檢索需要。
讀秀學(xué)術(shù)搜索的檢索方式包括一般檢索和高級檢索兩種。一般檢索也提供檢索限制項的選擇,包括字段限制、書名題名、責(zé)任者、關(guān)鍵詞等,根據(jù)搜索版塊(知識、圖書、期刊、報紙、學(xué)位論文、電子書、講座等)的不同而設(shè)置,在檢索界面設(shè)有二次檢索選項;高級檢索功能只在圖書和期刊兩個版塊設(shè)置,圖書高級檢索提供書名、作者、主題詞、出版社、ISBN、分類和年代7種檢索途徑,期刊高級檢索提供標題、作者、刊名、關(guān)鍵詞、年度范圍、期號6種檢索途徑。
2.5檢索效能評價
2.5.1查全率及查準率
查全率方面,Googlescholar的收錄范圍雖然廣泛,但卻不完整,雖然收錄了來自世界29個頂級學(xué)術(shù)出版商和大學(xué)出版社提供的內(nèi)容,但同時也遺漏了另外一些大的出版機構(gòu)的數(shù)據(jù)。另一方面,即使Googlescholar收錄了一些出版機構(gòu)的數(shù)據(jù),但卻可能沒有收錄其完整的數(shù)據(jù),尤其是最新的數(shù)據(jù)。除此之外,Googlescholar的數(shù)據(jù)更新頻率具有滯后性,這些因素影響了Googlescholar學(xué)術(shù)信息資源的查全率。讀秀學(xué)術(shù)搜索的查全率取決于其所收錄的數(shù)據(jù)庫,相較而言中文圖書的查全率較高,期刊論文等類型資源的查全率次之。
查準率方面,Googlescholar的檢索策略基本上承 襲了Google檢索中應(yīng)用的pagerank算法,即主要看某項研究成果在其他學(xué)術(shù)文獻中的被引文情況,同時將文章全文、作者和出版物等信息納入算法中,保證了搜索結(jié)果的相關(guān)性,以提高查準率[6]。但由于Google收錄了大量的網(wǎng)頁信息,在進行非學(xué)術(shù)信息過濾時可能會漏掉一些垃圾信息,影響查準率。而讀秀學(xué)術(shù)搜索在文獻收錄時就以學(xué)術(shù)型信息為主,故在檢索使用時查準率能得到較好的保障。
2.5.2檢索結(jié)果顯示
Googlescholar檢索結(jié)果按相關(guān)性遞減進行排序。根據(jù)Googlescholar的站點信息,其相關(guān)性排序綜合考慮了文章的全文、作者、刊載文章出版物的知名度以及該篇文章的被引用次數(shù),在綜合考慮資源的整體重要性及其與特定查詢的相關(guān)性之后,可將最相關(guān)、最可靠的搜索結(jié)果放在首位。其相關(guān)性排序的最關(guān)鍵因素是文獻的被引用次數(shù)(Cited值),一般在Cited值相同時,文獻按照時間降序排列。這種排序方式的優(yōu)點是可以查到最相關(guān)和最優(yōu)秀的資源;缺點是不利于查找最新的資源。Googlescholar的檢索結(jié)果著錄信息包括文檔類型、標題、作者、期刊、來源、摘要、被引用次數(shù)、相關(guān)文章、所有版本、網(wǎng)頁搜索鏈接、圖書館鏈接、導(dǎo)入相應(yīng)文件管理軟件等(后兩者需進行學(xué)術(shù)搜索設(shè)置后才能顯示)。其中,“被引用次數(shù)”隱含引用文獻的搜索信息,點擊鏈接可實現(xiàn)擴展性檢索;“相關(guān)文章”隱含與本篇文章類似或相關(guān)聯(lián)的其他文獻,點擊鏈接可實現(xiàn)聚類檢索。
讀秀學(xué)術(shù)搜索對每一檢索內(nèi)容按相關(guān)的詞條、圖書、中文期刊、報紙、中文學(xué)位論文、會議論文、專利順序、視頻、信息資訊、網(wǎng)頁相關(guān)信息排序,內(nèi)部按相關(guān)性進行排序。檢索結(jié)果頁面的主體內(nèi)容顯示所選擇的檢索版塊的搜索結(jié)果著錄信息,右側(cè)有其他版塊搜索結(jié)果的顯示和鏈接,左側(cè)根據(jù)搜索版塊的不同有不同顯示,如知識搜索顯示專題聚類,圖書搜索顯示圖書導(dǎo)航、類型、年代和學(xué)科導(dǎo)航等,方便讀者根據(jù)不同的需求進行二次檢索。
2.6資源獲取方式
2.6.1Googlescholar的文獻獲取方式
Googlescholar的檢索結(jié)果代表一組學(xué)術(shù)研究成果,其中可能包含一篇或多篇相關(guān)文章甚至同一篇文章的多個版本。用戶可根據(jù)檢索結(jié)果的著錄信息來獲取文獻原文:(1)文檔類型:DOC、PDF、PPT、TXT、RTF、XLS等文檔類型可直接點擊文章標題或文檔類型標識下載原文。(2)標題:可鏈接至文章的摘要或數(shù)據(jù)庫合作商提供的獲取文獻途徑。(3)被引用次數(shù):點擊鏈接可查看引用該文獻的所有來源文獻。(4)所有版本:點擊鏈接可訪問該文獻的其他版本,從而得到獲取原文的線索。(5)HTML版:Google在網(wǎng)路漫游時能將文獻檔案自動轉(zhuǎn)換成HTML網(wǎng)頁來儲存,點擊鏈接可直接獲得文獻內(nèi)容。(6)圖書館鏈接:用戶在學(xué)術(shù)搜索設(shè)置中設(shè)置過所要鏈接的圖書館后,可在檢索過程中同時檢索該圖書館的館藏信息,若該館藏有檢出文獻,則在檢索結(jié)果著錄中有該圖書館的鏈接顯示,用戶可通過直接借閱、文獻傳遞或館際互借等方式來獲取文獻。
2.6.2讀秀學(xué)術(shù)搜索的資源獲取方式
讀秀學(xué)術(shù)搜索的文獻的獲取方式也是多樣的,用戶可按如下途徑獲取:(1)直接獲?。鹤x秀可將圖書館的館藏紙本資源和電子資源整合在一起,若館藏中有相關(guān)文獻則檢出結(jié)果顯示有全文鏈接地址或本館館藏紙質(zhì)圖書鏈接,用戶可點擊鏈接獲取電子全文或到圖書館借閱館藏紙本。(2)文獻傳遞服務(wù):若本館館藏中沒有讀者需要的紙質(zhì)圖書或電子資源,讀者可以通過“圖書館文獻傳遞中心”或“文獻資源共享與服務(wù)平臺”申請文獻傳遞服務(wù)。(3)文獻互助和文獻市場:讀秀提供有文獻使用交流互助平臺,在此平臺上用戶可發(fā)帖尋求自己需要但卻無法獲取的文獻,或?qū)⒆约阂勋@取的文獻提供給互助平臺上有需要的用戶;文獻市場的服務(wù)類似于文獻互助平臺,不同的是文獻市場中的文獻是非免費的,用戶可發(fā)貼求購或出售相關(guān)文獻。(4)其他方式:對于圖書的獲取來說,如果上述幾種方式都無法實現(xiàn),讀者還可以通過檢索結(jié)果著錄信息中的其他文獻資源鏈接途徑來實現(xiàn)。一是點擊網(wǎng)上書店鏈接,通過網(wǎng)絡(luò)書店訂購;二是選擇按需印制服務(wù),讀秀提供有朗潤數(shù)字書店的鏈接,讀者可通過該書店代尋稀缺絕版圖書或進行按需印制。這些服務(wù)大大擴寬了讀者獲取圖書的渠道。
2.7個性化服務(wù)
Googlescholar的個性化服務(wù)主要體現(xiàn)在個性化學(xué)術(shù)搜素設(shè)置上,此外其還提供了創(chuàng)建電子郵件快訊功能,可通過這個功能及時了解到檢索信息在Goolescholar中的更新情況。讀秀學(xué)術(shù)搜索的個性化服務(wù)除了能進行文獻交流的“文獻互助”和“文獻市場”外,還包括“我的圖書館”、“專題圖書館”及“我的咨詢”等。用戶可通過“我的圖書館”建立一個彰顯個性的收藏空間,或創(chuàng)建和管理自己感興趣的某個專題圖書館;也可通過瀏覽其他用戶創(chuàng)建的專題圖書館發(fā)現(xiàn)有價值的學(xué)術(shù)資源,找到學(xué)術(shù)上志同道合的朋友;還可以登錄“我的咨詢”查看近期的文獻傳遞申請記錄。
3小結(jié)
Googlescholar憑借其收錄了大量的學(xué)術(shù)資源、易用、免費等特點成為用戶較常使用的免費學(xué)術(shù)搜索引擎;讀秀學(xué)術(shù)搜索憑借海量的學(xué)術(shù)信息資源及其與圖書館館藏資源的高度整合能力,為用戶提供了一個全面快捷的檢索和參考咨詢服務(wù)平臺。對于購買了讀秀學(xué)術(shù)搜索等收費專業(yè)數(shù)據(jù)庫的機構(gòu)用戶來說,在檢索學(xué)術(shù)資源時,可將讀秀學(xué)術(shù)搜索或其他收費專業(yè)數(shù)據(jù)庫作為主要的檢索工具,將Googlescholar作為輔助檢索工具,以查找非購買學(xué)術(shù)資源;而對于無法獲取收費專業(yè)數(shù)據(jù)庫文獻的用戶,Googlescholar具有重要的意義,可等價于幾個價格昂貴的傳統(tǒng)在線索引及文摘數(shù)據(jù)庫,用戶可充分利用Googlescholar檢索免費學(xué)術(shù)資源。
參考文獻:
[1]林曉華,鐘伶.3種中文圖書搜索引擎搜索特性的比較[J].中華醫(yī)學(xué)圖書情報雜志,2009,18(4):59-60.
[2]王雅南.Web2.0環(huán)境下的多面搜索與獲取信息途徑的多樣性分析——以讀秀學(xué)術(shù)搜索為例[J].科技信息,2009(33):743-744.
[3]肖強.Googlescholar搜索引擎特征研究[J].圖書館學(xué)研究,2008(6):39-41.
[4]李志明,胡國芳.圖書館OPAC與讀秀知識庫的比較及啟示[J].圖書館建設(shè),2008(7):61-63.
[5]龔立群,高琳.Googlescholar與跨庫檢索系統(tǒng)的比較研究[J].現(xiàn)代情報,2007(12):177-179.
[6]蘇悅,張文德.谷歌學(xué)術(shù)搜索與現(xiàn)代圖書館[J].情報探索,2007(11):10-12.