鄭雯譯
(電子科技大學,成都 611731)
?
國外發(fā)現(xiàn)系統(tǒng)分面過濾功能比較
——EDS、Summon、Primo
鄭雯譯
(電子科技大學,成都 611731)
摘要:通過實例對三種國外發(fā)現(xiàn)系統(tǒng)——EDS、Summon、Primo的分面過濾功能進行深入比較和分析,包括:分面過濾選項設置、一些主要分面(精煉結果選項、文獻類型分面、主題分面、數據庫分面、出版日期分面)的比較。
關鍵詞:發(fā)現(xiàn)系統(tǒng);分面;過濾;EDS;Summon;Primo
1分面特點及比較平臺的選取
分面(Facet)是指事物的多維度屬性[1],例如一本書包含題名、作者、主題、出版社、出版年等分面。分面過濾是指將查詢結果按照多個分面來組織和聚類的過濾方式,它實際是查詢和瀏覽的結合,是一種交互式、動態(tài)的結果呈現(xiàn)方式。分面過濾可以引導用戶在相關的分面中逐層深入,不斷調整和縮小檢索范圍,直至發(fā)現(xiàn)適宜的結果,并且分面過濾只展現(xiàn)有結果的選項,避免了結果為空的情況,從而大大提高了檢索效率和用戶體驗。
分面過濾的上述優(yōu)點使其非常適合海量資源的搜索和過濾,目前在電子商務網站(如淘寶、京東、當當等)和數字圖書館都已日益得到廣泛應用。而對于擁有海量元數據的資源發(fā)現(xiàn)系統(tǒng),分面過濾更是其必備功能和重要特征之一,也是圖書館考察發(fā)現(xiàn)系統(tǒng)優(yōu)劣的重要指標之一。
目前,國內應用較多的國外發(fā)現(xiàn)系統(tǒng)主要有三家: EDS[2]、Summon[3]、Primo[4]。本文將通過實例對它們的分面過濾功能進行深入比較,比較重點包括:分面過濾選項設置、主要分面過濾選項(精煉結果、文獻類型分面、主題分面、數據庫分面、出版日期分面)的比較。具體比較平臺分別選擇它們各自的代表性用戶: EDS選擇中山大學的智慧搜索[5]、Summon選擇北京大學的未名學術搜索[6]、Primo選擇清華大學的水木搜索[7]。
2分面過濾選項設置比較
發(fā)現(xiàn)系統(tǒng)分面選項的具體設置會直接影響過濾效果,通常,分面選項設置越豐富、越實用,對結果的過濾效果就越好。EDS、Summon、Primo的分面過濾選項均顯示在查詢結果的左邊,其中,EDS有八組分面:Refine Results、文獻類型、Subject、Publisher、Publication、Language、Geography、來源數據庫;Primo也有八組分面:選擇顯示內容、主題、作者、來源、出版日期、文獻類型、語種、出版物;Summon有五組分面:限定顯示范圍、內容類型、主題、創(chuàng)建/出版時間、語言。將以上這些分面中相似或相同的分面進行合并,可以看出三種發(fā)現(xiàn)系統(tǒng)主要涉及以下這些分面:精煉結果、主題、文獻類型、出版日期、出版物、數據庫、作者、出版者、語種等。表1中,打“√”的是相應發(fā)現(xiàn)系統(tǒng)包括的分面,打“×”的是其不包括的分面。
表1 三種發(fā)現(xiàn)系統(tǒng)主要分面過濾選項
由表1可看出,在這些分面中,EDS和Primo的分面選項比較全面,EDS僅沒有作者分面,Primo僅沒有出版者分面,而Summon的分面選項相對要少一些,缺少出版物、數據庫、作者、出版者等四項分面。這就意味著,讀者在檢索Summon時,不能按照出版物、數據庫、作者以及出版者來過濾結果。
3主要分面過濾選項比較
3.1 精煉結果選項比較
通常在發(fā)現(xiàn)系統(tǒng)分面過濾選項的最頂端,首先會看到一組精煉結果(Refine Results)的選項,嚴格地說它們并不是一組專門的分面過濾選項,而是將從不同分面中提取出的一些比較常用的過濾選項集中在一起,以方便讀者勾選。
EDS的精煉結果選項主要有以下4個(如圖1),這些條件都可以多選,即讀者可以將結果限定在:電子全文、同行評議期刊、本館館藏目錄,并可以選擇結果的年代范圍。
圖1 EDS精煉結果選項
Summon的精練結果選項包括5個(如圖2),也是可以多選,可將結果限定為在線全文、期刊文章、館藏紙本資源、館外資源,以及是否排除報紙文章等。
圖2 summon精煉結果選項
Primo的精煉結果選項包括3個:同行評議期刊、在線全文、本館收藏(如圖3),也是可以多選。
圖3 Primo精煉結果選項
縱觀這三家發(fā)現(xiàn)系統(tǒng)的精煉結果選項,EDS和Primo很相近,允許讀者將結果限定在在線全文、同行評議期刊及本館館藏,此外,EDS還多一個年代范圍選項。Sumon的選項是三者中最多的,仔細分析發(fā)現(xiàn),它比另兩個發(fā)現(xiàn)系統(tǒng)多的是:排除報紙文章、顯示館外更多結果,但是它也比另兩個發(fā)現(xiàn)系統(tǒng)少了一個很重要的選項:同行評議期刊。同行評議期刊中的文章質量通常比非同行評議期刊更有保證,在海量搜索中,這個選項是很重要的,而Summon只能籠統(tǒng)地將結果限定在期刊文章,不能不說是一個缺憾。
3.2 文獻類型分面比較
文獻類型是一個比較常用的分面。讀者在搜索到海量結果后,可以根據自己需要的文獻類型(期刊論文、學位論文或圖書等)對結果進行過濾。下面我們輸入一個范圍比較大的詞“computer”,分別看一下三種發(fā)現(xiàn)系統(tǒng)中都包含哪些文獻類型。
EDS的文獻類型分面有19個選項:Academic Journals、Magazines、Conference Materials、Electronic Resources、Trade Publications、Books、Reviews、News、Reports、Biographies、Dissertations/Theses、Primary Source Documents、eBooks、Videos、Audio、Non-Print Resources、Maps、Music Scores、Audio books。
Summon的文獻類型分面有39個選項:報紙、報紙文章、期刊或電子期刊、期刊文章、商業(yè)出版物、商業(yè)出版物文章、雜志、雜志文章、出版物、出版物文章、書籍/電子書、書籍章節(jié)、書評、論文、學位論文、會議錄、專利、標準、報告、技術報告、市場研究、政府文獻、圖書館館藏、電子資源、案例、簡訊、數據集、圖像、視頻記錄、地圖、照片、講座、學習參考、參考文獻、縮微膠卷、計算機文件、抄本、詩歌、其他。
Primo的文獻類型分面有20個選項:文章、報紙文章、會議論文集、圖書、Dissertations、文本型資料、評論、Technical Report、期刊、音像資料、其它、網站、參考條目、法律文件、地圖、統(tǒng)計數據、樂譜、數據庫、research datasets、圖片。
縱觀三家發(fā)現(xiàn)系統(tǒng)的文獻類型分面,從數量上來說,EDS和Primo很接近,都是20個左右,Summon則要多一倍,接近40個;從文字上來說,Summon全部使用中文,最易懂,Primo以中文為主,夾雜少量英文,次之,EDS全部使用英文,不夠直觀;從內容上來說,三家發(fā)現(xiàn)系統(tǒng)都包含了最基本、常用的文獻類型(期刊文章、會議文章、圖書、學位論文、報告等);另外,三家都分別包含了一些各自的特色文獻類型,如EDS中的Primary Source Documents(原始文檔)、Audio books(有聲讀物),Summon的抄本、詩歌、縮微膠卷等,Primo的統(tǒng)計數據、research datasets(研究數據集)等。此外,Summon和Primo不僅可以選擇希望包含的文獻類型,還可以選擇希望排除的文獻類型,比較靈活,而EDS沒有排除選項。
三家發(fā)現(xiàn)系統(tǒng)中,Summon是文獻類型最為豐富的一個,劃分得很細,這有利有弊,一方面,它把圖書、期刊、報紙和圖書章節(jié)、期刊文章、報紙文章等區(qū)分得非常清楚,這是它的可取之處,但另一方面,它的文獻類型有近40個,過于復雜,特別是有些選項有點重復或容易引起歧義,如:報告和技術報告、學習參考和參考文獻等。
3.3 主題分面比較
主題分面是發(fā)現(xiàn)系統(tǒng)分面導航中比較重要的一個分面,如果主題分面中的主題詞設置得精煉、恰當,會幫助讀者迅速找到相關主題的結果。下面選擇一個大家比較熟悉的詞匯“artificial intelligence”(人工智能),分別在三種發(fā)現(xiàn)系統(tǒng)中進行檢索,從中我們可以看一下這三種發(fā)現(xiàn)系統(tǒng)主題分面的具體情況。
EDS的主題分面默認顯示的主題詞約50個左右,以“artificial intelligence”檢索為例,可以看出主題詞還是比較相關的,排在前面的有:artificial intelligence、algorithms(算法)、neural networks(神經網絡)、computer science、machine learning等,如圖4所示。
圖4 EDS主題分面示例
Summon在主題分面中默認顯示的主題詞個數通常為100個左右,以“artificial intelligence”檢索為例,會看到排在前面的主題詞除artificial intelligence、algorithms比較相關,也有些相關性并不是很緊密或過于籠統(tǒng)的,如:engineering, electrical & electronic、information systems applications,如圖5所示。
圖5 Summon主題分面示例
Primo在主題分面中顯示的主題詞通常為20個左右,以“artificial intelligence”檢索為例,排在前面的主題詞有artificial intelligence、algorithms、computer science、mathematical models等,如圖6所示,仔細分析這些主題詞發(fā)現(xiàn)多數與檢索詞還是比較相關的。
由以上比較可看出,三種發(fā)現(xiàn)系統(tǒng)的主題分面比較理想的是Primo,主題詞的數量20個比較合適,并且其主題詞的相關性也較好。EDS的主題詞相關性也很好,但50個主題詞略多了一些。而Summon的主題詞有些相關性不是很緊密,并且100個主題詞數量過多,因此檢索者很難通過其主題分面獲得理想的結果。
3.4 數據庫分面比較
數據庫分面也是發(fā)現(xiàn)系統(tǒng)中比較重要的一個分面,它可以幫助檢索者將結果限定在特定的數據庫中,從而保證檢索結果的質量。三種發(fā)現(xiàn)系統(tǒng)中,Summon沒有數據庫分面,下面我們就以“computer”檢索為例,分析一下EDS和Primo的數據庫分面。
在EDS檢索結果頁面,點擊來源數據庫分面可看到如圖7所示的列表,筆者將列表中所有數據庫瀏覽了一遍發(fā)現(xiàn),除了幾個大的數據庫如:Scopus、EBSCO的Business Source Complete、ScienceDirect、SCI、JSTOR等外,幾乎看不到國內圖書館和讀者所熟悉的那些專業(yè)出版社或學會數據庫,如:Springer、Taylor、Wiley、IEEE、ACM等等。事實上,EDS最初把這個分面命名為“provider”,準確地說是數據提供商,和我們平時所說的數據庫并不完全一致。
圖7 EDS來源數據庫分面示例
下面我們看一下Primo的數據庫分面(在Primo中被稱為來源分面),以“computer”檢索為例,在來源分面中我們看到如圖8所示的列表,仔細看一下這個列表會發(fā)現(xiàn)上面的名稱多數是我們熟悉的數據庫,如:Elsevier、Gale、SpringerLink、IEEE、ACM、Wiley、Taylor等。
圖8 Primo數據庫分面(來源分面)示例
由以上比較可看出,Primo的數據庫分面更接近大家所理解的數據庫分面,對中國讀者來說也更有實用意義。而EDS的數據庫分面,實際上是數據提供者分面,和通常大家所理解的數據庫并不完全一致。
3.5 出版日期分面
出版日期分面也是一個非常重要的分面,可以幫助讀者按照特定的出版時間段來過濾結果,是讀者常會用到的一個分面。下面我們來比較一下三種發(fā)現(xiàn)系統(tǒng)的出版日期分面。
EDS的出版日期分面如圖9,可精確到年,通過在輸入框中輸入起止年代或拖動年代滑動條都可以實現(xiàn)對結果年代范圍的限定。
圖9 EDS出版日期分面示例
Summon的出版日期分面如圖10,不僅可輸入起止年,還可以輸入起止月、日,時間上更精確,并且也可通過拖動年代條來限定結果的時間范圍。
圖10 Summon出版日期分面示例
Primo的出版日期分面如圖11,上面是年代輸入框和年代滑動條,下面是一些固定的年代段以及年代查找框。
圖11 Primo出版日期分面示例
由以上截圖可看出,出版日期分面最靈活好用且最精確的是Summon,它能夠將出版日期精確到日而不只是年,而另外兩種發(fā)現(xiàn)系統(tǒng)都只能精確到年,并且,Summon在年代滑動條上有各出版年發(fā)文量的矩形圖顯示,也非常直觀。EDS和Primo都可通過拖動年代滑動條和輸入年代范圍兩種方式來限定出版時間,只是Primo的下半部分(預設的年代段和年代查找框)顯得有些多余。
4結語
綜合以上分析和比較可以看出,三種發(fā)現(xiàn)系統(tǒng)僅就分面過濾功能來說,總體上最理想的是Primo。它不僅分面選項設置比較全面,并且也比較實用,符合中國人的使用習慣和理解,其精煉結果選項簡明實用,文獻類型分面數量適中(20個左右),主題分面數量也適中(20個左右),主題詞也比較精煉、相關,數據庫分面設置也較貼切、實用,只有出版時間分面可以設置得更精簡一些。
EDS的分面過濾功能總體來說也不錯,其分面選項設置比較全面豐富,精煉結果選項也較實用,文獻類型分面數量適中(20個左右),其主題詞的設置很專業(yè),但主題詞數量偏多(50個),降低了其實用性,其數據庫分面實際是數據提供者分面,和國內通常所說的數據庫并不完全一致,且EDS的分面選項文字顯示上多為英文,不夠直觀。
Summon的分面選項設置比前兩家要簡單一些,雖然它的出版時間分面是三家中最為靈活好用的,但它缺乏一些重要的分面,如數據庫分面、出版物分面等,使得讀者無法按照數據庫或出版物來過濾結果,而它的精煉結果分面缺少同行評議期刊這一重要選項,主題分面也不是很理想,主題詞相關性不是很緊密且數量過多(100個),這些都是Summon在分面過濾選項中需要改進的地方。
參考文獻:
[1] 郭力潔,李新葉,宋金澮.分面搜索研究綜述[J].電子科技,2012,(9):136-138.
[2] EBSCO Discovery Service[EB/OL].https://www.ebscohost.com/discovery,2015-6-20.
[3] ProQuest Summon[EB/OL].http://www.proquest.com/products-services/The-Summon-Service.html. 2015-6-20.
[4] ExLibris Primo[EB/OL].http://www.exlibrisgroup.com/category/PrimoOverview.2015-6-20.
[5] 中山大學圖書館智慧搜索[EB/OL].http://library.sysu.edu.cn/web/guest/index. 2015-6-22.
[6] 北京大學圖書館未名學術搜索[EB/OL].http://www.lib.pku.edu.cn/portal/2015-6-22.
[7] 清華大學圖書館水木搜索[EB/OL].http://discovery.lib.tsinghua.edu.cn/primo_library/libweb/action/search.do?vid=thu. 2015-06-22.
(責任編輯:傅正)
Comparisons of faceted filtering capabilities of discovery systems abroad:——EDS, Primo and Summon
ZHENG Wen-yi
(University of Electronic Science and Technology, Chengdu611731, China)
Abstract:This paper compares and analyzes faceted filtering capabilities of three discovery systems abroad-EDS, Summon and Primo by examples. Comparisons focus on: faceted options arrange and some important facets comparison such as refine results, document type, subject, database and publication date etc..
Key words:discovery system; facet; filter; EDS; Summon; Primo
收稿日期:2015-07-13
作者簡介:鄭雯譯,女,副研究館員。
中圖分類號:G250.76
文獻標識碼:A
文章編號:1006-1525(2016)01-0026-05