寇晶晶 賈君枝
高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)中文檢索性能比較分析
寇晶晶 賈君枝
對(duì)不同資源發(fā)現(xiàn)系統(tǒng)的檢索性能進(jìn)行比較分析,可以發(fā)現(xiàn)系統(tǒng)間的差異,為高校選擇合適的資源發(fā)現(xiàn)系統(tǒng)提供一定的依據(jù)。以“985工程”高校普遍使用的五種資源發(fā)現(xiàn)系統(tǒng)Primo、Summon、EDS、Find+和指針?biāo)阉髯鳛檫x擇研究對(duì)象的依據(jù),選取應(yīng)用各系統(tǒng)的高校圖書(shū)館作為調(diào)查對(duì)象,從檢索功能和檢索效果角度對(duì)系統(tǒng)的性能進(jìn)行比較分析,發(fā)現(xiàn)各資源發(fā)現(xiàn)系統(tǒng)之間在檢索功能和檢索效果上存在一定的差異,高校應(yīng)根據(jù)自身需求合理選擇資源發(fā)現(xiàn)系統(tǒng)。表12。參考文獻(xiàn)9。
高校圖書(shū)館 資源發(fā)現(xiàn)系統(tǒng) 檢索性能
近年來(lái),飛速發(fā)展的計(jì)算機(jī)和網(wǎng)絡(luò)信息技術(shù)使得信息資源的種類(lèi)日益復(fù)雜,資源量日益龐大,圖書(shū)館資源檢索開(kāi)始面臨更多的難題和挑戰(zhàn)。為了讓用戶(hù)能夠以較少的時(shí)間準(zhǔn)確地檢索到符合自身需求的資源,圖書(shū)館不斷地嘗試實(shí)現(xiàn)精準(zhǔn)的資源整合檢索,從早期致力于本館館藏?cái)?shù)字資源的OPAC系統(tǒng)、數(shù)據(jù)庫(kù)導(dǎo)航系統(tǒng)到資源整合系統(tǒng)[1],再到現(xiàn)在的資源發(fā)現(xiàn)系統(tǒng)。資源發(fā)現(xiàn)系統(tǒng)的檢索性能關(guān)乎用戶(hù)的檢索體驗(yàn)和滿(mǎn)意度,本文旨在應(yīng)用適宜的信息檢索評(píng)價(jià)指標(biāo),設(shè)定查詢(xún)主題,從檢索功能和檢索效果角度對(duì)不同的資源發(fā)現(xiàn)系統(tǒng)的性能進(jìn)行比較分析,以對(duì)圖書(shū)館進(jìn)行資源發(fā)現(xiàn)系統(tǒng)的選擇與更新提供參考借鑒。
資源發(fā)現(xiàn)系統(tǒng)是在元數(shù)據(jù)的基礎(chǔ)上將圖書(shū)館各種數(shù)字資源整合到統(tǒng)一檢索平臺(tái),從而為用戶(hù)提供快速方便檢索服務(wù)的一種跨數(shù)據(jù)庫(kù)跨平臺(tái)的檢索系統(tǒng),具有內(nèi)容聚合、整合檢索、結(jié)果集展示、一站式獲取等特點(diǎn)。其資源主要來(lái)自于本地館藏資源、電子期刊/數(shù)據(jù)庫(kù)、數(shù)字資源和開(kāi)放獲取資源等,包括圖書(shū)、期刊、電子書(shū)、期刊文章、學(xué)位論文、多媒體資源、報(bào)紙文章等多種類(lèi)型。
目前,國(guó)外的資源發(fā)現(xiàn)系統(tǒng)主要有 EDS、Primo、Summon、WorldCat Local四種;國(guó)內(nèi)主要有e讀、讀秀、超星學(xué)術(shù)發(fā)現(xiàn)系統(tǒng)、指針?biāo)阉?、百鏈、EBSCO&南大數(shù)圖Find+、CNKI學(xué)術(shù)搜索等[1]。
由于e讀、CNKI學(xué)術(shù)搜索、百鏈等應(yīng)用較普遍,較難體現(xiàn)出圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)使用的差異性,因而本文對(duì)除上述外的其他資源發(fā)現(xiàn)系統(tǒng)進(jìn)行了調(diào)研,對(duì)國(guó)內(nèi)“985工程”高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)的調(diào)查顯示(截止到2016年2月6日),全國(guó)39所“985工程”高校中,擁有資源發(fā)現(xiàn)系統(tǒng)的高校數(shù)量由2013年的25所[1]上升為39所,覆蓋率達(dá)到100%,具體使用情況如表1所示。
表1 國(guó)內(nèi)“985工程”高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)使用情況
根據(jù)資源發(fā)現(xiàn)系統(tǒng)的可訪問(wèn)程度,本文選取Primo、Summon、EDS、Find+和指針?biāo)阉魑宸N系統(tǒng)分別在清華大學(xué)、北京大學(xué)、中山大學(xué)、南京大學(xué)和廈門(mén)大學(xué)五所高校的應(yīng)用為比較對(duì)象。
檢索功能是資源發(fā)現(xiàn)系統(tǒng)的核心,決定了其能否將資源全面、準(zhǔn)確地揭示給用戶(hù)[2],主要包括:檢索字段的設(shè)置,提供的檢索類(lèi)型、檢索策略、檢索限定以及檢索結(jié)果的顯示方式等。這些功能存在與否、其完備程度及合理性將影響系統(tǒng)的可用性和易用性,與檢索效果密切相關(guān),關(guān)系到系統(tǒng)滿(mǎn)足用戶(hù)需求的程度,是反映檢索系統(tǒng)性能的重要依據(jù)。因此本研究從檢索字段、檢索類(lèi)型、檢索策略、檢索限定以及檢索結(jié)果五個(gè)方面,對(duì)高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)的檢索功能進(jìn)行調(diào)查分析,詳見(jiàn)表2。
表2 五所高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)檢索功能
從表2內(nèi)容可以看出:
(1)檢索字段方面:五所高校的資源發(fā)現(xiàn)系統(tǒng)均具有的檢索字段為題名、著者/作者和關(guān)鍵詞。清華大學(xué)的水木搜索包含的檢索字段最少;北京大學(xué)的資源發(fā)現(xiàn)系統(tǒng)不具有主題詞檢索字段,但卻在DOI(數(shù)字對(duì)象唯一標(biāo)識(shí)符)、CODEN(國(guó)際刊名代碼)等字段上優(yōu)于其他系統(tǒng);中山大學(xué)的EDS系統(tǒng)和廈門(mén)大學(xué)的指針?biāo)阉鬟€提供了摘要檢索字段。此外,只有南京大學(xué)和廈門(mén)大學(xué)的系統(tǒng)提供了作者機(jī)構(gòu)檢索字段。
(2)檢索類(lèi)型方面:五所高校的資源發(fā)現(xiàn)系統(tǒng)均提供了簡(jiǎn)單(或基本)檢索和高級(jí)檢索兩種,而廈門(mén)大學(xué)的指針?biāo)阉靼l(fā)現(xiàn)系統(tǒng)還提供了專(zhuān)業(yè)檢索,即用戶(hù)可以根據(jù)自身需要制定檢索式。相較于高級(jí)檢索的固定字段和固定邏輯關(guān)系檢索,專(zhuān)業(yè)檢索增加了檢索的靈活性。進(jìn)入各高校資源發(fā)現(xiàn)系統(tǒng)主頁(yè)會(huì)發(fā)現(xiàn),相對(duì)于其他資源發(fā)現(xiàn)系統(tǒng)來(lái)說(shuō),北京大學(xué)采用Summon系統(tǒng)而形成的“未名學(xué)術(shù)搜索”在檢索界面和風(fēng)格上更趨向于一站式檢索,界面也更加簡(jiǎn)潔,增強(qiáng)了系統(tǒng)易用性。
(3)檢索策略方面:五所高校均提供精確檢索和模糊檢索,但提供的方式不盡相同。例如,清華大學(xué)的水木搜索在“檢索幫助”中說(shuō)明:可使用半角雙引號(hào)進(jìn)行精確匹配;而南京大學(xué)的資源發(fā)現(xiàn)系統(tǒng)則是提供了“精確匹配”勾選框,更加方便讀者進(jìn)行模糊或精確檢索。
(4)檢索限定方面:雖然五所高校的資源發(fā)現(xiàn)系統(tǒng)均提供語(yǔ)種、資料類(lèi)型和出版日期/年份的檢索限定條件,但各限定條件下的細(xì)分項(xiàng)存在一定差別。例如,北京大學(xué)的資料類(lèi)型提供的種類(lèi)較多,分類(lèi)詳細(xì),包括案例、百科、報(bào)告、報(bào)紙、報(bào)紙文章、標(biāo)準(zhǔn)、參考文獻(xiàn)、抄本、出版物、技術(shù)報(bào)告、簡(jiǎn)訊、講座、樂(lè)譜、圖書(shū)館館藏、期刊文章等在內(nèi)的四十多種資料類(lèi)型限定;而清華大學(xué)僅提供圖書(shū)、文章、期刊、圖片和音像資料5種,中山大學(xué)的資料類(lèi)型也只提供了期刊、圖書(shū)、全文、目錄、圖像、同行評(píng)審6種。此外,北京大學(xué)不提供出版物/期刊名稱(chēng)和來(lái)源數(shù)據(jù)庫(kù)限定,而南京大學(xué)、廈門(mén)大學(xué)僅不提供來(lái)源數(shù)據(jù)庫(kù)限定。
(5)結(jié)果顯示和篩選方面:北京大學(xué)在顯示內(nèi)容和精煉檢索結(jié)果這兩個(gè)選項(xiàng)前特別設(shè)置了多選框,這樣讀者就可以根據(jù)自己的需要更為靈活地對(duì)顯示內(nèi)容進(jìn)行控制;“未名學(xué)術(shù)搜索”還自動(dòng)提供文獻(xiàn)的摘要部分,有助于讀者更加直接地判斷系統(tǒng)返回的結(jié)果是否為自己所需。而清華大學(xué)的“水木搜索”則具有更加自主化的頁(yè)面,并沒(méi)有將所有信息一并呈現(xiàn)在初始頁(yè)面上,而是給予用戶(hù)一定的選擇權(quán),用戶(hù)可以根據(jù)需要在檢索結(jié)果頁(yè)面上點(diǎn)擊相關(guān)鏈接以得到更多的詳細(xì)信息。此外,廈門(mén)大學(xué)的資源發(fā)現(xiàn)系統(tǒng)還提供了可視化顯示,用戶(hù)可以通過(guò)指針資源發(fā)現(xiàn)系統(tǒng)得到近年來(lái)相關(guān)主題的發(fā)文趨勢(shì)圖、學(xué)科分類(lèi)分布圖、期刊分類(lèi)分布圖等。而在排序方式中除均包括相關(guān)性和日期排序外,清華大學(xué)的排序方法還包括作者、題名、受歡迎度等,南京大學(xué)還包括核心期刊排序。
檢索效果是以檢索結(jié)果為立足點(diǎn),通過(guò)對(duì)響應(yīng)時(shí)間、查全率、查準(zhǔn)率、重復(fù)率等指標(biāo)的分析,反映檢索結(jié)果能在多大程度上滿(mǎn)足用戶(hù)的需求。傳統(tǒng)意義上的響應(yīng)時(shí)間是指從用戶(hù)發(fā)出檢索指令,到檢索系統(tǒng)返回檢索結(jié)果所需要的時(shí)間,響應(yīng)時(shí)間與用戶(hù)的檢索體驗(yàn)密切相關(guān)。一般而言,響應(yīng)時(shí)間越短,用戶(hù)負(fù)擔(dān)越小,用戶(hù)體驗(yàn)也相對(duì)越好。查全率和查準(zhǔn)率由J.W.Perry和A.Kent提出[3]。查全率是用于刻畫(huà)檢索系統(tǒng)在執(zhí)行某一檢索指令時(shí),檢出相關(guān)文獻(xiàn)能力的一種指標(biāo),傳統(tǒng)的計(jì)算方法是指檢索出的相關(guān)信息量與系統(tǒng)中所有相關(guān)信息量的比值[4];查準(zhǔn)率是用于刻畫(huà)檢索系統(tǒng)執(zhí)行某一檢索指令時(shí)檢索精確度的指標(biāo),計(jì)算方法為檢出的相關(guān)文獻(xiàn)量與檢出的文獻(xiàn)總量的比值[4]。對(duì)于檢索系統(tǒng)來(lái)說(shuō),查準(zhǔn)率和查全率越高系統(tǒng)的性能越好,越能將完備度高、準(zhǔn)確率高的結(jié)果返回給用戶(hù)。重復(fù)率是指檢索結(jié)果中重復(fù)的結(jié)果數(shù)占全部檢索結(jié)果數(shù)的百分比[5],也是反映檢索系統(tǒng)性能的一個(gè)重要指標(biāo)。較強(qiáng)的去重功能能夠自動(dòng)將相同的鏈接過(guò)濾掉,幫助讀者提高檢索效率。去重功能越強(qiáng)大,所得到的重復(fù)率就越低。
4.1 檢索主題的確定
本文選取如下四個(gè)主題分別在這五所高校圖書(shū)館的資源發(fā)現(xiàn)系統(tǒng)中進(jìn)行檢索,比較各系統(tǒng)的檢索效果。
(1)Topic1:從引文角度分析高校科研水平(檢索詞:高校 引文 科研水平)
(2)Topic2:高校圖書(shū)館管理系統(tǒng)的使用情況(檢索詞:高校 圖書(shū)館 管理系統(tǒng) 使用)
(3)Topic3:知識(shí)管理在中小企業(yè)中的應(yīng)用(檢索詞:知識(shí)管理 中小企業(yè) 應(yīng)用)
(4)Topic4:搜索引擎性能的評(píng)價(jià)體系研究(檢索詞:搜索引擎 性能 評(píng)價(jià))
4.2 檢索效果比較
(1)響應(yīng)時(shí)間
由于響應(yīng)時(shí)間會(huì)受到網(wǎng)絡(luò)和檢索工具本身反應(yīng)速度的影響,因此本文將五所高校的檢索實(shí)驗(yàn)選擇在相同網(wǎng)絡(luò),同一計(jì)算機(jī)檢索終端以及相同地點(diǎn)進(jìn)行,以減少不必要的誤差。表3為各高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)關(guān)于各主題的響應(yīng)時(shí)間和平均響應(yīng)時(shí)間。
表3 五所高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)的響應(yīng)時(shí)間(單位:秒)
如表3所示,五所高校資源發(fā)現(xiàn)系統(tǒng)的平均響應(yīng)時(shí)間從長(zhǎng)到短依次為清華大學(xué)、廈門(mén)大學(xué)、北京大學(xué)、南京大學(xué)和中山大學(xué),即清華大學(xué)的“水木搜索”和廈門(mén)大學(xué)檢索系統(tǒng)的響應(yīng)時(shí)間較長(zhǎng),可能會(huì)增加用戶(hù)檢索時(shí)的負(fù)擔(dān)。而從上表中也可以看出,清華大學(xué)和廈門(mén)大學(xué)的資源發(fā)現(xiàn)系統(tǒng)在四個(gè)主題的檢索響應(yīng)時(shí)間上相差較多,廈門(mén)大學(xué)的檢索系統(tǒng)最為明顯,最長(zhǎng)的響應(yīng)時(shí)間為34.72秒,而最短的響應(yīng)時(shí)間為8.72秒。中山大學(xué)的資源發(fā)現(xiàn)系統(tǒng)平均響應(yīng)時(shí)間最短。
(2)相對(duì)查準(zhǔn)率
1)相對(duì)查準(zhǔn)率計(jì)算方法
大數(shù)據(jù)時(shí)代的到來(lái),使得信息檢索系統(tǒng)檢索結(jié)果超乎想象的龐大,在這種情況下,如果用傳統(tǒng)的方法來(lái)計(jì)算查準(zhǔn)率,無(wú)疑是不可能的。相關(guān)調(diào)查顯示,用戶(hù)在進(jìn)行信息檢索時(shí),僅有12.1%的用戶(hù)會(huì)查看20條以上的檢索結(jié)果,也就是說(shuō)87.9%的用戶(hù)只會(huì)查看不到20條檢索結(jié)果[6],甚至更少。因此,本文參考美國(guó)研究人員H.Vernon和Jaideep Srivstava的“前X命中記錄查準(zhǔn)率”[7]計(jì)算方法來(lái)考察圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)的查準(zhǔn)率(以下稱(chēng)為相對(duì)查準(zhǔn)率),即首先將前20條檢索記錄分為三組,1 -3為第一組,所占權(quán)重為20;4-10為第二組,所占權(quán)重為17;11-20為第三組,所占權(quán)重為10,而20以后的返回記錄可以看成第四組,但是其所占的權(quán)重默認(rèn)為0,則當(dāng)系統(tǒng)返回的記錄數(shù)多于20條時(shí),查準(zhǔn)率計(jì)算的分母為279。若檢索結(jié)果返回的記錄數(shù)不足20,則分母為279-(20-n)?10[8](n為實(shí)際返回的檢索記錄數(shù),本文五所高校資源發(fā)現(xiàn)系統(tǒng)返回的檢索記錄數(shù)均大于10)。
2)相關(guān)度判斷
根據(jù)檢索結(jié)果對(duì)用戶(hù)的有用程度,本文將相關(guān)性范疇劃分為四類(lèi),給每一類(lèi)賦予不同的相關(guān)度系數(shù),本文設(shè)定相關(guān)度系數(shù)的值域?yàn)椋?,1],顯然非常有用和完全沒(méi)用的系數(shù)取值分別為1和0,而對(duì)較為有用和部分有用兩類(lèi)的系數(shù)取值則相對(duì)自由,為顯示區(qū)分度,本文在完全沒(méi)用(系數(shù)為0)和非常有用(系數(shù)為1)的基礎(chǔ)上加減0.3,得到中間兩類(lèi)的相關(guān)度系數(shù),則相關(guān)度系數(shù)最終設(shè)為1、0.7、0.3、0(重復(fù)鏈接中第二次出現(xiàn)的記錄的相關(guān)度系數(shù)默認(rèn)為0),具體見(jiàn)表4。
表4 相關(guān)度判斷
這樣在相對(duì)查準(zhǔn)率計(jì)算方法和相關(guān)度判斷方法的基礎(chǔ)上,就得出如下計(jì)算方公式:
該公式為當(dāng)檢索返回記錄數(shù)多于20條時(shí)相對(duì)查準(zhǔn)率的計(jì)算公式,i=1,2,3……20,其中Wi表示第i條記錄所屬分組的權(quán)重,Ri表示該條記錄的相關(guān)系數(shù)。而當(dāng)檢索返回記錄數(shù)不足20條時(shí),計(jì)算公式為:
其中,分母的取值在上文中已經(jīng)提到,n表示該檢索所返回的記錄數(shù),Wi和Ri的含義不變。
3)相對(duì)查準(zhǔn)率計(jì)算
表5—9分別對(duì)應(yīng)清華大學(xué)、廈門(mén)大學(xué)、北京大學(xué)、南京大學(xué)和中山大學(xué)的資源發(fā)現(xiàn)系統(tǒng)檢索結(jié)果相關(guān)度判斷。
根據(jù)表5—9計(jì)算各高校資源發(fā)現(xiàn)系統(tǒng)的相對(duì)查準(zhǔn)率,結(jié)果如表10所示(計(jì)算結(jié)果保留到小數(shù)點(diǎn)后6位)。
表5 清華大學(xué)資源發(fā)現(xiàn)系統(tǒng)相關(guān)度判斷
表6 廈門(mén)大學(xué)資源發(fā)現(xiàn)系統(tǒng)相關(guān)度判斷
表7 北京大學(xué)資源發(fā)現(xiàn)系統(tǒng)相關(guān)度判斷
表8 南京大學(xué)資源發(fā)現(xiàn)系統(tǒng)相關(guān)度判斷
表9 中山大學(xué)資源發(fā)現(xiàn)系統(tǒng)相關(guān)度判斷
表10 五所高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)相對(duì)查準(zhǔn)率
表10反映的是五所高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)的相對(duì)查準(zhǔn)率的計(jì)算結(jié)果,其平均查準(zhǔn)率排名(從高到低)依次為廈門(mén)大學(xué)、北京大學(xué)、南京大學(xué)、中山大學(xué)和清華大學(xué),可以看出幾所高校所使用的資源發(fā)現(xiàn)系統(tǒng)的查準(zhǔn)率還是存在一定差別的。
(3)相對(duì)查全率
1)相對(duì)查全率的計(jì)算方法[9]:設(shè)在一個(gè)相對(duì)較短的時(shí)間內(nèi),Pm(m=1,2,3,4,5)為資源發(fā)現(xiàn)系統(tǒng)m,Xn(n=1,2,3,4)為第n個(gè)主題,那么就可以形成一個(gè)矩陣Z。矩陣Z中每一個(gè)元素pmn表示第n個(gè)主題在第m個(gè)資源發(fā)現(xiàn)系統(tǒng)上所得到的返回記錄數(shù),即檢索結(jié)果數(shù)。假設(shè)pn′=Max(p1n,p2n,p3n,p4n,p5n),即同一主題在五種資源發(fā)現(xiàn)系統(tǒng)中得到返回記錄數(shù)最多的系統(tǒng);qn′=Min(p1n,p2n,p3n,p4n,p5n),即同一主題在五種資源發(fā)現(xiàn)系統(tǒng)中得到返回記錄數(shù)最少的系統(tǒng)。這樣就會(huì)出現(xiàn)A和B兩種理想情況,其中A表示在所有主題的檢索中都能得到最多返回記錄數(shù)的系統(tǒng)(Pbest),而B(niǎo)則表示在所有主題的檢索中都能得到最少返回記錄數(shù)的系統(tǒng)(Pworst)。當(dāng)然這兩種情況都是理想狀態(tài),從客觀的角度來(lái)說(shuō),沒(méi)有一個(gè)資源發(fā)現(xiàn)系統(tǒng)會(huì)那么好,也沒(méi)有一個(gè)資源發(fā)現(xiàn)系統(tǒng)會(huì)那么糟糕。但是我們可以根據(jù)某一發(fā)現(xiàn)系統(tǒng)與最好和最壞兩種理想系統(tǒng)的接近程度,來(lái)衡量它的查全率。
pm=∑(pn′-pmn)(m=1,2,3,4,5;n=1,2,3,4),得到的值表示第 m個(gè)資源發(fā)現(xiàn)系統(tǒng)與Pbest的接近程度,pm越小,說(shuō)明與理想狀態(tài)越接近;qm=∑(pmn-qn′)(m=1,2,3,4,5;n=1,2,3,4),表示第m個(gè)系統(tǒng)遠(yuǎn)離Pworst的程度,所得到的值越大,則表明所對(duì)應(yīng)的系統(tǒng)的查全率越高。
2)相對(duì)查全率
最終相對(duì)查全率的計(jì)算結(jié)果如表11所示。
從表11中可以看出,相對(duì)查全率的計(jì)算結(jié)果中出現(xiàn)了上文中所說(shuō)的理想狀態(tài),這是由中山大學(xué)的EDS發(fā)現(xiàn)系統(tǒng)對(duì)外文發(fā)現(xiàn)能力較強(qiáng),而對(duì)中文的發(fā)現(xiàn)能力較弱造成的。就本次檢索而言,相對(duì)查全率的排名(從高到低)依次為北京大學(xué)、廈門(mén)大學(xué)、南京大學(xué)、清華大學(xué)和中山大學(xué)。
(4)重復(fù)率
在本次檢索實(shí)驗(yàn)中,五所高校在四個(gè)主題檢索實(shí)驗(yàn)中的重復(fù)情況如表12所示。其中,重復(fù)數(shù)是指同一檢索主題下,同一鏈接出現(xiàn)的次數(shù)的總和。如檢索主題1,得到的檢索結(jié)果中A和B是相同的,C和D是相同的,那么基于這個(gè)主題的檢索重復(fù)數(shù)就是4。而總重復(fù)數(shù)是指四個(gè)檢索主題下總共的重復(fù)數(shù),平均重復(fù)率是用總重復(fù)數(shù)除以四個(gè)主題總的參評(píng)記錄數(shù)。假設(shè)總重復(fù)數(shù)為X,根據(jù)只查看前20條記錄的方法,若每個(gè)主題返回的結(jié)果數(shù)大于20,則其重復(fù)率為X/(20?4);若有的主題返回的記錄數(shù)小于20,則分母應(yīng)改成真實(shí)的記錄數(shù)之和。
從表12可以看出,五所大學(xué)的資源發(fā)現(xiàn)系統(tǒng)均雖具有一定的去重功能,單就此次檢索實(shí)驗(yàn)來(lái)說(shuō),除去中山大學(xué)外(中山大學(xué)的EDS由于是外文發(fā)現(xiàn)系統(tǒng),因此對(duì)中文主題的檢索受到一定的限制),其他高校資源發(fā)現(xiàn)系統(tǒng)的平均重復(fù)率均在5%以上。尤其是清華大學(xué)的資源發(fā)現(xiàn)系統(tǒng),重復(fù)率在五所高校中最高,達(dá)25%,其去重功能最弱,可能會(huì)給讀者檢索帶來(lái)較多不便。
表12 五所高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)的重復(fù)記錄(單位:個(gè))
通過(guò)對(duì)Primo、Summon、EDS、Find+和指針?biāo)阉魑宸N類(lèi)型的圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)進(jìn)行實(shí)證研究得到如下結(jié)論:
(1)五種資源發(fā)現(xiàn)系統(tǒng)在檢索功能上差別并不大,但是廈門(mén)大學(xué)所使用的指針?biāo)阉靼l(fā)現(xiàn)系統(tǒng)在可視化方面具有較大優(yōu)勢(shì),在顯示檢索結(jié)果的同時(shí),還提供了可視化顯示,用戶(hù)可以通過(guò)資源發(fā)現(xiàn)系統(tǒng)得到近年來(lái)相關(guān)主題的發(fā)文趨勢(shì)圖、學(xué)科分類(lèi)分布圖、期刊分類(lèi)分布圖等。
(2)在檢索效果方面,雖然中山大學(xué)的EDS屬于外文發(fā)現(xiàn)系統(tǒng),但其對(duì)中文主題也有一定的發(fā)現(xiàn)能力。而從響應(yīng)時(shí)間、查準(zhǔn)率、查全率、重復(fù)率四個(gè)維度的計(jì)算結(jié)果可以看出,在檢索效果方面,各資源發(fā)現(xiàn)系統(tǒng)之間存在一定差別。
由于受一些因素的限制,本文仍存在以下幾個(gè)問(wèn)題:(1)受訪問(wèn)權(quán)限的影響,中山大學(xué)的EDS發(fā)現(xiàn)系統(tǒng)對(duì)中文資源的檢索能力不夠,從而使得相對(duì)查全率和相對(duì)查準(zhǔn)率的計(jì)算受到影響。(2)雖然文中采取了多個(gè)主題查準(zhǔn)率結(jié)果求取平均值的計(jì)算方法,在一定程度上提高了查準(zhǔn)率計(jì)算結(jié)果的準(zhǔn)確性,但是由于檢索實(shí)驗(yàn)返回結(jié)果的相關(guān)度判斷受到判斷者主觀因素的影響,其計(jì)算結(jié)果仍存在一定的局限性。
1 胡瑋.“985工程”高校圖書(shū)館資源發(fā)現(xiàn)系統(tǒng)現(xiàn)狀分析和思考[J].圖書(shū)館學(xué)研究,2013(16).
2 秦鴻,等.三種發(fā)現(xiàn)服務(wù)系統(tǒng)的比較研究[J].大學(xué)圖書(shū)館學(xué)報(bào),2012(5).
3 鄧漢城.檢全率與檢準(zhǔn)率辨異[J].情報(bào)理論與實(shí)踐,1998(1).
4 黃崑.網(wǎng)絡(luò)信息檢索的檢全率、檢準(zhǔn)率影響因素研究[J].圖書(shū)情報(bào)工作,2002(3).
5 張文良.網(wǎng)絡(luò)環(huán)境下的信息檢索系統(tǒng)評(píng)價(jià)[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2010(12).
6 鄧小昭,等.網(wǎng)絡(luò)用戶(hù)信息行為研究[M].北京:科學(xué)出版社,2010:44.
7 H.Vernon Leighton,Jaideep Srivastava.Precision Among World Wide Web Search Services(Search Engines):Alta Vista,Excite,Hotbot,Infoseek,Lycos[EB/OL].[2016-02-20].http:∥www. winona.msus.edu/library/webind2/webind2.htm.
8 張軍華,韓全會(huì).中文五大綜合搜索引擎主要性能測(cè)評(píng)[J].情報(bào)科學(xué),2008(9).
9 于彩云.搜索引擎Yahoo的性能評(píng)價(jià)及評(píng)價(jià)指標(biāo)的選擇[J].現(xiàn)代情報(bào),2007(2).
(寇晶晶 中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心2015級(jí)碩士研究生,賈君枝 教授 山西大學(xué)經(jīng)濟(jì)與管理學(xué)院)
Comparative Analysis on the Chinese Retrieval Performance of Resource Discovery Systems of Academic Libraries
Kou Jingjing Jia Junzhi
The paper aims to find differences between different systems and provides some basis for universities to help them choose appropriate resource discovery system.Taking five kinds of library resource discovery systems used by“985 Project”universities as the basis,including Primo,Summon,EDS,F(xiàn)ind+and Super Star Found,this paper selects some academic libraries that use these systems as the research objects,and then compares and evaluates these university libraries'resource discovery systems from the point view of retrieval function and effect.There are some differences between them,and universities should choose appropriate resource discovery system according to their own needs.12 tabs.9 refs.
Academic Library;Resource Discovery System;Retrieval Performance
2016-07-18