陳紅艷
(湖北大學(xué)圖書館 湖北武漢 430062)
數(shù)字技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展和應(yīng)用,改變了用戶信息資源的供給、需求和環(huán)境。在網(wǎng)絡(luò)環(huán)境下,用戶利用信息資源的方式發(fā)生了變化,一般用戶更傾向于使用搜索引擎作為檢索起點。伴隨信息技術(shù)的發(fā)展,網(wǎng)絡(luò)資源正呈指數(shù)級別增長,對于一般用戶而言,信息利用成本增加,如何快速有效地查詢到所需信息顯得愈發(fā)困難。在用戶搜索與信息查找反饋復(fù)雜的信息交換過程中,網(wǎng)絡(luò)敘詞表作為一種成熟的語義組織工具,對于聯(lián)接用戶和信息資源發(fā)揮著重要的作用。本文在分析影響用戶對網(wǎng)絡(luò)敘詞表需求因素的基礎(chǔ)上,采用深入訪談的方式調(diào)研用戶需求,分析其需求特征,以期為構(gòu)建面向用戶的網(wǎng)絡(luò)敘詞表提供參考。
網(wǎng)絡(luò)敘詞表不僅可以用于紙質(zhì)文獻(xiàn)的組織,也可用于組織網(wǎng)絡(luò)信息資源。伴隨互聯(lián)網(wǎng)的出現(xiàn),用戶對網(wǎng)絡(luò)敘詞表的需求主要與下列因素有密切關(guān)系。
信息環(huán)境的改變主要體現(xiàn)在信息資源的網(wǎng)絡(luò)化和資源數(shù)字化兩大方面。當(dāng)前,互聯(lián)網(wǎng)絡(luò)是用戶獲取信息的重要途徑。據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的第42次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示:截至2018年6月,中國網(wǎng)站數(shù)量達(dá)到了544萬個,中國網(wǎng)民規(guī)模達(dá)8.02億,互聯(lián)網(wǎng)普及率達(dá)到57.7%,近六成中國人已接入互聯(lián)網(wǎng)[1]。其中,即時通信、搜索引擎、網(wǎng)絡(luò)新聞和社交作為基礎(chǔ)應(yīng)用,用戶規(guī)模保持平穩(wěn)增長。隨著數(shù)字出版、預(yù)印本、開放獲取等新型數(shù)字媒體的出現(xiàn),資源數(shù)字化趨勢日益明顯,數(shù)字資源在整個文獻(xiàn)信息體系中所占的比例越來越大。以上海交通大學(xué)圖書館為例,其在2001—2011年期間,數(shù)字資源增長迅猛,電子圖書增加了195.9萬種,電子期刊增加了267 000種,數(shù)據(jù)庫增加了196個,館藏資源朝數(shù)字化方向發(fā)展[2]。目前國內(nèi)最大OA資源數(shù)據(jù)庫Socolar平臺,幾乎涉及所有學(xué)科領(lǐng)域,共收錄11 739種OA期刊,1 048個OA倉儲,平臺收錄文章數(shù)達(dá)23 894 558篇[3]。由瑞典隆德大學(xué)圖書館2003年5月推出的開放獲取期刊檢索系統(tǒng)——開放獲取期刊目錄(Directory of Open Access Journals,簡稱DOAJ),當(dāng)前可提供12 228種開放獲取期刊的訪問,其中有9 209種支持文章級檢索,涉及128個國家,收集的論文數(shù)量達(dá)3 457 865篇[4]。由此可見,面對海量信息源,用戶需有適合的知識組織工具予以支持,方可節(jié)省檢索時間和提高檢準(zhǔn)率。網(wǎng)絡(luò)敘詞表就是其中有效的工具之一。
在檢索活動前,用戶對于所需查詢的問題通常有較為清晰的認(rèn)識,清楚查詢主題的范圍。但在構(gòu)建檢索表達(dá)式、選擇合適的檢索詞時,往往會遇到困難。國外已有學(xué)者對此展開過定性與定量研究。Nielsen曾對29個參與者進(jìn)行調(diào)查,其中有21人表明在構(gòu)建檢索式時,很難限定其信息需求所用檢索詞[5]。為了限定檢索提問式,在未產(chǎn)生更高檢索噪音而又獲得高查全率的情況下,用戶通常需要參考一些同義詞和其他類型的等同詞匯。比如,借助敘詞表等工具。Shiri在《敘詞表增強的檢索界面》一文中指出,在構(gòu)建檢索式時,通常終端用戶在選擇詞匯時有困難。敘詞表通過提供有效檢索詞,幫助用戶順利完成檢索過程[6]。
網(wǎng)絡(luò)敘詞表具有標(biāo)引、檢索、瀏覽、導(dǎo)航等多種功能,通過提供多途徑瀏覽方式,幫助用戶快速選定目標(biāo)詞,提高詞表的易用性。網(wǎng)絡(luò)敘詞表既能標(biāo)引各種媒介資源,又能實現(xiàn)資源鏈接,滿足終端用戶從檢索詞匯到檢索相關(guān)信息的連續(xù)檢索。因此,網(wǎng)絡(luò)敘詞表具有優(yōu)化用戶檢索過程及檢索效果的功能。
網(wǎng)絡(luò)敘詞表為網(wǎng)絡(luò)環(huán)境下的信息生產(chǎn)者和使用者帶來雙贏:對網(wǎng)絡(luò)信息生產(chǎn)者而言,利用敘詞表可用同一標(biāo)準(zhǔn)來標(biāo)引和描述信息,尤其是對同類資源的描述;對網(wǎng)絡(luò)終端用戶而言,作用則更為顯著。Shiri和Revie在《敘詞表增強的檢索界面的可用性及用戶認(rèn)知》一文中曾經(jīng)指出敘詞表:①為用戶的具體檢索引入相關(guān)新概念;②為檢索詞匯提供語境信息;③為用戶構(gòu)筑提問式提供多種可選建議;④便于用戶擴(kuò)大或縮小檢索范圍;⑤為用戶提供多角度檢索;⑥提供敘詞之間語義關(guān)系的指導(dǎo)說明;⑦提醒用戶使用檢索最初未想到的詞匯[7]。
同時,網(wǎng)絡(luò)敘詞表反映了概念間內(nèi)在語義邏輯關(guān)系,對于促進(jìn)客觀知識體系中的多級語義傳遞具有正向促進(jìn)作用。通常,在具有5個相同相鄰語義域時,發(fā)生多級語義傳遞的可能性最大[8]。
為了探討不同學(xué)科領(lǐng)域的普通用戶對網(wǎng)絡(luò)敘詞表需求的差異及特征,筆者于2018年3-5月利用講授《信息檢索與利用》選修課程的機會,對33名選修學(xué)生進(jìn)行分組深度訪談。訪談內(nèi)容主要包括對敘詞表的認(rèn)知、利用情況,以及在檢索過程中遇到的常見障礙和對敘詞表功能展望等,深入了解用戶對網(wǎng)絡(luò)敘詞表的認(rèn)知情況與真實需求,以期為面向用戶的網(wǎng)絡(luò)敘詞表設(shè)計及構(gòu)建提供借鑒。
在33名訪談?wù)咧?,大一學(xué)生有22人,占66.67%,大二學(xué)生有7人,占21.21%,大三學(xué)生有4人,占12.12%;所涉及的學(xué)科分布分別為社會學(xué)科9人(27.28%)、人文學(xué)科2人(6.06%)、理工學(xué)科14人(42.42%)以及信息學(xué)科8人(24.24%);專業(yè)主要有化學(xué)工程與工藝、地理科學(xué)、計算機科學(xué)與技術(shù)、檔案學(xué)、人力資源管理等。
在訪談之前,筆者首先對受訪者進(jìn)行有關(guān)敘詞表基礎(chǔ)知識的普及講解。例如,在我國,敘詞表與主題詞表指代幾乎等同;主題與主題詞的常見應(yīng)用場景等。根據(jù)用戶對敘詞表認(rèn)知的熟悉程度分為“非常熟悉”“熟悉”“基本了解”“從未聽說”4個級別進(jìn)行調(diào)查,統(tǒng)計結(jié)果見圖1。其中,“從未聽說”的比例占了66.67%,“熟悉”與“非常熟悉”的為15.15%。由此可見,一般用戶對敘詞表的認(rèn)知水平有限。
圖1 用戶對敘詞表的認(rèn)知情況
通過進(jìn)一步交談得知,選擇“非常熟悉”的學(xué)生專業(yè)多集中在檔案學(xué)。究其原因是因為其開設(shè)了《信息組織》等相關(guān)課程,故對敘詞表非常了解。對于選擇“基本了解”的學(xué)生而言,對敘詞表的了解主要源于對WOS、EBSCO等外文數(shù)據(jù)庫的使用。
為了解普通用戶使用敘詞表的場景,筆者列舉了圖書館公共目錄OPAC、中文數(shù)據(jù)庫、外文數(shù)據(jù)庫、電子圖書、搜索引擎、門戶網(wǎng)站、社交網(wǎng)站等不同信息平臺。訪談發(fā)現(xiàn),文科類學(xué)生使用敘詞表時主要是在利用中文數(shù)據(jù)庫(CNKI、維普、萬方等)時,選擇“主題”項;而在利用OPAC檢索圖書時,更多地采用“題名”項。理工科類學(xué)生則主要是在利用外文數(shù)據(jù)庫(WOS、EBSCO等)時,為擴(kuò)增檢索結(jié)果選擇“主題”項。
在利用搜索引擎、門戶網(wǎng)站檢索學(xué)術(shù)信息資源時,理工科類學(xué)生更愿意嘗試用多個關(guān)鍵詞來輸入查找信息;文科類學(xué)生則更傾向于用自己熟知的概念、詞匯作為首要輸入詞語,在檢索結(jié)果不理想的情形下,反復(fù)替換多個輸入詞的意識較弱。
在允許用戶自行添加標(biāo)簽的社交網(wǎng)站(如豆瓣等)上,對敘詞表認(rèn)知程度高的學(xué)生添加標(biāo)簽積極性很高,標(biāo)簽主題范圍更為具體。
在獲悉敘詞表基本功能后,利用敘詞表頻率較低者表示,未來在網(wǎng)絡(luò)檢索界面上,若鏈接有相關(guān)敘詞表或者主題詞表,均表示愿意試用。
根據(jù)檢索過程,將用戶檢索行為分為檢索前的檢索表達(dá)式構(gòu)建與檢索后的檢索結(jié)果處理兩個階段,列舉了6大類障礙,供受訪者選擇(選項可多選),其結(jié)果排序見表1。
表1 用戶檢索過程中存在的障礙情況統(tǒng)計
從表1可見,用戶對檢索過程所遇障礙因素的趨同性較高。其中,有超過半數(shù)以上的學(xué)生選擇“不知如何表達(dá)信息需求”“想不出恰當(dāng)?shù)臋z索關(guān)鍵詞”等5類障礙因素。其中,“不知如何表達(dá)信息需求”居首位,占81.82%。通過深入交流,發(fā)現(xiàn)大部分受訪者選擇此項最主要的原因是無法精準(zhǔn)、快速地提煉自己所需信息的主題,進(jìn)而找不到合適的詞語進(jìn)行表達(dá)。在面對初次檢索結(jié)果不理想時,“二次檢索(精確檢索)更困難”“無法及時想到很多關(guān)聯(lián)詞語”與主題表達(dá)均存在內(nèi)在關(guān)聯(lián)性。
為進(jìn)一步普及網(wǎng)絡(luò)敘詞表,推廣其應(yīng)用,在訪談最后階段了解了用戶對網(wǎng)絡(luò)敘詞表平臺服務(wù)功能的期待,列出多項功能供受訪學(xué)生選擇,結(jié)果如表2所示。
表2 用戶對網(wǎng)絡(luò)敘詞表服務(wù)的期待情況統(tǒng)計
從表2可見,除了“自動標(biāo)引”以外,其他服務(wù)類別期待的比例較高(均超過了半數(shù)),反映了用戶對這些服務(wù)的期待非常強烈。尤其是,“關(guān)聯(lián)詞匯提示”“可視化顯示”“提供注釋”以及“免費獲取”四項是用戶最需要的服務(wù)。用戶希望敘詞表能夠清晰、直觀地揭示不同詞匯之間的關(guān)系,提示同義詞、近義詞等關(guān)聯(lián)詞匯,供自己在確定檢索詞時選擇,提高檢準(zhǔn)率?!懊赓M獲取”“與常用學(xué)術(shù)資源平臺(網(wǎng)站)鏈接”則從另一角度反映了用戶對網(wǎng)絡(luò)敘詞表的迫切需要。
通過調(diào)查用戶對網(wǎng)絡(luò)敘詞的需求情況可知,面向用戶、面向網(wǎng)絡(luò)是網(wǎng)絡(luò)敘詞表構(gòu)建過程中必須遵守的基本原則。此處“用戶”既包括信息標(biāo)引用戶和信息檢索用戶,又包含專業(yè)用戶和普通終端用戶,其對網(wǎng)絡(luò)敘詞表需求的特征如下。
在傳統(tǒng)信息環(huán)境下,敘詞表的入口詞是指等同(用代)關(guān)系中的“代項”,即非優(yōu)選詞,包括優(yōu)選詞的同義詞或準(zhǔn)同義詞;優(yōu)選詞是來源于正式文獻(xiàn)和學(xué)術(shù)術(shù)語。由于網(wǎng)絡(luò)敘詞表的使用環(huán)境和用戶群體發(fā)生了巨大改變,入口詞的來源、規(guī)模及作用亦需作出相應(yīng)調(diào)整。
入口詞不應(yīng)局限于優(yōu)選詞的同義詞或準(zhǔn)同義詞,有關(guān)優(yōu)選詞的不同拼寫形式、不同的外語縮寫形式、不同翻譯形式、概念的全稱與簡稱等均可納入入口詞的范圍。入口詞的規(guī)模需要擴(kuò)增,適當(dāng)增加入口詞數(shù)量、擴(kuò)大入口詞形式,提高入口率,增強網(wǎng)絡(luò)敘詞表的自然語言檢索能力。入口詞作為檢索的引導(dǎo)詞,雖不用作標(biāo)引詞,但通過詞表的等同關(guān)系控制也可以檢索到相應(yīng)的信息。由于不同學(xué)科領(lǐng)域,對于某一概念的表述詞語不盡相同。如果人為規(guī)定優(yōu)選詞可能并不能滿足使用者的偏好,無法體現(xiàn)入口詞在進(jìn)行高效信息檢索時發(fā)揮詞匯之間的調(diào)節(jié)作用[9]。當(dāng)網(wǎng)絡(luò)敘詞表主要應(yīng)用于網(wǎng)絡(luò)信息的組織和檢索、面向形形色色的非專業(yè)用戶時,入口詞就要收集用戶常用檢索詞作為其重要來源之一。
因此,在遵守敘詞表選詞基本原理與前提的條件下,網(wǎng)絡(luò)敘詞表需擴(kuò)大收詞規(guī)模,增加入口詞的數(shù)量,使得其選詞與用戶在檢索時所使用的關(guān)鍵詞盡量保持一致,適應(yīng)用戶檢索習(xí)慣。
敘詞表詞間關(guān)系主要有等同關(guān)系、等級關(guān)系和相關(guān)關(guān)系三種,基本滿足了用戶對敘詞表的需要。由于網(wǎng)絡(luò)敘詞表的應(yīng)用環(huán)境是面向網(wǎng)絡(luò)環(huán)境下的所有用戶,為了更貼近用戶的真實需求,這就要求敘詞表的編制要根據(jù)用戶的要求,支持用戶自定義詞間關(guān)系[10]。
自定義是基于三種基本詞間關(guān)系并結(jié)合學(xué)科特點作有針對性和適應(yīng)性調(diào)整。例如,對于計算機專業(yè)用戶而言,希望能將“概念——對象——屬性”作為一類相關(guān)關(guān)系;藝術(shù)學(xué)科專業(yè)用戶則希望要充分考慮藝術(shù)學(xué)科的學(xué)科特色,在詞間關(guān)系設(shè)置時,多設(shè)立一些“對象”“材料”“空間”“時間”等頂層類別,用不同分面來細(xì)分某一具體主題。此外,還可將“學(xué)科——學(xué)者——研究機構(gòu)”視為一種相關(guān)關(guān)系,以此了解某一研究領(lǐng)域概況。
通過詞間關(guān)系擴(kuò)展,既能夠靈活處理不同的詞間關(guān)系,又能滿足用戶的個性化標(biāo)引和檢索需求,提高檢準(zhǔn)率。為方便用戶對詞間關(guān)系理解和使用,采用可視化技術(shù),形象直觀地呈現(xiàn)不同類型的詞間關(guān)系[11]。
在計算機屏幕顯示格式下,網(wǎng)絡(luò)敘詞表能夠在一張頁面上顯示每條敘詞紀(jì)錄的所有信息,給予用戶完整的信息反饋[12]。雖然用戶記住詞匯的語義內(nèi)容難度增加,但超文本鏈接使用戶在不同顯示格式之間跳轉(zhuǎn),加快了用戶在詞匯間的移動和定位。由于用戶對網(wǎng)絡(luò)敘詞的認(rèn)知水平普遍較低,為更快熟悉與利用詞表,用戶希望在顯示界面清晰、明了,增強導(dǎo)航功能的前提下,提供多種網(wǎng)絡(luò)敘詞表顯示方式,方便其瀏覽和檢索詞匯。除了最常見的字母順序顯示方式外,還可考慮等級顯示、主題類別顯示等。
等級顯示直觀顯示了詞匯間的語義關(guān)系。通過顯示概念間線形、樹型等級結(jié)構(gòu),表達(dá)出敘詞整體結(jié)構(gòu)和所有等級。網(wǎng)絡(luò)敘詞表應(yīng)顯示詞匯不同層次的等級,并對不同等級賦予一定指示標(biāo)記。不同的等級層次反映詞匯間不同的上、下位關(guān)系,對用戶選擇詞匯具有導(dǎo)航作用。等級顯示將詞匯語義關(guān)系直觀顯示,便于用戶擴(kuò)檢或縮檢來選擇合適敘詞。
主題類別顯示一般按主題范疇集中顯示敘詞,在一個“語義場”內(nèi)顯示大量相關(guān)概念,增加敘詞表系統(tǒng)性,方便用戶查找。此種顯示方式兼具分類、主題兩種標(biāo)引和檢索功能,為不同層次和不同需求的用戶提供不同入口進(jìn)行詞語概念查詢,提高用戶檢索效率。
信息檢索與信息標(biāo)引作為敘詞表的基本功能,為網(wǎng)絡(luò)敘詞表所具備。在用戶對網(wǎng)絡(luò)敘詞表服務(wù)期待調(diào)查中可知,更多用戶希望網(wǎng)絡(luò)敘詞表能與常用學(xué)術(shù)資源平臺(網(wǎng)站)進(jìn)行鏈接,通過查詢敘詞來直接獲取所需資源,提供“一站式”鏈接服務(wù)。在信息技術(shù)的推動下,網(wǎng)絡(luò)敘詞表的功能得到了進(jìn)一步提升。
一是利用可視化技術(shù),將相關(guān)隱性知識進(jìn)行可視化展示成為顯性知識,提高敘詞表的易用性,幫助普通用戶實現(xiàn)對敘詞表的專業(yè)化使用,充分發(fā)揮敘詞表知識組織、知識導(dǎo)航以及知識發(fā)現(xiàn)等功能,提高用戶對網(wǎng)絡(luò)信息資源的利用率。
二是實現(xiàn)跨語言檢索的功能。網(wǎng)絡(luò)環(huán)境本身就是一個多語種環(huán)境,編制多語種敘詞表,使其作為一種中介詞典,讓用戶在使用母語的同時,可檢索到其他語種同類信息,擴(kuò)大信息檢索范圍。
在網(wǎng)絡(luò)環(huán)境下,敘詞表更多的是適應(yīng)普通用戶更直觀的信息檢索需求,甚至機器用戶的自動標(biāo)引和檢索[13]。網(wǎng)絡(luò)敘詞表設(shè)計的基本原則應(yīng)從適應(yīng)普通用戶和機器用戶的應(yīng)用環(huán)境和需求出發(fā),敘詞表的編制應(yīng)更加關(guān)注入口詞范圍擴(kuò)充、詞間關(guān)系變革、詞表顯示等核心內(nèi)容,包括敘詞表自然語言化、控制機制智能化,以及與其他信息系統(tǒng)無縫交換和集成。