張劍
摘 要 論文從可視化數(shù)字圖書館的定義和資源類型出發(fā),剖析“以用戶為中心”的可視化數(shù)字圖書館評價的必要性,在總結(jié)前人研究的基礎(chǔ)上,融入跨領(lǐng)域的人機(jī)交互、數(shù)字圖書館和用戶界面等要素,歸納總結(jié)出一個以用戶為中心的可視化數(shù)字圖書館評價框架,希望能為圖書館工作提供參考。
關(guān)鍵詞 可視化 信息用戶 數(shù)字圖書館
分類號 G250.76
DOI 10.16810/j.cnki.1672-514X.2017.07.014
Abstract This paper takes the definition of visualized digital library and the resource types as a starting point, analyzes the necessity of evaluating user-centered visualized digital library. Based on the view of predecessors' research, it combines the field of human-computer interaction, digital library and user interface elements etc, and sums up an evaluation framework of user-centered visualized digital library, hoping to provide some references for library work.Keywords Visualization. Information user. Digital library.
近些年,圖書館的館藏資源,尤其是數(shù)字資源海量增加,圖書館用戶如何有效地利用館藏資源成為眾多圖書館面臨的難題。一方面,用戶需要直觀、生動、簡潔的界面;另一方面,在有限的界面空間里需要充分展示龐大的數(shù)字資源的導(dǎo)航。這對圖書館工作提出了更高的要求。信息可視化為解決這些難題提供了良好的對策。信息可視化技術(shù)是一種非數(shù)值型資源的視覺呈現(xiàn)技術(shù),它將數(shù)字資源以一種用戶易接受的方式進(jìn)行展示,為用戶提供人工視野和空間感知,解釋信息之間的關(guān)聯(lián),發(fā)現(xiàn)海量館藏資源中的潛在隱性知識,在認(rèn)知層面組織和管理信息,提高用戶對信息的感知能力。目前,國內(nèi)銀多圖書館開始重視可視化技術(shù),并對館藏資源進(jìn)行知識化、可視化建設(shè),提供面向各類用戶的知識服務(wù),但是在可視化資源建設(shè)與服務(wù)水平上卻無統(tǒng)一的評價標(biāo)準(zhǔn)和指標(biāo)。對此,筆者提出“以用戶為中心”的可視化數(shù)字圖書館評價框架,以期為圖書館工作提供一些參考。
1 可視化數(shù)字圖書館
數(shù)字圖書館聯(lián)盟給出的數(shù)字圖書館定義是提供資源的組織,包括軟硬件、網(wǎng)絡(luò)與專業(yè)人員,以一致性、永久性的方式將數(shù)字化館藏進(jìn)行選擇、組織、提供查詢、解釋、傳播與完整保存,以便于這些數(shù)字館藏可以迅速、經(jīng)濟(jì)地提供給特定社區(qū)和用戶使用。數(shù)字圖書館研究領(lǐng)導(dǎo)小組人員使用5S(FS)框架來描述數(shù)字圖書館,分別是數(shù)據(jù)流(streams)、結(jié)構(gòu)(structures)、空間(spaces)、情境(scenarios)和社區(qū)(societies)。因此,無論從那個角度來看,數(shù)字圖書館實質(zhì)上都是“數(shù)字資源的集合”,目的在于為用戶感興趣的主題和領(lǐng)域提供信息訪問。
數(shù)字圖書館允許用戶通過界面對特定領(lǐng)域的信息進(jìn)行多次循環(huán)交互,館藏范圍涵蓋不同領(lǐng)域,包括(但不限于)教育、醫(yī)學(xué)、護(hù)理、法律、音樂、娛樂、存檔新聞、文化遺產(chǎn)等。具體到可視化數(shù)字圖書館來說,就是通過交互式檢索系統(tǒng),讓用戶能夠訪問和使用可視化數(shù)字信息(如圖像和視頻)。圖像館藏包括原生的或數(shù)字化的照片和其他數(shù)字圖形或圖像,這些圖像可以是各種不同訪問格式和尺寸(從縮略圖到全尺寸高分辨率);視頻館藏是指可訪問和播放的視頻信息,包括完整的電影或節(jié)目、場景、基于聚合的片段和故事情節(jié)片段等。這兩類可視化資源可以與任何數(shù)字圖書館進(jìn)行連接,多次呈現(xiàn)在檢索系統(tǒng)中。
2 數(shù)字圖書館可視化資源
筆者通過對國內(nèi)外數(shù)字圖書館可視化項目進(jìn)行調(diào)研,發(fā)現(xiàn)圖書館界可視化的數(shù)據(jù)源主要以全文數(shù)據(jù)庫、OPAC資源、論文數(shù)據(jù)庫為主,通常以矩形圖、網(wǎng)絡(luò)圖、表格、樹狀圖、餅圖等可視化形式顯示,可視化特征以大小、位置、面積、顏色等來表示,一般用于用戶提問構(gòu)建和檢索結(jié)果展示居多。數(shù)字圖書館中可以應(yīng)用的可視化技術(shù)資料類型主要有以下四種。
2.1 圖書館資源覆蓋范圍概覽
圖書館館藏資源覆蓋范圍、目錄或結(jié)構(gòu),很難通過文字來進(jìn)行描述,用戶難以準(zhǔn)確有效地進(jìn)行提問??梢暬詧D形方式、顏色差異等對資源集合的構(gòu)成成分進(jìn)行概括性揭示,提高了用戶感官上對資源的了解,幫助用戶進(jìn)行瀏覽。此外,豐富的交互功能讓用戶能夠基于所展示的信息對資源進(jìn)行進(jìn)一步的探索性操作,可大大擴(kuò)展用戶的知識視野,并提升館藏資源的利用率[1]。
2.2 用戶提問的可視化
讓用戶更加清楚提問詞范圍,更好地進(jìn)行定位,幫助用戶更恰當(dāng)?shù)剡M(jìn)行選擇,預(yù)覽并優(yōu)化提問。如Visual Thesaurus[2]可視化英語詞典,以網(wǎng)狀圖的方式顯示與提問詞相關(guān)的其他詞(同義或反義詞),界面右方則有所選詞匯的各種意思解釋,并且提供發(fā)音功能。
2.3 檢索結(jié)果的可視化
用戶通過圖形界面與網(wǎng)絡(luò)信息檢索系統(tǒng)進(jìn)行交互,對檢索結(jié)果進(jìn)行多角度分析,優(yōu)化提問或查詢??梢暬瘷z索結(jié)果遠(yuǎn)比文字呈現(xiàn)的分類維度直觀,能夠有效地幫助用戶鑒別其組成部分,理解資源之間的關(guān)聯(lián),探索并挖掘其自身的潛在信息需求。
2.4 用戶與數(shù)字資源交互行為的可視化
用戶與數(shù)字資源交互行為的可視化基于對用戶在線行為數(shù)據(jù)的采集,包括用戶對檢索結(jié)果頁面的每一次訪問、點(diǎn)擊、瀏覽及其他細(xì)粒度行為,用來評估數(shù)字資源的利用率及導(dǎo)航系統(tǒng)的效率,還可以對用戶行為進(jìn)行分析,從而提供更好的信息服務(wù)[3]。
3 可視化數(shù)字圖書館評價的必要性
可視化數(shù)字圖書館的評估是多層次的。從實踐層面來說,比較典型的是TREC視頻檢索評估(TRECVid)和ImageCLEF圖像檢索。TRECVid評估嘗試對真實世界場景或者這些場景中的重要組件任務(wù)進(jìn)行建模,通過開放的、基于度量的評估,來提升針對數(shù)字視頻的內(nèi)容分析和檢索技術(shù),被譽(yù)為評估可視化信息處理和檢索的新方法。ImageCLEF致力于為圖片提供一個基準(zhǔn)(檢索、分類、標(biāo)注等),它可為特定的任務(wù)(從圖像處理到圖像注釋等)創(chuàng)建特定數(shù)據(jù)集和評價措施,在無人參與的情況下從注釋圖像列表自動選擇圖像分析和概念。從應(yīng)用層面來說,可視化數(shù)字圖書館的評估主要是對數(shù)字館藏和數(shù)字圖書館的應(yīng)用進(jìn)行評估,以及對系統(tǒng)性能的測試,包括響應(yīng)時間和準(zhǔn)確度、用戶的交互、認(rèn)知和圖書館滿意度等??蓴U(kuò)展應(yīng)用程序或人際交互評價指標(biāo)主要是效率、效果和滿意度。
這些評估標(biāo)準(zhǔn)和指標(biāo)雖然領(lǐng)先其他領(lǐng)域,但是從近些年的技術(shù)發(fā)展和用戶需求現(xiàn)狀來看,以用戶為中心的評價標(biāo)準(zhǔn)和模式是可視化數(shù)字圖書館研究與發(fā)展的下一階段,主要目標(biāo)是對所開發(fā)出的信息系統(tǒng)進(jìn)行評估。然而這也將引發(fā)一系列的問題:開發(fā)人員或圖書館員在哪里及如何評估可視化數(shù)字圖書館?最初的評估策略是什么策略,又是基于什么?圖書館員如何決定哪些標(biāo)準(zhǔn)對用戶來說是重要的?
目前,以用戶為中心的數(shù)字圖書館研究方法是具體到特定館藏、數(shù)據(jù)化項目和用戶組,但會反過來限制其他研究項目適用性,而可視化數(shù)字圖書館以用戶為中心的研究尚無一般化的評估。
在用戶尋找、發(fā)現(xiàn)、使用和與信息的交互中,可視化信息資源會產(chǎn)生巨大的變化。已證實用戶在給定的情形下進(jìn)行可視化信息檢索時,會通過交互式會話高效地掃描大量代理。因此,除了數(shù)字圖書館其他類型(如文本)的評估之外,應(yīng)該單獨(dú)評估接口、功能和用戶,因為他們屬于不同類型的館藏和視覺信息。
另外,知識環(huán)境下要求圖書館必須堅持以用戶為中心的服務(wù)理念,評價可視化信息檢索系統(tǒng)應(yīng)通過標(biāo)準(zhǔn)化協(xié)議、便于實驗使用的公共數(shù)據(jù)集、任務(wù)定義和以系統(tǒng)為中心的檢索主題。
4 以用戶為中心的可視化數(shù)字圖書館評估框架
由于可視化數(shù)字圖書館的評估缺乏綜合性指標(biāo),故筆者在前人研究的基礎(chǔ)上,融入跨領(lǐng)域的人機(jī)交互、數(shù)字圖書館和用戶界面等要素,提出以用戶為中心的可視化數(shù)字圖書館評價指標(biāo),用于指導(dǎo)相關(guān)工作。
4.1 目標(biāo)及動機(jī)
以用戶為中心的可視化數(shù)字圖書館評估框架設(shè)計目標(biāo)主要有四點(diǎn)。一是形成一個基于單個項目需要,且適用于以用戶為中心的可視化數(shù)字圖書館的評估框架。二是確定并提出重要的、有影響力的和潛在的交叉重疊實驗因素,保證評估作為可視化數(shù)字圖書館評估框架的一部分。三是提供不同方法的具體實例,包括數(shù)據(jù)收集和分析,用于研究評價用戶和可視化數(shù)字圖書館應(yīng)用情況。四是為未來以用戶為中心的數(shù)字圖書館研究提供指導(dǎo)。
實現(xiàn)上述目標(biāo)將有助于研究人員更好地理解視覺數(shù)字館及與用戶的交互(如用戶界面),以科學(xué)有效的標(biāo)準(zhǔn)形式來進(jìn)行評估。
4.2 以用戶為中心的評價框架
筆者從合成可視化數(shù)字圖書館研究中開發(fā)出了一個評估框架[4]。圖1顯示了框架的基本組成構(gòu)件:用戶、交互、系統(tǒng)、領(lǐng)域、主題,組成框架的具體策略和方法可見表1??蚣苤胁煌u價組件之間的重疊將會得到很好的解決。
4.2.1 用戶
用戶是可視化數(shù)字圖書館評估框架的一個至關(guān)重要的組件,詳見表1。由于數(shù)字圖書館是交互式檢索工具,因此有必要進(jìn)行面向特定用戶和以用戶為中心的分析??梢暬瘮?shù)字圖書館是由不同的交互系統(tǒng)組成的,因此,支持檢索、瀏覽和可視化信息的評估是衡量用戶專業(yè)知識和技術(shù)水平的一項重要內(nèi)容。美國學(xué)者威爾金斯[5]在2009年指導(dǎo)36個用戶憑經(jīng)驗進(jìn)行檢索,跨越多個位置來證明如何提高搜索和檢索效率,結(jié)果發(fā)現(xiàn)在系統(tǒng)的高級檢索中,新老用戶差別很大。因此,可視化數(shù)字圖書館對用戶的分析評估需要在特定的情境下進(jìn)行。有關(guān)用戶背景或前期經(jīng)驗的數(shù)據(jù)可以參照表1制定調(diào)查問卷進(jìn)行收集。
②定量分析通常是指統(tǒng)計證據(jù)和對某些措施的觀察,如用戶交互、縮放比例和意見等;定性分析是指用戶的某些想法、執(zhí)行操作情況及原因等
4.2.2 交互
交互是可視化數(shù)字圖書館評估框架的重要組成部分,是數(shù)字圖書館與其他檢索工具交互的基礎(chǔ)??梢暬瘮?shù)字圖書館的交互評估應(yīng)該考慮系統(tǒng)和用戶界面如何調(diào)整用戶行為。用戶交互評估可以由正在執(zhí)行的操作進(jìn)行,包括但不限于頻率和類型的搜索、瀏覽和來自系統(tǒng)的其他請求??梢暬瘮?shù)字圖書館評估涵蓋各種交互技術(shù)手段,包括不同類型的文本檢索,如字段檢索或視頻記錄全文檢索等,具體到操作而言,可以按顏色、形狀、特性和紋理等來進(jìn)行檢索。
瀏覽是掃描數(shù)字可視化信息的一個重要交互技術(shù),它是最常見的交互,在豐富的可視化(如縮略圖或關(guān)鍵格)環(huán)境下,高效可視化瀏覽是非常重要的。可視化數(shù)字圖書館的用戶,尤其是目的明確的用戶,通過不同的可視化代理,可以瀏覽大量的館藏資源并返回搜索結(jié)果列表。
此外,可視化數(shù)字圖書館的評估需要測定不同交互預(yù)期,包括搜索和瀏覽行為,以及其他如選擇、保存、布局和現(xiàn)實配置和反饋等方法。
4.2.3 系統(tǒng)
系統(tǒng)是評估框架的另外一個主要組成部分??梢暬瘮?shù)字圖書館應(yīng)有高效的、令用戶滿意的、基于提問的檢索結(jié)果。其包括檢索特定可視化信息的功能,一般情況下,系統(tǒng)和檢索效率可以通過多種方式來評價,如響應(yīng)速度和精準(zhǔn)度。使用調(diào)查問卷來收集有關(guān)可視化數(shù)字圖書館有效性方面的數(shù)據(jù)(見表1),可通過用戶對系統(tǒng)的整體效率和檢索性能來判斷分析跨不同任務(wù)的、不同類型或類別的檢索主題。
4.2.4 多成分的評估
(1)用戶-交互。在評估框架組件中,用戶與交互之間有明顯的重疊。用戶是與數(shù)字圖書館相互作用的,因此有關(guān)交互的評估離不開用戶。在數(shù)字圖書館環(huán)境下用戶的信息需求可能更為詳細(xì)和精確,這些需求一般是基于特定領(lǐng)域知識和類似經(jīng)驗的集合,因此不同用戶,其交互也不同。美國學(xué)者韋斯特曼調(diào)查不同領(lǐng)域?qū)<业慕换?,將用戶分為“專業(yè)人士”和“非專業(yè)人士”,發(fā)現(xiàn)大多數(shù)專業(yè)人士在搜索時更頻繁地使用以視覺為導(dǎo)向的搜索功能,如顏色;而非專業(yè)人士則青睞于瀏覽和視覺掃描的集合。同時,非專業(yè)人士傾向于改變他們的交互方式與方向,專業(yè)人士則不斷優(yōu)化其查詢[6]。
(2)用戶-系統(tǒng)。用戶與數(shù)字圖書館系統(tǒng)結(jié)合的評估見表1。這種評估不僅評價系統(tǒng)與用戶結(jié)合的有效性,還包括以用戶為中心的界面特性、設(shè)計和布局及一個數(shù)字圖書館的各方面組織。在這里,評估系統(tǒng)主要評價其為預(yù)期用戶和數(shù)字圖書館開發(fā)出的適當(dāng)?shù)那榫澈陀虻挠行?。更具體地說,可用性和可學(xué)習(xí)性評估成為框架組件評估的重點(diǎn),可用性是數(shù)字圖書館最重要的屬性,評估可視化數(shù)字圖書館的可用性包括效率、有效性和滿意度。
(3)交互-系統(tǒng) 。交互-系統(tǒng)評價的程度依賴于與數(shù)字圖書館檢索過程交互的有效性,即在恰當(dāng)?shù)臅r間恰當(dāng)?shù)牟襟E和情況下可獲取的可視化信息或資源,簡而言之是“可視化數(shù)字圖書館的數(shù)據(jù)獲取效率”,通常通過系統(tǒng)事物處理或系統(tǒng)日志來評價其有效性,包括檢索會話的持續(xù)時間、訪問頻率、用戶瀏覽檢索結(jié)果集合大小。
(4)用戶、交互和系統(tǒng)。主要檢查用戶群組在完成檢索主題和一個信息任務(wù)時,如何與給定的可視化數(shù)字圖書館進(jìn)行交互。用戶對圖像需求熟悉程度與檢索策略和任務(wù)等都是相互關(guān)聯(lián)的。視頻也成為類似評估的情境,用戶的知識會影響交互(包括可視化檢索使用),將產(chǎn)生更高層次的主題檢索。
4.2.5 領(lǐng)域和主題
領(lǐng)域和主題組成了評價框架的基本組件。很多時候,這些因素并不是相互排斥的,可視化需求與檢索主題應(yīng)與數(shù)字圖書館的領(lǐng)域或情境相吻合。
用戶、交互和系統(tǒng)都對檢索主題的結(jié)構(gòu)和構(gòu)成有直接或間接的影響??梢暬黝}可以組成各種各樣的需求,包括基于內(nèi)容的需求、文本需求、語義視覺需求、抽象視覺需求(如恐懼和憤怒)等。基于現(xiàn)實和多樣化信息需求來評價可視化數(shù)字圖書館是有價值的,它可以影響到數(shù)字圖書館的其他評價。
評價可視化數(shù)字圖書館不同類別的檢索主題,主要基于以下要素:步驟或請求的數(shù)量(即單個和多個);語義和抽象;不同的特征,如視覺、文本或混合需求;不同組合的需求(例如分步語義可視需求)。通常任務(wù)越具體,用戶查全率越高。
此外,不同用戶交互檢索結(jié)果可能橫跨不同主題類型,如查詢模型和轉(zhuǎn)換。因此,評價可視化數(shù)字圖書館要考慮不同類型的可視化資源是否可以實現(xiàn)跨范圍的檢索,這對系統(tǒng)檢索主題設(shè)計將提出更高要求[7]。
領(lǐng)域的不同會影響檢索主題或信息需求。有些領(lǐng)域(如藝術(shù),藝術(shù)史、新聞攝影等)的專家或?qū)I(yè)人士的工作非常依賴視覺資源類型,藝術(shù)史領(lǐng)域的數(shù)字資源及系統(tǒng)充分展示出了可視化檢索評價的潛力。然而,這些特殊性并不代表可視化評價方式適應(yīng)于其他領(lǐng)域,或是所有其他可視化數(shù)字圖書館。例如一個未經(jīng)刪減的視頻是可視化館藏,但其所包含的信息(如一個人的頭部特寫)可能無法保證對具有相同特點(diǎn)的藝術(shù)歷史去進(jìn)行評價;對關(guān)于口述歷史的視頻館藏,很可能重點(diǎn)放在講述這個故事上。另外,許多數(shù)字圖書館的研究指出了通過快速高效的方式瀏覽可視化館藏的重要性,如利用縮略圖進(jìn)行瀏覽。有學(xué)者指出“單點(diǎn)的一個小時長的單人說話視頻”和“單點(diǎn)的情節(jié)串聯(lián)圖板沒有任何導(dǎo)航價值”,即評價一個可視化數(shù)字圖書館需要根據(jù)領(lǐng)域、任務(wù)和館藏性質(zhì)來進(jìn)行。
5 結(jié)語
可視化技術(shù)引進(jìn)數(shù)字圖書館已經(jīng)成為一種必然,大多數(shù)用戶已經(jīng)適應(yīng)并專注于用可視化方式瀏覽和檢索數(shù)字圖書館的資源,因此如何對可視化數(shù)字圖書館進(jìn)行評價將成為業(yè)內(nèi)關(guān)注的焦點(diǎn),筆者所提出的可視化數(shù)字圖書館評價框架能促使研究人員和開發(fā)人員從用戶的角度來研發(fā)可視化資源,從而保證用戶使用所熟悉的可視化內(nèi)容搜索、瀏覽和優(yōu)化查詢,提高資源的利用率和用戶滿意度,為國內(nèi)圖書館提供一些參考。