我國聯合虛擬參考咨詢系統(tǒng)知識庫現狀研究*
——基于與QuestionPoint的對比
鮑計國 欒美晨
論文以訪問網站作為主要調研方式,從知識庫的基礎構建、應用與服務、聯合管理三大方面選取典型實例,對比分析國內現有主流參考咨詢知識庫和美國QuestionPoint的發(fā)展狀況、特點以及彼此間的差異,最后進行歸納總結,以期為我國圖書館參考咨詢系統(tǒng)知識庫建設提供借鑒。
知識庫聯合虛擬參考咨詢QuestionPoint知識挖掘元數據標準OCLC
聯合虛擬參考咨詢系統(tǒng)的知識庫包括在虛擬參考咨詢中用戶所提的問題與相應的解答記錄,它是經過分類與組織,有序化的知識集合,是在普通知識庫的基礎上,有目的和有針對性地從中抽取知識點,按一定的知識體系進行分析和整合而組織起來的數據庫,是面向用戶的有特色的專業(yè)化知識服務系統(tǒng)。聯合虛擬參考咨詢知識庫的構建與運作情況在很大程度上決定了聯合虛擬參考咨詢服務的深度和廣度。從中國科學院文獻情報中心參考咨詢臺、CALIS的DCVRS、廣東省立中山圖書館參考咨詢聯盟、上海圖書館網上聯合知識導航站等國內主流參考咨詢系統(tǒng)來看,基本上記錄了表單咨詢,并以此為資源供讀者檢索和瀏覽,但由于在構建和組織上的不完善性,加之記錄本身的問題,參考咨詢知識庫的作用沒有充分發(fā)揮出來,很大程度上憑借于參考咨詢館員自身經驗積累和個人的水平。因此,我國聯合參考咨詢知識庫的構建是一個急需加強的課題。
QP(QuestionPoint)是OCLC于2000年在CDRS(Collaborative Digital Reference Service:分布式虛擬參考咨詢服務)基礎上研制推出的服務項目(產品),也是目前世界公認的最成功的、輻射范圍最大的聯合虛擬參考咨詢服務項目。QP擁有兩個重要的特色資源:一個是得到歐美甚至于全球合作圖書館所組成的全球通訊架構和網絡以及軟件工具的大力支持,另一個是擁有由成員館的協(xié)作網絡構成的獨特的集中式知識源[1]。QP參考咨詢服務為全世界各地區(qū)、各國圖書館拓展參考服務提供了一種新的范式。因此以QP和我國主流參考咨詢知識庫進行對比研究對我國參考咨詢知識庫的建設具有典型的借鑒意義。
鑒于近年來聯合虛擬參考咨詢系統(tǒng)知識庫的研究重點大致是參考咨詢知識庫的基礎構建、知識庫創(chuàng)新型服務以及知識庫聯合管理三個方面,本文將結合中美兩國主要聯合虛擬參考咨詢系統(tǒng)的建設實例,從這三個方面,對參考咨詢系統(tǒng)知識庫的發(fā)展情況進行對照研究,以歸納總結我國參考咨詢知識庫與美國QP為代表的參考咨詢知識庫發(fā)展的異同。
2.1 知識庫的架構與建設方法
同時架設中心知識庫和本地知識庫是國內外主要聯合虛擬參考咨詢系統(tǒng)普遍采用的模式。QP虛擬參考咨詢系統(tǒng)設有一個唯一的全球知識庫(Global Knowledge Base)和大量本地知識庫(Local Knowledge Bases),各本地知識庫由成員館獨立架設本地服務器,自行管理。本地知識庫和中心知識庫能夠互通有無。全球知識庫由QP總部OCLC管理,全世界所有地區(qū)成員館可以很方便地在全球知識庫進行業(yè)務查詢。全球知識庫的記錄來源各本地知識庫,全球知識庫本身沒有記錄。各本地知識庫每年至少要向全球知識庫篩選一定數量的對答記錄。全球知識庫專家對提交的問答記錄按照一定的標準進行審核,只有符合標準的、有應用價值的記錄才錄入全球知識庫供全球各成員館共同享用,知識庫積累流程見圖1。除了Global KB 本身知識庫外,QP還能夠利用所有OCLC其他成員的知識庫如wordcat,wordshare,proquestion等,而且這些知識庫都很強大,以proquestion知識庫為例,截止到2014年2月,記錄達到3.2 億條[2]。
我國CALIS的分布式聯合虛擬參考咨詢系統(tǒng)(DCVRS)知識庫架設方式相比QP更為豐富和完善。DCVRS不僅有QP的中心知識庫和本地知識庫,還考慮到各地區(qū)、省市資源分配的合理性設立了省級知識庫(有的省級知識庫還創(chuàng)建了市級的“共享域”),各省成員館能夠通過向地區(qū)或省級參考咨詢系統(tǒng)租用知識庫的方式獲得聯合參考咨詢服務[3],大致架構如圖2所示。在中心知識庫建設方面,中心數據庫積累了巨大的知識記錄,因為中心知識庫的數據信息來自于兩方面:一是總咨詢臺的記錄;二是通過OAI元數據收割各省級知識庫中記錄的信息,而且后者更為重要。值得提出的是,2010年CALIS的三期建設項目建立了共享的云服務平臺和兩級支持共建,為高校圖書館和其他兩種類型圖書館的建設提供基于混合云的本地虛擬圖書館解決方案[4]。云服務的運用在一定程度上標志著我國在參考咨詢知識庫建設的某些領域面已經達到國際一流水平。
2.2 知識庫的知識組織與分類方法
從現實情況來看,全球聯合參考咨詢系統(tǒng)知識庫內的記錄都不是雜亂無章的簡單堆積,而是系統(tǒng)的知識集合,因此知識庫的分類組織方法對知識庫的建設與優(yōu)化有著極其重要的意義。美國QP知識庫分類導航按學科排列,參考的是美國國會圖書館分類法標準,這一標準在全美具有至高的權威性。與此同時,知識庫會自動通過問題關鍵詞聚類,能夠進一步向館員和讀者推薦與他們關注問題有一定聯系的知識記錄。此外,知識庫具有良好的主題分析功能,即能夠根據知識庫主題瀏覽或檢索情況自動彈出若干熱點和經典主題,為館員、讀者展現和提供相應的熱點、經典導航和鏈接,便于館員、讀者較快地找到需要的知識。其實這種技術在國內其他領域已經普遍使用,知網、萬方碩博論文庫的搜索引擎等也采取了這種方法。我國虛擬參考咨詢知識庫中的問答記錄方式彼此差異較大,但都是通過主題標引和自身服務對象的特點進行了單途徑的分類導航。通過對國內主要虛擬參考咨詢系統(tǒng)的實際使用,其中的浙江省聯合知識導航網站設置了多種信息分類導航,既科學又人性,能夠滿足不同層次、不同領域讀者的查詢需求。
3.1 知識庫的檢索服務
美國聯合虛擬參考咨詢知識庫的檢索服務界面中有很多檢索路徑,智能檢索服務、自動問答已初步應用。在檢索途徑上,和OCLC的其他產品類似,QP提供了兩種途徑:基本檢索和高級檢索?;緳z索就是輸入關鍵詞或句子;高級檢索有多關鍵詞邏輯組配檢索、模糊檢索和混合檢索。而在檢索機制上更加科學更加人文,QP對知識庫的檢索主要基于關鍵詞匹配的方式,出于兼顧查準率與查全率的考慮,QP提供了關聯問題提示,這樣更加方便用戶決定是否查找相關問題。在我國盡管這方面的技術已經成熟,但知識庫的檢索途徑很簡單,不少咨詢知識庫沒有提供模糊檢索和多關鍵詞的組配檢索。相比之下,上海圖書館的參考咨詢知識庫提供的檢索途徑很全面,其中“瀏覽問題庫”左側的分類多達33種,涉及到學科分類和文獻載體(如圖書、期刊、報紙、古籍等),還有“房地產資訊”“中小企業(yè)服務”,滿足了不同人群的查詢需求。微博、微信等方式也在上海圖書館的參考咨詢中得到了運用,但查詢擴展和關聯提示等功能尚未配備[5]。用戶除使用聯合虛擬咨詢平臺進行檢索外,QP還將知識庫作為一種普通的網絡服務,用戶不僅能通過OCLC以及OCLC合作伙伴登錄,還能夠從Facebook等其他網絡平臺訪問知識庫。國內的情況是通過圖書館網站可以登錄其他知識性較強的網絡,但是通過其他網絡尤其是商業(yè)網站不能登錄圖書館網站,更涉及不到參考咨詢知識庫。
自動問答服務目前在互聯網等領域已經獲得較廣泛的運用。QP收到問題后先采用句子相似度的方法和知識庫已有問題進行匹配,若匹配成功,即相似度達到規(guī)定的值,已有的答案將直接返回給用戶;若匹配不成功,即相似度沒有達到規(guī)定的值,再將問題提交給咨詢館員。這是一種較簡便的自動問答方式,不僅減輕了咨詢館員的工作量,而且更充分地運用了知識庫的已有資源。CALIS的DCVRS在吸收上述優(yōu)點的基礎上更加完善。如從北京大學圖書館咨詢臺入口,進入“文獻信息檢索”,輸入問題,DCVRS便直接對問題進行匹配,匹配成功直接得到答案;不成功,問題將交給北京大學學科館員處理。而這項技術在我國其他聯合參考咨詢聯盟中還沒有獲得大面積推廣運用。
3.2 知識挖掘與發(fā)現等創(chuàng)新型服務
除了提供日常的檢索服務外,QP咨詢知識庫正在探索進一步發(fā)揮其專業(yè)化知識服務的特色。2005年以來,美國對基于知識挖掘與知識發(fā)現的服務特別注意,多數參考咨詢系統(tǒng)可提供熱點知識點導航。在這一點上國內的圖書館參考咨詢也做了大膽的開發(fā),如上文提到上海圖書館聯合參考咨詢項目就有“房地產資訊”“中小企業(yè)服務”的服務欄目。在基于知識挖掘的創(chuàng)新型知識服務的同時,虛擬參考咨詢知識庫與互聯網等其他知識庫的融合也有了更多的研究,并取得了一定的成果。QP的母公司OCLC與各種各樣的子公司一起交流數據、連接工作流程和共享應用程序,這些合作伙伴的知識庫都能為QP和世界信息網、互聯網融合,使QP用戶最大限度地獲得更多的信息資源[6]。
4.1 知識庫的知識來源與標準
知識庫聯合管理最基礎的部分是知識的來源與標準。一般情況下,聯合虛擬參考咨詢系統(tǒng)中心知識庫信息來源于各本地知識庫所貢獻的信息,而本地知識庫的信息來源主要是其日常虛擬參考咨詢服務中的讀者與館員的問答記錄。目前知識來源主要有實時咨詢、表單咨詢、E-mail咨詢等。國內參考咨詢多數都采用了QQ咨詢,這類咨詢往往比較零散,整理起來需要大量時間。實際情況是盡管有價值,咨詢員卻沒有整理,因此大多知識庫并不能收錄實時咨詢的問答記錄。為了便于知識的儲存和利用,CALIS的分布式聯合虛擬參考咨詢系統(tǒng)(DCVRS)規(guī)定:咨詢員須將咨詢問題整理成標準的表單咨詢形式后,方能將咨詢記錄存入到知識庫。這一規(guī)定客觀上大大減少了入庫的記錄。然而,美國QP知識庫的記錄量相比之下非常大,不但記錄了基于計算機終端的實時問答情況,而且記錄了手機等移動客戶端設備的實時咨詢(如Text a Labrarian)[7]。這看起來是個簡單的問題,實質上涉及問題的標準化、知識庫的標準化、人工勞動等等問題。
知識庫標準一般定義為對知識庫記錄的語言、來源、資源描述、質量、編輯、存檔和權限、利用方面的規(guī)范,旨在整合、共同享用各知識庫中的資源,以保證服務質量和系統(tǒng)的互操作,統(tǒng)一所有成員圖書館在構建和豐富知識庫時的行動,進而使得知識庫中的記錄規(guī)范化[8]。美國目前虛擬參考咨詢知識庫的元數據(或數據元素)標準主要有:KBit(Knowledge Bit)和元數據標準、QATP(Question/Answer Transaction Protocol)、QUIP(Question Interchange Profile)。QATP是對參考咨詢進行統(tǒng)一的技術標準,是由美國National Information Stands Organization提出的,和QUIP相似,但是QATP定義了一種基于在不同虛擬參考咨詢服務機構之間進行問題/回答交換、客戶端/服務器模式,是一種幫助實現虛擬(或數字)參考咨詢系統(tǒng)之間的問題交互過程的規(guī)范。20世紀后期虛擬參考咨詢問答記錄量增加比較快,Answerbase公司在2000年VRD年會上提出KBit項目。KBi對問題和答案進行了分類與格式規(guī)定,是一種參考咨詢知識庫內容質量標準。QP知識庫要求的知識記錄必備元素包括問題本身、來源、成員圖書館、提問時間、咨詢館員教育背景、答案文本、涉及的參考文獻和注釋、入庫狀態(tài)、回答問題的成員圖書館等,它將每一個原問題作為一記錄來形容和描繪與之相關的問答交互情況。目前,我國CALIS的分布式聯合虛擬參考咨詢系統(tǒng)(DCVRS)知識庫在充分參考QUIP的問題交換協(xié)議標準基礎上做了進一步的優(yōu)化,必備元素有所減少,實現了各圖書館間跨平臺的問答記錄共同享用、交換,而且參考了2004年美國國家信息標準協(xié)會發(fā)布的虛擬參考咨詢試用標準問答處理協(xié)議,實現了與QP等參考咨詢系統(tǒng)之間的問題互換。
4.2 知識庫的維護與管理
記錄的錄入規(guī)范、記錄的更新與清理以及隱私與知識產權保護等內容構成聯合虛擬參考知識庫的維護與管理的基本內容。虛擬參考咨詢知識庫的維護在美國已相對成熟?!禥P知識庫編輯指南》是QP項目開發(fā)不久后便迅速起草的文件,該書對QP知識庫URL格式、問答記錄格式、參考資料的標注元數據等做了較為詳細嚴格的規(guī)定。此外,QP知識庫每月更新一次,并檢查知識庫記錄的時效性,及時修正或者刪除已過時的參考資料或者鏈接。在知識庫的管理上充分考慮到知識產權和隱私等敏感問題,問答記錄入庫時只錄入問題或答案本身,私人信息自動刪除。
我國還沒有制定統(tǒng)一的知識庫記錄標準,而在入庫記錄的篩選流程上,多數還沒有設被選問題和答案的臨時知識庫,對完整的問答記錄采取直接入庫機制,這樣就出現兩個極端,即錄入太多質量差的或者因為要求嚴格錄入太少。對知識庫里面無用的、不合時宜的記錄也未制定相應的淘汰辦法,如提供知識庫中記錄多而雜。我國主流的參考咨詢系統(tǒng)在用戶反饋機制上,都設置反饋郵箱等途徑供用戶反饋情況,但多數情況下用戶不能對某一具體問答結果進行評價。中國科學文獻情報中心首頁就設置了“用戶反饋”,但點擊進入之后,會發(fā)現是“網上咨詢臺”[9],問題可見一斑。
隨著參考咨詢的發(fā)展和知識庫記錄增加,國內知識庫維護與管理的提升將提到日程上來。綜合上述分析,我國以CALIS的DCVRS、上海圖書館網上聯合知識導航站等為代表的參考咨詢知識庫在基礎構建、創(chuàng)新型服務及聯合管理三個方面雖做了大膽的探索與創(chuàng)新,取得了可喜的成果,并在不少方面形成了自己的特色。但美國以QP為代表的參考咨詢知識庫建設方面總體上領先于我國,并表現出不同的文化特征,我國在知識庫建設的很多方面存在不足,需借鑒美國等國家先進的知識庫運作模式,加快我國參考咨詢系統(tǒng)知識庫的成長與發(fā)展[10]。
我國參考咨詢知識庫間的合作,以及參考咨詢知識庫和其他機構、網絡資源間的合作需要加大力度,實現內部融合,并和世界的圖書館鏈接起來。從知識庫的發(fā)展來看,知識挖掘、基于知識庫的智能檢索、自動標引與分類、自動問答等的研究是未來參考咨詢知識庫發(fā)展的重點課題,將知識庫作為一種搜索引擎與其他知識資源進行整合將成為我國知識庫發(fā)展的必然趨勢。
[1]OCLC.QuestionPoint at glance[EB/OL].[2014-05-24]. http://www.oclc.org/en-asiapacific/questionpoint/about. html.
[2]OCLC.QuestionPoint[EB/OL].[2014-05-24].http://www. oclc.org/questionpoint.en.html.
[3]王天虹,錢蔚蔚.天津高校圖書館CALIS分布式聯合虛擬參考咨詢服務實踐與問題研究[J].圖書館論壇,2013,33(4):157-161.
[4]中國教育和科研計算機網.H3C助力CALIS系統(tǒng)進入“云時代”[EB/OL].(2010-12-07)[2014-05-24]. http://www.edu.cn/tsg_6497/20101207/t20101207_54 9379.shtml.
[5]方向明.聯合虛擬參考咨詢服務比較研究:以“三層”結構評價體系為視角[J].新世紀圖書館,2014(3):48-51.
[6]OCLC.Partnerships[EB/OL].[2014-05-24].http://www. oclc.org/en-asiapacific/partners-for-libraries.html.
[7]王猛,鄭建明.1997—2012年我國數字參考咨詢研究主題分析[J].新世紀圖書館,2013(10):19-23.
[8]周寧麗,張智雄,李珍.分布式參考咨詢服務標準與規(guī)范研究與應用[J].現代圖書情報技術,2007(4):45-48.
[9]中國科學文獻情報中心網站[EB/OL].[2014-05-24]. http://www.las.ac.cn/index.jsp.
[10]洪韻佳,許鑫.聯合虛擬參考咨詢系統(tǒng)知識庫的發(fā)展現狀與趨勢[J].現代圖書情報技術,2012(9):2-9.
鮑計國遼寧對外經貿學院圖書館館員、講師。遼寧大連,116052。
欒美晨遼寧對外經貿學院圖書館館長、研究員。遼寧大連,116052。
Contrast Analysis of the Main Knowledge Base of the Collaborative Digital Reference Systems in China and QuestionPoint
Bao Jiguo,Luan Meichen
By visiting website,this paper analyzes the status of research and application of the knowledge base from its foundation construction,service and collaborative management through a study of the knowledge base of the main collaborative digital reference system in China and QP.At last,it makes a generalization expecting to provide references for the construction of knowledge base at home.
Knowledge base.Collaborative digital reference.QuestionPoint.Knowledge mining.Metadata standard.OCLC.
G250.76
2014-05-13 編校:方瑋)
*本文系2013年度遼寧省社會科學規(guī)劃基金項目“遼寧地區(qū)圖書館合作參考咨詢問題研究”(項目編號:L13DTQ016)階段性成果。