摘 要 在數(shù)字人文環(huán)境下,面對讀者多元化的信息獲取方式和多元化的信息需求,圖書館基于讀者需求開展精準服務,是提高資源利用率、降低服務成本的有效方法之一。論文基于馬斯洛需求層次理論和高校圖書館讀者的需求層次,對館內各應用系統(tǒng)中的讀者行為和資源利用的多源數(shù)據(jù)進行采集、統(tǒng)計,采用關聯(lián)算法、探索性分析等分析與挖掘技術,對高校圖書館“小數(shù)據(jù)”可視化分析與挖掘進行了策略設計,構建了一套以行為學監(jiān)測為主的統(tǒng)計分析系統(tǒng)平臺,實現(xiàn)了對讀者行為特征規(guī)律需求的監(jiān)測。
關鍵詞 高校圖書館 讀者行為科學 馬斯洛需求層次理論
分類號 G252.0
DOI 10.16810/j.cnki.1672-514X.2018.03.007
Abstract Under the digital humanities environment, facing the readers diversified access to information and diversified information needs, the library carries out precision service based on readers needs, which is one of the effective ways to improve the resources utilization rate and reduce the service cost. Based on Maslows hierarchy of needs and hierarchy of user needs in academic libraries, this paper collects and statistics the readers behavior data and resources utilization data in the application system of the libraries. And then it conducts a strategy design for the visualization analysis and mining of “small Data” in university libraries using the methods of association algorithm and exploratory analysis, and constructs a set of statistical analysis system platform based on behavioral monitoring, which realizes the monitoring of the characteristics of readers behavior.
Keywords University library. Readers behavioral science. Maslows hierarchy of needs.
信息社會發(fā)展至今,多元化的信息獲取的途徑已經逐步改變讀者的信息獲取習慣[1-2]。高校師生利用圖書館進行學習與科研,可以歸納到馬斯洛的需求層次理論中的自我實現(xiàn)需求。面對讀者多樣化的需求,掌握讀者對圖書館資源需求、空間需求、服務需求等特征是解決知識與服務之間矛盾的前提。在高校圖書館這個較為封閉的管理層面下,對多應用系統(tǒng)進行應用關聯(lián),匯聚讀者的各種資源應用與空間應用等數(shù)據(jù),分別從宏觀資源與微觀讀者兩個層面分析讀者對資源的利用情況與讀者的特殊需求,才能很好地開展個性化服務,為圖書館實現(xiàn)精準服務提供可能。
1 數(shù)字人文數(shù)據(jù)挖掘的研究對象
讀者需求內容的挖掘與可視化已經成為數(shù)字人文中行為學研究的重要手段。在“大數(shù)據(jù)”概念盛行的時代,“小數(shù)據(jù)”同樣具有一定的研究與實用價值。小數(shù)據(jù)是以人作為個體為中心,圍繞不同個體采集有關人的思想、行為、個性、偏好等個性化特征的數(shù)據(jù)[3]。結合圖書館與讀者之間的服務關系,本文認為圖書館中“小數(shù)據(jù)”挖掘就是指以讀者為中心,動態(tài)分析讀者在不同時刻的資源需求、服務需求和空間需求等,以及與圖書館活動相關的社會關系等信息,進行全方位的數(shù)據(jù)采集、處理、計算、分析與應用的過程。
高校圖書館處于一個較為封閉的網絡運行環(huán)境中,其封閉性也給數(shù)字資源的訪問控制與管理帶來一定的便利,例如以數(shù)字資源訪問統(tǒng)計為目的的數(shù)字資源統(tǒng)計分析系統(tǒng)[4-6],以遠程訪問和域外訪問為目的的電子資源遠程訪問系統(tǒng)[7],基于位置感知的書目推薦系統(tǒng),這些系統(tǒng)在一定程度上都可納入到計算機系統(tǒng)管理層面[8-9],在多系統(tǒng)運行環(huán)境下構建一套以讀者為研究對象的,關聯(lián)圖書館的資源、服務、空間的日志數(shù)據(jù)的采集系統(tǒng),用以進行讀者行為的分析研究,也可以用以宏觀分析圖書館的運行。
人文領域研究從最初以計算機工具輔助到“互動式學術”即模擬模型、參考工具、空間歷史實驗室項目[10],以及數(shù)字人文和計算化社會科學,都屬于數(shù)字人文的研究類型?,F(xiàn)代圖書館數(shù)字人文研究領域從研究對象劃分,主要包括兩個方面的內容:一是資源研究,例如古籍、特色資源庫研究等;二是讀者行為學研究,例如讀者資源行為研究等。由于資源和讀者都是圖書館的重要組成部分之一,所以數(shù)字人文的研究必須圍繞著圖書館的性質進行。本文數(shù)字人文研究,主要是針對讀者行為學方面的研究,通過對讀者行為分析推斷出讀者的資源需求、空間需求、服務需求等;根據(jù)需求理論,指導圖書館的資源建設、空間管理、服務提升等業(yè)務。
2 讀者行為可視化分析挖掘思路
2.1 高校圖書館讀者行為分析
高校圖書館的服務質量一般與讀者行為聯(lián)系在一起,也就是說服務質量的直接表現(xiàn)形式是讀者行為[11]。而進行讀者行為學研究的目的也是為了提升圖書館的服務質量。在信息社會的環(huán)境下,讀者的多元化獲取資源的方式造就了其多樣化的需求,其對圖書館的資源、服務等反饋的行為也不盡相同。所以,對研究對象的分類細化,獲取讀者的行為方式、空間軌跡方式、服務需求內容等,是進行精細化服務的基礎。這些信息的獲得,往往通過圖書館的各種系統(tǒng)實現(xiàn)。系統(tǒng)日志信息記錄著讀者以及與系統(tǒng)支持相關應用行為數(shù)據(jù),這些與讀者行為有關的數(shù)據(jù),在馬斯洛需求理論中,也就是自我實現(xiàn)的需求。根據(jù)高校讀者利用圖書館的目的,歸納出高校圖書館需求理論模型,如圖1所示。
如圖1所示,不同讀者由于目的不同,其對圖書館的需求層次也有多樣性。由左往右、從低層次到高層次,分別為學習需求、科研需求、創(chuàng)作需求、設計需求與規(guī)劃需求。這是高校讀者在學習、科研、創(chuàng)作、設計與規(guī)劃中的層次等級細化。高校讀者的學習能力、科研能力、創(chuàng)作能力、設計能力與規(guī)劃能力等可在圖書館等相關業(yè)務部門的協(xié)助下得到不斷提升。在此過程中,圖書館與讀者之間需要建立一種動態(tài)溝通機制,除了傳統(tǒng)的信息服務工作以外,研究分析讀者的學術與科研動向,采取與其相適應的資源建設、服務推送等工作,才能夠真正的幫助讀者在學習、科研等工作中得到提升。圖書館讀者需求層次模型的建立,有助于建立科學化管理的理論基礎,也能夠幫助圖書館在日常的資源建設、空間管理、服務管理工作中提供決策依據(jù),避免資源浪費,空間混亂,服務低下的現(xiàn)象發(fā)生。
2.2 需求理論與讀者行為關系
人的價值分為社會價值、個人價值和自我價值。人的自我價值是指個人自身既為主體又為客體自我認識、反省、調節(jié)和實踐以達到社會和他人無法給予的自我滿足[12]。人的價值的實現(xiàn)就是人們對馬斯洛所提出的人的五個層次需求的奉獻和索取。而人在第一層次至第四層次需求的過程中無法實現(xiàn)自身滿足,需要自我認識、調節(jié);人要實現(xiàn)最高的第五層次需求才能自我實現(xiàn)需求,使自己越來越成為自己所期望的人物。在高校讀者群體里,圖書館的價值是實現(xiàn)人的最高的第五層次需求,即實現(xiàn)自我需求。
讀者對圖書館的需求反饋,主要是通過圖書館各項業(yè)務使用過程的感知來評價。例如資源的借閱量、空間的使用量等,不同的資源,不同的空間,其數(shù)值是相同的,也客觀反映讀者的偏好。讀者需求與行為反饋的關系如圖2所示。
如圖2所示,讀者在追求自我實現(xiàn)需求的過程中,對圖書館所能提供的資源、空間、服務提出一定的要求,這些要求直接體現(xiàn)在資源的借閱量、空間的使用量與服務的滿意度方面。因此根據(jù)量化的方法,對借閱量、使用量和滿意度進行分析研究,可以獲取到讀者的真實需求,掌握讀者的偏好,用以提升讀者服務工作。
3 讀者行為可視化分析策略設計
高校圖書館的多系統(tǒng)、多應用環(huán)境為讀者行為研究提供了原始數(shù)據(jù)基礎。源數(shù)據(jù)準確性與可靠性,直接影響讀者行為分析結果的真實性。減少中間環(huán)節(jié),直接從源系統(tǒng)中獲取數(shù)據(jù),是提高分析效率和統(tǒng)計準確性的基礎。高校圖書館的應用系統(tǒng)建立在資源、服務與空間管理上,而各種應用系統(tǒng)運行都圍繞著這三個方面進行。資源、服務、空間直接或者間接與讀者活動相關,根據(jù)這個原則,設計讀者行為可視化策略,并逐步實施,如圖3所示。
高校圖書館的多系統(tǒng)分別包括空間管理系統(tǒng)、資源管理系統(tǒng)、電子資源遠程訪問系統(tǒng)、服務管理系統(tǒng)等??臻g管理包括涉及與空間相關的系統(tǒng),例如座位管理系統(tǒng)、門禁管理系統(tǒng)、無線管理系統(tǒng)等。資源管理包括紙質資源管理的圖書館管理系統(tǒng),例如匯文圖書館管理系統(tǒng)等;數(shù)字資源管理系統(tǒng),例如復旦光華、信安之星的電子資源統(tǒng)計分析系統(tǒng)。高校圖書館為了方便域外讀者訪問數(shù)字資源,提供VPN系統(tǒng)或者類似的電子資源遠程訪問系統(tǒng),例如匯文的電子資源遠程訪問系統(tǒng)。服務管理包括多媒體閱覽室的管理系統(tǒng),自助打印設備的管理系統(tǒng)等。高校圖書館的讀者行為數(shù)據(jù)可視化分析與挖掘,需要從上述各系統(tǒng)中采集源數(shù)據(jù),進行多重數(shù)據(jù)清洗,提高數(shù)據(jù)的準確性,以此提升行為分析的準確。
對于在多樣化的應用系統(tǒng)中的源數(shù)據(jù),一定要以讀者行為數(shù)據(jù)為基礎。在空間管理層中,基于讀者座位選擇與無線網絡熱點聚類,從涉及讀者、位置的關聯(lián)數(shù)據(jù)中汲??;在資源管理層中,進行文本分析,從雙類型數(shù)據(jù)、文獻-關鍵詞數(shù)據(jù)中進行文獻聚類和關鍵詞聚類,從而獲取讀者對資源的偏好信息;在服務管理層中,基于服務系統(tǒng)數(shù)據(jù)庫,關聯(lián)讀者、多媒體閱覽室、自助設備等服務系統(tǒng)之間的相互聯(lián)系,進行利用率統(tǒng)計聚類與讀者身份信息聚類[13]。只有這樣才可以較為全面掌握讀者資源、空間、服務動態(tài)。對于采集到的數(shù)據(jù),通過關聯(lián)算法、探索性分析和基于案例學習等分析與挖掘方法,進行實時分析才可實現(xiàn)對讀者對象性、多樣性、周期性、歷史性等四個方面特征的需求進行監(jiān)測,以輔助圖書館決策者在資源與空間管理中發(fā)現(xiàn)新的現(xiàn)象、需求、趨勢。
4 讀者行為可視化分析與挖掘研究實踐
4.1 行為數(shù)據(jù)的關聯(lián)算法
基于要采掘的數(shù)據(jù)庫中的概念層次和發(fā)現(xiàn)單一概念層次中的關聯(lián)規(guī)則的算法,主要有Han等人的ML_T2L1和R.Srikant等人的Cumulate、Stratify算法。如在討論同一字段的值之間的關系時,即可運用在單維或者維內的關聯(lián)規(guī)則,這些規(guī)則一般是在同一數(shù)據(jù)庫中挖掘。例如大三、大四的讀者,職業(yè)是學生,那么該讀者就會訪問學術期刊網下載論文。該規(guī)則的表達方式如下:
年級(X,“大學三年級—大學四年級”)+職業(yè)(X,“學生”) →訪問(X,學術期刊網下載論文)
另外,由各系統(tǒng)提供的座位管理的讀者選擇座位的信息,讀者無線網絡訪問與登錄點位置信息,門禁系統(tǒng)提供的進館信息等,都是從點方面獲取讀者信息來研究分析。而不同系統(tǒng)的應用統(tǒng)計分析數(shù)據(jù),則是從面上對各個系統(tǒng)運行狀態(tài)進行研究分析。4.2 探索性分析
探索性分析也稱為探索性因子分析法(Exploratory Factor Analysis, EFA) ,是一項用來找出多元觀測變量的本質結構、并進行處理降維的技術。因而,EFA能夠將具有錯綜復雜關系的變量綜合為少數(shù)幾個核心因子。對于主因子分析法來說,不存在異常值、等距值、線形值、多變量常態(tài)分配以及正交性等情況[14]。EFA能夠將將具有錯綜復雜關系的變量綜合為少數(shù)幾個核心因子。因子分析法是驗證性分析和純粹的探索性分析兩種分析形式的統(tǒng)一體。英國的心理學家Charles Spearman在1904年的時候,提出單一化的智能因子(A Single Intellectual Factor)。隨著試驗的深入,大量個體樣本被分析研究,Spearman的單一智能因子理論被證明是不充分的。同時,人們認識到有必要考慮多元因子。20世紀30年代,瑞典心理學家Thurstone打破了流行的單因理論假設,大膽提出了多元因子分析(Multiple Factor Analysis) 理論。Thurstone在他的《心智向量》 (Vectors of Mind, 1935) 一書中,闡述了多元因子分析理論的數(shù)學和邏輯基礎。在運用EFA法的時候,可以借助統(tǒng)計軟件(例如SPSS或者R語言) 來進行數(shù)據(jù)分析。
高校圖書館探索性因子分析法的運用一般在讀者滿意度調查、服務質量調查、特殊需求測試、市場劃分識別、 讀者、圖書館資源和服務及相互關聯(lián)行為分類等五個方面進行。
一個典型的EFA流程如下[14]:(1) 辨認、收集觀測變量,如讀者行為、服務質量、資源動態(tài)等。(2) 獲得協(xié)方差矩陣(或Bravais-Pearson的相似系數(shù)矩陣)。(3) 驗證將用于EFA的協(xié)方差矩陣(顯著性水平、反協(xié)方差矩陣、Bartlett球型測驗、反圖像協(xié)方差矩陣、KMO測度)。(4) 選擇提取因子法(主成分分析法、主因子分析法)。(5) 發(fā)現(xiàn)因素和因素裝貨。因素裝貨是相關系數(shù)在可變物(列在表里) 和因素(專欄之間在表里)。(6) 確定提取因子的個數(shù)(以Kaiser準則和Scree測試作為提取因子數(shù)目的準則)。(7) 解釋提取的因子(如或解釋為“潛在資源需求”,或“服務需求”等)。
4.3 數(shù)字資源訪問系統(tǒng)數(shù)據(jù)挖掘與分析系統(tǒng)實踐
多維度的讀者信息行為數(shù)據(jù)獲取,能夠提高讀者偏好分析的準確性,是系統(tǒng)研究讀者行為的基礎,也是研究的重點。動態(tài)獲取讀者的資源行為,可以掌握資源建設與讀者服務的主動性,能夠實現(xiàn)想讀者所想,供讀者所需。在復雜多變的互聯(lián)網環(huán)境下,實現(xiàn)精準服務,能夠吸引讀者回歸圖書館,充分利用圖書館的資源、空間與服務,側面體現(xiàn)了圖書館的價值。
域外(校園網外) 遠程訪問的數(shù)據(jù)主要通過電子資源授權訪問系統(tǒng)進行挖掘和分析,該系統(tǒng)提供了數(shù)字資源統(tǒng)計匯總數(shù)據(jù),同時也提供讀者使用排行,熱門資源排行與讀者登陸人次。整個系統(tǒng)為讀者資源行為分析提供了決策數(shù)據(jù)。校園網內數(shù)字資源訪問監(jiān)測是基于旁路監(jiān)聽方式進行,統(tǒng)計分析結果較為準確,解決了在多系統(tǒng)、異構性環(huán)境下,獲取利用率等數(shù)據(jù)的復雜性。
域外(校園網外) 遠程訪問與域內(校園網內) 數(shù)字資源監(jiān)測體系的構建,可以全面對數(shù)字資源的利用率和讀者的數(shù)字資源行為作出24小時全方位的動態(tài)監(jiān)測,實現(xiàn)了對讀者對象性、多樣性、周期性、歷史性等四個方面特征規(guī)律需求進行監(jiān)測。對象性主要是指不同類型的讀者和不同的資源庫;多樣性主要是讀者的多樣化的需求,以及不同資源之間的關聯(lián)性;周期性主要是反映讀者的近期需求和長期需求,根據(jù)自身學習研究的動態(tài)性,形成對資源需求的周期性;歷史性主要是利用保存的行為數(shù)據(jù),在一段時間內,以小數(shù)據(jù)的思維,分析、挖掘讀者資源總體需求以及資源利用率情況,用以指導資源建設、服務工作。
5 讀者行為可視化分析與挖掘面臨問題以及解決方案
5.1 讀者數(shù)據(jù)隱私保護策略
通過應用系統(tǒng)獲取讀者行為數(shù)據(jù),從讀者隱私角度分析,如果使用不當,勢必造成對讀者隱私的侵犯[15]。高校圖書館各種系統(tǒng)中,記錄著讀者的各種行為,例如資源系統(tǒng)記錄著讀者借閱圖書資源的信息,而這些信息直接反映了讀者研究動態(tài),間接的反映了讀者思想、立場等信息。諸如此類的數(shù)據(jù),如果不能夠良好的進行保護,萬一被不法分子獲得將會對讀者在生活學習造成不利的影響。所以,高校圖書館在進行讀者行為軌跡挖掘分析的同時,必須要制定一系列的策略,對讀者隱私數(shù)據(jù)進行保護。例如采用信息混淆隱私保護策略,引入第三方認證技術,設計并實現(xiàn)讀者隱私保護模型,避免在信息服務中對讀者隱私的侵犯。同時進行權限分級管理,數(shù)據(jù)匿名指代化,避免讀者核心數(shù)據(jù)泄露。
5.2 多系統(tǒng)異構數(shù)據(jù)歸一化
在圖書館的多系統(tǒng)運行環(huán)境下,解決異構系統(tǒng)歸一化問題,是進行數(shù)據(jù)挖掘與分析的基礎[16]??梢詫⒉煌瑪?shù)據(jù)庫(如SQL、ORCALE等) 數(shù)據(jù)轉換成同一種數(shù)據(jù)庫數(shù)據(jù),實現(xiàn)對同一數(shù)據(jù)源進行訪問。異質關聯(lián)數(shù)據(jù)的聚類,是由超過兩種類型以上的數(shù)據(jù)對象組成。現(xiàn)在圖書館等多系統(tǒng)異構數(shù)據(jù),往往屬于異質環(huán)境。在此環(huán)境下,多類型數(shù)據(jù)相互聯(lián)系形成一個K部異質關聯(lián)圖。運用迭代算法思想,對一個K部異質關聯(lián)圖創(chuàng)建一個RSN,構建一套關聯(lián)網絡模型,解決多系統(tǒng)異構數(shù)據(jù)歸一化問題,其流程見圖4。
5.3 空間管理與服務管理系統(tǒng)需要整合
空間管理需要涉及讀者空間位置的各個管理系統(tǒng)的配合,例如座位管理系統(tǒng)、無線定位系統(tǒng)等。通過讀者空間位置感知的管理系統(tǒng),可以在定位讀者的同時,獲取讀者的空間行為軌跡,進一步分析出讀者的空間偏好。同時,復雜的、多樣的服務管理系統(tǒng),需要進一步進行應用關聯(lián)與整合,其工作量較大,部署與實施細節(jié)較為繁雜,往往因為各高校圖書館的環(huán)境不同,其實施方案與部署的條件不一。所以,在此當前環(huán)境下,需要各個圖書館技術部門、規(guī)劃部門對基礎系統(tǒng)數(shù)據(jù)庫類型進行歸一化處理,做進一步整合,才能夠為部署KaaS的小數(shù)據(jù)系統(tǒng),提供硬件基礎環(huán)境。
5 結語
資源、空間、服務是高校圖書館讀者工作的基本內容。圖書館外部環(huán)境不斷改變,互聯(lián)網、移動互聯(lián)網已經逐步改變讀者的各種行為方式。如何抓住讀者的行為習慣,利用讀者學習生活特征,開展各項讀者工作,是圖書館需要認真面對的問題。構建資源監(jiān)測評價體系,規(guī)劃空間管理服務體系,搭建服務數(shù)據(jù)分析平臺,運用動態(tài)數(shù)據(jù),指導圖書館日常業(yè)務工作,是提高圖書館運營效率的一個有效措施。在信息技術多樣化的時代,圖書館缺的不是技術支持,而是運營的思路、理念。只有時刻圍繞讀者與圖書館兩個對象,開展一系列針對性的研究與實踐,才能夠避免圖書館在發(fā)展中被逐漸邊緣化,以技術支持管理的理念來提升圖書館的實用價值乃至學術價值。
參考文獻:
陸康,陸興華,劉慧.基于讀者行為追蹤的智能服務研究:以帆布指紋識別與CNZZ為例[J].現(xiàn)代情報,2016(7):107-112.
陸康.網絡行為讀者需求分析運用探討[J]. 現(xiàn)代情報,2015(5):94-97,104.
馬曉亭,陳臣.基于可信小數(shù)據(jù)的圖書館個性化服務研究[J]. 圖書情報工作,2015(4):70-75.
陸康.高校圖書館數(shù)字資源統(tǒng)計系統(tǒng)建設研究[J]. 現(xiàn)代情報,2015(9):140-145.
周欣,陸康. 基于圖書館數(shù)字資源訪問系統(tǒng)的讀者行為數(shù)據(jù)挖掘研究[J].現(xiàn)代情報,2016(1):51-56,73.
劉慧.基于網絡行為的圖書館數(shù)字資源評價方法研究[J].現(xiàn)代情報,2015(2):62-66.
周欣,陸康,張迎春.數(shù)字資源校外訪問及統(tǒng)計分析系統(tǒng)探討[J].中華醫(yī)學圖書情報雜志,2016(6):39-44.
鄧志文,都平平,穆亞鳳.基于位置感知的圖書館主動信息服務系統(tǒng)設計[J].現(xiàn)代圖書情報技術,2016(2):102-110.
李勝,王葉茂.一種基于本體和位置感知的圖書館書籍推薦模型[J].現(xiàn)代圖書情報技術,2015(3):58-66.
MICHAEL AKELLER,王寧.數(shù)字人文和計算化社會科學及其對圖書館的挑戰(zhàn)[J].現(xiàn)代圖書情報技術,2014(10):1-3.
王頻.圖書館服務質量與讀者行為關系研究[J].圖書館論壇,2008(4):113-114,149.
胡萬鐘.從馬斯洛的需求理論談人的價值和自我價值[J].南京社會科學,2000(6):25-29.
LONG B, ZHANG Z F, YU P S. 關聯(lián)數(shù)據(jù)聚類-模型、算法及應用[M].北京:科學出版社,2015.
探索性因子分析法[EB/OL].[2016-11-24].http://www.psychspace.com/psych/viewnews-7168.
陸康.網絡信息環(huán)境下讀者隱私保護策略研究[J].現(xiàn)代情報,2016(6):119-123,153.
曹畋.大數(shù)據(jù)環(huán)境下的圖書館異構數(shù)據(jù)統(tǒng)一訪問與轉化系統(tǒng)[J].圖書館理論與實踐,2016(2):80-84.
陸 康 南京曉莊學院圖書館系統(tǒng)技術部主任、副研究館員。江蘇南京,211171。
(收稿日期:2016-11-24 編校:劉 明)