●陳 臣(蘭州商學院信息中心,蘭州 730020)
大數據時代一種基于用戶行為分析的圖書館個性化智慧服務模式
●陳臣(蘭州商學院信息中心,蘭州730020)
[關鍵詞]用戶行為;分析;個性化智慧服務;大數據時代;圖書館
[摘要]本文基于大數據時代用戶行為數據分析,構建了一種圖書館個性化智慧服務模式。該服務模式能夠準確獲得讀者個性化閱讀需求,可為讀者提供安全、高效、經濟、低碳的個性化智慧服務,具有較高的服務系統運行效率和用戶滿意度。
隨著大數據時代的到來,如何創(chuàng)建高效的信息基礎環(huán)境,不斷增強數據搜集、處理、整合與分析能力,從中獲得讀者個性化智慧服務的知識、經驗和業(yè)務洞察力,是圖書館樹立以“智慧分析洞察”為核心理念,提高用戶服務決策能力、風險防范能力、服務系統效率、讀者個性化閱讀滿意度和服務收益率,確保讀者個性化服務內容與模式創(chuàng)新、高效、精確和經濟的關鍵。
圖書館大數據環(huán)境具有“4V+1C”的特點。(1)Variety,數據種類繁多,包括結構化、半結構化和非結構化等多類型數據。數據在編碼方式、格式、應用特征等多方面存在差異性,具有較強的異構性。(2)Volume,圖書館可通過監(jiān)控、服務終端設備,采集系統運營和讀者的行為數據,具有數據量龐大且以年均60%的速度遞增特點。(3)Velocity,所采集的數據多關系圖書館應用服務和用戶行為,數據的處理與分析具有較強的實時性要求。(4)Vitality,大數據系統的分析與處理模式必須根據讀者需求和服務實際快速變化,并具備較強的時間和空間適應性。(5)Complexity,大數據處理和分析過程難度較大,須采用高效算法來滿足異構數據統一接入和實時處理的需求。因此,圖書館須加強大數據應用系統的平臺化、精準化、實時化和可預見化建設,重點解決好數據采集、存儲、搜索與查詢、共享和分析、觀測這五個方面的問題,才能構建高效的智慧服務系統,才能為讀者提供安全的大數據個性化智慧服務。[1]
1.1大數據時代圖書館用戶個性化服務模式特征
首先,大數據時代圖書館用戶服務模式是以讀者需求為依據,面向用戶的個性化智慧服務。是基于傳感器、RFID、監(jiān)控器、人機交互等設備,對圖書館系統運營和讀者個性化閱讀活動實現全自動的知識感知。也是在讀者閱讀全生命周期活動中,通過知識服務實現以知識、用戶、技術、服務模式、服務資源和能力為核心的接入和智能感知。其次,大數據個性化智慧服務具有較強的不確定性。圖書館大數據分析平臺通過對讀者閱讀關系和行為數據進行采集、處理、分析和決策,明確讀者個性化閱讀需求及其變化趨勢,進行服務內容和模式的制定、選擇、部署、優(yōu)化、評估和跟蹤,這個過程具有較強的不確定性。第三,讀者是大數據個性化服務的核心與重點。讀者是大數據資源采集的源泉,同時也是大數據服務的參與者與承擔者,因此,讀者應參與到用戶需求判定、知識服務過程和服務質量評估生命周期管理的每一個環(huán)節(jié)。第四,大數據個性化服務是基于知識、資源、技術和過程共享、交易的知識服務模式,是通過對服務資源、知識、技術、能力和過程的統一封裝、配置、顯示、管理和調用,最終完成用戶大數據個性化服務的交付、共享和使用。第五,大數據個性化閱讀服務具有用戶個性化和群體創(chuàng)新性雙層模式,服務具有安全、高效、經濟和低碳的特點。
1.2圖書館大數據個性化智慧服務面臨的問題
(1)圖書館的大數據服務支撐能力弱。根據IDC
數據統計顯示,全球數據總量每過18個月就要翻一番,年數據總量已達40000PB(1PB=1024TB)。大數據時代的到來,徹底改變了圖書館的數據環(huán)境、決策方法、服務模式和運算方式,如何利用大數據的知識挖掘實現服務資源優(yōu)化和保障能力提升,已成為關系圖書館大數據決策與服務有效性的關鍵因素。
首先,隨著讀者個性化閱讀需求和用戶服務模式的變革,圖書館數據中心的安全需求、系統復雜度、管理難度和運營成本呈現級數增長,對數據中心的智能、自動化管理提出了新要求。其次,圖書館管理人員的技術水平和管理方法已不適應大數據環(huán)境需要,需要提高相關技術人員的大數據平臺構建、數據挖掘與分析軟件開發(fā)、大數據資源管控和精確決策能力。第三,讀者大數據個性化服務對圖書館服務決策水平提出了新要求,要求管理層在大數據分析、決策過程中,應將傳統經驗決策模式轉變?yōu)橐罁髷祿臎Q策模式。第四,大數據資源的采集與整合過程是否全面、系統、及時和高價值密度,是關系圖書館用戶服務安全、精確、即時和滿意的關鍵因素。因此,圖書館必須有效采集來自館內外的讀者數據,并對所有數據進行發(fā)現處理、深度挖掘、分析整合和價值提取。
(2)大數據資源的可靠性與可用性問題。首先,圖書館大數據資源庫收集的用戶數據中,還包括移動服務商、有線傳輸運營商、互聯網站、政府機構等第三方協作部門的共享數據,圖書館無法有效判斷與控制第三方共享數據的真實性、準確性、可用性和價值密度。其次,圖書館讀者群數量龐大且所采集數據類型復雜,導致大數據資源普遍存在著數據價值稀疏性和多維性,對大數據平臺系統的規(guī)模、性能和分析算法效率提出了較高要求。同時,多維數據挖掘在提高讀者閱讀體驗愉悅感和服務深度的同時,也大幅度增加了大數據處理、分析平臺的負荷。第三,大數據時代,RFID射頻數據、傳感器網絡、服務器監(jiān)控系統、社交網絡交互數據、第三方運營商數據成為圖書館大數據資源采集的主要對象,半結構化與非結構化數據占據所采集數據的絕大多數,嚴重影響了大數據資源的存儲、管理和標準化有效性。第四,圖書館大數據源的開放性、價值密度、數據采集方法和讀者隱私保護需求,也影響著大數據資源的可靠性與可用性。[2]
(3)大數據資源信息的可表示與可融合性。首先,大數據時代圖書館大數據平臺的數據源、采集方法及對象具有復雜、多樣性,數據總體呈現異質、異構、半結構化、非結構化和不可信等特征,且大數據資源庫的非結構化數據比例和結構復雜度,隨著讀者群數量和用戶服務需求增長呈現快速遞增趨勢,現在的數據表示方法已不能完全、準確地表達數據的結構特點和自身意義。其次,依靠增加數據中心基礎設備數量來提高數據處理能力的傳統模式,已不適應圖書館大數據動態(tài)資源獲取、存儲、組織、分析和決策的需求,必須通過多種學科、技術的有效結合,才能滿足新的數據采集、處理、存儲、管理、分析和決策需求。第三,大數據資源總量的快速增長、新數據類型的出現和結構復雜化,大幅增加了數據融合和價值發(fā)現的難度,嚴重影響著圖書館大數據資源信息表示與融合的有效性。
(4)大數據平臺對用戶行為分析、預測和決策的有效性。首先,大數據環(huán)境下,圖書館對用戶個性化服務數據分析具有安全、準確、高效和實時的需求。大數據平臺在數據處理與增量計算過程中,如何有效控制算法的時間與空間復雜性,實現算法時間與空間復雜性、運算過程系統資源損耗、用戶個性化服務滿意度的最優(yōu)化結合,是提高圖書館大數據平臺用戶個性化智慧服務有效性的關鍵。其次,基于讀者個性化服務需求的用戶行為挖掘、分析和預測活動,是關系讀者大數據個性化服務質量和復雜環(huán)境閱讀滿意度的重要因素。因此,讀者行為的大數據個性化分析應涉及用戶歷史閱讀活動、個體特征和閱讀社會關系、個性化閱讀需求與行為差異性、閱讀滿意度評估與服務策略修正等內容。第三,用戶大數據個性化服務系統應具備較強的安全性和公正性。圖書館不能因為自身利益等因素,而弱化讀者個性化閱讀需求在大數據推薦服務中的決定性因素。此外,圖書館還需從大數據個性化服務推送的安全性、準確度、多樣性、經濟性和用戶反饋等方面評估大數據平臺性能,從而提高平臺的科學性、可用性、經濟性和可控性。
2.1圖書館大數據個性化服務的體系架構
圖書館用戶大數據個性化服務的體系架構主要由感知層、存儲層、組織層、分析層和決策層五部分組成。感知層主要由數據中心系統監(jiān)控器、視頻監(jiān)控器、RFID設備、數碼相機、網絡監(jiān)控器和傳感器組成,負責采集關系數據中心系統運行和讀者大數據閱讀行為的數據。存儲層主要存儲感知層采集的結構化、半結構化和非結構化數據。組織層通過對數據庫中數據的結構特征進行分析、處理,從數據組織方式的角度來描述信息。分析層利用數據統計分析、語義
分析、可視化分析、圖形分析、預測性分析和數據挖掘等手段,高效、精確地從海量的數據中自動搜索、發(fā)現隱藏于其中的特殊關系和知識。決策層基于分析層的處理結果,對圖書館的系統運營管理和讀者大數據個性化服務進行決策支持。同時,對管理與服務決策結果有效性進行評估和優(yōu)化。
2.2大數據時代圖書館個性化智慧服務的構建策略
(1)對圖書館大數據規(guī)模與數據可用性進行評估。圖書館大數據的規(guī)模、價值密度、數據可用性和應用程度,是關系大數據時代圖書館個性化智慧服務體系結構科學性和服務效率的關鍵因素。因此,在圖書館個性化智慧服務體系構建之初,必須對其大數據規(guī)模與數據可用性進行評估。
對圖書館大數據規(guī)模與數據可用性的評估,可劃分為五個階段進行判定。①對圖書館收集的服務系統運行數據、讀者群特征與閱讀關系數據、讀者閱讀行為數據、讀者閱讀需求數據廣度和深度的判定,以及數據的規(guī)模能否滿足圖書館進行大數據分析、判斷和決策需要。②對圖書館大數據資源數據整合活動的科學性、規(guī)范化、有效性和經濟性評估。③對大數據資源能否實現多用戶共享,大數據決策能否滿足圖書館管理、服務和讀者個性化閱讀QOS(服務質量保障)需求的評估。④圖書館通過對讀者大數據資源進行個性化分析,依據用戶個體特征和閱讀需求將讀者劃分為不同的用戶群,為讀者提供大量經濟、個性化的客戶定制產品和服務。⑤對圖書館能否建立科學、高效的大數據分析體系,能否利用大數據進行運營安全與效率、服務與管理能力、應急處理和安全防范能力、市場競爭的決策,以及對服務策略的評估和優(yōu)化。[3]
(2)準確定位讀者的大數據個性化智慧服務需求??梢罁杉挠脩舸髷祿畔?,實時掌握讀者閱讀活動的位置、內容、習慣、興趣和社會關系,是圖書館及時、快速、準確地判斷讀者個性化特征、定位個性化閱讀需求、提升服務品質和降低服務成本的關鍵。
首先,大數據時代數據已成為圖書館的重要資產和競爭力來源,而大數據海量、結構復雜、價值密度低和處理速度需求快的特點,嚴重影響了圖書館將大數據資源轉變?yōu)樯a力的有效性。因此,大數據分析引擎在用戶數據分析、系統建模和交互過程中,應增強系統可反饋性、用戶互動性和自主學習的功能,保證讀者個性化服務需求分析結果可依據用戶大數據特征信息變化趨勢而動態(tài)變化。其次,為了提高個性化智慧服務推薦的準確性、針對性和實時性,圖書館在大數據分析前應通過高效的數據過濾和價值挖掘,大幅度減少用戶數據的總量和增強數據價值密度,努力提高讀者大數據個性化智慧服務推送的效率、實時性和精確性。第三,讀者個性化智慧服務的大數據資源采集與分析過程,不應以侵犯用戶隱私、利益和個性化閱讀愉悅感為代價,用戶應擁有對個體數據與信息采集、分析和使用的知情權和決定權。第四,圖書館在讀者大數據個性化智慧服務分析、判斷、決策與評估的過程中,應借助云計算的分布式系統和虛擬化資源調配特點,提高大數據存儲、標準化、分析和挖掘的有效性。
(3)增強圖書館的讀者個性化智慧服務能力。大數據時代,圖書館在數據中心組織模式、數據處理的方法與價值、數據處理系統的架構體系上有了根本性變化。一是數據中心功能建設從以提高計算能力向數據分析能力轉變;二是數據中心IT基礎架構從集中式架構向分布式架構演進;三是大數據平臺不同功能模塊系統之間加強了結構與功能融合。因此,圖書館應依靠大數據平臺的超級數據組織、計算、分析和判斷能力,提高讀者的個性化智慧服務能力。
首先,圖書館應依靠大數據的智慧分析、判斷和決策能力,提升圖書館市場競爭環(huán)境的適應力、用戶需求的判斷力和智慧服務能力,實現讀者個性化服務模式與內容的智慧轉變。同時,圖書館在讀者個性化智慧服務過程中,應精確發(fā)現大數據平臺、服務系統和用戶之間的內在聯系,通過大數據支持來優(yōu)化系統結構和服務模式,確保用戶服務系統具備較強的智慧發(fā)現、機器學習、人工智能與服務創(chuàng)造力。其次,圖書館的智慧服務能力評估指標與體系的構建,應涉及智慧系統、智慧管理、智慧服務、智慧讀者、智慧環(huán)境和智慧監(jiān)測六部分內容,保證圖書館在用戶個性化服務的同時,可利用大數據進行服務質量與閱讀輿情的準確監(jiān)測,并通過精準營銷來提高決策效率、防范服務風險和降低服務成本。第三,圖書館在大數據資源采集過程中,應努力擴大數據源的范圍和規(guī)模。所采集數據的內容還應包括用戶閱讀終端和服務系統之外的第三方協作商和網絡信息,確保智慧服務模型構建、競爭環(huán)境分析、用戶閱讀行為分析、個性化智慧服務廣告投放、服務咨詢、輿情與服務內容分析、服務需求預測與質量保證等活動安全、精確。
(4)保證大數據系統和讀者個人隱私安全。隨著大數據技術在圖書館應用的深入,大數據平臺所采集
的用戶個體數據量與總量增速快速增長,數據中心傳統的系統架構模式、數據存儲與計算方法,已不能滿足用戶大數據個性化智慧服務對數據中心計算性能、存儲模式和系統可擴展性的需求。如果依靠增加數據中心基礎設施資源數量的方法來提高數據處理、存儲能力,則極易導致服務系統結構復雜、整體負荷加重、負載不平衡和造成數據孤島現象。因此,必須重點關注大數據系統和讀者的個人隱私安全。
首先,大數據時代圖書館應構建分布式的系統架構,以此來降低系統運行、管理和功能擴展的成本與復雜度。同時,在大數據平臺構建中應堅持系統數據存儲與存儲分析系統、數據標準化與挖掘分析系統、數據計算與決策系統相融合的原則,實現數據存儲、分析和決策的智慧、自動化管理,保證大數據平臺運營與決策過程安全、可靠。其次,圖書館在用戶行為數據的采集、存儲、處理、分析和決策過程中應透明和向讀者公開,讀者擁有對涉及自身行為數據采集的知情權和使用決定權,并保證合理使用所采集的數據和維護用戶隱私。第三,讀者應加強閱讀終端系統、數據傳輸模式和保密數據的安全管理,提高個性化閱讀活動和保密數據的安全保障級別。
(5)構建面向大數據的讀者個性化移動閱讀服務模式。據易觀智庫的數據預測,2014年中國移動閱讀市場銷售規(guī)模將達到82.3億元,2015年移動閱讀活躍用戶將達到6.5億。因此,依據讀者個體閱讀需求差異和客戶實時閱讀行為數據,構建面向大數據的讀者個性化移動閱讀服務模式,是圖書館挖掘潛在客戶和建立穩(wěn)定客戶關系,提高用戶服務質量和市場競爭力的關鍵。
首先,圖書館應通過對用戶移動閱讀大數據信息的分析,明確讀者對移動閱讀模式和內容的需求、服務可用性的評估標準、讀者移動閱讀數據的可采集與可用性、移動閱讀需求的變化趨勢,同時,制定個性化、精確和可優(yōu)化的個性化移動閱讀服務策略。其次,圖書館應加強個性化服務推薦引擎的功能建設。推薦引擎可依據用戶移動閱讀的大數據資源分析結果,深度挖掘讀者移動閱讀的需求和開展個性化的營銷服務,在降低服務成本投入的同時,提高用戶的移動閱讀體驗。第三,圖書館在開展面向大數據的個性化移動閱讀推薦服務時,應緊密結合所采集的RFID射頻數據、傳感器數據、閱讀社交關系數據和移動運營商共享數據等大數據資源,準確還原用戶的閱讀行為和內涵,確保面向大數據的讀者個性化移動閱讀服務安全、準確、經濟和可控。第四,圖書館應根據讀者個性化移動閱讀需要,加強移動閱讀終端的功能性和可用性建設。同時,應與谷歌等第三方服務商合作,利用其已有的大數據服務平臺和互聯網搜索平臺,為讀者提供網頁搜索、圖片搜索、地圖搜索、新聞搜索、博客搜索、論壇搜索和學術搜索等個性化移動閱讀增值服務。
圖書館讀者個性化智慧服務,是依據讀者個性化特點和閱讀需求為核心,通過對服務資源進行高效收集、整合、分配與優(yōu)化而開展的一種針對性服務。與傳統被動服務模式相比,具有較高的資源利用率和讀者閱讀滿意度。
在影響圖書館用戶個性化智慧服務有效性的眾多因素中,讀者個性化閱讀需求、服務系統資源管理與運行效率、讀者群的準確劃分、營銷策略的精準性和可控性,是決定圖書館讀者個性化智慧服務質量的主要因素,而大數據技術則是準確獲取讀者需求和有效開展個性化智慧服務的重要支持技術。因此,圖書館在加強數據中心基礎設施結構科學性和運行效率的同時,必須努力提高大數據平臺在數據采集、處理、存儲、分析和決策的準確性和效率。此外,還應確保所采集的讀者閱讀行為和關系數據全面、精確和具備高價值密度,數據的存儲與處理過程高效、實時和可控,數據分析與決策結果符合讀者個性化智慧閱讀需求,并具有較強的安全性、可靠性、經濟性和可行性,才能為讀者提供滿意的大數據個性化智慧閱讀服務。
[參考文獻]
[1](英)維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2013:31-37.
[2]呂竹筠,等.信息資源管理與云服務融合的內涵及共性技術體系研究[J].情報理論與實踐, 2012,35(9):26-32.
[3]唐杰,楊洋.移動社交網絡中的用戶行為預測模型[J].中國計算機學會通訊,2012,8(5):21-25.
[收稿日期]2013-09-22 [責任編輯]菊秋芳
[作者簡介]陳臣(1974-),男,陜西西安人,碩士,工程師,研究方向:大數據、數字圖書館建設。
[文章編號]1005-8214(2015)02-0096-04
[文獻標志碼]A
[中圖分類號]G252.0;G250.73