袁先文,程結(jié)晶(揚(yáng)州大學(xué)社會(huì)發(fā)展學(xué)院)
數(shù)據(jù)已經(jīng)成為世界上最有價(jià)值的資源[1],在大數(shù)據(jù)環(huán)境下,數(shù)據(jù)資源呈指數(shù)級(jí)增長(zhǎng)趨勢(shì),數(shù)據(jù)素養(yǎng)是社會(huì)大眾適應(yīng)現(xiàn)代社會(huì)發(fā)展的必備素養(yǎng)。目前,已有許多圖書(shū)館從數(shù)據(jù)科學(xué)角度出發(fā)開(kāi)展數(shù)據(jù)素養(yǎng)教育,主要以數(shù)據(jù)管理系列課程、在線課堂、實(shí)踐指南、專題研討會(huì)等方式開(kāi)展,內(nèi)容涉及數(shù)據(jù)共享、數(shù)據(jù)處理、元數(shù)據(jù)、數(shù)據(jù)科學(xué)、數(shù)據(jù)科學(xué)管理、數(shù)據(jù)分析工具、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘,以及高校圖書(shū)館員在目前研究生數(shù)據(jù)管理和數(shù)據(jù)策展能力培養(yǎng)中的作用與角色和數(shù)據(jù)素養(yǎng)教育實(shí)踐中的實(shí)施主體、前期計(jì)劃調(diào)研、教學(xué)設(shè)計(jì)、實(shí)施方式、結(jié)果評(píng)估等,此外還有圖書(shū)館為用戶提供有關(guān)數(shù)據(jù)管理的定題服務(wù)[2]。但由于用戶學(xué)科領(lǐng)域、知識(shí)結(jié)構(gòu)、研究方向、科研環(huán)境的差異以及各圖書(shū)館對(duì)數(shù)據(jù)素養(yǎng)存在不同的認(rèn)識(shí)與理解,目前的數(shù)據(jù)素養(yǎng)相關(guān)研究仍存在不足。因此,本研究在探討圖書(shū)館與用戶數(shù)據(jù)、數(shù)據(jù)素養(yǎng)以及數(shù)據(jù)共享空間相關(guān)文獻(xiàn)研究的基礎(chǔ)上,構(gòu)建圖書(shū)館用戶數(shù)據(jù)共享空間模型,以期為圖書(shū)館塑造以用戶需求為中心的服務(wù)環(huán)境、提高數(shù)據(jù)素養(yǎng)能力、培養(yǎng)新型智慧人才提供參考。
國(guó)外數(shù)據(jù)素養(yǎng)研究起步較早,已經(jīng)形成了較為成熟的數(shù)據(jù)素養(yǎng)培育體系,且研究重點(diǎn)偏向于實(shí)踐應(yīng)用領(lǐng)域,主要涉及數(shù)據(jù)素養(yǎng)意識(shí)、數(shù)據(jù)素養(yǎng)技術(shù)平臺(tái)等方面,尤其重視圖書(shū)館作為主體在數(shù)據(jù)素養(yǎng)教育過(guò)程中的角色定位研究。如,弗吉尼亞大學(xué)圖書(shū)館深入教學(xué)團(tuán)隊(duì)開(kāi)展數(shù)據(jù)素養(yǎng)能力培訓(xùn),并針對(duì)特定學(xué)科進(jìn)行了數(shù)據(jù)認(rèn)知素養(yǎng)分類介紹[3]。
國(guó)內(nèi)對(duì)于數(shù)據(jù)素養(yǎng)的探討主要集中于數(shù)據(jù)素養(yǎng)內(nèi)涵、課程內(nèi)容設(shè)計(jì)、影響因素與發(fā)展策略等理論研究方面。司莉等調(diào)研了iSchool聯(lián)盟院校圖書(shū)情報(bào)專業(yè)的數(shù)據(jù)素養(yǎng)課程設(shè)置情況,從調(diào)查結(jié)果和課程設(shè)置的特征角度進(jìn)行分析[4];沈玖玖等以南昌大學(xué)為例,基于教師專業(yè)素養(yǎng)、教學(xué)方式、教育資源環(huán)境、教學(xué)內(nèi)容四個(gè)因素構(gòu)建了數(shù)據(jù)素養(yǎng)影響因素模型[5];張靜波提出,大數(shù)據(jù)時(shí)代數(shù)據(jù)素養(yǎng)的發(fā)展策略主要包括借鑒國(guó)外的成果和經(jīng)驗(yàn)展開(kāi)多種方式教學(xué)、掌握我國(guó)數(shù)據(jù)素養(yǎng)發(fā)展態(tài)勢(shì)、采取多方協(xié)同發(fā)展的管理機(jī)制[6];隆茜構(gòu)建了數(shù)據(jù)素養(yǎng)能力指標(biāo)體系,并基于該體系對(duì)大學(xué)教師、本科生、研究生群體的數(shù)據(jù)素養(yǎng)能力現(xiàn)狀開(kāi)展調(diào)查[7]。
綜上,國(guó)內(nèi)外已經(jīng)開(kāi)展了部分?jǐn)?shù)據(jù)素養(yǎng)相關(guān)的理論與應(yīng)用研究,研究角度各有側(cè)重,均取得了一定的研究成果。但是隨著新技術(shù)的日新月異,用戶的數(shù)據(jù)素養(yǎng)需求逐步呈現(xiàn)出個(gè)體差異,現(xiàn)有的數(shù)據(jù)素養(yǎng)培養(yǎng)方式與用戶需求不適應(yīng)等問(wèn)題日益凸顯,具體表現(xiàn)為以下三個(gè)方面:①數(shù)據(jù)素養(yǎng)培育模式較為單一,一般僅由教師或館員單向推廣,不能夠根據(jù)學(xué)科領(lǐng)域、興趣以及用戶自身的數(shù)據(jù)素養(yǎng)水平進(jìn)行分類教學(xué);②缺乏數(shù)據(jù)管理與分析技術(shù)的實(shí)踐培訓(xùn),缺少可供用戶與館員相互交流的共享系統(tǒng)平臺(tái),且未將數(shù)據(jù)素養(yǎng)與圖書(shū)館業(yè)務(wù)和資源進(jìn)行深度結(jié)合;③數(shù)據(jù)素養(yǎng)的培育缺乏系統(tǒng)性與層次性,未考慮到數(shù)據(jù)管理的周期性與科學(xué)性。因此,本研究擬從圖書(shū)館用戶數(shù)據(jù)共享空間的角度出發(fā),旨在打破空間限制,依據(jù)動(dòng)態(tài)變化的用戶環(huán)境靈活調(diào)整服務(wù)策略,從而更好地滿足差異化、智能化的數(shù)據(jù)素養(yǎng)需求。
20世紀(jì)90年代初期,信息共享空間理論被引入人文社會(huì)科學(xué)領(lǐng)域,自此開(kāi)始,圖書(shū)館界對(duì)于“共享空間”進(jìn)行了廣泛研究和實(shí)踐探索。隨著信息社會(huì)的發(fā)展,圖書(shū)館空間的發(fā)展逐步走向多元化,衍生出了智慧學(xué)習(xí)空間、知識(shí)共享空間、創(chuàng)客空間等多種模式。受e-Science環(huán)境下密集型科研的影響,在面對(duì)大量龐雜無(wú)序的數(shù)據(jù)時(shí),科研人員亟需一個(gè)穩(wěn)定而靈活的數(shù)據(jù)平臺(tái)來(lái)解決在科研數(shù)據(jù)生命周期中遇到的相關(guān)問(wèn)題。
為了應(yīng)對(duì)這種情況,數(shù)據(jù)共享空間(Data Commons,DC)應(yīng)運(yùn)而生,其主要應(yīng)用于公共服務(wù)、教育以及醫(yī)學(xué)等相關(guān)領(lǐng)域。美國(guó)國(guó)家癌癥研究所的基因組數(shù)據(jù)共享(Genomic Data Commons,GDC)項(xiàng)目是一個(gè)用于癌癥研究計(jì)劃中基因組和臨床數(shù)據(jù)的導(dǎo)入和標(biāo)準(zhǔn)化的數(shù)據(jù)共享平臺(tái),作為一個(gè)數(shù)據(jù)庫(kù)工具或可擴(kuò)展的知識(shí)網(wǎng)絡(luò),GDC可實(shí)現(xiàn)跨癌癥基因組研究的數(shù)據(jù)共享,以支持精密醫(yī)學(xué)[8]。美國(guó)國(guó)家科學(xué)基金會(huì)生物科學(xué)局資助的CyVerse平臺(tái)是一個(gè)提供數(shù)據(jù)存儲(chǔ)、生物信息學(xué)工具、圖像分析、云服務(wù)、API等服務(wù),以處理龐大的數(shù)據(jù)集并進(jìn)行復(fù)雜分析的網(wǎng)絡(luò)基礎(chǔ)設(shè)施平臺(tái)[9]。目前,國(guó)外對(duì)于數(shù)據(jù)共享空間的研究主要圍繞其管理和控制、框架構(gòu)建、實(shí)踐發(fā)展、相關(guān)法律政策等方面展開(kāi)。
國(guó)內(nèi)對(duì)于數(shù)據(jù)共享空間的研究相對(duì)較少,主要集中于對(duì)國(guó)外數(shù)據(jù)共享空間建設(shè)的經(jīng)驗(yàn)介紹和數(shù)據(jù)共享平臺(tái)的建設(shè)方面。吳雅威等分析了國(guó)外不同領(lǐng)域數(shù)據(jù)共享空間建設(shè)的典型案例,并提出了數(shù)據(jù)共享空間功能框架[10];張計(jì)龍等以復(fù)旦大學(xué)社會(huì)科學(xué)共享平臺(tái)為例,在介紹其主要功能的基礎(chǔ)上提出了有針對(duì)性的建議[11];鄧仲華等從用戶應(yīng)用層、數(shù)據(jù)服務(wù)層、平臺(tái)管理層、數(shù)據(jù)資源層四個(gè)層面構(gòu)建了“互聯(lián)網(wǎng)+”環(huán)境下的科學(xué)數(shù)據(jù)共享平臺(tái)的框架模型[12]。但是,在已有研究中鮮見(jiàn)關(guān)于將數(shù)據(jù)共享空間理論應(yīng)用于圖書(shū)館領(lǐng)域的探索,尤其是對(duì)基于數(shù)據(jù)素養(yǎng)服務(wù)的圖書(shū)館用戶數(shù)據(jù)共享空間的定義和內(nèi)涵還沒(méi)有特別詳細(xì)的闡述。
目前,國(guó)內(nèi)對(duì)于用戶數(shù)據(jù)的研究主要集中在用戶數(shù)據(jù)的定義和內(nèi)涵、用戶數(shù)據(jù)權(quán)利、用戶數(shù)據(jù)隱私保護(hù)、用戶數(shù)據(jù)溯源體系等方面。黃國(guó)彬等通過(guò)對(duì)用戶數(shù)據(jù)相關(guān)研究的梳理和內(nèi)涵的界定,劃分了用戶數(shù)據(jù)的十四種基本類型[13];謝珍等在闡述智慧圖書(shū)館視角下用戶數(shù)據(jù)與隱私權(quán)保護(hù)兩者矛盾的基礎(chǔ)上,提出了用戶數(shù)據(jù)應(yīng)用與隱私保護(hù)之間的平等原則與平衡方案[14];陸康等對(duì)我國(guó)的《中華人民共和國(guó)網(wǎng)絡(luò)安全法》與歐盟的《一般數(shù)據(jù)保護(hù)條例》中關(guān)于數(shù)據(jù)隱私、用戶信息權(quán)的條款進(jìn)行比較分析,并提出了其對(duì)智慧圖書(shū)館的啟示[15];殷建立等在用戶數(shù)據(jù)溯源分析的基礎(chǔ)上構(gòu)建了溯源管理體系,包括溯源管理模式、技術(shù)支撐體系、政策法規(guī)保障體系、追蹤溯源管理平臺(tái)四部分[16];王忠對(duì)有獎(jiǎng)勵(lì)和無(wú)獎(jiǎng)勵(lì)兩種情形進(jìn)行了細(xì)分并建立舉報(bào)隱私泄露模型,比較分析不同舉報(bào)行為的收益,進(jìn)而完善用戶數(shù)據(jù)隱私泄露舉報(bào)機(jī)制[17];馬蘭夢(mèng)等基于學(xué)科背景、用戶類型、重要用戶以及需求峰谷四個(gè)維度對(duì)圖書(shū)館科技查新用戶數(shù)據(jù)進(jìn)行分析,并結(jié)合其需求特征提出精準(zhǔn)查新服務(wù)策略[18]。
可見(jiàn),以上研究成果主要探討的是用戶數(shù)據(jù)隱私安全方面的問(wèn)題,對(duì)于將用戶數(shù)據(jù)與圖書(shū)館數(shù)據(jù)服務(wù)相結(jié)合方面的研究還不夠全面。鑒于已有經(jīng)驗(yàn)與相關(guān)研究成果,筆者認(rèn)為,本研究所探討的用戶數(shù)據(jù)是用戶在享受圖書(shū)館知識(shí)與數(shù)據(jù)服務(wù)的過(guò)程中產(chǎn)生的行為數(shù)據(jù)痕跡,包括用戶基本數(shù)據(jù)、行為數(shù)據(jù)、情感狀態(tài)數(shù)據(jù)等,這些數(shù)據(jù)是建立用戶興趣模板、實(shí)現(xiàn)圖書(shū)館智慧化資源推薦服務(wù)的基本要素。
黨的十八屆五中全會(huì)首次提出“國(guó)家大數(shù)據(jù)戰(zhàn)略”,并發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,指出“數(shù)據(jù)已成為國(guó)家基礎(chǔ)性戰(zhàn)略資源”[19],數(shù)據(jù)的應(yīng)用前景被廣泛認(rèn)識(shí)。用戶數(shù)據(jù)作為數(shù)據(jù)社會(huì)環(huán)境的組成部分,也發(fā)揮著重要的作用。如果說(shuō)信息素養(yǎng)是信息社會(huì)不可或缺的一種能力,那么數(shù)據(jù)素養(yǎng)則可視為大數(shù)據(jù)時(shí)代用戶開(kāi)展研究與交流的能力,對(duì)于新形勢(shì)下信息素養(yǎng)能力的不足之處輔以豐富的補(bǔ)充。
用戶的數(shù)據(jù)技能和數(shù)據(jù)管理能力是其數(shù)據(jù)素養(yǎng)的外在表現(xiàn),用戶數(shù)據(jù)技能與數(shù)據(jù)素養(yǎng)教育主體、數(shù)據(jù)素養(yǎng)教育資源的投入、教育方式、專業(yè)領(lǐng)域等均存在一定的聯(lián)系。如,數(shù)據(jù)素養(yǎng)教育主體越多元(以圖書(shū)館為主導(dǎo)、其他技術(shù)部門(mén)為輔),數(shù)據(jù)素養(yǎng)教育的資源投入度、數(shù)據(jù)技能培訓(xùn)課程就越豐富,相應(yīng)地,用戶了解與利用數(shù)據(jù)的機(jī)會(huì)和數(shù)據(jù)管理能力就越高。而且教育方式越多樣越能更好地滿足用戶的數(shù)據(jù)需求,更好地促進(jìn)其數(shù)據(jù)技能快速提升[20]。此外,需要注意數(shù)據(jù)與文獻(xiàn)不同,不同領(lǐng)域的用戶數(shù)據(jù)差距很大,如自然科學(xué)領(lǐng)域的用戶往往偏向于利用數(shù)據(jù)分析工具來(lái)處理獲取的數(shù)據(jù)。
從社會(huì)發(fā)展的角度來(lái)看,全面提升社會(huì)的整體數(shù)據(jù)素養(yǎng)需要從用戶個(gè)體到團(tuán)體再到整個(gè)社會(huì)進(jìn)行不斷推廣,而圖書(shū)館作為數(shù)據(jù)與知識(shí)的重要載體,其在數(shù)據(jù)管理與服務(wù)方面具有先天優(yōu)勢(shì),因此圖書(shū)館可充分發(fā)揮主導(dǎo)作用,并聯(lián)合社會(huì)其他圖書(shū)情報(bào)機(jī)構(gòu),共同促進(jìn)社會(huì)數(shù)據(jù)素養(yǎng)教育泛在化。盡管數(shù)據(jù)素養(yǎng)的培育可以從多個(gè)方面展開(kāi),但其落腳點(diǎn)始終在于提升用戶的數(shù)據(jù)素養(yǎng)能力,通過(guò)個(gè)體向團(tuán)體進(jìn)行傳播,積極提升社會(huì)對(duì)數(shù)據(jù)素養(yǎng)的重視,并最終推動(dòng)數(shù)據(jù)素養(yǎng)環(huán)境的形成。
隨著社會(huì)信息化和智能化程度的快速提升,技術(shù)環(huán)境也發(fā)生了巨大的變化,大數(shù)據(jù)作為一種新的理念和技術(shù),對(duì)現(xiàn)代生活產(chǎn)生著重要影響[21]。數(shù)據(jù)共享空間是大數(shù)據(jù)時(shí)代的新興產(chǎn)物,它將數(shù)據(jù)、方法和用戶需求三者最大限度地融合起來(lái)并集中管理,為用戶提供數(shù)據(jù)收集、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)監(jiān)護(hù)、數(shù)據(jù)分析、數(shù)據(jù)共享、數(shù)據(jù)創(chuàng)新等多種功能[22]。需要注意的是,在利用大數(shù)據(jù)技術(shù)促使用戶數(shù)據(jù)收集變得更加全面高效的同時(shí),也要考慮大數(shù)據(jù)可能給用戶帶來(lái)數(shù)據(jù)泄露的風(fēng)險(xiǎn)。
一方面,用戶數(shù)據(jù)是數(shù)據(jù)共享空間開(kāi)展用戶深層次服務(wù)的前提。圖書(shū)館數(shù)據(jù)服務(wù)逐步以用戶為中心,以用戶為中心不僅要幫助用戶參與數(shù)據(jù)采集、分析、共享與發(fā)布等數(shù)據(jù)管理過(guò)程,還應(yīng)主動(dòng)為用戶提供更深層次的增值服務(wù),這就要求圖書(shū)館不能僅對(duì)用戶數(shù)據(jù)進(jìn)行淺層次的汲取,還要依靠數(shù)據(jù)管理模式的精準(zhǔn)呈現(xiàn)促使用戶充分表達(dá)其需求,實(shí)現(xiàn)對(duì)用戶行為規(guī)律的實(shí)時(shí)感知和深入挖掘。數(shù)據(jù)共享空間的用戶數(shù)據(jù)主要包括:用戶利用圖書(shū)館數(shù)據(jù)資源的日志記錄、用戶使用分析工具的記錄、用戶瀏覽數(shù)據(jù)共享空間動(dòng)態(tài)的記錄等,只有實(shí)現(xiàn)了對(duì)用戶數(shù)據(jù)足跡的識(shí)別和抓取,才能更有效地拓展數(shù)據(jù)共享空間的服務(wù)與功能,增加用戶黏度。
另一方面,數(shù)據(jù)共享空間必須考慮對(duì)用戶隱私數(shù)據(jù)和機(jī)密數(shù)據(jù)的保護(hù)。密集型數(shù)據(jù)環(huán)境在推動(dòng)社會(huì)發(fā)展的同時(shí),也對(duì)數(shù)據(jù)安全提出了一些新的要求。用戶在使用數(shù)據(jù)共享空間的數(shù)據(jù)管理與共享功能的過(guò)程中,往往會(huì)在數(shù)據(jù)引用、數(shù)據(jù)著錄格式、數(shù)據(jù)使用政策等方面涉及隱私安全問(wèn)題,因此,數(shù)據(jù)共享空間責(zé)任主體(如圖書(shū)館)、相關(guān)科研機(jī)構(gòu)及政府需要制定元數(shù)據(jù)標(biāo)準(zhǔn)和用戶控制規(guī)則,并建立相關(guān)匿名協(xié)議來(lái)實(shí)現(xiàn)透明化用戶數(shù)據(jù)管理,防止數(shù)據(jù)濫用。數(shù)據(jù)共享空間需要關(guān)注用戶數(shù)據(jù)匿名化,最大程度地保護(hù)用戶隱私和規(guī)避知識(shí)產(chǎn)權(quán)問(wèn)題。
數(shù)據(jù)素養(yǎng)和數(shù)據(jù)共享空間是當(dāng)前圖書(shū)情報(bào)領(lǐng)域研究的重要課題,隨著數(shù)據(jù)素養(yǎng)教育的不斷拓展和數(shù)據(jù)共享空間研究的逐步深入,二者因?yàn)椤皵?shù)據(jù)”這一紐帶而產(chǎn)生的聯(lián)系更為密切。數(shù)據(jù)共享空間的目標(biāo)之一是提升用戶的數(shù)據(jù)素養(yǎng),數(shù)據(jù)共享空間可將數(shù)據(jù)資源與數(shù)據(jù)處理工具相結(jié)合,分析用戶科研與服務(wù)過(guò)程中可能存在的問(wèn)題,并利用多樣化的數(shù)據(jù)服務(wù)方式來(lái)滿足用戶數(shù)據(jù)素養(yǎng)需求,幫助用戶真正認(rèn)識(shí)到數(shù)據(jù)素養(yǎng)與科研數(shù)據(jù)管理服務(wù)之間的關(guān)系,從而提高對(duì)于數(shù)據(jù)素養(yǎng)的重視度。數(shù)據(jù)共享空間是圖書(shū)館數(shù)據(jù)素養(yǎng)服務(wù)的應(yīng)用與體現(xiàn),是數(shù)據(jù)素養(yǎng)服務(wù)的一種載體。
綜上,本研究基于圖書(shū)館領(lǐng)域用戶數(shù)據(jù)、數(shù)據(jù)素養(yǎng)、數(shù)據(jù)共享空間三者間的內(nèi)在關(guān)聯(lián),將三者的概念有機(jī)融合,提出圖書(shū)館用戶數(shù)據(jù)共享空間的新構(gòu)想:圖書(shū)館用戶數(shù)據(jù)共享空間是將物理空間和虛擬空間相結(jié)合的一種以物理空間(圖書(shū)館主體空間)為基礎(chǔ)、大數(shù)據(jù)技術(shù)為手段,滿足用戶數(shù)據(jù)服務(wù)需求和學(xué)習(xí)交流需求的空間。
數(shù)據(jù)素養(yǎng)教育和圖書(shū)館用戶數(shù)據(jù)共享空間的目標(biāo)都是為滿足用戶數(shù)據(jù)需求、培養(yǎng)用戶數(shù)據(jù)分析與利用能力,同時(shí),二者都是在大數(shù)據(jù)開(kāi)放獲取環(huán)境和以數(shù)據(jù)為核心的新型范式下逐步發(fā)展起來(lái)的,二者之間的結(jié)合是可行、合理的。
數(shù)據(jù)素養(yǎng)教育與圖書(shū)館用戶數(shù)據(jù)共享空間的構(gòu)建都需要依托一定的數(shù)據(jù)基礎(chǔ)環(huán)境。用戶數(shù)據(jù)素養(yǎng)的培育不能僅僅依靠理論課程知識(shí),還應(yīng)融入特定的實(shí)踐環(huán)境中,如培養(yǎng)用戶的數(shù)據(jù)意識(shí)需要用戶對(duì)特定數(shù)據(jù)環(huán)境進(jìn)行感知,提高其主動(dòng)利用數(shù)據(jù)的能力。隨著手機(jī)、電子閱讀器、平板電腦等智能終端的不斷普及,用戶更加注重情境體驗(yàn),圖書(shū)館用戶數(shù)據(jù)共享空間則恰好可依托大數(shù)據(jù)、智能設(shè)備、人工智能技術(shù)等為用戶提供智慧化體驗(yàn)環(huán)境。智能環(huán)境還可以幫助用戶隨時(shí)隨地學(xué)習(xí)數(shù)據(jù)素養(yǎng)課程或者進(jìn)行數(shù)據(jù)在線分析,形成與用戶相伴隨行的個(gè)人學(xué)習(xí)空間,在潛移默化中提升用戶的數(shù)據(jù)素養(yǎng)。此外,通過(guò)智能化、情境感知的信息網(wǎng)絡(luò),將圖書(shū)館實(shí)體空間與虛擬空間的數(shù)據(jù)資源相融合,為用戶提供一個(gè)交互性、智能化、體驗(yàn)性的圖書(shū)館用戶數(shù)據(jù)共享空間環(huán)境。
當(dāng)前,人工智能科技產(chǎn)業(yè)的發(fā)展勢(shì)如破竹,圖書(shū)館用戶數(shù)據(jù)共享空間也應(yīng)考慮在智能維度上通過(guò)人工智能技術(shù)打造智能化數(shù)據(jù)素養(yǎng)服務(wù)體系。其具體實(shí)現(xiàn)路徑為“數(shù)據(jù)收集—數(shù)據(jù)發(fā)現(xiàn)—數(shù)據(jù)分析—服務(wù)交互—問(wèn)題解決”:借助智能感知設(shè)備收集并整理用戶行為和情感數(shù)據(jù);依靠機(jī)器學(xué)習(xí)、數(shù)據(jù)關(guān)聯(lián)等相關(guān)技術(shù)將數(shù)據(jù)資源層的各類數(shù)據(jù)與用戶數(shù)據(jù)進(jìn)行實(shí)體、屬性、關(guān)系描述,為不同來(lái)源的數(shù)據(jù)之間建立連接,從而構(gòu)建由各個(gè)最小知識(shí)單元組成的知識(shí)網(wǎng)絡(luò),完成數(shù)據(jù)發(fā)現(xiàn)和分析過(guò)程;通過(guò)設(shè)置智能數(shù)據(jù)聚合社區(qū)、智能數(shù)據(jù)資源推送等服務(wù)模塊促進(jìn)用戶與圖書(shū)館用戶數(shù)據(jù)共享空間相互交互;通過(guò)用戶評(píng)價(jià)反饋對(duì)問(wèn)題解決的效果進(jìn)行核查。
數(shù)據(jù)素養(yǎng)教育和圖書(shū)館用戶數(shù)據(jù)共享空間均要考慮用戶的數(shù)據(jù)需求,但又各有不同:數(shù)據(jù)素養(yǎng)教育在了解不同用戶群體需求的基礎(chǔ)上,針對(duì)性地開(kāi)展數(shù)據(jù)素養(yǎng)服務(wù),常見(jiàn)的分類是面向不同層次(本科生、碩士生、科研人員)或不同學(xué)科的用戶,但缺乏對(duì)單個(gè)用戶精準(zhǔn)需求的抓??;圖書(shū)館用戶數(shù)據(jù)共享空間是面向用戶的智慧化數(shù)據(jù)服務(wù),需要對(duì)用戶的隱性需求進(jìn)行深度挖掘與匹配,從而為用戶提供更為精準(zhǔn)的服務(wù)。用戶數(shù)據(jù)共享空間的用戶需求獲取主要通過(guò)三個(gè)步驟完成:①用戶在注冊(cè)登錄系統(tǒng)時(shí)填寫(xiě)姓名、專業(yè)、興趣愛(ài)好等靜態(tài)信息,并通過(guò)調(diào)查問(wèn)卷、留言等方式反映自己長(zhǎng)期的需求,平臺(tái)據(jù)此初步確定用戶需求;②在用戶使用該系統(tǒng)一段時(shí)間后,平臺(tái)主動(dòng)對(duì)用戶檢索方式、瀏覽軌跡、下載與使用軟件分析記錄等動(dòng)態(tài)數(shù)據(jù)進(jìn)行收集,進(jìn)一步獲取用戶個(gè)性化需求;③根據(jù)收集的用戶行為數(shù)據(jù)信息和反饋信息對(duì)用戶重新進(jìn)行分類,比較用戶前期需求與后期行為的偏差,進(jìn)而調(diào)整服務(wù)內(nèi)容。
數(shù)據(jù)素養(yǎng)教育的最終目標(biāo)是提高用戶的數(shù)據(jù)素養(yǎng)能力。傳統(tǒng)的數(shù)據(jù)素養(yǎng)教育主要根據(jù)教學(xué)目標(biāo)來(lái)安排課程,未考慮到整個(gè)數(shù)據(jù)生命周期,而圖書(shū)館用戶數(shù)據(jù)共享空間作為一個(gè)開(kāi)放式的空間平臺(tái),主張嵌入性,即圍繞科學(xué)數(shù)據(jù)生命周期來(lái)培養(yǎng)科研人員的數(shù)據(jù)素養(yǎng)能力。科研人員的數(shù)據(jù)處理能力貫穿于數(shù)據(jù)生命周期的各個(gè)階段,如數(shù)據(jù)創(chuàng)建(查詢)與數(shù)據(jù)保存(存儲(chǔ))、數(shù)據(jù)分析、數(shù)據(jù)引用與數(shù)據(jù)共享等。在圖書(shū)館用戶數(shù)據(jù)共享空間中,主要由數(shù)據(jù)服務(wù)層內(nèi)數(shù)據(jù)共享服務(wù)的部分模塊來(lái)體現(xiàn)數(shù)據(jù)生命周期環(huán)節(jié)(見(jiàn)下表)。
表 涉及數(shù)據(jù)生命周期環(huán)節(jié)的數(shù)據(jù)素養(yǎng)能力維度分析
綜上,筆者以圖書(shū)館內(nèi)外部的數(shù)據(jù)資源作為數(shù)據(jù)基礎(chǔ)環(huán)境、以智能平臺(tái)為依托,連通虛擬空間與實(shí)體空間,將數(shù)據(jù)生命周期的各個(gè)環(huán)節(jié)嵌入圖書(shū)館用戶數(shù)據(jù)共享空間的模塊中,構(gòu)建了圖書(shū)館用戶數(shù)據(jù)共享空間總體設(shè)計(jì)模型,以期為用戶提供以應(yīng)用為導(dǎo)向、以能力為基礎(chǔ)的數(shù)據(jù)素養(yǎng)服務(wù),滿足用戶的數(shù)據(jù)智慧化服務(wù)需求。
圖書(shū)館用戶數(shù)據(jù)共享空間模型由感知層、數(shù)據(jù)資源層、技術(shù)處理層、數(shù)據(jù)服務(wù)層、用戶層構(gòu)成(見(jiàn)圖1)。圖書(shū)館用戶數(shù)據(jù)共享空間模型是智慧化的數(shù)據(jù)素養(yǎng)服務(wù)生態(tài)系統(tǒng),各系統(tǒng)層級(jí)之間相互影響、相互作用,共同聚焦于用戶空間化與動(dòng)態(tài)化的數(shù)據(jù)服務(wù)訴求。
圖1 圖書(shū)館用戶數(shù)據(jù)共享空間模型
感知層主要應(yīng)用于泛在化的智慧環(huán)境,通過(guò)多種情景感知設(shè)備(如攝像頭、傳感器、感官捕捉器、眼動(dòng)儀、智能機(jī)器人等)獲取用戶行為和情感的信息數(shù)據(jù),并將其存儲(chǔ)至數(shù)據(jù)資源層的感知設(shè)備數(shù)據(jù)庫(kù)中。
數(shù)據(jù)資源層主要集成社會(huì)科學(xué)類、醫(yī)療類、經(jīng)濟(jì)文化類等領(lǐng)域的開(kāi)放專題科學(xué)數(shù)據(jù)、公開(kāi)的研究報(bào)告以及相關(guān)政策法規(guī)等,具體類型包括圖書(shū)館自建特色數(shù)據(jù)、用戶提交數(shù)據(jù)、感知設(shè)備數(shù)據(jù)、外部數(shù)據(jù)(政府、企業(yè)、科研院所)、網(wǎng)絡(luò)數(shù)據(jù)等。由于該層中的數(shù)據(jù)資源具有多個(gè)種類,而將半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)標(biāo)準(zhǔn)化是實(shí)現(xiàn)數(shù)據(jù)檢索、分析與共享的前提,因此,開(kāi)發(fā)數(shù)據(jù)字典、制定全面完整的元數(shù)據(jù)標(biāo)準(zhǔn)至關(guān)重要。
技術(shù)處理層是實(shí)現(xiàn)系統(tǒng)數(shù)據(jù)處理、挖掘與分析的重要層級(jí),主要由情感計(jì)算、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、5G技術(shù)、關(guān)聯(lián)數(shù)據(jù)技術(shù)、語(yǔ)音識(shí)別等技術(shù)模塊組成。需要注意的是,各個(gè)技術(shù)模塊之間可自由結(jié)合,通過(guò)不同的組合方式為圖書(shū)館用戶數(shù)據(jù)共享空間的數(shù)據(jù)服務(wù)層提供符合各個(gè)單位實(shí)際情況的技術(shù)支撐。
數(shù)據(jù)服務(wù)層是圖書(shū)館用戶數(shù)據(jù)共享空間的核心層,主要由數(shù)據(jù)共享服務(wù)、智能服務(wù)、用戶數(shù)據(jù)服務(wù)三個(gè)模塊構(gòu)成。其中,數(shù)據(jù)共享服務(wù)模塊主要以數(shù)據(jù)為中心向用戶提供相關(guān)的數(shù)據(jù)服務(wù),智能服務(wù)模塊的主體逐步從數(shù)據(jù)轉(zhuǎn)向用戶,相應(yīng)地,數(shù)據(jù)服務(wù)也轉(zhuǎn)向更高層次的知識(shí)服務(wù)、智能服務(wù)。
(1)數(shù)據(jù)共享服務(wù)主要圍繞數(shù)據(jù)生態(tài)系統(tǒng)展開(kāi)。通過(guò)加強(qiáng)用戶在數(shù)據(jù)查詢、數(shù)據(jù)分析、數(shù)據(jù)保存、數(shù)據(jù)發(fā)布等數(shù)據(jù)管理過(guò)程的參與度來(lái)提升用戶數(shù)據(jù)素養(yǎng),實(shí)現(xiàn)數(shù)據(jù)增值與深度揭示。
(2)智能服務(wù)。當(dāng)前功能單一、僅圍繞數(shù)據(jù)開(kāi)展的服務(wù)已無(wú)法滿足用戶的多元化需求,故數(shù)據(jù)服務(wù)層的構(gòu)建必然要擴(kuò)展相關(guān)智能服務(wù)。①智能問(wèn)答咨詢主要利用自然語(yǔ)言處理、情感計(jì)算等技術(shù),以智能客服的形式與用戶進(jìn)行一對(duì)一交流,對(duì)問(wèn)答咨詢過(guò)程中用戶語(yǔ)言呈現(xiàn)出來(lái)的情緒、態(tài)度等信息進(jìn)行快速分析并給出準(zhǔn)確回復(fù);②智能在線測(cè)評(píng)可利用語(yǔ)音識(shí)別技術(shù)對(duì)學(xué)習(xí)者的數(shù)據(jù)素養(yǎng)綜合能力進(jìn)行測(cè)評(píng),幫助系統(tǒng)對(duì)用戶能力進(jìn)行科學(xué)“素描”并提供不同層次的智能培育方案;③超高清視頻直播主要依托5G技術(shù),將數(shù)據(jù)素養(yǎng)精品課程以細(xì)粒度的方式呈現(xiàn)給用戶,實(shí)現(xiàn)互動(dòng)性較強(qiáng)的“面對(duì)面”服務(wù)場(chǎng)景;④智能數(shù)據(jù)資源推送主要利用神經(jīng)網(wǎng)絡(luò)算法智能分析并抽取用戶的興趣需求,通過(guò)智能標(biāo)簽細(xì)分用戶群體,為不同群體用戶提供精準(zhǔn)推送服務(wù);⑤智能數(shù)據(jù)聚合社區(qū)即提供數(shù)據(jù)交流與共享的交互式社區(qū),該社區(qū)利用上述智能標(biāo)簽將具有相同興趣的用戶聚集在一起,通過(guò)小組討論的方式使思維相互碰撞,在虛擬社區(qū)中進(jìn)行相互協(xié)作。
(3)用戶數(shù)據(jù)服務(wù)。該模塊可幫助用戶從數(shù)據(jù)消耗者轉(zhuǎn)變?yōu)閿?shù)據(jù)創(chuàng)建者,主要圍繞用戶信息管理系統(tǒng)、注冊(cè)登錄服務(wù)、智能化培訓(xùn)、服務(wù)反饋等功能展開(kāi),其中智能化培訓(xùn)包括共享空間相關(guān)資源的運(yùn)用、分析工具的使用、相關(guān)元數(shù)據(jù)標(biāo)準(zhǔn)等指南。用戶信息管理系統(tǒng)可將用戶的數(shù)據(jù)集、相同領(lǐng)域的合作者、數(shù)據(jù)分析方法等相互關(guān)聯(lián),創(chuàng)建統(tǒng)一規(guī)范的數(shù)據(jù)標(biāo)準(zhǔn),便于他人對(duì)其數(shù)據(jù)進(jìn)行引用。
用戶層即通過(guò)接口幫助用戶進(jìn)入該系統(tǒng)的一個(gè)入口。圖書(shū)館用戶數(shù)據(jù)共享空間目前設(shè)計(jì)了三個(gè)入口,主要包括手機(jī)、Pad等智能設(shè)備及電腦等客戶端與嵌入應(yīng)用系統(tǒng)。在“大數(shù)據(jù)+移動(dòng)網(wǎng)絡(luò)+人工智能”相互聯(lián)合的環(huán)境中,用戶與數(shù)據(jù)資源、圖書(shū)館用戶數(shù)據(jù)共享空間以及終端設(shè)備三者互通互聯(lián),實(shí)現(xiàn)不同環(huán)節(jié)緊密相連的多向交互圈,滿足用戶“人人、處處、時(shí)時(shí)”的智能化學(xué)習(xí)服務(wù)。
根據(jù)圖1,筆者進(jìn)行了基于情境智能感知的圖書(shū)館用戶數(shù)據(jù)共享空間原型系統(tǒng)的設(shè)計(jì)。需要注意的是,該原型系統(tǒng)主要體現(xiàn)了圖書(shū)館用戶數(shù)據(jù)共享空間模型感知層的思想,將基于智能設(shè)備的圖書(shū)館用戶數(shù)據(jù)共享空間與實(shí)體空間通過(guò)感知層聯(lián)系在一起,借助情境感知技術(shù)和設(shè)施形成了一個(gè)虛實(shí)結(jié)合的智能學(xué)習(xí)空間,如圖書(shū)館實(shí)體空間配置的智能感知設(shè)備主要有無(wú)線傳感器、智能顯示交互系統(tǒng)、面部情感狀態(tài)捕捉設(shè)備、用戶語(yǔ)音行為捕捉設(shè)備等。智能設(shè)備獲取到的所有用戶學(xué)習(xí)狀態(tài)信息通過(guò)網(wǎng)關(guān)提交給后臺(tái)服務(wù)器,并將搜集到的用戶行為和情感數(shù)據(jù)信息反饋至智能終端的圖書(shū)館用戶數(shù)據(jù)共享空間中。對(duì)于數(shù)據(jù)素養(yǎng)教育來(lái)說(shuō),通過(guò)原型系統(tǒng)的情境感知設(shè)備對(duì)于用戶的心理狀態(tài)、動(dòng)作行為、實(shí)時(shí)情況進(jìn)行智能捕捉,全面監(jiān)控用戶以及科研人員的需求,能夠有針對(duì)性地提高用戶數(shù)據(jù)素養(yǎng)技能,如利用眼動(dòng)儀對(duì)用戶眼球注視時(shí)長(zhǎng)進(jìn)行監(jiān)測(cè),實(shí)時(shí)抓取用戶對(duì)于數(shù)據(jù)意識(shí)、數(shù)據(jù)價(jià)值以及數(shù)據(jù)應(yīng)用知識(shí)的認(rèn)知狀態(tài),從而診斷用戶的數(shù)據(jù)素養(yǎng)水平,挖掘背后更深層次的信息。
本研究通過(guò)智能代理Agent設(shè)計(jì)了基于智能設(shè)備的智能化數(shù)據(jù)資源推薦機(jī)制(見(jiàn)圖2),該機(jī)制是實(shí)現(xiàn)圖書(shū)館用戶數(shù)據(jù)共享空間交互的關(guān)鍵,由此完成用戶“需求—推薦—反饋”機(jī)制。智能化數(shù)據(jù)資源推薦的流程如下:首先,為智能感知設(shè)備收集到的用戶基本信息、用戶行為信息、用戶情感狀態(tài)信息等分別建立對(duì)應(yīng)的用戶特征數(shù)據(jù)庫(kù),構(gòu)建用戶畫(huà)像;其次,依據(jù)現(xiàn)有的元數(shù)據(jù)標(biāo)準(zhǔn)將數(shù)據(jù)資源層中各個(gè)領(lǐng)域的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并按照主題進(jìn)行聚類,挖掘數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系,將不相關(guān)的數(shù)據(jù)進(jìn)行異質(zhì)性處理;再次,通過(guò)資源匹配Agent將處理好的數(shù)據(jù)資源與用戶的特征聯(lián)系在一起,計(jì)算兩者之間的匹配值;最后,將算法Agent優(yōu)選的合適推薦策略傳送至圖書(shū)館用戶數(shù)據(jù)共享空間的智能數(shù)據(jù)資源推送模塊。
圖2 基于智能設(shè)備的數(shù)據(jù)資源推薦機(jī)制
粒度作為知識(shí)的基本組成單元,其大小是度量知識(shí)的抽象程度[23]。傳統(tǒng)的圖書(shū)館服務(wù)處理并解決的一般是粗粒度的用戶需求,僅僅提供一些基礎(chǔ)性數(shù)據(jù)服務(wù),而圖書(shū)館用戶數(shù)據(jù)共享空間可實(shí)現(xiàn)以用戶需求為導(dǎo)向的細(xì)粒度的知識(shí)服務(wù)。要實(shí)現(xiàn)用戶需求細(xì)粒度化,就要對(duì)圖書(shū)館內(nèi)外部的數(shù)據(jù)資源進(jìn)行結(jié)構(gòu)化處理,對(duì)其進(jìn)行LDA聚類分析,更加快速、徹底地挖掘內(nèi)容價(jià)值,建立基于知識(shí)層面的用戶需求網(wǎng)絡(luò),從而幫助用戶減少使用資源時(shí)的障礙,構(gòu)建“用戶需求—知識(shí)聚合”兩級(jí)映射。圖書(shū)館用戶數(shù)據(jù)共享空間的數(shù)據(jù)服務(wù)層可將數(shù)據(jù)提煉至滿足用戶的目的,為形成完備的數(shù)據(jù)服務(wù)體系奠定基礎(chǔ),使圖書(shū)館用戶數(shù)據(jù)共享服務(wù)更具針對(duì)性。
圖書(shū)館用戶數(shù)據(jù)共享空間的智能數(shù)據(jù)資源推送服務(wù)首先應(yīng)對(duì)用戶所處的環(huán)境進(jìn)行監(jiān)測(cè),如用戶應(yīng)對(duì)圖書(shū)館不同空間位置采取不同的推薦策略、選擇有針對(duì)性的推薦資源內(nèi)容。常見(jiàn)的智能設(shè)備定位技術(shù)包括Wi-Fi、GPS、iBeacon、谷歌地圖等,本研究使用GPS定位系統(tǒng)來(lái)精準(zhǔn)定位用戶位置并提供智能化服務(wù)推送。此外,可將iBeacon技術(shù)應(yīng)用于圖書(shū)館智能定位系統(tǒng),在圖書(shū)館內(nèi)部署iBeacon基站,通過(guò)統(tǒng)一的API接口將用戶智能終端與圖書(shū)館用戶數(shù)據(jù)共享空間App相連接。該技術(shù)的實(shí)現(xiàn)原理是:當(dāng)用戶打開(kāi)智能設(shè)備的藍(lán)牙功能并經(jīng)過(guò)圖書(shū)館iBeacon節(jié)點(diǎn)附近時(shí),圖書(shū)館用戶數(shù)據(jù)共享空間App會(huì)自動(dòng)接收到節(jié)點(diǎn)信號(hào)并發(fā)送至圖書(shū)館服務(wù)器,從而獲取用戶的地理位置信息[24]。目前,數(shù)據(jù)素養(yǎng)的培育主要以傳統(tǒng)的學(xué)校課程教育方式為主,而圖書(shū)館用戶數(shù)據(jù)共享空間可利用iBeacon引擎實(shí)現(xiàn)館內(nèi)定位功能,感知用戶具體位置,向其發(fā)送該節(jié)點(diǎn)位置相關(guān)的數(shù)據(jù)資源,為用戶提供情景式數(shù)據(jù)素養(yǎng)體驗(yàn)。