裴 昱
(廣東工業(yè)大學(xué)圖書館,廣東 廣州 510006)
近年來,大數(shù)據(jù)這個(gè)名詞變得越來越流行、越來越重要,成為了國(guó)家和政府層面的發(fā)展戰(zhàn)略[1]。在政府企業(yè)做出決策的過程中,經(jīng)常要參考大量數(shù)據(jù)以及以此為依據(jù)得出的結(jié)論。然而,在當(dāng)今社會(huì)中,影響決策的信息源基數(shù)與信息源所產(chǎn)生的有效數(shù)據(jù)日益增多。這些海量信息所蘊(yùn)含的大量商業(yè)價(jià)值也逐漸映入了決策者的視野。
大數(shù)據(jù)通常被認(rèn)為是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多樣的非結(jié)構(gòu)化數(shù)據(jù)[2]。針對(duì)這些海量信息,即大數(shù)據(jù)所進(jìn)行的數(shù)據(jù)倉(cāng)庫、數(shù)據(jù)安全、數(shù)據(jù)分析、數(shù)據(jù)挖掘,并從中獲得有價(jià)值信息的技術(shù),就是大數(shù)據(jù)技術(shù)。
大數(shù)據(jù)技術(shù)的意義不在于對(duì)大數(shù)據(jù)信息的搜集,而在于對(duì)龐大數(shù)據(jù)的深度處理,從中分析和挖掘出有價(jià)值的信息。例如消費(fèi)者在網(wǎng)站上的搜索記錄在亞馬遜的數(shù)據(jù)庫中,通過分析用戶的購(gòu)買行為,向用戶推薦合適的產(chǎn)品,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。在互聯(lián)網(wǎng)行業(yè),通過對(duì)接入設(shè)備、廣告、B2C業(yè)務(wù)的實(shí)時(shí)分析,從而達(dá)到不影響用戶體驗(yàn)和快速準(zhǔn)確營(yíng)銷的目的,進(jìn)而與各垂直行業(yè)發(fā)生深度融合,以帶動(dòng)社會(huì)化媒體、電子商務(wù)的蓬勃發(fā)展。在金融服務(wù)領(lǐng)域,通過對(duì)銀行發(fā)卡量、用戶具體業(yè)務(wù)數(shù)據(jù)的分析,能夠?qū)蛻粜庞妙~度進(jìn)行有效的調(diào)整。同時(shí),針對(duì)不同客戶采取不同的宣傳、營(yíng)銷策略。在能源行業(yè),能源勘探開發(fā)數(shù)據(jù)類型眾多,不同類型數(shù)據(jù)包含的信息各具特點(diǎn),綜合各種數(shù)據(jù)所包含的信息才能得出地下真實(shí)的地質(zhì)狀況。因此,它對(duì)大數(shù)據(jù)產(chǎn)品和解決方案的需求集中體現(xiàn)在:可擴(kuò)展存儲(chǔ)、高帶寬、可處理不同格式數(shù)據(jù)的分析。在醫(yī)療行業(yè),數(shù)據(jù)量主要來自于B超、病理分析等業(yè)務(wù)所產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)。通過對(duì)臨床操作的大量數(shù)據(jù),包括醫(yī)療數(shù)據(jù)、監(jiān)控影像、臨床決策、癥狀對(duì)比等的研究,可以預(yù)測(cè)或建立疾病模式。在此基礎(chǔ)上,公共衛(wèi)生部門可對(duì)全國(guó)電子病歷數(shù)據(jù)庫進(jìn)行全面的監(jiān)測(cè)和快速的響應(yīng)。
總之,大數(shù)據(jù)技術(shù)已經(jīng)滲透到我們生活的方方面面,這些種類多、基數(shù)大的海量數(shù)據(jù)蘊(yùn)涵著極大價(jià)值。作為可能產(chǎn)生海量數(shù)據(jù)并擁有眾多讀者的圖書館,具備大數(shù)據(jù)信息的來源與信息服務(wù)對(duì)象。因此,探討圖書館大數(shù)據(jù)信息的利用方式尤為必要。
首先,以不同的主體為研究對(duì)象,以不同的事件為線索,均能夠得到一系列數(shù)量龐大的流水記錄。例如,以讀者為分析對(duì)象,以讀者借閱圖書的標(biāo)準(zhǔn)流程為線索,其生成的信息依次為:讀者姓名、進(jìn)入圖書館的時(shí)間、查詢圖書的關(guān)鍵詞、目標(biāo)圖書的狀態(tài)、讀者借閱的狀態(tài)、借閱(或歸還)圖書的登記信息、離開圖書館的時(shí)間。同理,以圖書借閱登記人員為對(duì)象,同樣以圖書借閱的標(biāo)準(zhǔn)流程為線索,依次產(chǎn)生的信息為:被借閱圖書的狀態(tài)、讀者的狀態(tài)、圖書借閱的時(shí)間。
其次,除了具有這些實(shí)時(shí)生成的零散的數(shù)據(jù)流信息,圖書館還擁有館藏圖書信息、中外文論文庫信息、電子材料信息以及其他經(jīng)過整理匯總得到的資源信息。
最后,在圖書館的整體運(yùn)作過程中,有可能與學(xué)校部門、學(xué)生團(tuán)體、社會(huì)團(tuán)體、出版社產(chǎn)生一定的聯(lián)系。由此會(huì)產(chǎn)生活動(dòng)開展、場(chǎng)地租借、廣告承載、新書出版等具有一定潛在商業(yè)價(jià)值的信息。雖然圖書館屬于非營(yíng)利性公益事業(yè)單位,但如何使這些具有潛在商業(yè)價(jià)值的信息真正發(fā)揮作用,也是值得思考的。
從某種意義上來講,作為文化領(lǐng)域職能單位之一的圖書館,與文化領(lǐng)域其他單位的互動(dòng)其實(shí)是最為便捷的。通過讀者的借閱信息,根據(jù)民眾所關(guān)心的時(shí)事熱點(diǎn),向特定群體發(fā)送館藏信息及推薦資料。這種主動(dòng)的推送通知,可以通過時(shí)下流行的各種方式,如微博更新、微信群發(fā)。另一方面,通過新穎方式與讀者進(jìn)行有效互動(dòng)所得到的反饋信息,將被用來進(jìn)一步豐富館藏,逐漸形成針對(duì)讀者需求而發(fā)展的良性循環(huán)。這種良性的循環(huán),不但改善了從前圖書館在讀者心目中刻板的形象,而且將讀者逐漸融入圖書館的運(yùn)作。
圖書館是服務(wù)提供者的角色。面對(duì)知識(shí)鏈條的上游,圖書館應(yīng)當(dāng)也能夠承擔(dān)起科技創(chuàng)新發(fā)起者的角色,主動(dòng)為專家學(xué)者提供有價(jià)值的參考信息,一定程度上引導(dǎo)專家學(xué)者的研究方向;而面對(duì)知識(shí)鏈條的下游,圖書館仍然能夠參與到科技轉(zhuǎn)化為實(shí)際生產(chǎn)力的隊(duì)伍當(dāng)中。通過廣泛開展新型科技理論的展覽和推介,加強(qiáng)與社會(huì)上科技轉(zhuǎn)化團(tuán)體的聯(lián)系,在為國(guó)家科技建設(shè)添磚加瓦的同時(shí)也挖掘出圖書館自身在商業(yè)、科技領(lǐng)域的綜合價(jià)值。對(duì)圖書館產(chǎn)出信息在科技領(lǐng)域的利用方式可以參考以下幾點(diǎn):①學(xué)科服務(wù),課題跟蹤。傳統(tǒng)的圖書館信息服務(wù)模式是參考咨詢,這種服務(wù)方式較為被動(dòng),旨在對(duì)圖書館資源及信息渠道自身的維護(hù),通過軟硬件設(shè)施、人力資源來實(shí)現(xiàn)具體服務(wù)。學(xué)科服務(wù)是一種新型信息服務(wù)形式,它在當(dāng)下的海量信息時(shí)代表現(xiàn)為專人專崗地向?qū)W校以及學(xué)校的科研力量提供行業(yè)前沿信息的個(gè)性化服務(wù)。這種包括信息的搜集、傳遞與分析的服務(wù)形式在國(guó)外已經(jīng)具有一定的規(guī)模與成效。圖書館信息在科技領(lǐng)域的應(yīng)用,可以視作由參考咨詢向?qū)W科服務(wù)的轉(zhuǎn)變,它要求館員從“走進(jìn)來的服務(wù)”向“走出去的服務(wù)”轉(zhuǎn)變[3],從而帶動(dòng)圖書館參與學(xué)校學(xué)科建設(shè)。②科技查新。目前國(guó)家教育部授權(quán)84所高??萍疾樾沦Y質(zhì),這些科技查新中心為校內(nèi)外的科研活動(dòng)開展查新服務(wù)。為了提高服務(wù)水平和效率,很多學(xué)校已經(jīng)研發(fā)和使用具有查詢和統(tǒng)計(jì)功能的查新管理系統(tǒng),系統(tǒng)按照委托單位(校內(nèi)和校外)、查新類型、查新范圍、時(shí)間、學(xué)科、地區(qū)等條件可對(duì)本年度的查新項(xiàng)目進(jìn)行統(tǒng)計(jì)。通過以上各類的查詢和統(tǒng)計(jì)功能,查新站管理人員可以方便地掌握工作進(jìn)展情況,提高業(yè)務(wù)管理的效率。各類統(tǒng)計(jì)數(shù)據(jù)也可供學(xué)校相關(guān)部門參考,及時(shí)把握學(xué)校科研動(dòng)態(tài)和規(guī)劃。圖書館科技查新系統(tǒng)形成的數(shù)據(jù)庫能夠以查新課題為依托將科技信息服務(wù)貫穿于科研活動(dòng)的各個(gè)環(huán)節(jié),從科研立項(xiàng)、實(shí)施、鑒定、報(bào)獎(jiǎng)到成果轉(zhuǎn)化和應(yīng)用全過程[4]。該系統(tǒng)的歷史數(shù)據(jù)自身就是一個(gè)單位、科研梯隊(duì)、科研人員的很有價(jià)值的資料庫,利用信息技術(shù)、網(wǎng)絡(luò)技術(shù)對(duì)查新過程進(jìn)行管理,可以有效地體現(xiàn)科研積淀[5],逐步形成全國(guó)科研信息特色數(shù)據(jù)庫,從而更深層次地提高服務(wù)水平。
圖書館的讀者本身來自于社會(huì)上的各個(gè)領(lǐng)域。很多讀者身處生產(chǎn)的第一線,其自身水平的提高將直接作用于生產(chǎn)力的提高。圖書館作為最新生產(chǎn)力的理論擁有者,如何向一線生產(chǎn)者灌輸最新的理論將是很有價(jià)值的研究方向。而經(jīng)過生產(chǎn)者實(shí)踐的科技理論,反過來進(jìn)一步影響研究人員的理論創(chuàng)新。對(duì)圖書館產(chǎn)出信息在生產(chǎn)領(lǐng)域的利用方式可以參考以下幾點(diǎn):①依據(jù)生產(chǎn)實(shí)踐類圖書的借閱情況,聯(lián)系社會(huì)資源主動(dòng)向讀者群進(jìn)行培訓(xùn)。培訓(xùn)可定期或不定期,都可使圖書館成為讀者職業(yè)或興趣培養(yǎng)的紐帶。②聯(lián)系應(yīng)用研究專家與實(shí)際應(yīng)用群體,一方面為研究人員提供素材,一方面為實(shí)際應(yīng)用人員提供指導(dǎo)。
嚴(yán)格來講,教育本身即屬于文化領(lǐng)域。大學(xué)圖書館所具有的能力和搜集到的信息,占據(jù)了圖書館整體信息量產(chǎn)出的絕大部分。大學(xué)圖書館能夠產(chǎn)出的信息可以用作以下幾方面:①為學(xué)校提供選修課開班的依據(jù);②為學(xué)生選課、選導(dǎo)師、選畢業(yè)論文指導(dǎo)方向;③為數(shù)據(jù)庫培訓(xùn)、舉辦講座提供參考;④為社會(huì)培訓(xùn)機(jī)構(gòu)、興趣聯(lián)盟的引入充當(dāng)中介。
目前,多數(shù)學(xué)校圖書館采用的是門禁系統(tǒng)。師生進(jìn)入圖書館要刷相應(yīng)的證件方可通過門禁系統(tǒng),由此產(chǎn)生的海量刷卡流水記錄就是一種大數(shù)據(jù)。通過對(duì)這些信息的統(tǒng)計(jì),可以得到某一時(shí)間段內(nèi)師生進(jìn)出圖書館的時(shí)間與頻率,比如晚上的讀者比白天多,期末考試前一個(gè)月比平時(shí)的讀者多,去圖書館復(fù)習(xí)功課的學(xué)生比進(jìn)行課外閱覽的學(xué)生多等。針對(duì)這些信息的分析,圖書館可以靈活調(diào)整開放時(shí)間與開放區(qū)域,便于資源更合理的使用。
通過對(duì)搜索關(guān)鍵詞的搜集與統(tǒng)計(jì),以類似搜索排行榜的形式,主動(dòng)引導(dǎo)讀者對(duì)相關(guān)內(nèi)容的關(guān)注,從而帶動(dòng)相關(guān)圖書的借閱。同時(shí),通過這類信息,圖書館自身采購(gòu)圖書時(shí)也可以對(duì)關(guān)注度較高的圖書種類予以一定的傾斜。
通過對(duì)具體圖書借閱的統(tǒng)計(jì),學(xué)校可以利用這些信息舉辦校園書香節(jié)和讀者服務(wù)月活動(dòng),從中選出借閱量最多的前幾十位讀者。讀者專業(yè)與圖書類型的關(guān)聯(lián)統(tǒng)計(jì),比如與其他專業(yè)讀者相比,外語學(xué)院的讀者借閱專業(yè)外語書籍就較多些。
電子數(shù)據(jù)庫的信息包括實(shí)體圖書文獻(xiàn)的電子版、音視頻教程、圖片畫作、試題庫等豐富的資源。這些資源是圖書館長(zhǎng)期固有的,并且已經(jīng)過了一定程度的數(shù)據(jù)集中,常規(guī)的利用方式是儲(chǔ)存、查閱和傳遞。通過對(duì)其特征的解構(gòu)——例如內(nèi)容、技法、適用范圍,匹配不同需求特征的人群,就能夠得到針對(duì)個(gè)人定制的數(shù)據(jù)庫。這種針對(duì)個(gè)人需求特性的數(shù)據(jù)庫既能夠增強(qiáng)用戶對(duì)圖書館的依賴,又能減少用戶進(jìn)行搜索時(shí)所耗費(fèi)的資源。
在圖書館更新或擴(kuò)大館藏時(shí),與出版社的聯(lián)系尤其緊密。在這種行為當(dāng)中,圖書館將得到不同出版社正在或?qū)⒁l(fā)行的圖書信息。對(duì)于讀者,這些信息一方面支撐了當(dāng)下閱讀,同時(shí)也將引導(dǎo)未來閱讀的方向。因此,及時(shí)且有目的地向讀者提供此類信息,將加速圖書館從“知識(shí)中介者”向“知識(shí)引導(dǎo)者”的角色轉(zhuǎn)變過程。
圖書館具有對(duì)信息與知識(shí)的承載、組織、開發(fā)、創(chuàng)新、使用與傳承的功能[6]。作為圖書館長(zhǎng)期以來的固有職能,信息承載的功能本身也應(yīng)當(dāng)發(fā)生積極的變化。以往,圖書館的信息承載體,如公告欄——僅僅刊登圖書借閱流程、文學(xué)作品介紹等內(nèi)容。事實(shí)上,通過對(duì)讀者借閱圖書的數(shù)據(jù)分析,針對(duì)讀者的學(xué)習(xí)興趣,圖書館完全有能力引入社會(huì)上優(yōu)秀的培訓(xùn)組織或興趣聯(lián)盟,從而將學(xué)校與社會(huì)的力量有機(jī)結(jié)合起來,更好地為讀者服務(wù)。
大數(shù)據(jù)時(shí)代給社會(huì)各個(gè)領(lǐng)域帶來新的發(fā)展機(jī)遇,同時(shí)也為圖書館帶來創(chuàng)新轉(zhuǎn)型的可能性。基于固有以及可產(chǎn)生的各類信息資源,借鑒國(guó)外已有的創(chuàng)新經(jīng)驗(yàn),結(jié)合社會(huì)相關(guān)單位的力量,圖書館將會(huì)發(fā)生相當(dāng)程度的角色轉(zhuǎn)變,進(jìn)而在個(gè)性化信息服務(wù)的大潮中取得較好的發(fā)展。
[1] 徐子灃.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].桂林:廣西師范大學(xué)出版社,2012:40-57.
[2] 大數(shù)據(jù)時(shí)代的特點(diǎn)[EB/OL].[2012-05-20].http://www.5lian.cn/html/2012/xueshu_0417/32237.html.
[3]陽海燕,陳遠(yuǎn)方.從參考咨詢走向?qū)W科服務(wù)——論高校圖書館參考咨詢的學(xué)科化服務(wù)[J].長(zhǎng)沙大學(xué)學(xué)報(bào),2011(6):158-160.
[4] 朱世清.科技查新系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)[D].揚(yáng)州:揚(yáng)州大學(xué),2009.
[5] 袁潤(rùn),等.科技查新信息管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代情報(bào),2007(7):152-155.
[6] 王雅坤.信息時(shí)代圖書館社會(huì)功能的定位思考[J].河北科技圖苑,2005(3):77-78.