国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于用戶數(shù)據(jù)挖掘的醫(yī)院圖書館文獻(xiàn)采訪和服務(wù)實踐

2019-03-04 11:49商慧蘭周玨榕陶慧娟于海燕
關(guān)鍵詞:數(shù)據(jù)挖掘檢索數(shù)據(jù)庫

商慧蘭 周玨榕 李 晶 陶慧娟 于海燕

(同濟大學(xué)附屬楊浦醫(yī)院圖書館 上海 200090)

1 引言

隨著數(shù)字圖書館理論與實踐的發(fā)展,醫(yī)院圖書館開始步入數(shù)字化時代。圖書館管理系統(tǒng)中書目數(shù)據(jù)、讀者流通借還數(shù)據(jù)、Web及圖書館平臺訪問記錄、資源使用數(shù)據(jù)等為實現(xiàn)數(shù)據(jù)挖掘技術(shù)在圖書館的應(yīng)用提供基礎(chǔ)。流通數(shù)據(jù)的挖掘幫助圖書館更好地了解讀者閱讀的內(nèi)容、習(xí)慣、興趣等行為特征[1-2],不僅能為館藏建設(shè)、資源配置提供參考依據(jù),而且有助于了解個性化服務(wù)需求。在圖書管理系統(tǒng)、Web、數(shù)字平臺(鏡像)電子資源、數(shù)據(jù)庫資源智能分析環(huán)境中利用關(guān)聯(lián)分析、序列分析、聚類相關(guān)功能、聚類分析方法進(jìn)行數(shù)據(jù)挖掘研究,從而指導(dǎo)圖書館文獻(xiàn)采訪決策和服務(wù)創(chuàng)新。

2 數(shù)據(jù)挖掘應(yīng)用于圖書館的主要功能

2.1 關(guān)聯(lián)分析

圖書館數(shù)據(jù)挖掘中應(yīng)用最為廣泛的方法,屬于描述型模式,挖掘隱藏在數(shù)據(jù)間的相互關(guān)系[2-3]。在圖書館應(yīng)用中可用來發(fā)現(xiàn)讀者閱覽、借閱行為中的規(guī)律,分析用戶的需求類型、識別用戶特點和興趣等[1-2]。

2.2 序列分析

通過分析樣本特點,發(fā)現(xiàn)其規(guī)則和方法,在圖書館服務(wù)系統(tǒng)中可對點擊率、閱讀、檢索記錄數(shù)據(jù)進(jìn)行采集并整理、排序,從中獲知用戶熱門閱讀文獻(xiàn)和圖書[3],分析讀者類別和屬性特征。關(guān)注數(shù)據(jù)檢索、下載、瀏覽頻次,按序排列統(tǒng)計,分析數(shù)據(jù)利用率等。

2.3 聚類相關(guān)功能

利用聚類相關(guān)功能挖掘數(shù)據(jù)的因果關(guān)聯(lián),如數(shù)據(jù)庫歷史檢索中主題詞、關(guān)鍵詞的頻次等,可以了解醫(yī)院熱門研究方向,臨床疾病、診斷、治療技術(shù)的研究重點;掌握用戶資源需求,預(yù)測科研發(fā)展態(tài)勢。也可聚焦學(xué)科頻數(shù),篩選出臨床優(yōu)勢學(xué)科,從而為圖書館資源配置和個性化服務(wù)提供依據(jù)。

2.4 聚類分析

聚類的方法很多,有劃分、層次、核聚類以及基于網(wǎng)絡(luò)、數(shù)據(jù)庫的方法等。如層次方法,將數(shù)據(jù)劃分到不同組,盡量保持類層的同質(zhì)性,將數(shù)據(jù)組成類分層結(jié)構(gòu)。在圖書館應(yīng)用中可以對用戶分別聚類,識別同類子群,提供同類資源配置與個性化服務(wù)。也可利用數(shù)據(jù)庫聚類分析功能,聚焦分類用戶、科室科研的數(shù)據(jù)集,分析專家學(xué)者、學(xué)科研究的發(fā)展態(tài)勢,預(yù)測未來趨勢,為決策提供參考依據(jù)。

3 醫(yī)院圖書館及其數(shù)據(jù)特點

3.1 醫(yī)院圖書館特點

為醫(yī)療、教學(xué)、科研提供信息服務(wù)是醫(yī)院圖書館基本職能,資源的結(jié)構(gòu)具有醫(yī)院專業(yè)和學(xué)科特色。服務(wù)對象主要分為臨床醫(yī)療、醫(yī)技用戶;科研、教師(導(dǎo)師)用戶;行政管理用戶;規(guī)培學(xué)員、醫(yī)學(xué)院校學(xué)生、實習(xí)用戶和進(jìn)修人員。每類用戶專業(yè)不同,又可細(xì)分為醫(yī)療、護(hù)理、藥學(xué)、檢驗、放射、超聲、管理等學(xué)科。醫(yī)學(xué)用戶的學(xué)科專業(yè)性非常強,各類人員對信息的需求差異很大,信息主要集中在專業(yè)領(lǐng)域緊密相關(guān)的生物醫(yī)學(xué)文獻(xiàn)上。因此醫(yī)院圖書館在資源構(gòu)建、配置、使用習(xí)慣模式、用戶體驗、服務(wù)方式等既要兼顧到不同層次人員的需求,又要兼顧到醫(yī)院網(wǎng)絡(luò)環(huán)境、館址面積、功能布局、資源分布、采訪資金等。

3.2 數(shù)據(jù)特點

醫(yī)院圖書館作為文獻(xiàn)情報中心,可通過多個渠道獲取用戶數(shù)據(jù),如結(jié)構(gòu)化的用戶流通借閱、預(yù)約數(shù)據(jù)。用戶登錄、資源使用中產(chǎn)生的記錄數(shù)據(jù),如用戶基本信息、借閱歷史、訪問記錄、資源瀏覽、下載、拒絕數(shù)據(jù);文獻(xiàn)檢索歷史記錄、條件檢索數(shù)據(jù)等。只有經(jīng)過清理、統(tǒng)計、歸類、變換、集成的數(shù)據(jù)才可提供增值服務(wù)。

4 數(shù)據(jù)挖掘在醫(yī)院圖書館的應(yīng)用實踐

4.1 管理系統(tǒng)集成數(shù)據(jù)應(yīng)用

圖書館利用書目管理系統(tǒng)中的統(tǒng)計功能對用戶的流通借閱[1]、檢索、預(yù)約數(shù)據(jù)進(jìn)行跟蹤統(tǒng)計[3]。通過分類聚類方法對收集的數(shù)據(jù)進(jìn)行分析,了解用戶的閱讀傾向與需求[4]進(jìn)行館藏配置和預(yù)測新一輪文獻(xiàn)采訪的重點。如近年來隨著圖書館數(shù)字化建設(shè)的推進(jìn),圖書流通借閱數(shù)據(jù)量呈逐年下降趨勢,同濟大學(xué)附屬楊浦醫(yī)院圖書館逐年調(diào)整紙版書刊的采購量,增加電子類書刊的采訪,不僅節(jié)省資金,而且極大豐富資源,將有限經(jīng)費投入資源最大化。跟蹤用戶借閱習(xí)慣與周期,進(jìn)行關(guān)聯(lián)分析,調(diào)整借閱規(guī)則,使制度符合用戶實際需求。根據(jù)閱覽室流通數(shù)據(jù)的用戶分層聚類分析并結(jié)合閱覽室規(guī)模,確立移動圖書館的建設(shè)方案,解決一院四區(qū)都具備使用圖書館資源的條件,同時確保有限空間用戶使用最優(yōu)化。

4.2 用戶檢索數(shù)據(jù)挖掘分析

圖書館一站檢索平臺實現(xiàn)資源數(shù)據(jù)集成。首先,圖書館對用戶檢索過程中產(chǎn)生的記錄數(shù)據(jù)進(jìn)行捕捉、關(guān)聯(lián)、整理并按序排列,從中分析用戶關(guān)注較高的熱門檢索圖書及文獻(xiàn)需求,為后續(xù)圖書館的采選種類、數(shù)量決策提供依據(jù)[4]。其次,對數(shù)據(jù)庫的訪問量、檢索數(shù)據(jù)、期刊數(shù)據(jù)、檢索歷史等進(jìn)行挖掘排序,可以發(fā)現(xiàn)用戶習(xí)慣,了解其關(guān)注的研究熱點和方向。聚焦IP站點數(shù)據(jù)分析站點需求、使用情況、培訓(xùn)需求,為圖書館開展后續(xù)服務(wù)提供依據(jù)。數(shù)據(jù)庫流量、并發(fā)數(shù)、拒絕數(shù)據(jù)分析也為數(shù)據(jù)庫繼訂的內(nèi)容、價格提供采訪依據(jù)。第三,為資源建設(shè)、信息服務(wù)提供方向[5]。如臨床指南檢索數(shù)據(jù)促使館員開展最新臨床指南的資源建設(shè);專家專著發(fā)表數(shù)據(jù)促使圖書館開辟專家專著欄目;用戶咨詢數(shù)據(jù)(如核心期刊、影響因子、論文發(fā)表、培訓(xùn))等為平臺讀者指南服務(wù)內(nèi)容和項目提供建設(shè)方向,相繼提供前沿信息導(dǎo)讀、信息編譯、最新到刊等服務(wù)。最后,歷年臨床訂閱文獻(xiàn)偏好數(shù)據(jù)歸類分析(如使用情況、數(shù)據(jù)庫收錄情況、出版商、資源分析)為圖書館采選數(shù)據(jù)庫提供決策方向。文獻(xiàn)傳遞服務(wù)數(shù)據(jù)(如電子書、文獻(xiàn)傳遞)拓展了解用戶需求的窗口,也為用戶信息數(shù)據(jù)的建立和應(yīng)用奠定基礎(chǔ)。

4.3 建立用戶數(shù)據(jù)庫

圖書館作為知識信息服務(wù)中心和中轉(zhuǎn)站,對數(shù)據(jù)庫海量數(shù)據(jù)信息進(jìn)行專業(yè)化加工處理和應(yīng)用,對圖書館知識服務(wù)、創(chuàng)造、組織和存儲有十分重要的作用和意義。圖書館對搜集、檢索的用戶數(shù)據(jù)進(jìn)行分析與處理正逐步成為各圖書館的工作重點。無論是現(xiàn)存信息的檢索,還是檢出信息的處理分析都促使圖書館在資源建設(shè)、管理、服務(wù)及發(fā)展模式的轉(zhuǎn)變。大數(shù)據(jù)已從根本上改變?nèi)藗儗σ酝鶖?shù)據(jù)的觀念,通過數(shù)據(jù)信息可以看到其潛在價值,建立一個整合、結(jié)構(gòu)化的用戶數(shù)據(jù)倉庫并及時更新已迫在眉睫。因此現(xiàn)階段主要發(fā)現(xiàn)、挖掘數(shù)據(jù)并進(jìn)行篩選和積累,建立用戶數(shù)據(jù)資源庫(包括用戶、使用、資源、檢索、科研學(xué)術(shù)數(shù)據(jù)等),加強結(jié)構(gòu)性數(shù)據(jù)庫資源建設(shè),為后續(xù)數(shù)據(jù)轉(zhuǎn)化、分析、增值及決策提供基礎(chǔ)保障。用戶基本信息按聚類可以了解不同層次用戶的信息需求,也為個性化服務(wù)提供依據(jù)。

4.4 數(shù)據(jù)挖掘在采訪策略中的應(yīng)用

最初會采用非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)挖掘,如同行、不同醫(yī)院、機構(gòu)數(shù)據(jù)庫功能咨詢、評價;相似數(shù)據(jù)庫的功能、數(shù)據(jù)分析比較;同行使用反饋體驗等。醫(yī)院結(jié)構(gòu)性數(shù)據(jù)挖掘分析,如數(shù)據(jù)庫的收錄范圍與醫(yī)院、學(xué)科發(fā)展方向、專家的偏好相關(guān)度;能否滿足不同層次用戶的需求(或滿足何層群體需求);用戶使用情況數(shù)據(jù)分析、習(xí)慣和體驗、標(biāo)準(zhǔn)檢索方法等。其次,界定采訪流量數(shù)據(jù),流量數(shù)據(jù)決定數(shù)據(jù)庫價格。如中國知網(wǎng)拒絕數(shù)據(jù)分析,可以了解醫(yī)院并發(fā)數(shù)能否滿足用戶需求,指導(dǎo)續(xù)訂采訪決策。數(shù)據(jù)庫(鏡像)用戶信息數(shù)據(jù)與網(wǎng)絡(luò)數(shù)據(jù)用數(shù)據(jù)群組分類分析可以發(fā)現(xiàn)一院四區(qū)用戶數(shù)據(jù)庫的使用情況,預(yù)測未來提高數(shù)據(jù)庫利用率的切入點,提高采訪資源利用率和全面性。最后,評估采訪價格與合同約定,確立數(shù)據(jù)庫性價比。如萬方醫(yī)學(xué)數(shù)據(jù)庫價格數(shù)據(jù)指數(shù)可以估算采訪價格。邁特思創(chuàng)外文文獻(xiàn)檢索平臺文獻(xiàn)傳遞數(shù)據(jù)分析可界定限量數(shù)據(jù)的約定與分配。最大用戶流量數(shù)據(jù)及數(shù)據(jù)更新趨勢分析可為預(yù)測平臺服務(wù)器硬件更新升級時間和硬件配置要求提供依據(jù)。通過使用數(shù)據(jù)的趨勢分析可以了解用戶的習(xí)慣偏好和數(shù)據(jù)庫對用戶的影響力??傊?,圖書館在基于用戶數(shù)據(jù)挖掘進(jìn)行采訪時要將數(shù)據(jù)信息與用戶信息有序篩選、提煉、積累、轉(zhuǎn)化,才能指導(dǎo)文獻(xiàn)采訪的方向和重點[6],優(yōu)化資源配置和資金分配。

4.5 圖書館數(shù)據(jù)挖掘擴展空間

圖書館除用戶信息數(shù)據(jù)外還具有其他數(shù)據(jù),而通過多維度數(shù)據(jù)分析可實現(xiàn)以下目標(biāo):營造第二課堂,提升信息素養(yǎng);保障文獻(xiàn)需求,推送前沿信息;輔助課題申報,防范學(xué)術(shù)不端;跟蹤學(xué)科動態(tài),輔助科研決策;聚焦人才發(fā)展,參與人才評估。如整體科研實力檢索可預(yù)測醫(yī)院科研發(fā)展態(tài)勢;通過歷史檢索數(shù)據(jù)分析重點學(xué)科及熱門研究方向。序列分析科研成果高產(chǎn)作者和科室,篩選優(yōu)勢學(xué)科。聚焦行業(yè)領(lǐng)軍人物,了解醫(yī)院科研前沿性,聚類分析研究熱點趨勢。還可跟蹤個體學(xué)者,挖掘其科研發(fā)展軌跡,評估其研究的相關(guān)性、領(lǐng)域的地位;分析學(xué)者科研成果的頂峰期、瓶頸期或衰退期,預(yù)測未來潛能等。圖書館則可根據(jù)多元化數(shù)據(jù)挖掘分析開展個性化服務(wù)(如前沿信息推送、相關(guān)領(lǐng)域最新文獻(xiàn)更新推送、優(yōu)勢學(xué)科和熱點研究的資源采訪等),實現(xiàn)文獻(xiàn)采訪資源、資金向優(yōu)勢學(xué)科、領(lǐng)先領(lǐng)域研究、熱門研究傾斜配置。

5 醫(yī)院圖書館數(shù)據(jù)挖掘的困境及對策

5.1 困境

第一,醫(yī)院圖書館不同于高校圖書館,其資源有限,數(shù)據(jù)不夠完整,缺乏專業(yè)軟件。部分教授、碩博士可以通過校園網(wǎng)登錄使用大學(xué)資源,這部分?jǐn)?shù)據(jù)圖書館無法采集。第二,目前數(shù)據(jù)挖掘限于管理軟件、圖書館平臺集成數(shù)據(jù)以及數(shù)據(jù)庫自帶的數(shù)據(jù)統(tǒng)計,缺乏整體集成和專業(yè)軟件支持,館員對數(shù)據(jù)的處理需要篩選、導(dǎo)出、整理、甄別、歸類、統(tǒng)計。數(shù)據(jù)挖掘方法主要采用常規(guī)(SPSS、EXL等)工具處理,數(shù)據(jù)準(zhǔn)備費時耗力,不能進(jìn)行更深層次挖掘利用來提升價值。第三,數(shù)據(jù)挖掘精確問題。源數(shù)據(jù)的準(zhǔn)確性對數(shù)據(jù)挖掘分析有很大影響。系統(tǒng)數(shù)據(jù)來自不同平臺,數(shù)據(jù)的異構(gòu)性以及沒有統(tǒng)一標(biāo)準(zhǔn)導(dǎo)致信息整合、利用困難重重。第四,館員和管理者對推進(jìn)圖書館數(shù)字化建設(shè)認(rèn)識不足,對醫(yī)院圖書館定位及功能服務(wù)停滯在傳統(tǒng)的非數(shù)字化時代,缺乏數(shù)字化意識。第五,圖書館在醫(yī)院屬行政輔助科室,研究項目少,資金缺乏,人才引進(jìn)與培訓(xùn)缺乏保障,如果不能順利解決存在于用戶需求、管理決策和圖書館之間的矛盾必將制約圖書館在大數(shù)據(jù)時代的發(fā)展。

5.2 對策

第一,加強館員及管理者對大數(shù)據(jù)的認(rèn)識,信息資源整合是推進(jìn)數(shù)據(jù)挖掘利用的首要問題。圖書館作為醫(yī)院文獻(xiàn)信息匯集地,要重視與領(lǐng)導(dǎo)溝通,為臨床醫(yī)教研發(fā)揮信息樞紐作用,爭取領(lǐng)導(dǎo)最大支持。第二,展示信息成果,擴大影響力。建設(shè)信息共享平臺,形成特色館藏,推動檔案館、圖書館、院史館的融合發(fā)展[7]。第三,培養(yǎng)復(fù)合型專業(yè)人才。人才是推進(jìn)資源價值升級的關(guān)鍵,數(shù)據(jù)挖掘技術(shù)門檻較高,館員不但需要有計算機、信息、圖書文檔、檔案管理知識,還必須具有良好的統(tǒng)計學(xué)、外文基礎(chǔ),熟悉數(shù)據(jù)挖掘技術(shù)與工具;而醫(yī)院圖書館專業(yè)性強,又需要館員最好具有醫(yī)學(xué)背景,對抓取信息有較強的專業(yè)敏感度。加強專業(yè)化人才隊伍建設(shè),既要領(lǐng)導(dǎo)重視,又要館員努力,通過招聘、送修、培訓(xùn)、外聘兼職專家顧問、對接臨床專業(yè)館員等方式,提高館員技術(shù)、能力和專業(yè)性。第四,推進(jìn)智慧圖書館一體化建設(shè)。即集智慧管理、大數(shù)據(jù)分析決策、智能采選、數(shù)據(jù)應(yīng)用和智慧辦公于一體。建立大學(xué)與附屬醫(yī)院聯(lián)盟,共享數(shù)據(jù)庫資源,資源互補、完善數(shù)據(jù)。第五,匯集不同數(shù)據(jù)源優(yōu)勢與數(shù)據(jù)商協(xié)調(diào)解決方案。與數(shù)據(jù)集成商協(xié)作改良、開發(fā)有針對性的數(shù)據(jù)挖掘工具包,嵌入圖書館服務(wù)平臺,智能抓取、集成分析,注重智慧圖書館集成建設(shè)方案和數(shù)據(jù)挖掘工具的開發(fā),即專業(yè)軟件開發(fā)。第六,促進(jìn)行業(yè)標(biāo)準(zhǔn)的建立。建立統(tǒng)一的數(shù)據(jù)挖掘標(biāo)準(zhǔn)或模型,探索數(shù)據(jù)倉庫的內(nèi)涵、范圍及評價體系指標(biāo)。

6 結(jié)語

數(shù)據(jù)挖掘是提取隱含在數(shù)據(jù)中的規(guī)律,為醫(yī)院圖書館文獻(xiàn)采訪決策工作提供潛在、有價值的信息指導(dǎo)。通過數(shù)據(jù)的挖掘、篩選、分析可以發(fā)現(xiàn)和獲取用戶需求,指導(dǎo)采訪資源和資金分配。多維度用戶數(shù)據(jù)挖掘為圖書館創(chuàng)新服務(wù)提供更加廣闊的想象空間,創(chuàng)新服務(wù)模式,預(yù)測服務(wù)方向;提高文獻(xiàn)采訪的精確性,提供精準(zhǔn)化的個性服務(wù)。圖書館應(yīng)結(jié)合本館結(jié)構(gòu)、特色、資源、人力等情況,合理分配有限資源、資金,在實踐中不斷完善用戶數(shù)據(jù)的挖掘、構(gòu)建,為開拓更廣泛的讀者服務(wù)領(lǐng)域提供技術(shù)支撐和決策指導(dǎo)。

猜你喜歡
數(shù)據(jù)挖掘檢索數(shù)據(jù)庫
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費中的應(yīng)用淺析
數(shù)據(jù)庫
數(shù)據(jù)庫
專利檢索中“語義”的表現(xiàn)
數(shù)據(jù)庫
數(shù)據(jù)庫
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
高級數(shù)據(jù)挖掘與應(yīng)用國際學(xué)術(shù)會議
國際標(biāo)準(zhǔn)檢索
海伦市| 石首市| 名山县| 四川省| 章丘市| 永德县| 临江市| 邹平县| 阳春市| 华亭县| 乌兰察布市| 鹤庆县| 新龙县| 当雄县| 刚察县| 阜新| 通江县| 蒙阴县| 砀山县| 朝阳县| 清涧县| 阳朔县| 五常市| 克拉玛依市| 高陵县| 青州市| 油尖旺区| 宁津县| 麦盖提县| 临湘市| 巴中市| 弥渡县| 景泰县| 曲阜市| 莱芜市| 汨罗市| 崇左市| 醴陵市| 安吉县| 呼玛县| 新绛县|