,
隨著學術(shù)研究信息量不斷增多,從海量信息中提煉出學科領(lǐng)域發(fā)展動態(tài)和研究熱點對科研人員和科研管理人員非常重要。掌握學科熱點能夠揭示學科發(fā)展規(guī)律和未來發(fā)展趨勢,可以為管理決策人員提供決策參考,為學科研究人員確定研究方向和研究內(nèi)容提供情報依據(jù)[1]。一些高校圖書館根據(jù)學校的學科建設(shè)情況和需求,建立了學科熱點推薦平臺,如重慶科技學院設(shè)計的基于Kano模型與Ajax技術(shù)的學科聯(lián)盟熱點推薦平臺[2-3]。
為了給醫(yī)務(wù)人員提供及時的、高質(zhì)量的信息服務(wù),廣州軍區(qū)總醫(yī)院(以下簡稱“我院”)圖書館在建立移動信息咨詢服務(wù)平臺的基礎(chǔ)上,大力開展學科熱點信息推送服務(wù)。我館根據(jù)中文期刊文獻、英文期刊文獻、專利文獻的特點和對應(yīng)的檢索工具,細分學科熱點信息搜集方法,旨在建立規(guī)范的學科熱點信息的搜集和服務(wù)流程,使信息咨詢工作人員更好地搜集和整理相關(guān)主題文獻,分析和發(fā)現(xiàn)學科熱點。
學科熱點信息搜集方法有很多,主要采用詞頻分析、共詞分析、聚類分析等方法,利用分析軟件對電子期刊、碩博士論文、立項基金、引文信息源進行數(shù)據(jù)挖掘[4]。
本文按照中文期刊文獻、英文期刊文獻、專利文獻的特點分類搜集學科熱點信息,并通過我院的移動信息咨詢服務(wù)平臺,為我院科研人員推送最新的學術(shù)動態(tài)。學科熱點信息搜集方法見圖1。
圖1 學科熱點信息搜集方法
1.1.1 聚類挖掘平臺WEKA
WEKA(全稱Waikato Environment for Knowledge Analysis)是一款基于Java的用于數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的開源項目,集成了大量能承擔數(shù)據(jù)挖掘任務(wù)的機器學習算法,包括數(shù)據(jù)預處理、分類、回歸、聚類、關(guān)聯(lián)以及在新的交互界面上的可視化[5],主要適用于分析英文主題內(nèi)容,尤其適用于兩個主題詞間相關(guān)性的分析,依據(jù)聚類效果較好的類別的文獻,總結(jié)要查找的相關(guān)主題的研究熱點和方向。參考黃銳[6]和張瑞[7]所采用的學科熱點信息搜集方法,運用WEKA搜集英文文獻學科熱點。具體過程見圖2。
圖2 利用WEKA搜集學科熱點的流程
1.1.2 GoPubMed和bdPubMed 智能分析工具
GoPubMed和bdPubMed 是基于PubMed數(shù)據(jù)源的檢索分析工具。GoPubMed從what、who、where、when等方面對PubMed檢索結(jié)果進行分析,展示文獻的研究主題、研究作者、研究者所在區(qū)域、研究發(fā)展趨勢等特點[8];bdPubMed主要通過“知識演進圖譜”、“高IF論文”、“高TC論文”、“指紋共詞分析”4個分析工具從檢索結(jié)果中篩選出高頻主題詞、高影響因子論文以及高被引論文,信息咨詢服務(wù)人員根據(jù)篩選出的信息歸納總結(jié)該檢索主題的學科熱點及研究趨勢。GoPubMed和bdPubMed主要用于某一個主題研究領(lǐng)域的熱點分析。信息咨詢服務(wù)人員利用GoPubMed和bdPubMed進行學科熱點分析的具體過程見圖3。
圖3 利用GoPubMed和bdPubMed分析學科熱點的流程
數(shù)據(jù)庫網(wǎng)頁提供最新的學科研究熱點和前沿信息的依據(jù)有兩點:一是根據(jù)文獻被下載和被引用的次數(shù)來判斷文獻是否為關(guān)注的熱點;二是根據(jù)時間上的先后順序來判斷學科熱點信息的新穎程度[9]。因此,搜集國內(nèi)相關(guān)主題熱點,除了根據(jù)主題詞檢索文獻并進行分析歸納研究熱點之外,信息咨詢?nèi)藛T還可以利用國內(nèi)一些數(shù)據(jù)庫供應(yīng)商開發(fā)的分析工具,如萬方“知識脈絡(luò)分析”、“比較分析”,中國生物醫(yī)學文獻數(shù)據(jù)庫學術(shù)分析版塊中的“引證分析”、“機構(gòu)分析”,中國知網(wǎng)的“指數(shù)分析”、“學術(shù)研究熱點”、“學術(shù)趨勢搜索”、“個人機構(gòu)館”等。綜合運用以上中文文獻的分析工具,對作者、引文、關(guān)鍵詞、作者單位進行可視化分析,可以大致了解國內(nèi)相關(guān)主題的發(fā)展狀況及研究動態(tài)。搜集國內(nèi)相關(guān)主題學科熱點信息的流程見圖4。
圖4 搜集國內(nèi)相關(guān)主題學科熱點信息的流程
Innography是Dialog公司推出的專利信息檢索和分析平臺,可查詢和獲取70多個國家的專利信息,了解相關(guān)領(lǐng)域?qū)@袌龅母偁幀F(xiàn)狀和趨勢,全面直觀地展示某一研究方向的現(xiàn)狀和趨勢[10]。CNKI專利數(shù)據(jù)庫收錄了1985 年以來中國的所有專利,可以準確地反映中國最新的專利發(fā)明。通過檢索CNKI專利文獻,還可以獲得與該專利相關(guān)的最新文獻、科技成果、標準等信息,可以完整地展現(xiàn)該專利產(chǎn)生的背景、最新發(fā)展動態(tài)、相關(guān)領(lǐng)域的發(fā)展趨勢。此外,還可以瀏覽發(fā)明人與發(fā)明機構(gòu)更多的論述以及在各種出版物上發(fā)表的文獻信息。信息咨詢服務(wù)人員可利用Innography獲得相關(guān)主題的英文專利文獻,利用CNKI獲得相關(guān)主題的中文專利文獻,再綜合分析國內(nèi)外相關(guān)主題專利文獻的檢索結(jié)果,歸納學科熱點及研究趨勢。詳細流程見圖5。
圖5基于專利的學科熱點搜集流程
信息推送服務(wù)是信息加工人員對相關(guān)主題信息進行加工處理后,將不同渠道和載體的資源整合到一個平臺中,以文本、圖片、音頻、視頻等形式集中推送給用戶使用[11]。信息咨詢服務(wù)人員依托我院的移動信息咨詢服務(wù)平臺,以一對多的方式向用戶群體推送文字、圖片和表格等各種形式的熱點信息,對用戶群進行自定義分組,把特定的學科熱點信息推送給特定群體。此外還可根據(jù)我院的學科研究特點及信息咨詢用戶的信息需求,設(shè)定學科熱點信息推送服務(wù)響應(yīng)時間、信息推送周期、內(nèi)容更新頻率等,如學科熱點的推送頻率可設(shè)定為每周一次。在微信、微博和院內(nèi)網(wǎng)站中同時更新學科熱點信息,并注意讀者的反饋信息,以便更好地修正檢索內(nèi)容和檢索策略,使學科熱點信息更貼近讀者的需求。
推送的學科熱點信息包括國內(nèi)外研究熱點及專利文獻信息熱點分析。
國外研究熱點信息內(nèi)容包括WEKA軟件分析結(jié)果(排名前5位的高頻詞及其出現(xiàn)頻次,各類型聚類效果比較,分析檢索結(jié)果和聚類效果,總結(jié)檢索主題的研究熱點和方向),GoPubMed和BdPubMed分析結(jié)果(相關(guān)主題被引次數(shù)排前5位的文獻、來源期刊影響因子排前5位的相關(guān)主題文獻、與檢索主題最相關(guān)的5篇文獻、綜合分析檢索結(jié)果并歸納學科熱點及研究趨勢)。
國內(nèi)研究熱點信息內(nèi)容包括相關(guān)學科的熱點主題詞以及熱度值,相關(guān)主題學科趨勢圖(學術(shù)關(guān)注度、用戶關(guān)注度、知識網(wǎng)絡(luò)結(jié)構(gòu)圖、引證分析圖),相關(guān)熱門被引文章和下載文章,綜合分析檢索結(jié)果并歸納得到的學科熱點及研究趨勢。
基于專利的研究熱點信息內(nèi)容包括相關(guān)主題專利文獻國家分布圖、IPC分類圖、專利權(quán)人氣泡圖,相關(guān)主題專利國內(nèi)外分布特點、各單位研發(fā)情況、專利熱點及核心專利等,相關(guān)主題專利強度,相關(guān)專利文獻關(guān)鍵詞聚類分析,國內(nèi)外相關(guān)主題專利的研究熱點、重點單位以及研究趨勢。
為了給科研人員提供更可靠、更有用的科研動態(tài),需要多渠道獲取信息,盡可能地提高信息檢索的查全率。雖然我們檢索了盡可能多的國內(nèi)外生物醫(yī)藥類數(shù)據(jù)庫,并采用了多種學科熱點搜集分析方法,學科熱點信息服務(wù)仍然存在一些問題。
一是國內(nèi)外的數(shù)據(jù)庫數(shù)據(jù)都存在更新滯后問題。對此,我們要與各醫(yī)學類學會協(xié)會加強溝通,通過學術(shù)會議了解最新動態(tài)和學科熱點,關(guān)注相關(guān)微博,發(fā)現(xiàn)、追蹤、分析學科熱點。
二是一些數(shù)據(jù)庫的數(shù)據(jù)不全,分析存在片面性。如bdPubMed的論文被引次數(shù)來自谷歌學術(shù)而不是權(quán)威的Web of Science,而且不能導入Web of Science的數(shù)據(jù)[12];CNKI 2008年后未收入中華系列期刊,數(shù)據(jù)缺失。因此,信息咨詢服務(wù)人員要關(guān)注各類學(協(xié))會和期刊出版商網(wǎng)站提供的最新會議信息,或者早于正式出版物發(fā)布的信息等,如AIAA,ACM,Nature等網(wǎng)站[9]。
三是采用高頻詞代表研究熱點具有一定合理性,但某些最新研究主題的詞頻較低,僅依靠高頻詞無法監(jiān)測到最新的研究熱點。對此,信息咨詢服務(wù)人員可結(jié)合監(jiān)控暴發(fā)詞的方法來探測學科熱點[13]。
本文提出學科熱點信息的搜集和推送服務(wù),豐富了我院移動信息咨詢服務(wù)系統(tǒng)的內(nèi)容。學科熱點搜集流程的建立,可以使信息搜集工作更加規(guī)范化、模式化、簡單化、明了化,便于信息服務(wù)工作的管理,保障所搜集信息的質(zhì)量。