曹樹金,岳文玉
春華秋實(shí),武漢大學(xué)信息管理學(xué)院(以下簡稱“學(xué)院”)迎來百年華誕。經(jīng)歷百年,學(xué)院已發(fā)展成為我國規(guī)模最大、實(shí)力最強(qiáng)的信息管理學(xué)科教學(xué)和研究基地。回顧學(xué)院發(fā)展,我們深深感受到她是一個能夠創(chuàng)造奇跡、化一般為神奇的學(xué)術(shù)圣地。并不聰明絕頂?shù)膶W(xué)生們,經(jīng)過她的培養(yǎng),可以大比例地成為棟梁之材,神奇的“7901”(指武漢大學(xué)79級圖書館學(xué)專業(yè)班,該班因出了較多的學(xué)界業(yè)界人物而在本領(lǐng)域聞名)就是一個例子。她為什么有此能耐?“守正創(chuàng)新”可能就是答案之一。為此,筆者從學(xué)院師生所發(fā)表學(xué)術(shù)論文的主題發(fā)展角度呈現(xiàn)她守正創(chuàng)新的特征。
從文獻(xiàn)中挖掘研究主題和發(fā)展趨勢,一般有兩類方法[1]:基于共詞分析的主題挖掘方法和基于概率模型的主題挖掘方法。共詞分析法的主要原理是統(tǒng)計(jì)關(guān)鍵詞在文獻(xiàn)中同時出現(xiàn)的次數(shù),構(gòu)建共詞矩陣進(jìn)行聚類,以坐標(biāo)或網(wǎng)絡(luò)形式進(jìn)行可視化,進(jìn)而分析研究領(lǐng)域的主題結(jié)構(gòu)和研究熱點(diǎn),具有操作靈活和易于解讀的優(yōu)點(diǎn),應(yīng)用于多個領(lǐng)域。Wei Wen-Juan等[2]利用共詞分析法分析人類神經(jīng)干細(xì)胞的研究主題趨勢和知識結(jié)構(gòu);吳桐等[3]對中國知網(wǎng)收錄的我國醫(yī)院財務(wù)管理文獻(xiàn)進(jìn)行共詞聚類分析,得到4個研究類團(tuán),在此基礎(chǔ)上分析醫(yī)院財務(wù)管理存在的問題及其解決方案;李綱等[4]從共詞分析過程中術(shù)語的高詞頻選擇等方面對共詞分析的優(yōu)缺點(diǎn)做主客觀評價,為該方法的完善提供借鑒。
在基于概率模型的主題挖掘研究中,LDA主題模型有較強(qiáng)的主題識別能力,因而在對不同載體文本語料的主題挖掘研究中受到普遍關(guān)注。Zhu Lin等[5]運(yùn)用社會網(wǎng)絡(luò)分析和LDA模型分析醫(yī)療不良事件的潛在行為,得出良好的信息共享和反饋機(jī)制能預(yù)防醫(yī)患問題;Luo L X等[6]提出結(jié)合LDA模型和卷積神經(jīng)網(wǎng)絡(luò)的文本輿情分析方法,以提高網(wǎng)絡(luò)輿情分析的性能;劉雅姝等[7]選取網(wǎng)絡(luò)輿情突發(fā)事件評論數(shù)據(jù)構(gòu)建知識圖譜,利用LDA模型對圖譜中實(shí)體的話題屬性進(jìn)行劃分,以多維視角追蹤輿情話題演化情況;關(guān)鵬等[8]結(jié)合LDA和生命周期理論,提出主題語義演化分析方法,深度揭示學(xué)科領(lǐng)域發(fā)展過程中繼承、分裂和融合的語義演化模式。
綜上所述,基于LDA主題模型的研究多從全局語料庫進(jìn)行主題抽取,局限是未能深入揭示學(xué)科領(lǐng)域研究主題內(nèi)容的演變。筆者結(jié)合共詞分析法,在利用LDA模型主題挖掘的基礎(chǔ)上進(jìn)行高頻關(guān)鍵詞共詞分析,深入探究熱點(diǎn)主題不同歷史時期的演變過程。本文通過系統(tǒng)采集1958~2019年CNKI數(shù)據(jù)庫收錄的學(xué)院論文,探析學(xué)院學(xué)科領(lǐng)域研究熱點(diǎn)的演變,探尋學(xué)院發(fā)展至今不斷閃耀的學(xué)術(shù)光芒。
潛在狄利克雷模型(latent Dirichlet allocation,LDA)的本質(zhì)是基于“文檔-主題-詞”的三層貝葉斯概率模型,是可實(shí)現(xiàn)文本聚類的主題生成模型。其生成過程為:首先,基于語料庫中的每篇文檔,從主題分布中抽取一個主題;接著,從該主題的詞項(xiàng)分布中抽取一個詞;最后,重復(fù)以上流程直至遍歷文檔中的所有詞。通過模型訓(xùn)練,形成從文本到主題、從主題到詞的多項(xiàng)式分布[9]。每個詞在一篇文檔中出現(xiàn)的概率[8]如下:
p(特征詞|文檔)=∑主題p(特征詞|主題)×p(主題│文檔)
論文主題提取是論文主題演化研究的基礎(chǔ)。LDA 模型具有高效的抽樣推理算法和模型泛化能力,將該方法應(yīng)用于學(xué)術(shù)論文研究的主題挖掘有助于在文檔語義層面實(shí)現(xiàn)海量文獻(xiàn)基于主題的文本建模,對學(xué)術(shù)論文主題的提取與演化分析更精確。
(1)主題隸屬概率。依據(jù)LDA模型的主題識別結(jié)果,能得出不同主題在每篇文獻(xiàn)下的主題概率分布,其作為度量標(biāo)準(zhǔn)用來衡量文獻(xiàn)的研究主題[10]。若某主題在該文獻(xiàn)呈現(xiàn)較高的主題隸屬概率,說明該文獻(xiàn)研究內(nèi)容與此主題有較大關(guān)聯(lián);反之,說明該文獻(xiàn)研究內(nèi)容與此主題聯(lián)系較弱。通過LDA模型生成文檔主題隸屬概率θd,k表示,θd,k代表第d個文檔中主題k的概率。
(2)主題熱度。通常用主題與文檔間的關(guān)聯(lián)程度反映主題熱度,同一主題可能在各個文檔中呈現(xiàn)不同的主題隸屬概率,同一文檔中各個主題的隸屬概率也各不相同。一個主題在不同文檔中的主題隸屬概率總和相較于其他主題越高,則表明其熱度越高。主題熱度的演化分析即通過計(jì)算某一主題在不同時間段中的主題熱度來反映隨時間變化的主題熱度趨勢。主題熱度的計(jì)算方法[11]為:計(jì)算某一主題在所有文檔中主題隸屬概率的平均值。主題Tk在某一時間段的熱度可表示為:
其中,∣D∣表示文檔集合D 中的文檔數(shù)量,d表示文檔集合中的一篇文檔,θd,k表示主題Tk出現(xiàn)在文檔中的主題隸屬概率。
利用LDA主題模型和共詞分析法進(jìn)行主題抽取與演化分析的流程可概括為3個階段:一是數(shù)據(jù)采集與預(yù)處理階段;二是構(gòu)建LDA主題模型和計(jì)算階段;三是主題分析和可視化階段。整體流程見圖1。
圖1 主題抽取與演化分析框架
(1)數(shù)據(jù)采集與預(yù)處理階段。數(shù)據(jù)采集來源于CNKI數(shù)據(jù)庫,LDA模型中的主題由特征詞概率構(gòu)成,需要對采集的文本進(jìn)行預(yù)處理,包括中文分詞、刪除停用詞、加入用戶自定義詞典等。
(2)構(gòu)建LDA主題模型和計(jì)算階段。有3個步驟:一是在建模前設(shè)置適用的參數(shù)和確定最優(yōu)主題數(shù)目;二是對原始語料文本進(jìn)行LDA建模,得到模型文檔-主題概率分布、主題-詞項(xiàng)概率分布等輸出結(jié)果;三是過濾原始主題,刪掉無意義主題。
(3)主題分析與可視化階段?;贚DA主題模型輸出的文件,進(jìn)行熱點(diǎn)主題分析和主題演化分析。一方面依據(jù)主題強(qiáng)度分析不同時間段內(nèi)的熱點(diǎn)主題,挖掘?qū)W院不同時期研究的熱點(diǎn)領(lǐng)域;另一方面,引入時間因素,繪制不同主題強(qiáng)度變化的折線圖,進(jìn)行熱點(diǎn)主題演化趨勢可視化。在進(jìn)行主題演化趨勢分析時,結(jié)合共詞分析法,利用社會網(wǎng)絡(luò)分析軟件Ucinet 和Netdraw揭示不同主題內(nèi)高頻關(guān)鍵詞的共詞關(guān)系,從可視化角度來定量探討熱點(diǎn)主題在不同時期的研究熱點(diǎn)。
2.2.1 數(shù)據(jù)采集
1920年代初韋棣華、沈祖榮等共同創(chuàng)辦武昌文華大學(xué)圖書科,標(biāo)志著我國近代圖書館學(xué)產(chǎn)生,1929年圖書科單獨(dú)建校為武昌文華圖書館??茖W(xué)校[12]。在之后的研究發(fā)展中,創(chuàng)辦《文華圖書館學(xué)??茖W(xué)校季刊》,出版《普通圖書編目法》(黃星輝,1934)、《標(biāo)題總錄》(沈祖榮,1938)等圖書館學(xué)專著,在圖書館界引起反響。1956年成立武漢大學(xué)圖書館學(xué)系,成為我國圖書館學(xué)教育的重要基地。本文選用CNKI數(shù)據(jù)庫作為數(shù)據(jù)源,檢索作者單位“武昌文華圖書館??茖W(xué)校”,未檢索到相關(guān)文獻(xiàn),表明未收錄此時期文獻(xiàn)。檢索作者單位“武漢大學(xué)圖書館學(xué)系”,檢索到相關(guān)文獻(xiàn)始于1958年。因此,本文使用檢索策略“作者單位:武漢大學(xué)圖書館學(xué)系or武漢大學(xué)圖書情報學(xué)院or武漢大學(xué)傳播與信息學(xué)院or武漢大學(xué)大眾傳播與知識信息管理學(xué)院or武漢大學(xué)信息管理學(xué)院”進(jìn)行檢索,得到1958~2019 年9 月14 日的文獻(xiàn)記錄10,860條,抽取每篇論文的時間和摘要作為主題識別和分析的語料。為獲取科學(xué)、規(guī)范的語料來源,對獲取的文獻(xiàn)進(jìn)行處理,包括刪除武漢大學(xué)傳播與信息學(xué)院中新聞與傳播類文獻(xiàn)、摘要缺失的文獻(xiàn)記錄以及對文獻(xiàn)題錄進(jìn)行去重等,添加在相關(guān)論文搜集過程中發(fā)現(xiàn)的署名單位為武漢大學(xué)實(shí)際是學(xué)院師生發(fā)表的文獻(xiàn)記錄。通過清洗數(shù)據(jù),將得到的10,179條文獻(xiàn)記錄作為實(shí)驗(yàn)的候選語料庫。
2.2.2 數(shù)據(jù)預(yù)處理和參數(shù)設(shè)置
為提高實(shí)驗(yàn)結(jié)果準(zhǔn)確性,對采集到的原始數(shù)據(jù)進(jìn)行預(yù)處理。采用中國科學(xué)院ICTCLAS分詞工具,對標(biāo)題和摘要文本進(jìn)行漢語分詞處理,并在用戶自定義詞典中加入“高校圖書館”“競爭情報”“數(shù)字出版經(jīng)濟(jì)”“檔案治理”等相關(guān)詞語。將“的”“已經(jīng)”等功能詞、文本中應(yīng)用廣泛的詞和標(biāo)點(diǎn)符號等作為停用詞,進(jìn)行過濾處理。數(shù)據(jù)預(yù)處理階段是一個持續(xù)重復(fù)的過程,依據(jù)模型輸入需求,需對用戶自定義詞典進(jìn)行不斷擴(kuò)充,直至得到滿意的處理結(jié)果,最后基于開源包JGibbLDA實(shí)現(xiàn)LDA主題模型的參數(shù)訓(xùn)練。
在試驗(yàn)階段,將主題劃分為10~17類,對每一類中詞的隸屬概率進(jìn)行分析。研究發(fā)現(xiàn),將主題分為11~15類時,每一類中詞項(xiàng)的隸屬概率逐漸提高,但主題間區(qū)分度不強(qiáng),在分為15類主題時輸出的實(shí)驗(yàn)結(jié)果較好,在分為16類時詞項(xiàng)的分布概率下降。因此,將主題數(shù)目設(shè)置T=15,超參數(shù)設(shè)置為α=0.01,β=0.05,迭代次數(shù)niters=1,000 次,抽取各主題下概率最高的前10 個詞,利用Gibbs Sampling進(jìn)行參數(shù)估計(jì)和推斷。
圖2呈現(xiàn)學(xué)院1958~2019年發(fā)表文獻(xiàn)數(shù)量的年代分布。至2019年9月14日,學(xué)院不同歷史時期發(fā)表的論文大體經(jīng)歷3個階段:第一階段為1958~1983年,自數(shù)據(jù)庫收錄武漢大學(xué)圖書館學(xué)系的第一篇文獻(xiàn)至1984年建立圖書情報學(xué)院前。論文數(shù)量增長緩慢,變化曲線幾乎與坐標(biāo)軸重合平行,主因是CNKI數(shù)據(jù)庫只對1993年前的部分期刊進(jìn)行回溯。第二階段為1984~2000年,即2001 年更名為武漢大學(xué)信息管理學(xué)院前,論文數(shù)量增長加快。第三階段為2001~2019年,更名為武漢大學(xué)信息管理學(xué)院后,發(fā)文量呈現(xiàn)遞增趨勢,局部有小幅度波動,2014年達(dá)到峰值630篇。
圖2 發(fā)表文獻(xiàn)數(shù)量年代分布
通過LDA主題模型計(jì)算結(jié)果分析以及過濾1個摘要結(jié)構(gòu)信息的主題,得到最優(yōu)主題數(shù)目為14。為提高主題劃分的準(zhǔn)確性,結(jié)合每個主題下高概率詞項(xiàng),對主題的定義進(jìn)行驗(yàn)證。刪去主題下無參考意義的詞項(xiàng),如“程度”“性質(zhì)”,最終輸出每個主題下的主要詞項(xiàng),見表1。發(fā)現(xiàn)詞項(xiàng)與主題高度相關(guān)。比如,“圖書館服務(wù)與管理”主題下,“參考咨詢”“服務(wù)質(zhì)量”“圖書館管理”等均與主題高度相關(guān),說明LDA模型在提取潛在研究主題方面是有效的。
面對1958~2019年學(xué)院數(shù)量龐大、主題豐富的研究成果,選取各階段出現(xiàn)頻次占比均值較高的前4個主題進(jìn)行分析,利用主題強(qiáng)度方法挖掘?qū)W院不同時期研究的熱點(diǎn)主題,以時間窗口T=1958-1984、1985-2000、2001-2019觀察研究的熱門主題,用顏色填充方法標(biāo)出熱門主題,見表2。
根據(jù)表2~3可知,在1958~1983年學(xué)院研究成果發(fā)表的第一個階段,研究集中于“主題2”“主題1”“主題3”“主題4”。分析每個領(lǐng)域在該階段的研究內(nèi)容,主題2主要涉及目錄學(xué)和文獻(xiàn)組織中文獻(xiàn)分類與編目基礎(chǔ)理論、方法等。陳傳夫[13]對蘇聯(lián)目錄學(xué)基本理論、書目工作方法進(jìn)行綜合概述;彭斐章、謝灼華[14]提出在實(shí)現(xiàn)“四個現(xiàn)代化”的背景下,目錄學(xué)研究面臨的研究對象、目錄學(xué)史等問題;周繼良[15]提出對“馬克思列寧主義、毛澤東思想”列為圖書分類法五大部類之一的理解?!爸黝}1”主要涉及圖書館管理的理論與方法、業(yè)務(wù)管理和人力資源管理。黃宗忠[16]從人才學(xué)基本觀點(diǎn)出發(fā),探討圖書館管理隊(duì)伍建設(shè)問題?!爸黝}3”主要涉及情報檢索語言的基礎(chǔ)理論和情報檢索系統(tǒng)等。張琪玉[17]提出一種純標(biāo)識檢索系統(tǒng)的方案,然后就其實(shí)用價值作出分析;陳光祚[18]介紹學(xué)習(xí)計(jì)算機(jī)情報檢索的意義,以及如何利用情報檢索系統(tǒng)查找資料;王昌亞[19]論述科技情報檢索刊物體系存在的缺點(diǎn),認(rèn)為根源是指導(dǎo)思想和方向不明確,建議加強(qiáng)管理、集中編制檢索刊
物。“主題4”主要涉及在社會主義現(xiàn)代化建設(shè)新時期,圖書情報教育如何用新思路進(jìn)行改革等。1980年代初起,謝灼華致力于圖書館史學(xué)學(xué)科建設(shè)研究,建議在本科課程教學(xué)基礎(chǔ)上建立完整的圖書館史教育層次,通過教材建設(shè)構(gòu)建圖書館史學(xué)科體系[20]。1983年在國家科委和武大支持下,嚴(yán)怡民等聯(lián)合創(chuàng)辦全國第一個科技情報培訓(xùn)中心,我國情報教育基地建設(shè)邁上新臺階[21]。
表1 研究主題及主要概率詞項(xiàng)
表2 不同時間窗口t下的熱點(diǎn)主題
表3 不同時期top4熱門主題
在1984~2000年學(xué)院研究成果發(fā)表的第二個階段,研究主題包括“主題2”“主題7”“主題1”“主題10”,編輯出版學(xué)和信息經(jīng)濟(jì)學(xué)成為該時期研究熱點(diǎn)。在“主題2”中,目錄學(xué)與文獻(xiàn)分類的編目理論研究不斷深化,關(guān)于計(jì)算機(jī)分類、編目的研究增多。陳傳夫[22]論述現(xiàn)代“新目錄學(xué)”的基本流派;司莉等[23]探討因特網(wǎng)資源編目的特點(diǎn),介紹OCLC網(wǎng)上資源編目計(jì)劃?!爸黝}7”主要涉及電子出版物、網(wǎng)絡(luò)出版物、出版經(jīng)濟(jì)、高校出版類課程建設(shè)等研究。彭建炎[24]論述出版業(yè)的價格、稅收、信貸等出版經(jīng)濟(jì)政策的作用與制定;方卿[25]提出推進(jìn)平衡書業(yè)的產(chǎn)銷關(guān)系整合等舉措以推動書業(yè)產(chǎn)銷關(guān)系平衡;徐麗芳等[26]界定網(wǎng)絡(luò)出版,將其區(qū)分為主題討論型、定期或不定期型、數(shù)據(jù)庫型、綜合型4 類。在“主題1”中,隨著信息技術(shù)發(fā)展,研究主題轉(zhuǎn)向圖書館管理與服務(wù)的信息管理系統(tǒng)、自動化管理等方面。黃宗忠[27]針對圖書館管理體制不健全等問題,提出由封閉管理型轉(zhuǎn)向開放管理型等思路?!爸黝}10”主要涉及信息經(jīng)濟(jì)學(xué)概念、信息經(jīng)濟(jì)學(xué)與情報經(jīng)濟(jì)學(xué)關(guān)系、微觀經(jīng)濟(jì)學(xué)等。馬費(fèi)成[28]討論信息經(jīng)濟(jì)學(xué)涉及的主要領(lǐng)域,以此為基礎(chǔ)進(jìn)一步闡明信息與情報等概念在我國情報工作中的背景,專著《信息經(jīng)濟(jì)學(xué)》連續(xù)多年被評為經(jīng)濟(jì)學(xué)、情報學(xué)領(lǐng)域的高被引圖書。
在2001~2019年學(xué)院研究成果發(fā)表的第三個階段,研究主題集中于“主題2”“主題3”“主題11”“主題4”。信息組織依然是關(guān)注的主題,隨著21世紀(jì)信息化、網(wǎng)絡(luò)化發(fā)展,數(shù)字信息資源建設(shè)、網(wǎng)絡(luò)信息計(jì)量、信息素質(zhì)教育成為新的研究熱點(diǎn)?!爸黝}2”研究集中在信息組織理論、網(wǎng)絡(luò)信息組織、本體、語義網(wǎng)、自動標(biāo)引和分類等方面。胡昌平等[29]從個性化服務(wù)的資源定位等多重定位出發(fā),構(gòu)建以需求為導(dǎo)向的信息資源組織目標(biāo)控制體系;周耀林等[30]基于本體理論,構(gòu)建非遺信息資源組織與檢索研究框架。在“主題3”中,引文分析理論文章減少,應(yīng)用研究增多,包括期刊引文分析、文獻(xiàn)需求分析、數(shù)據(jù)庫開發(fā)應(yīng)用、網(wǎng)絡(luò)信息資源定性評價、網(wǎng)絡(luò)測評大學(xué)等。邱均平等[31]討論了網(wǎng)絡(luò)計(jì)量學(xué)的研究對象、工具及其5個主要應(yīng)用。“主題11”主要涉及資源整合、數(shù)據(jù)庫建設(shè)、網(wǎng)絡(luò)信息資源開發(fā)與利用、信息資源共建共享等。肖希明等[32]剖析數(shù)字閱讀在資源結(jié)構(gòu)等方面對圖書館信息資源建設(shè)的影響,提出圖書館應(yīng)本著虛實(shí)并重的方針開發(fā)網(wǎng)絡(luò)資源,推動公共數(shù)字文化資源整合;李綱等[33]比較垂直型、水平型、網(wǎng)絡(luò)型3 種信息資源共享模式,對館際互借、網(wǎng)絡(luò)檢索等共享模式進(jìn)行社會收益成本分析。“主題4”研究方向發(fā)展為研究信息素質(zhì)教育、數(shù)字信息素質(zhì)教育課程模式、網(wǎng)絡(luò)環(huán)境下用戶信息素質(zhì)培養(yǎng)等方面。黃如花團(tuán)隊(duì)發(fā)表“信息素養(yǎng)教育與MOOC”系列專題論文,全面調(diào)研MOOC 環(huán)境下的課程開設(shè)現(xiàn)狀和需求,推動整個行業(yè)對MOOC教學(xué)模式有更深入的了解[34]。
圖3 熱門主題演化趨勢圖
為從宏觀上展示研究主題的演化趨勢,本文呈現(xiàn)實(shí)驗(yàn)所得熱門主題強(qiáng)度值。受篇幅限制,選取主題強(qiáng)度排在前5 位的主題,包括“主題2”“主題6”“主題7”“主題1”“主題3”,繪制不同主題1958~2019年強(qiáng)度變化的折線圖,見圖3。
依據(jù)主題強(qiáng)度變化,得出以下結(jié)論:總的來說,前期各主題強(qiáng)度值的跨度較大,同一時期不同主題之間的強(qiáng)度差異較大,而后期主題之間強(qiáng)度差異縮小,并趨于平衡和穩(wěn)定。以2000年為對比關(guān)鍵點(diǎn),2000年前的波動幅度較2000年后的波動高,說明學(xué)院的主要研究方向越來越明確,對各主題有更好的把握。
具體來說,“主題2目錄學(xué)與信息組織”熱度維持高水平,關(guān)注度保持穩(wěn)定。武漢大學(xué)是最早研究信息組織的機(jī)構(gòu)之一,多與北京大學(xué)、南京大學(xué)等研究機(jī)構(gòu)合作,是信息組織研究的重要力量[35]。1990 年代前對館藏文獻(xiàn)進(jìn)行整序和整合,研究文獻(xiàn)分類和編目,相關(guān)研究為圖書分類法、書目工作、布魯塞爾分類法等。1983 年嚴(yán)怡民主編的《情報學(xué)概論》出版,以情報組織與利用為主線,融合情報學(xué)各領(lǐng)域研究成果構(gòu)建情報學(xué)體系,是國內(nèi)第一部系統(tǒng)論述情報學(xué)主要研究領(lǐng)域的著作[21]。1986 年彭斐章等翻譯出版《目錄學(xué)普通教程》,是全面研究書目情報理論的開端[36]。1990 年代掀起中圖法研究熱潮,并出現(xiàn)計(jì)算機(jī)在分類領(lǐng)域的應(yīng)用,涉及術(shù)語有中圖法、自動標(biāo)引、聯(lián)機(jī)編目等。目錄學(xué)在書目實(shí)踐中不斷創(chuàng)新,書目情報理論逐漸建立并成熟,彭斐章的現(xiàn)代目錄學(xué)思想為創(chuàng)立中國特色的現(xiàn)代目錄學(xué)做出了貢獻(xiàn)[37]。目錄學(xué)涉及術(shù)語有現(xiàn)代目錄學(xué)、機(jī)讀目錄、數(shù)目數(shù)據(jù)庫等,見圖4。21世紀(jì)“圖書分類學(xué)”“文獻(xiàn)分類學(xué)”逐漸被信息組織替代,隨著網(wǎng)絡(luò)普及,研究網(wǎng)絡(luò)信息分類和元數(shù)據(jù)編目的論文增多,研究內(nèi)容從基于元數(shù)據(jù)的信息組織向基于本體的知識組織方向發(fā)展。隨著大數(shù)據(jù)時代到來,目錄學(xué)新觀點(diǎn)和新理念層出不窮,見圖5。
“主題1圖書館服務(wù)與管理”“主題7編輯出版學(xué)”總體上呈下滑趨勢,其中“圖書館服務(wù)與管理”研究在1980年時熱度排名第一,21世紀(jì)后跌至第五。究其原因,學(xué)院對這兩大熱點(diǎn)主題的研究相對成熟,主題強(qiáng)度略有降低。
圖4 21世紀(jì)前的目錄學(xué)與信息組織關(guān)鍵詞共現(xiàn)圖
圖5 21世紀(jì)以來的目錄學(xué)與信息組織關(guān)鍵詞共現(xiàn)圖
圖6 21世紀(jì)前的圖書館管理與服務(wù)關(guān)鍵詞共現(xiàn)圖
圖7 21世紀(jì)以來的圖書館管理與服務(wù)關(guān)鍵詞共現(xiàn)圖
圖8 21世紀(jì)前的編輯出版學(xué)關(guān)鍵詞共現(xiàn)圖
改革開放后,“圖書館服務(wù)與管理”研究逐漸由經(jīng)驗(yàn)主導(dǎo)向理性與經(jīng)驗(yàn)相結(jié)合轉(zhuǎn)變,論文中多涉及“讀者服務(wù)”“讀者工作”等,見圖6。隨著數(shù)字化、網(wǎng)絡(luò)化發(fā)展,圖書館服務(wù)功能從單一型文獻(xiàn)傳遞服務(wù)向多元化信息服務(wù)方向發(fā)展,自動化技術(shù)和網(wǎng)絡(luò)技術(shù)對圖書館管理產(chǎn)生重要影響,傳統(tǒng)的科學(xué)管理逐漸演變?yōu)樾畔①Y源管理。21 世紀(jì)以來,學(xué)者的研究關(guān)注用戶需要解決的問題,依據(jù)用戶情景,建立知識服務(wù)和知識管理核心能力,促進(jìn)圖書館服務(wù)與管理理論體系的成熟,相關(guān)術(shù)語主要涉及“數(shù)字圖書館”“個性化信息服務(wù)”“知識管理”“數(shù)字參考咨詢”,見圖7。胡昌平長期從事信息服務(wù)與用戶研究,他認(rèn)為包括圖書館在內(nèi)的信息機(jī)構(gòu)在進(jìn)行信息資源組織開發(fā)的活動中,最終必須面向用戶[38]。
圖9 21世紀(jì)以來的編輯出版學(xué)關(guān)鍵詞共現(xiàn)圖
圖10 21世紀(jì)前的信息檢索關(guān)鍵詞共現(xiàn)圖
圖11 21世紀(jì)以來的信息檢索關(guān)鍵詞共現(xiàn)圖
在“主題7 編輯出版學(xué)”領(lǐng)域,1983年孫冰炎領(lǐng)頭創(chuàng)建全國第一個圖書發(fā)行專業(yè)[39],填補(bǔ)了高校專業(yè)建設(shè)的空白[40]。21世紀(jì)前“編輯出版學(xué)”形成出版學(xué)基礎(chǔ)理論與管理、網(wǎng)絡(luò)與電子出版、出版物市場營銷、編輯出版史與出版文化4 個研究方向[41]。新世紀(jì)以來“編輯出版學(xué)”研究朝著互聯(lián)網(wǎng)環(huán)境下出版業(yè)現(xiàn)狀與問題研究、出版產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型及其版權(quán)保護(hù)等方向發(fā)展,涉及術(shù)語有“數(shù)字出版”“版權(quán)保護(hù)”“出版產(chǎn)業(yè)”等,見圖8~9。1998年以來,學(xué)院在出版營銷領(lǐng)域發(fā)文量居全國第一。21世紀(jì)以來,方卿、張美娟等長期關(guān)注出版營銷,貢獻(xiàn)突出[42]。黃先蓉等在數(shù)字出版產(chǎn)業(yè)政策等領(lǐng)域有較高參與度,為核心研究人員[43]。
“主題3信息檢索”“主題6信息計(jì)量”在個別年份有比較小的波動,但從總體看強(qiáng)度變化并不大,一直穩(wěn)定發(fā)展。改革開放初期,信息檢索研究主要圍繞檢索工具的使用和分類。如圖10所示,到20 世紀(jì)八九十年代,由于引入新的標(biāo)引技術(shù)和聯(lián)機(jī)服務(wù),出現(xiàn)一批以自動標(biāo)引和聯(lián)機(jī)檢索為主題的研究成果,推動信息檢索研究達(dá)到一個小高峰。21世紀(jì)后,信息檢索研究趨向于網(wǎng)絡(luò)搜索核心技術(shù)和知識化的信息檢索服務(wù),“信息檢索”與“搜索引擎”“本體”“互聯(lián)網(wǎng)”“元數(shù)據(jù)”共現(xiàn)次數(shù)最多,見圖11。陸偉、吳丹是知識檢索研究的重要力量,發(fā)文量較多,貢獻(xiàn)較大[44]。
圖12 21世紀(jì)前的信息計(jì)量關(guān)鍵詞共現(xiàn)圖
圖13 21世紀(jì)以來的信息計(jì)量關(guān)鍵詞共現(xiàn)圖
信息計(jì)量研究,21 世紀(jì)前集中于三大經(jīng)典定律、對期刊的統(tǒng)計(jì)分析、引文分析方面,討論曲線的參數(shù)取值、文獻(xiàn)半生期半衰期、學(xué)科發(fā)展趨勢等問題,見圖12。1980年代,馬費(fèi)成系統(tǒng)討論布拉德福文獻(xiàn)分布概率模型、布魯克斯情報學(xué)的基本理論模型,其成果成為我國文獻(xiàn)計(jì)量學(xué)和信息計(jì)量學(xué)研究的基礎(chǔ)。1990年代,他敏銳地提出信息計(jì)量從語法層次向語義和語用層次發(fā)展,該理論成為我國20多年來學(xué)科發(fā)展 的 基 線[45]。21 世 紀(jì)后,網(wǎng)絡(luò)計(jì)量分析、引文分析應(yīng)用研究逐漸成為增長點(diǎn),主要討論網(wǎng)絡(luò)信息計(jì)量學(xué)的研究對象和研究內(nèi)容、期刊評價、學(xué)科引文評價等,見圖13。邱均平研究團(tuán)體貢獻(xiàn)大,他是國內(nèi)信息計(jì)量與科學(xué)評價研究主要學(xué)術(shù)帶頭人[46]。
本文運(yùn)用LDA主題模型和共詞分析法相結(jié)合的方法,揭示學(xué)術(shù)論文在不同時期研究熱點(diǎn)的內(nèi)容發(fā)展和主題演變特征。以1958~2019年CNKI 數(shù)據(jù)庫收錄的學(xué)院論文為研究對象,抽取14個主題;分析不同時期主題強(qiáng)度排在前4 位的主題,繪制綜合主題強(qiáng)度排名前五位的主題演化趨勢圖,構(gòu)建不同時期的關(guān)鍵詞共現(xiàn)圖。研究發(fā)現(xiàn):武漢大學(xué)信息管理學(xué)院在守正中不斷實(shí)現(xiàn)新突破,在守正創(chuàng)新中保持強(qiáng)勁發(fā)展態(tài)勢;在繼承和發(fā)揚(yáng)前輩學(xué)者的治學(xué)作風(fēng)和科研精神的基礎(chǔ)上,學(xué)院在不同時期都會出現(xiàn)新的研究熱點(diǎn),且在各個領(lǐng)域都有突出成就,守正不渝,創(chuàng)新不止,不斷開創(chuàng)信息管理領(lǐng)域育人和科研新局面。
經(jīng)過百年年薪火相傳,文華圖專發(fā)展成信息管理學(xué)院,每個時代皆成就斐然。如今武漢大學(xué)信息管理學(xué)院已成為擁有圖書館學(xué)、情報學(xué)、檔案學(xué)、出版科學(xué)、信息管理與信息系統(tǒng)、電子商務(wù)、信息資源管理、管理科學(xué)與工程等學(xué)科的綜合性研究型信息管理教育與研究機(jī)構(gòu)[47]。由于武大信息管理學(xué)院歷史悠久,名師薈萃,鴻儒云集,成果豐碩,內(nèi)容寬廣,本文無論是數(shù)據(jù)還是分析,難免掛一漏萬。
謹(jǐn)以此文恭賀武漢大學(xué)信息管理學(xué)院百年華誕,祝愿學(xué)院實(shí)現(xiàn)更大飛躍,邁上新高峰!