姜 濤,趙俊玲
(1.河北大學(xué),河北 保定 071000 2.河北大學(xué)管理學(xué)院,河北 保定 071000)
文獻(xiàn)計量學(xué)是以文獻(xiàn)本身及其所表現(xiàn)出來的題名、著者、參考文獻(xiàn)及文獻(xiàn)內(nèi)容等一切與文獻(xiàn)有關(guān)的文獻(xiàn)計量特征為研究對象,通過數(shù)學(xué)、統(tǒng)計學(xué)等的計量方法,研究文獻(xiàn)信息的分布結(jié)構(gòu)、數(shù)量關(guān)系、變化規(guī)律和定量管理,并進(jìn)而探討科學(xué)技術(shù)的某些結(jié)構(gòu)、特征和規(guī)律的一門科學(xué)[1]。我國文獻(xiàn)計量學(xué)的研究隨著情報學(xué)學(xué)科的建立和發(fā)展,在理論研究與實際應(yīng)用方面均取得了長足的發(fā)展,目前已經(jīng)在許多學(xué)科中廣泛的應(yīng)用,是情報學(xué)中最活躍、發(fā)展最迅速的專業(yè)領(lǐng)域之一。知識爆炸的時代,醫(yī)學(xué)相關(guān)信息海量激增,醫(yī)務(wù)工作者由于時間缺乏,檢索能力差等原因,很難從大量醫(yī)學(xué)信息中查找相關(guān)知識,文獻(xiàn)計量分析為醫(yī)務(wù)工作者提供了一種方便快捷可靠度高的醫(yī)學(xué)情報情報信息獲取途徑。隨著現(xiàn)代信息技術(shù)的飛速發(fā)展,文獻(xiàn)計量分析在醫(yī)學(xué)中的應(yīng)用也越來越廣泛,本文探討醫(yī)學(xué)文獻(xiàn)計量分析的研究現(xiàn)狀,現(xiàn)報道如下。
1.1 一般資料:本文的文獻(xiàn)數(shù)據(jù)來源范圍限定在《中國學(xué)術(shù)期刊全文數(shù)據(jù)庫(CJFD)》“醫(yī)藥衛(wèi)生科技”專輯,以“文獻(xiàn)計量”為主題進(jìn)行精確檢索,檢索出977條符合條件的論文,導(dǎo)入Excel中以方便統(tǒng)計。借助Excel剔除會議通知等非論文文獻(xiàn),并通過查檢剔除非相關(guān)文獻(xiàn),最終得到的有效記錄為740條。
1.2 方法:詞頻分析法是常用的文獻(xiàn)計量學(xué)方法之一,是利用某一研究領(lǐng)域文獻(xiàn)中的關(guān)鍵詞頻次高低來確定該研究領(lǐng)域的研究熱點和研究現(xiàn)狀。關(guān)鍵詞是論文的文獻(xiàn)檢索標(biāo)識,是表達(dá)文獻(xiàn)主題概念的自然語言詞匯,能夠簡單、直接、較為全面地概括論文的核心研究內(nèi)容[2]。
共詞分析法是利用某一研究領(lǐng)域文獻(xiàn)中關(guān)鍵詞共同出現(xiàn)的情況,來確定該研究領(lǐng)域中各關(guān)鍵詞之間的關(guān)系[3]。一對關(guān)鍵詞在文獻(xiàn)中出現(xiàn)的頻次越高,它們之間的關(guān)系越緊密。因此,構(gòu)建出醫(yī)學(xué)文獻(xiàn)計量分析期刊論文的高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),其節(jié)點之間的關(guān)系就可以反映出該領(lǐng)域主題內(nèi)容的親疏關(guān)系,通過分析該共現(xiàn)網(wǎng)絡(luò)就能夠得到醫(yī)學(xué)文獻(xiàn)計量分析的研究現(xiàn)狀。
本文將在對醫(yī)學(xué)文獻(xiàn)計量分析相關(guān)的期刊論文進(jìn)行頻次分析和共詞分析的基礎(chǔ)之上,結(jié)合相關(guān)文獻(xiàn)的具體內(nèi)容,總結(jié)該領(lǐng)域的研究現(xiàn)狀。
1.3 應(yīng)用軟件:應(yīng)用Bibexcel和Netdraw軟件對數(shù)據(jù)進(jìn)行處理。
2.1 高頻關(guān)鍵詞:利用Bibexcel對醫(yī)學(xué)文獻(xiàn)計量分析相關(guān)論文的關(guān)鍵詞進(jìn)行統(tǒng)計,得到1673個關(guān)鍵詞,將其頻次降序排列,其中頻次不小于十次的高頻關(guān)鍵詞見表1。
表1 高頻關(guān)鍵詞及詞頻
2.2 高頻關(guān)鍵詞共詞網(wǎng)絡(luò):使用Netdraw軟件繪制醫(yī)學(xué)文獻(xiàn)分析的共詞網(wǎng)絡(luò),選取共現(xiàn)3次以上的關(guān)鍵詞予以顯示,如圖1所示。節(jié)點大小反映與其它節(jié)點的連接次數(shù)的多少,節(jié)點之間連線的粗細(xì)反映節(jié)點之間共同出現(xiàn)的頻次,頻次越高表示節(jié)點之間關(guān)系越密切。
通過詞頻分析和共詞分析的結(jié)果,結(jié)合醫(yī)學(xué)文獻(xiàn)計量分析論文進(jìn)行內(nèi)容分析,對醫(yī)學(xué)文獻(xiàn)計量分析的目的,對象,數(shù)據(jù)來源和分析方法進(jìn)行討論。
3.1 醫(yī)學(xué)文獻(xiàn)計量分析的目的:①期刊評價:利用醫(yī)學(xué)文獻(xiàn)計量分析對某一種或一類期刊進(jìn)行評價,確定該刊的發(fā)展現(xiàn)狀以及在同類期刊中的地位和作用。②個人或機(jī)構(gòu)評價:利用文獻(xiàn)計量學(xué)方法確定某一領(lǐng)域的核心期刊,高產(chǎn)作者,高產(chǎn)機(jī)構(gòu)等。③研究熱點預(yù)測:利用醫(yī)學(xué)文獻(xiàn)計量分析得到某一研究領(lǐng)域的研究熱點和研究現(xiàn)狀。
3.2 醫(yī)學(xué)文獻(xiàn)計量分析的對象:①以某一種或某一類醫(yī)學(xué)期刊為對象進(jìn)行文獻(xiàn)計量分析。②以某一研究領(lǐng)域的文獻(xiàn)為對象進(jìn)行醫(yī)學(xué)文獻(xiàn)計量分析,例如藥物不良反應(yīng)、艾滋病、中醫(yī)藥、醫(yī)院管理或生物材料等。
3.3 醫(yī)學(xué)文獻(xiàn)計量分析的數(shù)據(jù)來源:①SCI(科學(xué)引文索引)數(shù)據(jù)庫:SCI(Science Citation Index)是1961年由美國科學(xué)信息研究所(ISI)創(chuàng)建的引文數(shù)據(jù)庫,是世界三大科技文獻(xiàn)檢索系統(tǒng)之一,是世界公認(rèn)的科學(xué)統(tǒng)計與評價的重要數(shù)據(jù)來源。②PubMed數(shù)據(jù)庫:PubMed是由美國國立醫(yī)學(xué)圖書館開發(fā)的Entrez檢索系統(tǒng)的一部分,是世界公認(rèn)的最權(quán)威的免費的大型醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫,現(xiàn)有1950年以來的2200多萬篇文獻(xiàn)的記錄,涉及40多個語種,每年增加60余萬條文獻(xiàn)記錄。其中最重要的MEDLINE數(shù)據(jù)庫收錄1966以來的70余個國家5000余種生物醫(yī)學(xué)期刊的題錄與文摘。③CBMdisc(中國生物醫(yī)學(xué)文獻(xiàn))數(shù)據(jù)庫:CBMdisc是中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所創(chuàng)建的綜合性醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫,收錄了1978以來的近1800余種中國期刊,以及匯編、會議論文的文獻(xiàn)題錄700余萬篇,全部題錄均進(jìn)行主題標(biāo)引和分類標(biāo)引等規(guī)范化加工處理,年增文獻(xiàn)40余萬篇[4]。
3.4 醫(yī)學(xué)文獻(xiàn)計量分析方法:①載文分析:載文分析一般應(yīng)用在期刊評價中,是對某一種或一類期刊的載文情況進(jìn)行分析,主要分析內(nèi)容包括載文量,載文質(zhì)量,參考文獻(xiàn)量,篇均引文率,基金支持情況等等。②著者分析:著者分析的主要分析內(nèi)容包括高產(chǎn)作者,合著情況。高產(chǎn)作者,是指某一研究領(lǐng)域中論文發(fā)表數(shù)量相對很多的少數(shù)幾個著者,這些著者在該領(lǐng)域中非常活躍,可以認(rèn)定為該領(lǐng)域的核心領(lǐng)軍人物。隨著科技的飛速發(fā)展,醫(yī)學(xué)研究的廣度、深度不斷增加,專業(yè)化程度越來越高,分工越來越精細(xì),一些大型的復(fù)雜的科研實驗往往需要不同學(xué)科學(xué)者的合作,科研合作日趨頻繁。合著情況在一定程度上能夠反映科研合作趨勢,某一研究領(lǐng)域著者合作度越高,表明該領(lǐng)域信息共享和科研合作交往較多,有利于該領(lǐng)域發(fā)展。③引文分析:引文分析是利用各種數(shù)學(xué)及統(tǒng)計學(xué)的方法和比較、歸納、抽象、概括等邏輯方法,對科學(xué)期刊、論文、著者等各種分析對象的引證與被引證現(xiàn)象進(jìn)行分析,以揭示其數(shù)量特征和內(nèi)在規(guī)律的一種文獻(xiàn)計量分析方法[5]。引文分析是文獻(xiàn)計量學(xué)中的應(yīng)用最為廣泛的方法之一,主要分析內(nèi)容包括引文時間分布,引文量,引文類型,引文語種,被引期刊等等。④統(tǒng)計分析、聚類分析:統(tǒng)計學(xué)方法是文獻(xiàn)計量學(xué)的最基本的方法之一,聚類分析是統(tǒng)計分析中最常用的降低維數(shù)技術(shù)的多元統(tǒng)計方法之一。統(tǒng)計分析法是利用統(tǒng)計、概率的原理對關(guān)系中各屬性進(jìn)行統(tǒng)計分析,從而找出它們之間關(guān)系和規(guī)律的一種方法。常用的統(tǒng)計分析法有聚類分析、因子分析、相關(guān)分析、多元回歸分析、多維標(biāo)度分析等。
綜上所述,大型的醫(yī)學(xué)權(quán)威數(shù)據(jù)庫如PubMed、CBMdisc等的建設(shè),深度全面的文獻(xiàn)歸類,規(guī)范化的主題詞表的標(biāo)引,使得醫(yī)學(xué)文獻(xiàn)計量分析的結(jié)果更加具有權(quán)威性、可靠性。隨著大數(shù)據(jù)時代的到來,文獻(xiàn)計量分析方法越來越多樣化,作為一門交叉科學(xué)越來越受到各領(lǐng)域?qū)<覍W(xué)者的重視。近年來可視化分析法和社會網(wǎng)絡(luò)分析方法在情報學(xué)中應(yīng)用廣泛,但在醫(yī)學(xué)文獻(xiàn)計量分析中應(yīng)用還相對比較少,可以預(yù)見這些新的方法將為醫(yī)學(xué)文獻(xiàn)計量分析開辟更廣闊的發(fā)展空間。
[1]邱均平,文獻(xiàn)計量學(xué),科學(xué)技術(shù)文獻(xiàn)出版社,1988.12-13.
[2]尹相旭,張更平,李曉菲.基于關(guān)鍵詞統(tǒng)計的情報學(xué)研究現(xiàn)狀分析[J].情報雜志,2009,28(11):38-41.
[3]李長玲,支嶺,紀(jì)雪梅,王效岳.我國情報學(xué)研究進(jìn)展——基于期刊論文關(guān)鍵詞的統(tǒng)計分析[J].圖書情報工作,2010(24):35-40.
[4]中國生物醫(yī)學(xué)服務(wù)文獻(xiàn)系統(tǒng).http://sinomed.imicams.ac.cn/,2013-11-24.
[5]邱均平,信息計量學(xué)[M],武漢大學(xué)出版社,2007.23.