劉輝,錢真真,栗洋,詹中群
隨著醫(yī)療、科研的不斷發(fā)展,關于各個疾病的研究報道呈現(xiàn)出爆炸式增長的趨勢,文獻產出是科學研究的顯性標志[1],但由于研究者水平、精力、基金支持等條件的不同,使得文獻質量參差不齊。被引頻次是反映文獻學術影響力的重要指標,代表了同行認可,在一定程度上反應了研究成果的質量,即一篇文獻的被引量越高,越能說明該文獻的觀點得到了更多該領域研究者的認可。共詞分析法自1983年由Callon等[2]學者提出后,被人們廣泛應用于研究熱點分析、學科結構揭示和信息檢索等領域[3-8]。對高被引論文進行共現(xiàn)分析更能幫助研究者了解某一領域高質量文獻所關注的主要研究熱點。近年來關于緩慢性心律失常的研究亦取得了很大進展,為了更好地研究本病近年來的發(fā)展狀況及研究熱點,本文基于CNKI數(shù)據(jù)庫,檢索近10年的關于緩慢性心律失常的文獻報道,選取高被引文獻進行分析,以期了解緩慢性心律失常近年來的研究概況及研究熱點,為科研工作者提供參考。
1.1 文獻來源 數(shù)據(jù)庫:CNKI高級檢索;檢索詞:“緩慢性心律失常”、“緩慢型心律失?!薄ⅰ靶膭舆^緩”、“病態(tài)竇房結綜合征”、“竇房結功能障礙”、“竇房傳導阻滯”、“房室傳導阻滯”、“快慢綜合征”;檢索方式:主題詞檢索;檢索時間:2009-1-1至2018-12-31。
1.2 研究方法和步驟
1.2.1 軟件工具 Excel、Bicomb2、SPSS 22.0等。
1.2.2 方法和步驟 ①利用中國知網(wǎng)的參考文獻導出功能,選擇Notefirst方式,將樣本論文的題名、作者、關鍵詞等元數(shù)據(jù)導出為XML格式,并以文本(.txt)文件格式保存;②采用書目共現(xiàn)分析系統(tǒng)Bicomb2軟件,提取樣本論文的關鍵要素并進行統(tǒng)計,導出為Excel格式文件,多方面分析和討論;③運用SPSS 22.0對高頻關鍵詞進行系統(tǒng)聚類分析;④根據(jù)分析結果,總結該領域學術研究的趨勢和熱點。
1.3 文獻納入情況 依據(jù)1.1檢索策略進行文獻搜集,累計檢索文獻8695篇,單篇最高被引量為81,借鑒普萊斯確定核心作者的方法(公式:Mp=0.749×),確定高被引論文最低被引次數(shù)為≥7,被引頻次≥7的文獻經CNKI初步除重后,累計納入文獻661篇。將661篇文獻導入Excel中進一步除重后,最終納入文獻598篇,重新檢索598篇文獻,依次錄入文獻的被引頻次,以NoteFirst格式按發(fā)表年份進行導出保存。文獻檢索、納入情況如表1。
表1 文獻檢索及納入概況
2.1 文獻被引頻次統(tǒng)計 被引頻次反映了文獻的學術影響力,截至到檢索日期(2019年9月13日),納入研究的598篇文獻,累計被引頻次7150次,平均單篇被引頻次11.96次,被引頻次<12的共400篇,占66.89%;被引頻次≥20的有50篇,占3.34%。單篇最高被引頻次為81次,為秦永文2011年發(fā)表在《介入放射學雜志》上的《常見先天性心臟病介入治療中國專家共識 二、室間隔缺損介入治療》[9]。統(tǒng)計被引頻次位于前20的文章信息,總共分布在19家期刊,其中11篇來源于核心期刊,占55%,具體見表2。
2.2 文獻發(fā)表年份及發(fā)表數(shù)量 對納入文獻進行提取論文的發(fā)表年份,匯總歷年的論文數(shù)量,統(tǒng)計被引頻次,并繪制年份-發(fā)文量-被引頻次折線圖。從圖中可以看出,2010~2012年發(fā)表的緩慢性心律失常相關文獻被引用篇數(shù)最多,平均91篇/年,共273篇文獻(45.7%),累計被引頻次3297次(46.11%),平均每篇被引11.92次。文獻發(fā)表年份統(tǒng)計見圖1。
2.3 文獻作者及者合作情況 文獻數(shù)量是衡量科研人員個人科技產出的重要指標,也是判斷一個領域核心作者群體的重要依據(jù)[10]。納入研究的598篇文獻中,涉及作者1504個,發(fā)表文章最多者為中國中醫(yī)科學院廣安門醫(yī)院的劉如秀,共7篇;有1385位(92.09%)作者均只發(fā)表1篇,93位(6.18%)作者發(fā)表2篇,17位(1.13%)作者發(fā)表3篇,7位(0.04%)作者發(fā)表4篇。
此外,科學研究一般具有合作的特點,合著率和合作度兩個指標可以有效地反映研究相互交叉、相互滲透的程度,從而反應了研究文獻的質量[11]。598篇文獻中有386篇由2位及以上作者合作完成,合著率為64.5%,文獻作者總人次達1504人次,合作度為1504×64.5%/386=2.51,2014年發(fā)表在《中醫(yī)藥通報》上的文獻《第十三講 心律失常的中醫(yī)治療》[12]署名作者人數(shù)最多,達到15人。各年份核心作者合著率和合作度情況見表3。
圖1 2009~2019年緩慢性心律失常相關文獻數(shù)量分布及被引頻次情況
表3 2009~2019年核心作者合著率和合作度情況
2.4 文獻發(fā)表機構及區(qū)域統(tǒng)計 機構發(fā)表文獻數(shù)量可以揭示研究開展的地理分布,展現(xiàn)機構的科研活躍度,評價機構的科研實力[13]。對發(fā)表機構進行統(tǒng)計,598篇文獻涉及672家機構,其中發(fā)文量最多的機構為遼寧中醫(yī)藥大學與中國中醫(yī)科學院廣安門醫(yī)院,各發(fā)表文章6篇。有652家機構發(fā)表文章為1篇,占97.02%,28家機構發(fā)文2篇,占4.17%,16家機構發(fā)文3篇,占2.38%。發(fā)文量位于前5的單位如表4。
從區(qū)域分布來看,672家機構涉及全國各個地區(qū)省份,其中以華北地區(qū)分布最多,為169篇(北京75篇,天津12篇,河北54篇,山西16篇,內蒙11篇);其次華東地區(qū)為132篇,西北地區(qū)最少,為47篇,各地區(qū)具體發(fā)文量見圖2。
表4 發(fā)文量位于前五位的機構
圖2 全國各地區(qū)發(fā)文量分布情況
2.5 文獻發(fā)表期刊分布 經統(tǒng)計,納入研究的598篇文獻共來源于234個學術期刊,其中有121個期刊發(fā)文量在2篇及以上,占51.71%;《中西醫(yī)結合心腦血管病雜志》發(fā)文量最大,共發(fā)表相關文章22篇,占3.68%,《中國中醫(yī)急癥》發(fā)表18篇,占3.01%。根據(jù)布拉德福定律(1:n:n2)確定“核心區(qū)”期刊數(shù)量約為15個,占6.41%,由于位于第15為的期刊發(fā)文量為7,有4家期刊發(fā)文量均為7,故統(tǒng)計發(fā)文量位于前18位的為“核心區(qū)”期刊,累計發(fā)文量181篇,其中核心期刊8個(占44.44%),核心期刊發(fā)文量91篇(占50.28%),具體分布見圖3。
圖3 各期刊發(fā)文量
2.6 高頻關鍵詞統(tǒng)計分析 文獻的關鍵詞可高度概括研究內容,通過分析高頻關鍵詞可以看出研究的聚焦點,是判斷研究方向的重要依據(jù)[14,15]。利用Bicomb2軟件,提取598篇論文關鍵詞信息,關鍵詞出現(xiàn)頻次,即每個關鍵詞在論文關鍵詞中出現(xiàn)的總次數(shù),根據(jù)它們出現(xiàn)的頻次,借鑒普賴斯定律確定核心要素信息確定高頻關鍵詞的詞頻下限。納入研究的598篇文獻的關鍵詞,共計關鍵詞870個,經計算高頻關鍵詞為35個,詞頻下限為9次。其中,出現(xiàn)頻次前3位的分別為心律失常、緩慢性心律失常、病態(tài)竇房結綜合征?!?次的高頻詞累計出現(xiàn)821次,占39.59%。關鍵詞統(tǒng)計見表5。
2.7 關鍵詞變遷 以上35個高頻關鍵詞反映了緩慢性心律失常的研究熱點,分析這些關鍵詞之間的關系,有助于了解該病的研究發(fā)展狀況、熱點前沿和發(fā)展方向。進一步分析關鍵詞變遷,統(tǒng)計每年發(fā)表高被引文獻的前5為關鍵,2009~2016年“緩慢性心律失常”、“心律失常”一直都是該領域的研究的重中之重,2017~2018年“動態(tài)心電圖”成為高頻關鍵詞,且開始關注“雙腔起搏器”,2009年、2016年中醫(yī)藥相關關鍵詞占比40%。
2.8 共詞分析 高頻關鍵詞反映了研究熱點,但是以上只是對這35個高頻關鍵詞進行的線性排序,需要進一步通過聚類分析,探索這些高頻關鍵詞之間的潛在關系以深入挖掘該研究領域各部分間的聯(lián)系及其共同特征[16]。聚類分析(Cluster Analysis)是物以類聚的一種統(tǒng)計分析方法,用于對事物類別的面貌尚不清楚,甚至在事前連總共有幾類都不能確定的情況下進行分類的場合[17]。運用SPSS 22.0對高頻關鍵詞矩陣進行系統(tǒng)聚類分析,繪制出緩慢性心律失常文獻高頻關鍵詞共詞聚類樹狀圖,通過系統(tǒng)聚類法得出的圖4,總結出共詞聚類分析可劃分為3個群體(表7)。從而歸納總結出2009~2018年CNKI關于緩慢性心律失常研究的熱點問題。
表5 緩慢性心律失常論文高頻關鍵詞統(tǒng)計
表6 2009~2018年詞頻居于前5位的關鍵詞分布表
表7 2009~2018年緩慢性心律失常研究關鍵詞共詞聚類群體劃分
3.1 本研究揭示的問題
3.1.1 被引頻次的時間影響因素 被引頻次在一定程度上反應了文獻質量,研究高被引文獻,可排除低質量文獻的混雜影響,本研究采用普萊斯確定核心作者的方法,確定高被引文獻的最低頻次,最終納入598篇高被引文獻,在一定程度上剔除了被引頻次較低的低質量文獻,對相對高質量文獻進行分析,更能反應學科關注的核心熱點。分析近10年的發(fā)展趨勢,2009年CNKI收錄的高被引文獻59篇,2009~2012年文獻發(fā)表達到高峰,2013年呈現(xiàn)直線下降趨勢,一是說明隨著研究深入,研究愈加全面,自2013年后,研究者對該領域的關注力度及研究熱度逐漸退卻;另一方面,由于時間因素在一定程度上可影響被引頻次,文獻發(fā)表時間越接近統(tǒng)計時間,被引頻次越低,且無法預測未來被引情況,導致一些新近發(fā)表的高質量文獻未能納入研究,可能對研究結果產生一定影響[18]。進一步分析每年納入研究的高被引文獻的平均被引頻次,發(fā)現(xiàn)從2009~2018年每年的篇被引頻次大致相同,故納入研究的文獻雖受時間因素的影響,但從平均篇被引頻次在一定程度上也能反應研究熱度,從圖1可以看出2009年以來的近10年關于緩慢性心律失常的關注程度的變化基本不大。
3.1.2 文獻作者及合作情況 緩慢性心律失常相關文獻合著率(64.5%)與合作度(2.51),說明在該領域的研究中,研究者具有良好的合作關系,但是,根據(jù)洛特卡定律[19],統(tǒng)計文獻作者情況,發(fā)現(xiàn)598篇文獻涉及作者1504人,92.09%的作者僅發(fā)表1篇相關文獻,遠大于60%,提示在該領域的研究中雖研究參與者較多,但缺乏核心研究力量。
3.1.3 文獻發(fā)表地域因素分析 分析文獻來源機構及所在區(qū)域,發(fā)現(xiàn)此類研究開展廣泛,598篇文獻涉及672家機構,各機構分布在全國各個省份,且呈現(xiàn)出“華北>華東>東北>華中>華南>西南>西北”地理分布差異,體現(xiàn)了文獻發(fā)表數(shù)量可能受文化、經濟、教育等各種因素的影響,如華北地區(qū)文化底蘊深厚,經濟、教育水平具有全國領先優(yōu)勢,文獻發(fā)表數(shù)量高達169篇(28.26%),且地區(qū)內各省份又有不同,呈現(xiàn)出“北京>河北>天津>山西>內蒙”。西北地區(qū)經濟發(fā)展緩慢,文化、教育水平較華北地區(qū)落后,其文獻發(fā)表數(shù)量亦較少,僅47篇(占7.86%)。
圖4 高頻關鍵詞聚類分析
3.1.4 期刊分布 如上所述,被引頻次反應了同行認可程度,在一定程度上代表了文獻的質量,但受時間因素的影響。統(tǒng)計期刊分布情況研究疾病領域的“核心區(qū)”期刊文獻發(fā)表情況可以看出研究專業(yè)程度和整體層次。本研究598篇文獻共發(fā)表在234各學術期刊上,113個期刊僅發(fā)表相關文獻1篇,根據(jù)“布拉德福定律”確定“核心區(qū)”期刊18個,占比僅7.69%,說明該領域核心期刊數(shù)量缺乏。
3.1.5 高頻關鍵詞及變遷、聚類分析 關鍵詞是研究內容的高度概括,關鍵詞的變遷反映了研究熱點的變化情況,35個高頻關鍵詞出現(xiàn)頻次前3位的分別為心律失常、緩慢性心律失常、病態(tài)竇房結綜合征,即對疾病的研究仍是該領域的研究重點。此外,“中醫(yī)藥療法”,“麻黃附子細辛湯”,“參松養(yǎng)心膠囊”,“參附注射液”,“炙甘草湯”,“心寶丸”,“參仙升脈口服液”,“心悸”,“中醫(yī)藥”等中醫(yī)藥相關關鍵詞累計出現(xiàn)160次,占所有高頻關鍵詞的19.5%,說明中醫(yī)藥在該領域的研究中占有重要地位。
進一步分析關鍵詞的變遷,探索研究熱點及發(fā)展趨勢2009~2012年發(fā)表的高被引論文的高頻關鍵詞,發(fā)現(xiàn)這4年的研究熱點集中在中醫(yī)藥治療上,2013年開始關注該病患者的動態(tài)心電圖研究,2017年的研究熱點增加了雙腔起搏器,2018年研究開始關注患者的生活質量,動態(tài)分析關鍵詞的變遷,隨著時間推移,對本病的研究從疾病到中西醫(yī)治療到診斷到預后及新興治療技術(雙腔起搏器)再到關注患者生活質量,表明了該領域的研究愈加全面。此外,在起搏器快速發(fā)展的現(xiàn)代科技背景下,各種起搏器的出現(xiàn)能夠迅速改善病情,解決患者不適癥狀,故未來的研究趨勢將從對該疾病的治療領域方面轉移到關注患者預后、生活質量提高等人文方面。
對高頻關鍵詞聚類分析,主要分為3大類:群體1中19個關鍵詞,詞頻261,主要為疾病的診療;群體2中5個關鍵詞,詞頻137,主要為疾病的病變類型;群體3中11個關鍵詞,詞頻212。說明近10年該領域的研究已形成大規(guī)模的研究趨勢,且在分出的各個研究方向中有較為集中深入的研究。但群體2研究相對較少,在今后的研究中應加大對該病并發(fā)癥及病變類型的研究。
3.2 本研究存在的問題
3.2.1 文獻來源的選擇 由于研究者時間、精力的限制,本研究納入的文獻為2009~2018年10年間收錄在CNKI上的相關文獻,數(shù)據(jù)庫的及文獻檢索時間較為局限,使得研究結果未能更好的概括本學科的發(fā)展,在今后的研究中可擴大數(shù)據(jù)庫的選擇及文獻發(fā)表時間,以更好的研究該領域的發(fā)展概貌。
3.2.2 被引頻次的確定 根據(jù)ESI數(shù)據(jù)庫的界定,高被引論文是指近10年來被引頻次排在前1%的論文[20],本研究參照的是普萊斯確定核心作者的方法,篩選被引頻次≥9的文獻為高被引文獻,這使得文獻的納入可能存在一定的偏差,在以后的研究中根據(jù)ESI數(shù)據(jù)庫的界定進行文獻篩選。此外,由于被引頻次受發(fā)表時間的影響,使得新近發(fā)表高質量文選未能納入研究,在今后的研究中可不對被引頻次進行限制。
3.2.3 核心期刊的確定 核心期刊是期刊中學術水平較高的刊物,是指發(fā)表關于某領域論文數(shù)量最多,使用率(包括被引率、摘轉率和流通率)較高,學術影響較大的期刊。本研究的通過被引頻次篩選相關文獻,通過對相關文獻信息資料的提取。598篇文獻共發(fā)表在234個學術期刊上,根據(jù)“布拉德福定律”確定“核心區(qū)”期刊18個,二并未對這234個期刊逐一查詢確認具體核心期刊數(shù)量,進一步分析核心期刊上的高被引文獻更能反應高質量文獻的關注熱點及學科的重點發(fā)展趨勢。在以后的研究中可先確定該領域的核心期刊,再對這些核心期刊上的高被引文獻進行研究。
綜上所述,近10年CNKI收錄的緩慢性心律失常的相關研究開展較為廣泛、研究內容覆蓋全面、部分文獻具有較高影響,但文獻核心作者及核心期刊數(shù)量不足,相關研究還有進一步發(fā)展的空間。此外,由于研究者時間及人力不足,本研究只關注了近10年CNKI收錄的高被引文獻,研究較為局限,未能反應整個研究趨勢的概貌,在以后的研究中可擴大數(shù)據(jù)庫及時間年限以全面的研究該疾病的發(fā)展歷程。