袁曉園+華薇娜
〔摘要〕基于Web of Science數(shù)據(jù)庫,對中國醫(yī)學(xué)信息學(xué)國際文獻(xiàn)進行收集,采用TDA50軟件清洗數(shù)據(jù),從不同角度進行定量分析,采用社會網(wǎng)絡(luò)分析軟件繪制高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖,結(jié)合文獻(xiàn)分析和網(wǎng)絡(luò)共現(xiàn)圖探討五大研究主題。
〔關(guān)鍵詞〕醫(yī)學(xué)信息學(xué);文獻(xiàn)計量學(xué);定量分析;社會網(wǎng)絡(luò)分析;UCINET;共現(xiàn)網(wǎng)絡(luò)
1987年美國國立衛(wèi)生研究院、國家醫(yī)學(xué)信息中心第一次對醫(yī)學(xué)信息學(xué)(Medical Informatics)[1]進行定義,此后30年,醫(yī)學(xué)信息學(xué)得到高速發(fā)展。
從信息科學(xué)的角度,Ackerman等[2]提出病人、數(shù)據(jù)提供商和保健站點間,實現(xiàn)醫(yī)療信息數(shù)據(jù)標(biāo)準(zhǔn)化。1986年美國國家醫(yī)學(xué)圖書館集結(jié)多個學(xué)科團隊,研發(fā)了統(tǒng)一醫(yī)學(xué)語言系統(tǒng)(United Medical Language System),它對信息學(xué)的整體研究提供了巨大的幫助[3]。2006年Dolin[4]研究臨床文檔架構(gòu)(Clinical Document Architecture,CDA),詳細(xì)描述從HL7發(fā)展到CDA的過程,并相繼推出了CDA-R1和CDA-R2。2009年DeShazo[5]采用文獻(xiàn)計量學(xué)方法,分析過去20年間醫(yī)學(xué)信息學(xué)國際出版物的科研產(chǎn)出和研究領(lǐng)域。在中國,一些學(xué)者也從不同層面對它開展了研究[6-22]。
本文選擇文獻(xiàn)計量學(xué)的定量分析法。文獻(xiàn)計量學(xué)是采用數(shù)學(xué)和統(tǒng)計學(xué)的方法,定量分析一切知識載體的交叉科學(xué)[23]。經(jīng)過40多年發(fā)展,它已經(jīng)漸居核心地位,是與科學(xué)傳播及基礎(chǔ)理論關(guān)系密切的學(xué)術(shù)環(huán)節(jié)。現(xiàn)在全世界每年發(fā)表的文獻(xiàn)計量學(xué)學(xué)術(shù)論文約為400~500篇[24]。由于中國醫(yī)學(xué)信息學(xué)的發(fā)展越來越走向?qū)I(yè)化,作者認(rèn)為很有必要對它的文獻(xiàn)發(fā)展進行定量分析,從而掌握該領(lǐng)域的發(fā)展脈搏和研究熱點。
1數(shù)據(jù)來源及方法
11數(shù)據(jù)來源
選擇Web of Science數(shù)據(jù)庫(簡稱WOS),它是美國湯姆森科技信息集團基于WEB開發(fā)的產(chǎn)品,是大型綜合性、多學(xué)科、核心期刊引文索引數(shù)據(jù)庫。本研究選擇WOS數(shù)據(jù)庫下3個子庫SCIE(科學(xué)引文索引擴展板——1900-至今)、SSCI(社會科學(xué)引文索引——1900-至今)和A&HCI(人文藝術(shù)科學(xué)引文索引——1975-至今)。
從該數(shù)據(jù)庫收集中國大陸、臺灣、香港發(fā)表的醫(yī)學(xué)信息學(xué)的研究文獻(xiàn),檢索式采用研究方向(Research Area)作為檢索策略,檢索式設(shè)計為((SU=Medical Informatics)AND CU=(China OR Taiwan OR Hong Kong)),檢索年限為所有年限(排除2013年)進行檢索,共收集1 448篇,文獻(xiàn)類型選擇論文(Article)、會議論文(Proceeding Paper)和綜述(Review)進行精煉,收集到1 388篇。檢索時間2013-12-01。
12研究方法
本研究采用定量分析法揭示中國醫(yī)學(xué)信息學(xué)領(lǐng)域國際發(fā)文的文獻(xiàn)特征,然后采用社會網(wǎng)絡(luò)分析法,對高頻關(guān)鍵詞進行共現(xiàn)分析,借助UCINET60軟件可視化,以了解中國醫(yī)學(xué)信息學(xué)國際發(fā)文的研究主題。
21年代文獻(xiàn)量分析
科學(xué)文獻(xiàn)量是衡量科學(xué)知識量的重要尺度之一,因此某領(lǐng)域年代論文量的變化可以直觀反映該領(lǐng)域內(nèi)學(xué)科發(fā)展態(tài)勢。圖1將中國醫(yī)學(xué)信息學(xué)國際發(fā)文1 388篇文獻(xiàn)按照出版年進行匯總。
(1)萌芽階段(1976-1995):1995年以前,中國醫(yī)學(xué)信息學(xué)研究的發(fā)文量增長緩慢,每年論文量不超過15篇,有些年份甚至出現(xiàn)空缺,這段時期是中國醫(yī)學(xué)信息學(xué)研究成果走向國際的開始階段。1976年,中國香港大學(xué)的Wing,Hj[25]作為第一作者首次在國際期刊“計算機和生物醫(yī)學(xué)研究”上發(fā)表了“計算機程序?qū)π∧X——丘腦皮層信號的分析”一文。
(2)平穩(wěn)發(fā)展階段(1996-1999):1996年以后,中國醫(yī)學(xué)信息學(xué)研究進入平穩(wěn)發(fā)展的階段,每年文獻(xiàn)量基本維持在20~30篇。由于計算機和網(wǎng)絡(luò)技術(shù)的普及,中國的研究機構(gòu)開始重視發(fā)展醫(yī)學(xué)信息學(xué)的研究。
(3)快速發(fā)展階段(2000-至今):2000年以后,中國醫(yī)學(xué)信息學(xué)研究的發(fā)文量迅猛增長,每年文獻(xiàn)量均在40篇以上,2008年以后,每年的發(fā)文量平均超過100篇,2012年達(dá)到歷史的最高峰,預(yù)測2012年后,發(fā)文量還會持續(xù)地增長。
22來源期刊分析
中國醫(yī)學(xué)信息學(xué)領(lǐng)域的國際文獻(xiàn)共涉及來源期刊32種,平均每種期刊載文量=文獻(xiàn)總量/期刊種數(shù)=1388/32=4338,將期刊按照載文量進行排序,具體的統(tǒng)計情況如表1所示。
從表1顯示結(jié)果可以看出,影響因子最高的期刊是醫(yī)學(xué)互聯(lián)網(wǎng)研究雜志,IF=3768,載文12篇,占文獻(xiàn)總量的086%;其次是美國醫(yī)學(xué)信息學(xué)會志,IF=3571,載文20篇,占文獻(xiàn)總量的23%;影響因子不低于3的期刊共有2種,即上述兩個。影響因子不小于2的期刊有6種,如醫(yī)學(xué)統(tǒng)計、IEEE醫(yī)學(xué)和生物工程雜志等;另有13種期刊的影響因子在1左右;其余11種刊物沒有查到影響因子。在這32種期刊中,能查到影響因子的16種期刊出版國分別是英國5個、美國5個、荷蘭2個、愛爾蘭1個、加拿大1個、德國3個。
23重要發(fā)文機構(gòu)分析
在WOS數(shù)據(jù)庫中,對研究者名字進行區(qū)分比較復(fù)雜,特別是中國的研究者,存在中文名同音但不同字,但是英文中的表達(dá)卻相同的現(xiàn)象。為了降低研究誤差,本文不對研究者做具體分析,而是將發(fā)文機構(gòu)作為研究對象, 對科研機構(gòu)總發(fā)文量進行分析,選擇發(fā)文量在20篇以上的21所機構(gòu),如表2列出,除了來自澳大利亞的悉尼大學(xué),其余均來自臺灣、香港、中國大陸的研究機構(gòu)。其中臺灣地區(qū)的研究機構(gòu)有11所,文獻(xiàn)量占3977%; 香港地區(qū)的研究機構(gòu)5所,文獻(xiàn)量占1981%;中國大陸的研究機構(gòu)5所,文獻(xiàn)量占1491%。在此研究范圍內(nèi),可以看出目前臺灣地區(qū)的科研成果成為中國醫(yī)學(xué)信息學(xué)國際發(fā)文量的重要來源。澳大利亞的悉尼大學(xué)是重要的合作機構(gòu),所以可以放在里面,即臺灣、香港、中國大陸和悉尼大學(xué)合作的文章數(shù)較多。表2重要發(fā)文機構(gòu)的統(tǒng)計表(文獻(xiàn)量>=20)endprint
序號機構(gòu)文獻(xiàn)量百分比(%)1臺灣大學(xué)(臺灣)1369802臺灣成功大學(xué)(臺灣)926633香港中文大學(xué)(香港)896414陽明大學(xué)(臺灣)705045香港大學(xué)(香港)694976香港理工大學(xué)(香港)553967中國科學(xué)院(中國大陸)533828上海交通大學(xué)(中國大陸)503609清華大學(xué)(中國大陸)463319臺北醫(yī)科大學(xué)(臺灣)4431710香港城市大學(xué)(香港)3928111臺灣大學(xué)附屬醫(yī)院(臺灣)3928112浙江大學(xué)(中國大陸)3726713中正大學(xué)(臺灣)3625914長庚大學(xué)(臺灣)3424515交通大學(xué)(臺灣)3323816中央大學(xué)(臺灣)2618717悉尼大學(xué)(澳大利亞)2518018香港浸會大學(xué)(香港)2316619臺北榮民總醫(yī)院(臺灣)2215920復(fù)旦大學(xué)(中國大陸)2115121清華大學(xué)(臺灣)201443合作國家分析
中國醫(yī)學(xué)信息學(xué)研究的3 429位論文作者來自于36個國家,與其他國家合作的總發(fā)文量為555篇,占40%,具有鮮明的國際合作化的表現(xiàn)。表3顯示與中國研究者合作、發(fā)文量在10篇以上的研究者國籍的詳細(xì)信息。其中與中國合作最多的是來自美國的研究者,合作發(fā)文量為241篇;其次是澳大利亞的研究者,合作發(fā)文量為70篇。其他如英國、加拿大、新加坡,合作發(fā)文量分別為53篇、31篇和29篇。
41關(guān)鍵詞統(tǒng)計分析
采用TDA軟件處理1 388篇文獻(xiàn),除去沒有關(guān)鍵詞的203篇,得到1 185篇。對關(guān)鍵詞詞頻進行統(tǒng)計,表4列出詞頻不低于8的39個關(guān)鍵詞,可以看出研究集中在支持向量機、電子醫(yī)學(xué)記錄、數(shù)據(jù)挖掘、心電圖、功能選擇、圖像分割、遠(yuǎn)程醫(yī)療、分類、隨機效應(yīng)、中國傳統(tǒng)醫(yī)學(xué)、RFID、網(wǎng)絡(luò)等;同時注重醫(yī)院信息系統(tǒng)、計算機模擬、病人安全、隱私、自然語言處理、電子健康記錄和本體等;有些還涉及到神經(jīng)網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、生物力學(xué)、芯片等領(lǐng)域。
42關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析
選擇詞頻不低于8的39個關(guān)鍵詞,對其做共現(xiàn)矩陣,采用Ucinet60軟件繪制高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖,結(jié)果如圖2示,刪除了3個孤立節(jié)點。圖2中的節(jié)點表示關(guān)鍵詞,連線表示其兩端的兩個關(guān)鍵詞節(jié)點在同一篇文章中存在共現(xiàn),節(jié)點大小表示關(guān)鍵詞的點度中心度,即關(guān)鍵詞出現(xiàn)的總頻次,連線粗細(xì)表示關(guān)鍵詞的共現(xiàn)次數(shù),連線越粗,即關(guān)鍵詞共現(xiàn)越多,反之越少。
利用UCINET分析圖2中高頻關(guān)鍵詞的點度中心度、接近中心度和中間中心度,支持向量機、數(shù)據(jù)挖掘、功能選擇、遺傳算法等關(guān)鍵詞的點度中心度較高。RFID、安全、隱私、病人安全、電子醫(yī)學(xué)記錄;數(shù)據(jù)挖掘、決策樹;文本挖掘、自然語言處理、中國傳統(tǒng)醫(yī)學(xué);支持向量機、功能選擇、數(shù)據(jù)挖掘、決策樹、分類、遺傳算法、神經(jīng)網(wǎng)絡(luò);圖2高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖
功能選擇、心電圖、乳腺癌、特征提取等各組關(guān)鍵詞間的連線較粗,即表明它們在一篇文章中共現(xiàn)次數(shù)較高,當(dāng)高頻關(guān)鍵詞在同一文章中共同出現(xiàn)的次數(shù)多,則可以初步反映該領(lǐng)域的研究熱點。結(jié)合文獻(xiàn)分析和共現(xiàn)網(wǎng)絡(luò)圖,可以推出中國醫(yī)學(xué)信息學(xué)的五大研究主題:(1)電子醫(yī)學(xué)記錄的安全管理。(2)計算機自然語言處理和文本挖掘在中國傳統(tǒng)醫(yī)學(xué)診斷中的運用。(3)計算機和網(wǎng)絡(luò)對醫(yī)院信息系統(tǒng)、護理系統(tǒng)的研發(fā)和應(yīng)用。(4)統(tǒng)計方法和計算機技術(shù)在臨床檢查、疾病診斷和 治療、臨床決策中的運用。(5)統(tǒng)計方法和計算機處理對臨床醫(yī)學(xué)、研究型數(shù)據(jù)的分析和系統(tǒng)構(gòu)建。
5結(jié)語
本文采用文獻(xiàn)計量學(xué)方法,從年代發(fā)文量、來源期刊、重要發(fā)文機構(gòu)、合作國家和相關(guān)學(xué)科等進行分析,得出中國醫(yī)學(xué)信息學(xué)領(lǐng)域的研究經(jīng)歷了3個階段:萌芽階段、平穩(wěn)發(fā)展階段、快速發(fā)展階段。2008年以后,每年發(fā)文量平均超過100篇,2012年達(dá)到歷史最高峰。根據(jù)來源期刊分析,中國醫(yī)學(xué)信息學(xué)期刊分布主要集中在載文量為55篇以上的前9種期刊。發(fā)文量在20篇以上的21所機構(gòu)中,臺灣地區(qū)研究機構(gòu)成為中國醫(yī)學(xué)信息學(xué)國際發(fā)文的重要來源。從合作來看,中國醫(yī)學(xué)信息學(xué)研究具有鮮明的國際化合作趨勢,與中國合作最多的是美國、澳大利亞和英國的研究者。采用Ucinet60繪制高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖,結(jié)合文獻(xiàn)得到五大研究主題。
本研究選擇中國醫(yī)學(xué)信息學(xué)的國際發(fā)文為研究樣本,因樣本量和選擇范圍較小,如果采用被引頻次作為分析指標(biāo),不具備較強的代表性和典型性,容易產(chǎn)生抽樣誤差,當(dāng)樣本量擴大至國際范圍,在較大范圍內(nèi)進行研究可以縮小誤差變異。因此擴大樣本量和研究范圍,試評價重要學(xué)者的學(xué)術(shù)影響力,以及分析國際合作、測度它對其他學(xué)科的影響力和滲透性,都有待進一步研究。
參考文獻(xiàn)
[1]http:∥www.ncbi.nlm.nih.gov/mesh/?term=Medical+Informatics[EB].
[2]Ackerman,MJ.et al.STANDARDS FOR MEDICAL IDENTIFIERS,CODES,AND MESSAGES NEEDED TO CREATE AN EFFICIENT COMPUTER-STORED MEDICAL RECORD[J].Journal of the American Medical Informatics Association,1994,(1):1-7.
[3]Humphreys,BL.,Lindberg,DAB.,Schoolman,HM.& Barnett,GO.The Unified Medical Language System:An informatics research collaboration[J].Journal of the American Medical Informatics Association,1998,(5):1-11.
[4]Dolin,RH.et al.HL7 Clinical Document Architecture,Release 2[J].Journal of the American Medical Informatics Association,2006,(13):30-39.
[5]DeShazo J P,LaVallie D L,Wolf F M.Publication trends in the medical informatics literature:20 years of[J].BMC medical informatics and decision making,2009,9(1):7.
[6]董建成.醫(yī)學(xué)信息學(xué)的現(xiàn)狀與未來[J].中華醫(yī)院管理雜志,2004,20(4):232-235.
[7]胡兆芹,張士靖.美國醫(yī)學(xué)信息學(xué)教育現(xiàn)狀分析及啟示[J].中國高等醫(yī)學(xué)教育,2005,(3):37-40.endprint
序號機構(gòu)文獻(xiàn)量百分比(%)1臺灣大學(xué)(臺灣)1369802臺灣成功大學(xué)(臺灣)926633香港中文大學(xué)(香港)896414陽明大學(xué)(臺灣)705045香港大學(xué)(香港)694976香港理工大學(xué)(香港)553967中國科學(xué)院(中國大陸)533828上海交通大學(xué)(中國大陸)503609清華大學(xué)(中國大陸)463319臺北醫(yī)科大學(xué)(臺灣)4431710香港城市大學(xué)(香港)3928111臺灣大學(xué)附屬醫(yī)院(臺灣)3928112浙江大學(xué)(中國大陸)3726713中正大學(xué)(臺灣)3625914長庚大學(xué)(臺灣)3424515交通大學(xué)(臺灣)3323816中央大學(xué)(臺灣)2618717悉尼大學(xué)(澳大利亞)2518018香港浸會大學(xué)(香港)2316619臺北榮民總醫(yī)院(臺灣)2215920復(fù)旦大學(xué)(中國大陸)2115121清華大學(xué)(臺灣)201443合作國家分析
中國醫(yī)學(xué)信息學(xué)研究的3 429位論文作者來自于36個國家,與其他國家合作的總發(fā)文量為555篇,占40%,具有鮮明的國際合作化的表現(xiàn)。表3顯示與中國研究者合作、發(fā)文量在10篇以上的研究者國籍的詳細(xì)信息。其中與中國合作最多的是來自美國的研究者,合作發(fā)文量為241篇;其次是澳大利亞的研究者,合作發(fā)文量為70篇。其他如英國、加拿大、新加坡,合作發(fā)文量分別為53篇、31篇和29篇。
41關(guān)鍵詞統(tǒng)計分析
采用TDA軟件處理1 388篇文獻(xiàn),除去沒有關(guān)鍵詞的203篇,得到1 185篇。對關(guān)鍵詞詞頻進行統(tǒng)計,表4列出詞頻不低于8的39個關(guān)鍵詞,可以看出研究集中在支持向量機、電子醫(yī)學(xué)記錄、數(shù)據(jù)挖掘、心電圖、功能選擇、圖像分割、遠(yuǎn)程醫(yī)療、分類、隨機效應(yīng)、中國傳統(tǒng)醫(yī)學(xué)、RFID、網(wǎng)絡(luò)等;同時注重醫(yī)院信息系統(tǒng)、計算機模擬、病人安全、隱私、自然語言處理、電子健康記錄和本體等;有些還涉及到神經(jīng)網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、生物力學(xué)、芯片等領(lǐng)域。
42關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析
選擇詞頻不低于8的39個關(guān)鍵詞,對其做共現(xiàn)矩陣,采用Ucinet60軟件繪制高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖,結(jié)果如圖2示,刪除了3個孤立節(jié)點。圖2中的節(jié)點表示關(guān)鍵詞,連線表示其兩端的兩個關(guān)鍵詞節(jié)點在同一篇文章中存在共現(xiàn),節(jié)點大小表示關(guān)鍵詞的點度中心度,即關(guān)鍵詞出現(xiàn)的總頻次,連線粗細(xì)表示關(guān)鍵詞的共現(xiàn)次數(shù),連線越粗,即關(guān)鍵詞共現(xiàn)越多,反之越少。
利用UCINET分析圖2中高頻關(guān)鍵詞的點度中心度、接近中心度和中間中心度,支持向量機、數(shù)據(jù)挖掘、功能選擇、遺傳算法等關(guān)鍵詞的點度中心度較高。RFID、安全、隱私、病人安全、電子醫(yī)學(xué)記錄;數(shù)據(jù)挖掘、決策樹;文本挖掘、自然語言處理、中國傳統(tǒng)醫(yī)學(xué);支持向量機、功能選擇、數(shù)據(jù)挖掘、決策樹、分類、遺傳算法、神經(jīng)網(wǎng)絡(luò);圖2高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖
功能選擇、心電圖、乳腺癌、特征提取等各組關(guān)鍵詞間的連線較粗,即表明它們在一篇文章中共現(xiàn)次數(shù)較高,當(dāng)高頻關(guān)鍵詞在同一文章中共同出現(xiàn)的次數(shù)多,則可以初步反映該領(lǐng)域的研究熱點。結(jié)合文獻(xiàn)分析和共現(xiàn)網(wǎng)絡(luò)圖,可以推出中國醫(yī)學(xué)信息學(xué)的五大研究主題:(1)電子醫(yī)學(xué)記錄的安全管理。(2)計算機自然語言處理和文本挖掘在中國傳統(tǒng)醫(yī)學(xué)診斷中的運用。(3)計算機和網(wǎng)絡(luò)對醫(yī)院信息系統(tǒng)、護理系統(tǒng)的研發(fā)和應(yīng)用。(4)統(tǒng)計方法和計算機技術(shù)在臨床檢查、疾病診斷和 治療、臨床決策中的運用。(5)統(tǒng)計方法和計算機處理對臨床醫(yī)學(xué)、研究型數(shù)據(jù)的分析和系統(tǒng)構(gòu)建。
5結(jié)語
本文采用文獻(xiàn)計量學(xué)方法,從年代發(fā)文量、來源期刊、重要發(fā)文機構(gòu)、合作國家和相關(guān)學(xué)科等進行分析,得出中國醫(yī)學(xué)信息學(xué)領(lǐng)域的研究經(jīng)歷了3個階段:萌芽階段、平穩(wěn)發(fā)展階段、快速發(fā)展階段。2008年以后,每年發(fā)文量平均超過100篇,2012年達(dá)到歷史最高峰。根據(jù)來源期刊分析,中國醫(yī)學(xué)信息學(xué)期刊分布主要集中在載文量為55篇以上的前9種期刊。發(fā)文量在20篇以上的21所機構(gòu)中,臺灣地區(qū)研究機構(gòu)成為中國醫(yī)學(xué)信息學(xué)國際發(fā)文的重要來源。從合作來看,中國醫(yī)學(xué)信息學(xué)研究具有鮮明的國際化合作趨勢,與中國合作最多的是美國、澳大利亞和英國的研究者。采用Ucinet60繪制高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖,結(jié)合文獻(xiàn)得到五大研究主題。
本研究選擇中國醫(yī)學(xué)信息學(xué)的國際發(fā)文為研究樣本,因樣本量和選擇范圍較小,如果采用被引頻次作為分析指標(biāo),不具備較強的代表性和典型性,容易產(chǎn)生抽樣誤差,當(dāng)樣本量擴大至國際范圍,在較大范圍內(nèi)進行研究可以縮小誤差變異。因此擴大樣本量和研究范圍,試評價重要學(xué)者的學(xué)術(shù)影響力,以及分析國際合作、測度它對其他學(xué)科的影響力和滲透性,都有待進一步研究。
參考文獻(xiàn)
[1]http:∥www.ncbi.nlm.nih.gov/mesh/?term=Medical+Informatics[EB].
[2]Ackerman,MJ.et al.STANDARDS FOR MEDICAL IDENTIFIERS,CODES,AND MESSAGES NEEDED TO CREATE AN EFFICIENT COMPUTER-STORED MEDICAL RECORD[J].Journal of the American Medical Informatics Association,1994,(1):1-7.
[3]Humphreys,BL.,Lindberg,DAB.,Schoolman,HM.& Barnett,GO.The Unified Medical Language System:An informatics research collaboration[J].Journal of the American Medical Informatics Association,1998,(5):1-11.
[4]Dolin,RH.et al.HL7 Clinical Document Architecture,Release 2[J].Journal of the American Medical Informatics Association,2006,(13):30-39.
[5]DeShazo J P,LaVallie D L,Wolf F M.Publication trends in the medical informatics literature:20 years of[J].BMC medical informatics and decision making,2009,9(1):7.
[6]董建成.醫(yī)學(xué)信息學(xué)的現(xiàn)狀與未來[J].中華醫(yī)院管理雜志,2004,20(4):232-235.
[7]胡兆芹,張士靖.美國醫(yī)學(xué)信息學(xué)教育現(xiàn)狀分析及啟示[J].中國高等醫(yī)學(xué)教育,2005,(3):37-40.endprint
序號機構(gòu)文獻(xiàn)量百分比(%)1臺灣大學(xué)(臺灣)1369802臺灣成功大學(xué)(臺灣)926633香港中文大學(xué)(香港)896414陽明大學(xué)(臺灣)705045香港大學(xué)(香港)694976香港理工大學(xué)(香港)553967中國科學(xué)院(中國大陸)533828上海交通大學(xué)(中國大陸)503609清華大學(xué)(中國大陸)463319臺北醫(yī)科大學(xué)(臺灣)4431710香港城市大學(xué)(香港)3928111臺灣大學(xué)附屬醫(yī)院(臺灣)3928112浙江大學(xué)(中國大陸)3726713中正大學(xué)(臺灣)3625914長庚大學(xué)(臺灣)3424515交通大學(xué)(臺灣)3323816中央大學(xué)(臺灣)2618717悉尼大學(xué)(澳大利亞)2518018香港浸會大學(xué)(香港)2316619臺北榮民總醫(yī)院(臺灣)2215920復(fù)旦大學(xué)(中國大陸)2115121清華大學(xué)(臺灣)201443合作國家分析
中國醫(yī)學(xué)信息學(xué)研究的3 429位論文作者來自于36個國家,與其他國家合作的總發(fā)文量為555篇,占40%,具有鮮明的國際合作化的表現(xiàn)。表3顯示與中國研究者合作、發(fā)文量在10篇以上的研究者國籍的詳細(xì)信息。其中與中國合作最多的是來自美國的研究者,合作發(fā)文量為241篇;其次是澳大利亞的研究者,合作發(fā)文量為70篇。其他如英國、加拿大、新加坡,合作發(fā)文量分別為53篇、31篇和29篇。
41關(guān)鍵詞統(tǒng)計分析
采用TDA軟件處理1 388篇文獻(xiàn),除去沒有關(guān)鍵詞的203篇,得到1 185篇。對關(guān)鍵詞詞頻進行統(tǒng)計,表4列出詞頻不低于8的39個關(guān)鍵詞,可以看出研究集中在支持向量機、電子醫(yī)學(xué)記錄、數(shù)據(jù)挖掘、心電圖、功能選擇、圖像分割、遠(yuǎn)程醫(yī)療、分類、隨機效應(yīng)、中國傳統(tǒng)醫(yī)學(xué)、RFID、網(wǎng)絡(luò)等;同時注重醫(yī)院信息系統(tǒng)、計算機模擬、病人安全、隱私、自然語言處理、電子健康記錄和本體等;有些還涉及到神經(jīng)網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、生物力學(xué)、芯片等領(lǐng)域。
42關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)分析
選擇詞頻不低于8的39個關(guān)鍵詞,對其做共現(xiàn)矩陣,采用Ucinet60軟件繪制高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖,結(jié)果如圖2示,刪除了3個孤立節(jié)點。圖2中的節(jié)點表示關(guān)鍵詞,連線表示其兩端的兩個關(guān)鍵詞節(jié)點在同一篇文章中存在共現(xiàn),節(jié)點大小表示關(guān)鍵詞的點度中心度,即關(guān)鍵詞出現(xiàn)的總頻次,連線粗細(xì)表示關(guān)鍵詞的共現(xiàn)次數(shù),連線越粗,即關(guān)鍵詞共現(xiàn)越多,反之越少。
利用UCINET分析圖2中高頻關(guān)鍵詞的點度中心度、接近中心度和中間中心度,支持向量機、數(shù)據(jù)挖掘、功能選擇、遺傳算法等關(guān)鍵詞的點度中心度較高。RFID、安全、隱私、病人安全、電子醫(yī)學(xué)記錄;數(shù)據(jù)挖掘、決策樹;文本挖掘、自然語言處理、中國傳統(tǒng)醫(yī)學(xué);支持向量機、功能選擇、數(shù)據(jù)挖掘、決策樹、分類、遺傳算法、神經(jīng)網(wǎng)絡(luò);圖2高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖
功能選擇、心電圖、乳腺癌、特征提取等各組關(guān)鍵詞間的連線較粗,即表明它們在一篇文章中共現(xiàn)次數(shù)較高,當(dāng)高頻關(guān)鍵詞在同一文章中共同出現(xiàn)的次數(shù)多,則可以初步反映該領(lǐng)域的研究熱點。結(jié)合文獻(xiàn)分析和共現(xiàn)網(wǎng)絡(luò)圖,可以推出中國醫(yī)學(xué)信息學(xué)的五大研究主題:(1)電子醫(yī)學(xué)記錄的安全管理。(2)計算機自然語言處理和文本挖掘在中國傳統(tǒng)醫(yī)學(xué)診斷中的運用。(3)計算機和網(wǎng)絡(luò)對醫(yī)院信息系統(tǒng)、護理系統(tǒng)的研發(fā)和應(yīng)用。(4)統(tǒng)計方法和計算機技術(shù)在臨床檢查、疾病診斷和 治療、臨床決策中的運用。(5)統(tǒng)計方法和計算機處理對臨床醫(yī)學(xué)、研究型數(shù)據(jù)的分析和系統(tǒng)構(gòu)建。
5結(jié)語
本文采用文獻(xiàn)計量學(xué)方法,從年代發(fā)文量、來源期刊、重要發(fā)文機構(gòu)、合作國家和相關(guān)學(xué)科等進行分析,得出中國醫(yī)學(xué)信息學(xué)領(lǐng)域的研究經(jīng)歷了3個階段:萌芽階段、平穩(wěn)發(fā)展階段、快速發(fā)展階段。2008年以后,每年發(fā)文量平均超過100篇,2012年達(dá)到歷史最高峰。根據(jù)來源期刊分析,中國醫(yī)學(xué)信息學(xué)期刊分布主要集中在載文量為55篇以上的前9種期刊。發(fā)文量在20篇以上的21所機構(gòu)中,臺灣地區(qū)研究機構(gòu)成為中國醫(yī)學(xué)信息學(xué)國際發(fā)文的重要來源。從合作來看,中國醫(yī)學(xué)信息學(xué)研究具有鮮明的國際化合作趨勢,與中國合作最多的是美國、澳大利亞和英國的研究者。采用Ucinet60繪制高頻關(guān)鍵詞的共現(xiàn)網(wǎng)絡(luò)圖,結(jié)合文獻(xiàn)得到五大研究主題。
本研究選擇中國醫(yī)學(xué)信息學(xué)的國際發(fā)文為研究樣本,因樣本量和選擇范圍較小,如果采用被引頻次作為分析指標(biāo),不具備較強的代表性和典型性,容易產(chǎn)生抽樣誤差,當(dāng)樣本量擴大至國際范圍,在較大范圍內(nèi)進行研究可以縮小誤差變異。因此擴大樣本量和研究范圍,試評價重要學(xué)者的學(xué)術(shù)影響力,以及分析國際合作、測度它對其他學(xué)科的影響力和滲透性,都有待進一步研究。
參考文獻(xiàn)
[1]http:∥www.ncbi.nlm.nih.gov/mesh/?term=Medical+Informatics[EB].
[2]Ackerman,MJ.et al.STANDARDS FOR MEDICAL IDENTIFIERS,CODES,AND MESSAGES NEEDED TO CREATE AN EFFICIENT COMPUTER-STORED MEDICAL RECORD[J].Journal of the American Medical Informatics Association,1994,(1):1-7.
[3]Humphreys,BL.,Lindberg,DAB.,Schoolman,HM.& Barnett,GO.The Unified Medical Language System:An informatics research collaboration[J].Journal of the American Medical Informatics Association,1998,(5):1-11.
[4]Dolin,RH.et al.HL7 Clinical Document Architecture,Release 2[J].Journal of the American Medical Informatics Association,2006,(13):30-39.
[5]DeShazo J P,LaVallie D L,Wolf F M.Publication trends in the medical informatics literature:20 years of[J].BMC medical informatics and decision making,2009,9(1):7.
[6]董建成.醫(yī)學(xué)信息學(xué)的現(xiàn)狀與未來[J].中華醫(yī)院管理雜志,2004,20(4):232-235.
[7]胡兆芹,張士靖.美國醫(yī)學(xué)信息學(xué)教育現(xiàn)狀分析及啟示[J].中國高等醫(yī)學(xué)教育,2005,(3):37-40.endprint