国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CNKI的2002—2013年中醫(yī)數(shù)據(jù)挖掘類(lèi)學(xué)位論文計(jì)量分析

2016-02-23 08:08朱垚袁睿陸明郭立中
關(guān)鍵詞:文獻(xiàn)計(jì)量學(xué)數(shù)據(jù)挖掘中醫(yī)藥

朱垚 袁?!£懨鳌」⒅?/p>

摘要:目的 基于文獻(xiàn)分析2002-2013年中醫(yī)數(shù)據(jù)挖掘類(lèi)學(xué)位論文情況。方法 計(jì)算機(jī)檢索中國(guó)知識(shí)資源總庫(kù)(CNKI)博碩士文獻(xiàn)庫(kù),檢索時(shí)間2013年11月。篩選中醫(yī)數(shù)據(jù)挖掘類(lèi)文獻(xiàn),從發(fā)文年份、發(fā)文院校、數(shù)據(jù)挖掘方法、研究類(lèi)型等方面進(jìn)行計(jì)量學(xué)分析。結(jié)果 共204篇文獻(xiàn)符合納入標(biāo)準(zhǔn)。2002-2013年中醫(yī)數(shù)據(jù)挖掘類(lèi)文獻(xiàn)數(shù)量呈逐年上升趨勢(shì),其中北京中醫(yī)藥大學(xué)、中國(guó)中醫(yī)科學(xué)院、廣州中醫(yī)藥發(fā)文量居前3位,分別為57、30、24篇。204篇數(shù)據(jù)挖掘類(lèi)文獻(xiàn)共使用12種不同挖掘方法,其中關(guān)聯(lián)規(guī)則為使用頻數(shù)最高方法,達(dá)111篇,占54.41%。共涉及7種研究類(lèi)型,其中病種研究類(lèi)文獻(xiàn)最多,達(dá)102篇,占50.00%。結(jié)論 數(shù)據(jù)挖掘技術(shù)逐漸成為中醫(yī)類(lèi)院校學(xué)位論文的研究熱點(diǎn),但數(shù)據(jù)挖掘技術(shù)與中醫(yī)學(xué)交叉的研究設(shè)計(jì)需進(jìn)一步加強(qiáng),且需廣泛引入適合中醫(yī)學(xué)的新型數(shù)據(jù)挖掘方法。

關(guān)鍵詞:中醫(yī)藥;數(shù)據(jù)挖掘;文獻(xiàn)計(jì)量學(xué)

DOI:10.3969/j.issn.1005-5304.2016.02.010

中圖分類(lèi)號(hào):R2-05 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-5304(2016)02-0034-03

Bibliometrics Analysis of TCM Graduation Thesis Using Data Mining Methods During 2002-2013 Based on CNKI ZHU Yao1, YUAN Rui2, LU Ming2, GUO Li-zhong1 (1. Institute of TCM Internal Medicine for Emergency and Serious Diseases, Nanjing University of Chinese Medicine, Nanjing 210029, China; 2. TCM Data Mining Center of Nanjing Medchitec Technology Limited Company, Nanjing 210029, China)

Abstract: Objective To analyze the situation of using data mining technology in TCM graduation thesis during 2002-2013 based on literature analysis. Methods Computers were used to retrieve the database of graduation thesis in CNKI. The retrieval time was from November in 2013. The thesis according with requirements were screened. Metrology analysis was conducted from the aspects of the literature issue year, literature issue colleges and universities, data mining methods and research types. Results Totally 204 papers were included. The number of papers using data mining methods in TCM graduation thesis was increasing year by year, with Beijing University of Chinese Medicine, China Academy of Chinese Medical Sciences and Guangzhou University of Chinese Medicine ranking the top three, which published 57, 30, 24 pieces of papers respectively. In this research, 12 data mining methods were found adopted in the 204 papers, of which association rule and cluster analysis (111 papers, 54.41%) were the most frequently used data mining methods, and they were mostly applied in the research of disease category. 7 types of research were involved, among which papers studying disease entities rank the most, 102 papers, occupying 50.00%. Conclusion Data mining technology has gradually become one of main research directions in TCM graduation thesis. However, the overlapping study and project between data mining technology and TCM has room for further improvement and new data mining methods that fit TCM are expected to be introduced extensively.

Key words: traditional Chinese medicine; data mining; bibliometrics

基金項(xiàng)目:國(guó)家中醫(yī)藥管理局中醫(yī)瘀熱病機(jī)重點(diǎn)研究室開(kāi)放課題(YUBJ2011KF-10);江蘇省普通高校研究生科研創(chuàng)新計(jì)劃項(xiàng)目(CXZZ13_0610)

通訊作者:郭立中,E-mail:lzg1073@sina.com

數(shù)據(jù)挖掘是指從數(shù)據(jù)中提取出隱含的過(guò)去未知的有價(jià)值的潛在信息,也是一門(mén)從大量數(shù)據(jù)或者數(shù)據(jù)庫(kù)中提取有用信息的科學(xué)。提取出的信息具備有效、新穎、易理解等特征。中醫(yī)藥專(zhuān)業(yè)研究生學(xué)位研究課題中引入數(shù)據(jù)挖掘技術(shù)最早可追溯到2002年《“方證相應(yīng)”的數(shù)據(jù)挖掘方法研究》[1]。隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)挖掘技術(shù)將越來(lái)越多地運(yùn)用到中醫(yī)學(xué)領(lǐng)域的研究中,也將逐漸成為各中醫(yī)院校、科研院所的研究熱點(diǎn)之一。

1 資料與方法

1.1 數(shù)據(jù)來(lái)源

計(jì)算機(jī)檢索中國(guó)知識(shí)資源總庫(kù)(CNKI)博碩士文獻(xiàn)庫(kù),以“數(shù)據(jù)挖掘”“中醫(yī)”為主題詞進(jìn)行檢索。檢索式:主題為“數(shù)據(jù)挖掘”and“中醫(yī)”(精確匹配)。檢索時(shí)間范圍:2002年1月-2013年11月。檢索時(shí)間:2013年11月。

1.2 篩選標(biāo)準(zhǔn)

納入標(biāo)準(zhǔn):文獻(xiàn)中涉及中醫(yī)數(shù)據(jù)挖掘內(nèi)容。排除標(biāo)準(zhǔn):只討論數(shù)據(jù)挖掘算法,無(wú)挖掘數(shù)據(jù)舉例分析。

1.3 研究方法

采用Medcase V3.2數(shù)據(jù)記錄挖掘系統(tǒng)(數(shù)理版),對(duì)文獻(xiàn)的發(fā)文年份、發(fā)文院校、數(shù)據(jù)挖掘方法、研究類(lèi)型等方面進(jìn)行計(jì)量學(xué)分析。

2 結(jié)果

2.1 文獻(xiàn)檢出情況

共檢出文獻(xiàn)247篇,經(jīng)篩選后,最終入選204篇。

2.2 發(fā)文年份分布

204篇數(shù)據(jù)挖掘類(lèi)文獻(xiàn)中,2012年發(fā)文量最多,達(dá)51篇,占25.00%。2002年發(fā)文量最少,僅占0.49%。2002-2013年,年發(fā)文量大致呈逐年上升趨勢(shì),見(jiàn)表1。

2.3 發(fā)文單位分布

204篇中醫(yī)數(shù)據(jù)挖掘類(lèi)文獻(xiàn)分布于37所院校及科研院所,其中北京中醫(yī)藥大學(xué)發(fā)文量最多,達(dá)57篇,占27.94%。發(fā)文單位以中醫(yī)藥院校為主,非中醫(yī)類(lèi)院校發(fā)文量均不足0.5%,見(jiàn)表2。

2.4 數(shù)據(jù)挖掘方法分布

204篇中醫(yī)數(shù)據(jù)挖掘類(lèi)文獻(xiàn)共使用12種數(shù)據(jù)挖掘方法,其中關(guān)聯(lián)規(guī)則為使用頻數(shù)最高方法,達(dá)111篇,占54.41%,隨機(jī)行走分析為使用率最低的挖掘方法,僅占0.49%,見(jiàn)表3。

2.5 研究類(lèi)型分布

204篇中醫(yī)數(shù)據(jù)挖掘類(lèi)文獻(xiàn)共涉及7種研究類(lèi)型,其中病種研究類(lèi)文獻(xiàn)最多,達(dá)102篇,占50.00%。中醫(yī)數(shù)據(jù)庫(kù)搭建、計(jì)算機(jī)原理與中醫(yī)結(jié)合類(lèi)文獻(xiàn)最少,僅占2.45%。見(jiàn)表4。102篇病種研究類(lèi)文獻(xiàn)涉及病種情況見(jiàn)表5。

3 討論

基于學(xué)位論文的整體性、連貫性、創(chuàng)新性,本次研究對(duì)象為2002年1月-2013年11月CNKI博碩士文獻(xiàn)庫(kù)中中醫(yī)數(shù)據(jù)挖掘類(lèi)學(xué)位論文。通過(guò)年份分布統(tǒng)計(jì),發(fā)現(xiàn)國(guó)內(nèi)最早涉及中醫(yī)學(xué)與數(shù)據(jù)挖掘的學(xué)位論文出現(xiàn)于2002年,且前4年發(fā)展進(jìn)度比較緩慢。從2006年開(kāi)始,伴隨著中醫(yī)信息化工作的開(kāi)展,數(shù)據(jù)挖掘技術(shù)與中醫(yī)學(xué)相結(jié)合的學(xué)位論文開(kāi)始大幅度提升,并于2012年達(dá)到51篇。因檢索時(shí)間為2013年11月,許多2013年6月畢業(yè)論文未上傳,導(dǎo)致所統(tǒng)計(jì)2013年發(fā)文量減少。隨著數(shù)據(jù)挖掘分析技術(shù)與中醫(yī)學(xué)越來(lái)越緊密的結(jié)合,未來(lái)此類(lèi)學(xué)位論文將呈增長(zhǎng)趨勢(shì)。

發(fā)文單位以北京中醫(yī)藥大學(xué)最多(57篇),廣州中醫(yī)藥大學(xué)和中國(guó)中醫(yī)科學(xué)院分列2、3位,分別有30、24篇學(xué)位論文。其次為成都中醫(yī)藥大學(xué)、黑龍江中醫(yī)藥大學(xué)、南京中醫(yī)藥大學(xué)、山東中醫(yī)藥大學(xué)等國(guó)內(nèi)知名大學(xué)的數(shù)據(jù)挖掘類(lèi)學(xué)位論文篇數(shù)呈增長(zhǎng)趨勢(shì)。另外,從表2中發(fā)現(xiàn)包括南京大學(xué)、清華大學(xué)、浙江大學(xué)等一批非中醫(yī)藥類(lèi)大學(xué)也都有數(shù)據(jù)挖掘與中醫(yī)學(xué)相結(jié)合的學(xué)位論文,從中反映出各大院校都加強(qiáng)了交叉學(xué)科的相互運(yùn)用與配合。

204篇中醫(yī)數(shù)據(jù)挖掘類(lèi)文獻(xiàn)中,使用關(guān)聯(lián)規(guī)則的論文達(dá)111篇(54.41%),聚類(lèi)分析達(dá)69篇(33.82%)。使用典型相關(guān)分析、ROC曲線、薈萃、隨機(jī)行走分析等較為特殊的數(shù)據(jù)挖掘方法的論文較少。中醫(yī)院校的學(xué)生應(yīng)加強(qiáng)對(duì)數(shù)據(jù)挖掘方法的學(xué)習(xí),了解如何使用多種挖掘方法進(jìn)行數(shù)據(jù)的分析[2]。

文獻(xiàn)、配方、實(shí)驗(yàn)、病機(jī)方面研究論文每類(lèi)型25篇左右,而病種研究類(lèi)論文達(dá)102篇,表明目前數(shù)據(jù)挖掘分析主要運(yùn)用在各疾病的研究[3]。表5顯示,在102篇病種研究的論文中,討論內(nèi)分泌代謝疾病的論文為最多,而討論免疫系統(tǒng)疾病的論文僅2篇,表明目前數(shù)據(jù)挖掘方法對(duì)于不同病種的支持度參差不齊。

此次通過(guò)中醫(yī)數(shù)據(jù)挖掘?qū)W位論文的梳理,發(fā)現(xiàn)從2002年出現(xiàn)第一篇中醫(yī)學(xué)與數(shù)據(jù)挖掘結(jié)合的學(xué)位論文,到2012年達(dá)到51篇學(xué)位論文,短短11年間此類(lèi)論文增長(zhǎng)達(dá)50倍。越來(lái)越多的院校關(guān)注到中醫(yī)學(xué)與數(shù)據(jù)挖掘的重要性及實(shí)用性。但從中也不難看出,此類(lèi)數(shù)據(jù)挖掘?qū)W位論文面臨挖掘方法單一的困境,其中高達(dá)88.23%的論文使用關(guān)聯(lián)規(guī)則或聚類(lèi)分析為主要挖掘方法,較為特殊和復(fù)雜的數(shù)據(jù)挖掘方法在中醫(yī)院校的學(xué)位論文中使用率極低,加強(qiáng)中醫(yī)院校學(xué)生的數(shù)據(jù)挖掘知識(shí)培訓(xùn)成為當(dāng)務(wù)之急,如何正確選擇挖掘方法,了解研究類(lèi)型與目的,成為今后各中醫(yī)院校開(kāi)展交叉學(xué)科設(shè)計(jì)的教學(xué)重點(diǎn)。此外,國(guó)內(nèi)目前進(jìn)行數(shù)據(jù)挖掘工具主要使用IBM SPSS與Microsoft SQL Server等國(guó)外主流非中醫(yī)類(lèi)數(shù)據(jù)挖掘軟件,專(zhuān)業(yè)適合于中醫(yī)學(xué)領(lǐng)域的數(shù)據(jù)挖掘軟件缺乏,且多數(shù)研究使用國(guó)外數(shù)據(jù)挖掘軟件存在正版授權(quán)問(wèn)題[4]。開(kāi)發(fā)出多款自主研發(fā)、擁有完全版權(quán)且專(zhuān)門(mén)用于中醫(yī)學(xué)的專(zhuān)業(yè)數(shù)據(jù)挖掘軟件勢(shì)在必行。

總之,隨著大數(shù)據(jù)時(shí)代的到來(lái),中醫(yī)學(xué)與數(shù)據(jù)挖掘交叉學(xué)科技術(shù)不斷發(fā)展,數(shù)據(jù)挖掘分析技術(shù)被越來(lái)越廣泛地運(yùn)用在中醫(yī)基礎(chǔ)、臨床、藥理等各領(lǐng)域上。通過(guò)對(duì)中醫(yī)藥數(shù)據(jù)不同層次的挖掘,提煉出完善的中醫(yī)特色療效方法,提升中醫(yī)的傳承效率。

參考文獻(xiàn):

[1] 李認(rèn)書(shū),蔣永光.“方證相應(yīng)”的數(shù)據(jù)挖掘方法研究[D].成都:成都中醫(yī)藥大學(xué),2002.

[2] 杜建強(qiáng),聶斌.數(shù)據(jù)挖掘在中醫(yī)藥領(lǐng)域應(yīng)用研究進(jìn)展[J].中國(guó)中醫(yī)藥信息雜志,2013,20(6):109-112.

[3] 周雯靜,金周慧,劉靈力.數(shù)據(jù)挖掘在中醫(yī)藥研究中的應(yīng)用述評(píng)[J].中國(guó)中醫(yī)藥信息雜志,2014,21(10):131-133

[4] 鄧宏勇,許吉,張洋,等.中醫(yī)藥數(shù)據(jù)挖掘研究現(xiàn)狀分析[J].中國(guó)中醫(yī)藥信息雜志,2012,19(10):21-23.

(收稿日期:2015-04-27)

(修回日期:2015-05-25;編輯:向宇雁)

猜你喜歡
文獻(xiàn)計(jì)量學(xué)數(shù)據(jù)挖掘中醫(yī)藥
中醫(yī)藥在惡性腫瘤防治中的應(yīng)用
中醫(yī)藥在治療惡性腫瘤骨轉(zhuǎn)移中的應(yīng)用
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
從《中醫(yī)藥法》看直銷(xiāo)
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
《廣西民族研究》創(chuàng)辦30年來(lái)刊發(fā)文章的回顧與展望
中文圖書(shū)評(píng)價(jià)體系研究
中醫(yī)藥立法:不是“管”而是“促”
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究