鄭 娜,邵黨國(guó)
(昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650504)
信息可視化分析工具的比較分析
——以CiteSpace、SATI分析關(guān)鍵詞共現(xiàn)為例
鄭 娜,邵黨國(guó)
(昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650504)
CiteSpace和SATI都是應(yīng)用比較廣泛的可視化分析工具,為分析其兩者的共性及各自的特點(diǎn)。首先介紹了CiteSpace和SATI的基本功能界面,然后分析了他們對(duì)數(shù)據(jù)格式的轉(zhuǎn)換處理,最后通過(guò)兩個(gè)軟件在相同數(shù)據(jù)(通過(guò)中國(guó)知網(wǎng)檢索“煤炭去產(chǎn)能”領(lǐng)域相關(guān)文獻(xiàn))下以分析關(guān)鍵詞共現(xiàn)為例,對(duì)生成的關(guān)鍵詞共現(xiàn)圖譜進(jìn)行分析。從多角度歸納總結(jié)可視化軟件CiteSpace和SATI的共性特點(diǎn),期望能為用戶選擇信息可視化分析工具提供參考。
信息可視化分析;煤炭去產(chǎn)能;SATI;CiteSpace
可視化是指數(shù)據(jù)信息轉(zhuǎn)化為圖形圖像表示的一種方法[1]??蓪?shù)據(jù)信息通過(guò)計(jì)算機(jī)處理技術(shù)后以圖形圖像的形式輸出,對(duì)源數(shù)據(jù)的表達(dá)更加直觀形象[2]??梢暬浖闷鋸?qiáng)大的數(shù)據(jù)處理功能,將數(shù)據(jù)信息轉(zhuǎn)化成圖像形式,并通過(guò)繪制可視化圖譜[3],可以達(dá)到更好的幫助研究人員的目的。
CiteSpace軟件是國(guó)際上應(yīng)用較為廣泛的可視化軟件,它由美國(guó)陳超美博士使用Java語(yǔ)言開(kāi)發(fā),可處理國(guó)際上的WoS數(shù)據(jù)以及國(guó)內(nèi)的CNKI數(shù)據(jù)等[4]。而 SATI是國(guó)內(nèi)應(yīng)用比較廣泛的文獻(xiàn)題錄信息統(tǒng)計(jì)分析可視化軟件[5]。它是基于.NET開(kāi)發(fā)平臺(tái)使用C#編程開(kāi)發(fā)的[6],可處理最常見(jiàn)的 EndNote格式數(shù)據(jù)以及NoteFirst和NoteExpress的格式數(shù)據(jù)。本文首先介紹了數(shù)據(jù)來(lái)源以及對(duì)數(shù)據(jù)的處理,然后再具體介紹了CiteSpace和SATI兩種軟件,最后以關(guān)鍵詞共現(xiàn)為研究實(shí)例,使用CiteSpace與SATI對(duì)相同的數(shù)據(jù)(通過(guò)中國(guó)知網(wǎng)檢索“煤炭去產(chǎn)能”領(lǐng)域相關(guān)文獻(xiàn))進(jìn)行研究,通過(guò)可視化結(jié)果分析總結(jié)兩個(gè)可視化軟件的共性及各自的特點(diǎn)。
1.1 數(shù)據(jù)來(lái)源
作為文獻(xiàn)計(jì)量分析的基本步驟,數(shù)據(jù)收集和預(yù)處理這兩個(gè)過(guò)程尤為重要[7-8],它們直接決定了后面生成結(jié)果的分析。在中國(guó)知網(wǎng)(CNKI)以主題詞“煤炭去產(chǎn)能”進(jìn)行高級(jí)檢索[9],檢索時(shí)間范圍設(shè)置為2007年1月1日-2017年3月4日,文獻(xiàn)來(lái)源類型為全部,檢索日期為2017年3月4日,得到我國(guó)關(guān)于煤炭去產(chǎn)能相關(guān)文獻(xiàn)3562篇。數(shù)據(jù)預(yù)處理是把收集的數(shù)據(jù)經(jīng)過(guò)處理導(dǎo)入到分析軟件的過(guò)程。此過(guò)程是整個(gè)分析過(guò)程的基礎(chǔ),它根據(jù)軟件的要求把收集到的數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換以便進(jìn)一步分析。
1.2 數(shù)據(jù)處理
從中國(guó)知網(wǎng)將收集到的我國(guó)煤炭去產(chǎn)能研究數(shù)據(jù)導(dǎo)出,格式分別設(shè)置為Refworks和Endnote格式[10]。其中Citespace可導(dǎo)入Refworks格式的數(shù)據(jù),再通過(guò)格式轉(zhuǎn)換后重新導(dǎo)入 Citespace軟件可生成關(guān)鍵詞共現(xiàn)知識(shí)圖譜。而SATI軟件可直接導(dǎo)入Endnote格式數(shù)據(jù),通過(guò)轉(zhuǎn)化為 XML的格式數(shù)據(jù),可得到關(guān)鍵詞共現(xiàn)矩陣,并借助Ucinet,Netdraw軟件也可得到關(guān)鍵詞共現(xiàn)知識(shí)圖譜。
2.1 Citespace簡(jiǎn)介
Citespace可視化軟件是由美國(guó)博士陳超美先生使用Java語(yǔ)言開(kāi)發(fā)的軟件,主要功能為研究相關(guān)領(lǐng)域的發(fā)展過(guò)程[11]。通過(guò)基于共現(xiàn)、共引和網(wǎng)絡(luò)算法對(duì)相關(guān)領(lǐng)域文獻(xiàn)進(jìn)行分析,繪制可視化圖譜作為結(jié)果來(lái)分析具體的變化過(guò)程并探測(cè)其進(jìn)一步發(fā)展趨勢(shì)。并且著名教授劉則淵曾通過(guò)“一圖展春秋,一覽無(wú)余;一圖勝萬(wàn)言,一目了然”對(duì)Citespace軟件進(jìn)行了高度評(píng)價(jià)概括,可見(jiàn)Citespace是非常強(qiáng)大的一個(gè)可視化軟件。
2.2 文獻(xiàn)題錄信息計(jì)量分析工具SATI簡(jiǎn)介
文獻(xiàn)題錄信息統(tǒng)計(jì)分析工具 SATI通過(guò)導(dǎo)入預(yù)處理后的數(shù)據(jù)[12],利用其內(nèi)部的數(shù)據(jù)分析處理方法,可使數(shù)據(jù)轉(zhuǎn)化為可視化的圖像形式并借助屏幕顯示出來(lái)。方便后期進(jìn)一步使用分析數(shù)據(jù),SATI可通過(guò)對(duì)導(dǎo)入數(shù)據(jù)進(jìn)行預(yù)處理,將其轉(zhuǎn)化為 XML格式(SATI專用格式)數(shù)據(jù)文件。SATI主要功能包括數(shù)據(jù)格式轉(zhuǎn)換、抽取字段信息、詞頻統(tǒng)計(jì)以及構(gòu)建知識(shí)矩陣。
2.3 界面設(shè)計(jì)比較
CiteSpace和SATI這兩款軟件的主界面均包含菜單項(xiàng)、參數(shù)設(shè)置項(xiàng)以及顯示框。CiteSpace只有英文版本而 SATI提供中英文兩種版本,其中如圖 1所示,CiteSpace的菜單項(xiàng)又包含了File(文件)、Project(項(xiàng)目)、Data(數(shù)據(jù))、Network(網(wǎng)絡(luò))、Visualization(可視化)等欄目,參數(shù)設(shè)置項(xiàng)包含了Time Slicing(時(shí)間切割)、Term Source(術(shù)語(yǔ)來(lái)源)、Term Type(術(shù)語(yǔ)類型)、Links(節(jié)點(diǎn)類型)、Selection Criteria(選擇標(biāo)準(zhǔn))、Pruning(圖譜精簡(jiǎn))和Visualization(可視化類型)等部分,顯示框包含了Process Reports(軟件運(yùn)行結(jié)果報(bào)告)和Space Status(數(shù)據(jù)基本信息)兩部分。如圖2所示,SATI菜單項(xiàng)包括Welcome(歡迎)、Bibliography(文獻(xiàn)目錄)、Tools(工具),其中在Bibliography菜單項(xiàng)下包括文件格式轉(zhuǎn)換(形成SATI專用的XML文件)、參數(shù)設(shè)置(如數(shù)據(jù)的處理內(nèi)容、矩陣的類型、行列設(shè)置等)以及運(yùn)行過(guò)程的操作(字段抽取、頻次統(tǒng)計(jì)、矩陣生成、保存文件)。通過(guò)運(yùn)行軟件發(fā)現(xiàn)CiteSpace可以同時(shí)執(zhí)行多種操作即運(yùn)行多個(gè)窗口,而 SATI僅可運(yùn)行一個(gè)窗口。
2.4 數(shù)據(jù)處理功能比較
首先根據(jù)CiteSpace和STAI軟件對(duì)數(shù)據(jù)格式的要求,從中國(guó)知網(wǎng)分別獲取Refworks和Endnote格式的數(shù)據(jù)。接下來(lái)需要進(jìn)行數(shù)據(jù)轉(zhuǎn)換,其中Refworks格式的數(shù)據(jù)需要借助 CiteSpace進(jìn)行格式轉(zhuǎn)化使之成為CiteSpace專用數(shù)據(jù)。如圖3所示,在CNKI選項(xiàng)下,選擇數(shù)據(jù)的源目錄以及處理后數(shù)據(jù)的存放目錄,這里需要注意下在中國(guó)知網(wǎng)獲取的Refworks格式的txt文件應(yīng)以download開(kāi)頭[13],因?yàn)镃iteSpace只能識(shí)別名為download_xxx.txt的文件,點(diǎn)擊Format Conversion按鈕,當(dāng)在信息欄出現(xiàn) Finished則表示轉(zhuǎn)換成功。而對(duì)于SATI也需要對(duì)Endnote數(shù)據(jù)轉(zhuǎn)換成SATI內(nèi)部需要的XML格式的數(shù)據(jù),首先在Bibliography選項(xiàng)下點(diǎn)擊單文件選著已經(jīng)在知網(wǎng)獲取到的Endnote格式數(shù)據(jù)文件,在格式下拉框里選擇EndNote-(推薦知網(wǎng)),最后點(diǎn)擊轉(zhuǎn)換按鈕,如圖4當(dāng)出現(xiàn)“XML格式題錄文件轉(zhuǎn)換成功”這表明數(shù)據(jù)處理成功。相比兩軟件的數(shù)據(jù)轉(zhuǎn)換不難發(fā)現(xiàn)它們?cè)O(shè)計(jì)的數(shù)據(jù)轉(zhuǎn)換都具有良好的操作體驗(yàn),不過(guò) SATI進(jìn)行數(shù)據(jù)轉(zhuǎn)換后可以直接使用,而Citespace在進(jìn)行數(shù)據(jù)轉(zhuǎn)換后還需要把數(shù)據(jù)再次導(dǎo)入才可進(jìn)行后續(xù)操作,這主要是由于CiteSpace是國(guó)外開(kāi)發(fā)可視化應(yīng)用軟件。
圖2 SATI軟件主界面Fig.2 SATI software main interface
圖3 Citespace軟件數(shù)據(jù)格式轉(zhuǎn)換Fig.3 Citespace software data format conversion
圖4 SATI軟件數(shù)據(jù)格式轉(zhuǎn)換Fig.4 SATI software data format conversion
煤炭不僅是重要的工業(yè)原料,還是我國(guó)最重要的傳統(tǒng)基礎(chǔ)能源,對(duì)社會(huì)的發(fā)展起著決定性的作用[14]。而煤炭生產(chǎn)廠家在巨大利益的誘惑下,沒(méi)有遵循經(jīng)濟(jì)發(fā)展的客觀規(guī)律,忽視了市場(chǎng)供求關(guān)系,導(dǎo)致煤炭行業(yè)的盲目投資擴(kuò)張[15]。現(xiàn)階段我國(guó)煤炭行業(yè)出現(xiàn)了嚴(yán)重的產(chǎn)能過(guò)剩問(wèn)題,也得到了社會(huì)各界的高度關(guān)注[16]。而通過(guò) SATI和Citespace兩種可視化軟件分別生成關(guān)鍵詞共現(xiàn)知識(shí)圖譜,并對(duì)可視化圖譜進(jìn)行深入解讀、分析和比較,以展示我國(guó)煤炭領(lǐng)域去產(chǎn)能的研究全貌,了解我國(guó)煤炭去產(chǎn)能研究現(xiàn)狀及趨勢(shì)。
3.1 基于Citespace可視化軟件的關(guān)鍵詞共現(xiàn)分析
通過(guò) Citespace軟件對(duì)數(shù)據(jù)處理后可進(jìn)一步獲得關(guān)鍵詞共現(xiàn)知識(shí)圖譜,如圖5首先新建一個(gè)項(xiàng)目命名為“煤炭去產(chǎn)能”,然后選擇一個(gè)目錄作為項(xiàng)目運(yùn)行結(jié)果保存目錄(Project Home)和處理轉(zhuǎn)換之后的數(shù)據(jù)目錄作為數(shù)據(jù)輸入目錄(Data Directory),選擇數(shù)據(jù)來(lái)源為CNKI,CSSCI,其余選項(xiàng)默認(rèn)即可,最后點(diǎn)擊Sava保存,項(xiàng)目創(chuàng)建成功。然后在圖6中Time Slicing選擇分析的時(shí)間區(qū)間為 2007-2017,Years per Slice的意思是以多長(zhǎng)時(shí)間作為一個(gè)時(shí)間單位進(jìn)行分析,我們選擇每一年為一個(gè)時(shí)間段,Term source 是關(guān)鍵詞來(lái)源,不需要更改維持默認(rèn)即可。Term type代表關(guān)鍵詞類型,這里一般選擇最后一個(gè)burst terms,也就是關(guān)鍵詞以爆發(fā)性出現(xiàn)。因?yàn)橐粋€(gè)研究熱點(diǎn)出現(xiàn)時(shí),一般關(guān)于這個(gè)熱點(diǎn)的關(guān)鍵詞會(huì)出現(xiàn)爆發(fā)性的增長(zhǎng),這也是 CiteSpace主要功能的體現(xiàn)。Node Types選擇Keyword,Selection Criteria中Top N 的意思是每個(gè)時(shí)間段(slice)選擇被引用最多的前 50個(gè)文獻(xiàn)進(jìn)行分析,引用多相對(duì)而言研究較為熱門。為了使得到的知識(shí)圖譜更加清楚,我們?cè)趐runing(修剪)選項(xiàng)中,勾選pathfinder(探測(cè))和pruning sliced network(修建切片網(wǎng)絡(luò)),這樣可以使得到的知識(shí)圖譜不至于太亂。最后點(diǎn)擊go按鈕即可運(yùn)行得到關(guān)于關(guān)鍵詞共現(xiàn)的知識(shí)圖譜(圖7)。
圖5 Citespace創(chuàng)建研究項(xiàng)目Fig.5 Citespace to create a research project
圖6 Citespace項(xiàng)目參數(shù)設(shè)置Fig.6 Citespace project parameter settings
圖7 Citespace關(guān)鍵詞共現(xiàn)知識(shí)圖譜Fig.7 Citespace keyword co-occurrence knowledge map
圖7中的環(huán)形圓圈被稱為引文年輪,代表了包含該關(guān)鍵詞的文章出現(xiàn)的年份。其中中心部分的顏色代表了文章的發(fā)表時(shí)間。引文時(shí)間對(duì)應(yīng)著引文年輪的每環(huán)顏色。環(huán)的厚度與時(shí)區(qū)中引用的數(shù)目成正比??梢钥吹疆a(chǎn)能過(guò)剩、結(jié)構(gòu)性改革、動(dòng)力煤、過(guò)剩產(chǎn)能、煤炭企業(yè)等節(jié)點(diǎn)較大,并與其他節(jié)點(diǎn)聯(lián)系較為緊密。說(shuō)明其在引文中出現(xiàn)的次數(shù)較多,也代表了它們?cè)诿禾咳ギa(chǎn)能領(lǐng)域的重要性。雖然圖7已是修剪過(guò)的知識(shí)圖譜,但是看起來(lái)還是比較繁雜,為更好地分析煤炭去產(chǎn)能的研究熱點(diǎn)我們可以使用Citespace的Timeline功能生成在時(shí)間軸上的知識(shí)圖譜如圖8所示。
圖8 Citespace基于時(shí)間軸的知識(shí)圖譜Fig.8 Citespace based on the time axis of the knowledge map
為得到圖8所示圖譜,首先在輸出結(jié)果圖(圖7)的右側(cè)對(duì)話框中,選擇Labels欄,在Visualizations里面選擇Timeline選項(xiàng),即可得到每一個(gè)時(shí)間段內(nèi)的研究熱點(diǎn)圖譜。從Timeline的圖中我們可以得前三十個(gè)關(guān)鍵詞的分布。其中關(guān)鍵詞曲線的長(zhǎng)短與時(shí)間跨度成正相關(guān),并且不同年份對(duì)應(yīng)不同顏色。結(jié)合圖 7和圖 8,可以看到產(chǎn)能過(guò)剩、經(jīng)濟(jì)發(fā)展等關(guān)鍵詞貫穿了整個(gè)時(shí)間段,說(shuō)明它們?cè)诿禾咳ギa(chǎn)能過(guò)程中的重要性。動(dòng)力煤、常務(wù)會(huì)議、企業(yè)兼并重組等關(guān)鍵詞在2011年開(kāi)始涌現(xiàn),說(shuō)明在2011年國(guó)家高度重視煤炭去產(chǎn)能,并且實(shí)施了一系列應(yīng)對(duì)措施。僵尸企業(yè)、結(jié)構(gòu)性改革、職工安置等關(guān)鍵詞出現(xiàn)在2015年,說(shuō)明隨著煤炭去產(chǎn)能一系列措施的實(shí)施,消化過(guò)剩產(chǎn)能的過(guò)程中不可避免的出現(xiàn)了一些僵尸企業(yè),并隨著產(chǎn)能的減少,一些職工也面臨著重新安置的問(wèn)題。所以優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)才是煤炭去產(chǎn)能的必行之路。
3.2 基于SATI可視化軟件的關(guān)鍵詞共現(xiàn)分析
同樣通過(guò) SATI軟件進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換后也可以進(jìn)一步得到關(guān)鍵詞共現(xiàn)知識(shí)圖譜,不過(guò)相比于Citespace較多的設(shè)置項(xiàng)來(lái)說(shuō),SATI的設(shè)置較為簡(jiǎn)單。如圖9所示,首先在選項(xiàng)欄里選擇“關(guān)鍵詞”選項(xiàng),時(shí)間和來(lái)源選擇數(shù)據(jù)中的全部(ALL),矩陣選擇輸出共現(xiàn)矩陣,每單元代表出現(xiàn)的次數(shù)。Rows/Cols選項(xiàng)欄里輸入 30,即結(jié)果中只保留共現(xiàn)
次數(shù)最多的前三十個(gè)詞。然后依次選著“字段抽取”、“頻次統(tǒng)計(jì)”、“矩陣生成”之后在 Excle里面出現(xiàn)關(guān)鍵詞共現(xiàn)矩陣,進(jìn)一步借助Ucinet、Netdraw軟件[17]可以得到可視化的關(guān)鍵詞共現(xiàn)知識(shí)圖譜(圖10)。如果關(guān)鍵詞節(jié)點(diǎn)之間存在連接,這意味著它們之間存在一種共現(xiàn)的關(guān)系,連線的厚度和共現(xiàn)關(guān)系的強(qiáng)度呈正相關(guān)[18]。如果結(jié)點(diǎn)的位置越處于中心則代表其地位越核心,在圖10中可以看到節(jié)點(diǎn)最大為產(chǎn)能過(guò)剩,其次較大節(jié)點(diǎn)還包括結(jié)構(gòu)性改革、過(guò)剩產(chǎn)能、動(dòng)力煤、煤炭生產(chǎn)、國(guó)家發(fā)改委等,而且也都比較居中,說(shuō)明了這些關(guān)鍵詞在能源去產(chǎn)能中有著重要的地位。由于煤炭去產(chǎn)能形勢(shì)一直嚴(yán)峻,所以持續(xù)被各界廣泛的關(guān)注。并且在圖10中還可以發(fā)現(xiàn)產(chǎn)能過(guò)剩節(jié)點(diǎn)與上述節(jié)點(diǎn)分別有較粗的連線,說(shuō)明產(chǎn)能過(guò)剩與這些節(jié)點(diǎn)都有比較強(qiáng)的聯(lián)系,可以看出煤炭去產(chǎn)能和國(guó)家層面的相關(guān)政策聯(lián)系較緊密,比如國(guó)家發(fā)改委出臺(tái)一系列關(guān)于煤炭產(chǎn)業(yè)結(jié)構(gòu)性改革調(diào)整的政策等,并且影響著經(jīng)濟(jì)發(fā)展。再看圖10中位于中心部分的節(jié)點(diǎn),大多都是很多煤炭行業(yè)行業(yè)都涉及到的東西,比如過(guò)剩產(chǎn)能等。而其他邊緣節(jié)點(diǎn)則主要體現(xiàn)的是煤炭去產(chǎn)能涉及的一些具體應(yīng)對(duì)措施,并且不同顏色的節(jié)點(diǎn)代表著不同的領(lǐng)域,如煤化工、節(jié)能減排、產(chǎn)業(yè)結(jié)構(gòu)、分流安置說(shuō)明發(fā)展煤化工是煤炭去產(chǎn)能的有效途徑,這屬于產(chǎn)業(yè)結(jié)構(gòu)調(diào)整,所以面臨著職工的分流安置,這一過(guò)程中還有可能出現(xiàn)僵尸企業(yè)。關(guān)鍵詞常務(wù)會(huì)議則代表的是政治領(lǐng)域?qū)γ禾咳ギa(chǎn)能的調(diào)節(jié)。煤炭行業(yè)、煤炭企業(yè)、煤炭產(chǎn)業(yè)則在煤炭去產(chǎn)能過(guò)程中在行業(yè)、企業(yè)、產(chǎn)業(yè)的范疇中扮演著主要角色。圖10中各節(jié)點(diǎn)均是煤炭去產(chǎn)能領(lǐng)域排名前三十的關(guān)鍵詞,可見(jiàn)它們?cè)谝欢ǔ潭壬洗砹嗣禾咳ギa(chǎn)能行業(yè)的發(fā)展現(xiàn)狀。
圖9 SATI運(yùn)行參數(shù)設(shè)置Fig.9 SATI operating parameter settings
圖10 SATI關(guān)鍵詞共現(xiàn)知識(shí)圖譜Fig.10 SATI keyword co-occurrence knowledge map
通過(guò)使用可視化軟件Citespace和SATI對(duì)我國(guó)煤炭行業(yè)相關(guān)文獻(xiàn)關(guān)鍵詞共現(xiàn)分析,可以發(fā)現(xiàn)Citespace所具有的的功能更加強(qiáng)大,它不僅可以生成關(guān)鍵詞共現(xiàn)知識(shí)圖譜,而且還可以通過(guò) Timeline選項(xiàng)得到每個(gè)時(shí)間段內(nèi)的研究熱點(diǎn)。不過(guò) SATI也有其自己的優(yōu)勢(shì),生成的可視化圖譜較清晰簡(jiǎn)潔,并可以以 Excle表格的形式保存關(guān)鍵詞共現(xiàn)矩陣,這使得其生成的結(jié)果可以被很多研究者方便使用。而且兩者對(duì)數(shù)據(jù)格式的轉(zhuǎn)換處理速度很快,不過(guò)CiteSpace是國(guó)外開(kāi)發(fā)可視化應(yīng)用軟件,主要針對(duì)(WoS)數(shù)據(jù),所以其需要單獨(dú)的數(shù)據(jù)轉(zhuǎn)換過(guò)程。CiteSpace只有英文版本而SATI提供中英文兩種版本,不過(guò)CiteSpace可以同時(shí)執(zhí)行多種操作即運(yùn)行多個(gè)窗口,而 SATI僅可運(yùn)行一個(gè)窗口。綜上所述,這兩款軟件各有千秋,我們還是應(yīng)根據(jù)具體的需要選擇相應(yīng)軟件。
[1] 鄺野, 馬璇. 信息可視化過(guò)程中色像差的補(bǔ)償方式研究[J].軟件, 2012, 33(12): 218-221.Kuang Y, M a X. Compensation method of chromatic aberration in the process of information visualization[J]. Software,2012, 33(12): 218-221.
[2] 李慧玲, 張俊霞. 計(jì)算機(jī)圖形圖像處理與制作專業(yè)教學(xué)改革分析[J]. 軟件, 2014(2): 184-185.Li H L, Zhang J X. Computer Graphics, Image Processing and Analysis of the Production of Teaching Reform[J].Software, 2014(2): 184-185.
[3] 孫金升. 數(shù)據(jù)可視化技術(shù)的研究及其在教務(wù)信息數(shù)據(jù)庫(kù)中的應(yīng)用[D]. 合肥工業(yè)大學(xué), 2006.Sun J S.Research on Data Visualization and the Application in Educational Administration Information Database[D].Hefei University of Technology, 2006.
[4] 陳超美, 陳悅, 侯劍華, 等. CiteSpaceⅡ: 科學(xué)文獻(xiàn)中新趨勢(shì)與新動(dòng)態(tài)的識(shí)別與可視化[J]. 情報(bào)學(xué)報(bào), 2009, 28(3):401-421.Chen C M, Chen Y, Hou J H, et al. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature[J]. Journal of the China Society for Scientific and Technical Information, 2009, 28(3): 401-421.
[5] 劉啟元, 葉鷹. 文獻(xiàn)題錄信息挖掘技術(shù)方法及其軟件SATI的實(shí)現(xiàn)——以中外圖書情報(bào)學(xué)為例[J]. 信息資源管理學(xué)報(bào),2012(1): 50-58.Liu Q Y, Ye Y. A Study on Mining Bibliographic Records by Designed Software SATI:Case Study on Library and Information Science[J]. Journal of Information Resources Management,2012, 2(1): 50-58.
[6] 趙蓉英, 李飛. 基于社會(huì)網(wǎng)絡(luò)分析方法的國(guó)內(nèi)外信息計(jì)量比較研究[J]. 情報(bào)科學(xué), 2013(2): 7-12.Zhao R Y, Li F. A Comparative Study of Informetrics in China and in Foreign Countries Based on Social Network Analysis[J]. Information Science, 2013(2): 7-12.
[7] 郭婷, 鄭穎. 數(shù)據(jù)挖掘在國(guó)內(nèi)圖書情報(bào)領(lǐng)域的應(yīng)用現(xiàn)狀分析——基于文獻(xiàn)計(jì)量分析和共詞分析[J]. 情報(bào)科學(xué), 2015(10): 91-98.Guo T, Zheng Y. Research on the Application of Data Mining in the Field of Library and Information Science in China--Based on Bibliometric Analysis and Co-word Analysis[J].INFORMATION SCIENCE, 2015(10): 91-98.
[8] 周曉分, 黃國(guó)彬, 白雅楠. 科學(xué)計(jì)量可視化軟件的對(duì)比與數(shù)據(jù)預(yù)處理研究[J]. 圖書情報(bào)工作, 2013, 57(23): 64-72.Zhou X F, Huang G B, Bai Y N, et al. Comparison Between Scientific Visualization Metrology Software and the Data Pretreatment[J]. Library & Information Service, 2013, 57(23):64-72.
[9] 譚捷, 張李義, 饒麗君. 中文學(xué)術(shù)期刊數(shù)據(jù)庫(kù)的比較研究[J]. 圖書情報(bào)知識(shí), 2010(4): 4-13.Tan J, Zhang L Y, Rao L J. A Comparative Study of Chinese Academic Journal Databases[J]. Document Information &Knowledge, 2010(4): 4-13.
[10] 周春雷, 王偉軍, 成江東. CNKI輸出文件在文獻(xiàn)計(jì)量中的應(yīng)用[J]. 圖書情報(bào)工作, 2007, 51(7): 124-126.Zhou C L, Wang W J, Cheng J D. Application of CNKI Output Files in Bibliometric Analysis[J]. Library & Information Service, 2007, 51(7): 124-126.
[11] 侯劍華, 胡志剛. CiteSpace軟件應(yīng)用研究的回顧與展望[J].現(xiàn)代情報(bào), 2013, 33(4): 99-103.Hou J H, Hu Z G. Review on the Application of CiteSpace at Home and Abroad[J]. Journal of Modern Information, 2013,33(4): 99-103.
[12] 王瑋. 我國(guó)創(chuàng)客空間研究熱點(diǎn)可視化分析[J]. 現(xiàn)代情報(bào),2015, 35(12): 92-98.Wang W. Visualization Analysis on Research Hotspots of Makerspace in China[J]. JournaL of Modern Information,2015, 35(12): 92-98.
[13] 劉高勇, 汪會(huì)玲. 國(guó)內(nèi)外引文分析研究熱點(diǎn)的可視化分析[J]. 情報(bào)科學(xué), 2011(5): 700-705.Liu G Y, Wang H L. Visualization Analysis on the Research Hotspots of Citation Analysis between the Whole World and China[J]. Information Science, 011(5): 700-705.
[14] 賀佑國(guó), 葉旭東, 王震. 關(guān)于煤炭工業(yè)“十三五”規(guī)劃的思考[J]. 煤炭經(jīng)濟(jì)研究, 2015(1): 6-8.He Y G, Ye X D, Wang Z. Consideration on the 13th Five Year Plan of Coal Industry[J]. Coal Economic Research,2015(1): 6-8.
[15] 陳月生. 我國(guó)經(jīng)濟(jì)發(fā)展方式轉(zhuǎn)變與戰(zhàn)略性新興產(chǎn)業(yè)的發(fā)展[J]. 天津大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2011, 13(3): 217-221.Chen Y S. Transformation of Economic Development Mode and Development of Strategic Emerging Industries in China[J]. Journal of Tianjin University, 2011, 13(3): 217-221.
[16] 管馨, 李文臣. 我國(guó)煤炭行業(yè)經(jīng)濟(jì)效益下滑的原因分析[J].煤炭工程, 2015, 47(1): 136-138.Guan X, Li W C. Cause Analysis on Economic Benefits Decline of China's Coal Industry[J]. Coal Engineering, 2015,47(1): 136-138.
[17] 文庭孝, 劉曉英等. 我國(guó)非物質(zhì)文化遺產(chǎn)研究的可視化分析——基于三種可視化工具的比較分析[J]. 圖書館, 2016(2): 21-27.Wen T X, Liu X Y. Visualization Analysis of Intangible Cultural Heritage in China[J]. Library, 2016(2): 21-27.
[18] 王曉光. 科學(xué)知識(shí)網(wǎng)絡(luò)的形成與演化(Ⅰ): 共詞網(wǎng)絡(luò)方法的提出[J]. 情報(bào)學(xué)報(bào), 2009, 28(4): 599-605.Wang X G. Formation and Evolution of Science Knowledge Network(I): A New Research Method Based on Co-word Network[J]. Journal of the China Society for Scientific &Technical Information, 2009, 28(4): 599-605.
A Comparative Analysis of Information Visualization Analysis Tools -- CiteSpace,SATI Analysis of Keywords Co-occurrence as an Example
ZHENG Na, SHAO Dang-guo
(School of Information Engineering and Automation, Kunming University of Science and Technology, Kunming 650504, China)
CiteSpace and SATI are the application of a wide range of visual analysis tools for the analysis of the two common and their respective characteristics. First introduced the basic functions of CiteSpace and SATI interface, and then analyzed their conversion of the data format processing, and finally through the two software in the same data (through the Chinese knowledge network "coal to produce capacity" in the field of relevant literature) to analyze keywords For example, the generated co-occurrence of the keyword analysis. Summarize the common features of the visualization software CiteSpace and SATI from multiple perspectives and look forward to providing a reference for users to choose information visualization analysis tools.
: Information visualization analysis; Coal to produce capacity; SATI; CiteSpace
G350
A
10.3969/j.issn.1003-6970.2017.10.007
本文著錄格式:鄭娜,邵黨國(guó). 信息可視化分析工具的比較分析——以CiteSpace、SATI分析關(guān)鍵詞共現(xiàn)為例[J]. 軟件,2017,38(10):39-46
國(guó)家博士后科學(xué)基金(2016M592894XB);云南省科技廳面上項(xiàng)目:(KKS0201703015)
鄭娜(1994-),女,碩士,學(xué)生,昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院學(xué)生,研究方向:WEB數(shù)據(jù)挖掘。
邵黨國(guó),博士,講師,主要研究方向:圖像處理、自然語(yǔ)言處理、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)。