国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CNKII的數(shù)字檔案館研究可視化分析

2015-05-30 15:41李曉明
北京檔案 2015年10期
關(guān)鍵詞:發(fā)文檔案館圖譜

摘要:為系統(tǒng)分析我國數(shù)字檔案館研究成果,促進(jìn)數(shù)字檔案館的研究和建設(shè),運(yùn)用文獻(xiàn)計(jì)量和可視化分析方法,對CNKI收錄的1999~2014年數(shù)字檔案館研究的期刊文獻(xiàn),從數(shù)量、作者、機(jī)構(gòu)、主題等方面進(jìn)行統(tǒng)計(jì),并結(jié)合知識圖譜進(jìn)行可視化分析,總結(jié)國內(nèi)數(shù)字檔案館研究的文獻(xiàn)分布、高產(chǎn)作者和機(jī)構(gòu),揭示數(shù)字檔案館研究的熱點(diǎn)和發(fā)展趨勢。

關(guān)鍵詞:數(shù)字檔案館知識圖譜可視化分析統(tǒng)計(jì)分析CNKI CiteSpace

Abstract:In order to analyse systematically the research findings of digital archives in our country,pro? mote the research and construction of digital ar? chives, this paper uses econometric analysis method and visualization analysis software to count the litera? ture quantity, authors, institutions, and themes of pe? riodical literatures on digital archives included in Chi? na National Knowledge Infrastructure(CNKI)pub? lished during 1999~2014, analyses the related knowl? edge maps drew by CiteSpace, summarizes the litera? ture distribution, high yield authors and institutions, reveals the hotspots and development trends of do? mestic studies on digital archives.

Keywords:Digital archives;Mapping knowledge domain;Visual analysis;Statistical analysis;CNKI;CiteSpace

一、引言

數(shù)字檔案館(Digital Archives)是伴隨著電子技術(shù)、計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通訊技術(shù)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)等的發(fā)展而產(chǎn)生的新型檔案館,也稱作電子檔案館、虛擬檔案館、無墻檔案館等。[1]雖然,國內(nèi)對數(shù)字檔案館的研究時間僅有十多年,但是近年來出現(xiàn)的富有行業(yè)特色的數(shù)字檔案館,如數(shù)字城建檔案館、企業(yè)數(shù)字檔案館等已經(jīng)引起檔案界的關(guān)注,并正在成為我國檔案領(lǐng)域研究的重點(diǎn)和熱點(diǎn)之一。具體而言,從國家宏觀層面來看,相關(guān)政策和管理的穩(wěn)步推進(jìn),促進(jìn)和推動了我國數(shù)字檔案館的研究與實(shí)踐。例如,自2002年以來,國家檔案局陸續(xù)發(fā)布了《全國檔案信息化建設(shè)實(shí)施綱要》《檔案事業(yè)發(fā)展“十二五”規(guī)劃》《數(shù)字檔案館建設(shè)指南》和《數(shù)字檔案室建設(shè)指南》等標(biāo)準(zhǔn)規(guī)范。從微觀層面來看,經(jīng)過專家學(xué)者和檔案工作者的不懈努力,也取得了豐碩的成果。在國內(nèi)不斷建成各類數(shù)字檔案館的基礎(chǔ)上,促進(jìn)我國數(shù)字檔案館建設(shè)的研究正在進(jìn)一步深入。例如,2013年10月,時任國家檔案局局長楊冬權(quán)在全國數(shù)字檔案館(室)建設(shè)推進(jìn)會上發(fā)表了重要講話,明確提出“用15年左右的時間,建成以數(shù)字資源為基礎(chǔ)、安全管理為保障、遠(yuǎn)程利用為目標(biāo)的數(shù)字檔案館(室)體系”[2]的我國數(shù)字檔案館(室)建設(shè)目標(biāo)。2014年2月,國家檔案局成立了數(shù)字檔案館(室)建設(shè)領(lǐng)導(dǎo)小組,楊冬權(quán)主持召開領(lǐng)導(dǎo)小組第一次會議,討論通過了領(lǐng)導(dǎo)小組工作規(guī)則和《2014年數(shù)字檔案館(室)建設(shè)重點(diǎn)工作》。[3]

為全面客觀和系統(tǒng)地反映我國數(shù)字檔案館的研究歷程,總結(jié)研究特點(diǎn),分析研究熱點(diǎn),探尋研究趨勢,為未來數(shù)字檔案館的研究、建設(shè)和實(shí)現(xiàn)我國數(shù)字檔案館建設(shè)的目標(biāo)提供借鑒,筆者收集了中國知網(wǎng)(CNKI)收錄的有關(guān)期刊文獻(xiàn)并加以整理,借助相關(guān)軟件對整理后的文獻(xiàn)進(jìn)行統(tǒng)計(jì)和可視化分析??梢暬治?,作為一種新興的信息處理分析方法,在檔案類文獻(xiàn)方面的研究僅有幾年時間,對數(shù)字檔案館進(jìn)行可視化分析的文獻(xiàn)更少。例如,筆者在LISA數(shù)據(jù)庫中未檢索到相關(guān)文獻(xiàn),在CNKI中僅檢索出相關(guān)文獻(xiàn)2篇。

二、樣本文獻(xiàn)來源、統(tǒng)計(jì)與分析工具

(一)樣本文獻(xiàn)來源

本文進(jìn)行統(tǒng)計(jì)分析時抽取的樣本主要為由CNKI檢索而來的文獻(xiàn),選取時間為1999~2014年,檢索日期為2015年1月26日,共得到檢索結(jié)果1472篇。為確保檢索結(jié)果的全面性,筆者對檢索主題進(jìn)行反復(fù)調(diào)試后,確定了以“篇名”為主題的檢索入口,以“TI=‘虛擬/PREV 2檔案館OR TI=‘虛擬/PREV 2檔案室OR TI=‘?dāng)?shù)字/PREV 2檔案館OR TI=‘?dāng)?shù)字/PREV 2檔案室OR TI=‘?dāng)?shù)字化/PREV 2檔案館OR TI=‘?dāng)?shù)字化/PREV 2檔案室OR TI=‘云檔案館OR TI=‘電子/PREV 2檔案館OR TI=‘電子/PREV 2檔案室OR TI=‘無墻/PREV 2檔案館OR TI=‘無墻/PREV 2檔案室”為表達(dá)式的檢索路徑,對期刊、特色期刊、學(xué)術(shù)期刊三個數(shù)據(jù)庫進(jìn)行全面檢索。同時,為確保樣本的準(zhǔn)確性,筆者逐一核對了題錄與原文,剔除消息、廣告、領(lǐng)導(dǎo)講話、標(biāo)準(zhǔn)法規(guī)、文摘、書評等非學(xué)術(shù)研究類文獻(xiàn)和一稿多投的重復(fù)文獻(xiàn),經(jīng)整理,得到相關(guān)文獻(xiàn)1339篇。

(二)統(tǒng)計(jì)分析工具與數(shù)據(jù)處理

進(jìn)行統(tǒng)計(jì)分析時,主要借助兩個軟件工具,一是國內(nèi)使用較廣泛的CiteSpace(版本號3.7. R7),[4]該軟件由美國學(xué)者陳超美開發(fā),用于繪制知識圖譜,計(jì)算節(jié)點(diǎn)的突變率、中心性等;二是作者自編的關(guān)系型數(shù)據(jù)庫軟件,用于機(jī)構(gòu)、關(guān)鍵詞等數(shù)據(jù)項(xiàng)的規(guī)范或補(bǔ)充,區(qū)分不同機(jī)構(gòu)的同名作者,篩選分析樣本,快速生成相關(guān)統(tǒng)計(jì)報(bào)表,并可生成用于CiteSpace處理的數(shù)據(jù)格式文件。[5]在進(jìn)行數(shù)據(jù)處理時,利用自編軟件完成。一是對簡稱、更名、合并及不同寫法的機(jī)構(gòu)名稱進(jìn)行統(tǒng)一;二是對部分關(guān)鍵詞進(jìn)行合并,刪除CNKI自動標(biāo)引的機(jī)標(biāo)關(guān)鍵詞;三是區(qū)分同名作者;四是剔除誤檢及不宜用作分析的非研究性文獻(xiàn),一稿多投文獻(xiàn)僅保留1篇。經(jīng)以上處理后,由自編軟件生成可用于CiteSpace的WOS格式數(shù)據(jù)文件。

三、數(shù)字檔案館研究的可視化分析

本文研究中相關(guān)數(shù)據(jù)由CiteSpace軟件和自編軟件統(tǒng)計(jì)得出,二者有關(guān)文獻(xiàn)年代分布、作者與機(jī)構(gòu)發(fā)文數(shù)量、關(guān)鍵詞頻次等重點(diǎn)方面的統(tǒng)計(jì)結(jié)果相同。另外,文中表格由工具軟件分別生成或合并而成,作者合著網(wǎng)絡(luò)圖譜、機(jī)構(gòu)合著網(wǎng)絡(luò)圖譜和研究主題與熱點(diǎn)知識圖譜由CiteSpace軟件繪制并經(jīng)調(diào)整生成。

運(yùn)用CiteSpace繪制圖譜的時間范圍為1999~2014年,以每2年為界進(jìn)行時間分區(qū),圖譜上方由不同顏色色段連成的年度色帶(自左至右由冷色至暖色),每種顏色分別代表2個年度,暖色對應(yīng)的年份較近。時區(qū)閾值根據(jù)圖譜效果調(diào)試設(shè)置;Pruning(剪切連線算法)選擇Pathfinder(路徑搜索算法)或Minimum Spanning Tree(最小生成樹)及Pruning sliced networks(路徑網(wǎng)絡(luò)簡化),這些設(shè)置及主要處理結(jié)果均在圖譜的左上方呈現(xiàn)。圖譜中的圓,分別代表作者、機(jī)構(gòu)和關(guān)鍵詞節(jié)點(diǎn),節(jié)點(diǎn)內(nèi)的色環(huán)及節(jié)點(diǎn)間的連線顏色代表的年度,與年度色帶顏色表示的年度相對應(yīng)。圖譜中部分節(jié)點(diǎn)內(nèi)還有紅色色環(huán),這些紅色色環(huán)是突顯率,反映較短時間內(nèi)數(shù)量增長的快慢。

(一)文獻(xiàn)量和作者分析:2000年以來,數(shù)字檔案館在我國得到了較快發(fā)展,雖然部分年份上研究數(shù)量有所回落,但是基本呈穩(wěn)中有升的趨勢,如圖1所示。同時,以潘連根、程妍妍、袁紅軍、唐艷芳、傅榮校等為代表的檔案學(xué)者是數(shù)字檔案館研究的領(lǐng)軍人物

具體而言,獨(dú)著論文占絕大多數(shù),合著文獻(xiàn)數(shù)量較少。經(jīng)統(tǒng)計(jì),1339篇文獻(xiàn)中共包括1458個作者(含非第一作者)。其中,獨(dú)著961篇,占比71.77%;兩人合著287篇,占比21.43%。將數(shù)據(jù)導(dǎo)入CiteSpace,以節(jié)點(diǎn)類型選擇作者(Author),運(yùn)行調(diào)試后,得到文獻(xiàn)作者的合著網(wǎng)絡(luò)圖譜,如圖2所示。節(jié)點(diǎn)越大,表明作者的發(fā)文量越多,如潘連根、程妍妍、袁紅軍、唐艷芳等。同時,節(jié)點(diǎn)中有紅色色環(huán),表明他們在較短時間內(nèi)發(fā)文較多。節(jié)點(diǎn)中的色環(huán)越厚,表明對應(yīng)年份作者的發(fā)文越多,如潘連根、程妍妍、金更達(dá)等。節(jié)點(diǎn)間的連線,表明相連的作者間有合著。圖中還有個別作者姓名后有大寫字母,這是為了區(qū)分同名作者而添加的。值得注意的是,統(tǒng)計(jì)結(jié)果與圖譜顯示的發(fā)文數(shù)量較多的作者(按第一作者發(fā)文量排序,“+”號的數(shù)字為第二作者發(fā)文數(shù))大體相當(dāng)。但圖中個別較大的節(jié)點(diǎn)并未出現(xiàn)在表中(如謝海洋、金波、姚樂野等),這是由于CiteSpace生成的圖譜節(jié)點(diǎn)僅依據(jù)總發(fā)文量生成,而沒有區(qū)分作者排序,如表1所示。

(二)發(fā)文機(jī)構(gòu)分析:解放軍南京政治學(xué)院上海校區(qū)、武漢大學(xué)、中國人民大學(xué)、紹興文理學(xué)院等是數(shù)字檔案館研究的重要機(jī)構(gòu)

經(jīng)統(tǒng)計(jì),1339篇文獻(xiàn)中共有機(jī)構(gòu)724個(含不詳和非第一作者機(jī)構(gòu))。其中,第一作者機(jī)構(gòu)665個,且發(fā)文超過10篇的16個機(jī)構(gòu)(發(fā)文量達(dá)322篇),僅1篇的482個。將數(shù)據(jù)導(dǎo)入CiteSpace,以節(jié)點(diǎn)類型選擇機(jī)構(gòu)(Institution),運(yùn)行調(diào)試后,得到數(shù)字檔案館研究文獻(xiàn)的機(jī)構(gòu)合著網(wǎng)絡(luò)圖譜,如圖3所示。節(jié)點(diǎn)越大,表明機(jī)構(gòu)的發(fā)文量越多,如解放軍南京政治學(xué)院上海校區(qū)、武漢大學(xué)、中國人民大學(xué)、紹興文理學(xué)院等。此外,紹興文理學(xué)院、上海大學(xué)、鄭州師范學(xué)院等帶有紅色色環(huán),表明這些機(jī)構(gòu)在數(shù)字檔案館研究的某個階段有較高的發(fā)文量。同時,筆者還對第一發(fā)文機(jī)構(gòu)發(fā)文量的前十名進(jìn)行了統(tǒng)計(jì),依次為南京政治學(xué)院上海校區(qū)、武漢大學(xué)、中國人民大學(xué)、紹興文理學(xué)院、浙江大學(xué)、上海大學(xué)、湘潭大學(xué)、鄭州師范大學(xué)和南昌大學(xué)、蘇州大學(xué)。

(三)主題分析:數(shù)字化、信息化、知識管理是數(shù)字檔案館研究的熱點(diǎn)主題;云計(jì)算、建設(shè)、檔案館、數(shù)字化和數(shù)字城建檔案館是數(shù)字檔案館研究的前沿方向

關(guān)鍵詞是從文獻(xiàn)的標(biāo)題、摘要和正文中選取的,能夠反映文獻(xiàn)的主題,[6]研究中往往用關(guān)鍵詞進(jìn)行主題分析,從中探究研究熱點(diǎn)和趨勢。經(jīng)統(tǒng)計(jì),1339篇文獻(xiàn)中關(guān)鍵詞2385個,其中不同關(guān)鍵詞871個,有關(guān)鍵詞的文獻(xiàn)706篇。將數(shù)據(jù)導(dǎo)入CiteSpace,以節(jié)點(diǎn)類型選擇關(guān)鍵詞(Keyword),運(yùn)行調(diào)試后,得到研究主題與熱點(diǎn)知識圖譜,如圖3所示,為清晰顯示節(jié)點(diǎn)及節(jié)點(diǎn)間的關(guān)系,圖中隱藏了出現(xiàn)頻次最高的關(guān)鍵詞“數(shù)字檔案館”。節(jié)點(diǎn)越大,表明關(guān)鍵詞出現(xiàn)的頻次越高,節(jié)點(diǎn)間的連線及粗細(xì)體現(xiàn)出節(jié)點(diǎn)間共現(xiàn)關(guān)系的強(qiáng)弱。將自編軟件統(tǒng)計(jì)的關(guān)鍵詞頻與CiteSpace導(dǎo)出的報(bào)表整合成表2。圖中出現(xiàn)了數(shù)字化、信息化、知識管理等12個帶有紫色外環(huán)的高中心性節(jié)點(diǎn)(中心性>0.1),表明這些節(jié)點(diǎn)在主題知識圖譜中占據(jù)重要位置,是數(shù)字檔案館研究的熱點(diǎn)主題。此外,圖中的云計(jì)算、建設(shè)、檔案館、數(shù)字化和數(shù)字城建檔案館帶有紅色內(nèi)環(huán),代表了國內(nèi)數(shù)字檔案館研究的前沿方向。

運(yùn)用可視化工具進(jìn)行統(tǒng)計(jì)分析比傳統(tǒng)的統(tǒng)計(jì)分析生動形象,但在同名作者及作者排序的區(qū)分、機(jī)構(gòu)名稱的一致、關(guān)鍵詞的規(guī)范等方面仍存在問題,因而不能簡單地以從相關(guān)數(shù)據(jù)庫中獲取的數(shù)據(jù)作為統(tǒng)計(jì)分析d依據(jù),而要對此進(jìn)行綜合分析才能使結(jié)論更加客觀真實(shí)。

注釋及參考文獻(xiàn):

[1]潘連根.數(shù)字檔案館與相關(guān)概念的關(guān)系——數(shù)字檔案館研究之一[J].浙江檔案,2004(3):18-20.

[2]楊冬權(quán).在全國數(shù)字檔案館室)建設(shè)推進(jìn)會上的講話[J].中國檔案,2013(11):16-21.

[3]韓冬.加強(qiáng)領(lǐng)導(dǎo)統(tǒng)籌規(guī)劃狠抓落實(shí)——國家檔案局?jǐn)?shù)字檔案館室)建設(shè)領(lǐng)導(dǎo)小組近日成立[N].中國

[4]Chen Chaomei. CiteSpace:Visualizing Patterns and Trends in Sci? entificLiterature[CP/OL].[2014-06-15].http://cluster.cis. drexel.edu/~cchen/citespace/download/.

[5]李曉明. CAJD電子文件研究高被引文獻(xiàn)的知識圖譜分析[J].檔案管理,2015(1):13-16.

[6]倪麗娟,于淑麗.檔案學(xué)研究熱點(diǎn)分析——基于2004-2008年《檔案學(xué)研究》、《檔案學(xué)通訊》論文關(guān)鍵詞的詞頻分析[J].檔案學(xué)通訊,2010(1):19-22.

作者單位:北京電子科技學(xué)院圖書館(檔案館)

猜你喜歡
發(fā)文檔案館圖譜
繪一張成長圖譜
10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
校園拾趣
爺孫趣事
以牙還牙
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
全省部分檔案館新館掠影
主動對接你思維的知識圖譜
太倉市數(shù)字檔案館成為“全國示范數(shù)字檔案館”
when與while檔案館