文·徐欣欣 王海寧
基于CNKI會議論文文獻(xiàn)計(jì)量
及共詞分析的國內(nèi)檔案學(xué)研究概觀
文·徐欣欣王海寧
文章通過對CNKI會議論文數(shù)據(jù)庫中檔案學(xué)(G27)的論文進(jìn)行文獻(xiàn)計(jì)量和共詞分析,發(fā)現(xiàn)這些會議主要是2000年后由各檔案學(xué)會舉辦的檔案工作者的會議,各高校舉辦的會議沒有錄入。會議作者發(fā)表1篇論文的居多,沒有穩(wěn)定的核心作者群。高產(chǎn)作者的機(jī)構(gòu)主要是各級檔案局、各類檔案館,高校人員較少。會議研究熱點(diǎn)也是檔案工作的各方面內(nèi)容,尤其關(guān)注檔案開發(fā)利用和民生檔案。
會議論文;文獻(xiàn)計(jì)量;共詞分析;檔案學(xué)
會議論文是分析學(xué)科研究熱點(diǎn)和發(fā)展脈絡(luò)的很好的材料,因?yàn)橐粋€(gè)學(xué)科的重要會議往往聚焦于該學(xué)科的重大前沿及熱點(diǎn)問題,甚至引領(lǐng)一個(gè)學(xué)科的發(fā)展方向;歷次會議的內(nèi)容都反映了該學(xué)科當(dāng)時(shí)關(guān)注的焦點(diǎn),各種會議其實(shí)是幾十年來學(xué)科研究發(fā)展的一個(gè)縮影。然而目前我國檔案界對國內(nèi)檔案學(xué)會議資料的挖掘較為欠缺。通過查閱相關(guān)紙質(zhì)文獻(xiàn),并檢索CNKI文獻(xiàn)數(shù)據(jù)庫,筆者發(fā)現(xiàn),除了幾篇針對某次會議進(jìn)行概述的文章和一些新聞報(bào)道類文章,目前尚無對國內(nèi)各種檔案學(xué)會議進(jìn)行綜合分析的論文。鑒于此,本文基于CNKI的會議論文數(shù)據(jù)庫,應(yīng)用文獻(xiàn)計(jì)量和共詞分析兩種方法,對相關(guān)文獻(xiàn)進(jìn)行定量和定性分析,以管窺國內(nèi)檔案學(xué)研究的歷史與現(xiàn)狀。
(一)研究方法
本文主要采用的是文獻(xiàn)計(jì)量分析法和共詞分析法。文獻(xiàn)計(jì)量分析法是以文獻(xiàn)信息為研究對象、以文獻(xiàn)計(jì)量學(xué)為理論基礎(chǔ)的一種研究方法;它以定量分析為主,側(cè)重外部表征。而共詞分析則以文獻(xiàn)中的關(guān)鍵詞或主題詞為分析單元,統(tǒng)計(jì)出文獻(xiàn)集中關(guān)鍵詞或主題詞在同一篇文獻(xiàn)中兩兩出現(xiàn)的頻率,形成共詞網(wǎng)狀,并以數(shù)值、圖形直觀地表現(xiàn)出來;它屬于內(nèi)容分析法,即對文獻(xiàn)內(nèi)容進(jìn)行客觀、系統(tǒng)和量化描述與分析的方法,是以定性分析為主,側(cè)重內(nèi)部特征[1]。
(二)數(shù)據(jù)采集、處理、分析
本文數(shù)據(jù)采集于CNKI國內(nèi)外重要會議論文全文數(shù)據(jù)庫。筆者于2015年3月7號進(jìn)行檢索,檢索條件為“中圖分類號”,輸入檔案學(xué)的分類號G27,共檢索到5353篇文獻(xiàn)。經(jīng)過去重,剩下4670篇。其中國際會議論文只有32篇,且它們是信息工程、公共管理、創(chuàng)造學(xué)等其它學(xué)科的會議中涉及到檔案學(xué)的文獻(xiàn),因此樣本反映的主要是國內(nèi)檔案學(xué)會議的情況。
數(shù)據(jù)處理通過excel實(shí)現(xiàn),先統(tǒng)計(jì)出會議類別、舉辦方、年份、作者、作者單位的分布情況;再借助VBA編程進(jìn)行關(guān)鍵詞提取、詞頻統(tǒng)計(jì)、構(gòu)建共詞矩陣并轉(zhuǎn)化為相似、相異矩陣。最后導(dǎo)入SPSS軟件進(jìn)行聚類分析。
(一)會議類別和舉辦方
按照所屬會議對4670篇文獻(xiàn)進(jìn)行歸類,如表1所示,除了一些名稱缺失的會議,以及一些所含論文很少、且多為非檔案學(xué)學(xué)科的會議(“其它”類中),其余會議可分為8大類,即1個(gè)中國檔案學(xué)會、5個(gè)省檔案學(xué)會、1個(gè)六省區(qū)檔案學(xué)會和1個(gè)專業(yè)檔案學(xué)會舉辦的會議。有些會議是這些學(xué)會和其它機(jī)構(gòu)合辦的,或者是這些學(xué)會承辦、其它機(jī)構(gòu)主辦的,為分類方便,都?xì)w于這些學(xué)會舉辦的會議。中南六省區(qū)檔案學(xué)會的學(xué)術(shù)會議是由廣西省檔案學(xué)會主辦。各類會議論文所占比例見圖1。
與實(shí)際召開的會議情況相比,數(shù)據(jù)中缺少其它省份或?qū)I(yè)檔案學(xué)會的會議資料,且沒有各高校舉辦的會議。由于各檔案學(xué)會所舉辦會議的參與者多為各級檔案局館、各單位檔案室的工作人員,高校的科研人員較少參與,因此論文反映的主要是其工作過程中的實(shí)際問題,純理論的內(nèi)容所占比例較少。這在后面的內(nèi)容分析中會得到進(jìn)一步驗(yàn)證。
表1:會議的構(gòu)成
圖1:各舉辦方的會議論文所占比例
(二)會議年份分布
我國第一次檔案學(xué)術(shù)會議是1981年中國檔案學(xué)會成立后召開的全國第一次檔案學(xué)術(shù)研討會,之后到2000年間又召開了4次,另外還召開了兩次全國青年檔案學(xué)術(shù)討論會。除此之外,該期間便無其它重大會議。本文樣本中的論文也主要是2000年以后的(見圖2),90年代僅有的幾篇經(jīng)查證也都來自非檔案學(xué)學(xué)科的會議。
其中2002年,會議論文陡增,主要是該年召開了中國檔案學(xué)會第六次全國檔案學(xué)術(shù)討論會、檔案工作應(yīng)對入世挑戰(zhàn)學(xué)術(shù)研討會以及江蘇省檔案現(xiàn)代化管理與檔案信息化建設(shè)學(xué)術(shù)研討會等會議。多種會議的召開反映了該年檔案學(xué)研究的興旺,這點(diǎn)通過其它途徑也可得到驗(yàn)證,如在CNKI文獻(xiàn)數(shù)據(jù)庫中檢索檔案學(xué)的文獻(xiàn),除了2006年之后的情況,2002年的文獻(xiàn)量達(dá)到峰值。說明2002年不僅有很多會議論文,期刊論文等其它文獻(xiàn)也很多。
2008~2012年會議論文也較多,主要是因?yàn)檫@幾年分別召開了2008、2010、2012年全國檔案工作者年會、2010年全國青年檔案工作者研討會以及貴州、甘肅、山東各省檔案學(xué)術(shù)會議。
圖2:會議論文年份分布
(三)會議核心作者
表2中給出了不同發(fā)文量的作者人數(shù)。按照洛特卡定律,寫兩篇論文的作者數(shù)量約為寫一篇論文的作者數(shù)量的 1/4;寫n篇論文的作者數(shù)量約為寫一篇論文的作者數(shù)量的 1/n2,而寫一篇論文的作者數(shù)量約占作者總數(shù)的60%[2]。對照表2,寫一篇論文的作者數(shù)量占作者總數(shù)的81.90%,遠(yuǎn)遠(yuǎn)超過了洛特卡定律的值;同時(shí),寫n篇論文的作者數(shù)量都低于寫一篇論文作者數(shù)的1/n2(n>1),低產(chǎn)作者人數(shù)過多,未達(dá)到洛特卡定律的條件。
表2:會議論文作者分布
4 49 1.07% 98.93% 234 5 25 0.55% 99.48% 150 6 6 0.13% 99.61% 104 7 10 0.22% 99.83% 76 8 5 0.11% 99.94% 59 9 1 0.02% 99.96% 46 10 0 0 99.96% 37 11 2 0.04% 100.00% 31
在洛特卡的基礎(chǔ)之上,普賴斯進(jìn)一步研究了科學(xué)家人數(shù)與科學(xué)文獻(xiàn)數(shù)量以及不同能力層次的科學(xué)家之間的定量關(guān)系,提出“在同一主題中,半數(shù)的論文為一群高生產(chǎn)能力作者所撰,其中杰出科學(xué)家中最低產(chǎn)和最高產(chǎn)科學(xué)家所撰寫的論文的關(guān)系數(shù)為m=0.749√”[3]。本文中,m=0.749√11=2.484篇,即杰出科學(xué)家中最低產(chǎn)者的撰文量為2.484,因此發(fā)表論文 3 篇以上的作者為核心作者。由表3可知核心作者共 172人,他們發(fā)表了682篇論文,遠(yuǎn)遠(yuǎn)低于全部論文的一半。
因此,無論使用洛特卡定律還是普賴斯定律,結(jié)果都表明國內(nèi)檔案學(xué)會議中高產(chǎn)作者少,而發(fā)文量 2 篇以下的作者形成了長尾,沒有一個(gè)穩(wěn)定的核心作者群。
表3:會議核心作者
(四) 會議核心研究機(jī)構(gòu)
表4:作者機(jī)構(gòu)分布
表4給出了發(fā)文量10篇以上的26個(gè)作者機(jī)構(gòu),從中可看出,高產(chǎn)單位主要是各級檔案局、各類檔案館;高校較少,只有遼寧大學(xué)歷史學(xué)院、云南省紅河州財(cái)經(jīng)學(xué)校、南京政治學(xué)院上海分院軍事信息管理系和中國人民大學(xué)信息資源管理學(xué)院4個(gè)。這與前文會議類別的結(jié)果一致,會議類型決定了主要參與者與發(fā)文者。
本文4670篇文獻(xiàn)中共有關(guān)鍵詞10416個(gè),總頻次36856次。頻次在50以上的關(guān)鍵詞共有97個(gè),占關(guān)鍵詞總數(shù)的0.9%,頻次計(jì)12071,占總頻次的32.75%??梢哉J(rèn)為,這些關(guān)鍵詞反映了本文會議論文的核心內(nèi)容。去除幾個(gè)意義過于寬泛的詞,如“檔案”“問題”“對策”等,還剩91個(gè),篇幅所限,本文僅將部分高頻關(guān)鍵詞列于下表:
表5:高頻關(guān)鍵詞(部分)
檔案信息 649 企業(yè)檔案 164 檔案服務(wù) 113 檔案業(yè)務(wù) 91檔案管理 641 現(xiàn)行文件 148 編研成果 110 人民群眾 91檔案利用 466 文件材料 147 檔案意識 102 檔案館藏 87檔案資料 382檔案館工作 137 檔案內(nèi)容 101數(shù)字檔案館建設(shè)87國家檔案局 295 開發(fā)利用 135 電子文件歸檔 99 市檔案館 84檔案人員 259數(shù)字檔案館 126 電子文件管理 96信息技術(shù) 84館藏檔案 223檔案編研工作 121現(xiàn)代化管理95 信息資源 84檔案數(shù)字化 217 檔案管理模式 115 檔案史料 94 單位檔案 83
統(tǒng)計(jì)這些高頻關(guān)鍵詞在文獻(xiàn)中的共現(xiàn)次數(shù),構(gòu)建91×91的共詞矩陣,并運(yùn)用Ochiia系數(shù)將之轉(zhuǎn)化為相似矩陣,以導(dǎo)入SPSS進(jìn)行系統(tǒng)聚類分析。聚類方法選擇Ward法,度量標(biāo)準(zhǔn)選擇計(jì)數(shù)中的Phi方度量,得出結(jié)果樹狀圖(圖3)[4]。為便于展示,對其大小進(jìn)行了調(diào)整,過程中部分關(guān)鍵詞被自動隱藏,因此圖中91個(gè)關(guān)鍵詞未全部顯示。
根據(jù)圖中聚類情況,并返回原文獻(xiàn)中查看關(guān)鍵詞具體的涵義和詞對共現(xiàn)情況,結(jié)合本領(lǐng)域相關(guān)背景知識,筆者將其劃分為10個(gè)子類進(jìn)行具體探討。
圖3:高頻關(guān)鍵詞聚類樹狀圖
(一)檔案事業(yè)
該類是從宏觀的方面進(jìn)行論述,由于會議參與者主要是各級檔案行政管理部門、各保管單位以及廣大專業(yè)檔案工作者,因此關(guān)于檔案事業(yè)的討論是一大熱點(diǎn),很多會議都直接圍繞檔案事業(yè)命名,如“檔案事業(yè)發(fā)展與青年檔案工作者的責(zé)任”(2010)、“檔案事業(yè)改革與創(chuàng)新”(2013)。高頻關(guān)鍵詞的前4位也都在此聚類中。
本論題涉及的內(nèi)容較多,論述到檔案事業(yè)的方方面面,如檔案管理、檔案服務(wù)、檔案業(yè)務(wù)、檔案人員、檔案系統(tǒng)、檔案管理部門、檔案法制建設(shè)、檔案學(xué)理論等,不過論述的出發(fā)點(diǎn)和立足點(diǎn)還是檔案事業(yè),典型的論文如《以改革創(chuàng)新精神助推檔案事業(yè)進(jìn)步——對湖北檔案工作促進(jìn)發(fā)展、服務(wù)民生的分析與思考》《檔案事業(yè)要科學(xué)發(fā)展法制建設(shè)是有力保障》。
(二)文書工作和檔案室業(yè)務(wù)
文書工作是指適應(yīng)單位開展各種業(yè)務(wù)活動的需要,圍繞文書的生成、接收、運(yùn)轉(zhuǎn)、辦理直至辦畢處置等的一系列管理活動[5]。而檔案室的任務(wù)是集中統(tǒng)一地管理本單位的全部檔案,維護(hù)檔案的完整與安全,積極開發(fā)檔案信息,為單位各項(xiàng)工作服務(wù)。這二者是檔案館工作開展之前的在各單位內(nèi)的文件管理活動,它們緊密聯(lián)系,相互促進(jìn)。
本文涉及此類的論文主要論述文書的立卷歸檔、機(jī)關(guān)檔案的保管期限、檔案室的集中統(tǒng)一管理、基層單位檔案管理等。典型的論文有《淺談文件立卷歸檔應(yīng)考慮到檔案開放的問題》《淺談新形勢下機(jī)關(guān)檔案工作的創(chuàng)新》《淺論基層單位如何做好檔案管理工作》。
(三)檔案館工作
很多會議參與者來自各級各類檔案館,因此圍繞檔案館工作的討論也是一大熱點(diǎn)。涉及的內(nèi)容有檔案的收集、檔案館藏、檔案資源建設(shè)、檔案利用以及各級各類檔案館的業(yè)務(wù)工作等。典型的論文有《對檔案接收進(jìn)館存在問題的思考》《豐富檔案館藏的途徑與方法》《試論檔案館利用率不高的原因及對策》《淺析縣級檔案館館藏建設(shè)》。
(四)電子文件和數(shù)字檔案館
“電子文件”的概念在我國出現(xiàn)于20世紀(jì)90年代。但其研究的真正興盛是在1996年之后。1996年在北京召開了第十三屆國際檔案大會,從理論上推進(jìn)了我國電子文件研究的發(fā)展。之后國家“政府上網(wǎng)工程”于1999 年正式啟動和實(shí)施, 2000 年底 80% 以上的部委和各級政府在網(wǎng)上建立了正式站點(diǎn),開始構(gòu)建中國的“電子政府”或“電子政務(wù)”,由此電子文件大范圍產(chǎn)生[6]。與此同時(shí),關(guān)于數(shù)字檔案館的研究也開始興起。
本文中這一類的研究主要圍繞檔案數(shù)字化(包括紙質(zhì)、照片和聲像等各種檔案的數(shù)字化)、辦公自動化、電子文件歸檔、電子文件管理和數(shù)字檔案館建設(shè),相關(guān)的論文有《淺談?wù)掌瑱n案的數(shù)字化處理》《電子文件在生成、運(yùn)行、歸檔、管理中應(yīng)注意的問題》《對數(shù)字檔案館功能定位與構(gòu)建方式的思考》等。
(五)專門檔案
專門檔案是各單位在某些專業(yè)性強(qiáng)的業(yè)務(wù)活動中產(chǎn)生的檔案,是我國在多年的檔案管理工作中,逐漸形成的與文書檔案、科技檔案并列的概念,包含會計(jì)檔案、訴訟檔案、病歷檔案等很多種。本文中有關(guān)該類的熱點(diǎn)研究領(lǐng)域是城建檔案、工程檔案和企業(yè)檔案,論文有《武漢城市圈城建檔案信息資源共享策略研究》《工程檔案質(zhì)量的全面監(jiān)控》《民營企業(yè)檔案工作的現(xiàn)狀及對策》等。
(六) 檔案開放及開發(fā)利用、檔案編研和檔案信息資源開發(fā)利用
這三類都涉及檔案的開發(fā)利用,只是角度和側(cè)重點(diǎn)有所不同,因此聚類時(shí)未成一類。不過我們可將其放在一起論述?!皺n案開放及開發(fā)利用”一類涵蓋的內(nèi)容比較全面,涉及檔案的開放、開發(fā)(如編研)、利用(如檔案信息服務(wù)),還從檔案庫房的角度論述如何優(yōu)化館藏以提高檔案服務(wù)水平?!皺n案編研”專門針對檔案材料的開發(fā),包括檔案史料的挖掘等?!皺n案信息資源開發(fā)利用”則借用資源管理和知識管理的視角,論述信息時(shí)代和知識經(jīng)濟(jì)時(shí)代檔案的開發(fā)利用價(jià)值。
三個(gè)類別反映出我國檔案部門對檔案開發(fā)利用的重視。近年來,我國越來越重視檔案館的社會服務(wù)功能,不斷加大檔案的開放力度,拉近檔案館和公眾的距離。信息技術(shù)的應(yīng)用也改變了檔案開發(fā)利用的方式,在檔案深度加工以及提供網(wǎng)上服務(wù)方面取得不斷進(jìn)步。會議對這方面的持續(xù)關(guān)注說明檔案開發(fā)利用仍將是我國檔案工作的重點(diǎn)。
(七) 民生檔案與家庭檔案和人事檔案
這兩類聯(lián)系緊密,因此也放一起論述。民生,《辭?!返慕忉屖侨嗣竦纳?jì)。民生檔案,就是與普通民眾的生計(jì)有直接關(guān)系的、社會公眾關(guān)注度高的、人民群眾需要查閱利用的檔案,如養(yǎng)老保險(xiǎn)檔案、醫(yī)療保險(xiǎn)檔案、婚姻檔案、房屋拆遷檔案等等[7]。人事檔案,由于記述了每個(gè)人工作生涯中的個(gè)人經(jīng)歷、思想品德、業(yè)務(wù)能力、工作狀況以及獎(jiǎng)懲情況等,也是民生檔案的重要組成部分。家庭檔案,是每個(gè)家庭里,所有成員在各項(xiàng)社會活動中,直接形成的對國家、社會、家庭和個(gè)人有保存價(jià)值的原始記錄。雖不同于民生檔案,但記錄的是人們?nèi)粘I畹姆椒矫婷?,與民生工作有著千絲萬縷的聯(lián)系;兩種檔案的落腳點(diǎn)也是一致的,最終都服務(wù)于人民。
本文中民生檔案一類主要是基于國家檔案局加強(qiáng)民生檔案工作的要求展開論述,從本質(zhì)上看,此方面的討論順應(yīng)了黨和政府推進(jìn)以保障和改善民生為重點(diǎn)的社會建設(shè)的需要。家庭和人事檔案,一個(gè)以家庭為單位,一個(gè)以個(gè)人為單位,關(guān)注的也是民生。兩類研究熱點(diǎn)反映了我國檔案部門對民生的重視。
通過CNKI會議論文數(shù)據(jù)庫中檔案學(xué)(G27)的4670篇文獻(xiàn),可以發(fā)現(xiàn)這些會議主要是2000年后由各檔案學(xué)會舉辦的檔案工作者的會議;各高校舉辦的會議沒有錄入。會議作者發(fā)表1篇論文的居多,沒有穩(wěn)定的核心作者群。高產(chǎn)作者的機(jī)構(gòu)主要是各級檔案局、各類檔案館,高校人員較少。會議研究熱點(diǎn)也是檔案工作的各方面內(nèi)容,尤其關(guān)注檔案開發(fā)利用和民生檔案。
會議內(nèi)容的特點(diǎn)是從實(shí)踐出發(fā),論述具體問題,鮮活生動,反映了檔案工作各環(huán)節(jié)各領(lǐng)域的情況。然而主要是從檔案工作者的視角進(jìn)行論述,對我國檔案學(xué)研究整體狀況的描述還有待分析各高校舉辦的檔案學(xué)者的會議。
●
[1]馬費(fèi)成,望俊成,陳金霞等.我國數(shù)字信息資源研究的熱點(diǎn)領(lǐng)域:共詞分析透視[J].情報(bào)理論與實(shí)踐,2007 (4):438-443.
[2][3]王崇德. 文獻(xiàn)計(jì)量學(xué)引論[M]. 桂林:廣西師范大學(xué)出版社,1997:145-163.
[4]張勤,馬費(fèi)成. 國內(nèi)知識管理研究結(jié)構(gòu)探討——以共詞分析為方法[J]. 情報(bào)學(xué)報(bào),2008(1):93-101.
[5]王健. 文書學(xué)[M]. 北京: 中國人民大學(xué)出版社,2001:37. [6]王先發(fā),龐濤,甘榮萍.中國電子文件研究綜述[J]. 云南檔案,2007(8):31-33.
[6]肖秋惠,我國數(shù)字檔案館與電子文件中心建設(shè)述評,《檔案學(xué)通訊》,2008(6):11-15.
[7]曹航,宗培嶺. 民生檔案的概念解析與價(jià)值指向[J]. 檔案管理,2009(2):19-21.
(作者單位:武漢大學(xué)信息管理學(xué)院)