張 蒂,郝晉清,王 珺
在推進(jìn)“雙一流”建設(shè)進(jìn)程中,高校圖書館積極開展學(xué)科評價服務(wù)。這項服務(wù)依托圖書館數(shù)字資源,應(yīng)用文獻(xiàn)計量法及分析工具對多源數(shù)據(jù)進(jìn)行整合分析,通過不同評價指標(biāo)實現(xiàn)對特定機構(gòu)的學(xué)科競爭力評價。由于學(xué)科評價的基礎(chǔ)數(shù)據(jù)來自不同數(shù)據(jù)庫,而每個數(shù)據(jù)庫獨特的文獻(xiàn)分類體系與確定評價學(xué)科所依據(jù)的教育部學(xué)科分類體系并不一致,因而如果無法將獲取的數(shù)據(jù)與評價學(xué)科進(jìn)行匹配,就會降低數(shù)據(jù)準(zhǔn)確性,直接影響評價結(jié)果的合理性。因此,科學(xué)判別數(shù)據(jù)的學(xué)科歸屬成為學(xué)科評價中亟待解決的重要問題。對人文社科學(xué)科評價而言,研究對象復(fù)雜化、研究范式多樣化、學(xué)科成果多元化等特點決定了評價體系是綜合性的系統(tǒng)工程[1],不僅評價指標(biāo)的設(shè)定與自然科學(xué)學(xué)科有所差異,而且評價數(shù)據(jù)的來源也必須是多維的,除應(yīng)用國際權(quán)威的引文數(shù)據(jù)庫外,還要充分應(yīng)用其他可行的中文數(shù)據(jù)庫源[2]。多源異構(gòu)的跨庫數(shù)據(jù)和學(xué)科本身的復(fù)雜性,為人文社科評價中學(xué)科歸屬的判別帶來了更多挑戰(zhàn)。
跨庫數(shù)據(jù)的學(xué)科歸屬問題直觀地表現(xiàn)為應(yīng)用數(shù)據(jù)庫獲取學(xué)科數(shù)據(jù)時比較困難,這也促使業(yè)界積極從構(gòu)建數(shù)據(jù)庫的映射方案層面著手解決此類問題。目前已有的數(shù)據(jù)庫映射方案集中于WoS、ESI和Scopus等外文數(shù)據(jù)庫,而缺少對CNKI和CSSCI等數(shù)據(jù)庫的探究和分析,這無疑是人文社會科學(xué)評價中實踐研究成果層面的缺失;同時由于缺少從映射方案中提煉出的可借鑒的方法和策略,從業(yè)者面對來自不同數(shù)據(jù)源的學(xué)科判別問題時仍然顯得辦法不多。在理論層面,雖然學(xué)界對學(xué)科分類及映射原理早有研究,但相關(guān)研究成果沒有與多維數(shù)據(jù)庫的學(xué)科歸屬判別情境發(fā)生鏈接,無法為解決實踐問題提供更多的理論支持??梢姡槍θ宋纳缈茖W(xué)科評價中判別跨庫數(shù)據(jù)學(xué)科歸屬過程中所出現(xiàn)的理論與實踐脫節(jié)、數(shù)據(jù)庫實踐范圍不完整以及缺乏從業(yè)者可借鑒的應(yīng)用策略等問題,進(jìn)行有針對性的研究并提出合理解決策略勢在必行。本研究聚焦人文社科學(xué)科評價中跨庫數(shù)據(jù)的學(xué)科歸屬問題。應(yīng)用案例研究法全方位地展示了南開大學(xué)圖書館在開展人文社科學(xué)科評價進(jìn)程中,根據(jù)數(shù)據(jù)庫特點及映射理論,在辨析學(xué)科分類體系的基礎(chǔ)上,通過制定多維度的學(xué)科映射方案對來自CNKI、CSSCI和WoS等數(shù)據(jù)源的評價數(shù)據(jù)實現(xiàn)合理判別學(xué)科歸屬的實踐過程?;诎咐龑嵺`,本研究全面剖析了學(xué)科評價中跨庫數(shù)據(jù)學(xué)科歸屬問題的本質(zhì)及根本原因、解決途徑及制約性因素,并提出了包括情境性因素、映射思路和實踐方法在內(nèi)的應(yīng)對策略。
(1)關(guān)于學(xué)科分類的內(nèi)涵及分類體系的對比。有學(xué)者[3-5]從范式發(fā)展或認(rèn)識論視角研究學(xué)科分類,認(rèn)為學(xué)科分類是為了確定學(xué)科在整個科學(xué)體系中的地位,根本問題是按照原則揭示體系的內(nèi)在關(guān)系,并以嚴(yán)格的符合邏輯的排列形式進(jìn)行表述[6];也有學(xué)者注重分析不同分類體系之間的差異,如對比國內(nèi)外學(xué)科分類體系[7],指出我國人文社科學(xué)科分類體系的問題并提出新的分類框架。
(2)關(guān)于學(xué)科映射方法的探究。學(xué)科映射方法是解決數(shù)據(jù)學(xué)科歸屬問題的理論基礎(chǔ)。在信息學(xué)研究中,映射指建立一個或多個詞匯的概念與另一個詞匯的概念之間的關(guān)系[8]。人工映射和自動映射是常見的兩類分類法映射方式,人工映射一般通過領(lǐng)域?qū)<覍τ成漕惸考M(jìn)行對比分析;自動映射是指用計算機通過統(tǒng)計或設(shè)計利用相關(guān)算法對類目進(jìn)行映射[9]。詹萌論證了學(xué)科分類與文獻(xiàn)分類之間進(jìn)行映射的可行性[10],提出多種映射方案。這些基礎(chǔ)理論和學(xué)科映射方法的探究為解決數(shù)據(jù)庫的學(xué)科歸屬判別奠定了理論基礎(chǔ),提供了方法論上的指引,但具體的映射方法還要根據(jù)評價情境進(jìn)行合理構(gòu)建。
(1)剖析學(xué)科評價實踐中凸顯的數(shù)據(jù)的學(xué)科歸屬難題。開展學(xué)科評價服務(wù)是近年高校圖書館在“雙一流”建設(shè)大背景下的重要服務(wù)模式,很多從業(yè)者就實踐中凸顯的學(xué)科數(shù)據(jù)判別問題從不同層面進(jìn)行了分析。吳愛芝等[11]根據(jù)北京大學(xué)開展的學(xué)科競爭力評價實踐,提出數(shù)據(jù)的學(xué)科匹配與歸屬是評估中需要解決的重點問題。趙飛等[12]指出大部分科研成果的學(xué)科劃分均是參照來源數(shù)據(jù)的學(xué)科劃分來定義,由此產(chǎn)生的問題和誤差也是科研評估中無法回避的難點。謝慧珍[13]以天津師范大學(xué)的實踐為例,指明數(shù)據(jù)的權(quán)威性和廣泛性是進(jìn)行數(shù)據(jù)源選擇的重要考慮因素。
(2)提出針對特定數(shù)據(jù)庫的學(xué)科映射方案?;趯嵺`,許多學(xué)者對特定數(shù)據(jù)庫進(jìn)行了有針對性的映射研究,為學(xué)科數(shù)據(jù)判別提供了有參考價值的實證案例。陳雨[14]應(yīng)用分類體系差異測度工具,全方位地比較了WoS和Scopus分類體系的差異;劉苗苗等[15]基于ESI工具進(jìn)行了社會科學(xué)總論學(xué)科域的映射研究;付凱麗[16]在對制約學(xué)科評價服務(wù)的多種因素的分析中提出正確利用數(shù)據(jù)庫分類體系是全面準(zhǔn)確獲取數(shù)據(jù)的前提,并以心理學(xué)為例建立了WoS及Scopus的學(xué)科映射方案。
綜上,雖然學(xué)界和業(yè)界已經(jīng)注意到了學(xué)科歸屬問題給學(xué)科評價實踐帶來的影響,并通過制定針對特定數(shù)據(jù)庫的映射方案,為解決數(shù)據(jù)獲取層面的難題提供應(yīng)用依據(jù),但理論研究的缺陷及實踐中亟待解決的問題仍舊存在。首先,缺乏關(guān)于CNKI 和CSSCI 數(shù)據(jù)庫學(xué)科歸屬判別的研究成果。目前相關(guān)論文中針對的研究對象幾乎全部集中于WoS、ESI和Scopus等外文數(shù)據(jù)庫,很少涉及對人文社科學(xué)科評價所必須應(yīng)用的CNKI和CSSCI等中文數(shù)據(jù)源的探討。研究成果上的缺失既有可能是實踐中應(yīng)用數(shù)據(jù)庫的范圍不完整造成的,也有可能是難以解決CNKI和CSSCI的數(shù)據(jù)學(xué)科歸屬判別難題的真實寫照。無論何種原因,人文社科學(xué)科評價中數(shù)據(jù)的權(quán)威性和廣泛性均有賴于對多源異構(gòu)數(shù)據(jù)的收集分析,因此必須展開全面的跨庫數(shù)據(jù)學(xué)科歸屬判別的實踐和分析。其次,映射理論與數(shù)據(jù)庫實踐脫節(jié)。圖情領(lǐng)域?qū)Ψ诸惙ㄓ成涞难芯坑蓙硪丫茫芯砍晒麉s很少應(yīng)用于學(xué)科評價的數(shù)據(jù)庫映射實踐中。吳愛芝等在關(guān)于北京大學(xué)學(xué)科評價實踐的論文[11]中雖然提出已經(jīng)分別建立了各數(shù)據(jù)庫與評價學(xué)科的映射關(guān)系,但沒有詳細(xì)闡述理論依據(jù)??梢姡壳皩W(xué)科映射理論與數(shù)據(jù)應(yīng)用實踐呈現(xiàn)出某種程度的脫節(jié)。同時,由于缺乏依據(jù)學(xué)科評價情境形成的一整套解決同類問題的有效策略,從業(yè)者往往在面對產(chǎn)生于不同數(shù)據(jù)庫的數(shù)據(jù)學(xué)科歸屬判別難題時顯得無所適從。因此,為研究人文社科學(xué)科評價中跨庫數(shù)據(jù)的學(xué)科歸屬問題,應(yīng)借鑒已有映射理論,積極探索人文社科學(xué)科評價情境中可行的映射方法;拓展人文社科評價的數(shù)據(jù)庫實踐范圍,對多元異構(gòu)數(shù)據(jù)學(xué)科歸屬判別的實踐案例進(jìn)行全面剖析。
本研究采用案例研究法。通過南開大學(xué)圖書館開展人文社科學(xué)科評價服務(wù)的實踐案例,剖析其應(yīng)用多種學(xué)科映射方法,對來源于CNKI、CSSCI和WoS數(shù)據(jù)庫的評價數(shù)據(jù)進(jìn)行學(xué)科歸屬判別并有效獲取學(xué)科數(shù)據(jù)的過程。數(shù)據(jù)主要來源于2017年至今南開大學(xué)圖書館開展學(xué)科評價服務(wù)中的學(xué)科數(shù)據(jù),數(shù)據(jù)庫源為南開大學(xué)IP范圍內(nèi)可應(yīng)用的CNKI、CSSCI和WoS數(shù)據(jù)庫平臺及部分試用數(shù)據(jù)庫平臺。
2.2.1 辨析學(xué)科分類體系與文獻(xiàn)分類體系
自2002年起,教育部學(xué)位與研究生教育發(fā)展中心(以下簡稱“學(xué)位中心”)依據(jù)《學(xué)位授予和人才培養(yǎng)學(xué)科目錄》[17](以下簡稱《學(xué)科目錄》)對全國具有博士或碩士學(xué)位授予權(quán)的一級學(xué)科進(jìn)行評估,該目錄即成為高校圖書館學(xué)科評價服務(wù)所依據(jù)的學(xué)科分類體系。此外,我國的學(xué)科分類指導(dǎo)性文件還有《中華人民共和國學(xué)科分類與代碼國家標(biāo)準(zhǔn)》(GB/T13745-2009)以及《普通高等學(xué)校本科專業(yè)目錄》(以下簡稱《專業(yè)目錄》)。另外,與學(xué)科分類體系相對應(yīng)的是文獻(xiàn)分類體系。文獻(xiàn)分類通常是指根據(jù)文獻(xiàn)內(nèi)容和形式的異同,按照一定體系有系統(tǒng)地組織和區(qū)分文獻(xiàn)[18]。數(shù)據(jù)庫的學(xué)科分類在本質(zhì)上是一種文獻(xiàn)分類體系,在功能應(yīng)用及劃分形式上均與學(xué)科分類有差異,正是這種差異才不可避免地導(dǎo)致了獲取學(xué)科評價數(shù)據(jù)時的難題。為了更直觀地解讀這兩類分類體系,本研究分別對3種學(xué)科分類體系和兩種常用的中外文數(shù)據(jù)庫的文獻(xiàn)分類體系進(jìn)行了多維度辨析,具體內(nèi)容見表1。如表1 內(nèi)容所示,學(xué)科分類體系與文獻(xiàn)分類體系在應(yīng)用范圍、分類原則構(gòu)成等方面均有差異。根據(jù)分類示例的展示,可知3種學(xué)科分類體系的類目表達(dá)方式十分接近,而《中國圖書館分類法》(以下簡稱《中圖法》)作為文獻(xiàn)分類體系對于學(xué)科內(nèi)涵的揭示與學(xué)科分類體系之間有相通性,由此也為建立映射關(guān)系提供了可行性。
表1 主要學(xué)科分類體系與文獻(xiàn)分類體系概覽
2.2.2 探究學(xué)科映射方法
人工映射和自動映射是兩種常用的映射方式。建立人文社科學(xué)科評價的映射關(guān)系既需要明晰學(xué)科分類體系的應(yīng)用范圍及分類原理,也需要厘清不同數(shù)據(jù)庫的文獻(xiàn)分類規(guī)則,同時更需要了解評價學(xué)科的研究范疇甚至其獨特的發(fā)展歷程。從這個意義上講,現(xiàn)階段主要由學(xué)科評價從業(yè)者和學(xué)科信息專家通過人工映射完成定性研究的學(xué)科映射方案更符合目前人文社科的評價情境。具體映射過程中采用更為科學(xué)和規(guī)范的映射方法則可以有效降低主觀性因素的影響。詹萌的研究[10]表明,可以通過對《中圖法》進(jìn)行類目解析、建立基于字面和語義相關(guān)性以及尋找專業(yè)或?qū)W科知識點相關(guān)性等途徑來構(gòu)建學(xué)科分類體系與文獻(xiàn)分類體系之間的映射關(guān)系。在借鑒該項研究成果的基礎(chǔ)上,本文案例對這3種方式均有應(yīng)用,但相對更廣泛地使用了基于語義相關(guān)性的映射法和基于知識內(nèi)涵相關(guān)性的映射法。語義映射法是以學(xué)科類目名稱作為映射元素,在兩類分類體系之間尋找學(xué)科名稱的同一性或語義相關(guān)性,由此建立映射關(guān)系的方法,根據(jù)實際情況也可以細(xì)分為字面相關(guān)性和語義相關(guān)性的具體映射途徑?;谥R內(nèi)涵相關(guān)性的映射是以學(xué)科或?qū)I(yè)的知識點作為映射元素,通過確定學(xué)科在兩類分類體系中所覆蓋的知識點層面的相關(guān)性來確定映射關(guān)系的方法。
2.2.3 學(xué)科映射方案的總體思路
根據(jù)相關(guān)理論基礎(chǔ),本研究設(shè)計了用以指導(dǎo)南開大學(xué)人文社科學(xué)科評價中判別學(xué)科歸屬的學(xué)科映射方案的總體思路(見圖1),主要包括如下步驟:(1)梳理分類體系及了解學(xué)科評價情境;(2)對需建立映射關(guān)系的學(xué)科分類體系與數(shù)據(jù)庫文獻(xiàn)分類體系進(jìn)行同質(zhì)性或異質(zhì)性辨析;(3)根據(jù)辨析過程,規(guī)劃同質(zhì)性或異質(zhì)性分類體系下的學(xué)科映射方案;(4)基于學(xué)科映射方案,分別采用以學(xué)科類目名稱作為映射元素的語義映射法和以學(xué)科內(nèi)涵知識點作為映射元素的知識內(nèi)涵映射法完成映射工作;(5)對其他映射方案的可行性探索、驗證與特殊學(xué)科的處理。
2017年至今南開大學(xué)圖書館根據(jù)學(xué)科特點和實際需求,先后為政治學(xué)、中國史、世界史、理論經(jīng)濟學(xué)和應(yīng)用經(jīng)濟學(xué)等人文社會科學(xué)一級學(xué)科提供了學(xué)科評價服務(wù)[19]。本部分案例展示的是對來自CNKI、CSSCI和WoS等數(shù)據(jù)源的評價數(shù)據(jù)實現(xiàn)合理判別學(xué)科歸屬的實踐過程。每個數(shù)據(jù)庫的具體實踐分析都包括兩部分內(nèi)容:分別是學(xué)科分類體系辨析及數(shù)據(jù)庫學(xué)科評價功能揭示,以及在此基礎(chǔ)上設(shè)計的特定學(xué)科規(guī)劃并實施的學(xué)科映射方案。
(1)分類體系辨析:基于《中圖法》學(xué)科分類體系。中國知網(wǎng)系列數(shù)據(jù)庫(CNKI)是評估學(xué)科中文科研成果的重要數(shù)據(jù)來源。CNKI 在“使用手冊”中提到其文獻(xiàn)分類是根據(jù)《中圖法》獨創(chuàng)的學(xué)科分類體系[20],與確定評價學(xué)科所依據(jù)的《學(xué)科目錄》是兩種本質(zhì)不同的異質(zhì)性分類體系。而且,其檢索項中沒有設(shè)立“學(xué)科”檢索字段,因此無論是其檢索字段的設(shè)置還是其獨創(chuàng)的學(xué)科分類體系都無法契合學(xué)科評價的檢索需求,必須重新規(guī)劃學(xué)科映射方案。
(2)映射方案1:基于知識內(nèi)涵相關(guān)性的學(xué)科映射。通過分析CNKI文獻(xiàn)分類原則及檢索特點,在針對政治學(xué)一級學(xué)科的學(xué)科評價服務(wù)中,學(xué)科館員規(guī)劃了基于知識內(nèi)涵相關(guān)性的映射方案,以實現(xiàn)在該平臺上政治學(xué)的學(xué)科數(shù)據(jù)歸屬判別,具體步驟及詳細(xì)內(nèi)容見表2。
表2 基于知識內(nèi)涵相關(guān)性的政治學(xué)學(xué)科映射具體步驟
根據(jù)知識點內(nèi)涵相關(guān)性映射方法,完成上述映射過程主要包括明確學(xué)科內(nèi)涵、梳理兩類分類體系下的學(xué)科分類方法、提取學(xué)科映射的知識點元素和完成映射4個步驟。需要指出的是,并不是所有知識點都可完成映射匹配。根據(jù)學(xué)科發(fā)展情境的變化,有些知識點的學(xué)科歸屬還需要視學(xué)科變化進(jìn)程而定,目前暫時無法完成映射。根據(jù)對可產(chǎn)生映射關(guān)系的學(xué)科內(nèi)涵知識點的挖掘,完成了對CNKI 社會科學(xué)I 輯文獻(xiàn)中政治學(xué)學(xué)科的具體映射,提煉出“政治學(xué)”“中國政治與國際政治”“政黨與群眾組織”3個學(xué)科類別中的19個具體研究專題的學(xué)科數(shù)據(jù)。
(3)映射方案2:基于《中國高校教學(xué)科研成果大數(shù)據(jù)分析平臺》的字面相關(guān)性學(xué)科映射。2017年南開大學(xué)圖書館試用《中國高校教學(xué)科研成果大數(shù)據(jù)分析平臺》,該平臺是知網(wǎng)研發(fā)的評定高校教學(xué)科研成果的定量分析工具。平臺最突出的特點是學(xué)科分類是以教育部2011年《學(xué)科目錄》與《中圖法》(第五版)為基礎(chǔ)設(shè)置。該平臺的文獻(xiàn)分類體系與教育部一級學(xué)科目錄完全一致,屬于同質(zhì)性分類體系,可以采用語義映射法。依據(jù)語義相關(guān)性選擇字面相同的學(xué)科名稱,即可獲取相應(yīng)的學(xué)科數(shù)據(jù)。為了在多種映射方案中形成相互印證,學(xué)科館員分別將在兩種方案中得到的科研產(chǎn)出數(shù)據(jù)進(jìn)行對比,其結(jié)果數(shù)據(jù)的差異在可接受的范圍內(nèi),因此這兩種方案仍是CNKI數(shù)據(jù)庫中進(jìn)行學(xué)科歸屬判別的最為可行的方式。
(1)分類體系辨析:數(shù)據(jù)庫學(xué)科分類依據(jù)的多元化。中文社會科學(xué)引文索引(CSSCI)是我國人文社會科學(xué)重要的文獻(xiàn)信息查詢與評價工具。關(guān)于其分類體系的依據(jù),在其網(wǎng)站上公布的遴選標(biāo)準(zhǔn)[22]中明確指出數(shù)據(jù)庫學(xué)科分類的依據(jù)是《中華人民共和國學(xué)科分類與代碼國家標(biāo)準(zhǔn)》(GB/T13745-2009),并參照《學(xué)位授予和人才培養(yǎng)學(xué)科目錄(2011年)》(學(xué)位[2011]11號)和《國家社會科學(xué)基金學(xué)科分類目錄》進(jìn)行。CSSCI的檢索系統(tǒng)及與學(xué)科相關(guān)的檢索字段的設(shè)置均是數(shù)據(jù)庫學(xué)科分類依據(jù)的多元化帶來的結(jié)果。這種現(xiàn)狀為學(xué)科歸屬的判別實踐帶來兩個難題:首先是如何甄別“學(xué)科類別”與“學(xué)位分類”這兩個與學(xué)科數(shù)據(jù)檢索與獲取相關(guān)的檢索字段;其次是難以應(yīng)用一種映射方案完成人文社會科學(xué)全域范圍內(nèi)的學(xué)科數(shù)據(jù)的判別。可見,對于CSSCI數(shù)據(jù)庫的學(xué)科歸屬判別必須融合多種映射方案完成。
(2)映射方案1:基于字面相關(guān)性的13個人文社科一級學(xué)科的映射。CSSCI高級檢索方式中分別設(shè)有“學(xué)科類別”與“學(xué)位分類”檢索字段,選擇哪個檢索字段作為學(xué)科數(shù)據(jù)的檢索字段與其所依據(jù)的分類體系緊密相關(guān)。CSSCI在其附表中分別提供了“學(xué)科代碼”“學(xué)科類別”的具體含義,其中“學(xué)科代碼”與《中華人民共和國學(xué)科分類與代碼國家標(biāo)準(zhǔn)》(GB/T 13745-2009)中的學(xué)科代碼完全一致,從而也說明CSSCI“學(xué)科類別”字段所代表的分類體系來源于國家標(biāo)準(zhǔn)中的學(xué)科分類體系;而根據(jù)檢索實踐的結(jié)果,“學(xué)位分類”檢索字段的分類體系更多的是依據(jù)《學(xué)科目錄》。因此,選擇“學(xué)位分類”字段進(jìn)行學(xué)科數(shù)據(jù)獲取是合理且適宜的。通過對檢索字段內(nèi)涵的甄別,不僅解決了選擇檢索字段的問題,也完成了對CSSCI學(xué)科分類體系的辨析及在此基礎(chǔ)上映射方案的規(guī)劃。由于“學(xué)位分類”字段所依據(jù)的分類體系就是教育部的《學(xué)科目錄》,這種分類體系上的同質(zhì)性使我們可以應(yīng)用字面相關(guān)性的映射方法完成學(xué)科數(shù)據(jù)歸屬的判別。根據(jù)《學(xué)科目錄》以及教育部學(xué)位中心開展學(xué)科評估中對人文社會科學(xué)學(xué)科的設(shè)定,人文社科類共包括17個具有博士或碩士學(xué)位授予權(quán)的一級學(xué)科。應(yīng)用以上映射方案,17個人文社科一級學(xué)科中的13個一級學(xué)科在學(xué)科名稱字面上是完全匹配的,可以直接通過“學(xué)位分類”字段的檢索來獲取學(xué)科數(shù)據(jù),完成映射。
(3)映射方案2:基于語義相關(guān)性的2個人文社科一級學(xué)科的映射。CSSCI“學(xué)位分類”字段包括17個一級學(xué)科中的13個學(xué)科,無法實現(xiàn)人文社科一級學(xué)科的全域映射,馬克思主義理論、考古學(xué)、中國史和世界史這4個一級學(xué)科的學(xué)科名稱沒有出現(xiàn)在“學(xué)位分類”字段,必須尋找新的映射途徑。
CSSCI“學(xué)科類別”字段所依據(jù)的分類體系來源于《中華人民共和國學(xué)科分類與代碼國家標(biāo)準(zhǔn)》(GB/T13745-2009),這與教育部的《學(xué)科目錄》雖然并不完全一致,但它們本質(zhì)上都屬于同質(zhì)性學(xué)科分類體系,這為應(yīng)用同質(zhì)性分類體系下的映射方法奠定了基礎(chǔ)。CSSCI高級檢索“學(xué)科類別”字段的學(xué)科范圍中設(shè)有“馬克思主義”和“考古學(xué)”兩個學(xué)科,其中“馬克思主義”在字面上與教育部《學(xué)科目錄》中的“馬克思主義理論”學(xué)科名稱不完全一致,但學(xué)科類目名稱的語義層面是一致的。因此,對于無法在“學(xué)位分類”中獲取學(xué)科產(chǎn)出數(shù)據(jù)的馬克思主義理論和考古學(xué)一級學(xué)科,通過語義相關(guān)性判別學(xué)科歸屬,選擇“學(xué)科類別”字段進(jìn)行數(shù)據(jù)獲取的檢索方式也不失為一種可行的方案。
(4)映射方案3:基于《中圖法》類目分析的2個人文社科一級學(xué)科的映射。世界史于2011年2月正式成為一級學(xué)科,與中國史和考古學(xué)并列成為歷史學(xué)學(xué)科門類下的一級學(xué)科。這種來自學(xué)科發(fā)展過程的變化沒有及時在數(shù)據(jù)庫文獻(xiàn)分類中體現(xiàn)出來,目前CSSCI的“學(xué)科類別”和“學(xué)位分類”字段都只能檢索到“歷史學(xué)”的學(xué)科文獻(xiàn),無法將“中國史”和“世界史”文獻(xiàn)從其中較為清晰地分離出來,因此根據(jù)學(xué)科映射方案的總體思路,針對這種特殊學(xué)科的處理,需要結(jié)合數(shù)據(jù)庫特點探索其他映射方案。
CSSCI設(shè)置有“中圖分類號”檢索字段,可以揭示每篇文獻(xiàn)的中圖分類號,有利于應(yīng)用《中圖法》類目分析的方法來判別學(xué)科數(shù)據(jù)。具體做法是:選擇CSSCI數(shù)據(jù)庫中的“中圖分類號”檢索字段,收集評價機構(gòu)在特定評估年份中CSSCI歷史學(xué)論文的總體數(shù)據(jù)及中圖分類號的相關(guān)數(shù)據(jù),對照《中圖法》,將論文分為“K0 史學(xué)理論”“K1世界史”“K2中國史”“K3-7世界各國和地區(qū)史”“K82中國人物傳記”5個區(qū)間,逐一統(tǒng)計分析。其中“中國史”學(xué)科數(shù)據(jù)包括“K2中國史”,“世界史”學(xué)科數(shù)據(jù)包括“K1世界史”和“K3-7世界各國和地區(qū)史”。這種方法基本上可以實現(xiàn)“中國史”和“世界史”學(xué)科數(shù)據(jù)的歸屬判別,但無法做到數(shù)據(jù)的完全精確,其中數(shù)量較少的“史學(xué)理論”及“中國人物傳記”部分的學(xué)術(shù)論文的歸屬還都需要經(jīng)過與專家協(xié)商,從論文的內(nèi)容中判別學(xué)科歸屬。
CSSCI是人文社會科學(xué)學(xué)科評價的重要數(shù)據(jù)來源和分析工具,探討它在數(shù)據(jù)學(xué)科歸屬判別實踐中的應(yīng)用具有重要意義,有必要進(jìn)行全方位整理。關(guān)于分別在CSSCI數(shù)據(jù)庫中應(yīng)用“字面相關(guān)性”“語義相關(guān)性”及“《中圖法》類目解析”3種方案實現(xiàn)對學(xué)科數(shù)據(jù)的判別及有效收集的整體思路總結(jié)如圖2所示。
圖2 應(yīng)用CSSCI數(shù)據(jù)庫判別人文社科學(xué)科數(shù)據(jù)歸屬的思路及路徑
(1)分類體系辨析:WoS核心合集學(xué)科分類體系的特殊性。Web of Science(WoS)是科睿唯安公司的信息服務(wù)平臺,支持自然科學(xué)、社會科學(xué)、藝術(shù)與人文學(xué)科的文獻(xiàn)檢索,該平臺的WoS核心合集是世界上最有影響力的多學(xué)科學(xué)術(shù)文獻(xiàn)文摘索引數(shù)據(jù)庫。作為學(xué)科國際科研成果的重要數(shù)據(jù)源和評價工具,WoS對人文社科學(xué)科評價服務(wù)的重要意義不言而喻。WoS核心合集包括254個學(xué)科類別[23],學(xué)科粒度劃分細(xì)致,其學(xué)科體系的劃分與業(yè)界熟悉的3類中文學(xué)科分類體系以及《中圖法》文獻(xiàn)分類體系均有本質(zhì)差異,僅從學(xué)科名稱難以實現(xiàn)對評價學(xué)科的準(zhǔn)確匹配,必須以新思路實現(xiàn)數(shù)據(jù)的學(xué)科歸屬判別。
(2)映射方案1:基于知識內(nèi)涵相關(guān)性的學(xué)科映射。根據(jù)相關(guān)理論及過去幾年的學(xué)科評價實踐,南開大學(xué)學(xué)科服務(wù)團隊認(rèn)為可以基于異質(zhì)性學(xué)科分類體系下的知識內(nèi)涵相關(guān)性的方法來規(guī)劃WoS 平臺的學(xué)科映射方案,其中的關(guān)鍵在于對學(xué)科內(nèi)涵的深入和全面理解。以政治學(xué)為例,從學(xué)科名稱上看,WoS 核心合集的Web of Science類別字段中有“Political Science”學(xué)科,但除了學(xué)科名稱字面上的對應(yīng)之外是否還有其他學(xué)科也有對應(yīng)關(guān)系,需要進(jìn)行學(xué)科內(nèi)涵的理解和挖掘。WoS核心合集中的“Master Journal List”部分就收錄文獻(xiàn)與其學(xué)科類別的歸屬進(jìn)行了說明,詳細(xì)描述了254 個學(xué)科的文獻(xiàn)收錄范圍,這對我們理解WoS每個學(xué)科類別的具體內(nèi)涵大有裨益。表3 是Categories&Collections(Scope Notes)[24]對Web of Science 類別中的“Political Science” 和“International Relations”學(xué)科內(nèi)涵的描述。根據(jù)表3中對這兩個學(xué)科內(nèi)涵的描述,看出它們在研究內(nèi)容、研究范圍及所覆蓋的知識點上與《學(xué)科目錄》中“政治學(xué)”學(xué)科內(nèi)涵較為一致,可以成為“政治學(xué)”的映射學(xué)科。在進(jìn)行學(xué)科映射的過程中,由于無法確定是否將Web of Science類別字段中的“Area Studies”也作為政治學(xué)的對應(yīng)學(xué)科,學(xué)科館員積極與院系的學(xué)科信息專家進(jìn)行探討,發(fā)現(xiàn)“Area Studies”的學(xué)科內(nèi)涵闡述中雖然也包含政治學(xué)的部分內(nèi)容,但其知識點內(nèi)涵上更傾向于歷史學(xué)和跨學(xué)科研究。因此,對于映射過程中交叉學(xué)科的辨析,在院系學(xué)科信息專家的協(xié)助下認(rèn)真完成對學(xué)科知識內(nèi)涵的深度挖掘是十分必要的。
表3 WoS核心合集中Political Science和International Relations的學(xué)科內(nèi)涵描述
(3)映射方案2:應(yīng)用InCites評估工具的字面相關(guān)性的學(xué)科映射。InCites是科睿唯安公司基于Web of Science Core Collection 引文數(shù)據(jù)建立的綜合性科研績效評估工具。自2017年起,南開大學(xué)圖書館開始應(yīng)用InCites進(jìn)行學(xué)科數(shù)據(jù)獲取工作,這主要得益于該平臺提供了多種學(xué)科分類體系的選擇,其中就包括與教育部學(xué)科分類體系進(jìn)行映射后呈現(xiàn)的China SCADC Subject 97 Narrow(教育部110個一級學(xué)科中的97個)學(xué)科分類體系。由于該分類體系與教育部學(xué)科分類體系一致,可直接應(yīng)用字面相關(guān)性的映射方法,選擇“研究方向”字段來獲取學(xué)科數(shù)據(jù)。例如,選擇研究方向=“0202 Applied Economics”,就可以獲得應(yīng)用經(jīng)濟學(xué)的學(xué)科數(shù)據(jù)。表4是InCites平臺中China SCADC Subject 97 Narrow分類體系與教育部學(xué)科評估分類體系中人文社科學(xué)科的對應(yīng)情況。從表4 分析看出,InCites 平臺China SCADC Subject 97 Narrow學(xué)科分類體系可以實現(xiàn)與教育部學(xué)科分類體系中17個人文社會學(xué)科中的15個一級學(xué)科的對應(yīng),只有“0305馬克思主義理論”和“0501中國語言文學(xué)”2個一級學(xué)科,目前暫時無法實現(xiàn)學(xué)科映射。
表4 教育部學(xué)科分類體系中人文社科學(xué)科與InCites平臺China SCADC Subject 97 Narrow學(xué)科分類的對應(yīng)
數(shù)據(jù)的學(xué)科歸屬問題是伴隨著學(xué)科評價服務(wù)的深入逐漸凸顯的,在從業(yè)者的實踐中通常表現(xiàn)為無法通過數(shù)據(jù)庫獲取評價學(xué)科的科研成果數(shù)據(jù),或者說它更為直觀地表現(xiàn)為數(shù)據(jù)庫檢索難題。事實上,這類問題是涉及學(xué)科分類體系、文獻(xiàn)分類體系、學(xué)科映射方法以及數(shù)據(jù)庫學(xué)科評價功能應(yīng)用等多維度的科學(xué)問題。學(xué)科歸屬問題的根本原因是在學(xué)科評價服務(wù)的特定情境中由學(xué)科評價需求聯(lián)結(jié)的兩類分類體系之間的差異造成的。這兩類分類體系分別是產(chǎn)生學(xué)科信息檢索需求所依據(jù)的學(xué)科分類體系和滿足檢索需求的數(shù)據(jù)庫文獻(xiàn)分類體系,它們在分類原則等方面的本質(zhì)差異引發(fā)了數(shù)據(jù)的學(xué)科歸屬問題。
在兩類異構(gòu)的分類體系之間建立可操作的映射關(guān)系是解決數(shù)據(jù)學(xué)科歸屬問題的根本途徑,由此關(guān)于映射方法的探究成為本文重要的理論基礎(chǔ)。本項研究提出規(guī)劃學(xué)科映射總體思路的重要前提是對學(xué)科分類體系和數(shù)據(jù)庫文獻(xiàn)分類體系進(jìn)行同質(zhì)性或異質(zhì)性辨析,這既需要明確學(xué)科分類體系的設(shè)置原理及類目層級,也需要分析數(shù)據(jù)庫文獻(xiàn)的分類原則及學(xué)科評價功能?;趯Ψ诸愺w系的辨析,本文分別構(gòu)建了基于語義相關(guān)性和基于知識內(nèi)涵相關(guān)性的映射方法,并就每種方法在不同數(shù)據(jù)庫中的應(yīng)用進(jìn)行了具體闡述。
人文社科學(xué)科評價中數(shù)據(jù)的權(quán)威性和廣泛性有賴于對多源數(shù)據(jù)的全面收集,但目前所見的研究成果中針對的研究對象幾乎全部集中于WoS、ESI和Scopus等外文索引數(shù)據(jù)庫,很少涉及對中文數(shù)據(jù)源的探討。本文應(yīng)用案例研究法,分別探究了如何對來自CNKI、CSSCI 和WoS等數(shù)據(jù)源的評價數(shù)據(jù)實現(xiàn)合理判別學(xué)科歸屬的實踐過程,尤其是創(chuàng)新性地對CNKI 和CSSCI 數(shù)據(jù)庫規(guī)劃了多種學(xué)科映射方案,這種多維的跨庫探索是人文社科學(xué)科評價中數(shù)據(jù)源全面性的重要保障。
數(shù)據(jù)庫文獻(xiàn)分類體系極具復(fù)雜性,一個數(shù)據(jù)庫有時會涉及多種分類體系,同時數(shù)據(jù)庫的學(xué)科服務(wù)功能也呈現(xiàn)動態(tài)性,新的學(xué)科評價功能及檢索方式時有更新,針對這些變化及數(shù)據(jù)庫的特點,為每個數(shù)據(jù)庫規(guī)劃多種學(xué)科映射方案,并盡力在多種映射方案之間完成學(xué)科數(shù)據(jù)的有效驗證十分必要。
應(yīng)用多種學(xué)科映射方案可以完成特定學(xué)科在CNKI、CSSCI 和WoS 數(shù)據(jù)庫中的學(xué)科映射,但仍會面臨一些制約性因素。在基于知識點內(nèi)涵映射方法的實踐中,對學(xué)科知識點的提煉十分重要,這既需要充分了解該學(xué)科內(nèi)涵,更有賴于對學(xué)科在不同分類體系中的類目揭示的深入分析。例如CNKI數(shù)據(jù)庫的實踐中,3種學(xué)科分類體系與《中圖法》文獻(xiàn)分類體系在政治學(xué)學(xué)科類目層級的劃分上呈現(xiàn)高度的一致性,可以較為順暢地完成知識點映射元素的提取,但這是否適用于所有的人文社科一級學(xué)科,有待繼續(xù)探究。同時,學(xué)科評價中一些新情況的出現(xiàn),例如教育部學(xué)科目錄對一二級學(xué)科設(shè)置的變化等,都會影響映射關(guān)系的產(chǎn)生。另外,交叉性強的學(xué)科的數(shù)據(jù)歸屬判別以及數(shù)據(jù)庫學(xué)科評價功能的更新等因素都會在一定程度上制約學(xué)科映射實踐的完成。
鑒于數(shù)據(jù)學(xué)科歸屬問題在人文社科學(xué)科評價中的重要意義,有必要從單個數(shù)據(jù)庫的個性化實踐中提煉出共性的具有指導(dǎo)價值的整體應(yīng)對策略。根據(jù)數(shù)據(jù)庫映射實踐案例,提出人文社科學(xué)科評價中合理判別跨庫數(shù)據(jù)學(xué)科歸屬的主要策略,如圖3所示。解決評價數(shù)據(jù)的學(xué)科歸屬問題需要從理論到實踐,從宏觀到微觀的全面規(guī)劃,因此在應(yīng)對策略中既包括在理論基礎(chǔ)上構(gòu)建映射思路,也包括執(zhí)行學(xué)科映射方案的具體方法,更值得注意的是其中需要考慮的情境性因素。合理、動態(tài)的實踐情境對于人文社科學(xué)科評價的學(xué)科歸屬判別具有重要意義,這既有賴于從事學(xué)科評價服務(wù)的館員與院系信息專家的深度合作,也需要館員始終以動態(tài)的思維和發(fā)展的眼光關(guān)注學(xué)科發(fā)展的進(jìn)程和數(shù)據(jù)庫學(xué)科評價功能的不斷完善。
圖3 人文社科學(xué)科評價中合理判別跨庫數(shù)據(jù)學(xué)科歸屬的策略
在“雙一流”建設(shè)的大背景下,學(xué)科評價中數(shù)據(jù)的學(xué)科歸屬問題不僅直接影響著學(xué)科評價數(shù)據(jù)的精準(zhǔn)性,也會對交叉學(xué)科及學(xué)科分類研究產(chǎn)生間接影響,因此對此類問題的持續(xù)關(guān)注和探究意味著要繼續(xù)從理論上展開對多種學(xué)科分類體系和學(xué)科映射方案的探討,也意味著要積極推動和鼓勵形成可推廣的實踐對策。同時,本項研究主要應(yīng)用了人工映射方式下的不同映射方案,這與目前人文社科學(xué)科評價情境及學(xué)科發(fā)展的動態(tài)性和復(fù)雜性較為契合,但未來是否可以在處理好諸如學(xué)科分類體系變化、學(xué)科內(nèi)涵豐富、數(shù)據(jù)庫評價功能更新等因素的基礎(chǔ)上實現(xiàn)人工映射與自動映射的融合值得進(jìn)一步探索。