張寶隆 ,王 昊 ,張 衛(wèi)
(1. 南京大學(xué)信息管理學(xué)院,南京 210023;2. 江蘇省數(shù)據(jù)工程與知識(shí)服務(wù)重點(diǎn)實(shí)驗(yàn)室,南京 210023;3. 鄭州航空工業(yè)管理學(xué)院信息管理學(xué)院,鄭州 450046)
隨著學(xué)科間交流聯(lián)系的日益緊密,學(xué)科交叉融合已經(jīng)成為促進(jìn)學(xué)科發(fā)展創(chuàng)新的重要因素之一,關(guān)于學(xué)科交叉的研究已成為學(xué)科研究的重要發(fā)展趨勢(shì)[1]。但學(xué)科之間的交流融合正逐漸模糊學(xué)科邊界,學(xué)科自身的研究特色也隨之被弱化。而以新工科、新文科等為主要內(nèi)容的新學(xué)科建設(shè)要求各門學(xué)科要在發(fā)展中尋求自身特色,形成既獨(dú)立發(fā)展又融合新生的新學(xué)科[2]。因此,各個(gè)學(xué)科能否在融合發(fā)展的趨勢(shì)中保留學(xué)科特色,凸顯出學(xué)科個(gè)體的獨(dú)特性和差異性特征是需要密切關(guān)注的問題,這對(duì)于學(xué)科持續(xù)健康發(fā)展至關(guān)重要。
當(dāng)前,學(xué)科交叉研究是學(xué)科研究的主要方向之一,多采用引文的多樣性、作者合著、機(jī)構(gòu)合作等來對(duì)學(xué)科的交叉程度進(jìn)行測(cè)度和分析[3]。該方面研究主要聚焦于學(xué)科之間的交叉融合特征,對(duì)學(xué)科之個(gè)體的獨(dú)特性或差異性則較少關(guān)注;所采用的研究數(shù)據(jù)多是引文數(shù)據(jù),只有較少研究采用研究?jī)?nèi)容對(duì)學(xué)科進(jìn)行直接測(cè)度。區(qū)分能力最初用于索引術(shù)語質(zhì)量的評(píng)價(jià),通過度量術(shù)語個(gè)體在群體中的區(qū)分性來判定其質(zhì)量[4-6]。張寶隆等[7]將其算法進(jìn)行改進(jìn),并應(yīng)用于學(xué)術(shù)期刊的同質(zhì)性測(cè)度以探討學(xué)術(shù)期刊個(gè)體的異質(zhì)性特征,研究結(jié)果表明,該方法能夠很好地探測(cè)期刊對(duì)象的差異性特征。因此,在已有研究的基礎(chǔ)上,本文提出學(xué)科區(qū)分能力(discipline discrim‐inative capacity,DDC)指標(biāo),并將其定義為:學(xué)科個(gè)體與給定學(xué)科群體中其他所有學(xué)科在內(nèi)容層面的總體差異程度,即學(xué)科個(gè)體區(qū)別于其他學(xué)科總體的能力。區(qū)分能力越強(qiáng),說明該學(xué)科的獨(dú)特性越強(qiáng),反之則說明該學(xué)科與群體中的其他學(xué)科的交叉越密切。利用該指標(biāo)可以從研究?jī)?nèi)容層面對(duì)學(xué)科在群體中的差異程度進(jìn)行測(cè)度,進(jìn)而可以從一個(gè)新的視角——區(qū)分性,來對(duì)學(xué)科的獨(dú)特性和交叉性特征進(jìn)行定量分析,從而為探索學(xué)科個(gè)體的獨(dú)特性、把握學(xué)科交叉融合的發(fā)展動(dòng)向提供一種新的方法和思路。
本文旨在利用學(xué)科的研究?jī)?nèi)容對(duì)其區(qū)分能力進(jìn)行測(cè)度和分析,探討學(xué)科交叉融合發(fā)展中學(xué)科個(gè)體的差異性特征及其一般規(guī)律。為此,本文以中國(guó)人文社會(huì)學(xué)科為例,采用2019 年各個(gè)學(xué)科的論文題錄作為研究數(shù)據(jù),對(duì)學(xué)科的區(qū)分能力進(jìn)行測(cè)度和分析,并分別采用基于PCA(principal component analy‐sis)和基于ADV (angle-distance based visualization)方法對(duì)學(xué)科空間可視化,以輔助分析學(xué)科的差異性。同時(shí),采用常用的學(xué)科交叉測(cè)度指標(biāo)如布里淵指數(shù)、Rao-Stirling 指數(shù)等作為參照,對(duì)比分析DDC 與學(xué)科交叉指標(biāo)之間的相關(guān)性。在此基礎(chǔ)上,利用學(xué)科互引網(wǎng)絡(luò)對(duì)學(xué)科區(qū)分能力進(jìn)行分析,以驗(yàn)證學(xué)科交叉與其區(qū)分能力之間的關(guān)系,探查學(xué)科交叉的強(qiáng)度、廣度對(duì)于學(xué)科區(qū)分能力的影響,從而為學(xué)科的健康有序發(fā)展、研究方向的妥善調(diào)整提供參考和借鑒。
目前,國(guó)內(nèi)外對(duì)于學(xué)科對(duì)象的研究主要集中在學(xué)科交叉領(lǐng)域,其中大部分研究聚焦于利用基于學(xué)科間的引文關(guān)系和基于學(xué)科間的引文內(nèi)容[8]來進(jìn)行學(xué)科交叉測(cè)度和探討。
基于引文關(guān)系的學(xué)科交叉測(cè)度是國(guó)內(nèi)外學(xué)者較常采用的方法[1]。利用學(xué)科之間的引文關(guān)系能夠有效反映學(xué)科間的交叉融合,由此學(xué)界涌現(xiàn)出了大量的基于引文的學(xué)科交叉測(cè)度指標(biāo),其中引用學(xué)科多樣性指標(biāo)研究最為廣泛[9-10]。最早有學(xué)者將信息熵[11]用于學(xué)科交叉測(cè)度,但該指標(biāo)僅考慮了引用學(xué)科的均衡性。隨后,Brillouin[12]在信息熵的基礎(chǔ)上提出了布里淵指數(shù)來對(duì)學(xué)科多樣性進(jìn)行測(cè)度,該指標(biāo)綜合反映了引用學(xué)科的豐富性和均勻性,但沒有考慮引用學(xué)科之間的異質(zhì)性。而后,Stirling 指出多樣性測(cè)度應(yīng)綜合考慮引用學(xué)科的豐富性、均衡性和異質(zhì)性3 個(gè)屬性特征[13],并提出一般性計(jì)量公式[14],與Rao[15]所提出的公式共稱之為Rao-Stirling 指標(biāo)。該指標(biāo)綜合考慮了上述3 個(gè)屬性特征,成為學(xué)科交叉測(cè)度的一項(xiàng)重要指標(biāo),對(duì)推進(jìn)學(xué)科交叉測(cè)度具有重要作用。但同時(shí)也有研究提出該指標(biāo)的區(qū)分性并不高[16]。在該指標(biāo)的基礎(chǔ)上,有許多學(xué)者對(duì)其進(jìn)行了泛化和改進(jìn)[17-19],其中Zhang 等[20]所提出的改進(jìn)型2DS指數(shù)得到了廣泛認(rèn)可和應(yīng)用[21]。也有學(xué)者將Gini 系數(shù)[22-23]用于學(xué)科交叉測(cè)度[24],但該指標(biāo)側(cè)重于引用學(xué)科的均衡性而不是豐富性[25]。Leydesdorff 等[26-27]將Gini 系數(shù)作為均衡性屬性提出了DIV(diversity)指標(biāo),其中的上述3 個(gè)屬性均能夠獨(dú)立計(jì)算,具有一定的優(yōu)勢(shì)和應(yīng)用潛力。此外,還有很多學(xué)者從引文角度對(duì)學(xué)科交叉測(cè)度指標(biāo)進(jìn)行了探索[28-30],這些指標(biāo)也各有優(yōu)劣??偟膩砜矗诨谝牡膶W(xué)科交叉測(cè)度研究方面已經(jīng)取得了豐碩的成果,但這些指標(biāo)僅能依據(jù)引文特征來刻畫學(xué)科交叉性,無法有效揭示學(xué)科自身的獨(dú)特性或差異性特征。
基于內(nèi)容的學(xué)科交叉研究逐漸受到國(guó)內(nèi)外學(xué)者的關(guān)注。章成志等[31]和徐庶睿等[32-34]結(jié)合引用術(shù)語和引文內(nèi)容,通過計(jì)算引文內(nèi)容中引用術(shù)語的頻次和重復(fù)率實(shí)現(xiàn)了學(xué)科交叉測(cè)度。但該方法僅能對(duì)兩兩學(xué)科間的交叉程度進(jìn)行度量,無法實(shí)現(xiàn)學(xué)科個(gè)體與總體的交叉測(cè)度,難以全面反映學(xué)科交叉性特征。陳紅麗等[35]在其研究基礎(chǔ)上,用標(biāo)題術(shù)語表征學(xué)科內(nèi)容,通過計(jì)算兩兩學(xué)科間重疊詞序列在術(shù)語集中的詞頻分布相似程度來對(duì)兩學(xué)科間的交叉程度進(jìn)行測(cè)度。馬瑞敏等[36]利用Jaccard 相似度分別對(duì)學(xué)科間的文獻(xiàn)直引、文獻(xiàn)耦合和共關(guān)鍵詞的相似度進(jìn)行了計(jì)算,并在此基礎(chǔ)上對(duì)這三者進(jìn)行加權(quán)平均實(shí)現(xiàn)學(xué)科交叉的直接測(cè)度。該研究融合了引文和內(nèi)容,但仍局限于兩兩學(xué)科之間。曹嘉君等[37]采用關(guān)鍵詞描述學(xué)科研究?jī)?nèi)容,通過共現(xiàn)分析和相似度計(jì)算對(duì)人工智能領(lǐng)域與其他學(xué)科的交叉特征進(jìn)行分析探討??偟膩砜?,基于內(nèi)容的學(xué)科交叉研究成果不夠豐富,仍有繼續(xù)探索的空間,并且已有的這些研究多采用標(biāo)題詞、關(guān)鍵詞、引用術(shù)語等,不能全面表征學(xué)科內(nèi)容。
此外,有學(xué)者利用作者合著來對(duì)學(xué)科交叉進(jìn)行測(cè)度和分析[38-40],但這類研究從合作角度來探討學(xué)科交叉是一種更為間接的方式,并且不同領(lǐng)域?qū)W者的合作是否能產(chǎn)生知識(shí)交叉融合也值得商榷。
綜上所述,當(dāng)前對(duì)于學(xué)科對(duì)象的研究在學(xué)科交叉方面成果非常豐富,但總體來看絕大多數(shù)研究均是對(duì)學(xué)科交叉性特征的探索,很少有研究涉及學(xué)科自身的獨(dú)特性或差異性特征。當(dāng)然,學(xué)科多樣性指標(biāo)中也有將學(xué)科差異性(或異質(zhì)性)考慮在內(nèi),但這僅是反映引用學(xué)科在引文方面的差異,并不能有效測(cè)度學(xué)科自身的差異性特征。同時(shí),多數(shù)研究都是采用引文數(shù)據(jù)進(jìn)行測(cè)度,利用研究?jī)?nèi)容來探測(cè)學(xué)科交叉性的研究略顯不足。實(shí)際上,論文自身的研究?jī)?nèi)容能夠很好地體現(xiàn)學(xué)科涵蓋的內(nèi)容,利用其進(jìn)行學(xué)科交叉測(cè)度會(huì)更有優(yōu)勢(shì)。因此,本研究提出學(xué)科區(qū)分能力指標(biāo),利用學(xué)科論文的標(biāo)題、關(guān)鍵詞、摘要表征研究?jī)?nèi)容來對(duì)不同學(xué)科在內(nèi)容方面的差異性進(jìn)行測(cè)度,借此探討學(xué)科獨(dú)特性和交叉性特征,以彌補(bǔ)當(dāng)前研究在此方面的不足。
1)學(xué)科數(shù)據(jù)源確定
學(xué)科是本文的主要研究對(duì)象,因此采用何種標(biāo)準(zhǔn)來確定學(xué)科對(duì)象是本研究的關(guān)鍵?!吨腥A人民共和國(guó)國(guó)家標(biāo)準(zhǔn)學(xué)科分類與代碼》(GB/T 13745-2009)[41]和中文社會(huì)科學(xué)引文索引(Chinese Social Sciences Citation Index,CSSCI) 中均對(duì)中文社會(huì)學(xué)科進(jìn)行了規(guī)范劃分,因此,本研究結(jié)合兩者確定23 個(gè)人文社會(huì)科學(xué)一級(jí)學(xué)科作為研究對(duì)象。為了從內(nèi)容視角對(duì)學(xué)科對(duì)象進(jìn)行測(cè)度,本研究將各個(gè)學(xué)科的CSSCI期刊發(fā)表的研究論文作為數(shù)據(jù)源。學(xué)科類目及其期刊數(shù)量如表1 所示。
表1 學(xué)科類目及期刊數(shù)量
2)數(shù)據(jù)預(yù)處理
CSSCI 和中國(guó)知網(wǎng)(China National Knowledge Infrastructure,CNKI)是中文領(lǐng)域規(guī)范且常用的學(xué)術(shù)資源數(shù)據(jù)庫(kù),兩者均提供規(guī)范的論文題錄數(shù)據(jù)下載。但CSSCI 數(shù)據(jù)庫(kù)所提供的題錄中摘要字段缺失,CNKI 數(shù)據(jù)庫(kù)提供的題錄中參考文獻(xiàn)數(shù)據(jù)不完整。而標(biāo)題、摘要、關(guān)鍵詞、參考文獻(xiàn)等關(guān)鍵字段是本研究所需的核心數(shù)據(jù),因此需要分別從兩個(gè)數(shù)據(jù)庫(kù)中獲取題錄數(shù)據(jù),然后將標(biāo)題和關(guān)鍵詞作為匹配項(xiàng)對(duì)題錄數(shù)據(jù)進(jìn)行合并,最終構(gòu)建本研究所需的基礎(chǔ)數(shù)據(jù)集。
針對(duì)基礎(chǔ)數(shù)據(jù)集的預(yù)處理主要包括:①數(shù)據(jù)清洗。原始題錄中摘要、關(guān)鍵詞等字段空缺的不完整數(shù)據(jù),將其視作無效數(shù)據(jù)進(jìn)行剔除。②數(shù)據(jù)抽樣。由于每個(gè)學(xué)科的題錄數(shù)據(jù)量較大且存在較大差異,為了節(jié)省算力和計(jì)算過程的簡(jiǎn)便性,采用隨機(jī)抽樣方法對(duì)有效數(shù)據(jù)進(jìn)行抽樣。③文本處理。首先提取題錄數(shù)據(jù)中的標(biāo)題、摘要、關(guān)鍵詞字段,采用pynl‐pir 包進(jìn)行分詞,并根據(jù)詞性對(duì)分詞結(jié)果進(jìn)行停用詞過濾,將獲得的字或者詞視作術(shù)語。④參考文獻(xiàn)處理。由于參考文獻(xiàn)涉及較多外文、圖書等非中文學(xué)術(shù)論文,需要進(jìn)行剔除,從而為后續(xù)實(shí)驗(yàn)分析做準(zhǔn)備。
DDC 算法的核心思想是通過剔除所構(gòu)建的學(xué)科空間中某一學(xué)科后的空間密度(discipline space den‐sity,DSD)的變化來衡量該學(xué)科的區(qū)分能力,其中空間密度由空間中所有學(xué)科個(gè)體與空間中心的平均相似度來表示。某個(gè)學(xué)科被剔除后,如果新形成的空間密度增大,即說明該學(xué)科與其他學(xué)科相似度較小,具有顯著區(qū)分性;反之,如果空間密度減小,則說明該學(xué)科與其他學(xué)科相似度較大,學(xué)科之間存在一定的交叉。因此,基于該算法可以有效測(cè)度學(xué)科個(gè)體與群體的差異程度,進(jìn)而度量其區(qū)分能力。
根據(jù)DDC 算法思想,需要先采用基于TF-IDF的文本表示方法對(duì)學(xué)科對(duì)象進(jìn)行向量表示,從而構(gòu)建學(xué)科-術(shù)語矩陣(discipline-term matrix,DTM),并在此基礎(chǔ)上,采用Cosine 相似度把DTM 轉(zhuǎn)換為相似矩陣(discipline-discipline matrix,DDM),將其作為學(xué)科空間,即
其中,Si表示學(xué)科相似向量;sij表示學(xué)科i與學(xué)科j的Cosine 相似度;m為學(xué)科數(shù)量。
進(jìn)而,DSD 可由學(xué)科向量Si與空間中心的平均相似度來表示,即
其中,DS(Si)表示學(xué)科向量Si與空間中心的相似度,采用基于距離的相似度來計(jì)算,即
其中,Centroid 表示空間中心,由所有學(xué)科向量Si的均值計(jì)算所得;Dist 表示學(xué)科向量Si與Centroid之間的距離,采用歐幾里得距離進(jìn)行計(jì)算,公式為
最終,DDC 可由剔除某一學(xué)科后DSD 的變化計(jì)算得出,即
其中,DSDSk為剔除學(xué)科Sk后新形成的學(xué)科空間密度;AVG_DSD 表示所有空間密度變化差值的平均值,計(jì)算公式為
根據(jù)DDC 算法,學(xué)科區(qū)分能力具有以下屬性:
(1) DDCSk>0,說明學(xué)科k具有較好的區(qū)分能力,呈現(xiàn)出一定的獨(dú)特性特征;
(2)DDCSk=0,說明學(xué)科k沒有區(qū)分能力;
(3)DDCSk<0,說明學(xué)科k沒有區(qū)分能力,呈現(xiàn)出一定的交叉性特征。
基于術(shù)語特征所構(gòu)建的學(xué)科對(duì)象空間均為維度大于3 的不可視環(huán)境,這阻礙了學(xué)術(shù)對(duì)象空間分布特征及其規(guī)律的分析和探討。傳統(tǒng)的做法主要是采用MDS(multi-dimensional scaling)、PCA、t-SNE(tdistributed stochastic neighbor embedding)等方法將高維空間降至2 或3 維來實(shí)現(xiàn)空間的可視化分析,但其不足之處在于降維操作帶來的信息損失會(huì)導(dǎo)致相對(duì)位置的失真,不利于精確刻畫學(xué)術(shù)對(duì)象之間的差異。Zhang 等[42-44]提出了一種基于角度和距離的信息檢索可視化方法,本研究沿用其思想提出一種新的用于描述多維空間中學(xué)術(shù)對(duì)象相對(duì)位置的可視化方法——基于角度和距離的空間可視化方法(ADV)。
ADV 方法的思想是以中心對(duì)象為原點(diǎn),同時(shí)采用距離和角度兩個(gè)參數(shù)來描述對(duì)象之間的相對(duì)位置,進(jìn)而實(shí)現(xiàn)多維空間到2 維平面的映射。距離是指空間中兩點(diǎn)間的直線距離,角度用夾角余弦表示。因此,ADV 方法的具體實(shí)現(xiàn)過程為:基于所構(gòu)建的學(xué)術(shù)對(duì)象空間DS,將其空間中心Centroid 作為坐標(biāo)原點(diǎn),分別將學(xué)術(shù)對(duì)象Si與空間中心Cen‐troid 的余弦距離和歐幾里得距離作為橫縱坐標(biāo)軸,如圖1 所示。學(xué)術(shù)對(duì)象距離原點(diǎn)越遠(yuǎn),表明其區(qū)分能力越強(qiáng);與群體的距離越大,說明其與其他個(gè)體之間的差異程度越大。
圖1 基于角度(angle)和距離(distance)的可視化示意圖
本研究所提出的區(qū)分能力是從差異角度來描述學(xué)科對(duì)象的總體特征和個(gè)體差別的,利用該可視化方法可以有效地從差異性視角觀測(cè)學(xué)科對(duì)象在空間中的相對(duì)位置,從而實(shí)現(xiàn)學(xué)術(shù)對(duì)象間的相似關(guān)系分布在二維平面上的可視化展示。同時(shí),該種方法既不同于SNA(social network analysis)中以連線表示關(guān)系的關(guān)聯(lián)分析(角度不同),也不同于MDS 的僅以距離表示相似的降維擬合分析(失真程度不同),為學(xué)科對(duì)象的差異(相似)可視化分析提供了一種新的方法和思路。
目前國(guó)內(nèi)外學(xué)者多采用學(xué)科多樣性指標(biāo)來進(jìn)行學(xué)科交叉測(cè)度,常用的指標(biāo)有布里淵(Brillouin)指數(shù)[12,45]、 Rao-Stiling 指 數(shù)[13-15]、2DS指 數(shù)[20]、 Gini 系數(shù)[22-24]。其中,布里淵指數(shù)側(cè)重于引用學(xué)科的豐富性,Rao-Stiling 和2DS均綜合考慮了引用學(xué)科豐富性(variety,number of disciplines)、均勻性 (balance,evenness of distribution) 和差異性 (disparity,degree of difference),但2DS指數(shù)提高了豐富性的權(quán)重[46],Gini 系數(shù)則側(cè)重于引用學(xué)科強(qiáng)度的均勻性。這幾個(gè)指標(biāo)均已得到學(xué)界的廣泛認(rèn)可和使用,因此,本研究將其作為參照指標(biāo),與學(xué)科區(qū)分能力指標(biāo)進(jìn)行對(duì)比分析。各個(gè)指標(biāo)的計(jì)算方法如表2 所示。
表2 學(xué)科交叉測(cè)度指標(biāo)及其說明
本研究分別從CNKI 和CSSCI 數(shù)據(jù)庫(kù)中獲取23個(gè)學(xué)科所有期刊的題錄數(shù)據(jù)并進(jìn)行匹配,構(gòu)建完整的數(shù)據(jù)集合,然后按照預(yù)處理方法對(duì)數(shù)據(jù)集合進(jìn)行清洗、分詞等操作,最終形成實(shí)驗(yàn)所需的基礎(chǔ)數(shù)據(jù)集以進(jìn)行后續(xù)實(shí)驗(yàn)分析。
4.1.1 數(shù)據(jù)預(yù)處理結(jié)果
數(shù)據(jù)清洗之后,每個(gè)學(xué)科所收錄的有效題錄數(shù)據(jù)量差別較大,最少的是宗教學(xué),僅有490 條有效數(shù)據(jù)。因此,采用隨機(jī)抽樣方式從每個(gè)學(xué)科中抽取400 條作為實(shí)驗(yàn)數(shù)據(jù),然后提取其中的標(biāo)題、關(guān)鍵詞、摘要,進(jìn)行分詞、去停用詞等處理。數(shù)據(jù)預(yù)處理結(jié)果如表3 所示。
通過表3 可以發(fā)現(xiàn),不同學(xué)科的有效數(shù)據(jù)量及其術(shù)語量均存在較大差距,這主要是由每個(gè)學(xué)科所收錄的期刊數(shù)量和載文量決定的;并且,通過隨機(jī)抽樣所獲取的樣本術(shù)語量也存在較大差異,最小的是統(tǒng)計(jì)學(xué),有3705 個(gè)術(shù)語,最大的是歷史學(xué),有7718 個(gè)術(shù)語,是統(tǒng)計(jì)學(xué)的2 倍之多。因此,需要首先進(jìn)行分析探討的是,數(shù)據(jù)規(guī)模差異是否會(huì)對(duì)DDC產(chǎn)生影響。
表3 23個(gè)學(xué)科數(shù)據(jù)預(yù)處理結(jié)果
4.1.2 隨機(jī)抽樣及數(shù)據(jù)集對(duì)DDC的影響分析
為了驗(yàn)證隨機(jī)抽樣方式在本實(shí)驗(yàn)中的合理性,分別采用隨機(jī)樣本量和全樣本量進(jìn)行DDC 測(cè)度,并對(duì)兩者結(jié)果進(jìn)行相關(guān)性分析,從而判定隨機(jī)抽樣對(duì)DDC 結(jié)果的影響。由于不同抽樣規(guī)模也可能會(huì)對(duì)結(jié)果造成影響,故分別以50 和400 為最小和最大抽樣規(guī)模,以50 為步長(zhǎng)進(jìn)行遞增。同時(shí),按照最大抽樣規(guī)模進(jìn)行5 次隨機(jī)抽樣,以分析隨機(jī)抽樣結(jié)果的穩(wěn)定性。
1)基于隨機(jī)樣本和全樣本的DDC 結(jié)果相關(guān)性分析
根據(jù)抽樣規(guī)模對(duì)每個(gè)學(xué)科的有效數(shù)據(jù)進(jìn)行隨機(jī)抽樣,經(jīng)過數(shù)據(jù)處理后計(jì)算每個(gè)學(xué)科的DDC 值,然后采用SPSS 軟件對(duì)基于抽樣和全樣本的DDC 結(jié)果進(jìn)行皮爾遜相關(guān)性分析,將所有的相關(guān)性系數(shù)繪制成折線圖。如圖2 所示,隨著抽樣規(guī)模的逐漸增大,兩者之間的相關(guān)性也隨之增大,當(dāng)樣本量達(dá)到250 以后,相關(guān)性系數(shù)穩(wěn)定在0.95(P<0.01)以上。由此可以說明,采用隨機(jī)抽樣方式會(huì)對(duì)DDC 結(jié)果產(chǎn)生一定的影響,但當(dāng)抽樣數(shù)據(jù)量達(dá)到一定規(guī)模后,這種影響會(huì)降至很低,幾乎可以忽略不計(jì)。因此,本研究根據(jù)最小有效數(shù)據(jù)量,確定以400 作為抽樣規(guī)模具備科學(xué)性和合理性,這也充分說明基于隨機(jī)抽樣的結(jié)果具有很好的代表性和很強(qiáng)的穩(wěn)定性。
圖2 基于不同樣本量的DDC與全樣本DDC的相關(guān)性系數(shù)
2)數(shù)據(jù)集與DDC 的相關(guān)性分析
為了進(jìn)一步分析實(shí)驗(yàn)數(shù)據(jù)特征是否會(huì)對(duì)DDC 結(jié)果產(chǎn)生影響,對(duì)每個(gè)學(xué)科的有效數(shù)據(jù)量、全樣本術(shù)語量、隨機(jī)樣本術(shù)語量以及基于隨機(jī)樣本的DDC_s400 值進(jìn)行了相關(guān)性分析,兩兩之間的皮爾遜相關(guān)系數(shù)如表4 所示。
表4 數(shù)據(jù)集與DDC結(jié)果的相關(guān)性分析
從表4 可以看到,有效數(shù)據(jù)量和全樣本術(shù)語量、全樣本術(shù)語量和隨機(jī)樣本術(shù)語量?jī)蓛芍g均具有一定的相關(guān)性,但相關(guān)程度不高,這表明不同學(xué)科有效數(shù)據(jù)的差距并沒有對(duì)其術(shù)語量產(chǎn)生較大影響,并且對(duì)抽樣數(shù)據(jù)術(shù)語量的影響也比較微弱。同時(shí),有效數(shù)據(jù)量、全樣本術(shù)語量以及隨機(jī)樣本術(shù)語量均沒有對(duì)DDC_s400 產(chǎn)生顯著影響,這表明DDC 算法對(duì)數(shù)據(jù)集特征不敏感,表現(xiàn)出較好的魯棒性。因此,本研究采用隨機(jī)樣本來對(duì)各個(gè)學(xué)科進(jìn)行區(qū)分能力測(cè)度和分析是可行且科學(xué)合理的,這有助于提升計(jì)算效率。
4.2.1 DDC結(jié)果分析
通過上述分析,基于隨機(jī)抽樣的DDC 結(jié)果可以很好地替代全樣本數(shù)據(jù),因此,采用4.1.1 節(jié)中的隨機(jī)樣本數(shù)據(jù)對(duì)23 個(gè)學(xué)科DDC 進(jìn)行計(jì)算,結(jié)果降序排列如圖3 所示。
觀察圖3 發(fā)現(xiàn),23 個(gè)學(xué)科的區(qū)分能力具有顯著差異且呈現(xiàn)出明顯分層。從整體上看,絕大部分學(xué)科的DDC 都為正值且部分學(xué)科處于較高水平,表明在人文社會(huì)科學(xué)領(lǐng)域多數(shù)學(xué)科都具有較好的區(qū)分性,學(xué)科之間的知識(shí)流動(dòng)和交融并沒有掩蓋其學(xué)科差異特征。
圖3 人文社會(huì)學(xué)科的DDC結(jié)果
(1)DDC 處在第①層次的學(xué)科為經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)學(xué)和管理學(xué)。它們之間的差異明顯且與其他學(xué)科的DDC 也存在顯著差距,說明這3 個(gè)經(jīng)管類學(xué)科的研究?jī)?nèi)容特色鮮明,在人文社科領(lǐng)域具有顯著的差異性,可能與其他學(xué)科之間的知識(shí)交叉程度很低。
(2)2 個(gè)人文地理環(huán)境類(自然資源與環(huán)境、人文經(jīng)濟(jì)地理)和兩個(gè)文學(xué)類(中國(guó)文學(xué)、外國(guó)文學(xué))學(xué)科處于第②層次。前者由于其學(xué)科特性與其他學(xué)科差異顯著,區(qū)分性明顯;而中國(guó)文學(xué)和外國(guó)文學(xué)也同樣具有較高的區(qū)分度,說明這兩個(gè)學(xué)科獨(dú)特性較強(qiáng),與其他人文類學(xué)科存在較大差異,學(xué)科之間的交叉融合程度可能較低。
(3)接近半數(shù)的學(xué)科都集中在第③層次。這些學(xué)科的DDC 整體處于中低水平,并且學(xué)科之間的差異不大,說明這些學(xué)科的研究?jī)?nèi)容具有較好的區(qū)分性,但同時(shí)與其他學(xué)科之間存在一定程度的交叉融合,沒有呈現(xiàn)出鮮明的學(xué)科特色。如考古學(xué)、體育學(xué)、宗教學(xué)等學(xué)科雖較為獨(dú)特,但在學(xué)科群體中并沒有呈現(xiàn)出較高的區(qū)分性,表明這些學(xué)科可能與其他學(xué)科知識(shí)出現(xiàn)了不同程度的交叉融合。
(4) 處于第④層次的主要是社會(huì)類學(xué)科,其DDC 多為負(fù)值。其中歷史學(xué)和教育學(xué)的DDC 接近于0,其區(qū)分性特征與負(fù)值無異,因此將其劃分至第④層次。這類學(xué)科在群體中的區(qū)分度為負(fù)值,說明它們的研究?jī)?nèi)容與其他學(xué)科存在很大程度上的互動(dòng),在知識(shí)層面的交叉融合程度較深,從而掩蓋了自身學(xué)科特色。尤其是民族學(xué)與文化學(xué),其DDC在所有學(xué)科中最低,說明其研究?jī)?nèi)容可能與其他學(xué)科存在廣泛交叉,且學(xué)科知識(shí)融合程度較深,因此沒有呈現(xiàn)出差異性。
總的來說,人文社會(huì)科學(xué)領(lǐng)域的學(xué)科之間的差異性非常顯著。經(jīng)管類學(xué)科的區(qū)分能力處于最高層次,其學(xué)科差異性特征明顯,研究特色顯著;人文類學(xué)科的區(qū)分能力總體上處于中等層次,表現(xiàn)出了較好的學(xué)科獨(dú)特性;而部分社會(huì)類學(xué)科沒有表現(xiàn)出區(qū)分性,其學(xué)科交叉融合的特征較為顯著。此外,通過分析可以發(fā)現(xiàn),區(qū)分能力越高的學(xué)科,與其他學(xué)科知識(shí)的交叉融合程度可能就越低;而區(qū)分度較低的學(xué)科,其學(xué)科間知識(shí)交融的范圍可能更為廣泛,程度更深。
4.2.2 學(xué)科差異性可視化分析
本研究分別采用基于PCA 和基于ADV 方法來對(duì)學(xué)科空間分布進(jìn)行可視化分析,并對(duì)比兩種方法的優(yōu)劣性,從而可以通過觀測(cè)學(xué)科對(duì)象的相對(duì)位置、聚集離散程度等分布狀況來直觀判斷學(xué)科個(gè)體的差異性特征。
1)基于PCA 的可視化分析
PCA 是較為常用的降維方法,利用該方法對(duì)學(xué)科空間進(jìn)行降維,可以通過觀察學(xué)科分布的親疏關(guān)系來對(duì)學(xué)科差異性特征進(jìn)行輔助分析,結(jié)果如圖4所示。
圖4 基于PCA的學(xué)科空間的二維可視化
從圖4 可以看出,23 個(gè)學(xué)科大致分布在3 個(gè)區(qū)域,不同學(xué)科群體之間的界限明顯,學(xué)科個(gè)體分布的離散程度也基本和其DDC 相對(duì)應(yīng)。
(1)不同學(xué)科群體的聚集程度與其DDC 呈現(xiàn)負(fù)相關(guān),群體聚集程度越高,其DDC 相對(duì)越小。①經(jīng)管類和人文地理環(huán)境類學(xué)科分布在第一象限,學(xué)科之間分布較為離散,且整體距離空間中心較遠(yuǎn),其DDC 在學(xué)科群體中均處于較高水平。②分布在第二象限的主要為人文類學(xué)科,學(xué)科群體聚集程度和與空間中心的距離均次于第一象限的學(xué)科;這幾個(gè)學(xué)科的DDC 多分布在中間層次。③第三象限的學(xué)科主要為社會(huì)類學(xué)科,這些學(xué)科分布較為密集,且整體上較為靠近學(xué)科空間中心,它們的DDC多處于較低水平。
(2)學(xué)科個(gè)體的分布位置與其DDC 基本對(duì)應(yīng),分布位置越靠近中心,區(qū)分能力就越小。①經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)學(xué)等學(xué)科離散分布在學(xué)科群體的邊緣(虛線圓外),與空間中心以及其他學(xué)科之間的距離均較大,而它們的DDC 在學(xué)科群體也是最大的。②分布在圓環(huán)部分的學(xué)科個(gè)體與學(xué)科空間中心距離較遠(yuǎn),它們的DDC 也基本處于中間層次。③處于圓心區(qū)域的幾個(gè)學(xué)科(如政治學(xué)、民族學(xué)與文化學(xué)等)是距離空間中心最近的,其DDC 在整個(gè)學(xué)科群體中也是最小的。
因此,借助學(xué)科空間的二維分布可以通過觀察學(xué)科群體及個(gè)體的聚集程度和分布位置來大致判斷其區(qū)分性。學(xué)科群體的聚集程度越高,其DDC 就越??;學(xué)科個(gè)體分布距離空間中心越遠(yuǎn),它們的DDC 就越大。但該方法的不足在于降維操作所帶來的信息損失會(huì)導(dǎo)致相對(duì)位置的失真,并且從空間分布中也難以準(zhǔn)確判斷學(xué)科個(gè)體的區(qū)分能力。
2)基于ADV 的可視化分析
鑒于基于PCA 可視化分析的弊端,本文提出基于ADV 方法對(duì)學(xué)科空間進(jìn)行可視化,分別計(jì)算學(xué)科向量與空間中心的余弦距離和歐幾里得距離作為橫縱坐標(biāo),結(jié)果如圖5 所示。
從圖5 可以看出,學(xué)科群體整體上離散分布在3 個(gè)區(qū)域,不同區(qū)域間層次分明,與其DDC 所處層次基本保持一致;并且,學(xué)科個(gè)體的分布位置與其DDC 也基本對(duì)應(yīng)。第一,分布在區(qū)域①的經(jīng)管類學(xué)科距離學(xué)科群體最遠(yuǎn),且3 個(gè)學(xué)科之間也存在一定距離,這與其DDC 的數(shù)值分布高度一致。第二,文學(xué)類和人文地理環(huán)境類學(xué)科分布在區(qū)域②,其整體分布的區(qū)域位置反映了其DDC 所處的層次;同時(shí),兩類學(xué)科的相對(duì)位置也反映了學(xué)科間的親疏關(guān)系。第三,大多數(shù)學(xué)科離散分布于區(qū)域③(即學(xué)科群體的核心區(qū)域),整體從右上至左下排列分布,其中③_1 區(qū)域是DDC 為正值的學(xué)科,③_2 區(qū)域是DDC 為負(fù)值(或接近于零)的學(xué)科。對(duì)比圖2 中的DDC 排序,區(qū)域③的學(xué)科分布位置與DDC排序基本上保持一致,很好地呈現(xiàn)出了學(xué)科的區(qū)分性特征。
圖5 基于角度和距離的學(xué)科空間可視化
通過分析發(fā)現(xiàn),基于ADV 方法能夠更加準(zhǔn)確地刻畫學(xué)科區(qū)分能力。距離學(xué)科群體越遠(yuǎn)的學(xué)科,其DDC 就會(huì)越大;在學(xué)科群體的核心區(qū)域中,學(xué)科個(gè)體的DDC 自右上至左下遞減。由此,個(gè)體的分布規(guī)律可以泛化為距離群體越遠(yuǎn)其與群體的差異程度就越大,其DDC 也越大;距離原點(diǎn)(空間中心)越遠(yuǎn),其DDC 越大,反之,則DDC 越小。此外,個(gè)體之間的相對(duì)距離也能夠很好地呈現(xiàn)它們的差異性,距離越大,兩者之間的差異就越明顯。
上述分析表明基于抽樣數(shù)據(jù)的DDC 與基于全文本的DDC 結(jié)果高度相關(guān),但如果僅使用隨機(jī)樣本的引文數(shù)據(jù)進(jìn)行學(xué)科交叉測(cè)度,則可能丟失較多的引證關(guān)系,進(jìn)而導(dǎo)致學(xué)科交叉測(cè)度嚴(yán)重失真。因此,本研究采用學(xué)科中所有的有效參考文獻(xiàn)進(jìn)行測(cè)度和分析。
4.3.1 DDC與學(xué)科交叉測(cè)度結(jié)果對(duì)比分析
1)DDC 與學(xué)科交叉指標(biāo)的對(duì)比分析
按照文獻(xiàn)-期刊-學(xué)科的模式將每個(gè)學(xué)科中每篇論文的參考文獻(xiàn)映射到各個(gè)學(xué)科,最終統(tǒng)計(jì)所有學(xué)科間的互引頻次?;诖?,按照3.4 節(jié)中的公式進(jìn)行指標(biāo)測(cè)算,結(jié)果如表5 所示。
由于不同指標(biāo)的量綱不同,難以直接進(jìn)行比較,因此,通過其排名來對(duì)不同指標(biāo)進(jìn)行對(duì)比分析。在表5 中,①?gòu)恼w的數(shù)值分布來看,DDC 的數(shù)值區(qū)分性更強(qiáng)。DDC 的標(biāo)準(zhǔn)差最大,其數(shù)值分布最為離散;而B、Gini、RS 和2DS這4 個(gè)指數(shù)的標(biāo)準(zhǔn)差均在0.5 以下,數(shù)值分布較為集中,表明數(shù)值之間的差異較小,指標(biāo)區(qū)分性不強(qiáng)。②從各指標(biāo)的排名來看,DDC 與其他指標(biāo)之間存在一定的相關(guān)性。B指數(shù)和Gini 系數(shù)大致呈現(xiàn)負(fù)相關(guān);RS 和2DS指數(shù)表現(xiàn)為強(qiáng)正相關(guān),這是其計(jì)算原理所導(dǎo)致的;DDC與B、RS、2DS指數(shù)存在一定程度的負(fù)相關(guān),區(qū)分能力較大(較?。┑膸讉€(gè)學(xué)科其B、RS、2DS指數(shù)均處于較低(較高)水平;而多數(shù)學(xué)科的DDC 值與其Gini 系數(shù)呈現(xiàn)出一定的正相關(guān)性。③從學(xué)科個(gè)體來看,DDC 與其他指標(biāo)具有明顯的差異。對(duì)比B、Gini、RS 和2DS值可以發(fā)現(xiàn),經(jīng)濟(jì)學(xué)和民族學(xué)與文化學(xué)在23 個(gè)學(xué)科中分別是交叉程度最?。ㄝ^小)和最大(較大)的,這與其區(qū)分能力保持一致。而藝術(shù)學(xué)的RS 和2DS值是最大的,說明其具有較強(qiáng)的學(xué)科交叉性,但其DDC 處于中等水平,這兩者不完全一致;同時(shí),從RS 和2DS值來看,中國(guó)文學(xué)和外國(guó)文學(xué)的學(xué)科交叉性較強(qiáng),但實(shí)際上其區(qū)分能力處在較高水平,這兩者也不一致。由此可以說明,學(xué)科交叉指標(biāo)雖然和區(qū)分能力指標(biāo)存在一定的相關(guān)性,但兩者并不能完全相互替代。
表5 DDC與學(xué)科交叉指標(biāo)測(cè)度結(jié)果
2)DDC 與學(xué)科交叉指標(biāo)的相關(guān)性分析
為了進(jìn)一步探討DDC 與其他學(xué)科交叉指標(biāo)之間的相關(guān)性,本文采用SPSS 對(duì)其進(jìn)行皮爾遜相關(guān)性分析,結(jié)果如表6 所示。
從表6 可以發(fā)現(xiàn),DDC 與其他4 個(gè)指標(biāo)之間均具有較強(qiáng)的相關(guān)關(guān)系。①DDC 與Gini 呈現(xiàn)出較強(qiáng)的正相關(guān)關(guān)系,說明學(xué)科間交叉的均勻性對(duì)其區(qū)分能力具有顯著積極影響,不均勻性越強(qiáng),學(xué)科的區(qū)分能力就越強(qiáng)。②DDC 與B、RS、2DS具有顯著的負(fù)相關(guān)關(guān)系,說明引用學(xué)科豐富性、多樣性對(duì)于其區(qū)分能力具有一定的消極影響,即學(xué)科間知識(shí)的交叉程度越深,其學(xué)科區(qū)分能力就越弱。
表6 DDC與學(xué)科交叉指標(biāo)的相關(guān)系數(shù)
通過對(duì)比分析發(fā)現(xiàn),DDC 與其他學(xué)科交叉指標(biāo)具有顯著不同。DDC 能夠精確地刻畫不同學(xué)科個(gè)體在群體中的區(qū)分程度,而其他學(xué)科交叉指標(biāo)并不能完全反映其這一特征。但同時(shí),學(xué)科交叉指標(biāo)又與DDC 具有較為顯著的相關(guān)性,說明學(xué)科間的知識(shí)交叉融合是形成學(xué)科區(qū)分性的一個(gè)重要因素,因此,通過學(xué)科區(qū)分能力可以大致判斷不同學(xué)科的交叉程度,兩者可以在一定程度上互補(bǔ)。此外,DDC 與學(xué)科交叉指標(biāo)的相關(guān)關(guān)系也反映了學(xué)科交叉僅是形成學(xué)科區(qū)分性的因素之一,其他特征如學(xué)科創(chuàng)新性、影響力等也可能是其影響因素,這需要后續(xù)進(jìn)一步探討。
4.3.2 基于學(xué)科互引網(wǎng)絡(luò)的學(xué)科區(qū)分能力分析
學(xué)科引文網(wǎng)絡(luò)是利用學(xué)科之間的引證關(guān)系來探測(cè)學(xué)科知識(shí)流動(dòng)的重要方式,通過知識(shí)流動(dòng)的強(qiáng)度和廣度可以有效分析學(xué)科間的交叉程度。因此,為了深入探討學(xué)科區(qū)分能力與學(xué)科交叉之間的關(guān)系,本文采用23 個(gè)學(xué)科之間的互引網(wǎng)絡(luò)來對(duì)其學(xué)科交叉性進(jìn)行分析。先將上述實(shí)驗(yàn)中所統(tǒng)計(jì)的學(xué)科互引頻次轉(zhuǎn)換為學(xué)科互引矩陣(23×23 維),然后采用VOSviewer 軟件對(duì)其進(jìn)行可視化。為了使互引網(wǎng)絡(luò)結(jié)構(gòu)更加清晰,設(shè)置最小引證強(qiáng)度閾值為50,結(jié)果如圖6 所示。圖中節(jié)點(diǎn)直徑越大,學(xué)科間的知識(shí)流動(dòng)強(qiáng)度就越大;邊越粗,引證強(qiáng)度就越大。
圖6 人文社會(huì)學(xué)科互引網(wǎng)絡(luò)
在圖6 中,23 個(gè)學(xué)科被劃分為四類。類別一為經(jīng)濟(jì)學(xué)、管理學(xué)、統(tǒng)計(jì)學(xué)等經(jīng)管類學(xué)科,類別二為人文經(jīng)濟(jì)地理、自然資源與環(huán)境等人文地理環(huán)境類學(xué)科,類別三為社會(huì)學(xué)、法學(xué)、政治學(xué)等11 個(gè)社會(huì)類學(xué)科,類別四為民族學(xué)與文化學(xué)、歷史學(xué)、考古學(xué)、宗教學(xué)、藝術(shù)學(xué)、中國(guó)文學(xué)、外國(guó)文學(xué)等人文類學(xué)科。對(duì)比這些學(xué)科的DDC 發(fā)現(xiàn),DDC 的層次劃分與該引文網(wǎng)絡(luò)中學(xué)科劃分高度相關(guān),這進(jìn)一步驗(yàn)證了學(xué)科間知識(shí)流動(dòng)所造成的學(xué)科交叉是影響學(xué)科區(qū)分能力的重要因素。
為了進(jìn)一步分析學(xué)科間知識(shí)交叉對(duì)學(xué)科區(qū)分能力的影響,分別以DDC 最小、最大以及中間層次的民族學(xué)與文化學(xué)、經(jīng)濟(jì)學(xué),以及圖書館、情報(bào)與文獻(xiàn)學(xué)為例(如圖7 所示),對(duì)不同學(xué)科交叉特征進(jìn)行微觀分析。
圖7 DDC最小、最大及中間層次學(xué)科的互引網(wǎng)絡(luò)圖
觀察圖7 可以發(fā)現(xiàn),圖7a 中,民族學(xué)與文化學(xué)共與18 個(gè)學(xué)科存在廣泛的知識(shí)流動(dòng),且與各個(gè)學(xué)科間的知識(shí)流動(dòng)強(qiáng)度比較均勻,表明該學(xué)科與其他學(xué)科間的知識(shí)交叉范圍廣,與學(xué)科群體交叉程度較深;圖7b 中,經(jīng)濟(jì)學(xué)共與16 個(gè)學(xué)科存在知識(shí)流動(dòng),范圍較廣,但與不同學(xué)科間的知識(shí)流動(dòng)強(qiáng)度極不均勻,其中與管理學(xué)的知識(shí)流動(dòng)強(qiáng)度最大,次之是統(tǒng)計(jì)學(xué)、人文經(jīng)濟(jì)地理、自然資源與環(huán)境,而與其他學(xué)科的知識(shí)流動(dòng)則相對(duì)微弱,表明該學(xué)科僅與4 個(gè)學(xué)科具有較強(qiáng)的交叉融合,知識(shí)交叉范圍較小;圖7c 中,圖書館、情報(bào)與文獻(xiàn)學(xué)共與13 個(gè)學(xué)科存在知識(shí)流動(dòng),與管理學(xué)、新聞學(xué)與傳播學(xué)知識(shí)流動(dòng)強(qiáng)度相對(duì)較大,但與其他學(xué)科的知識(shí)流動(dòng)在整體上沒有表現(xiàn)出較大差異,表明該學(xué)科與較多學(xué)科存在知識(shí)流動(dòng),廣度和強(qiáng)度均處于一般水平。
對(duì)比3 個(gè)學(xué)科與其他學(xué)科的知識(shí)流動(dòng)發(fā)現(xiàn),民族學(xué)與文化學(xué)的知識(shí)流動(dòng)范圍最廣,學(xué)科交叉程度最深;經(jīng)濟(jì)學(xué)雖與較多學(xué)科存在知識(shí)流動(dòng),但僅與小部分學(xué)科存在較強(qiáng)的交叉,其他學(xué)科并未對(duì)其產(chǎn)生較大影響;而圖書館、情報(bào)與文獻(xiàn)學(xué)則介于兩者之間。由此可以說明,學(xué)科間的知識(shí)流動(dòng)廣度、強(qiáng)度以及均衡性對(duì)學(xué)科間的交叉融合具有重要影響,反映在研究?jī)?nèi)容方面則會(huì)影響學(xué)科的區(qū)分能力,即某學(xué)科與其他學(xué)科間的交叉融合程度越深,其學(xué)科區(qū)分能力就越弱,反之越強(qiáng)。
區(qū)分能力作為學(xué)術(shù)對(duì)象的內(nèi)在屬性,對(duì)研究學(xué)術(shù)對(duì)象個(gè)體與群體之間的差異程度具有重要作用。本研究在已有研究的基礎(chǔ)上,提出學(xué)科區(qū)分能力來對(duì)學(xué)科個(gè)體和總體的差異特征進(jìn)行分析。本研究采用標(biāo)題、關(guān)鍵詞、摘要等內(nèi)容數(shù)據(jù)對(duì)學(xué)科對(duì)象進(jìn)行區(qū)分能力測(cè)度和分析,并分別采用了基于PCA 和ADV 方法對(duì)學(xué)科的空間分布進(jìn)行了輔助分析。在此基礎(chǔ)上,將學(xué)科區(qū)分能力指標(biāo)與布里淵指數(shù)、Rao-Stirling 指數(shù)、Gini 系數(shù)等學(xué)科交叉指標(biāo)進(jìn)行了對(duì)比分析,探討指標(biāo)間的相關(guān)關(guān)系及其優(yōu)劣性。同時(shí)借助學(xué)科互引網(wǎng)絡(luò)來對(duì)學(xué)科交叉和學(xué)科區(qū)分能力的內(nèi)在聯(lián)系進(jìn)行分析和驗(yàn)證。結(jié)果表明,①利用學(xué)科區(qū)分能力指標(biāo)能夠很好地測(cè)度學(xué)科個(gè)體與群體的差異性特征。23 個(gè)學(xué)科個(gè)體區(qū)分能力差異顯著,經(jīng)管類學(xué)科區(qū)分能力最強(qiáng),人文類、社科類學(xué)科區(qū)分能力普遍偏弱,部分學(xué)科如民族學(xué)與文化學(xué)、政治學(xué)等區(qū)分能力最弱,呈現(xiàn)出顯著的學(xué)科交叉特性。②本研究提出的基于ADV 可視化方法能夠準(zhǔn)確刻畫學(xué)科個(gè)體的差異性特征,相較于基于PCA 的可視化方法,能夠更好地適用于學(xué)術(shù)對(duì)象差異性分析。根據(jù)其分布的相對(duì)位置可以判斷其區(qū)分能力:距離原點(diǎn)越遠(yuǎn),其區(qū)分能力越強(qiáng);距離學(xué)科群體越遠(yuǎn),其與群體的差異程度越大。③學(xué)科區(qū)分能力指標(biāo)與布里淵指數(shù)、Rao-Stirling 指數(shù)、Gini 系數(shù)等學(xué)科交叉度量指標(biāo)具有一定的相關(guān)性,但兩者并不完全一致,可以在一定程度上相互補(bǔ)充;同時(shí)兩者之間的相關(guān)關(guān)系這也反映了學(xué)科間的交叉融合會(huì)對(duì)學(xué)科區(qū)分能力產(chǎn)生一定影響。④學(xué)科區(qū)分能力測(cè)度和學(xué)科互引分析結(jié)果具有高度的一致性,這驗(yàn)證了學(xué)科交叉和學(xué)科區(qū)分能力之間的相關(guān)關(guān)系以及學(xué)科間知識(shí)交叉融合對(duì)于其區(qū)分能力的影響程度;并且通過學(xué)科區(qū)分能力測(cè)度和學(xué)科互引分析填補(bǔ)了學(xué)科差異性特征和交叉性特征之間的縫隙,實(shí)現(xiàn)了學(xué)科對(duì)象內(nèi)容測(cè)度和引文分析相統(tǒng)一。
本研究基于所提出的方法對(duì)學(xué)科對(duì)象的區(qū)分能力進(jìn)行了測(cè)度與分析,但仍有不足之處。本研究?jī)H與學(xué)科交叉指標(biāo)進(jìn)行了對(duì)比分析,討論了兩者之間的相關(guān)關(guān)系,但對(duì)于學(xué)科其他特征如學(xué)科影響力、學(xué)科創(chuàng)新性等并未涉及;同時(shí),在利用引文網(wǎng)絡(luò)分析時(shí),未對(duì)引證強(qiáng)度、出入度等網(wǎng)絡(luò)指標(biāo)與學(xué)科區(qū)分能力之間的關(guān)系做深入分析,后續(xù)將在這些方面進(jìn)行更加深入的研究。