郭文斌+方俊明
摘要:關(guān)鍵詞共詞分析法是一種較新的科學(xué)計(jì)量分析方法,它主要通過(guò)對(duì)高頻關(guān)鍵詞對(duì)在同一篇文章中出現(xiàn)的頻次進(jìn)行統(tǒng)計(jì)分析,生成共被引矩陣。在此基礎(chǔ)上,通過(guò)統(tǒng)計(jì)軟件,進(jìn)行聚類分析、多維尺度分析、因子分析、主成分分析、社會(huì)網(wǎng)絡(luò)分析等高級(jí)統(tǒng)計(jì)處理,繪制出二維或者三維的可視化圖形,客觀系統(tǒng)的展示出所關(guān)注資料的直觀量化信息。在我國(guó)高等教育研究領(lǐng)域較少有學(xué)者對(duì)此方法進(jìn)行論述,為了幫助大家更好地了解和掌握此方法,本文以2000-2012年《教育研究》文獻(xiàn)熱點(diǎn)知識(shí)圖譜作為實(shí)例,詳細(xì)展示了此方法的使用過(guò)程和注意事項(xiàng)。
關(guān)鍵詞:關(guān)鍵詞;共詞分析;高等教育研究;知識(shí)圖譜
一、引言
隨著研究成果的激增,數(shù)字化期刊的盛行及互聯(lián)網(wǎng)使用的便捷化,可以通過(guò)網(wǎng)上搜索引擎快捷的查詢并獲得這些成果。在應(yīng)對(duì)海量數(shù)字信息的今天,傳統(tǒng)文獻(xiàn)計(jì)量和綜述方式,不僅耗費(fèi)時(shí)間、效率低下、查詢資料的時(shí)間跨度短,而且難以全面搜集海量文獻(xiàn)信息,造成文獻(xiàn)研究偏于定性歸納、過(guò)于主觀。[1]激增的數(shù)據(jù)背后隱藏著許多重要的信息,缺乏挖掘數(shù)據(jù)背后隱藏的知識(shí)的手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識(shí)貧乏”。[2]如何在浩如煙海的數(shù)字文獻(xiàn)中,將這些零散的信息全面、快速綜合起來(lái),挖掘出有深度的信息為我所用,已經(jīng)成為眾多研究者關(guān)注的熱點(diǎn)。隨著計(jì)算機(jī)技術(shù)的不斷提升,以及數(shù)理統(tǒng)計(jì)方法的完善,研究者使用計(jì)算機(jī)進(jìn)行數(shù)據(jù)挖掘(Data Mining,DM)的能力得以大大提升。在此背景下,科學(xué)知識(shí)圖譜開(kāi)始成為當(dāng)前國(guó)際科學(xué)計(jì)量學(xué)領(lǐng)域熱門的方法之一。它是通過(guò)將科學(xué)計(jì)量學(xué)的引文分析方法與可視化技術(shù)相結(jié)合達(dá)到對(duì)信息的有效組織和利用,生成新的知識(shí)。[3]該方法首先,通過(guò)計(jì)算機(jī)和互聯(lián)網(wǎng)搜索引擎強(qiáng)大的自動(dòng)查詢功能,在極短的時(shí)間里面完成對(duì)海量信息的準(zhǔn)確查詢。其次,通過(guò)計(jì)算機(jī)對(duì)已查詢到的海量分散信息進(jìn)行文獻(xiàn)計(jì)量統(tǒng)計(jì)分析,不僅可以通過(guò)量化模型將其以科學(xué)的、可視化的形式直觀的呈現(xiàn)出來(lái),而且還可以發(fā)現(xiàn)它們之間的深層次關(guān)系和趨勢(shì),對(duì)將要進(jìn)行的同領(lǐng)域的研究提供科學(xué)的指導(dǎo)。該方法被國(guó)內(nèi)外的許多科學(xué)計(jì)量學(xué)研究者應(yīng)用于學(xué)科前沿的研究。但是,國(guó)內(nèi)教育研究方法方面還比較落后。許多現(xiàn)代科學(xué)研究方法在教育科研中應(yīng)用得很少,現(xiàn)代數(shù)學(xué)遲遲未被引進(jìn)到教育科學(xué)中來(lái)。[4]對(duì)于科學(xué)計(jì)量方法在教育研究中應(yīng)用的專題介紹性文獻(xiàn)并不多見(jiàn)。我們?cè)谧珜?xiě)本文前,使用關(guān)鍵詞共詞分析方法分別對(duì)國(guó)內(nèi)特殊教育和自閉癥(孤獨(dú)癥)[5]相關(guān)研究成果進(jìn)行了梳理和總結(jié),積累了一定的經(jīng)驗(yàn),同時(shí),該方法對(duì)大量文獻(xiàn)綜合處理的高效性、準(zhǔn)確性、客觀性和直觀性給我們留下了深刻的印象。為了幫助國(guó)內(nèi)的高等教育研究者能夠?qū)@種方法有所了解,并且能夠在今后的研究中更多的使用這種方法,提升自己教育科研的準(zhǔn)確性和科學(xué)性,下面,我們以代表國(guó)內(nèi)教育最高研究水準(zhǔn)的教育類的核心期刊《教育研究》在2000-2012年發(fā)表的所有文獻(xiàn)作為研究資料,向大家展示該方法的具體使用過(guò)程和注意事項(xiàng)。
二、關(guān)鍵詞共詞分析方法
(一)關(guān)鍵詞共詞分析方法簡(jiǎn)介
共詞分析(Co-word Analysis)是一種較新的文獻(xiàn)計(jì)量學(xué)方法,其屬于內(nèi)容分析方法的一種。其主要原理是對(duì)一組詞兩兩統(tǒng)計(jì)它們?cè)谕黄墨I(xiàn)中出現(xiàn)的次數(shù),以此為基礎(chǔ)對(duì)這些詞進(jìn)行聚類分析,從而反映出這些詞之間的親疏關(guān)系,進(jìn)而分析這些詞所代表的學(xué)科或主題的結(jié)構(gòu)與變化。[6]共詞分析法可分別以文獻(xiàn)的主題詞和關(guān)鍵詞進(jìn)行共詞分析,但我們傾向于主張采用關(guān)鍵詞進(jìn)行共詞分析來(lái)得出結(jié)論,主要原因有:第一,關(guān)鍵詞是論文中起關(guān)鍵作用的、最能說(shuō)明問(wèn)題的、代表論文內(nèi)容特征的、或最有意義的詞[7];第二,關(guān)鍵詞不僅準(zhǔn)確地反映論文的主題,而且其本身應(yīng)具有獨(dú)立的檢索功能;第三,由于一篇文獻(xiàn)的關(guān)鍵詞或主題詞是文章核心內(nèi)容的濃縮和提煉,因此,如果某一關(guān)鍵詞或主題詞在其所在的領(lǐng)域的文獻(xiàn)中反復(fù)出現(xiàn),則可反映出該關(guān)鍵詞或主題詞所表征的研究主題是該領(lǐng)域的研究熱點(diǎn)[8];第四,通過(guò)對(duì)高頻關(guān)鍵詞共現(xiàn)關(guān)系分析,可以進(jìn)一步明晰若干熱點(diǎn)研究領(lǐng)域。[9]關(guān)鍵詞共詞分析主要是通過(guò)共詞分析軟件,對(duì)符合條件的查詢到的海量信息的關(guān)鍵詞對(duì)在同一篇文章中出現(xiàn)的頻次進(jìn)行統(tǒng)計(jì)分析(共詞分析),生成共被引矩陣。在此基礎(chǔ)上,利用統(tǒng)計(jì)軟件,進(jìn)行聚類分析、多維尺度分析、因子分析、主成分分析、社會(huì)網(wǎng)絡(luò)分析等高級(jí)統(tǒng)計(jì)處理,繪制出二維或者三維的可視化圖形,客觀系統(tǒng)的展示出所關(guān)注資料的直觀量化信息。
(二)關(guān)鍵詞共詞分析方法的具體操作過(guò)程
1.準(zhǔn)備研究工具
下載并安裝Bicomb共詞分析軟件和SPSS20作為主要研究工具。Bicomb共詞分析軟件由中國(guó)醫(yī)科大學(xué)醫(yī)學(xué)信息學(xué)系崔雷教授和沈陽(yáng)市弘盛計(jì)算機(jī)技術(shù)有限公司開(kāi)發(fā)。下載獲取地址為崔雷教授科學(xué)網(wǎng)的博客網(wǎng)址:https://skydrive.live.com/?cid=3adcb3b569c0a509&id=3ADCB3B569C0A509%211195。
2.準(zhǔn)備研究資料
首先,進(jìn)入網(wǎng)絡(luò)搜索引擎,根據(jù)自己研究目的限定文獻(xiàn)來(lái)源,進(jìn)行文獻(xiàn)檢索。根據(jù)自己研究需要和目的對(duì)文獻(xiàn)進(jìn)行取舍和保留。再次,對(duì)選取的文獻(xiàn)按照統(tǒng)一格式進(jìn)行保存。第三,對(duì)保存的文獻(xiàn)進(jìn)行標(biāo)準(zhǔn)化。最后,將保留文獻(xiàn)的格式轉(zhuǎn)化為Bicomb共詞分析軟件能夠識(shí)別的ANSI編碼,供后續(xù)量化統(tǒng)計(jì)分析使用。這里值得注意的是,如果不將文本格式編碼轉(zhuǎn)為ANSI編碼,Bicomb共詞分析軟件將無(wú)法識(shí)別有效信息。
3.進(jìn)行量化統(tǒng)計(jì)分析
首先,使用Bicomb軟件進(jìn)行關(guān)鍵詞統(tǒng)計(jì)并確定提取、導(dǎo)出高頻關(guān)鍵詞詞篇矩陣。有關(guān)Bicomb軟件進(jìn)行關(guān)鍵詞統(tǒng)計(jì)的詳細(xì)操作過(guò)程請(qǐng)閱讀相關(guān)操作手冊(cè)。[10]其次,采用SPSS20對(duì)高頻關(guān)鍵詞進(jìn)行聚類分析并生成Ochiai系數(shù)相同矩陣。再次,采用SPSS將高頻關(guān)鍵詞的相同矩陣轉(zhuǎn)化為相異矩陣并進(jìn)行多維尺度分析。最后,對(duì)上述量化結(jié)果進(jìn)行定量和定性結(jié)合的分析,得出相應(yīng)的結(jié)論和建議。
概括而言,關(guān)鍵詞共詞分析法的一般過(guò)程包括:明確研究的問(wèn)題、選定并標(biāo)準(zhǔn)化研究材料、高頻關(guān)鍵詞的選定、共現(xiàn)矩陣的提取、進(jìn)行高級(jí)統(tǒng)計(jì)處理(相同矩陣、相異矩陣的轉(zhuǎn)化、聚類分析、多維尺度分析)。
三、關(guān)鍵詞共詞分析方法示例
為了更好的使大家掌握該方法,下面,我們以“2000-2012年《教育研究》文獻(xiàn)熱點(diǎn)知識(shí)圖譜”為例向大家進(jìn)行詳細(xì)的示范說(shuō)明。
(一)查找準(zhǔn)備文獻(xiàn)
首先,進(jìn)入中國(guó)學(xué)術(shù)文獻(xiàn)網(wǎng)絡(luò)出版總庫(kù),進(jìn)入標(biāo)準(zhǔn)檢索對(duì)話框,將發(fā)表時(shí)間欄的具體日期定義為從“2000-01-01”到“2012-12-31”,文獻(xiàn)出版來(lái)源限定為“《教育研究》”。根據(jù)限定好的條件進(jìn)行文獻(xiàn)檢索,檢索到文獻(xiàn)2908條。其次,根據(jù)研究需要?jiǎng)h除研討會(huì)綜述、課題介紹、會(huì)議通知、卷首語(yǔ)、會(huì)議記錄、課題通過(guò)鑒定、讀后感、簡(jiǎn)介、研討會(huì)簡(jiǎn)介、書(shū)評(píng)、成果鑒定會(huì)、學(xué)院以及學(xué)校簡(jiǎn)介信息、人物專訪、投稿須知、會(huì)議紀(jì)要、出版信息、目錄信息、公告等,得到有效論文2550篇。再次,對(duì)上述文獻(xiàn)統(tǒng)一按照題名、作者、關(guān)鍵詞、單位、摘要、年、期等信息以文本形式保存。最后將保存的文本信息編碼格式統(tǒng)一改為ANSI編碼后保存。
(二)進(jìn)行量化統(tǒng)計(jì)
1.進(jìn)行關(guān)鍵詞詞頻統(tǒng)計(jì)分析并提取高頻關(guān)鍵詞頻次
一個(gè)學(xué)術(shù)研究領(lǐng)域較長(zhǎng)時(shí)域內(nèi)的大量學(xué)術(shù)研究成果的關(guān)鍵詞集合,可以揭示研究成果的總體內(nèi)容特征、研究?jī)?nèi)容之間的內(nèi)在聯(lián)系、學(xué)術(shù)研究發(fā)展的脈絡(luò)與發(fā)展方向等。[11]如果在統(tǒng)計(jì)文獻(xiàn)時(shí),關(guān)鍵詞出現(xiàn)的頻次越高,則表示與該關(guān)鍵詞有關(guān)的研究成果越多,研究?jī)?nèi)容的集中性就越強(qiáng)。一個(gè)研究領(lǐng)域的少量高頻次的關(guān)鍵詞,擁有該學(xué)科明顯大的信息密度與知識(shí)密度,成為信息與知識(shí)需求者檢索文獻(xiàn)的重點(diǎn),它們被稱為核心關(guān)鍵詞。[12]詞頻分析法是利用能夠揭示或表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞或主題詞在某一研究領(lǐng)域文獻(xiàn)中出現(xiàn)的頻次高低來(lái)確定該領(lǐng)域研究熱點(diǎn)和發(fā)展動(dòng)向的文獻(xiàn)計(jì)量方法。[13]
對(duì)2550篇文章中的15976個(gè)關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì)分析,發(fā)現(xiàn)關(guān)鍵詞出現(xiàn)的頻次范圍是1-107。為了減輕工作量,對(duì)關(guān)鍵詞頻次大于20的高頻關(guān)鍵詞進(jìn)行提取,結(jié)果見(jiàn)表1。
從表1可以看出,頻次大于等于20的有52個(gè)關(guān)鍵詞,占關(guān)鍵詞總數(shù)的3.25%,其出現(xiàn)的頻次合計(jì)為1839次,詞均35.37次,占關(guān)鍵詞總頻次(15976)的11.51%。這些高頻關(guān)鍵詞表述的研究?jī)?nèi)容,是2000-2012年《教育研究》發(fā)表文章的核心內(nèi)容。從高頻關(guān)鍵詞分布順序可看出,《教育研究》涉及的前10個(gè)研究熱點(diǎn)依次為:高等教育(107)、基礎(chǔ)教育(69)、教育公平(63)、教育改革(59)、教師(59)、教育研究(54)、課程改革(52)、教師教育(52)、教育發(fā)展(48)、教育理論(44)。這一統(tǒng)計(jì)結(jié)果,與2000-2009年八種教育學(xué)期刊文獻(xiàn)前10位高頻關(guān)鍵詞(高等教育、課程改革、教育研究、教育改革、素質(zhì)教育、教學(xué)改革、基礎(chǔ)教育、課堂教學(xué)、教師、教育理論)對(duì)比,有7個(gè)高頻關(guān)鍵詞完全重合,排在第一位的高等教育和最后一位的教育理論在排序上完全吻合,其它5個(gè)僅在排列順序上發(fā)生差異。這一結(jié)果不僅驗(yàn)證了本研究中統(tǒng)計(jì)方法的可信,而且還進(jìn)一步說(shuō)明相對(duì)于其它教育研究刊物,《教育研究》起著風(fēng)向標(biāo)的作用。
為深入挖掘這52個(gè)高頻關(guān)鍵詞的詞頻之間的關(guān)系以及它們背后隱藏的有效信息,還需要進(jìn)一步采用關(guān)鍵詞共現(xiàn)技術(shù)來(lái)進(jìn)行深入的計(jì)量學(xué)研究。
2.生成高頻關(guān)鍵詞的相同和相異矩陣
首先,生成高頻關(guān)鍵詞詞篇矩陣。對(duì)各個(gè)高頻關(guān)鍵詞是否在其它論文中成對(duì)出現(xiàn)(出現(xiàn)為1,否則為0),利用Bicomb軟件生成高頻關(guān)鍵詞詞篇矩陣。詞篇矩陣考察各高頻關(guān)鍵詞間的親疏關(guān)系,詞篇矩陣表示的是兩目標(biāo)之間的相似程度的矩陣,即兩者數(shù)字越大表明兩者關(guān)系越近,越小表明兩者關(guān)系越遠(yuǎn)。[14]其次,生成高頻關(guān)鍵詞相似系數(shù)矩陣。以關(guān)鍵詞詞篇矩陣為基礎(chǔ),在SPSS20中進(jìn)行相關(guān)分析,數(shù)據(jù)類型選擇“binary”二元變量,相似系數(shù)選擇“Ochiai”系數(shù),構(gòu)造出高頻關(guān)鍵詞相似系數(shù)矩陣。[15]相似矩陣中的數(shù)字表明數(shù)據(jù)間的相似性,數(shù)字的大小表明了相應(yīng)的兩個(gè)關(guān)鍵詞之間的距離遠(yuǎn)近,其數(shù)值越接近1,表明關(guān)鍵詞之間的距離越近、相似度越大;反之,數(shù)值越接近0,則表明關(guān)鍵詞之間的距離越大、相似度越小。最后,生成高頻關(guān)鍵詞相異系數(shù)矩陣。為了消除由于關(guān)鍵詞共現(xiàn)次數(shù)差異所帶來(lái)的影響,根據(jù)相似系數(shù)矩陣,采用相異系數(shù)矩陣=1-相似系數(shù)矩陣,產(chǎn)生相異系數(shù)矩陣。相異系數(shù)矩陣中數(shù)字表明數(shù)據(jù)間的相異性,其含義與相似系數(shù)矩陣意義相反,數(shù)值越接近1,表明關(guān)鍵詞之間的距離越大。相異系數(shù)矩陣結(jié)果見(jiàn)表2。
從表2可以看出,各關(guān)鍵詞分別與高等教育距離由遠(yuǎn)及近的順序依次為:教師(1.000)、教育研究(1.000)、課程改革(1.000)、教師教育(1.000)、基礎(chǔ)教育(0.988)、教育改革(0.908)、教育公平(0.963)。這個(gè)結(jié)果說(shuō)明,研究者在論及高等教育時(shí),會(huì)更多的將其與教師、教育研究、課程改革與教師教育結(jié)合在一起討論,而較少和基礎(chǔ)教育、教育改革、教育公平結(jié)合起來(lái)。采用上述原理,綜合表2中的關(guān)鍵詞相異系數(shù)矩陣數(shù)據(jù),可以初步得出的結(jié)論為:2000-2012年在《教育研究》發(fā)表的成果中,涉及到基礎(chǔ)教育與課程改革的資料較少,大量研究主要以高等教育為探討對(duì)象,關(guān)注高等教育中涉及的教師、教育研究、課程改革及教師教育等主要因素,對(duì)這些因素予以了更多的關(guān)注。出現(xiàn)這一結(jié)果的原因,一方面是《教育研究》從2004年開(kāi)始增大了對(duì)“教師”這一關(guān)鍵詞的關(guān)注,開(kāi)辟了專欄。另一方面的原因是,2001年“教師教育”被國(guó)務(wù)院首次提出后,引起了多方面尤其是教育界對(duì)此問(wèn)題的高度重視。
3.進(jìn)行高頻關(guān)鍵詞聚類分析
聚類分析是選定一些分類標(biāo)準(zhǔn),將不同的觀察體加以分類,同一類(集群)之內(nèi)觀察體彼此的相似度愈高愈好,而不同一類之間觀察體彼此的相異度愈高愈好。[16]高頻關(guān)鍵詞聚類分析是通過(guò)高級(jí)統(tǒng)計(jì)對(duì)已經(jīng)發(fā)表文獻(xiàn)的高頻關(guān)鍵詞組的相似性與相異性分析,來(lái)發(fā)現(xiàn)它們之間的遠(yuǎn)近關(guān)系,挖掘隱藏在它們背后的研究者關(guān)心的知識(shí)信息。關(guān)鍵詞聚類分析時(shí),先以最有影響的關(guān)鍵詞(種子關(guān)鍵詞)生成聚類;再次,由聚類中的種子關(guān)鍵詞及相鄰的關(guān)鍵詞再組成一個(gè)新的聚類。關(guān)鍵詞越相似它們的距離越近,反之,則越遠(yuǎn)。
將上述52個(gè)高頻關(guān)鍵詞構(gòu)成的52×52的相似系數(shù)矩陣,導(dǎo)入SPSS20進(jìn)行聚類分析。結(jié)果見(jiàn)圖1。
從圖1可以直觀的看出2000-2012年《教育研究》高頻關(guān)鍵詞被分為8個(gè)種類,它們的具體分布結(jié)果見(jiàn)表3。
從表3可以看出,2000-2012年《教育研究》8類研究具體分布為:
種類1為教學(xué)過(guò)程中的活動(dòng)和改革,包括14個(gè)關(guān)鍵詞,其可以細(xì)分為6小類:小類1基礎(chǔ)教育教學(xué)活動(dòng)及過(guò)程,包括3個(gè)關(guān)鍵詞(教學(xué)過(guò)程、教學(xué)活動(dòng)、基礎(chǔ)教育課程);小類2教學(xué)改革與教學(xué)論,包括2個(gè)關(guān)鍵詞(教學(xué)改革、教學(xué)論);小類3教學(xué)模式與課堂教學(xué),包括2個(gè)關(guān)鍵詞(教學(xué)模式、課堂教學(xué));小類4學(xué)生、教師及其發(fā)展,包括3個(gè)關(guān)鍵詞(學(xué)生、發(fā)展 、教師);小類5師生關(guān)系,包括1個(gè)關(guān)鍵詞(師生關(guān)系);小類6基礎(chǔ)教育及素質(zhì)教育的課程改革,包括3個(gè)關(guān)鍵詞(基礎(chǔ)教育、課程改革、素質(zhì)教育)。
種類2為道德教育與生活,包括2個(gè)關(guān)鍵詞(道德教育、生活世界)。
種類3為教育與課程,包括2個(gè)關(guān)鍵詞(教育、課程)。
種類4為學(xué)校教育、義務(wù)教育及教育政策、觀念,包括16個(gè)關(guān)鍵詞,其可以細(xì)分為7小類:小類1學(xué)校教育與職業(yè)教育,包括2個(gè)關(guān)鍵詞(學(xué)校教育 、職業(yè)教育);小類2農(nóng)村教育和農(nóng)村義務(wù)教育,包括2個(gè)關(guān)鍵詞(農(nóng)村教育、農(nóng)村義務(wù)教育);小類3義務(wù)教育和均衡發(fā)展,包括2個(gè)關(guān)鍵詞(義務(wù)教育、均衡發(fā)展);小類4教育公平、質(zhì)量及政策,包括3個(gè)關(guān)鍵詞(教育公平 、教育質(zhì)量、教育政策);小類5教育資源,包括1個(gè)關(guān)鍵詞(教育資源);小類6教育發(fā)展與教育科研,包括2個(gè)關(guān)鍵詞(教育發(fā)展、教育科研);小類7教育理念及對(duì)學(xué)習(xí)者的關(guān)注,包括4個(gè)關(guān)鍵詞(以人為本 、科學(xué)發(fā)展觀、教育理念 、學(xué)習(xí)者)。
種類5為大學(xué)及學(xué)科建設(shè),包括2個(gè)關(guān)鍵詞(大學(xué) 、學(xué)科建設(shè))。
種類6為教師教育、教育理論與教育思想,包括10個(gè)關(guān)鍵詞,其可以細(xì)分為3小類:小類1教師教育及其專業(yè)發(fā)展,包括3個(gè)關(guān)鍵詞(教師教育 、教師專業(yè)發(fā)展、中小學(xué)教師);小類2教學(xué)理論、研究及實(shí)踐與改革,包括6個(gè)關(guān)鍵詞(教育理論、理論與實(shí)踐 、教育研究 、教育實(shí)踐 、教育學(xué) 、教育改革);小類3教育思想,包括1個(gè)關(guān)鍵詞(教育思想)。
種類7為高等職業(yè)教育和民辦教育,包括2個(gè)關(guān)鍵詞(高等職業(yè)教育、民辦教育)。
種類8為高等教育、高等學(xué)校與價(jià)值取向,包括4個(gè)關(guān)鍵詞,可以細(xì)分為2小類:小類1高等教育與大學(xué)生價(jià)值取向,包括3個(gè)關(guān)鍵詞(高等教育 、大學(xué)生 、價(jià)值取向);小類2高等學(xué)校,包括1個(gè)關(guān)鍵詞(高等學(xué)校)。
4.進(jìn)行高頻關(guān)鍵詞的多維尺度分析
多維尺度分析(MDS)是一種可以幫助研究者找出隱藏在觀察資料內(nèi)的深層結(jié)構(gòu)的統(tǒng)計(jì)方法,其目的是在發(fā)掘一組資料背后之隱藏結(jié)構(gòu),希望用主要元素所構(gòu)成的構(gòu)面圖來(lái)表達(dá)出資料所隱藏的內(nèi)涵,尤其是在觀察資料體很多時(shí),利用多維尺度法更能適切地找出資料的代表方式。[16]采用多維尺度分析時(shí),要匯報(bào)其 Stress和RSQ值,它們分別為多維尺度分析中的信度和效度估計(jì)值。其中,壓力系數(shù)(Stress)是擬合度量值,用于維度數(shù)的選擇,Stress越小,表明分析結(jié)果與觀察數(shù)據(jù)擬合越好,其值越小,說(shuō)明模型的適合度越高。Kruskal(1964)給出了一種根據(jù)經(jīng)驗(yàn)來(lái)評(píng)價(jià)Stress優(yōu)劣的尺度:若Stress≥20%,則近似程度為差(Bad);≤10%,為滿意(Fair);≤5%,則為好(Good);≤2.5%,為很好(Excellent);其理想的狀況為Stress=0,稱為完全匹配(Prefect)。[17] 模型距離解釋的百分比(RSQ),表示變異數(shù)能被其相對(duì)應(yīng)的距離解釋的比例,也就是回歸分析中回歸分析變異量所占的比率,RSQ值越大,即越接近1,代表所得到的構(gòu)形上各點(diǎn)之距離與實(shí)際輸入之距離越適合。一般認(rèn)為,RSQ在0.60以上是可接受的。[18]
采用spss20對(duì)上述52個(gè)高頻關(guān)鍵詞構(gòu)成的52×52的聚類分析產(chǎn)生的矩陣進(jìn)行多維尺度分析,標(biāo)準(zhǔn)化方法選擇Z分?jǐn)?shù)。結(jié)果顯示,Stress= 0.120,RSQ= 0.823,說(shuō)明其擬合效果較好,可以反映出《教育研究》高頻關(guān)鍵詞間的學(xué)術(shù)聯(lián)系狀況。多維尺度分析結(jié)果見(jiàn)圖2。
多維尺度繪制出的坐標(biāo)稱為戰(zhàn)略坐標(biāo),它以向心度和密度為參數(shù)繪制成二維坐標(biāo),可以概括地表現(xiàn)一個(gè)領(lǐng)域或亞領(lǐng)域的結(jié)構(gòu)。[19]戰(zhàn)略坐標(biāo)中,各個(gè)小圓圈代表各個(gè)高頻關(guān)鍵詞所處的位置,圖中圓圈間距離越近,表明它們之間的關(guān)系越緊密;反之,則關(guān)系越疏遠(yuǎn)。影響力最大的關(guān)鍵詞,其所表示的圓圈距離戰(zhàn)略坐標(biāo)的中心點(diǎn)越近。坐標(biāo)橫軸為向心度(Centrality),表示領(lǐng)域間相互影響的強(qiáng)度;縱軸為密度(Density),表示某一領(lǐng)域內(nèi)部聯(lián)系強(qiáng)度。[20]在戰(zhàn)略坐標(biāo)劃分的四個(gè)象限中,一般而言,第一象限的主題領(lǐng)域內(nèi)部聯(lián)系緊密并處于研究網(wǎng)絡(luò)的中心地位。第二象限的主題領(lǐng)域結(jié)構(gòu)比較松散。這些領(lǐng)域的工作有進(jìn)一步發(fā)展的空間,在整個(gè)研究網(wǎng)絡(luò)中具有較大的潛在重要性。第三象限的主題領(lǐng)域內(nèi)部鏈接緊密,題目明確,并且有研究機(jī)構(gòu)在對(duì)其進(jìn)行正規(guī)的研究,但是在整個(gè)研究網(wǎng)絡(luò)中處于邊緣。第四象限的主題領(lǐng)域在整體工作研究中處于邊緣地位,重要性較小。[21]
結(jié)合上述理論,從圖2可以看出,首先,2000-2012年《教育研究》熱點(diǎn)知識(shí)圖譜分為8個(gè)區(qū)域,雖然種類1、4和6所占的區(qū)域較大,種類2、3、5、7、8所占區(qū)域較小,但從其分布位置可以看出,這些小的區(qū)域處于戰(zhàn)略坐標(biāo)的核心附近,表明這些區(qū)域是其關(guān)注的重點(diǎn)。種類7和種類8所處的領(lǐng)域距離戰(zhàn)略坐標(biāo)軸心位置最近,表明近幾年高等職業(yè)教育和民辦教育、高等教育、高等學(xué)校與價(jià)值取向成為了《教育研究》發(fā)文的熱點(diǎn)領(lǐng)域。其次,從各個(gè)種類所處戰(zhàn)略坐標(biāo)的象限分布特點(diǎn)來(lái)看,種類4的大部分關(guān)鍵詞位于戰(zhàn)略坐標(biāo)的第一象限,說(shuō)明其不僅是《教育研究》雜志組稿的核心領(lǐng)域,而且其文章數(shù)量相對(duì)于其它7個(gè)種類所占領(lǐng)域更為多,也更成熟,該領(lǐng)域的研究是我國(guó)教育研究的中心領(lǐng)域。種類1、8主要位于第二象限,說(shuō)明其主題相對(duì)松散,對(duì)其關(guān)注度還有待于進(jìn)一步加強(qiáng),其今后在《教育研究》文獻(xiàn)成果質(zhì)量提升方面還具有較大的潛在價(jià)值。種類2、3、6主要位于第三象限,說(shuō)明這3個(gè)種類所占的領(lǐng)域內(nèi)部鏈接緊密,題目明確,并且有研究機(jī)構(gòu)正在對(duì)其展開(kāi)正規(guī)的研究,但在整個(gè)研究網(wǎng)絡(luò)中仍處于邊緣。種類6大部分位于戰(zhàn)略坐標(biāo)的第四象限,說(shuō)明它們所處的主題在整個(gè)研究中處于邊緣地位,重要性較小。種類7不僅橫跨四個(gè)象限,而且緊緊圍繞在戰(zhàn)略坐標(biāo)軸心,說(shuō)明它所占的領(lǐng)域是《教育研究》發(fā)文的重點(diǎn)核心領(lǐng)域,該領(lǐng)域的研究不僅與國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010-2012年)提出的大力發(fā)展職業(yè)教育和大力支持民辦教育的內(nèi)容相一致,而且還與《教育研究》“2006中國(guó)教育研究前沿與熱點(diǎn)問(wèn)題年度報(bào)告”中“創(chuàng)新高等教育發(fā)展思路”、“拓展高等教育辦學(xué)多樣化”、“職業(yè)教育的轉(zhuǎn)型與發(fā)展取向”[22]等內(nèi)容相一致。此研究結(jié)果也被潘黎、王素的研究所驗(yàn)證。
四、總結(jié)和展望
通過(guò)上述實(shí)例,大家可以更直觀的感受到關(guān)鍵詞共詞分析方法的使用效果,但是,在使用的具體過(guò)程中,還應(yīng)該值得關(guān)注和思考下述問(wèn)題。
(一)進(jìn)行關(guān)鍵詞共詞分析前要確保對(duì)其進(jìn)行標(biāo)準(zhǔn)化
我們主要針對(duì)《教育研究》進(jìn)行計(jì)量分析,因?yàn)槠滹L(fēng)格基本一致,所以在標(biāo)準(zhǔn)化處理關(guān)鍵詞方面比較容易處理,但是,如果涉及到多個(gè)雜志間的文獻(xiàn)關(guān)鍵詞處理,就要特別注意對(duì)查詢到的文獻(xiàn)的關(guān)鍵詞進(jìn)行規(guī)范和統(tǒng)一。比如,我們?cè)谶M(jìn)行自閉癥熱點(diǎn)研究時(shí),要將在不同刊物中表達(dá)同樣含義的關(guān)鍵詞“自閉癥”與“孤獨(dú)癥”統(tǒng)一為“自閉癥”。遲景明和吳琳在研究中,將“高職院?!?、“職業(yè)技術(shù)學(xué)院”和“職技高?!睒?biāo)準(zhǔn)化為“高職院?!?,將“高等學(xué)?!?、“高等院校”、“高?!?、“大學(xué)”等標(biāo)準(zhǔn)化為“高?!?。對(duì)關(guān)鍵詞的標(biāo)準(zhǔn)化處理,能確保最后量化材料的準(zhǔn)確,進(jìn)而保證最后科學(xué)計(jì)量的精確、科學(xué)。但很多進(jìn)行科學(xué)計(jì)量的研究忽視了此問(wèn)題,導(dǎo)致了其研究結(jié)果的科學(xué)和準(zhǔn)確性大打折扣。
(二)可以嘗試使用社會(huì)網(wǎng)絡(luò)分析法更清晰地展示關(guān)鍵詞間的強(qiáng)弱關(guān)系
本研究采用的多維尺度雖然可以較好的觀察到變量間的關(guān)系,但是無(wú)法表現(xiàn)他們之間的強(qiáng)弱。要更好的表達(dá)各個(gè)關(guān)鍵詞之間的強(qiáng)弱關(guān)系,大家以后可以嘗試進(jìn)行社會(huì)網(wǎng)絡(luò)分析。社會(huì)網(wǎng)絡(luò)分析(Social Network Analysis)(簡(jiǎn)稱SNA,有的文獻(xiàn)稱為“社會(huì)網(wǎng)”或“網(wǎng)絡(luò)分析”)是包括測(cè)量與調(diào)查社會(huì)系統(tǒng)中各部分(“點(diǎn)”)的特征與相互之間的關(guān)系(“連接”),將其用網(wǎng)絡(luò)的形式表示出來(lái),然后分析其關(guān)系的模式與特征這一全過(guò)程的一套理論、方法和技術(shù)。[23] 采用社會(huì)網(wǎng)絡(luò)分析得出的三位立體網(wǎng)絡(luò)圖,更能直觀地反應(yīng)各個(gè)體(節(jié)點(diǎn))的位置及它們之間的相互關(guān)系(線段)。在原始圖線條密集,不易分析時(shí),還可進(jìn)行凝聚子群分析,使圖的直觀性增強(qiáng),更容易分析理解。[24] 社會(huì)網(wǎng)絡(luò)分析方法介紹及其軟件的下載,國(guó)際社會(huì)網(wǎng)絡(luò)分析網(wǎng)(http://www.insna.org/cgi-bin/softdatasearch.cgi)中給出了Construct、Network Genie、ORGAN 1 Social Network Analysis、PARTNER、PermNet、Socilyzer、UCI
NET software for Social Network ?Analysis八種社會(huì)網(wǎng)絡(luò)分析軟件。中文社會(huì)學(xué)網(wǎng)(http://www.sociology2010.cass.cn/news/133424.htm)給出了包括上述軟件在內(nèi)的20種軟件介紹和鏈接地址,感興趣的讀者可以自己嘗試使用。
(三)關(guān)鍵詞共詞分析法和定性方法結(jié)合使用才能更好解讀研究結(jié)果
雖然熱點(diǎn)知識(shí)圖譜是采用科學(xué)計(jì)量法繪制出來(lái)的,但是該方法的使用并非完全依賴定量技術(shù),其還依賴于定性分析技術(shù)。在進(jìn)行了聚類分析和多維尺度分析之后,對(duì)于各個(gè)種類及其所在區(qū)域的劃分和命名均需要雄厚的專業(yè)功底。它就像采用因子分析之后,對(duì)于各個(gè)因子的命名需要結(jié)合專業(yè)知識(shí)來(lái)命名一樣。因此,要進(jìn)行科學(xué)知識(shí)圖譜的繪制,需要將定量研究與定性分析結(jié)合起來(lái),具有一定的專業(yè)背景,才能夠?qū)τ?jì)量結(jié)果進(jìn)行準(zhǔn)確、客觀的解讀。
(四)進(jìn)行關(guān)鍵詞共詞分析方法時(shí)軟件的選取也至關(guān)重要
雖然現(xiàn)在國(guó)內(nèi)很多研究者,在社會(huì)學(xué)科、管理學(xué)科、醫(yī)學(xué)等研究領(lǐng)域?qū)χ形奈墨I(xiàn)的熱點(diǎn)知識(shí)圖譜的繪制采用了陳朝美博士研發(fā)的CiteSpace軟件,但是該軟件的優(yōu)勢(shì)在于處理外文,尤其是英文文獻(xiàn)上,對(duì)于中文文獻(xiàn)的處理還存在一定的不足,而我們所介紹的Bicomb軟件在中文文獻(xiàn)的共詞分析方面較有優(yōu)勢(shì),因此,我們建議大家對(duì)中文材料進(jìn)行科學(xué)計(jì)量研究時(shí)更多的采用此軟件。
通過(guò)本文的介紹,我們衷心希望能夠幫助高等教育研究者對(duì)關(guān)鍵詞共詞分析法有所了解,同時(shí),也真誠(chéng)的希望越來(lái)越多的高等教育研究者投入到教育研究成果的科學(xué)計(jì)量研究中來(lái)!
參考文獻(xiàn):
[1]潘黎,王素.近十年來(lái)教育研究的熱點(diǎn)領(lǐng)域和前沿主題——基于八種教育學(xué)期刊2000-2009年刊載文獻(xiàn)關(guān)鍵詞共現(xiàn)知識(shí)圖譜的計(jì)量分析[J].教育研究,2011(2):47-53..
[2]王方華,陳潔,編著.數(shù)據(jù)庫(kù)營(yíng)銷[M].上海:上海交通大學(xué)出版社,2006.
[3]郭文斌,方俊明,陳秋珠.基于關(guān)鍵詞共詞分析的我國(guó)自閉癥熱點(diǎn)研究[J].西北師大學(xué)報(bào)(社會(huì)科學(xué)版),2012,49(1):128-132.
[4]鄭日昌,崔麗霞.二十年來(lái)我國(guó)教育研究方法的回顧與反思[J].教育研究,2001(6):17-2.
[5]郭文斌,陳秋珠.特殊教育研究熱點(diǎn)知識(shí)圖譜[J].華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版),2012,30(3):49-54.
[6]崔雷.專題文獻(xiàn)高頻主題詞的共詞聚類分析[J].情報(bào)理論與實(shí)踐,1996,19(4):49-51.
[7]馬妍春,黃可心.科技論文摘要、關(guān)鍵詞及參考文獻(xiàn)的規(guī)范化[J].情報(bào)科學(xué),1999,17(6):625-627.
[8]楊國(guó)立,李品,劉競(jìng).科學(xué)知識(shí)圖譜——科學(xué)計(jì)量學(xué)的新領(lǐng)域[J].科普研究,2010,5(4):28-34.
[9]王凡.科學(xué)知識(shí)圖譜視域中的《圖書(shū)館理論與實(shí)踐》[J].圖書(shū)館理論與實(shí)踐,2011,(8):23-26.
[10]崔雷.書(shū)目共現(xiàn)分析系統(tǒng)《用戶使用說(shuō)明書(shū)》[Z/OL].http://cid-3adcb3b569c0a509.skydrive.live.com/browse.aspx/BICOMB.2012-04-13.
[11]李文蘭,楊祖國(guó).中國(guó)情報(bào)學(xué)期刊論文關(guān)鍵詞詞頻分析[J].情報(bào)科學(xué),2005,23(1):68-70.
[12]安秀芬,黃曉鸝,張霞,等.期刊工作文獻(xiàn)計(jì)量學(xué)學(xué)術(shù)論文的關(guān)鍵詞分析[J].中國(guó)科技期刊研究,2002,13(6):505-506.
[13]馬費(fèi)城,張勤.國(guó)內(nèi)外知識(shí)管理研究熱點(diǎn)——基于詞頻的統(tǒng)計(jì)分析[J].情報(bào)學(xué)報(bào),2006,25(2):163-170.
[14]邱均平,馬瑞敏,李曄君.關(guān)于共被引分析方法的再認(rèn)識(shí)和再思考[J].情報(bào)學(xué)報(bào),2008,27(1):69-74.
[15]遲景明,吳琳.近十年我國(guó)高等教育學(xué)學(xué)科研究熱點(diǎn)和趨勢(shì)——基于研究生學(xué)位論文的共詞聚類分析[J].中國(guó)高教研究,2011(9):20-24.
[16]陳正昌,程炳林,陳新豐,等著.多變量分析方法:統(tǒng)計(jì)軟件應(yīng)用[M].北京:中國(guó)稅務(wù)出版社,2005:241-299.
[17]張文彤,主編.SPSS統(tǒng)計(jì)分析高級(jí)教程[M].北京:高等教育出版社,2004:40-44.
[18]靖新巧,趙守盈.多維尺度的效度和結(jié)構(gòu)信度評(píng)述[J].中國(guó)考試,2008(1).
[19]Law J, Bauin S, J.Courtial P, et al.Policy and the mapping of scientific change: A co-word analysis of research into environmental acidification[J].Scientometrics,1988,14(3-4):251-264.
[20]馮璐,冷伏海.共詞分析方法理論進(jìn)展[J].中國(guó)圖書(shū)館學(xué)報(bào),2006,32(2):88-92.
[21]崔雷,鄭華川.關(guān)于從MEDLINE數(shù)據(jù)庫(kù)中進(jìn)行知識(shí)抽取和挖掘的研究進(jìn)展[J].情報(bào)學(xué)報(bào),2003,22(4):425-433.
[22]教育研究編輯部.2006中國(guó)教育研究前沿與熱點(diǎn)問(wèn)題年度報(bào)告[R].教育研究,2007(3):3-16,29.
[23]湯匯道.社會(huì)網(wǎng)絡(luò)分析方法述評(píng)[J].學(xué)術(shù)界,2009(3):205-208.
[24]種艷秋,張晗,冷榮新,等.利用社會(huì)網(wǎng)絡(luò)分析法和聚類法研究心血管疾病知識(shí)結(jié)構(gòu)的比較[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2007,16(6):77-90.