黃思佳 何翀 徐惠珍
摘要:本文選取2016-2018年CNKI相關(guān)文獻(xiàn),運(yùn)用文獻(xiàn)題錄信息統(tǒng)計分析工具SATI、可視化網(wǎng)絡(luò)分析軟件Gephi對“R&D投入與公司成長性”的研究情況從發(fā)文年度、發(fā)文機(jī)構(gòu)單位分布、作者合著網(wǎng)絡(luò)、關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)、行業(yè)研究情況等方面進(jìn)行分析,從而指出研究熱點與最新研究趨勢。
關(guān)鍵詞:R&D投入;公司成長性;Gephi;可視化
引言
在倡導(dǎo)實現(xiàn)“中國制造”到“中國智造”轉(zhuǎn)型的當(dāng)下,我國大批企業(yè)著力更新科技水平,打造核心競爭優(yōu)勢,以此創(chuàng)造新的利潤增長點。R&D投入作為影響創(chuàng)新能力的重要因素,因其極大的風(fēng)險性質(zhì),一直是備受學(xué)者們關(guān)注的課題。因此,該投入對企業(yè)成長性的研究一直備受關(guān)注。
不同于形勢單一、呈現(xiàn)信息抽象的傳統(tǒng)數(shù)據(jù)可視化,可視化知識圖譜Gephi是一款交互式的復(fù)雜網(wǎng)絡(luò)分析軟件,能生動地展現(xiàn)出各要素之間的聯(lián)系和研究熱點。
本文采用文獻(xiàn)題錄分析工具SATI,借助Gephi的可視化網(wǎng)絡(luò)技術(shù)輔以excel匯總,描繪出2016-2018年R&D投入與公司成長性研究的圖譜,分析得出該課題的最新熱點、研究機(jī)構(gòu)分布及行業(yè)研究情況。
1、數(shù)據(jù)收集與研究方法
1.1 數(shù)據(jù)收集
本文數(shù)據(jù)來源于中國知網(wǎng)(CNKI)論文數(shù)據(jù)庫中的文獻(xiàn)。在中國知網(wǎng)上以“R&D投入OR公司成長性”為搜索范圍,檢索日期截至2018年10月4日,最終得到316篇期刊和論文。
1.2 研究方法
首先對文獻(xiàn)題錄信息剔除同義詞,其次將文件導(dǎo)入SATI生成共現(xiàn)矩陣。對于發(fā)文年度、發(fā)文機(jī)構(gòu)單位、行業(yè)研究情況等在excel中統(tǒng)計;對于關(guān)鍵詞共現(xiàn)矩陣與作者和主網(wǎng)絡(luò),則選擇用Gephi將被研究頻數(shù)較高的詞條凸顯出來。同時,對邊進(jìn)行過濾,將較熱門的研究方向顯現(xiàn)出來。最后,通過軟件統(tǒng)計的平均度、平均路徑長度、平均聚類系數(shù)等數(shù)值進(jìn)行分析。
2、數(shù)據(jù)分析
2.1 發(fā)表年度分布
剔除年度相關(guān)文章中重復(fù)或不相關(guān)的記錄后,匯總發(fā)現(xiàn)可以將此課題研究劃分為:起步階段(1997-2004年)、發(fā)展階段(2005-2012年)、高潮階段(2013-2015年)和漸趨成熟階段(2016-至今)。在2012年度發(fā)文量大幅上升后,2013年相關(guān)發(fā)文數(shù)量達(dá)到最高峰169篇。2016年開始逐漸回落,另一方面也向我們傳遞著研究漸趨成熟的信號。
2.2 發(fā)文單位機(jī)構(gòu)分布
發(fā)文機(jī)構(gòu)可以分為五類:高校單獨(dú)發(fā)文、社會機(jī)構(gòu)單位單獨(dú)發(fā)文、高校間聯(lián)合發(fā)文、機(jī)構(gòu)單位聯(lián)合發(fā)文以及高校與機(jī)構(gòu)聯(lián)合發(fā)文。匯總發(fā)現(xiàn),316篇文獻(xiàn)中,290篇來自高校單獨(dú)發(fā)文,占比高達(dá)91.7%。高校聯(lián)合發(fā)文15篇,占比4.75%??傮w而言,各大高校是最主要的貢獻(xiàn)力量。
截取SATI頻數(shù)統(tǒng)計前16位的高校,綜合類大學(xué)占16所總量的29.11%,6所財經(jīng)類高校發(fā)文總量占比37.97%,理工類大學(xué)發(fā)文量占16所總量的45.57% 。由此得出結(jié)論,該課題更受理工類大學(xué)學(xué)生的歡迎。
2.3 作者合著網(wǎng)絡(luò)
用SATI截取文獻(xiàn)作者信息矩陣導(dǎo)入Gephi,共得到100節(jié)點、115邊。采用Fruchterman Reingold布局。其次,對節(jié)點進(jìn)行排序并進(jìn)行模塊化分割,統(tǒng)計發(fā)現(xiàn)88個社區(qū),同時得到模塊化度量值0.753,表明合作團(tuán)體間聯(lián)系較密切。
研究圖譜發(fā)現(xiàn),發(fā)文作者分布較零散,多為碩博論文或單獨(dú)發(fā)表的期刊文章,僅存在6個合作較為密切的社區(qū)(社區(qū)之間不存在合作關(guān)系):唐瑋(唐瑋、曹蕾、崔也光)團(tuán)隊、吳祖光團(tuán)隊(吳祖光、康華、扈文秀)、張金鎖(張金鎖、呂靖燁、王婷、李明、李玲)團(tuán)隊、龔詩婕團(tuán)隊(龔詩婕、呂慶華)、任敏團(tuán)隊(任敏、谷文林、林寧)、郭浩團(tuán)隊(徐艷、郭浩)。其中,合著最為密切的是唐瑋-曹蕾-崔也光團(tuán)隊,吳祖光團(tuán)隊中吳祖光與扈文秀合著次數(shù)較多,而兩人與康華的合作較少。所有節(jié)點中度和加權(quán)度最大的是吳祖光和扈文秀,節(jié)點度為4,加權(quán)度為5.33,表明他們分別與四個作者有過5次的合作[1]。
2.4 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)
將共現(xiàn)矩陣導(dǎo)入Gephi,共計導(dǎo)入100節(jié)點、962條邊。為防止節(jié)點存在重疊,最終采用ForceAtlas2的算法[2]。其次,設(shè)置節(jié)點波動范圍和標(biāo)記顏色。統(tǒng)計頻數(shù)越大,節(jié)點也就越大,顏色也隨之加深。為區(qū)分大部分詞條的熱度,采用節(jié)點的模塊化分割形成11個社區(qū)。
節(jié)點加權(quán)度是指該節(jié)點與其他節(jié)點連接邊的權(quán)值的總和[3],即該詞條與相關(guān)聯(lián)的詞條共同出現(xiàn)的次數(shù)。經(jīng)計算,關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的平均度為10.62,平均加權(quán)度為1.305。因此,“R&D投入與公司成長性”的詞條關(guān)聯(lián)范圍較大,但關(guān)聯(lián)程度不夠密切。圖譜的平均路徑長度為1.996,網(wǎng)絡(luò)直徑為3,呈現(xiàn)小世界性[4]。圖譜平均聚類系數(shù)為0.745,該數(shù)值較接近1,表明節(jié)點之間的關(guān)聯(lián)較緊密。
由于圖譜中的邊交錯復(fù)雜,難以進(jìn)行深入研究,因此進(jìn)行邊的過濾,保留322條邊。(見圖2)經(jīng)觀察計數(shù)發(fā)現(xiàn),研究R&D投入與公司成長性關(guān)系的文章僅有7篇,而單獨(dú)研究R&D投入或者公司成長性的較多。其中涉及“R&D投入-企業(yè)績效”的高達(dá)50篇,涉及“R&D投入-融資約束”的有18篇,有關(guān)“R&D投入-股權(quán)結(jié)構(gòu)-股權(quán)激勵”的有19篇。公司治理、創(chuàng)新績效、稅收優(yōu)惠、政府補(bǔ)貼等詞條與R&D投入關(guān)聯(lián)也較緊密。除此之外,“公司成長性-創(chuàng)業(yè)板”(23篇)、“公司成長性-影響因素”(11篇)、“公司成長性-因子分析”(9篇)、“公司成長性-資本結(jié)構(gòu)”(5篇)也是最近三年研究中的熱點問題。
2.5 行業(yè)研究情況
在圖譜顯示的節(jié)點中有部分“高新技術(shù)上市公司”、“環(huán)保類上市公司”、“農(nóng)業(yè)上市公司”等行業(yè)詞條。為了進(jìn)一步研究行業(yè)實例研究的情況,篩選出關(guān)鍵詞頻數(shù)統(tǒng)計中行業(yè)詞條的記錄,統(tǒng)計發(fā)現(xiàn)共有70篇行業(yè)實例研究文獻(xiàn),占文獻(xiàn)總數(shù)的22.15%。這表明“R&D與公司成長性”課題的相關(guān)實例研究較少,偏向理論研究的較多。70篇實例研究中有關(guān)高新技術(shù)產(chǎn)業(yè)的實例研究有13篇,占行業(yè)研究總數(shù)的18.75%。設(shè)備制造業(yè)、生物醫(yī)藥、農(nóng)業(yè)緊跟其后,分別占有14.29%、11.43%、8.57%。
3、結(jié)論與不足
3.1 研究結(jié)論
一是,在2013-2015年的研究熱潮過后,最近三年的年度發(fā)文數(shù)量逐漸減少,研究趨向于成熟。2016-2018年R&D與公司成長性研究中,社會機(jī)構(gòu)單位的發(fā)文數(shù)量占極小部分,各類高校則是探究主力軍。其中,理工類大學(xué)的相關(guān)貢獻(xiàn)較多,財經(jīng)類高校次之。
二是,作者合著網(wǎng)絡(luò)較為分散,少有關(guān)聯(lián)緊密的合著團(tuán)隊。而在關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)中,單獨(dú)研究R&D投入、公司成長性的文獻(xiàn)居多。其中,R&D研究延伸范圍較廣,涉及企業(yè)績效、融資、股權(quán)結(jié)構(gòu)、高管激勵、稅收優(yōu)惠等方面的文獻(xiàn)數(shù)較多。而公司成長性涉及的研究課題較少,影響因素、資本結(jié)構(gòu)等為熱點方向。
三是,該課題下的理論研究較多,實例研究僅占70篇,其中高新技術(shù)產(chǎn)業(yè)、設(shè)備制造業(yè)、生物醫(yī)藥、農(nóng)業(yè)等領(lǐng)域的相關(guān)研究居多。而創(chuàng)業(yè)板上市公司因其高成長性,成為研究成長性的典型。綜合以上論述,建議增加對創(chuàng)業(yè)板上市公司R&D投入與公司成長性的實例研究。
3.2 研究不足
首先,在對題錄關(guān)鍵詞進(jìn)行同義詞清洗前需要人工識別,可能存在個別同義詞被忽略的情況,形成一定誤差。其次,在使用文獻(xiàn)題錄信息統(tǒng)計工具SATI生成關(guān)鍵詞共現(xiàn)矩陣時,由于軟件出于實際意義的限制,只能導(dǎo)出前100條記錄,遺漏了少部分信息。
參考文獻(xiàn)
[1] 彭琰,嚴(yán)莉.基于Gephi的云南民族醫(yī)藥研究可視化分析[J].醫(yī)學(xué)信息學(xué)雜志,2015,36(02):65-68+89.
[2] 王揚(yáng),田野,李鐵山,陳俊龍,彭東成,周義華.基于Gephi的航運(yùn)招聘信息可視化分析[J].大數(shù)據(jù),2018,4(03):81-91.
[3] 曹霞,崔雷.合著網(wǎng)絡(luò)評價指標(biāo)與文獻(xiàn)計量學(xué)評價指標(biāo)相關(guān)性研究[J].中華醫(yī)學(xué)圖書情報雜志,2016,25(2):20-26,74.
[4] 張梅,翁志輝,楊振,林海清,黃愛萍,劉健宏.我國水土保持學(xué)科領(lǐng)域作者合著網(wǎng)絡(luò)分析[J].中國水土保持, 2017(12):47-49.
[5] 劉勇,杜一.網(wǎng)絡(luò)數(shù)據(jù)可視化與分析利器: Gephi中文教程[M].北京:電子工業(yè)出版社,2017:163-164.
[6] 王龍.合作網(wǎng)絡(luò)模型結(jié)構(gòu)研究與應(yīng)用[D].濟(jì)南:山東師范大學(xué),2015:19-21.
作者單位:江蘇大學(xué)財經(jīng)學(xué)院。