■ 劉玉林 虞昌亮(安徽商貿(mào)職業(yè)技術學院經(jīng)濟貿(mào)易系安徽蕪湖 241002)
基于關鍵詞共現(xiàn)聚類的電子商務信用研究熱點分析
■ 劉玉林虞昌亮(安徽商貿(mào)職業(yè)技術學院經(jīng)濟貿(mào)易系安徽蕪湖241002)
本文以“電子商務、信用”作為篇名對中國知網(wǎng)期刊文獻數(shù)據(jù)庫進行檢索,將502篇檢索文章作為研究對象,分析其總體特征和關鍵詞共現(xiàn)熱點。通過分析發(fā)現(xiàn),總體上2007年是電子商務信用研究高潮,近五年有所下降但依然保持較好水平;在聚類上電子商務信用熱點研究分為電子商務信用評價與管理、信用信息與風險博弈分析、信用環(huán)境和信用類別、交易過程信用研究以及網(wǎng)絡交易和網(wǎng)站經(jīng)營五類,并總結出研究熱點集中化、突出化和實用化三大特征。
電子商務信用共詞分析熱點
近年來,我國電子商務持續(xù)向好發(fā)展,電子商務時代來臨促使國內(nèi)眾多學者對其開展研究。其中,關于“電子商務信用”理論與實踐的研究也成為熱點。在中國知網(wǎng)中,以篇名“電子商務 信用”作為檢索詞,在“中國學術期刊網(wǎng)絡出版總庫”中共有502篇來源文章。如此多的查詢結果,往往使文獻檢索人員感到分析困難,對國內(nèi)期刊文獻關于電子商務信用問題研究現(xiàn)狀難以把握。因此,勢必需要一種更好的研究綜述方法對其總結,展示文獻檢索的結果(朱晉偉等,2015)。
在對中國知網(wǎng)以“電子商務信用”為篇名檢索后,在“中國學術期刊網(wǎng)絡出版總庫”中共計502篇文章,時期跨度為2000年至2015年共16年時間。
首先,以年維度進行分組后匯總如圖1所示。在對電子商務信用研究方面,我國自2000年開始,總體上呈現(xiàn)出逐年增長的態(tài)勢,在2006-2010年我國“十一五”期間最高,相關資料也顯示當時正是我國電子商務蓬勃發(fā)展的時期。2010-2015年“十二五”期間數(shù)量也基本保持在每年40篇左右。
其次,在檢索文章基金方面,圖2和圖3顯示,有25%的文章是有基金項目支持的,從年分布角度看2006-2010年年度項目基金數(shù)量最高,近5年來也處于較高水平??梢妵壹笆∈姓呱蠈﹄娮由虅招庞脝栴}研究給予了很大的重視和支持。
再次,在文章成果推廣方面,主要以文章下載和被引用數(shù)量進行分析,502篇文章共被下載155884次,達到19.4次/(年·篇),被引用2551次,達到0.32次(年·篇)。由圖4可以看出,實線代表年下載情況,主坐標軸數(shù)據(jù)顯示自2000以來一直走高,在2007年達到最高,近5年來處于急速下降態(tài)勢;虛線代表年被引用情況,副坐標軸顯示在總體走勢上與被下載情況相同,在2000-2007年期間保持高企,2007年達到最高后持續(xù)下降。
最后,在持續(xù)研究性方面,主要以同一作者發(fā)表文章的篇數(shù)指標研究。表1顯示,在502篇文章中共有694位作者,平均1.4人次/篇;發(fā)表文章兩篇以上作者63位,占作者總數(shù)的9.1%,長期研究作者(3篇及其以上)較少,反映出我國在電子商務信用問題研究持續(xù)性方面還有待于進一步提升。
圖1 電子商務信用研究文章數(shù)據(jù)年度分析圖
圖2 研究文章基金支持情況扇形圖
圖3 研究文章基金項目數(shù)量年匯總圖
圖4 研究文章下載和引用數(shù)量統(tǒng)計圖
為了說明電子商務信用問題研究熱點的細節(jié)情況,主要對502篇文章進行聚類研究,具體方法是:通過關鍵詞形成共現(xiàn)矩陣,通過因子和聚類分析電子商務信用研究現(xiàn)狀。
(一)關鍵詞提取
通過Excel“分列”、“條件格式中的重復值”、“并列和數(shù)據(jù)透視表”等方法,502篇電子商務信用研究文章共有955個關鍵詞,共使用2256次。根據(jù)Donohue提出的高低詞頻界分公式得出T=31.1899,閥值為32,此時關鍵詞僅有“電子商務、信用、信用體系、信用評價、電子商務信用、信用風險”保留,由于在前期研究中以“電子商務 信用”作為主題詞搜索,因此去除這兩個關鍵詞后僅有“信用體系、信用評價、信用風險”三個關鍵詞。僅有的三個關鍵詞并不能反映研究的熱點情況,故在參考國內(nèi)一些基于關鍵詞共現(xiàn)研究文章后,選擇詞頻大于5的關鍵詞作為構造共詞矩陣的因素,選取的關鍵詞結果為60個,但在60個關鍵詞中有很多同一或者相近詞語,為研究的集中性進行合并,例如“淘寶”和“淘寶網(wǎng)”統(tǒng)一合并為“淘寶網(wǎng)”等。合并后關鍵詞數(shù)目共計18個,具體如表2所示。
(二)構建共詞矩陣
將中國知網(wǎng)中提出的關鍵詞列在Excel中處理,經(jīng)過“分列”、“VLOOKUP關鍵詞篩選”、“刪除空白單一關鍵詞”后變成8列,組成兩兩配對組C82=28次,經(jīng)過兩兩配對后形成兩列,再利用表2“新關鍵詞變換”形成構成共詞矩陣的原始數(shù)據(jù)。
在“新關鍵詞變換”后的兩列關鍵詞配對基礎上,通過“數(shù)據(jù)透視表”構建共詞矩陣,形成18×18矩陣(部分內(nèi)容見表3)。在表3 中,數(shù)字反映高頻關鍵詞間共現(xiàn)的次數(shù)。
(三)標準相關矩陣轉(zhuǎn)化
在共詞矩陣中,為消除頻數(shù)差異帶來的影響,利用Ochiai系數(shù)對其進行相關矩陣轉(zhuǎn)化,Ochiai系數(shù)公式如下:
式(1)中Nij表示兩個關鍵詞共現(xiàn)的頻數(shù),Ni或Nj表示關鍵詞各自出現(xiàn)的頻數(shù)。需要注意的是共詞矩陣的關鍵詞頻數(shù)與表2中共詞矩陣處理前關鍵詞頻數(shù)有所不同,因為在共詞矩陣處理過程中會刪除單一關鍵詞,造成頻數(shù)有所減少(見表4)。
由于共詞相關矩陣中“0”值較多,與“1”相減后得到高頻關鍵詞共詞相異矩陣,如表5所示。
(四)多元統(tǒng)計分析
通過SPSS20.0對共詞相異矩陣進行因子分析和聚類分析,找出關鍵詞類群分析,從而發(fā)現(xiàn)電子商務信息研究熱點和發(fā)展趨勢。
1.SPSS因子分析。在SPSS 20.0選擇“Analyze”-“Data Reduction”-“Factor”和“Principal components”選項對共詞相異矩陣進行分析,表6結果顯示7個因子被提取,因子累計方差解釋貢獻率為59.132%,但在圖5碎石圖中可以看出前5個因子比較陡峭,具有很好的代表性,考慮到劃分為5類能夠使分析更集中。因此,選擇提取5個因子作為聚類分析依據(jù)。
2.SPSS聚類分析。在SPSS 20.0選擇“Analyze”-“classify”-“Hierarchical Cluster”,在“Cluster Method”中選擇“Between-groups linkage”,和“Measure”中選擇“Squared Euclidean distance”,對共詞相異矩陣進行處理,得到樹狀圖(見圖6)。
在圖6中,對高頻關鍵詞進行分類,依照因子分析的結果共分為五類:第一類電子商務模式、信用評價、信用管理和對策;第二類博弈論、信用風險、信用服務和信用信息;第三類為網(wǎng)絡交易和網(wǎng)站經(jīng)營;第四類信用環(huán)境和信用類別;第五類信用認證、信用制度、交易過程信用、信用案例、信用問題和網(wǎng)上購買。
表1 同一作者發(fā)表文章篇數(shù)統(tǒng)計
表2 高頻關鍵詞選取和合并一覽表
表3 高頻關鍵詞構建共詞矩陣(部分)
表4 高頻關鍵詞共詞相關矩陣(部分)
表5 高頻關鍵詞共詞相異矩陣(部分)
(一)熱點研究領域分析
電子商務信用研究文獻通過形成共詞矩陣、相關相異矩陣轉(zhuǎn)化、因子聚類等多元分析后,得到五類研究領域,下面對其進行分析。
1.電子商務信用評價與管理。第一類包含新關鍵詞“電子商務模式、信用評價、信用管理和對策”,其中電子商務模式原有關鍵詞為“B2B、B2C、C2C、C2C電子商務、C2C模式”,信用評價原有關鍵詞“信用體系、信用評價、信用評價體系、信用評估、信用評價模型、指標體系、評價模型、信用度”,信用管理和對策為原關鍵詞本身。故該類主要討論不同電子商務模式的信用評價方法,對包含B2B、B2C、C2C等電子商務模式建立信用評價模式(或者信用高度)、設計指標或指標體系等,以及在電子商務信用評價基礎上開展信用管理和對策研究(王強等,2010)。
表6 共詞相異矩陣SPSS因子分析表
2.信用信息與風險博弈分析。第二類包含新關鍵詞“博弈論、信用風險、信用服務和信用信息”,其中博弈論原有關鍵詞為“博弈、博弈論、博弈分析、納什均衡”,信用風險原有關鍵詞為“信用風險、信用危機”,信用信息原有關鍵詞為“信用信息、信用數(shù)據(jù)、信息不對稱”,信用服務為原關鍵詞本身。該類主要是對電子商務信用過程中信息問題進行研究,包括對信用風險和危機利用博弈論理論和方法進行探討(夏晗,2015),例如討論信用風險的博弈分析,討論信息不對稱的博弈分析,同時該領域也提出應該建立信用數(shù)據(jù)服務(高勁松等,2014)。
3.網(wǎng)絡交易和網(wǎng)站經(jīng)營。第三類包含新關鍵詞“網(wǎng)絡交易和網(wǎng)站經(jīng)營”,其中網(wǎng)絡交易原有關鍵詞為“電子交易、網(wǎng)絡交易”,網(wǎng)站經(jīng)營原有關鍵詞為“網(wǎng)購、網(wǎng)上購買”。該類主要列舉電子交易、網(wǎng)絡交易、網(wǎng)絡和網(wǎng)上購買等社會熱點電子商務詞語,是研究領域?qū)﹄娮由虅崭咚侔l(fā)展做出的反應,在一定程度上說明其研究的社會意義。
4.信用環(huán)境和信用類別。第四類包含新關鍵詞“信用環(huán)境和信用類別”,其中信用環(huán)境原有關鍵詞為“信用環(huán)境、誠信環(huán)境”,信用類別原有關鍵詞為“個人信用、社會信用、企業(yè)信用、商務誠信、商業(yè)信用”。該類主要研究不同信用類型的環(huán)境問題,具體包括對個人、企業(yè)、商業(yè)、商務甚至社會等信用環(huán)境的特征描述和問題研究,從而把握整體信用環(huán)境的生態(tài)現(xiàn)狀。
5.交易過程信用研究。第五類新關鍵詞為“信用認證、信用制度、交易過程信用、信用案例、信用問題和網(wǎng)上購買”,其中信用認證原有關鍵詞為“認證機構、征信、第三方認證、社會信用體系”,信用制度原有關鍵詞為“信用制度、信用機制、誠信機制、誠實信用原則”,交易過程信用原有關鍵詞為“第三方支付、電子支付、電子合同、第三方、貨到付款、交易手段、交易信用”,信用案例原有關鍵詞為“支付寶、中小企業(yè)、網(wǎng)上拍賣、淘寶網(wǎng)、易趣網(wǎng)、淘寶”,信用問題原有關鍵詞為“信用問題和信用缺失”,網(wǎng)上購買為原有關鍵詞。該類主要選擇包括淘寶網(wǎng)、易趣網(wǎng)、網(wǎng)上拍賣等一些信用案例,進行交易過程的信用研究,涉及到通過第三方支付、信用認證或者征信等方法解決一些信用問題和信用缺失。該領域包含關鍵詞較多,研究范圍較廣,但在社會上都是電子商務信用問題研究的關鍵熱點之一。
(二)研究總體特征分析
通過上述分析,電子商務信用研究熱點呈現(xiàn)出集中化、突出化和實用化三大特點。
1.研究熱點集中化。通過聚類,發(fā)現(xiàn)五類研究熱點為包括個人、企業(yè)、商業(yè)、商務甚至社會等不同信用類型的環(huán)境特征和問題描述(第四類),對包括淘寶網(wǎng)、易趣網(wǎng)等信用案例進行交易過程的信用研究(第五類),對不同電子商務模式的信用評價研究(第一類),探討信用信息的博弈分析(第二類)。五類熱點全面反映了電子商務信用研究的涵蓋領域,研究脈絡清晰,結構明確,可以概括性表達為電子商務信用鏈的集中化研究。
2.研究熱點突出化。在五類研究熱點中,對不同電子商務模式的信用評價研究(第一類)和對包括淘寶網(wǎng)、易趣網(wǎng)等信用案例進行交易過程的信用研究(第五類)兩類涵蓋高頻關鍵詞較多,研究熱點突出,同時也是社會的突出熱點。此點實質(zhì)上反映出電子商務信用熱點研究已明確找到自身的核心問題,并開展了實際的重點研究,使研究熱點進一步突出化。
3.研究熱點實用性。在研究熱點中,信用案例、信用環(huán)境、交易過程信用等都是實際發(fā)展中電子商務信用遇到的社會問題,其本身作為研究熱點也是反映社會的期待熱點和實質(zhì)熱點,研究熱點的結論對完善不同電子商務信用評價(第一類研究)、提升交易過程信用保障(第五類研究)、建立信用信息的分析和服務(第二類研究)、不同信用類型的環(huán)境特征認知等都有著實際的社會意義,反映出研究熱點社會實用性。
綜上,通過對2000-2015年502篇電子商務信用期刊文獻總體特征統(tǒng)計,發(fā)現(xiàn)2007年電子商務信用處于最高時期,近年來所有所下降但依然保持較好勢頭。在關鍵詞共現(xiàn)聚類研究方面,分析發(fā)現(xiàn)電子商務信用評價與管理、信用信息與風險博弈分析、信用環(huán)境和信用類別、交易過程信用研究以及網(wǎng)絡交易和網(wǎng)站經(jīng)營五類研究熱點,并總結出研究熱點集中化、突出化和實用化三大特征。
圖5 共詞相異矩陣SPSS碎石圖
圖6 共詞相異矩陣聚類樹狀圖
1.朱晉偉,鄒玲.基于關鍵詞共現(xiàn)聚類的戰(zhàn)略管理研究熱點分析[J].現(xiàn)代情報,2015(10)
2.儲節(jié)旺,郭春俠. EXCEL實現(xiàn)共詞分析的方法——以國內(nèi)圖書情報領域知識管理研究為例[J].情報雜志,2011(3)
3.儲節(jié)旺,郭春俠.共詞分析法的基本原理及EXCEL實現(xiàn)[J].情報科學,2011(6)
4.王強,楊茂江,劉琛.基于統(tǒng)一信任的電子商務信用評價模型[J].信息安全與通信保密,2010(8)
5.夏晗.基于主成分分析和支持向量回歸隨機組合模型的電子商務信用風險度預測研究[J].現(xiàn)代情報,2015(1)
6.高勁松,梁艷琪,李珂,肖漣,周習曼.面向關聯(lián)數(shù)據(jù)的電子商務信用信息服務模型研究[J].現(xiàn)代圖書情報技術,2014(6)
安徽高校人文社科一般項目(SKSM201504);安徽高校人文社科重點項目(SK2016A0360);安徽省省級質(zhì)量工程項目(2014msgzs186)
F713
A