王宗水,劉海燕,劉 葦,趙 紅,張 健
(1.北京信息科技大學(xué)經(jīng)濟(jì)管理學(xué)院,北京 100192;2.中國(guó)科學(xué)院大學(xué)數(shù)學(xué)科學(xué)學(xué)院,北京 100190;3.中國(guó)科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院,北京 100190;4.中國(guó)科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 100190)
知識(shí)發(fā)現(xiàn)是獲取數(shù)據(jù)中新穎、具有潛在價(jià)值,且能被理解的知識(shí)的過程[1],不僅是企業(yè)解決信息超載問題、獲得競(jìng)爭(zhēng)優(yōu)勢(shì)的重要方式[2],也是知識(shí)成果轉(zhuǎn)化的前提[3]。知識(shí)來源的多樣性導(dǎo)致了知識(shí)發(fā)現(xiàn)在內(nèi)容與方法上的差異性,由于知識(shí)之間的關(guān)聯(lián)性,通過網(wǎng)絡(luò)分析方法來研究知識(shí)表達(dá)與知識(shí)挖掘得到了廣泛關(guān)注[4],尤其是知識(shí)網(wǎng)絡(luò)的動(dòng)態(tài)演化模型在知識(shí)分類與識(shí)別中具有更好的適用性[5]。
知識(shí)發(fā)現(xiàn)的過程包括數(shù)據(jù)的獲取、預(yù)處理、數(shù)據(jù)挖掘、數(shù)據(jù)后處理等步驟[6]。學(xué)術(shù)論文作為最新的研究主題,常被用于研究趨勢(shì)與發(fā)展路徑的分析[7-8]。數(shù)據(jù)挖掘方法和聚類分析方法已成為知識(shí)發(fā)現(xiàn)的重要方式[9-11]?;诖?,Sato等[12]將數(shù)據(jù)挖掘與聚類分析、關(guān)聯(lián)規(guī)則分析結(jié)合起來,對(duì)多目標(biāo)拓?fù)鋬?yōu)化中的知識(shí)予以挖掘,并通過實(shí)例證明了方法的有效性。
盡管知識(shí)網(wǎng)絡(luò)的概念尚未形成統(tǒng)一認(rèn)識(shí),但是通??衫斫鉃橹R(shí)節(jié)點(diǎn)的集合,知識(shí)節(jié)點(diǎn)可以是圖書、論文、專利、情報(bào)或文字[7]。節(jié)點(diǎn)間的關(guān)系既可以是文獻(xiàn)的引用關(guān)系,也可以是同一數(shù)據(jù)來源中不同知識(shí)的共現(xiàn)關(guān)系。例如,Xiao等[13]通過引文關(guān)系構(gòu)建知識(shí)網(wǎng)絡(luò)來研究知識(shí)的擴(kuò)散過程,此時(shí)網(wǎng)絡(luò)連接為文獻(xiàn)的引用關(guān)系;唐洪婷等[5]在研究大眾協(xié)同創(chuàng)新社區(qū)中的知識(shí)發(fā)現(xiàn)過程中,則以知識(shí)點(diǎn)的共現(xiàn)作為知識(shí)超圖中的超邊。另外,在研究知識(shí)體系的發(fā)展與概念演化過程中,關(guān)鍵詞的共現(xiàn)已經(jīng)成為主要的網(wǎng)絡(luò)構(gòu)建基礎(chǔ)[14],是研究知識(shí)關(guān)聯(lián)的重要方式[15]。然而,在知識(shí)發(fā)現(xiàn)的過程中引文分析具有滯后性,關(guān)鍵詞分析能夠有效避免此問題,但在關(guān)鍵詞中同義詞的存在在一定程度上降低了知識(shí)發(fā)現(xiàn)的準(zhǔn)確性[7]。
時(shí)間拓展網(wǎng)絡(luò)是一種離散時(shí)間下的動(dòng)態(tài)網(wǎng)絡(luò)流建模方法,通過將靜態(tài)網(wǎng)絡(luò)的節(jié)點(diǎn)與弧在離散時(shí)間框架下分別進(jìn)行復(fù)制和更新,從而形成新的網(wǎng)絡(luò)[16],通常被應(yīng)用于物流系統(tǒng)優(yōu)化[17]、傳輸最短路徑識(shí)別[18]、基于網(wǎng)絡(luò)距離的收費(fèi)結(jié)構(gòu)設(shè)計(jì)[19],其在網(wǎng)絡(luò)路徑識(shí)別與優(yōu)化中具有良好的適用性。所以用時(shí)間拓展網(wǎng)絡(luò)來研究以節(jié)點(diǎn)距離為基礎(chǔ)的知識(shí)發(fā)展路徑具有理論上的可行性。
鑒于此,結(jié)合已有研究,本文提出一種基于時(shí)間拓展網(wǎng)絡(luò)的知識(shí)發(fā)展路徑識(shí)別方法,將所得數(shù)據(jù)劃分為等時(shí)間間距的不同階段,采用文本挖掘方法對(duì)每個(gè)階段的關(guān)鍵詞進(jìn)行依次提取;同時(shí),為了提高數(shù)據(jù)的準(zhǔn)確性與可靠性,對(duì)關(guān)鍵詞進(jìn)行編輯與篩選,將不同階段的相同關(guān)鍵詞標(biāo)的為關(guān)系連接點(diǎn),通過定義關(guān)鍵詞網(wǎng)絡(luò)關(guān)聯(lián)準(zhǔn)則,形成基于時(shí)間流的知識(shí)連接網(wǎng)絡(luò),并結(jié)合節(jié)點(diǎn)接近中心性的值來探索知識(shí)發(fā)展的主要路徑,從而呈現(xiàn)知識(shí)的動(dòng)態(tài)演化過程。
知識(shí)網(wǎng)絡(luò)的構(gòu)建需要先確定數(shù)據(jù)來源,而在知識(shí)發(fā)現(xiàn)過程中,文獻(xiàn)是主要數(shù)據(jù)源之一[13,20],因此,本文以文獻(xiàn)為數(shù)據(jù)單元,通過文本挖掘方法來提取關(guān)鍵詞,并通過圖1所示的流程構(gòu)建知識(shí)網(wǎng)絡(luò)。首先,確定文獻(xiàn)的檢索條件,通過相應(yīng)數(shù)據(jù)庫(kù)初步檢索得到相應(yīng)文獻(xiàn),通過人工篩選確定所需下載的條目,下載文獻(xiàn)并以特定格式進(jìn)行存儲(chǔ)。然后,采用文本挖掘方法進(jìn)行關(guān)鍵詞提取,根據(jù)數(shù)據(jù)范圍進(jìn)行詞頻統(tǒng)計(jì)。最后,在關(guān)鍵詞共現(xiàn)矩陣的基礎(chǔ)上形成初步的知識(shí)網(wǎng)絡(luò),通過同義詞匯及其共現(xiàn)關(guān)系的合并處理形成最終的知識(shí)網(wǎng)絡(luò)。
圖1 知識(shí)網(wǎng)絡(luò)構(gòu)建流程
網(wǎng)絡(luò)結(jié)構(gòu)的變化能夠直觀地反映知識(shí)體系的發(fā)展過程[21],在科學(xué)計(jì)量學(xué)研究中引文網(wǎng)絡(luò)是知識(shí)發(fā)展路徑研究的主要方法[13]。但引文分析在知識(shí)發(fā)現(xiàn)中具有滯后性,所以學(xué)者們引入了關(guān)鍵詞與引文分析相結(jié)合的方法[7],因過程相對(duì)復(fù)雜且仍主要依據(jù)引文網(wǎng)絡(luò)對(duì)關(guān)鍵詞聚類分析,所以仍存在一定的滯后性。因此,知識(shí)動(dòng)態(tài)性的準(zhǔn)確刻畫是知識(shí)發(fā)展路徑演化必須考慮的因素,而時(shí)間拓展網(wǎng)絡(luò)既能夠充分體現(xiàn)同階段知識(shí)要素的關(guān)聯(lián)關(guān)系,又能夠反映知識(shí)網(wǎng)絡(luò)隨時(shí)間的演化過程。
鑒于此,本文依據(jù)關(guān)鍵詞構(gòu)建知識(shí)網(wǎng)絡(luò),同時(shí)依據(jù)知識(shí)網(wǎng)絡(luò)隨時(shí)間變化的動(dòng)態(tài)性,將知識(shí)網(wǎng)絡(luò)劃分為不同階段,并通過不同階段網(wǎng)絡(luò)結(jié)構(gòu)的變化來識(shí)別知識(shí)發(fā)展路徑,具體步驟如下:
(1)根據(jù)時(shí)間將所獲取的文獻(xiàn)劃分為等間距階段,分別構(gòu)建不同階段的知識(shí)網(wǎng)絡(luò),并形成不同階段的知識(shí)單元Ui={Ui1,Ui2,Ui3,…,Uik},其中,Uik表示第i個(gè)階段的第k個(gè)關(guān)鍵詞。
(2)識(shí)別相鄰階段中知識(shí)單元Ui與Ui+1中相同關(guān)鍵詞,當(dāng)兩個(gè)階段存在相同關(guān)鍵詞時(shí),則以相同關(guān)鍵詞建立網(wǎng)絡(luò)連接,其基本過程如圖2所示。
(3)根據(jù)節(jié)點(diǎn)連接情況,對(duì)節(jié)點(diǎn)間的距離xij予以賦值,當(dāng)相鄰兩個(gè)階段的關(guān)鍵詞相同時(shí),如U14與U21、U15與U22,兩個(gè)階段網(wǎng)絡(luò)節(jié)點(diǎn)間的距離記作0;當(dāng)同階段不同節(jié)點(diǎn)直接連接時(shí),如U12→U13,兩者之間的距離記作1;間接連接時(shí),其距離為最短到達(dá)路徑距離,如U23→U24,記作2;兩個(gè)節(jié)點(diǎn)通過連接不可能到達(dá)時(shí),如U13與U14,記作∞。此時(shí)不考慮由后一階段節(jié)點(diǎn)作為中間節(jié)點(diǎn)實(shí)現(xiàn)連接的過程。
(4)構(gòu)建節(jié)點(diǎn)-弧關(guān)聯(lián)矩陣,根據(jù)圖2中的部分節(jié)點(diǎn)形成的節(jié)點(diǎn)-弧關(guān)聯(lián)矩陣,如表1所示。由于在計(jì)算網(wǎng)絡(luò)距離過程中不考慮弧的方向性和節(jié)點(diǎn)的自連接,所以其距離矩陣為對(duì)稱矩陣,同階段節(jié)點(diǎn)的自身距離記作空值,用“—”表示。
圖2 時(shí)間網(wǎng)絡(luò)連接示意圖
表1 節(jié)點(diǎn)-弧關(guān)聯(lián)矩陣
(5)構(gòu)建知識(shí)發(fā)展路徑的目標(biāo)函數(shù),即
在此基礎(chǔ)上,計(jì)算出最短路徑f。
(6)知識(shí)發(fā)展路徑表明了知識(shí)要素在不同階段的發(fā)展過程,而組成路徑的節(jié)點(diǎn)在不同階段的重要性更能體現(xiàn)知識(shí)的層次結(jié)構(gòu)和重要內(nèi)容的分布,所以可以按照接近中心性的高低將知識(shí)要素劃分為不同的層次[22]。某一關(guān)鍵詞接近中心性的值較高時(shí),表明其在知識(shí)網(wǎng)絡(luò)中的位置越重要,也是知識(shí)發(fā)展路徑的重要組成。因此,本文根據(jù)不同階段知識(shí)元素在所屬階段知識(shí)網(wǎng)絡(luò)中的接近中心性(CC(vi))的值確定其重要性,其計(jì)算方法為
其中,N表示網(wǎng)絡(luò)中節(jié)點(diǎn)的總數(shù);dij為節(jié)點(diǎn)vi到vj的最短距離[4]。
然后,按接近中心性排名將節(jié)點(diǎn)以(maxmin)/4,等分為十分重要、比較重要、一般重要以及不重要4個(gè)層次,分別記作A、B、C、D,并分別統(tǒng)計(jì)每條路徑中4種類型節(jié)點(diǎn)的占比,從而確定不同的路徑在知識(shí)發(fā)展中的重要性,篩選出重要路徑。
(7)根據(jù)節(jié)點(diǎn)的連接關(guān)系對(duì)重要的知識(shí)發(fā)展路徑予以網(wǎng)絡(luò)展開,并對(duì)不同路徑中的相同元素予以挖掘,記作知識(shí)發(fā)展路徑的連接點(diǎn),從而形成不同路徑連接的紐帶,呈現(xiàn)整個(gè)知識(shí)發(fā)展脈絡(luò)。
數(shù)據(jù)的可靠性是知識(shí)發(fā)現(xiàn)的基本前提[23],由于文獻(xiàn)數(shù)據(jù)的完整性和準(zhǔn)確性,已經(jīng)成為知識(shí)發(fā)現(xiàn)的重要數(shù)據(jù)來源,并得到了較廣泛的應(yīng)用[24],如生物醫(yī)學(xué)[25]、傳統(tǒng)醫(yī)學(xué)[26]等領(lǐng)域。因此,本文選取信息管理領(lǐng)域的24個(gè)重要期刊在1979—2018年發(fā)表的論文為樣本(期刊信息如表2所示),檢索日期為2019年1月28日。在數(shù)據(jù)的采集過程中,經(jīng)過初步篩選去除信息不完整、非文章類條目,最終選取43624篇文獻(xiàn)作為研究樣本,其發(fā)文量整體變化趨勢(shì)如圖3所示。
表2 期刊及相關(guān)領(lǐng)域
圖3 發(fā)文量變化趨勢(shì)
為了比較不同階段知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)及發(fā)展路徑,本文以每10年劃分為一個(gè)階段,即階段一(1979—1988年)、階段二(1989—1998年)、階段三(1999—2008年)、階段四(2009—2018年),4個(gè)階段文獻(xiàn)的數(shù)量依次為4251、7966、13311和18096。整體上而言,信息管理領(lǐng)域的發(fā)文量呈上升趨勢(shì),且各階段的變化趨勢(shì)基本一致,1979—1988年增長(zhǎng)速度較慢,經(jīng)過1989—1998年、1999—2008年兩個(gè)階段的快速增長(zhǎng),2009年以后趨于相對(duì)穩(wěn)定,所以從發(fā)文量的變化趨勢(shì)上來看,該階段劃分方式是合理的。
國(guó)家/地區(qū)發(fā)文量的多少能夠反映出其在某領(lǐng)域知識(shí)創(chuàng)造能力及國(guó)際影響力的大小[27-28],所以在國(guó)家/地區(qū)科研能力評(píng)價(jià)過程中,論文數(shù)量成為重要的指標(biāo)之一[29]。本文采用CiteSpace軟件對(duì)不同階段的國(guó)家/地區(qū)發(fā)文量進(jìn)行統(tǒng)計(jì),其中4個(gè)階段發(fā)文量排在前10位的國(guó)家/地區(qū)如表3所示。
從表3中可以看出,在信息管理領(lǐng)域,美國(guó)的發(fā)文量遠(yuǎn)遠(yuǎn)高于其他國(guó)家/地區(qū),但每個(gè)階段所占發(fā)文量總數(shù)的比重在逐漸降低,例如,階段一美國(guó)發(fā)文量占前10位國(guó)家/地區(qū)發(fā)文量總數(shù)的80.90%,而階段四則下降至44.80%。大多數(shù)國(guó)家/地區(qū)的發(fā)文量整體呈上升趨勢(shì),且發(fā)文量前10位的國(guó)家/地區(qū)基本穩(wěn)定。近20年來,我國(guó)的發(fā)文量顯著增長(zhǎng),已成為信息管理領(lǐng)域重要的知識(shí)創(chuàng)造國(guó),國(guó)際影響力顯著提升。
表3 發(fā)文量排名前10位的國(guó)家/地區(qū)統(tǒng)計(jì)
關(guān)鍵詞是文章核心內(nèi)容的高度概括,在科學(xué)計(jì)量學(xué)的研究中,關(guān)鍵詞常被應(yīng)用于分析科學(xué)研究的發(fā)展趨勢(shì)[30]以及概念的演化[14]。詞頻的高低可反映某一領(lǐng)域在學(xué)術(shù)研究中的被關(guān)注程度[31],關(guān)鍵詞的共現(xiàn)系數(shù)及網(wǎng)絡(luò)關(guān)聯(lián)可用于分析研究?jī)?nèi)容的內(nèi)在關(guān)聯(lián)[14]。關(guān)鍵詞通常指的是作者標(biāo)注的關(guān)鍵詞,而在CiteSpace軟件中,關(guān)鍵詞可以為標(biāo)題、摘要、關(guān)鍵詞、出版商補(bǔ)充的關(guān)鍵詞共同提取出的關(guān)鍵詞[32]。由于標(biāo)題、摘要存在差異性且文字較多,關(guān)鍵詞提取的準(zhǔn)確性會(huì)降低。因此,本文僅提取作者關(guān)鍵詞與出版商關(guān)鍵詞作為研究對(duì)象進(jìn)行知識(shí)演化路徑分析。通過CiteSpace軟件提取主要關(guān)鍵詞,初步提取時(shí),以引用量或出現(xiàn)頻次前10%的條目作為分析對(duì)象。由于階段一的文章數(shù)量明顯低于其余3個(gè)階段,所以對(duì)階段一的詞頻閾值做降低處理,將其設(shè)定為2,最終得到61個(gè)關(guān)鍵詞,其他3個(gè)階段分別提取詞頻前100位的關(guān)鍵詞作為研究對(duì)象。4個(gè)階段排名前10位的關(guān)鍵詞及頻次如表4所示。
通過表4可以看出,4個(gè)階段前10位的關(guān)鍵詞在頻次上顯著增加,例如,在階段一最高頻次為12,階段四則為1975,也反映出研究規(guī)模的顯著增加。在內(nèi)容上,關(guān)鍵詞存在明顯的差異性,但又存在一些重要內(nèi)容貫穿4個(gè)階段,例如,信息系統(tǒng)(information system)在4個(gè)階段都具有較高的頻次,這表明其在信息管理研究中的重要性。
表4 高頻關(guān)鍵詞統(tǒng)計(jì)
根據(jù)公式(1)分別計(jì)算時(shí)間拓展網(wǎng)絡(luò)中的最短路徑,其中,最短路徑f的值為0,且存在9條路徑的最小值為0,即表明在4個(gè)階段均存在的關(guān)鍵詞有9個(gè),分別為management(管理)、information system(信息系統(tǒng))、innovation(創(chuàng)新)、design(設(shè)計(jì))、implementation(實(shí)施)、decision support system(決策支持系統(tǒng))、simulation(仿真)、決策(decision making)、數(shù)據(jù)庫(kù)(database)。
然后根據(jù)公式(2)計(jì)算各階段最短路徑節(jié)點(diǎn)的接近中心性的值,其接近中心性的值如表5所示,[]內(nèi)的數(shù)值為該階段節(jié)點(diǎn)接近中心性的取值范圍。其中,管理、信息系統(tǒng)、創(chuàng)新、設(shè)計(jì)與實(shí)施在4個(gè)階段的接近中心性的值均大于0,表明其在知識(shí)網(wǎng)絡(luò)中的位置比較重要,而決策支持系統(tǒng)的接近中心性逐漸降低,也反映出在知識(shí)網(wǎng)絡(luò)中的重要性逐漸降低。通過分別統(tǒng)計(jì)每條路徑中A、B、C、D的個(gè)數(shù)確定每條路徑在知識(shí)發(fā)展過程中的相對(duì)重要性。
表5 關(guān)鍵詞各階段中心性
由表5可知,管理3A、1C,信息系統(tǒng)2A、2C,創(chuàng)新2A、1B、1C,設(shè)計(jì)2A、1B、1C,實(shí)施2A、1B、1D,仿真1C、3D,決策支持系統(tǒng)2C、2D,決策1A、1B、2D,數(shù)據(jù)庫(kù)1A、1C、2D??梢钥闯?,仿真、決策支持系統(tǒng)各階段的相對(duì)重要性均較低,決策與數(shù)據(jù)庫(kù)在某個(gè)階段的重要性較高,而其他5個(gè)節(jié)點(diǎn)各階段整體的相對(duì)重要性則較高,因此其為重要的知識(shí)發(fā)展路徑。
圖5 信息系統(tǒng)為主線的知識(shí)發(fā)展路徑
圖6 創(chuàng)新為主線的知識(shí)發(fā)展路徑
為了進(jìn)一步分析信息管理領(lǐng)域知識(shí)網(wǎng)絡(luò)的發(fā)展路徑,本文對(duì)管理、信息系統(tǒng)、創(chuàng)新、設(shè)計(jì)與實(shí)施5條主線,依次以共現(xiàn)關(guān)系為鏈接,構(gòu)建與主路徑節(jié)點(diǎn)距離小于等于2的關(guān)系網(wǎng)絡(luò),如圖4~圖8所示。
圖4 管理為主線的知識(shí)發(fā)展路徑
圖8 實(shí)施為主線的知識(shí)發(fā)展路徑
1)管理為主線的發(fā)展路徑
在關(guān)鍵詞提取過程中,包含管理的關(guān)鍵詞主要有管理、信息系統(tǒng)管理、項(xiàng)目管理以及知識(shí)管理4個(gè),為了體現(xiàn)研究?jī)?nèi)容的具體化,并未對(duì)其進(jìn)行合并處理,而是以范圍最廣的管理為主線梳理相關(guān)研究的發(fā)展過程。階段一,與管理直接相連的關(guān)鍵詞有方法、標(biāo)準(zhǔn)、系統(tǒng)開發(fā)、生活模式4個(gè),在此基礎(chǔ)上形成了相應(yīng)的知識(shí)分支,如項(xiàng)目管理與軟件開發(fā)、系統(tǒng)設(shè)計(jì)與方法等。階段二,與管理直接連接的關(guān)鍵詞只有設(shè)計(jì),其成為連接管理與系統(tǒng)、人因工程、建模的紐帶。階段三,與管理直接相連的關(guān)鍵詞有技術(shù)、問題和框架,但技術(shù)是主要的研究?jī)?nèi)容,并且擴(kuò)展到組織、信息系統(tǒng)、電腦、模型等多個(gè)領(lǐng)域。階段四,管理的研究?jī)?nèi)容進(jìn)一步得到拓展,如知識(shí)管理、管理實(shí)施、管理的成功模式、管理績(jī)效等。整體上而言,管理相關(guān)的研究?jī)?nèi)容分散,且不同階段主要內(nèi)容差異較大,但與信息系統(tǒng)、信息技術(shù)相關(guān)的理論、方法與應(yīng)用仍是重要的研究?jī)?nèi)容。
2)信息系統(tǒng)為主線的發(fā)展路徑
通過詞頻及接近中心性計(jì)算發(fā)現(xiàn),信息系統(tǒng)是信息管理研究中重要的核心內(nèi)容。在階段一,信息系統(tǒng)與管理信息系統(tǒng)的管理及設(shè)計(jì)具有最直接的關(guān)系,在管理信息系統(tǒng)設(shè)計(jì)的基礎(chǔ)上,延伸到信息分析、認(rèn)知模式與用戶參與。然而,在階段二,與信息系統(tǒng)直接關(guān)聯(lián)的關(guān)鍵詞只有方法,表明此階段信息系統(tǒng)的相關(guān)研究更多的關(guān)注于系統(tǒng)開發(fā)的模型與方法。進(jìn)入階段三,盡管與信息系統(tǒng)直接相連的關(guān)鍵詞為成功與技術(shù),但研究?jī)?nèi)容更多的與信息系統(tǒng)技術(shù)相關(guān),而這些技術(shù)涉及管理、通訊、組織等多個(gè)方面。經(jīng)過階段三的發(fā)展,在階段四,與信息系統(tǒng)直接連接的關(guān)鍵詞只有技術(shù),表明信息系統(tǒng)技術(shù)成為最主要的研究?jī)?nèi)容,其涉及的領(lǐng)域有所拓展,如戰(zhàn)略層面的信息系統(tǒng)技術(shù)及其應(yīng)用[33]。從整體上而言,信息系統(tǒng)的研究經(jīng)歷了從管理新系統(tǒng)的管理與設(shè)計(jì)到對(duì)應(yīng)的方法與模型,再到聚焦于信息系統(tǒng)技術(shù)及其應(yīng)用3個(gè)階段。
3)創(chuàng)新為主線的發(fā)展路徑
創(chuàng)新是管理學(xué)研究的重要內(nèi)容,在信息管理領(lǐng)域同樣如此,其在信息管理研究的不同階段均具有重要的作用。階段一,信息管理領(lǐng)域的創(chuàng)新研究主要體現(xiàn)在軟件的開發(fā)上,尤其是以項(xiàng)目管理、生活方式相結(jié)合的創(chuàng)新模式。階段二與階段一相比,創(chuàng)新的相關(guān)研究發(fā)生了明顯的變化,此時(shí)更多地關(guān)注創(chuàng)新擴(kuò)散以及對(duì)創(chuàng)新的態(tài)度,并延伸到創(chuàng)新的采用及實(shí)施。階段三,創(chuàng)新擴(kuò)散仍是重要的研究?jī)?nèi)容之一,但此時(shí)更多地關(guān)注企業(yè)的創(chuàng)新能力、獲得的競(jìng)爭(zhēng)優(yōu)勢(shì)以及知識(shí)管理,同時(shí),創(chuàng)新的實(shí)施也是重要的研究視角。階段四,隨著人們對(duì)創(chuàng)新重要性認(rèn)識(shí)的提升,其涉及的領(lǐng)域進(jìn)一步擴(kuò)大,研究方法也更為多樣,如采用案例研究分析企業(yè)的信息技術(shù)的競(jìng)爭(zhēng)優(yōu)勢(shì)[11]。由于創(chuàng)新涉及的領(lǐng)域較為廣泛,所以在信息管理領(lǐng)域其整體發(fā)展呈現(xiàn)多樣性。
4)設(shè)計(jì)為主線的發(fā)展路徑
設(shè)計(jì)在信息管理中的體現(xiàn)主要包括信息系統(tǒng)的開發(fā)、信息需求的實(shí)現(xiàn)、信息的提取、信息技術(shù)的創(chuàng)新與完善等方面。隨著信息技術(shù)的發(fā)展,需要設(shè)計(jì)來實(shí)現(xiàn)的內(nèi)容增多,但與其直接連接或較短距離的關(guān)鍵詞數(shù)量卻逐漸減少,表明在信息管理的知識(shí)領(lǐng)域,設(shè)計(jì)相關(guān)的研究更為聚焦,形成了以信息系統(tǒng)、信息技術(shù)實(shí)現(xiàn)與完善相關(guān)功能的方式。
5)實(shí)施為主線的發(fā)展路徑
實(shí)施是信息系統(tǒng)及相關(guān)技術(shù)功能實(shí)現(xiàn)的重要環(huán)節(jié)。階段一,實(shí)施成為連接用戶滿意與系統(tǒng)研發(fā)的紐帶,即通過系統(tǒng)研發(fā)的實(shí)施來滿足用戶的需求是此階段重要的研究?jī)?nèi)容。階段二,實(shí)施將技術(shù)與擴(kuò)散連接起來[34],研究范圍得到擴(kuò)展。在階段三和階段四,隨著知識(shí)與創(chuàng)新在管理中作用的提升,實(shí)施的研究視角與知識(shí)、創(chuàng)新相連接,形成了新的研究領(lǐng)域。
圖7 設(shè)計(jì)為主線的知識(shí)發(fā)展路徑
信息系統(tǒng)、管理、創(chuàng)新、設(shè)計(jì)與實(shí)施構(gòu)成了信息管理知識(shí)發(fā)展的主線,彼此之間又通過技術(shù)、模型與方法、擴(kuò)散、知識(shí)等內(nèi)容相互關(guān)聯(lián),從而形成了信息管理研究的知識(shí)網(wǎng)絡(luò)。
在領(lǐng)域知識(shí)發(fā)現(xiàn)的過程中,聚類方法得到了較多的應(yīng)用[35-36],為了比較基于時(shí)間拓展網(wǎng)絡(luò)的知識(shí)發(fā)現(xiàn)方法與聚類方法的差異,本節(jié)采用了CiteSpace軟件中的LLR(log-likelihood ratio,對(duì)數(shù)似然比)對(duì)關(guān)鍵詞進(jìn)行聚類分析,同樣以引用量或出現(xiàn)頻次為前10%的條目作為分析對(duì)象,以10年為一個(gè)時(shí)間段,聚類結(jié)果以時(shí)間軸展示,節(jié)點(diǎn)顯示的閾值為頻次大于等于100,其結(jié)果如圖9所示。
圖9 關(guān)鍵詞聚類結(jié)果
模塊度(modularity)和平均輪廓系數(shù)(mean silhouette score)是反映網(wǎng)絡(luò)全局結(jié)構(gòu)特性的重要指標(biāo)[32],關(guān)鍵詞網(wǎng)絡(luò)聚類的模塊度值為0.8383,輪廓系數(shù)值為0.2932,表明網(wǎng)絡(luò)被合理地拆分為松耦合集群,且同質(zhì)性較高,聚類結(jié)果較理想。其中包括分析、信任、禁忌搜索、實(shí)驗(yàn)、優(yōu)化、決策支持系統(tǒng)、MIS計(jì)劃、案例研究、項(xiàng)目管理、信息系統(tǒng)、創(chuàng)新、仿真共12個(gè)主要分類,與表4中的主線內(nèi)容具有較高的一致性,研究?jī)?nèi)容隨時(shí)間軸的變化在一定程度上反映出信息管理領(lǐng)域知識(shí)的發(fā)展過程。
但是聚類分析的結(jié)果并不能準(zhǔn)確地顯示出知識(shí)形成的主要路徑,尤其是同一內(nèi)容在不同階段的重要性不能直觀地展示出來,需要深入挖掘、細(xì)化節(jié)點(diǎn)間的關(guān)聯(lián),才能更好地識(shí)別知識(shí)形成與發(fā)展的主要路徑,所以在知識(shí)發(fā)現(xiàn)過程中,聚類得到的結(jié)果仍需進(jìn)一步深入挖掘,尤其是結(jié)合節(jié)點(diǎn)的網(wǎng)絡(luò)特性才能更好地展示知識(shí)發(fā)展路徑。當(dāng)然,在知識(shí)發(fā)現(xiàn)的過程中,聚類分析方法操作更為簡(jiǎn)單,亦可展示主要的知識(shí)內(nèi)容。
知識(shí)發(fā)現(xiàn)是管理科學(xué)研究的重要內(nèi)容,文本挖掘、聚類分析在知識(shí)發(fā)現(xiàn)過程中得到了較廣泛的應(yīng)用。本文在已有研究的基礎(chǔ)上,提出了一種基于時(shí)間拓展網(wǎng)絡(luò)的知識(shí)發(fā)展路徑識(shí)別方法,通過對(duì)相關(guān)文獻(xiàn)關(guān)鍵詞的提取、時(shí)間拓展網(wǎng)絡(luò)的構(gòu)建、最短路徑的識(shí)別、接近中心性計(jì)算及網(wǎng)絡(luò)中節(jié)點(diǎn)相對(duì)重要性的劃分等步驟,確定知識(shí)發(fā)展的主要路徑。
本文以信息管理領(lǐng)域的24個(gè)期刊在1979—2018年發(fā)表的文獻(xiàn)為樣本,并以10年為一個(gè)間距劃分為4個(gè)階段,進(jìn)行知識(shí)挖掘研究。數(shù)據(jù)的初步統(tǒng)計(jì)分析發(fā)現(xiàn),信息管理領(lǐng)域研究規(guī)模逐步增加,近十年來趨于穩(wěn)定,發(fā)文量的變化趨勢(shì)表明,改革開放40年來我國(guó)在信息管理領(lǐng)域知識(shí)創(chuàng)造中的作用顯著增強(qiáng),國(guó)際影響力顯著提升。在知識(shí)發(fā)現(xiàn)過程中,管理、信息系統(tǒng)、創(chuàng)新、設(shè)計(jì)與實(shí)施形成了信息管理領(lǐng)域知識(shí)發(fā)展的主要路徑,彼此之間又通過技術(shù)、模型與方法、擴(kuò)散、知識(shí)等內(nèi)容相關(guān)聯(lián),從而形成了信息管理研究的知識(shí)網(wǎng)絡(luò)。通過與聚類方法比較,本文提出的方法能夠更好地展示知識(shí)發(fā)展的主線,以及不同主線的重要性,但知識(shí)發(fā)現(xiàn)過程比聚類方法相對(duì)復(fù)雜。
本文的研究也存在一定的局限性。第一,基于時(shí)間拓展網(wǎng)絡(luò)的主要是關(guān)鍵詞網(wǎng)絡(luò),并未對(duì)文獻(xiàn)內(nèi)的知識(shí)元素進(jìn)行深入挖掘;第二,本文構(gòu)建的時(shí)間拓展網(wǎng)絡(luò)以最短知識(shí)發(fā)展路徑為基礎(chǔ),能夠準(zhǔn)確地篩選出知識(shí)發(fā)展的主線,但僅選取節(jié)點(diǎn)接近中心性作為路徑重要性的評(píng)價(jià)依據(jù),評(píng)價(jià)維度相對(duì)單一,可能會(huì)忽略其他的重要路徑,因此在后續(xù)研究中會(huì)進(jìn)一步補(bǔ)充其他評(píng)價(jià)性指標(biāo),完善知識(shí)發(fā)展路徑的確定過程;第三,本文選取的樣本僅為信息管理領(lǐng)域,其階段特征比較明顯,所以基于時(shí)間拓展網(wǎng)絡(luò)的方法能夠篩選出主要的知識(shí)發(fā)展路徑,在其他領(lǐng)域的有效性仍需進(jìn)一步驗(yàn)證。