滕曉燕 吳忠
摘? ?要:利用文獻分析法和VOSviewer可視化軟件梳理大數(shù)據(jù)技術(shù)在數(shù)字化轉(zhuǎn)型中的應(yīng)用及研究現(xiàn)狀。結(jié)果顯示,大數(shù)據(jù)技術(shù)在數(shù)字化轉(zhuǎn)型中的應(yīng)用處于發(fā)展階段,大規(guī)模應(yīng)用還面臨不少關(guān)鍵技術(shù)難題。數(shù)字化轉(zhuǎn)型是人工智能、大數(shù)據(jù)、云計算等新一代信息技術(shù)引發(fā)的系統(tǒng)性變革,大數(shù)據(jù)是數(shù)字化轉(zhuǎn)型的核心和數(shù)字經(jīng)濟的關(guān)鍵生產(chǎn)要素。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義并非在于獲取大量的數(shù)據(jù)信息,而在于對這些具有意義的數(shù)據(jù)進行專業(yè)化處理及場景應(yīng)用。
關(guān)鍵詞:數(shù)字化轉(zhuǎn)型;大數(shù)據(jù);技術(shù)應(yīng)用;VOSviewer可視化分析
中圖分類號:F124? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2024)05-0055-03
1980年,阿爾文·托夫勒在其著作《第三次浪潮》中首次引入了“大數(shù)據(jù)”的概念[1]。2010年,美國麥肯錫公司發(fā)布了首個涉及大數(shù)據(jù)的專題報告。隨后,該公司在2011年的報告中正式定義了“大數(shù)據(jù)”的概念。為了提高大數(shù)據(jù)和分析的認知,麥肯錫全球研究院于2011年5月發(fā)表了一篇名為“大數(shù)據(jù):創(chuàng)新,競爭和生產(chǎn)力的下一個前沿”的開創(chuàng)性論文,從而引起了人們的關(guān)注。2012年,維克托·邁爾—舍恩伯格出版了他的著作《大數(shù)據(jù)時代》,他被公認為大數(shù)據(jù)商業(yè)應(yīng)用的先驅(qū)。大數(shù)據(jù)為人類提供了一種全新的方式來認識和改造世界,因此被視為當代社會人類的新世界觀和方法論[2]。劉維貴從四個角度論證了2013年是“大數(shù)據(jù)元年”[3],之后這一概念迅速成為熱詞。根據(jù)谷歌公司的趨勢分析(它提高了人們對關(guān)鍵詞的搜索興趣),大數(shù)據(jù)和分析熱潮在2016年6月達到了頂峰。本研究分析了大數(shù)據(jù)技術(shù)的原理及特點,梳理大數(shù)據(jù)技術(shù)在數(shù)字化轉(zhuǎn)型中的應(yīng)用及研究現(xiàn)狀,探討該技術(shù)在數(shù)字化轉(zhuǎn)型進程中的發(fā)展前景。
一、大數(shù)據(jù)的技術(shù)原理和技術(shù)特點
(一)大數(shù)據(jù)的技術(shù)原理
目前關(guān)于大數(shù)據(jù)(Big data)的定義有多種說法。國際數(shù)據(jù)中心(IDC)將大數(shù)據(jù)定義為更經(jīng)濟地從高頻率的、大容量的、不同結(jié)構(gòu)和類型的數(shù)據(jù)中獲取價值而設(shè)計的新一代架構(gòu)和技術(shù)[4]。根據(jù)Gartner的觀點,大數(shù)據(jù)是指信息資產(chǎn)的一個類別,它具有海量、高增長率和多樣化的特點,并且需要新的處理模式才能發(fā)揮其更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力。而在2011年,麥肯錫全球研究所對大數(shù)據(jù)進行了定義,他們認為大數(shù)據(jù)是指一個數(shù)據(jù)集合,其規(guī)模遠遠超出了傳統(tǒng)數(shù)據(jù)庫軟件工具的能力范圍,主要表現(xiàn)在獲取、存儲、管理和分析方面。大數(shù)據(jù)具有四個主要特征,包括海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價值密度低[5]。后兩個定義得到的認可最多。
就目前對“大數(shù)據(jù)”概念的使用來看,在此我們限定研究作為技術(shù)工具、研究方法的大數(shù)據(jù),具體到本文,大數(shù)據(jù)是數(shù)字化轉(zhuǎn)型的利器。數(shù)字化轉(zhuǎn)型是信息技術(shù)引發(fā)的系統(tǒng)性變革,需要一套涵蓋“數(shù)據(jù)、技術(shù)、流程和組織”的系統(tǒng)性解決方案。組織可以利用設(shè)備設(shè)施、信息技術(shù)軟硬件、網(wǎng)絡(luò)和平臺等資源,充分利用云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能和區(qū)塊鏈等新一代信息技術(shù)的先進功能,有序推進技術(shù)的整合、融合和創(chuàng)新[6]。
(二)大數(shù)據(jù)的技術(shù)特點
2013年,IBM公司總結(jié)了大數(shù)據(jù)的技術(shù)特點為“5V”,包括數(shù)據(jù)量大(Volume)、數(shù)據(jù)速度快(Velocity)、數(shù)據(jù)類型多樣(Variety)、數(shù)據(jù)價值高(Value)和數(shù)據(jù)準確性(Veracity)。國際數(shù)據(jù)公司(IDC)用“4V+1C”的特征來定義大數(shù)據(jù):龐大數(shù)據(jù)集合(Volume)、極速數(shù)據(jù)更新(Velocity)、多樣數(shù)據(jù)種類(Variety)、難以估量的數(shù)據(jù)價值(Value)和精密分析處理(Complexity)[4]。以上都包含大數(shù)據(jù)的4個“V”:(1)大量。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長。(2)多樣。廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。(3)高速。數(shù)據(jù)持續(xù)涌現(xiàn),速度更快者占據(jù)優(yōu)勢。(4)價值。只要合理運用并確切、準確地分析數(shù)據(jù),將帶來豐厚的價值回報。這也是大數(shù)據(jù)的核心特征[3]。
(三)大數(shù)據(jù)技術(shù)的發(fā)展歷程
1997年10月,Michael Cox和David Ellsworth在美國計算機學會的數(shù)字圖書館中發(fā)表了一篇名為《為外存模型可視化而應(yīng)用控制程序請求頁面調(diào)度》的文章。這是該學會數(shù)字圖書館中首次使用“大數(shù)據(jù)”一詞的文章。1999年8月,Steve Bryson、David Kenwright、Michael Cox、David Ellsworth和Robert Hemenway發(fā)表了一篇名為《千兆字節(jié)數(shù)據(jù)集的實時性可視化探索》的文章,該文章是在《美國計算機協(xié)會通訊》上使用“大數(shù)據(jù)”一詞的第一篇文章。2001年,美國Gartner首次開發(fā)了大數(shù)據(jù)模型。2005年Hadoop項目誕生。2008年,著名的《自然》雜志推出了一期專門介紹“Big Data”概念的刊物。隨后,從2009年開始,“大數(shù)據(jù)”逐漸成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)中的熱門詞匯。2011年5月,麥肯錫的全球研究院發(fā)布了一份題為《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個新領(lǐng)域》的報告,這是專業(yè)機構(gòu)首次詳細介紹和展望大數(shù)據(jù)。為了推動我國大數(shù)據(jù)技術(shù)的研究和發(fā)展,2012年中國計算機學會啟動了CCF大數(shù)據(jù)專家委員會,并發(fā)布了《2013年中國大數(shù)據(jù)技術(shù)與產(chǎn)業(yè)發(fā)展白皮書》。此后,國內(nèi)外學術(shù)界和工業(yè)界都積極行動起來,廣泛開展大數(shù)據(jù)技術(shù)的研究和開發(fā)[7]??傊?,論文奠定大數(shù)據(jù)技術(shù)發(fā)展基石,業(yè)務(wù)催生大數(shù)據(jù)技術(shù)不斷突破,效率倒逼大數(shù)據(jù)技術(shù)迭代更新。
二、大數(shù)據(jù)在數(shù)字化轉(zhuǎn)型中的應(yīng)用
(一)大數(shù)據(jù)在國內(nèi)數(shù)字化轉(zhuǎn)型中的應(yīng)用分析
2013年以來,大數(shù)據(jù)成為各行各業(yè)的新的研究熱點之一。在中國知網(wǎng)CNKI數(shù)據(jù)庫,以“大數(shù)據(jù)+數(shù)字化轉(zhuǎn)型”為主題,檢索日期為2023年3月,時間限定為2012年1月至2022年3月,共檢索到相關(guān)研究文獻3 910篇,其中學術(shù)期刊3 161篇,占比80.84%;學位論文272篇,占比6.96%;其他會議、報刊等478篇,占比12.20%。從主題看,以數(shù)字化轉(zhuǎn)型、大數(shù)據(jù)為主題的文章為1 512篇,占比38.67%;數(shù)字經(jīng)濟、大數(shù)據(jù)時代、數(shù)字政府的文章為361篇,占比9.23%。其他文章為2 037篇,占比52.1%。從發(fā)表年份來看,2012年,學術(shù)界相關(guān)研究文獻僅有兩篇,此后的研究是爆發(fā)式增長,尤其是從數(shù)字化轉(zhuǎn)型的元年2017年開始。2017—2022年分別為154篇、284篇、494篇、994篇、1 620篇、198篇,相關(guān)研究已經(jīng)頗具規(guī)模。
(二)大數(shù)據(jù)在國外數(shù)字化轉(zhuǎn)型中的應(yīng)用分析
選定的同行評審數(shù)據(jù)庫是web of science核心合集,以“big data”為主題進行搜索。檢索日期:2022年3月,時間限定為1975年1月—2022年3月,檢索到69 074篇。以“big data”組合“digital transformation”,檢索到文獻509篇。從發(fā)表時間來看,2015年檢索到1篇相關(guān)研究文獻,2016—2022年,相關(guān)研究文獻分別是10篇、23篇、42篇、86篇、121篇、189篇、37篇。在國外,大數(shù)據(jù)的研究前五位的國家分別是德國(69篇),意大利(65篇),美國(61篇),英國(54篇),俄羅斯(34篇),中國(32篇)在國際排名第八。
三、大數(shù)據(jù)技術(shù)在數(shù)字化轉(zhuǎn)型領(lǐng)域的熱點
VOSviewer是一款基于JAVA的免費軟件,主要面向文獻數(shù)據(jù),適應(yīng)于一模無向網(wǎng)絡(luò)的分析,側(cè)重科學知識的可視化。通過Network visualization的主題共現(xiàn)發(fā)現(xiàn)研究熱點的結(jié)構(gòu)分布。Density visualization可用來快速觀察重要領(lǐng)域以及某一領(lǐng)域知識及研究密度情況。據(jù)此我們總結(jié)出目前大數(shù)據(jù)在數(shù)字化轉(zhuǎn)型中應(yīng)用的主要研究方向,具體如下:聚類#1:Wessel L.等人(2021)研究了數(shù)字化轉(zhuǎn)型和基于信息技術(shù)(it)的組織轉(zhuǎn)型的兩個區(qū)別;Zeki-Suac M.等人(2021)將大數(shù)據(jù)平臺和機器學習納入智能系統(tǒng),以管理公共部門的能源效率;Manfreda A.等人(2021)的研究側(cè)重于技術(shù)采用、對效益的認知、安全性、與移動性相關(guān)的效率和擔憂等。聚類#2:Llopis-Albert C.等人(2021)分析了數(shù)字化轉(zhuǎn)型對企業(yè)績效模型和不同參與者滿意度的影響;Abdel-Basset M. 等人(2021)以一個實證的案例分析實際COVID-19患者,并顯示了破壞性技術(shù)對COVID-19分析框架的重要性。聚類#3:Liu H.等人(2019)確定了數(shù)字化轉(zhuǎn)型的三個階段:信息數(shù)字化、流程數(shù)字化和業(yè)務(wù)數(shù)字化;Osterrieder P.等人(2020)找到智能工廠研究模型,包括八個不同主題視角;Aheleroff S等人(2020)認為物聯(lián)網(wǎng)(IoT)在降低成本、提高效率、質(zhì)量和實現(xiàn)面向數(shù)據(jù)的預(yù)測性維護服務(wù)方面的潛力等。聚類#4:Szalavetz A.(2018)研究發(fā)現(xiàn)先進制造技術(shù)AMT顯著提高了生產(chǎn)能力的所有組成部分;數(shù)字孿生等。聚類#5:Rijswijk K等人(2021)認為數(shù)字技術(shù)的設(shè)計和創(chuàng)造是成功實現(xiàn)社會—網(wǎng)絡(luò)—物理系統(tǒng)數(shù)字化轉(zhuǎn)型的條件;Manesh M.F.等人(2021)通過使用文獻綜述法,工業(yè)4.0中知識管理的知識結(jié)構(gòu)和發(fā)展趨勢;Ghobakhloo M.(2019)發(fā)現(xiàn)生產(chǎn)效率和商業(yè)模式創(chuàng)新等經(jīng)濟可持續(xù)性功能往往是工業(yè)4.0更直接的結(jié)果。聚類#6:Matarazzo M.等人(2021)發(fā)現(xiàn)數(shù)字工具有助于其商業(yè)模式的創(chuàng)新;Li H.等人(2021)研究發(fā)現(xiàn)數(shù)字技術(shù)促進了外部和內(nèi)部關(guān)系以及數(shù)字技術(shù)業(yè)務(wù)戰(zhàn)略協(xié)調(diào);Tronvoll B.等人(2020)發(fā)現(xiàn)制造商越來越多地尋求數(shù)字化來推動服務(wù)增長,Vaio A.D.(2021)等人認為數(shù)字創(chuàng)新可以通過優(yōu)化新知識來促進新的商業(yè)模式;Ciampi F.等人(2020)研究發(fā)現(xiàn)數(shù)字化轉(zhuǎn)型工具在長期內(nèi)有助于價值創(chuàng)造過程等。
四、討論(未來研究方向)
使用VOSviewer1.6.16版本對以上在WOS里采集到的數(shù)據(jù)做出關(guān)鍵詞標簽視圖。Overlay visualization可以分析領(lǐng)域內(nèi)研究趨勢的演變。2019年以前:云計算、數(shù)字創(chuàng)新、Dwivedi Y.K.等人(2020)認為,COVID-19流行病迫使許多組織進行重大變革,并使用技術(shù)來維持運營等。2019年1—5月:數(shù)字化制造、隱私、信息數(shù)字化等。2019年6—12月:機器學習、工業(yè)物聯(lián)網(wǎng)、大數(shù)據(jù)科學等。2020年1—5月:Sb A.等人(2018)確定了數(shù)字化轉(zhuǎn)型如何影響循環(huán)經(jīng)濟中優(yōu)化采購流程的意圖;Urbinati A.等人(2020)認為可以采用變革管理的理論視角來確定企業(yè)在開放式創(chuàng)新過程中實施數(shù)字技術(shù)所采取的組織和過程層面的管理行動,從而彌合這一差距等。2020年5—12月:企業(yè)績效、大數(shù)據(jù)分析、機器人科學(或技術(shù))等。2021年以后:Frank A.G.,等人(2019)從商業(yè)模式創(chuàng)新(BMI)的角度將服務(wù)化和工業(yè)4.0概念聯(lián)系起來;Frank A.G.等人(2019)工業(yè)4.0技術(shù)(前端技術(shù)和基礎(chǔ)技術(shù))在制造企業(yè)中的采用模式等。
五、結(jié)束語
本文首先介紹了大數(shù)據(jù)技術(shù)的背景、定義,技術(shù)特點和發(fā)展歷程。檢索了CNKI和WOS的數(shù)據(jù)庫里”大數(shù)據(jù)+數(shù)字化轉(zhuǎn)型”主題的相關(guān)文獻并梳理,通過可視化軟件VOSviewer1.6.16版本梳理出目前的主要研究領(lǐng)域,最后本文對”大數(shù)據(jù)+數(shù)字化轉(zhuǎn)型”主題的未來研究方向和科學問題進行了探討與總結(jié)。
參考文獻:
[1]? ?阿爾文·托夫勒.黃明堅,譯.第三次浪潮 未來三部曲[M].北京:中信出版社,2018.
[2]? ?維克托·邁爾-舍恩伯格,肯尼思·庫克耶.盛楊燕,周濤,譯.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013.
[3]? ?劉維貴.“大數(shù)據(jù)”研究綜述[J].辦公自動化,2014(1):27-30.
[4]? ?Gantz J,Reinsel D. Extracting value from chaos[J].IDC iView, 2011: 1-12.
[5]? ?Manyika J,Chui M,Brown B,et al.Big data:the next frontier for innovation,competition,and productivity[R].McKinsey Global Institute,2011.
[6]? ?中關(guān)村信息技術(shù)和實體經(jīng)濟融合發(fā)展聯(lián)盟.數(shù)字化轉(zhuǎn)型 參考架構(gòu) T/AIITRE 10001-2020[M].北京:清華大學出版社,2020.
[7]? ?陳穎.大數(shù)據(jù)發(fā)展歷程綜述[J].當代經(jīng)濟,2015(8):13-15.
[責任編輯? ?文? ?欣]