国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

不同子領域間的技術魅力研究:以大數據技術為例

2017-06-27 19:18陳能美彭建文趙清俊
新世紀圖書館 2017年5期
關鍵詞:大數據

陳能美+彭建文+趙清俊

摘 要 論文以WoS數據庫的引文數據為基礎,根據大數據技術不同子領域間論文的相互引用情況構建了不同子領域的技術魅力指數,從而分析大數據技術在不同領域間的技術交互作用、擴散態(tài)勢。研究發(fā)現大數據技術在Computer Science領域最受歡迎,其次為Engineering領域,在Telecommunications等領域也比較受歡迎。

關鍵詞 大數據 技術魅力指數 技術擴散

分類號 G250.7

DOI 10.16810/j.cnki.1672-514X.2017.05.×××

Abstract Based on the citation data of WoS database, this paper constructs technology charm indexes among different subfield according to the mutual citation relations among different subfield in the big data research field, so as to analyze the interaction relation, and the technology diffusion situation among these subfield. It finds that computer science is the most popular field, followed by engineering, and other fields like telecommunications are relatively popular.

Keywords Big data. Technology charm indexes. Technology diffusion.

引 言

2012年2月《紐約時報》刊登的一篇專欄中稱,“大數據”時代已經降臨,商業(yè)、經濟等眾多領域的決策將日益依賴數據和分析[1]。在2013年,眾多國家先后出臺激勵政策促進本國大數據處理技術的研發(fā),進而掀起了大數據研發(fā)的熱潮[2],各國搶抓戰(zhàn)略布局,不斷加大扶持力度,全球大數據市場規(guī)模保持著高速增長的態(tài)勢。2015年谷歌的開源TensorFlow人工智能項目,促進了大數據技術、人工智能領域的發(fā)展,隨著開源技術的發(fā)展,企業(yè)進軍大數據領域的門檻逐步降低,加之數據量的規(guī)?;鲩L和應用場景的越發(fā)豐富,越來越多的企業(yè)加入了大數據掘金浪潮,創(chuàng)業(yè)企業(yè)不斷涌現,互聯網巨頭和傳統(tǒng)IT廠商加速投資并購以爭奪市場領袖地位。對于整個大數據行業(yè)而言,經過數年的發(fā)展,在工業(yè)應用和學術理論價值等方面已日趨完善。大數據技術進入了從概念炒作向實際應用的關鍵轉折期,面向不同行業(yè)的特色需求和用戶的個性化需求,企業(yè)加快了技術、產品和應用模型的迭代速度,大數據市場競爭愈加激烈;對于學術理論方面,這些年相關的理論研究文獻也成指數增長。大量的理論研究文獻的發(fā)表,為大數據技術的實際應用提供了科學的依據,推動著大數據技術的進步與完善。而今,大數據技術的發(fā)展和應用也呈現出跨學科交叉發(fā)展的特點,研究大數據技術在不同領域之間相互交叉的現狀,能為大數據技術發(fā)展提供新的思路。大量的文獻表明,當前研究大數據技術領域常見的主題詞主要集中在big data(大數據)、big science(大科學)、cloud computing(云計算)、cyberinfrastructure(基礎構架)、computational science(計算科學)、Hadoop、MapReduce(分布式計算)、NoSQL(數據庫)等。

廣大的研究人員做了大量的大數據技術研究工作。趙蓉英等人從計量學的視角對我國人文社會科學領域的大數據研究熱點進行了挖掘與分析,證實了從計量學的角度去研究大數據研究熱點的可行性[3],李恬研究了圖書館大數據,給出了數據挖掘、數據分析的重要性[4]。隨著大數據技術應用的深入,關于大數據技術的研究出現了各大領域學科的交叉性、研究領域的廣泛性等新特點。了解當前大數據技術的研究進展以及各學科的交叉分布特性,探討不同子領域間的技術魅力,將對大數據技術的發(fā)展起重要作用。

2 數據來源與研究方法

2.1 數學模型

2.2 數據來源與檢索規(guī)則

在引文分析研究領域,數據質量和數量是研究分析的基礎,它直接影響著研究內容的科學性和結果的可信度,選擇合適的數據源和檢索方式對分析起著至關重要的作用[5-8]。本文選擇了美國科學情報研究所出版的國際權威引文數據庫Web of Science(WoS)作為數據源,經過多次檢索試驗和采用權威作者、機構進行驗全、準確率驗證,最終確定的檢索方式為:TS=("big data" OR "big science" OR "cloud computing" OR "cyberinfrastructure" OR "computational science"OR"Hadoop" OR "MapReduce" OR "NoSQL"),文獻語言類別為英語,時間跨度從1995-2015年,文獻檢索結果總計21145篇。在此結果下分不同的領域對一次檢索結果進行多次檢索分析,結合WoS數據庫中Meeting(會議論文)、Article(文章)、Editorial Material(文獻類型)、Review(綜述)、Meeting(會議)、Abstract(摘要)等類別的不同研究領域作為研究分析的數據來源。

2.3 研究方法

荷蘭萊頓大學的Moed教授[8]曾指出,只有當文獻計量學指標具備了足夠先進的技術水平,且人們對文獻計量學指標的自身缺陷有了足夠的認識,并將這些指標與其他更多的定性評價信息相結合,文獻計量學指標才能成為科研績效評價的有效工具,而學科間發(fā)展具有相互的交叉性、科學家研究行為的社會性、學科發(fā)展所處的階段性等特點[9,10]。李江等人采用文獻計量學的方法對國內外文獻計量學者的學術偏好進行了比較研究[10],本文為了更好地研究大數據技術文獻在不同領域相互引用的情況,并描述不同子領域間的技術魅力分布,在WoS數據庫中采用檢索式為TS=("big data" OR "big science" OR "cloud computing" OR "cyberinfrastructure" OR "computational science" OR "Hadoop" OR "MapReduce" OR "NoSQL")的方式進行檢索,選擇Meeting(會議論文)和Article(文章)兩類級別中關于大數據技術的前5個研究方向文獻作為研究對象。

3 結果與分析

3.1 總體類別分布情況

用本文的檢索方式檢索出21145篇文獻,主要文獻的具體分布情況如下:

根據上表1和圖1中的數據顯示,在WoS數據庫中20年內關于大數據的研究成果中Meeting(會議論文)數量為12510篇,Article(文章)數量為7316,這兩類的文獻總數19826篇。為了使研究的數據源具有科學性,選擇相應領域所占總文獻比率較大的類別作為研究對象,Meeting(會議論文)和Article(文章)兩類分別占據大數據技術相關文獻的59.17%和34.61%,于是將研究的文獻類型設定Meeting(會議論文)和Article(文章)兩類。

在這兩大類文獻中,主要取排名前五的類別,具體情況如表2所示。分別在這五大類別中檢索主題“TS=("big data" OR "big science" OR "cloud computing" OR "cyberinfrastructure" OR "computational science" OR "Hadoop" OR "MapReduce" OR "NoSQL")”,然后統(tǒng)計各類別下研究文獻的分布情況,并把這些數據作為研究對象,探討大數據技術不同領域互引研究現狀。

按照檢索式進行條件檢索并去除自引以后,Meeting(會議論文)和Article(文章)主要的研究領域分布為Business Economics(商業(yè)經濟學)、Computer Science(計算機科學)、Engineering(工程)、Mathematics(數學)、Telecommunications(電信學),其具體情況如圖2所示。

3.2 技術受歡迎指數

根據上文所述的方法對WoS數據庫中記錄以上主題詞的文獻進行檢索查詢,并除去自引的施引文獻,其主要的結果如下表2和表3所示:

從Meeting(會議論文)方式收錄的大數據技術的文獻分布可以看出:大數據技術的應用主要集中在Computer Science(計算機科學)、Telecommunications(電信學)、Engineering(工程)三大研究方向,其余研究領域的大數據技術受歡迎指數很?。欢鳤rticle(文章)方式收錄的大數據技術的應用主要分布在Mathematics(數學)、Computer Science(計算機科學)、Engineering(工程)、Telecommunications(電信學)等研究方向。對于兩種方式收錄的文獻情況的比較,如圖3所示。

具體而言,從以Meeting(會議論文)方式發(fā)表的文獻來看,大數據受歡迎的領域排名為Computer Science(計算機科學)>Engineering(工程)> Telecommunications(電信學)>Mathematics(數學)> Business Economics(企業(yè)經濟學)。從以Article(文章)方式發(fā)表的文獻來看,大數據受歡迎的領域排名為Computer Science(計算機科學)>Mathematics(數學)>Engineering(工程)>Telecommunications(電信學) >Business Economics(企業(yè)經濟學)。

本文對Meeting(會議論文)和Article(文章)方式發(fā)表的文獻情況進行了比較,從圖3中可以看出:以Article(文章)方式發(fā)表的大數據技術的文獻在各個領域中都比以Meeting(會議論文)方式發(fā)表的文獻受歡迎,而且在Mathematics(數學)領域,Article(文章)方式發(fā)表的文獻比Meeting(會議論文)方式發(fā)表的文獻受歡迎指數要多出數倍。對于大數據技術的理論方面的文獻則集中以Article方式進行發(fā)表。

為了更深入地探究大數據技術相關研究方向的分布情況,本文選取表2和表3的五大類作為研究的基本對象,去除自引后進行統(tǒng)計分析。其中,Business Economics(企業(yè)經濟學)領域的文獻,主要應用于Business Economics(企業(yè)經濟學)、Computer Science(計算機科學)、Engineering(工程)、Information Science Library Science(圖書館情報科學)等研究方向,在這些研究方向中,以Article(文章)方式發(fā)表的文獻明顯比以Meeting(會議論文)方式發(fā)表的文獻受歡迎,20年間引用Business Economics(企業(yè)經濟學)領域文獻最多的為Computer Science(計算機科學)方向,且大量的文獻是以Article(文章)方式發(fā)表,如圖4所示。

Business Economics(企業(yè)經濟學)研究領域的文獻,主要在其他7大研究領域比較受歡迎,這些研究領域中最受歡迎的是Computer Science(計算機科學)領域,占了總量的54.34%,其次是Engineering(工程)領域,占了總量的18.77%??梢?,Business Economics(企業(yè)經濟學)領域的大數據技術在Computer Science(計算機科學)領域很受歡迎。

圖5中,展示了當前以Article(文章)和Meeting(會議論文)收錄的Computer Science(計算機科學)領域大數據研究在其他領域受歡迎的情況,上圖中該領域的文獻在Computer Science(計算機科學)、Engineerings(工程)、Automation Control Systems(自動化控制系統(tǒng))、Telecommunications(電信學)、Mathematics(數學)、Genetics Heredity(遺傳學)等研究方向很受歡迎,在這些領域中文獻主要以Meeting(會議論文)方式發(fā)表,而當前以Article(文章)方式發(fā)表的文獻中,最受歡迎的是Engineerings(工程)領域,高達1509篇。Computer Science(計算機科學)領域中應用于Engineerings(工程)領域的文獻占了全部引用的44.15%,其次是Computer Science(計算機科學)領域,占了全部引用的34.19%??梢?,Computer Science(計算機科學)領域的文獻在Engineerings(工程)領域中很受歡迎。

圖6中,展示了當前以Article(文章)和Meeting(會議論文)收錄的Engineering(工程)領域大數據研究在其他領域受歡迎的情況,上圖中該領域的文獻被引用到了Automation Control Systems(自動化控制系統(tǒng))、Computer Science(計算機科學)、Engineerings(工程)、Telecommunications(電信學)、Mathematics(數學)、Environmental Sciences Ecology(生態(tài)環(huán)境科學)等研究方向和相關領域,在這些領域中大數據技術文獻主要以Meeting(會議論文)方式發(fā)表,而當前以Article(文章)發(fā)表的大數據技術相關文獻中,Engineering(工程)領域比重最大。該領域被應用于Computer Science(計算機科學)領域的文獻占了全部引用的66.33%,其次是Engineering(工程)領域,占了全部引用的16.92%。可見,Engineering(工程)領域的大數據技術文獻在Computer Science(計算機科學)領域比較受歡迎。

圖7中,展示了當前以Article(文章)和Meeting(會議論文)收錄的Mathematics(數學)領域大數據技術在其他領域受歡迎的情況,上圖中該領域的大數據技術相關的文獻在Biochemistry Molecular Biology(生物化學及分子生物學)、Computer Science(計算機科學)、Environmental Sciences Ecology(生態(tài)環(huán)境科學)、Evolutionary Biology(進化生物學)、Genetics Heredity(基因遺傳)、Engineerings(工程)、Mathematics(數學)等領域比較受歡迎,這些領域中的文獻大多以Article(文章)方式發(fā)表,而當前以Article(文章)發(fā)表的文獻在Computer Science(計算機科學)領域最受歡迎,有295篇。該領域中被應用于Computer Science(計算機科學)領域的文獻占了全部引用的80.16%,其次是Biochemistry Molecular Biology(生物化學及分子生物學)領域,占了全部引用的11.14%??梢?,Mathematics(數學)領域的大數據技術文獻在Computer Science(計算機科學)領域很受歡迎。

圖8中,展示了當前以Article(文章)和Meeting(會議論文)收錄的Telecommunications(電信學)領域大數據技術文獻在其他領域受歡迎情況,上圖中該領域的文獻在Computer Science(計算機科學)、Engineerings(工程)、Mathematics(數學)、Science Technology Other Topics(科學技術其他主題)、Telecommunications(電信學)、Optics(光學)、Health Care Sciences Services(衛(wèi)生保健科學服務)等研究方向和相關領域比較受歡迎,在這些領域中文獻大多以Article方式發(fā)表,而當前以Article(文章)形式發(fā)表的文獻中,最受歡迎的是Telecommunications(電信學)領域,有955篇。文獻總體分布中,Computer Science(計算機科學)領域占到該方向總文獻的41.7%,其次為Telecommunications(電信學)領域,占了該領域總文獻的37.14%,可見,Telecommunications(電信學)領域的文獻在Computer Science(計算機科學)領域非常受歡迎。

3.3 技術魅力指數

上文對各個領域的單一引用情況進行了總體的概述和分析,得知大數據技術的文獻互引主要集中在Business Economics(企業(yè)經濟學)、Computer Science(計算機科學)、Engineering(工程)、Mathematics(數學)、Telecommunications(電信學)這五大研究領域,為了更加具體地量化大數據技術在各領域的受歡迎情況,現對以上結果深入量化建模分析。具體的計算根據式(2)進行,然后按照式(3)給出的方式進行評價。

3.3.1 Meeting類別中各領域的技術魅力指數

通過式(2)中給出的定義并結合WoS中的數據,對以Meeting(會議論文)方式發(fā)表的文獻進行分析,計算各領域中技術互引魅力指數,具體如表4所示。

上表中給出了Computer Science(計算機科學)、Engineering(工程)、Mathematics(數學)、Telecommunications(電信學)領域相互受歡迎情況的評價指標,在這些領域中Computer Science(計算機科學)對Engineering(工程)領域的f值為0.441、Computer Science(計算機科學)對Mathematics(數學)領域的f值為1.614、Computer Science(計算機科學)對Telecommunications(電信學)領域的f值為0.535等。其中,Telecommunications(電信學)對Engineering(工程)領域的互引約等于1,即這兩個領域的互引偏好相似,體現出這兩個領域技術魅力相當;而Engineering(工程)對Mathematics(數學)領域的互引f值為4.167,即Mathematics(數學)方向的文獻在Engineering(工程)領域受歡迎情況是Engineering(工程)領域在Mathematics(數學)領域受歡迎情況的4倍左右,Engineering(工程)對Mathematics(數學)領域的技術魅力單向偏好尤為嚴重。

綜上,在過去20年關于大數據技術的文獻中,以Meeting(會議論文)方式發(fā)表的文獻在Engineering(工程)和Telecommunications(電信學)領域技術魅力相當;而Engineering(工程)和Mathematics(數學)領域中,Engineering(工程)領域的技術對Mathematics(數學)表現出技術魅力單向偏好;Computer Science(計算機科學)和Mathematics(數學)、Computer Science(計算機科學)和Telecommunications(電信學)領域f值約等于1,表現出技術魅力相當的特性。

3.3.2 Article類別中各領域的技術魅力指數

按照上述的方法對以Article(文章)方式發(fā)表的文獻進行分析,將三大領域的相互受歡迎情況概括為以下幾類,如表5所示。

上表中體現了以Article(文章)形式發(fā)表的文獻在常見領域的相互受歡迎f值情況,主要包含了Computer Science(計算機科學)、Engineering(工程)、Telecommunications(電信學)三大領域。其中Computer Science(計算機科學)領域對Telecommunications(電信學)領域、Engineering(工程)領域對Telecommunications(電信學)領域、Telecommunications(電信學)領域對Computer Science(計算機科學)領域、Telecommunications(電信學)領域對Engineering(工程)領域的f值分別為1.018、0.985、0.983、1.016,都約等于1,表現出這些領域的技術魅力相當的特性。

綜上,對于Article(文章)形式發(fā)表的文獻,在Computer Science(計算機科學)、Engineering(工程)、Telecommunications(電信學)領域的技術魅力分布差異性較小。

3.3.3 總體領域中的技術魅力指數

為了更加全面地體現大數據技術在WoS數據庫中的研究現狀,全面地解析大數據技術在各領域中的技術魅力分布特性,現將Article(文章)方式和Meeting(會議論文)方式發(fā)表的文獻按受歡迎領域進行統(tǒng)計,然后將同一領域的文獻進行求和并按照上述式(2)進行計算,得到相應的領域互引情況分布,具體情況如表6所示。

表6中描述了大數據技術文獻在Computer Science(計算機科學)、Engineering(工程)、Mathematics(數學)、Telecommunications(電信學)這四大研究領域中的相互受歡迎情況,其中Computer Science(計算機科學)對Engineering(工程)的f值為0.823;Computer Science(計算機科學)對Telecommunications(電信學)的f值為0.737;Engineering(工程)對Computer Science(計算機科學)的f值為1.215;Telecommunications(電信學)對Computer Science(計算機科學)的f值為1.357??傮w而言,在上述研究領域的大數據技術呈現出技術魅力相當的分布特性,不存在明顯的技術魅力偏愛分布,其f值都在1附近。

在這些領域中,Computer Science(計算機科學)和Engineering(工程)、Telecommunications(電信學)和Computer Science(計算機科學)、Telecommunications(電信學)和Engineering(工程)技術魅力相當,其f值約等于1;而Engineering(工程)和Mathematics(數學)、Mathematics(數學)和Computer Science(計算機科學)相互受歡迎指數相差較大,表明這些領域中技術魅力單向偏好較為嚴重。

4 結語

本文使用統(tǒng)計分析的方法對WoS數據庫中關于大數據技術的文獻進行了統(tǒng)計分析,并討論了當前大數據技術在不同領域的相互受歡迎現狀。通過主題檢索的方式對大數據技術的文獻進行了查詢統(tǒng)計,以Article(文章)和Meeting(會議論文)形式發(fā)表的大數據技術相關文獻占了全部文獻的59.17%和34.61%。分析了以Article(文章)和Meeting(會議論文)形式發(fā)行的文獻,包含了Mathematics(數學)、Computer Science(計算機科學)、Engineering(工程)、Telecommunications(電信學)等領域,這些領域中文獻的相互引用主要集中于Business Economics(企業(yè)經濟學)、Computer Science(計算機科學)、Engineering(工程)、Mathematics(數學)、Telecommunications(電信學)這五大研究領域。

這些領域間的技術魅力分布,呈現出以下幾方面的特點:

(1)以Meeting(會議論文)方式發(fā)表的文獻中,Engineering(工程)和Telecommunications(電信學)領域互引偏好相似,技術魅力相當;而Engineering(工程)和Mathematics(數學)領域中,更加偏好于Engineering(工程)領域的Mathematics(數學)方向,體現出了Engineering(工程)、Mathematics(數學)兩大領域的技術魅力呈單向偏好的特性;Computer Science(計算機科學)和Mathematics(數學)、Computer Science(計算機科學)和Telecommunications(電信學)領域互引偏好相似,其f值約等于1,對應領域的技術魅力相當。

(2)以Article(文章)方式發(fā)表的文獻中,Computer Science(計算機科學)、Engineering(工程)、Telecommunications(電信學)這三大領域的受歡迎程度接近。其中,Telecommunications(電信學)領域、Telecommunications(電信學)領域和Engineering(工程)領域的f值都約等于1,各領域的互引情況分布差異性較小,這些領域的技術魅力基本相當。

(3)就整個行業(yè)文獻總體情況而言,Computer Science(計算機科學)和Engineering(工程)、Computer Science(計算機科學)和Telecommunications(電信學)、Telecommunications(電信學)和Computer Science(計算機科學)、Telecommunications(電信學)和Engineering(工程)互引偏好相似,其f值約等于1,這幾個子領域之間的技術魅力相當;而Engineering(工程)和Mathematics(數學)、Mathematics(數學)和Computer Science(計算機科學)互引偏好相差較大,技術魅力單向偏好較為嚴重。

5 政策及建議

根據上文的分析可以得出,在整個大數據技術的產業(yè)鏈中,科學領域與工程領域的相關研究較為熱門,而且這兩個領域的技術擴散較為廣泛。在后期的科學研究中,應繼續(xù)深化該領域之間的相互研究應用,為此在整個大數據技術的研究中,應該把基礎理論與工程實際問題相結合,做到將基礎科學轉化為社會生產力,去實現社會價值,推進大數據技術的實際應用創(chuàng)新。大數據技術中的基礎科學領域與通信等互引較為薄弱,而大數據技術的實際應用往往是跨學科的交叉應用,多種領域之間相互借鑒、相互引用才能更好地推進大數據技術的進步,最終實現大數據技術行業(yè)的進步,更好地為社會發(fā)展所服務。對大數據技術開發(fā)利用的同時,應該充分尊重人們的隱私,這方面的相關立法有待進一步完善,從而實現大數據行業(yè)的健康發(fā)展。

參考文獻:

[ 1 ] LOHR S. The age of big data[N].The New York Times,2012-2-11(3).

[ 2 ] 牛帥.發(fā)達國家大數據戰(zhàn)略及其影響[J].國際研究參考,2014(9):29-33.

[ 3 ] 趙蓉英,魏緒秋.計量視角下的我國人文社會科學領域大數據研究熱點挖掘與分析[J].情報雜志,2016,35(2):93-98.

[ 4 ] 溫芳芳.2008-2013國外信息檢索研究知識圖譜分析[J].圖書館理論與實踐,2015(1):55-58.

[ 5 ] ZHAO Q, GUAN J. Love dynamics between scienceand technology:some evidences in nanoscience and nanotechnology[J].Scientometrics,2013,94(1):113-132.

[ 6 ] 官建成,唐崇敏.我國分學科科學計量評價及國際比較[J].科學學研究,2007,24(A02):515-522.

[ 7 ] 王炳立.基于科學計量學的國際大數據研究可視化分析[J].情報雜志,2015,34(2):131-136.

[ 8 ] 高霞,官建成.非專利引文衍生的科學期刊共被引網絡分析[J].科學學研究,2010,28(5):675-680.

[ 9 ] GUAN J, ZHAO Q. The impact of university-industrycollaboration networks on innovation in nanobiopharm-aceuticals[J].Technological Forecasting and Social Ch-ange,2013,80(7):1271-1286.

[10] 方紅玲.2013年SSCI收錄圖書情報學期刊的文獻計量學分析[J].情報科學,2016,34(3):107-111.

[11] 李江,蔡小靜,李萍等.國內外文獻計量學者的學術偏好比較[J].情報科學,2016,34(2):127-132.

[12] 李恬.大數據理念與圖書館大數據[J].新世紀圖書館,2014(6):24-27.

陳能美 重慶師范大學數學科學學院碩士研究生。重慶,401331。

彭建文 重慶師范大學數學科學學院教授、博士生導師。重慶,401331。

趙清俊 重慶師范大學經濟與管理學院博士、副教授、碩士生導師。重慶,401331。

(收稿日期:2016-08-02 編校:劉忠斌)

猜你喜歡
大數據
基于在線教育的大數據研究
“互聯網+”農產品物流業(yè)的大數據策略研究
大數據時代新聞的新變化探究
淺談大數據在出版業(yè)的應用
“互聯網+”對傳統(tǒng)圖書出版的影響和推動作用
大數據環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉型思路
基于大數據背景下的智慧城市建設研究
數據+輿情:南方報業(yè)創(chuàng)新轉型提高服務能力的探索