国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究的科學(xué)計(jì)量學(xué)分析

2020-07-23 04:23宋英華李墨瀟雷生姣庫(kù)任俊夏亞瓊
食品科學(xué) 2020年13期
關(guān)鍵詞:交叉論文領(lǐng)域

邵 航,宋英華,*,李墨瀟,*,邵 偉,雷生姣,庫(kù)任俊,夏亞瓊

(1.武漢理工大學(xué)中國(guó)應(yīng)急管理研究中心,湖北 武漢 430070;2.安全預(yù)警與應(yīng)急聯(lián)動(dòng)技術(shù)湖北省協(xié)同創(chuàng)新中心,湖北 武漢 430070;3.武漢理工大學(xué)安全科學(xué)與應(yīng)急管理學(xué)院,湖北 武漢 430070;4.三峽大學(xué)生物與制藥學(xué)院,湖北 宜昌 443001)

食品安全關(guān)系人民群眾身體健康和生命安全,關(guān)系中華民族未來(lái)[1]。以食品安全突發(fā)事件為研究對(duì)象,深入開展演化機(jī)理、檢測(cè)技術(shù)和預(yù)警方法等方面的研究,能夠幫助政府及時(shí)采取有利的措施,預(yù)防食品安全問(wèn)題的再次發(fā)生,已經(jīng)得到黨和國(guó)家的高度重視[2]。

數(shù)據(jù)科學(xué)是基于傳統(tǒng)的數(shù)學(xué)、統(tǒng)計(jì)學(xué)的理論和方法,運(yùn)用計(jì)算機(jī)技術(shù)進(jìn)行大規(guī)模數(shù)據(jù)計(jì)算、分析和應(yīng)用的一門學(xué)科[3]。它是一門既古老又年輕的科學(xué),其淵源可以追溯至1749年起源于瑞典的統(tǒng)計(jì)學(xué)[4];隨著計(jì)算機(jī)技術(shù)的發(fā)展與大數(shù)據(jù)概念的興起,數(shù)據(jù)科學(xué)又逐漸成為大數(shù)據(jù)技術(shù)的代名詞。大數(shù)據(jù)時(shí)代的到來(lái)使得數(shù)據(jù)科學(xué)逐步演變成了一門“立足現(xiàn)代、面向未來(lái)”的顯學(xué);而公共安全領(lǐng)域?qū)Υ髷?shù)據(jù)挖掘與利用的迫切需求加劇了全社會(huì)對(duì)數(shù)據(jù)科學(xué)人才的需要;同時(shí),這種社會(huì)需求導(dǎo)向又反向顯著地提升了數(shù)據(jù)科學(xué)在公共安全各個(gè)子領(lǐng)域中的學(xué)科地位。

隨著社會(huì)信息化程度的提升與信息儲(chǔ)存方式的變革,食品生產(chǎn)與消費(fèi)的各個(gè)環(huán)節(jié)已經(jīng)積累了海量異構(gòu)的食品安全歷史數(shù)據(jù),且仍在源源不斷地產(chǎn)生著新的食品安全大數(shù)據(jù)。在大數(shù)據(jù)時(shí)代的背景下,大數(shù)據(jù)技術(shù)方法相比起傳統(tǒng)的研究方法,在處理海量的食品安全數(shù)據(jù)時(shí)顯得更加對(duì)口和有效。

已發(fā)表的科技論文是經(jīng)過(guò)同行評(píng)議,且其主題被認(rèn)為是隸屬于該領(lǐng)域的論文[5]。因此,從已發(fā)表的學(xué)術(shù)論文中識(shí)別并探測(cè)某一特定研究主題是被實(shí)踐證明的可靠方法[5]?;诖朔N假設(shè),本文選取中國(guó)知網(wǎng)(China National Knowledge Infrastructure,CNKI)數(shù)據(jù)庫(kù)中食品安全研究與數(shù)據(jù)科學(xué)存在交集的科技文獻(xiàn)作為我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究的樣本數(shù)據(jù)集,運(yùn)用科學(xué)計(jì)量學(xué)理論,主要使用科技文本挖掘軟件Citespace對(duì)文獻(xiàn)數(shù)據(jù)進(jìn)行深度挖掘。

本文將從所收集的文獻(xiàn)數(shù)據(jù)的特征出發(fā),開展本交叉研究的研究主體分析與研究主題分析,以期從文獻(xiàn)數(shù)據(jù)空間中發(fā)現(xiàn)本領(lǐng)域重要的研究機(jī)構(gòu)、期刊和作者,并進(jìn)一步地發(fā)現(xiàn)本領(lǐng)域當(dāng)前的研究熱點(diǎn)與未來(lái)的發(fā)展趨勢(shì)。

1 數(shù)據(jù)與方法

1.1 數(shù)據(jù)采集與預(yù)處理

本文所收集的數(shù)據(jù)全部來(lái)源于CNKI。考慮到文獻(xiàn)題錄數(shù)據(jù)的更新會(huì)有遲滯,本研究以2019年5月20日0時(shí)為截止時(shí)間,以“主題 = 食品安全 AND 數(shù)據(jù)”為檢索條件,收集了1996年1月至2019年5月跨度約23 年的3 375 條文獻(xiàn)數(shù)據(jù),文獻(xiàn)類型包括期刊論文、學(xué)位論文、會(huì)議論文和報(bào)紙圖書等。文獻(xiàn)數(shù)據(jù)以Refworks格式(包含文獻(xiàn)類型、作者、作者單位、標(biāo)題等主要科學(xué)計(jì)量字段)存儲(chǔ)為UTF-8編碼的.txt文件到本地路徑備用。同時(shí),使用Python爬取檢索頁(yè)面分年數(shù)據(jù)的完整信息,并寫入Excel文件。

1.2 科學(xué)計(jì)量學(xué)方法與科技文本挖掘軟件

科學(xué)計(jì)量學(xué)是運(yùn)用數(shù)學(xué)等定量方法對(duì)科學(xué)的整體及其各個(gè)方面進(jìn)行定量化研究,以解釋科學(xué)發(fā)展規(guī)律的一門新興學(xué)科[6]。傳統(tǒng)的科學(xué)計(jì)量學(xué)研究方法主要有出版物統(tǒng)計(jì)、著者統(tǒng)計(jì)、引文分析、詞頻分析等[7]。

Citespace是由美國(guó)德雷塞爾大學(xué)信息科學(xué)與技術(shù)學(xué)院的Chen Chaomei教授應(yīng)用Java語(yǔ)言開發(fā)的一款信息可視化軟件[8],本研究使用的是該軟件的5.1.R8.SE.版本。它主要基于共引分析理論和尋徑網(wǎng)絡(luò)算法等,對(duì)特定領(lǐng)域文獻(xiàn)(集合)進(jìn)行計(jì)量,以探尋出科學(xué)領(lǐng)域演化的關(guān)鍵路徑及知識(shí)轉(zhuǎn)折點(diǎn),并通過(guò)一系列可視化圖譜的繪制,來(lái)形成對(duì)科學(xué)演化潛在動(dòng)力機(jī)制的分析和學(xué)科發(fā)展前沿的探測(cè)[9]。

2 結(jié)果與分析

2.1 交叉研究的研究主體分析

2.1.1 文獻(xiàn)年代分布

對(duì)數(shù)據(jù)集進(jìn)行分類檢索可知:其中期刊論文記錄1 604 條,博、碩士學(xué)位論文記錄1 599 條,會(huì)議論文記錄71 條,這3 類文獻(xiàn)體例占總體文獻(xiàn)的97.01%。進(jìn)一步地對(duì)期刊和博、碩士學(xué)位論文的年累計(jì)量進(jìn)行多項(xiàng)式回歸預(yù)測(cè),發(fā)現(xiàn)當(dāng)多項(xiàng)式階數(shù)由2階增加到4階時(shí),預(yù)測(cè)精度不再隨著方程階數(shù)的增加而增加,故采用4階多項(xiàng)式預(yù)測(cè)。

文獻(xiàn)累計(jì)量的分年統(tǒng)計(jì)及回歸預(yù)測(cè)見圖1,期刊論文、學(xué)位論文累計(jì)數(shù)量預(yù)測(cè)曲線的R2均達(dá)到99%以上,證明回歸模型的擬合優(yōu)度很高。曲線數(shù)值的增長(zhǎng)具備某種指數(shù)型趨勢(shì),而此處依據(jù)泰勒公式原理,以多項(xiàng)式函數(shù)來(lái)近似計(jì)算指數(shù)函數(shù)值,通過(guò)設(shè)置預(yù)測(cè)點(diǎn),可以推測(cè):本領(lǐng)域期刊論文總量有望在2019年達(dá)到1 940 篇左右,在2020年達(dá)到2 340 篇左右;本領(lǐng)域?qū)W位論文總量有望在2019年達(dá)到1 810 篇左右,在2020年達(dá)到1 950 篇左右。在2007年以前,期刊論文的累計(jì)量高于學(xué)位論文的累計(jì)量,這表明1996—2007年交叉研究還處于討論與積累的萌芽階段,尚未形成較完備的學(xué)科形態(tài);2007—2019年學(xué)位論文的累計(jì)量高于期刊論文的累計(jì)量,這表明從事交叉研究的人越來(lái)越多,交叉研究的熱度在不斷提高,社會(huì)的重視程度也在不斷提高;預(yù)計(jì)2019年會(huì)成為期刊論文數(shù)量第二次超過(guò)學(xué)位論文數(shù)量的轉(zhuǎn)折點(diǎn),這將標(biāo)志著交叉研究會(huì)逐步形成新的學(xué)科增長(zhǎng)點(diǎn),推動(dòng)新一階段的交叉研究發(fā)展。

圖1 我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究的文獻(xiàn)累計(jì)量分年統(tǒng)計(jì)與預(yù)測(cè)Fig. 1 Accumulated annual statistics and prediction of literature on cross-disciplinary studies on food safety and data science in China

2.1.2 重要機(jī)構(gòu)分布

使用CNKI數(shù)據(jù)庫(kù)的“分組瀏覽-機(jī)構(gòu)”功能,可以查詢到當(dāng)前學(xué)科領(lǐng)域中重要機(jī)構(gòu)的信息(以發(fā)文量統(tǒng)計(jì),列表機(jī)構(gòu)最低發(fā)文量為14 篇)。由表1可知,發(fā)表論文30 篇及以上的機(jī)構(gòu)有18 家,所發(fā)表的論文占全部3 375篇文獻(xiàn)的26.93%,屬于引領(lǐng)本領(lǐng)域研究的核心機(jī)構(gòu)群體。

表1 1996—2019年我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究領(lǐng)域文獻(xiàn)產(chǎn)出量前18的機(jī)構(gòu)Table 1 Top 18 most prolific research institutions in terms of crossdisciplinary studies on food safety and data science in China (1996-2019)

在本領(lǐng)域發(fā)表論文的數(shù)量與該機(jī)構(gòu)研究人員的數(shù)量、獲得相關(guān)科研項(xiàng)目的數(shù)量密切相關(guān)。例如:在南京農(nóng)業(yè)大學(xué)所發(fā)表的論文中,李太平教授團(tuán)隊(duì)的研究成果最多,共有6 篇論文,主要受到國(guó)家自然科學(xué)基金面上項(xiàng)目“生鮮農(nóng)產(chǎn)品質(zhì)量安全的監(jiān)管機(jī)制研究”(71173114)的資助;在浙江大學(xué)所發(fā)表的論文中,杜樹新副研究員及其團(tuán)隊(duì)的論文數(shù)量最多,共有5 篇,主要受到國(guó)家科技攻關(guān)計(jì)劃資助項(xiàng)目(2001BA804A34)的資金支持。

2.1.3 重要期刊與學(xué)位授予單位分布

使用Excel 2016軟件的數(shù)據(jù)透視表功能,對(duì)所收集的3 375 條題錄數(shù)據(jù)的“期刊名稱”或“學(xué)位授予單位”字段進(jìn)行數(shù)據(jù)透視,可以得到期刊論文文獻(xiàn)的來(lái)源期刊或?qū)W位論文的學(xué)位授予單位的統(tǒng)計(jì)信息。共有1 611 篇與本主題相關(guān)的期刊論文被刊載在684 種學(xué)術(shù)期刊上,平均載文量為2.36 篇/刊。由表2可知,集中刊載本領(lǐng)域論文10 篇及以上的期刊有18 種,載文數(shù)量達(dá)438 篇,占全部期刊論文的27.19%,在期刊分類[10]上分屬于4大類,其中“食品科學(xué)技術(shù)”和“農(nóng)業(yè)綜合”分類占大多數(shù)。

共有1 598 篇與本主題相關(guān)的學(xué)位論文來(lái)自248 個(gè)不同的學(xué)位授予單位,平均載文量為6.44 篇/機(jī)構(gòu)。由表3可知,學(xué)位論文數(shù)量在20 篇及以上的機(jī)構(gòu)有17 家,論文數(shù)量達(dá)到650 篇,占本領(lǐng)域?qū)W位論文總量的40.68%。其中,農(nóng)林類與綜合類高校涉足食品安全與數(shù)據(jù)科學(xué)交叉研究領(lǐng)域的數(shù)量相較于其他類別更多。

表2 交叉研究期刊論文的來(lái)源期刊分布Table 2 Journal distribution of published papers on cross-disciplinary studies on food safety and data science

表3 交叉研究學(xué)位論文的學(xué)位授予單位分布Table 3 Degree conferring institution distribution of dissertations on cross-disciplinary studies on food safety and data science

本文通過(guò)文獻(xiàn)[11]的方法,統(tǒng)計(jì)載文數(shù)量、載文數(shù)量的出現(xiàn)頻數(shù)、出現(xiàn)概率和累計(jì)概率,得到了期刊論文和學(xué)位論文的頻數(shù)與概率分布表。使用Origin Pro 9.1軟件對(duì)上述數(shù)據(jù)進(jìn)行概率分布模型的擬合檢驗(yàn),得到圖2。

圖2A、B分別表示本領(lǐng)域期刊論文載文數(shù)量和學(xué)位論文載文數(shù)量的概率分布擬合曲線,決定系數(shù)分別為0.999 9、0.999 6,具有很高的擬合優(yōu)度。所以兩種文獻(xiàn)的載文數(shù)量的概率分布都服從異速生長(zhǎng)指數(shù)(Allometric)分布。這表明我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究領(lǐng)域經(jīng)過(guò)萌芽與積累,研究規(guī)模正在高速增長(zhǎng)。根據(jù)異速生長(zhǎng)尺度規(guī)律[12]的特點(diǎn),我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究所形成的這個(gè)特定的食品安全子領(lǐng)域,可以看作是一種廣義的生態(tài)系統(tǒng),而本主題新科技論文的產(chǎn)生則是這個(gè)生態(tài)系統(tǒng)中最重要的信息流之一。自身的主題與偏好適合這個(gè)子領(lǐng)域的優(yōu)質(zhì)文獻(xiàn)被刊載的期刊,或者重視這個(gè)新興子領(lǐng)域發(fā)展的研究機(jī)構(gòu),會(huì)在這個(gè)新興子領(lǐng)域里快速生長(zhǎng),顯得愈發(fā)重要。

圖2 期刊論文(A)和學(xué)位論文(B)載文數(shù)量的概率分布擬合Fig. 2 Fitted probability distribution of the number of papers published in journals (A) and degree papers (B)

2.1.4 重要作者分布

關(guān)于論文合著情況,共有3 619 人次的作者參與撰寫了這1 611 篇期刊論文,平均作者為2.24 位/篇,即作者合作度[6]為2.24。使用CNKI數(shù)據(jù)庫(kù)的“分組瀏覽-作者”功能,可以查詢到當(dāng)前學(xué)科領(lǐng)域中高產(chǎn)作者的信息,本文將所述高產(chǎn)作者中發(fā)文數(shù)量大于5 篇的作者信息進(jìn)行整理。同時(shí),為了客觀地評(píng)價(jià)各位高產(chǎn)作者在論文合著中對(duì)其論文的貢獻(xiàn)度,本文引入了Du Yongping等2015年提出的基于作者順序的影響力計(jì)算方法,該方法適用于大數(shù)據(jù)環(huán)境下具備統(tǒng)計(jì)意義的計(jì)算[13]。該方法的算理實(shí)質(zhì)是:先計(jì)算除第一作者以外其他作者的分配得分(以百分?jǐn)?shù)計(jì)),再反向用總貢獻(xiàn)值倒減出第一作者的得分,其計(jì)算見下式。

式中:paij表示論文署名次序?yàn)閕(即Order(i))的作者對(duì)其論文j的規(guī)范化貢獻(xiàn)值;M表示該論文的作者總數(shù)。

本文使用pa鏈來(lái)記錄作者的署名和排位情況,如:5(2)表示該作者的某一篇論文共有5 位作者,其為第2作者(若為通信作者,則視為第一作者;若存在并列一作,也視為第一作者;特殊情形(比如通信作者)將以“*”標(biāo)記,如:5(2*),計(jì)分為5(1))。根據(jù)公式(1)進(jìn)一步計(jì)算累計(jì)pa和平均pa,并將以上字段信息合并為表4。

表4 本領(lǐng)域發(fā)文數(shù)量大于5 篇的高產(chǎn)作者和pa鏈Table 4 Productive authors publishing more than 5 papers and their pa chain in this field

由表4可知,這些高產(chǎn)作者中,平均pa前5 名分別是:李太平、唐曉純、李麗、鄂旭、肖革新,他們應(yīng)該是本領(lǐng)域研究合作的優(yōu)秀候選人。從累計(jì)pa來(lái)看,王竹天、王志剛也是本領(lǐng)域具備合作潛質(zhì)的優(yōu)秀候選人。

2.2 交叉研究的研究主題分析

2.2.1 關(guān)鍵詞共現(xiàn)分析

本文使用對(duì)數(shù)似然率(log-likelihood rate,LLR)算法對(duì)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)進(jìn)行聚類分析,得到了具有11 個(gè)主要聚類的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜(圖3),這些聚類的輪廓值(Silhouette)均大于0.5,且部分大于0.7,說(shuō)明這些聚類合理且令人信服[14]。這11 個(gè)聚類可以進(jìn)一步歸納為3大類(表5),即:食品安全領(lǐng)域的新型數(shù)據(jù)采集技術(shù)(類I)、食品安全領(lǐng)域的新型數(shù)據(jù)分析技術(shù)(類II)、食品安全領(lǐng)域的新型數(shù)據(jù)科學(xué)應(yīng)用(類III)。

由圖3可知,1996—2019年我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究領(lǐng)域形成了內(nèi)部邊界聚合且外部邊界分明的復(fù)雜關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜。該圖譜有405 個(gè)節(jié)點(diǎn)和1 543 條連線,是一個(gè)由大量高頻關(guān)鍵詞形成的廣闊知識(shí)空間。以下將根據(jù)引文空間聚類成員的歸屬和食品安全意義上的類別界定,以大類(I、II、III)劃分為展開順序,對(duì)所得到的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜進(jìn)行深入的分析。

表5 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的聚類信息Table 5 Clustering information of keyword co-occurrence network

圖3 我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜Fig. 3 Keyword co-occurrence network map of cross-disciplinary studies on food safety and data science in China

2.2.1.1 食品安全領(lǐng)域的新型數(shù)據(jù)采集技術(shù)

在大數(shù)據(jù)時(shí)代的背景下,物聯(lián)網(wǎng)、區(qū)塊鏈和電子標(biāo)簽等技術(shù)成為了采集新型食品安全數(shù)據(jù)的重要支撐技術(shù)。將網(wǎng)絡(luò)嵌入食品生產(chǎn)流通各環(huán)節(jié)的物理設(shè)備,有利于提升食品供應(yīng)鏈的智能化,完善食品溯源體系。尚培培等[15]研究了具備感知層、網(wǎng)絡(luò)層和應(yīng)用層3 層架構(gòu)的產(chǎn)品電子代碼(elctronic product code,EPC)物聯(lián)網(wǎng)在牛肉供應(yīng)鏈安全中的應(yīng)用,實(shí)現(xiàn)了牛肉產(chǎn)品標(biāo)準(zhǔn)化唯一標(biāo)識(shí)、不合格牛肉溯源追蹤、全程信息共享3 個(gè)層面的食品安全保障。區(qū)塊鏈技術(shù)的數(shù)據(jù)分布式儲(chǔ)存與數(shù)據(jù)不可刪改的特性將對(duì)食品從生產(chǎn)到零售的整個(gè)商業(yè)過(guò)程起到某種監(jiān)督與凈化作用。顏波等[16]設(shè)計(jì)并開發(fā)了基于RFID和EPC技術(shù)的具有企業(yè)、政府部門和消費(fèi)者3 個(gè)追溯主體的羅非魚供應(yīng)鏈可追溯平臺(tái),在羅非魚上架銷售前一直使用可循環(huán)RFID標(biāo)簽,實(shí)現(xiàn)了銷售前的全程追溯;而零售端顧客則可以通過(guò)獨(dú)立包裝外的條形碼標(biāo)簽溯源,提升了生鮮食品安全監(jiān)管的效率,滿足了顧客的食品安全需求。

2.2.1.2 食品安全領(lǐng)域的新型數(shù)據(jù)分析技術(shù)

數(shù)學(xué)模型方法結(jié)合新興的人工智能技術(shù)應(yīng)用于食品安全領(lǐng)域,提升了食品安全數(shù)據(jù)及其分析挖掘技術(shù)在食品安全治理中的功能與地位。晁鳳英等[17]對(duì)某出入境檢驗(yàn)檢疫局提供的食品安全檢測(cè)數(shù)據(jù),使用廣度優(yōu)先的Apriori算法進(jìn)行了關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,并對(duì)挖掘出的幾條有代表性的關(guān)聯(lián)規(guī)則進(jìn)行了解讀,由此提煉出食品安全抽檢的優(yōu)化策略。質(zhì)量控制圖是一種簡(jiǎn)單、有效的統(tǒng)計(jì)技術(shù)[18]。帶有上中下控制界限的、以檢測(cè)食品生產(chǎn)過(guò)程安全和判斷食品質(zhì)量穩(wěn)定狀態(tài)為目標(biāo)的控制圖,已經(jīng)逐步演化和固定為食品質(zhì)量安全過(guò)程控制的專門化數(shù)據(jù)分析方法。秦燕等[19]使用控制圖工具進(jìn)行危險(xiǎn)檢出物指標(biāo)預(yù)警,對(duì)廣州食檢中心某時(shí)段內(nèi)的出口茶葉中的六氯環(huán)己烷和白蘭地酒中的甲醇的檢測(cè)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,提出了Y-Pn控制圖、C-Pn控制圖、J-Pn控制圖和-δ控制圖4種預(yù)警方法。

2.2.1.3 食品安全領(lǐng)域的新型數(shù)據(jù)科學(xué)應(yīng)用

以數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)的研究范式,研究前沿且恰當(dāng)?shù)氖称钒踩珕?wèn)題,是數(shù)據(jù)科學(xué)應(yīng)用在食品安全領(lǐng)域的一種使命。因?yàn)槊嫦蛑黧w對(duì)象不同,故其應(yīng)用場(chǎng)景和應(yīng)用需求也不相同[20]。所研究的對(duì)象是當(dāng)前層出不窮的各類食品安全事件及危險(xiǎn)源,如:使用主成分分析-最小二乘支持向量機(jī)預(yù)測(cè)模型鑒別地溝油[21]、使用層次分析法(analytic hierarchy process,AHP)評(píng)價(jià)水產(chǎn)品孔雀石綠的殘留風(fēng)險(xiǎn)[22]、使用SGompertz-SLogistic生長(zhǎng)動(dòng)力學(xué)模型預(yù)測(cè)清蛋糕中金黃色葡萄球菌的生長(zhǎng)速率[23]等;所研究的內(nèi)容是在宏觀層面上食品安全水平提升所亟待解決的各種問(wèn)題,如:使用關(guān)聯(lián)規(guī)則算法探尋食品質(zhì)量安全保障的關(guān)鍵因素[24]、使用循環(huán)神經(jīng)網(wǎng)絡(luò)算法對(duì)食品安全描述文本的情感傾向進(jìn)行分類[25]、通過(guò)構(gòu)建貝葉斯網(wǎng)絡(luò)對(duì)白酒質(zhì)量安全進(jìn)行預(yù)測(cè)[26]等;交叉研究所受益的主體及研究方向包括:政府的智慧監(jiān)管與風(fēng)險(xiǎn)預(yù)警[27-29]、食品企業(yè)的生產(chǎn)控制與事后應(yīng)對(duì)[30-32]、消費(fèi)者的食品安全風(fēng)險(xiǎn)認(rèn)知與支付意愿[33-35]等。

2.2.2 時(shí)間線聚類分析

使用Citespace軟件進(jìn)一步繪制關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的時(shí)間線圖譜,由圖4可知,我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究的各研究主題存續(xù)時(shí)間不同。例如:聚類C0、C1和C2存續(xù)時(shí)間都接近20 年,而且從聚類產(chǎn)生到現(xiàn)在一直是活躍的聚類;而另一些聚類的存續(xù)時(shí)間則相對(duì)較短,例如:聚類C6、C7和C8,存續(xù)時(shí)間只有大約7~10 年,且目前已經(jīng)不再是該主題研究熱度最高的時(shí)段,這些主題都具有從存續(xù)時(shí)間長(zhǎng)的主題中分化產(chǎn)生的特點(diǎn)。圖中的這些顏色與流向表征著我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究的不同發(fā)展階段。

圖4 我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究的關(guān)鍵詞聚類的時(shí)間線圖譜Fig. 4 Keyword clustering time-line atlas of cross-disciplinary studies on food safety and data science in China

1996—2006年為重視食品標(biāo)準(zhǔn)數(shù)據(jù)與傳統(tǒng)數(shù)理統(tǒng)計(jì)方法的階段。此階段的科技文獻(xiàn)主要側(cè)重引進(jìn)國(guó)外先進(jìn)的食品安全標(biāo)準(zhǔn)并與我國(guó)的食品安全標(biāo)準(zhǔn)進(jìn)行比較[37-39];在數(shù)據(jù)分析上多基于HACCP系[40-42]、調(diào)查問(wèn)卷方法和數(shù)理統(tǒng)計(jì)工具[43-45]。

2007—2014年為新型食品安全數(shù)字技術(shù)和數(shù)學(xué)模型方法開始涌現(xiàn)的階段。此階段層次分析法[46-47]、貝葉斯網(wǎng)絡(luò)[48]、關(guān)聯(lián)規(guī)則[49]、決策樹[50]、可拓決策[51]等數(shù)學(xué)模型方法被廣泛地應(yīng)用于食品安全風(fēng)險(xiǎn)評(píng)估和風(fēng)險(xiǎn)預(yù)警等方面;RFID[52-54]、QR二維碼[55-56]、同位素指紋[57-58]等技術(shù)被廣泛地應(yīng)用于食品質(zhì)量安全追溯領(lǐng)域。

2015—2019年為大數(shù)據(jù)與人工智能開始廣泛地應(yīng)用于食品安全各子領(lǐng)域的階段。此階段計(jì)算機(jī)視覺[59]、電子鼻與電子舌[60]、模式識(shí)別[61]等基于人工智能的食品安全無(wú)損檢測(cè)技術(shù)得到應(yīng)用;基于區(qū)塊鏈技術(shù)的可追溯平臺(tái)[62]、基于大數(shù)據(jù)的社會(huì)共治模式[63]、食品安全大數(shù)據(jù)的可視化分析方法[64]、基于大數(shù)據(jù)的食品安全風(fēng)險(xiǎn)分析[65]等由大數(shù)據(jù)技術(shù)驅(qū)動(dòng)的食品安全智慧監(jiān)管技術(shù)與模式正在探究與實(shí)踐中。

2.2.3 關(guān)鍵詞突現(xiàn)分析

本文采用Kleinberg突發(fā)事件檢測(cè)算法[66]來(lái)探測(cè)文獻(xiàn)空間中的突現(xiàn)詞,Citespace軟件會(huì)從論文題目、關(guān)鍵詞和摘要等字段中提取候選專業(yè)術(shù)語(yǔ),通過(guò)跟蹤分析它們?cè)诓煌瑫r(shí)間區(qū)間內(nèi)出現(xiàn)頻率的突然變化(激增),識(shí)別出代表研究前沿的若干名詞術(shù)語(yǔ)[67]。運(yùn)行程序后,Citespace找到了47 個(gè)突現(xiàn)關(guān)鍵詞,將突現(xiàn)度前50%的突現(xiàn)詞按照其突現(xiàn)起止時(shí)間的升序排列得到表6。

表6 突現(xiàn)度最高的前50%的關(guān)鍵詞Table 6 Top 50% keywords with the strongest citation burstness

從表6可以看出,不同年份本領(lǐng)域的研究者所關(guān)注的研究熱點(diǎn)不同。根據(jù)表6可以進(jìn)一步把我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究的熱點(diǎn)演進(jìn)劃分為3 個(gè)階段,與時(shí)間線聚類分析的年代劃分相吻合。1)1996—2006年為重視國(guó)外食品安全標(biāo)準(zhǔn)的引進(jìn)及與我國(guó)食品安全標(biāo)準(zhǔn)開展比較研究的階段,“檢索工具”、“GB(國(guó)家標(biāo)準(zhǔn))”是這一階段的突現(xiàn)詞。2)2007—2014年,突現(xiàn)詞“RFID”和“電子標(biāo)簽”代表了新型食品數(shù)字溯源技術(shù)的研究方向;突現(xiàn)詞“利益相關(guān)者”與“食品行業(yè)”代表了與食品企業(yè)有關(guān)的研究方向;突現(xiàn)詞“供應(yīng)鏈”與“預(yù)警”等代表了與食品安全風(fēng)險(xiǎn)控制有關(guān)的研究方向。3)2015—2019年,突現(xiàn)詞“大數(shù)據(jù)”代表了數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)的研究范式;突現(xiàn)詞“風(fēng)險(xiǎn)感知”、“購(gòu)買意愿”和“社會(huì)共治”等代表了這一階段涌現(xiàn)出的研究熱點(diǎn)。

3 討 論

3.1 交叉研究當(dāng)前的研究熱點(diǎn)

3.1.1 新型數(shù)據(jù)采集技術(shù)與食品溯源及網(wǎng)絡(luò)輿情的研究在食品從農(nóng)田到餐桌的流通過(guò)程中,食品及其有關(guān)主體的多重屬性被計(jì)量和記錄,產(chǎn)生了食品關(guān)聯(lián)屬性的數(shù)據(jù)化基礎(chǔ)[68]。以保障食品質(zhì)量或數(shù)量安全為目的,提取這些數(shù)據(jù),則產(chǎn)生了海量的食品安全數(shù)據(jù)。數(shù)據(jù)采集技術(shù)的發(fā)展使得文本資料、社會(huì)關(guān)系、地理方位等不易被提取的數(shù)據(jù)變得可被利用;使得政府、企業(yè)、檢測(cè)機(jī)構(gòu)、行業(yè)協(xié)會(huì)、媒體和消費(fèi)者這6 類食品安全社會(huì)主體[20]所產(chǎn)生和需要的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)[69]被各種技術(shù)手段收集和儲(chǔ)存,以備挖掘與利用。

一方面,RFID和傳感器、物聯(lián)網(wǎng)等面向現(xiàn)實(shí)世界中食品理化數(shù)據(jù)的數(shù)據(jù)采集技術(shù),推動(dòng)了食品安全溯源技術(shù)的發(fā)展。圣光磊[70]通過(guò)改進(jìn)滑動(dòng)窗口射頻識(shí)別數(shù)據(jù)分析-目標(biāo)自適應(yīng)射頻識(shí)別數(shù)據(jù)分析(statistics moothing for unreliabler fid data-dynamic tags-based SMURF,SMURF-DSMURF)算法中數(shù)據(jù)完整性和標(biāo)簽動(dòng)態(tài)性條件,設(shè)計(jì)了新的更高效的多層級(jí)射頻識(shí)別數(shù)據(jù)分析(multi label DSMURF,MDSMURF)算法,并應(yīng)用于白芍飲片溯源系統(tǒng)中,提高了數(shù)據(jù)噪聲的清洗效率和多標(biāo)簽動(dòng)態(tài)的閱讀效率。鐘聰兒等[71]將ALOHA算法應(yīng)用于基于RFID技術(shù)的茶葉物流溯源系統(tǒng)中,并設(shè)計(jì)了仿真實(shí)驗(yàn),結(jié)果表明:通過(guò)解決硬件不兼容、信息冗余等問(wèn)題,能夠顯著地提高追溯系統(tǒng)的響應(yīng)效率。

另一方面,網(wǎng)絡(luò)爬蟲及數(shù)據(jù)接口等面向虛擬世界中的食品資訊數(shù)據(jù)的數(shù)據(jù)采集技術(shù),推動(dòng)了食品安全輿情研究的發(fā)展。程鐵軍等[72]使用網(wǎng)絡(luò)爬蟲技術(shù)在線獲取了2011—2014年總貼數(shù)達(dá)50萬(wàn)以上的超熱度食品安全新聞事件15 例,并構(gòu)建了4大類11小類的食品安全風(fēng)險(xiǎn)預(yù)警指標(biāo),通過(guò)粗糙集理論進(jìn)行屬性簡(jiǎn)約計(jì)算,從高熱度輿情事件中提煉出易引發(fā)食品安全事件的關(guān)鍵食品流通環(huán)節(jié),為源頭管理和社會(huì)共治提供了針對(duì)性建議。洪小娟等[73]以所收集的包含588 個(gè)媒體微博節(jié)點(diǎn)的2014年食品安全微博輿情事件為數(shù)據(jù)集,使用Pajek軟件進(jìn)行了社會(huì)網(wǎng)絡(luò)分析特有的網(wǎng)絡(luò)結(jié)構(gòu)、度、K-核以及派系分析,發(fā)現(xiàn)了食品安全新聞傳播的核心節(jié)點(diǎn)、媒體派系以及傳播模式,為食品安全輿情的利用與引導(dǎo)提供了可參考的建議。

3.1.2 新型數(shù)據(jù)存儲(chǔ)技術(shù)與食品數(shù)據(jù)倉(cāng)庫(kù)及預(yù)警系統(tǒng)研究

大數(shù)據(jù)及其應(yīng)用技術(shù)的爆炸式發(fā)展所產(chǎn)生的數(shù)據(jù)存儲(chǔ)需求推動(dòng)了數(shù)據(jù)存儲(chǔ)技術(shù)的發(fā)展。大規(guī)模并行處理機(jī)(massively parallel processor,MPP)存儲(chǔ)架構(gòu)、Hadoop技術(shù)和分布式計(jì)算等新興技術(shù),讓已經(jīng)長(zhǎng)期存在的食品安全大數(shù)據(jù)有了被規(guī)范化存儲(chǔ)和多元化挖掘利用的可能性,尤其是基于數(shù)據(jù)庫(kù)的食品安全預(yù)警系統(tǒng),是當(dāng)前研究的重要熱點(diǎn)形態(tài)。郭曙超等[74]以山東地區(qū)進(jìn)出口食品檢測(cè)實(shí)驗(yàn)室的檢測(cè)數(shù)據(jù)為數(shù)據(jù)集,根據(jù)食品安全工作需要,設(shè)計(jì)數(shù)據(jù)字典和體系架構(gòu),建立了“進(jìn)出口食品與農(nóng)產(chǎn)品實(shí)驗(yàn)室檢測(cè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)”,該系統(tǒng)可進(jìn)行數(shù)理統(tǒng)計(jì)、可視化分析與數(shù)據(jù)挖掘,能夠?qū)崟r(shí)掌握食品安全狀況的動(dòng)態(tài),可以為食品安全管理人員提供高質(zhì)量的決策依據(jù)。劉翠玲等[75]使用Eclipse開發(fā)環(huán)境和Java語(yǔ)言,設(shè)計(jì)并開發(fā)了一種基于多源大數(shù)據(jù)的食品安全監(jiān)測(cè)預(yù)控系統(tǒng),該系統(tǒng)后臺(tái)采用My SQL關(guān)系數(shù)據(jù)庫(kù),實(shí)現(xiàn)了拉曼光譜儀數(shù)據(jù)的導(dǎo)入、分析與預(yù)警。黎建輝等[76]以云計(jì)算、云存儲(chǔ)、分布式計(jì)算框架為系統(tǒng)主體,結(jié)合信息爬取、模式識(shí)別以及深度學(xué)習(xí)技術(shù)等,設(shè)計(jì)并開發(fā)了全球食品安全信息監(jiān)控與分析云平臺(tái),通過(guò)對(duì)近5 000 個(gè)信息源的固定周期爬取與監(jiān)控,成功地預(yù)警出了礦泉水水源污染事件、病死豬肉流入市場(chǎng)事件以及保鮮膜中塑化劑超標(biāo)事件等具有重大社會(huì)影響的食品安全事件。

3.1.3 新型數(shù)據(jù)分析技術(shù)與食品安全智能解決方案研究

應(yīng)用數(shù)據(jù)科學(xué)模型方法體系中的有監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)[77]的各類算法對(duì)海量的食品安全數(shù)據(jù)進(jìn)行計(jì)算分析,可以為食品安全的信息探測(cè)、數(shù)據(jù)預(yù)測(cè)和風(fēng)險(xiǎn)評(píng)估等各方面帶來(lái)更加智能化的解決方案。劉金碩等[78]提出一種基于隱狄利克雷分配模型(latent Dirichlet allocation,LDA)的K平均值(K-means)聚類的網(wǎng)絡(luò)食品安全問(wèn)題話題發(fā)現(xiàn)算法,并以網(wǎng)絡(luò)爬取的2017年包含43 個(gè)食品安全分類的1 920 條新聞報(bào)道為數(shù)據(jù)集,通過(guò)LDA-K-means算法進(jìn)行聚類,以此發(fā)現(xiàn)新的食品安全話題,并與傳統(tǒng)的向量空間模型(vector space model,VSM)算法進(jìn)行了比對(duì),實(shí)驗(yàn)結(jié)果表明,LDA-K-means算法相對(duì)于傳統(tǒng)的VSM算法聚類效率更高,更加利于快速探測(cè)網(wǎng)絡(luò)中新的食品安全問(wèn)題話題。陳國(guó)慶等[79]使用基于熒光光譜和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò),對(duì)光譜儀發(fā)射波長(zhǎng)的網(wǎng)絡(luò)特征參數(shù)進(jìn)行訓(xùn)練,并對(duì)胭脂紅溶液樣本的濃度進(jìn)行預(yù)測(cè),結(jié)果表明,該方法對(duì)食品色素溶液種類識(shí)別的準(zhǔn)確度接近100%,可應(yīng)用于合成食品色素檢測(cè)及食品安全監(jiān)管。趙靜嫻[80]以2005—2009年華北地區(qū)20 個(gè)蔬菜種植基地的調(diào)查數(shù)據(jù)和國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心的共享數(shù)據(jù)為數(shù)據(jù)集,抽取82 個(gè)樣本作為訓(xùn)練集,抽取10 個(gè)樣本作為驗(yàn)證集,應(yīng)用決策樹算法進(jìn)行食品安全評(píng)估,提取了5 條規(guī)則,與驗(yàn)證集對(duì)比的準(zhǔn)確率達(dá)到了90%,說(shuō)明該方法能夠有效指導(dǎo)農(nóng)產(chǎn)品質(zhì)量安全的提高方向。

3.1.4 新型數(shù)據(jù)可視化技術(shù)與食品安全決策輔助研究

食品安全數(shù)據(jù)可視化分析作為一個(gè)新興的交叉研究領(lǐng)域,通過(guò)先進(jìn)的交互式可視化工具幫助食品安全領(lǐng)域人員快速分析數(shù)據(jù)的分布態(tài)勢(shì)、探尋數(shù)據(jù)間隱含關(guān)聯(lián)、提升認(rèn)知和分析能力、提高食品安全監(jiān)管的科學(xué)性和有效性[81]。陳誼等[81]在分析食品安全大數(shù)據(jù)特征的基礎(chǔ)上,使用了數(shù)據(jù)地圖、ThemeRiver、雙曲樹、TimeWheel和SolarMap等新型圖表,展示了時(shí)空數(shù)據(jù)、層次數(shù)據(jù)、多維數(shù)據(jù)和關(guān)聯(lián)關(guān)系的數(shù)據(jù)可視化形式,為提升數(shù)據(jù)可視化的易用性和輔助食品安全決策的可靠性提供了技術(shù)路徑。陳紅倩等[82]提出了一種基于Open GL圖形庫(kù)與統(tǒng)計(jì)數(shù)據(jù)的農(nóng)殘檢測(cè)數(shù)據(jù)的融合對(duì)比可視化方法,該方法可將一定規(guī)模的農(nóng)殘數(shù)據(jù)根據(jù)其所屬的地區(qū)和類別進(jìn)行分類統(tǒng)計(jì),并將多個(gè)統(tǒng)計(jì)結(jié)果融合到一個(gè)可視化界面中,可對(duì)農(nóng)殘檢測(cè)數(shù)據(jù)進(jìn)行快速展示,并以此進(jìn)行分析和預(yù)判,為有關(guān)專家進(jìn)行農(nóng)產(chǎn)品安全快速?zèng)Q策提供研判依據(jù)。楊璐等[83]提出了一種挖掘數(shù)據(jù)關(guān)系的可視分析圖ExploreView,以國(guó)家食品藥品監(jiān)督管理總局抽檢數(shù)據(jù)為數(shù)據(jù)集,使用立方體隱喻組織數(shù)據(jù),進(jìn)而完成數(shù)據(jù)編碼,綜合使用層次圖、細(xì)節(jié)描述圖和關(guān)系挖掘圖等新式可視化圖像,實(shí)現(xiàn)對(duì)數(shù)據(jù)的展示和交互,為食品質(zhì)量安全的監(jiān)測(cè)和預(yù)警提供決策幫助。江美輝等[84]以“上海福喜過(guò)期肉”事件新聞文本為研究對(duì)象,基于復(fù)雜網(wǎng)絡(luò)理論,使用Gephi軟件對(duì)非結(jié)構(gòu)化的文本信息進(jìn)行了拓?fù)涮卣鞣治龊完P(guān)聯(lián)網(wǎng)絡(luò)挖掘,結(jié)果表明,食品安全事件新聞報(bào)道的關(guān)注點(diǎn)具有集聚性,且關(guān)注點(diǎn)會(huì)隨著時(shí)間推移而變化,該研究挖掘出了新聞實(shí)體間的隱含關(guān)系,為有關(guān)部門對(duì)食品安全突發(fā)事件的應(yīng)急管理提供了決策依據(jù)。

3.1.5 面向?qū)ο蟮氖称钒踩髷?shù)據(jù)技術(shù)應(yīng)用研究

面向食品安全治理的不同社會(huì)主體的數(shù)據(jù)特征和數(shù)據(jù)需求的應(yīng)用研究,是目前交叉研究的重要橫向?qū)用妗?傮w來(lái)看,政府需要食品安全智慧監(jiān)管類的研究。張亮等[85]提出了面向智慧型城市的食品安全監(jiān)管體系,該體系基于感知網(wǎng)絡(luò)發(fā)現(xiàn)與采集數(shù)據(jù),基于云儲(chǔ)存規(guī)劃與分析數(shù)據(jù),基于大數(shù)據(jù)技術(shù)挖掘與預(yù)測(cè)數(shù)據(jù),為智慧城市食品質(zhì)量的安全預(yù)警和應(yīng)急管理提供了參考路徑;食品企業(yè)需要產(chǎn)品質(zhì)量與輿情安全類的研究,席磊等[86]提出了一種分布式無(wú)公害農(nóng)產(chǎn)品數(shù)字認(rèn)證系統(tǒng),該系統(tǒng)具有中心化分布式拓?fù)浣Y(jié)構(gòu),使用元數(shù)據(jù)、工作流和Web Service技術(shù),可實(shí)現(xiàn)跨部門、跨地域的協(xié)同工作和高效認(rèn)證的系統(tǒng)功能;檢測(cè)機(jī)構(gòu)需要共享分析和能力評(píng)價(jià)類的研究,沐曉馥[87]提出了一種基于AHP算法的檢驗(yàn)檢測(cè)機(jī)構(gòu)檢測(cè)能力管理信息系統(tǒng)績(jī)效評(píng)價(jià)方法,該方法基于AHP算法設(shè)計(jì)了具有4 個(gè)一級(jí)指標(biāo)和10 個(gè)二級(jí)指標(biāo)的評(píng)價(jià)指標(biāo)體系,用于量化評(píng)價(jià)不同檢測(cè)機(jī)構(gòu)的檢測(cè)能力管理信息系統(tǒng)的績(jī)效,為有關(guān)單位進(jìn)行系統(tǒng)選型提供了實(shí)際的決策依據(jù);行業(yè)協(xié)會(huì)需要行業(yè)自律和治理參與方式類的研究,劉根華等[88]以浙江省金華市為例,應(yīng)用數(shù)據(jù)統(tǒng)計(jì)分析方法分析了行業(yè)協(xié)會(huì)參與食品安全社會(huì)共治的現(xiàn)實(shí)困難,提出了“政府職能前移”和“五方聯(lián)動(dòng)機(jī)制”等有益對(duì)策;媒體需要治理策略和信息查詢類的研究,謝康等[89]基于Kahneman-Tversky前景理論和博弈論方法,定量化分析了媒體參與食品安全社會(huì)共治的條件,借助MATLAB軟件進(jìn)行系統(tǒng)仿真,得出媒體可采取的“提高違規(guī)者聲譽(yù)損失度”、“持續(xù)跟蹤調(diào)查或深度報(bào)道”、“動(dòng)態(tài)監(jiān)督”和“媒體群監(jiān)督與共治代表制度”4 種有效策略;消費(fèi)者需要風(fēng)險(xiǎn)感知和購(gòu)買意愿類的研究,張宇東等[90]使用數(shù)理統(tǒng)計(jì)方法分析了所設(shè)計(jì)、發(fā)放與回收的550 份有效調(diào)查問(wèn)卷,定量化地揭示了食品安全風(fēng)險(xiǎn)感知下,消費(fèi)者的量化信息偏好、購(gòu)買意愿和決策邏輯,結(jié)果表明,對(duì)食品安全風(fēng)險(xiǎn)嚴(yán)重性的主觀判斷會(huì)顯著提升消費(fèi)者對(duì)食品安全量化信息的偏好,而這種偏好會(huì)反向刺激消費(fèi)者量化消費(fèi),以應(yīng)對(duì)所認(rèn)知的食品安全風(fēng)險(xiǎn)。

3.2 交叉研究未來(lái)的發(fā)展趨勢(shì)

隨著大數(shù)據(jù)時(shí)代的到來(lái)以及數(shù)據(jù)挖掘技術(shù)在食品安全領(lǐng)域的應(yīng)用,數(shù)據(jù)科學(xué)在食品安全各領(lǐng)域的地位將會(huì)越來(lái)越重要,食品安全監(jiān)管也將向著更加智能化的方向發(fā)展,社會(huì)食品安全水平必然會(huì)得到更加顯著的提升。數(shù)據(jù)科學(xué)的發(fā)展是推動(dòng)交叉研究進(jìn)步的重要推動(dòng)力,食品安全研究的發(fā)展過(guò)程中對(duì)數(shù)據(jù)科學(xué)產(chǎn)生的新需求是引領(lǐng)交叉研究進(jìn)步的重要牽引力。從數(shù)據(jù)科學(xué)的發(fā)展趨勢(shì)來(lái)看:數(shù)據(jù)可視化、文本挖掘與自然語(yǔ)言處理、社交網(wǎng)絡(luò)分析、計(jì)算機(jī)視覺和高性能計(jì)算等會(huì)成為未來(lái)的大數(shù)據(jù)技術(shù)前沿[91]。若將這些前沿技術(shù)投射到食品安全領(lǐng)域,則會(huì)帶來(lái)如下的未來(lái)研究熱點(diǎn):1)計(jì)算機(jī)視覺技術(shù)的發(fā)展將推動(dòng)食品無(wú)損檢測(cè)技術(shù)的研究;2)自然語(yǔ)言處理能力的提升將推動(dòng)食品安全網(wǎng)絡(luò)輿情處理的研究;3)各種機(jī)器學(xué)習(xí)算法的進(jìn)步將推動(dòng)食品安全歷史數(shù)據(jù)的知識(shí)發(fā)現(xiàn)以及決策支持的研究;4)食品安全大數(shù)據(jù)的云儲(chǔ)存與人工智能服務(wù)的需求將持續(xù)擴(kuò)大,其產(chǎn)業(yè)化的研究將得到蓬勃發(fā)展。

4 結(jié) 語(yǔ)

在近23 年的發(fā)展歷程中,我國(guó)食品安全與數(shù)據(jù)科學(xué)的交叉研究從零星的學(xué)科交集萌芽,逐漸發(fā)展出一個(gè)新興交叉學(xué)科的雛形,目前正處于新的快速增長(zhǎng)期。文獻(xiàn)數(shù)量呈指數(shù)式增長(zhǎng),目前已存在3 375 篇各類文獻(xiàn)的研究體量,期刊論文和學(xué)位論文的年平均增速分別達(dá)到51.49%和52.45%,作者合作度為2.24。涌現(xiàn)出的高產(chǎn)和高貢獻(xiàn)度作者越來(lái)越多,例如南京農(nóng)業(yè)大學(xué)的李太平教授、中國(guó)人民大學(xué)的唐曉純副教授和安徽工業(yè)大學(xué)的李麗副教授等。通過(guò)CNKI的“分組瀏覽-研究層次”檢索功能獲知,我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究目前涉及到國(guó)內(nèi)工程技術(shù)(自科)、行業(yè)指導(dǎo)(社科)和基礎(chǔ)研究(社科)等16 個(gè)學(xué)科領(lǐng)域。結(jié)合科學(xué)計(jì)量學(xué)的分析,得出以下3 個(gè)方面的結(jié)論。

第一,通過(guò)關(guān)鍵詞共現(xiàn)圖譜分析,找出了本領(lǐng)域3大類11小類熱點(diǎn)研究主題。通過(guò)時(shí)間線聚類圖譜分析與關(guān)鍵詞突現(xiàn)度圖譜分析,劃分出了本領(lǐng)域發(fā)展史上的3 個(gè)典型歷史階段,即:1996—2006年的食品安全標(biāo)準(zhǔn)引入與比較和食品安全數(shù)據(jù)的數(shù)理統(tǒng)計(jì)階段;2007—2014年的食品安全數(shù)字技術(shù)與數(shù)學(xué)模型階段;2015—2019年的食品安全大數(shù)據(jù)與人工智能階段;預(yù)計(jì)在未來(lái)計(jì)算機(jī)視覺、自然語(yǔ)言處理技術(shù)、機(jī)器學(xué)習(xí)算法和大數(shù)據(jù)服務(wù)產(chǎn)業(yè)會(huì)在我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉領(lǐng)域發(fā)揮更加重要的作用。

第二,通過(guò)文獻(xiàn)分析,在食品安全與數(shù)據(jù)科學(xué)交叉融合的方向?qū)哟蝸?lái)看,數(shù)據(jù)科學(xué)的數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析和數(shù)據(jù)可視化等技術(shù),在23 年間不同程度地與食品安全的食品溯源、網(wǎng)絡(luò)輿情、風(fēng)險(xiǎn)預(yù)警、智慧監(jiān)管和可視化決策等重要方面相融合,誕生出新的食品安全前沿研究形態(tài),是推動(dòng)交叉研究不斷發(fā)展的重要縱向動(dòng)力。數(shù)據(jù)科學(xué)的各種技術(shù)與食品安全社會(huì)共治的各個(gè)主體的實(shí)際需求相結(jié)合,誕生出各種面向?qū)ο蟮氖称钒踩髷?shù)據(jù)技術(shù),是推動(dòng)食品安全與數(shù)據(jù)科學(xué)交叉融合、促進(jìn)食品安全大數(shù)據(jù)技術(shù)發(fā)展的重要橫向動(dòng)力。

第三,值得注意的是,雖然在僅僅23 年的時(shí)間里,我國(guó)食品安全與數(shù)據(jù)科學(xué)的交叉研究得到了迅猛發(fā)展;但是高被引論文[92]卻只是總體文獻(xiàn)中的極少數(shù),國(guó)內(nèi)研究與世界先進(jìn)水平相比仍有差距;相比起食品安全領(lǐng)域的其他成熟學(xué)科板塊,本領(lǐng)域的學(xué)科影響力仍然較為有限。結(jié)合未來(lái)的科技發(fā)展趨勢(shì)和國(guó)家科技政策導(dǎo)向,我國(guó)食品安全與數(shù)據(jù)科學(xué)交叉研究應(yīng)該得到社會(huì)各界更多的重視;本領(lǐng)域經(jīng)過(guò)探索且被證明是成熟可行的研究范式,應(yīng)該以課程化的形式進(jìn)入到與食品安全有關(guān)的專業(yè)學(xué)科的課程體系之中;各級(jí)科學(xué)基金也應(yīng)該加強(qiáng)對(duì)本領(lǐng)域的支持力度,推動(dòng)本領(lǐng)域新的科研成果的不斷產(chǎn)生以及科技成果的高效轉(zhuǎn)化,以此推動(dòng)我國(guó)食品安全監(jiān)管防控的智能化進(jìn)程。

本文也存在一定的局限性,因?yàn)閿?shù)據(jù)下載階段可檢索到并可供下載的數(shù)據(jù)與所在高校(或研究機(jī)構(gòu))所購(gòu)買的數(shù)據(jù)庫(kù)的時(shí)間跨度及文獻(xiàn)種類的權(quán)限有關(guān)[93]。故可能存在少量未被CNKI收錄的文獻(xiàn),或作者單位未購(gòu)買下載權(quán)限的數(shù)據(jù)庫(kù)所包含的文獻(xiàn),未被納入本研究的數(shù)據(jù)集會(huì)造成少量的樣本缺失,并會(huì)一定程度地影響科學(xué)計(jì)量與主題分析的精準(zhǔn)度。

猜你喜歡
交叉論文領(lǐng)域
2020 IT領(lǐng)域大事記
領(lǐng)域·對(duì)峙
“六法”巧解分式方程
連數(shù)
連一連
下期論文摘要預(yù)登
下期論文摘要預(yù)登
下期論文摘要預(yù)登
新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
2013年5—12月最佳論文