国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)技術(shù)的國內(nèi)外智庫動態(tài)監(jiān)測與應(yīng)用研究

2019-04-27 01:39:02李力魏姚
科技資訊 2019年2期
關(guān)鍵詞:趨勢分析大數(shù)據(jù)技術(shù)

李力 魏姚

摘 要:近年來,智庫發(fā)展尤其迅速,基于大數(shù)據(jù)技術(shù),對國內(nèi)外智庫進行動態(tài)監(jiān)測,在數(shù)據(jù)獲取、處理、分析挖掘、可視化等方面進行深入發(fā)掘與分析研究,可以為多種場景的應(yīng)用研究提供經(jīng)驗借鑒、決策參考、趨勢分析等信息支撐服務(wù),對加強我國智庫建設(shè)具有一定的實用價值。

關(guān)鍵詞:大數(shù)據(jù)技術(shù) 智庫監(jiān)測 趨勢分析

中圖分類號:G353 文獻標(biāo)識碼:A 文章編號:1672-3791(2019)01(b)-00-03

隨著社會的進程和演變,智庫作為一個地區(qū)乃至一個國家軟實力和國際話語權(quán)的重要體現(xiàn),在處理各項事務(wù)、助力決策咨詢中起到了越發(fā)重要的作用[1]。國家層面倡導(dǎo)的新型智庫正如火如荼的建設(shè),地方新型智庫的建設(shè)也在蓬勃發(fā)展。在此期間,發(fā)現(xiàn)決策定位難以把握、研究方向無從估摸、成果內(nèi)容不夠深入等主要情況,這就需要對國內(nèi)外智庫進行動態(tài)監(jiān)測,從中分析出有利于我國智庫相關(guān)研究的實際應(yīng)用場景,為其提供信息服務(wù)。

1 整體概述

針對國內(nèi)外智庫數(shù)量眾多、資源分散且無序的特點,使用大數(shù)據(jù)技術(shù),收集來自每個智庫組織的數(shù)據(jù),匯集后的眾多不同格式的數(shù)據(jù)首先進行處理,包括數(shù)據(jù)的清洗、去重、集成、歸約、有效性檢驗;其次對數(shù)據(jù)進行挖掘,包括聚類、分類、相關(guān)性、頻繁項集、特征化;再次對數(shù)據(jù)進行可視化展示,包括折線圖、柱狀圖、餅狀圖、文字云等知識圖譜,經(jīng)過一系列的大數(shù)據(jù)處理過程,如圖1所示;最后將零亂的數(shù)據(jù)源轉(zhuǎn)化為有價值的知識,最終為實際應(yīng)用提供具體服務(wù)。

2 智庫資源內(nèi)容及采集方法

2.1 智庫資源內(nèi)容

智庫相關(guān)數(shù)據(jù)信息眾多,篩選出核心且精煉的指標(biāo)信息,既能提升采集效率,又能為分析研究提供最有價值的服務(wù)。

根據(jù)智庫數(shù)據(jù)的特征,將智庫資源劃分成智庫機構(gòu)、智庫資訊、研究專家、研究成果四大數(shù)據(jù)體,在此基礎(chǔ)上,對每種數(shù)據(jù)體進行指標(biāo)信息設(shè)計,如表1所示。

對每種數(shù)據(jù)體建立起對應(yīng)聯(lián)系,智庫機構(gòu)以資訊進行發(fā)聲,并匯聚研究專家作為核心主體,研究專家發(fā)表其研究成果,從而形成一個完整的脈絡(luò)關(guān)系。

2.2 數(shù)據(jù)采集方法

按照數(shù)據(jù)體的指標(biāo)信息,進行國內(nèi)外智庫資源內(nèi)容的組織。以國內(nèi)外現(xiàn)有智庫機構(gòu)名錄為基礎(chǔ),確立數(shù)據(jù)來源導(dǎo)向,可以保證動態(tài)監(jiān)測的時效性與準(zhǔn)確性,利用Web信息采集技術(shù)對智庫資源進行獲取[2],通過該技術(shù)的應(yīng)用,可以實現(xiàn)智庫資源的自動采集、編輯和標(biāo)準(zhǔn)化,數(shù)據(jù)可以就地存儲,從而脫離對人為搜索及采集數(shù)據(jù)的干預(yù),以減少信息成本的支出,達到提升采集效率的目的。

3 智庫數(shù)據(jù)分析處理

通過采集開放的智庫數(shù)據(jù)具有異構(gòu)性,需要對這些異構(gòu)數(shù)據(jù)進行處理,包括數(shù)據(jù)清洗、集成、轉(zhuǎn)換、歸約,使其成為有用的目標(biāo)數(shù)據(jù)[3]。

(1)數(shù)據(jù)清洗:即處理缺失值,平滑降噪數(shù)據(jù),辨認或去除重復(fù)值和解決不規(guī)整的數(shù)據(jù)。如對智庫機構(gòu)中的研究專家和行政人員打標(biāo)區(qū)分,對有成果的專家進行保留,無成果的行政人員進行剔除,以達到數(shù)據(jù)清洗的目的。

(2)數(shù)據(jù)集成:對不同來源的數(shù)據(jù)進行集中聚集,利用數(shù)據(jù)倉庫進行存儲。根據(jù)眾多不同智庫數(shù)據(jù)的來源,對智庫機構(gòu)、研究專家、成果類型等建立統(tǒng)一的數(shù)據(jù)倉庫,每個倉庫存儲對應(yīng)數(shù)據(jù),從而實現(xiàn)數(shù)據(jù)的集成。

(3)數(shù)據(jù)轉(zhuǎn)換:目的是使數(shù)據(jù)統(tǒng)一標(biāo)準(zhǔn)化,并將數(shù)據(jù)轉(zhuǎn)換為另一種恰當(dāng)?shù)男问?。由于研究成果全文的排版格式多樣,進行規(guī)范化處理,轉(zhuǎn)換成以html或PDF全文的格式進行存儲,實現(xiàn)轉(zhuǎn)換效果的提升。

(4)數(shù)據(jù)歸約:指相同的數(shù)據(jù)在盡可能的前提下最大限度地減少數(shù)據(jù)量。從智庫機構(gòu)中刪除不重要或不相關(guān)的特征,如機構(gòu)的經(jīng)費情況、運作方式、審查機制等,以減少特征向量的維度。歸約后仍舊大抵保留原數(shù)據(jù)的完整性,但數(shù)據(jù)集變小。

通過一系列的大數(shù)據(jù)處理,既提升了數(shù)據(jù)的質(zhì)量,又使數(shù)據(jù)更適合挖掘技術(shù)的運用,以達到數(shù)據(jù)的快速、規(guī)范化處理。

4 大數(shù)據(jù)挖掘技術(shù)的運用

經(jīng)過持續(xù)的數(shù)據(jù)采集,后期的數(shù)據(jù)規(guī)模將達到海量級,從中找出隱藏的價值信息格外重要。剖析每種數(shù)據(jù)的屬性,實現(xiàn)多維分析與挖掘,將蘊含的內(nèi)在聯(lián)系揭示出來,為智庫的分析提供強有力的支撐。

4.1 關(guān)聯(lián)挖掘

關(guān)聯(lián)挖掘是為了找到數(shù)據(jù)項之間的關(guān)聯(lián)。通過該技術(shù)對智庫專家發(fā)布的研究成果數(shù)量來評估專家的產(chǎn)出情況,也可以通過分析專家同時署名的成果分布情況來發(fā)現(xiàn)專家之間的合作網(wǎng)絡(luò)。

關(guān)聯(lián)挖掘選用Apriori算法。實現(xiàn)步驟:根據(jù)向下閉包性,Apriori逐層搜索,由(k-1)-項頻繁集構(gòu)成k-項候選集,然后掃描數(shù)據(jù)庫找出k-項頻繁集,直到?jīng)]有新的頻繁集。此算法的優(yōu)點是在頻繁項集基礎(chǔ)上產(chǎn)生的,繼而能確保該算法的支持率達到合理的程度[4]。

4.2 聚類挖掘

聚類挖掘是按照集合內(nèi)的相似性原則將數(shù)據(jù)歸為若干個類別。通過該技術(shù)將研究成果按照國際關(guān)系、教育、經(jīng)濟、衛(wèi)生、外交等主題進行聚類,發(fā)現(xiàn)各個領(lǐng)域的成果信息。

聚類挖掘采用k-means算法。實現(xiàn)步驟:K-means算法是利用樣本目標(biāo)函數(shù)求從數(shù)據(jù)點到原型的距離最大值的方法,得到重復(fù)反饋運算的調(diào)整規(guī)則。K-means利用兩點間的度量距離作為相似性,以此得到某一初始聚類中心向量的最好歸類,使得評價指標(biāo)最低[4]。它能簡單快速地解決聚類問題,對處理大數(shù)據(jù)該算法彈性大并且效率高,時間復(fù)雜度趨近正比例關(guān)系,比較符合大數(shù)據(jù)的挖掘需求。

5 可視化展示

圖像的感知速率往往大于文字內(nèi)容,經(jīng)過數(shù)據(jù)的可視化所展現(xiàn)的直觀信息將有效增加內(nèi)容的應(yīng)用率。

通過可視化技術(shù)對數(shù)據(jù)進行呈現(xiàn),實現(xiàn)年份折線圖、成果類型餅狀圖、年度柱狀圖、文字云等多種知識圖譜,提高數(shù)據(jù)本身蘊涵的價值,從而快速識別數(shù)據(jù)所呈現(xiàn)的圖譜規(guī)律。

實現(xiàn)步驟:將數(shù)據(jù)轉(zhuǎn)化為可以觀察分析的圖像,每個圖像對應(yīng)一個維度,從對應(yīng)圖像上標(biāo)出對應(yīng)的數(shù)據(jù)情況,這樣每個維度的數(shù)據(jù)都轉(zhuǎn)換成為圖形的形式。此技術(shù)使我們能夠快速高效地簡化數(shù)據(jù)流,讓我們能夠交互地過濾大量的數(shù)據(jù),完成數(shù)據(jù)分析的任務(wù)[4]。

6 智庫動態(tài)監(jiān)測與實際應(yīng)用場景

6.1 智庫成果趨勢分析

通過對國內(nèi)外智庫進行動態(tài)監(jiān)測,可以對成果進行趨勢分析。以10年為一個時間跨度,如圖2所示,可以發(fā)現(xiàn)20世紀(jì)40年代至80年代,研究成果增長緩慢,但到了2000年以后,智庫成果出現(xiàn)指數(shù)級增長,特別是近20年以來,研究成果占到總數(shù)的80%以上。通過成果數(shù)量的監(jiān)測,能進行相關(guān)趨勢的研究分析。

6.2 國際政策追蹤與預(yù)警研究

通過對國外智庫機構(gòu)的長期動態(tài)關(guān)注與監(jiān)測,國際上的對華政策通常會在國外智庫機構(gòu)先行透露,對開展政策追蹤與預(yù)警研究十分必要。中國作為崛起的大國,離不開國際事務(wù)的合作參與,迫切需要借助相關(guān)研究,為我國的政策制定提供參考。

我國2013年提出的“一帶一路”合作倡議,受到眾多國家的強烈關(guān)注,都積極加入到合作倡議中來[5]。通過動態(tài)追蹤監(jiān)測國外智庫,發(fā)現(xiàn)他們及時抓住了政策熱點,發(fā)表了自己的主張與見解,研究成果呈井噴狀態(tài),特別是在2017年達到頂峰。通過這種方式進行分析與梳理,有利于精準(zhǔn)地把握國外政策的研究現(xiàn)狀與動向,更加科學(xué)地為我國的政策預(yù)警提供實際的應(yīng)用研究。

6.3 國際輿論監(jiān)測分析

近代傳媒出現(xiàn)以來,國與國之間在輿論領(lǐng)域的戰(zhàn)爭已成為一種新的看不見的硝煙戰(zhàn)爭,輿論領(lǐng)域的博弈已成為國際博弈的第四種主要形式[6],在爭奪國際話語權(quán)以及引導(dǎo)國際輿論向有利于本國方向的發(fā)展極其重要。

通過對國外智庫動態(tài)監(jiān)測發(fā)現(xiàn),美國亞洲協(xié)會的“中參館”對中國進行動態(tài)和深度報道,發(fā)表了比較多的言論與主張,如中國與非洲的關(guān)系;通過進一步監(jiān)測成果主題,涉及政策主題高居榜首,不難發(fā)現(xiàn)對輿論的導(dǎo)向有重要參照因素。通過監(jiān)測這些智庫的資訊動態(tài)及輿論焦點,展開實時分析,對研究國家與政權(quán)的博弈過程有重要價值。

6.4 智庫評價研究服務(wù)

智庫日益受到大眾的關(guān)注,在此形勢下,智庫評價研究具有非常重要的現(xiàn)實意義。利用大數(shù)據(jù)技術(shù)對全球智庫進行動態(tài)監(jiān)測,包括國內(nèi)外智庫的數(shù)量、輿論動態(tài)、成果影響力等進行全面綜合的跟蹤分析與評價,可以做到事實客觀、海量數(shù)據(jù)和實時監(jiān)測,能為智庫評價研究提供多樣化的數(shù)據(jù)利用,節(jié)省數(shù)據(jù)采集與清洗的時間,從而把工作重心放到趨勢分析、智庫評價等核心工作上來,大大提高研究的效率。

7 結(jié)語

目前,國內(nèi)外智庫數(shù)量眾多,每天都會產(chǎn)生大量的信息,利用大數(shù)據(jù)技術(shù),對國內(nèi)外智庫進行全面監(jiān)測,形成完整的智庫基礎(chǔ)數(shù)據(jù),為不同的應(yīng)用場景提供借鑒、分析服務(wù)。其主要體現(xiàn)在以下幾個方面。

(1)可以全面了解全球智庫機構(gòu)、專家、成果等各種智庫資源的構(gòu)成與基本現(xiàn)狀,有助于拓展國際視野。

(2)能方便、快速地對國外智庫機構(gòu)的觀點、評論、研究課題進行動態(tài)監(jiān)測,開展政策追蹤與預(yù)警研究,為我國的對外政策制定和交流合作提供參考。

(3)可以捕捉國內(nèi)外智庫的輿論焦點,對研究國家與政權(quán)的國際博弈、國際話語權(quán)的爭奪以及國際輿論的引導(dǎo)有重要價值。

(4)可以直接用于智庫整體評價、主題評價、領(lǐng)域評價、趨勢分析等相關(guān)研究服務(wù)。

利用大數(shù)據(jù)技術(shù),監(jiān)測國內(nèi)外智庫的最新動態(tài),有利于加強我國新型智庫的建設(shè),提高新型智庫的相關(guān)服務(wù)水準(zhǔn),制訂更加科學(xué)合理的評價指標(biāo)體系,更進一步地貫徹我國對于建設(shè)特色新型智庫的指導(dǎo)精神,對推進現(xiàn)代咨詢體系的建設(shè)具有積極意義。

參考文獻

[1] 趙培陽.我國新型科技創(chuàng)新智庫的發(fā)展機制與路徑研究[J].科技創(chuàng)新與應(yīng)用,2017(11):62-63.

[2] 朱潔,羅華霖.大數(shù)據(jù)架構(gòu)詳解——從數(shù)據(jù)獲取到深度學(xué)習(xí)[M].北京:電子工業(yè)出版社,2016:26-28.

[3] 孔欽,葉長青,孫赟.大數(shù)據(jù)下數(shù)據(jù)預(yù)處理方法研究[J].計算機技術(shù)與發(fā)展,2018(5):1-4.

[4] CODATA中國全國委員會.大數(shù)據(jù)時代的科研活動[M].北京:科學(xué)出版社,2014:159,160,172-173.

[5] 金杭川.“一帶一路”與國際化:助力國內(nèi)企業(yè)“走出去”[J].風(fēng)能,2016(11):38-39.

[6] 夏慶宇.輿論領(lǐng)域的博弈已成為國際博弈的第四種主要形式[J].南方論刊,2017(4):13-15,19.

猜你喜歡
趨勢分析大數(shù)據(jù)技術(shù)
化工材料科學(xué)與工程的發(fā)展現(xiàn)狀及趨勢研究
淺談核電項目設(shè)計質(zhì)量信息收集與分析
大數(shù)據(jù)技術(shù)在電子商務(wù)中的應(yīng)用
高校微課教學(xué)現(xiàn)狀及未來發(fā)展趨勢研究
大數(shù)據(jù)技術(shù)對新聞業(yè)務(wù)的影響研究
論大數(shù)據(jù)技術(shù)在智能電網(wǎng)中的應(yīng)用
從《遠程教育》35年載文看遠程教育研究趨勢
基于知識圖譜的智慧教育研究熱點與趨勢分析
高校檔案管理信息服務(wù)中大數(shù)據(jù)技術(shù)的應(yīng)用
計算機科學(xué)與技術(shù)的發(fā)展趨勢
郓城县| 运城市| 贺州市| 加查县| 汕尾市| 依兰县| 岗巴县| 山东省| 尤溪县| 广河县| 平顶山市| 手机| 铁岭县| 罗甸县| 泸水县| 衡水市| 崇义县| 哈尔滨市| 任丘市| 怀宁县| 响水县| 达拉特旗| 家居| 富宁县| 龙陵县| 汶上县| 景谷| 日喀则市| 瑞金市| 石棉县| 曲阳县| 乐山市| 绥中县| 个旧市| 孟村| 霞浦县| 岑溪市| 西林县| 江西省| 南和县| 宣威市|