国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

科技政務(wù)大數(shù)據(jù)管理與挖掘平臺(tái)設(shè)計(jì)

2021-05-25 05:26:50
軟件導(dǎo)刊 2021年5期
關(guān)鍵詞:政務(wù)科技企業(yè)

符 寧

(上海萬(wàn)達(dá)信息系統(tǒng)有限公司政務(wù)事業(yè)群,上海 201112)

0 引言

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,社會(huì)生產(chǎn)和生活產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)已成為一種新型的信息資產(chǎn)。大數(shù)據(jù)具有大量(Volume)、高速(Velocity)、多樣(Variety)、低價(jià)值密度(Value)和真實(shí)性(Veracity)的特性[1],其含義早已超越了數(shù)據(jù)規(guī)模定義,更代表著信息技術(shù)進(jìn)入了一個(gè)新時(shí)代。需要新技術(shù)和新方法將大規(guī)模數(shù)據(jù)中隱藏的信息和知識(shí)挖掘出來(lái),提高運(yùn)行效率,提高整個(gè)社會(huì)經(jīng)濟(jì)的集約化程度[2-3]。

由于大數(shù)據(jù)處理需求的迫切性和重要性,近年來(lái)大數(shù)據(jù)技術(shù)受到學(xué)術(shù)界、工業(yè)界和各國(guó)政府的高度重視。美國(guó)和歐洲一些發(fā)達(dá)國(guó)家政府從國(guó)家科技戰(zhàn)略層面提出一系列大數(shù)據(jù)技術(shù)研發(fā)計(jì)劃,并開放交通運(yùn)輸、天氣、健康等方面的核心公共數(shù)據(jù)庫(kù)[4],以推動(dòng)政府機(jī)構(gòu)、重大行業(yè)、學(xué)術(shù)界和工業(yè)界對(duì)大數(shù)據(jù)技術(shù)的研究與應(yīng)用[5-7]。目前大數(shù)據(jù)應(yīng)用還處于初級(jí)階段,描述型和預(yù)測(cè)型分析應(yīng)用居多,決策指導(dǎo)型應(yīng)用很少,而且大數(shù)據(jù)應(yīng)用的廣度和深度明顯不足[8]。

政務(wù)領(lǐng)域是大數(shù)據(jù)技術(shù)的一個(gè)重要應(yīng)用場(chǎng)景。隨著相關(guān)技術(shù)在該領(lǐng)域的應(yīng)用,政務(wù)大數(shù)據(jù)表現(xiàn)出以下幾個(gè)明顯發(fā)展趨勢(shì):

(1)政務(wù)決策科學(xué)化。把大數(shù)據(jù)技術(shù)運(yùn)用到政府決策與管理中,能夠?yàn)闆Q策提供依據(jù),優(yōu)化政府決策以及跟蹤決策實(shí)施,使決策更加精準(zhǔn)。

(2)管理精細(xì)化。大數(shù)據(jù)促進(jìn)政府設(shè)置更為詳細(xì)的績(jī)效指標(biāo)體系,進(jìn)一步對(duì)關(guān)鍵難點(diǎn)指標(biāo)進(jìn)行深度分析,使實(shí)時(shí)績(jī)效測(cè)量成為可能,有利于優(yōu)化資源配置,提高整體績(jī)效。

(3)服務(wù)個(gè)性化。大數(shù)據(jù)技術(shù)能夠整合多源數(shù)據(jù),通過(guò)大數(shù)據(jù)分析挖掘算法,為政府、企業(yè)和民眾提供個(gè)性化服務(wù)。

(4)運(yùn)轉(zhuǎn)協(xié)同化。大數(shù)據(jù)技術(shù)可以幫助政府建立一個(gè)跨部門、跨平臺(tái)、跨數(shù)據(jù)結(jié)構(gòu)的信息處理平臺(tái),促使政府各部門實(shí)現(xiàn)數(shù)據(jù)共享。

科技政務(wù)大數(shù)據(jù)管理和應(yīng)用中,除了存在大量的結(jié)構(gòu)化數(shù)據(jù)匯集管理以外,還存在與之相關(guān)的信息量更龐大的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),諸如流媒體、圖片、知識(shí)產(chǎn)權(quán)、科技文獻(xiàn)等。政府科技管理部門職能包括貫徹執(zhí)行科技相關(guān)法律法規(guī)、制定政策和計(jì)劃、編制并實(shí)施科研項(xiàng)目等,建設(shè)了項(xiàng)目管理、行政審批、行政運(yùn)行等應(yīng)用系統(tǒng),這些系統(tǒng)存在以下問題:①服務(wù)決策弱。信息化工作處于“流程軟件”開發(fā)階段,難以進(jìn)行特征分析、科技運(yùn)行態(tài)勢(shì)研判等,不能為科技宏觀決策提供大數(shù)據(jù)決策支撐;②個(gè)性化需求無(wú)法滿足。各個(gè)處室業(yè)務(wù)工作嵌鑲在4 大綜合辦公業(yè)務(wù)平臺(tái)系統(tǒng)中,但系統(tǒng)的個(gè)性要求難以滿足,降低了應(yīng)用系統(tǒng)的適應(yīng)性;③各子系統(tǒng)相互獨(dú)立,整體性差。調(diào)研結(jié)果顯示各個(gè)系統(tǒng)之間沒有數(shù)據(jù)交互,各自為政。

本文立足政府的政務(wù)數(shù)據(jù)建設(shè)成果,通過(guò)研究國(guó)內(nèi)外政務(wù)大數(shù)據(jù)采集、匯聚和運(yùn)營(yíng)管理機(jī)制與應(yīng)用模式,著眼各級(jí)政務(wù)體系中的數(shù)據(jù)互聯(lián)互通和共享共用,加強(qiáng)大數(shù)據(jù)應(yīng)用的頂層設(shè)計(jì),對(duì)已有政務(wù)數(shù)據(jù)運(yùn)行模式充分調(diào)研,構(gòu)建一個(gè)適用于科技管理的平臺(tái),在研究中逐步推演有價(jià)值、能落地的模型和方法。

1 相關(guān)工作

大數(shù)據(jù)技術(shù)相關(guān)研究較多,如大數(shù)據(jù)的治理平臺(tái)[9]和大數(shù)據(jù)技術(shù)轉(zhuǎn)移平臺(tái)[10]等,但這些研究沒有針對(duì)具體的業(yè)務(wù)進(jìn)行調(diào)整,沒有面向政務(wù)進(jìn)行適配。文獻(xiàn)[11]設(shè)計(jì)了一套由基本政策、具體政策、保障政策等構(gòu)成的政府?dāng)?shù)據(jù)開放體系;文獻(xiàn)[12-14]針對(duì)政務(wù)大數(shù)據(jù)的共享、集成、治理等提出了相關(guān)框架;文獻(xiàn)[15]強(qiáng)調(diào)了政務(wù)領(lǐng)域多部門的信息協(xié)同化,期望構(gòu)建無(wú)邊界化的智慧政務(wù);文獻(xiàn)[16]設(shè)計(jì)了政府大數(shù)據(jù)的高性能計(jì)算框架,完成數(shù)據(jù)的分布式存儲(chǔ)和訪問、多任務(wù)管理和運(yùn)行;文獻(xiàn)[17]研究了政務(wù)異構(gòu)數(shù)據(jù)融合過(guò)程中網(wǎng)絡(luò)安全的監(jiān)測(cè)方法,實(shí)現(xiàn)安全數(shù)據(jù)的全自動(dòng)化采集、人工智能的安全事件分析和分析結(jié)果的多維度場(chǎng)景化展示;文獻(xiàn)[18-19]以廣東省為例展示了大數(shù)據(jù)技術(shù)在政務(wù)方面的應(yīng)用成果。

上述相關(guān)研究工作中,文獻(xiàn)[9-10]主要闡述普適的大數(shù)據(jù)技術(shù)和平臺(tái)建設(shè)方案,并不針對(duì)具體應(yīng)用場(chǎng)景。本文所提出的科技政務(wù)大數(shù)據(jù)平臺(tái)是立足于政務(wù)領(lǐng)域的現(xiàn)有數(shù)據(jù),面向政務(wù)應(yīng)用場(chǎng)景所設(shè)計(jì)的,更加具有針對(duì)性;文獻(xiàn)[11,19]主要是梳理大數(shù)據(jù)技術(shù)現(xiàn)狀和相關(guān)政策,沒有展示具體技術(shù)實(shí)現(xiàn),其他文獻(xiàn)只涉及政務(wù)大數(shù)據(jù)治理的一個(gè)方面,例如只包括數(shù)據(jù)存儲(chǔ)和處理、高性能計(jì)算、大數(shù)據(jù)安全、上層應(yīng)用、智慧政務(wù)平臺(tái)推進(jìn)機(jī)制中的一項(xiàng),而本文的大數(shù)據(jù)平臺(tái)涵蓋了完整的數(shù)據(jù)鏈路,從數(shù)據(jù)產(chǎn)生到數(shù)據(jù)存儲(chǔ)和預(yù)處理到數(shù)據(jù)分析與挖掘,以及上層應(yīng)用的完整過(guò)程;文獻(xiàn)[14]的研究?jī)?nèi)容與本文最為接近,但其主要研究了數(shù)據(jù)的匯聚和共享技術(shù),數(shù)據(jù)的分析和挖掘主要體現(xiàn)在人口流動(dòng)狀況分析方面,與本文的應(yīng)用場(chǎng)景和分析挖掘技術(shù)不同。本文研究面向科技政務(wù)場(chǎng)景,設(shè)計(jì)了相關(guān)的大數(shù)據(jù)治理和挖掘平臺(tái)。與上述相關(guān)工作比較,本文創(chuàng)新性地提出了多時(shí)間粒度的殘差網(wǎng)絡(luò)預(yù)測(cè)模型和基于深度神經(jīng)網(wǎng)絡(luò)的科技政策推薦模型。

2 平臺(tái)框架

科技政務(wù)大數(shù)據(jù)研究主要面向科技信息系統(tǒng),需要將共享獲得的數(shù)據(jù)加以清洗、分析、整合和利用,建立一套運(yùn)行管理機(jī)制,包括采集方式、數(shù)據(jù)清理、數(shù)據(jù)檢查、質(zhì)量分析及更新相關(guān)工作。本文提出科技政務(wù)大數(shù)據(jù)管理與挖掘框架,如圖1 所示,包括科技政務(wù)數(shù)據(jù)采集、面向科技政務(wù)的大數(shù)據(jù)服務(wù)平臺(tái)和應(yīng)用示范3 個(gè)部分。

2.1 科技政務(wù)數(shù)據(jù)采集

數(shù)據(jù)采集指利用Web、App 或者傳感器等形式搜集數(shù)據(jù),并將數(shù)據(jù)通過(guò)網(wǎng)絡(luò)上傳并保存到數(shù)據(jù)庫(kù)中,其主要特點(diǎn)是數(shù)據(jù)多源異構(gòu)和數(shù)據(jù)規(guī)模大。本文結(jié)合科技部門業(yè)務(wù)和科技政務(wù)數(shù)據(jù)特點(diǎn)來(lái)設(shè)計(jì)數(shù)據(jù)采集方式。

科技部門是主管科技工作的政府部門,其主要職能包括:起草、制定、貫徹執(zhí)行與科技工作相關(guān)的法律、法規(guī)、規(guī)章、方針和政策;制定和組織實(shí)施科技發(fā)展規(guī)劃;負(fù)責(zé)科技重大專項(xiàng)的組織實(shí)施和綜合協(xié)調(diào)平衡;制定人才發(fā)展規(guī)劃和相關(guān)政策等。其產(chǎn)生的科技政務(wù)數(shù)據(jù)主要來(lái)自如圖1 中框架底層科技政務(wù)數(shù)據(jù)資源所示的幾個(gè)方面:科研項(xiàng)目管理系統(tǒng)的項(xiàng)目申報(bào)記錄;行政審批系統(tǒng)的辦事記錄;行政運(yùn)行系統(tǒng)的員工考核等數(shù)據(jù);科技114 平臺(tái)的用戶訪問數(shù)據(jù);國(guó)家層面和其他部門的外部數(shù)據(jù);網(wǎng)絡(luò)獲取的輔助數(shù)據(jù)等。

Fig.1 The framework of big data platform for the science and technology administration圖1 科技政務(wù)大數(shù)據(jù)平臺(tái)整體框架

新型的科技政務(wù)大數(shù)據(jù)框架的數(shù)據(jù)采集過(guò)程需要考慮采集方式、傳輸協(xié)議、保密3 個(gè)方面的問題。采集方式可以包括用戶填寫、門戶網(wǎng)站提供、傳感器獲取等??紤]不同數(shù)據(jù)特征,還需要選取合適的傳輸協(xié)議,如針對(duì)傳感器網(wǎng)絡(luò)獲取的數(shù)據(jù),由于其數(shù)據(jù)冗余度高、數(shù)據(jù)量大,需要選取有自組織性,支持動(dòng)態(tài)拓?fù)?、功耗低的?shù)據(jù)傳輸協(xié)議;而針對(duì)項(xiàng)目信息等的傳輸,數(shù)據(jù)量不大,可以選取高可靠性的協(xié)議。對(duì)于比較隱私的內(nèi)容,需要考慮對(duì)傳輸數(shù)據(jù)進(jìn)行加密。

2.2 大數(shù)據(jù)服務(wù)平臺(tái)

本文設(shè)計(jì)了面向政務(wù)的大數(shù)據(jù)服務(wù)平臺(tái),進(jìn)行接收數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)、挖掘信息、安全保護(hù)工作,并對(duì)外提供統(tǒng)一訪問接口。

首先,科技政務(wù)大數(shù)據(jù)資源中心接收來(lái)自不同系統(tǒng)的數(shù)據(jù),并對(duì)這些多源異構(gòu)數(shù)據(jù)進(jìn)行初步處理,涉及到數(shù)據(jù)接口的訪問控制和數(shù)據(jù)融合;然后,利用分布式數(shù)據(jù)庫(kù)或者分布式計(jì)算集群來(lái)對(duì)存儲(chǔ)于其內(nèi)的海量數(shù)據(jù)進(jìn)行普通分析和分類匯總,以滿足常見的分析需求。在數(shù)據(jù)存儲(chǔ)過(guò)程中還需要對(duì)數(shù)據(jù)進(jìn)行一些治理工作,如數(shù)據(jù)的清洗、數(shù)據(jù)融合等。構(gòu)建科技政務(wù)大數(shù)據(jù)分級(jí)分類資源目錄,形成全局化的數(shù)據(jù)資源視圖。

科技政務(wù)大數(shù)據(jù)智能計(jì)算平臺(tái)利用人工智能、機(jī)器學(xué)習(xí)、模式識(shí)別等理論對(duì)數(shù)據(jù)進(jìn)行分析和處理,從而獲得數(shù)據(jù)中隱含的知識(shí)。比如,分析企業(yè)發(fā)展時(shí)序數(shù)據(jù)中的因果關(guān)系,挖掘企業(yè)發(fā)展過(guò)程中多種因素之間的相互關(guān)系等。

2.3 應(yīng)用示范

設(shè)計(jì)新型應(yīng)用,將科技政務(wù)大數(shù)據(jù)技術(shù)落到實(shí)處,可以為政府制定科技政策、布局科技戰(zhàn)略、指導(dǎo)科技發(fā)展提供支持,從而提升我國(guó)產(chǎn)業(yè)的科技競(jìng)爭(zhēng)力,達(dá)到政務(wù)決策科學(xué)化、管理精細(xì)化、服務(wù)個(gè)性化的目的。根據(jù)應(yīng)用所針對(duì)的使用對(duì)象,可將政務(wù)大數(shù)據(jù)應(yīng)用分為三大類,即面向政府的科技決策、面向企業(yè)的科技扶持和面向人才的科技培育。面向政府應(yīng)用主要是提供有效的數(shù)據(jù)分析和可視化操作,為科技部門的宏觀決策提供大數(shù)據(jù)決策支撐;面向企業(yè)的應(yīng)用主要關(guān)注的是企業(yè)相關(guān)科技政策和項(xiàng)目推薦。根據(jù)企業(yè)特征個(gè)性化推薦相關(guān)政策內(nèi)容,降低企業(yè)工作量;在面向人才的應(yīng)用中,針對(duì)人才的特點(diǎn)進(jìn)行個(gè)性化項(xiàng)目推薦,進(jìn)行人才認(rèn)定,分析人才成長(zhǎng)路徑等。

3 面向科技政務(wù)的大數(shù)據(jù)服務(wù)平臺(tái)架構(gòu)

面向科技政務(wù)的大數(shù)據(jù)服務(wù)平臺(tái)主要包括科技政務(wù)大數(shù)據(jù)資源中心和科技政務(wù)大數(shù)據(jù)智能計(jì)算平臺(tái)。

3.1 科技政務(wù)大數(shù)據(jù)資源中心

科技政務(wù)大數(shù)據(jù)資源中心用于科技政務(wù)大數(shù)據(jù)的統(tǒng)一存儲(chǔ),對(duì)數(shù)據(jù)初步處理,為上層應(yīng)用提供統(tǒng)一訪問接口。如圖1 所示,科技政務(wù)大數(shù)據(jù)資源中心分為5 個(gè)功能模塊:①多源異構(gòu)科技數(shù)據(jù)整合匯聚模塊;②科技大數(shù)據(jù)資源池模塊;③多源高維數(shù)據(jù)治理模塊;④科技數(shù)據(jù)分級(jí)分類資源目錄模塊;⑤科技數(shù)據(jù)訪問控制模塊。

首先要把多源異構(gòu)的科技政務(wù)數(shù)據(jù)進(jìn)行整合匯聚,涉及的數(shù)據(jù)總體分為關(guān)系數(shù)據(jù)、平面數(shù)據(jù)兩大類,采用不同的技術(shù)與方式實(shí)現(xiàn)對(duì)數(shù)據(jù)的整合匯聚。關(guān)系數(shù)據(jù)是主要的業(yè)務(wù)數(shù)據(jù)源,數(shù)據(jù)量巨大,每日更新的數(shù)據(jù)量也很大,包括公文流轉(zhuǎn)記錄、行政審批專家評(píng)分、科研項(xiàng)目申報(bào)信息等。平臺(tái)利用基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)采集工具Sqoop,根據(jù)時(shí)間戳標(biāo)志定時(shí)訪問數(shù)據(jù)源,將最新的科技數(shù)據(jù)導(dǎo)入平臺(tái)。平面文件數(shù)據(jù)帶有一些格式化索引,但數(shù)據(jù)量的主體是無(wú)格式的平面文件。把平臺(tái)文件加載到HDFS,同時(shí)將文件索引信息插入到索引數(shù)據(jù)表中。

本文提供分布式文件系統(tǒng)(HDFS)、關(guān)系數(shù)據(jù)、內(nèi)存數(shù)據(jù)庫(kù)、列式數(shù)據(jù)庫(kù)等不同的數(shù)據(jù)存儲(chǔ)方案,保障基于此數(shù)據(jù)的應(yīng)用(或分析)能夠獲得良好的性能和使用體驗(yàn),形成全量數(shù)據(jù)存儲(chǔ)、專題庫(kù)。專題庫(kù)劃分為政策法規(guī)庫(kù)、科技項(xiàng)目庫(kù)、專家?guī)?、科技人才?kù)、企業(yè)信息庫(kù)、知識(shí)產(chǎn)權(quán)庫(kù)、成果轉(zhuǎn)化庫(kù)等,以方便科技人員使用。

多源高維的科技政務(wù)大數(shù)據(jù)在數(shù)據(jù)分析應(yīng)用前要進(jìn)行處理,因?yàn)槠淇赡艽嬖谀承┯虻娜笔б约爱惓V档?。本文設(shè)計(jì)了多源高維數(shù)據(jù)治理模塊,對(duì)存儲(chǔ)在科技大數(shù)據(jù)資源池的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)質(zhì)量評(píng)估,以提高存儲(chǔ)數(shù)據(jù)的質(zhì)量,方便對(duì)其進(jìn)行分析應(yīng)用。

設(shè)計(jì)科技政務(wù)大數(shù)據(jù)分級(jí)分層分域的數(shù)據(jù)管理體系與機(jī)制,研究多源異構(gòu)業(yè)務(wù)數(shù)據(jù)資產(chǎn)統(tǒng)一描述、管控、展示方法,通過(guò)對(duì)數(shù)據(jù)的業(yè)務(wù)屬性、數(shù)據(jù)量級(jí)等信息進(jìn)行描述,根據(jù)業(yè)務(wù)邏輯對(duì)數(shù)據(jù)資產(chǎn)進(jìn)行目錄分層,實(shí)現(xiàn)數(shù)據(jù)資源的分級(jí)分類,形成科技政務(wù)大數(shù)據(jù)資源目錄,然后提供給科技政務(wù)大數(shù)據(jù)智能計(jì)算平臺(tái)進(jìn)行數(shù)據(jù)挖掘,服務(wù)科技管理部門各業(yè)務(wù)科室、外部委辦局等不同用戶。

建設(shè)數(shù)據(jù)訪問審計(jì)功能,在數(shù)據(jù)訪問之前部署安全審計(jì)工具,在數(shù)據(jù)訪問過(guò)程中持續(xù)生成多方可信的原始審計(jì)數(shù)據(jù),為數(shù)據(jù)訪問全流程的回溯與取證服務(wù)提供支持。

3.2 科技政務(wù)大數(shù)據(jù)智能計(jì)算平臺(tái)

科技政務(wù)大數(shù)據(jù)智能計(jì)算平臺(tái)在科技政務(wù)大數(shù)據(jù)資源中心基礎(chǔ)上進(jìn)一步處理科技政務(wù)大數(shù)據(jù),并使用數(shù)據(jù)挖掘技術(shù)對(duì)科技政務(wù)大數(shù)據(jù)進(jìn)行分析與挖掘。

科技政務(wù)大數(shù)據(jù)智能計(jì)算平臺(tái)包括以下6 個(gè)模塊:

(1)自動(dòng)問答引擎。面向科技政務(wù)的自動(dòng)問答引擎包含知識(shí)存儲(chǔ)、知識(shí)表示、信息抽取、自然語(yǔ)言處理等多方面技術(shù),其體系結(jié)構(gòu)包括問題處理、信息檢索和答案抽取3 個(gè)部分。根據(jù)用戶輸入的問題進(jìn)行語(yǔ)義分析,尋找知識(shí)庫(kù)中的相關(guān)文檔和結(jié)果,排序后展示給用戶。

(2)語(yǔ)義分析引擎。以科研項(xiàng)目管理系統(tǒng)、行政審批系統(tǒng)、互聯(lián)網(wǎng)等多源異構(gòu)數(shù)據(jù)為基礎(chǔ),構(gòu)建實(shí)體與文本的對(duì)應(yīng)關(guān)系。語(yǔ)義分析引擎會(huì)面向人才、專家、企業(yè)等實(shí)體進(jìn)行簡(jiǎn)歷、報(bào)告等描述文字的語(yǔ)義分析,提取研究方向、科技成果、科研評(píng)價(jià)等,面向政策文件提取戰(zhàn)略目標(biāo)、戰(zhàn)略任務(wù)等,建立實(shí)體關(guān)聯(lián)關(guān)系。

(3)科技創(chuàng)新知識(shí)圖譜。幫助使用者透視科技領(lǐng)域知識(shí)體系結(jié)構(gòu)的形成、關(guān)聯(lián)與演變,洞察社會(huì)進(jìn)步與技術(shù)更替、企業(yè)發(fā)展以及人才、政策等資源的多方關(guān)系,構(gòu)建人、時(shí)間、技術(shù)等多維度視角的知識(shí)表示網(wǎng)絡(luò),活動(dòng)分布與競(jìng)爭(zhēng)的最新態(tài)勢(shì)與趨勢(shì),使研究者能概貌與深入了解和發(fā)現(xiàn)科技發(fā)展、研究前沿以及新興、熱點(diǎn)領(lǐng)域、學(xué)術(shù)水平等重要信息,并從科技研發(fā)、產(chǎn)業(yè)需求等方面精準(zhǔn)篩查具有產(chǎn)業(yè)價(jià)值的科技創(chuàng)新成果。

(4)推薦引擎。在電子政務(wù)方面的研究與應(yīng)用還比較欠缺,尤其是針對(duì)科技政務(wù),政府每年都會(huì)出臺(tái)很多政策,對(duì)企業(yè)和各行業(yè)的人才進(jìn)行資助或者扶持,但是用戶對(duì)政府的政策和服務(wù)關(guān)注較少。政府政策和服務(wù)涉及社會(huì)各行各業(yè),種類繁雜,導(dǎo)致用戶獲取與自己相關(guān)的政策和服務(wù)信息比較困難。本文設(shè)計(jì)了為企業(yè)推薦相關(guān)科技政策、為人才推薦相關(guān)項(xiàng)目、為政府推薦合適的項(xiàng)目評(píng)審專家等功能。

(5)預(yù)測(cè)模型。是對(duì)數(shù)據(jù)、標(biāo)簽之間的關(guān)系進(jìn)行建模,挖掘出量化的時(shí)間變化關(guān)系、變量因果關(guān)系等,從而對(duì)未來(lái)發(fā)展進(jìn)行科學(xué)預(yù)測(cè)。建立企業(yè)成長(zhǎng)預(yù)測(cè)模型,對(duì)區(qū)域內(nèi)科技企業(yè)的成長(zhǎng)偏向、成長(zhǎng)潛力等屬性進(jìn)行預(yù)測(cè)分析。

(6)特征畫像。分為人才畫像、專家畫像、企業(yè)畫像3部分,采用的技術(shù)均為“用戶畫像”。用戶畫像標(biāo)簽在證據(jù)強(qiáng)度上分為兩層:①?gòu)?qiáng)數(shù)據(jù)標(biāo)簽:主要是直接獲得的具有比較強(qiáng)的證據(jù)作用標(biāo)簽;②弱數(shù)據(jù)標(biāo)簽:利用人工智能算法所構(gòu)建的統(tǒng)計(jì)類、預(yù)測(cè)類標(biāo)簽。

4 科技政務(wù)應(yīng)用設(shè)計(jì)

科技政務(wù)大數(shù)據(jù)應(yīng)用包括面向政府的科技決策、面向企業(yè)的科技扶持和面向人才的科技培育。

4.1 面向政府的科技決策

本文通過(guò)對(duì)科技發(fā)展趨勢(shì)的預(yù)測(cè)、對(duì)科技投入績(jī)效的分析以及對(duì)人才的發(fā)現(xiàn)和評(píng)定,為政府制定科技政策、布局科技戰(zhàn)略、指導(dǎo)科技發(fā)展提供支持。

科技發(fā)展趨勢(shì)預(yù)測(cè)及布局利用面向科技政務(wù)的大數(shù)據(jù)服務(wù)平臺(tái)整合科技政務(wù)數(shù)據(jù)資源,運(yùn)用科技創(chuàng)新知識(shí)圖譜、人才畫像、企業(yè)畫像等大數(shù)據(jù)技術(shù),幫助科技管理部門了解企業(yè)和學(xué)術(shù)界的研究應(yīng)用熱點(diǎn),洞察科技企業(yè)特色與優(yōu)勢(shì)、調(diào)配區(qū)域人才科研力量、預(yù)測(cè)科技發(fā)展趨勢(shì),綜合評(píng)價(jià)科技資源布局合理性,為科技部門制定政策和發(fā)展規(guī)劃提供依據(jù)。

科技投入績(jī)效分析應(yīng)用示范需要建立完整的評(píng)估指標(biāo)庫(kù),除考慮科技投入和產(chǎn)出的經(jīng)濟(jì)效益指標(biāo)或財(cái)務(wù)指標(biāo)外,還必須考慮生態(tài)效益指標(biāo)和社會(huì)效益指標(biāo),切實(shí)關(guān)注科技創(chuàng)新對(duì)生活質(zhì)量、資源節(jié)約、環(huán)境優(yōu)化及社會(huì)和諧的正面與負(fù)面影響。

基于事實(shí)型數(shù)據(jù)挖掘?qū)崿F(xiàn)科技專家評(píng)價(jià)與發(fā)現(xiàn),通過(guò)梳理現(xiàn)有科技系統(tǒng)專家?guī)?,收集非體制內(nèi)、非高校等人才信息,如科技小巨人企業(yè)、高新技術(shù)企業(yè)技術(shù)骨干等信息,運(yùn)用大數(shù)據(jù)手段,從專業(yè)人才庫(kù)中挖掘?qū)<胰瞬?,多角度分析判斷不同人才的技術(shù)能力,建立專家數(shù)據(jù)挖掘與分析數(shù)據(jù)模型,對(duì)現(xiàn)有專家進(jìn)行評(píng)定,從被動(dòng)主觀的挖掘評(píng)價(jià)模式轉(zhuǎn)化為主動(dòng)、較客觀的挖掘評(píng)價(jià)模式,為專家挖掘與評(píng)價(jià)提供參考。

4.2 面向企業(yè)的科技扶持

本文通過(guò)企業(yè)成長(zhǎng)預(yù)測(cè)、科技政策推薦為企業(yè)提供科技支持。針對(duì)科技類企業(yè)進(jìn)行成長(zhǎng)預(yù)測(cè),主要考察科技領(lǐng)域企業(yè)近期、遠(yuǎn)期的發(fā)展規(guī)劃、目標(biāo)與措施,科技產(chǎn)品的地位與市場(chǎng)競(jìng)爭(zhēng)能力,企業(yè)在科技研發(fā)方面投入等。

企業(yè)成長(zhǎng)預(yù)測(cè)模型包含4 個(gè)部分,如圖2 所示,分別為一個(gè)信息抽取神經(jīng)網(wǎng)絡(luò)和3 個(gè)殘差深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)[20-21]。首先將各企業(yè)的財(cái)務(wù)指標(biāo)按照時(shí)間展開,如圖中最上面的塊組??紤]到時(shí)間序列在不同頻率上具有不同特征,如短期的接近性、中期的周期性和長(zhǎng)期的趨勢(shì)性,將不同頻率的財(cái)務(wù)指標(biāo)拆分組合,構(gòu)造3 個(gè)深度殘差網(wǎng)絡(luò)。利用殘差網(wǎng)絡(luò)深度深和卷積網(wǎng)絡(luò)范圍廣的特點(diǎn),設(shè)定每一個(gè)網(wǎng)絡(luò)層數(shù),使其最后一層隱藏層能夠?qū)W習(xí)到最原始輸入的所有信息。同時(shí)為了確保信息不會(huì)丟失,在每一層殘差單元中縮減時(shí)間步長(zhǎng)時(shí)同時(shí)考慮增加數(shù)據(jù)維度。3 個(gè)殘差網(wǎng)絡(luò)的輸出做一次拼接操作并接入全連接網(wǎng)絡(luò)學(xué)習(xí)組合后的特征。此外,將企業(yè)相關(guān)的額外信息通過(guò)嵌入層與上述殘差層輸出相加,經(jīng)過(guò)激活函數(shù)得到預(yù)測(cè)值。企業(yè)可根據(jù)下一階段的預(yù)測(cè)值確定自身成長(zhǎng)趨勢(shì);政府可將多個(gè)企業(yè)的預(yù)測(cè)值進(jìn)行排序,選出最有影響力的企業(yè)。

本文基于某省市所有企業(yè)歷史月營(yíng)收數(shù)據(jù)(2017-2019 年)驗(yàn)證該模型的有效性。以該省市所有企業(yè)的最后一個(gè)月營(yíng)收作為測(cè)試集,其他數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。實(shí)驗(yàn)結(jié)果顯示,本文提出的方法相比于經(jīng)典的ARIMA 模型在預(yù)測(cè)誤差指標(biāo)MAE 上降低約12%。

Fig.2 Structure of the proposed prediction model圖2 預(yù)測(cè)模型結(jié)構(gòu)

科技政策推薦應(yīng)用示范有用戶畫像、科技政策庫(kù)、推薦算法3 個(gè)重要模塊。推薦引擎把用戶模型中興趣需求信息和科技政策庫(kù)中的特征信息匹配,同時(shí)使用相應(yīng)的推薦算法進(jìn)行計(jì)算篩選,找到需求方可能感興趣的科技政策信息推薦給企業(yè)和個(gè)人。

4.3 面向人才的科技培育

通過(guò)人才成長(zhǎng)路徑分析和人才服務(wù)推薦,基于科技政務(wù)大數(shù)據(jù)管理平臺(tái),創(chuàng)建面向人才的科技培育應(yīng)用,提高科技核心競(jìng)爭(zhēng)力。

科技人才成長(zhǎng)路徑分析,從人才管理機(jī)制角度考慮入職、任用、晉升等環(huán)節(jié),完善和更新專家?guī)煨畔?,方便日常工作開展;就人才個(gè)體而言,通過(guò)構(gòu)建相關(guān)指標(biāo),分析人才成長(zhǎng)過(guò)程所需資源和政策信息,主動(dòng)提供服務(wù)和政策引導(dǎo),增強(qiáng)科技人才的歸屬感和滿意度。將優(yōu)秀人才的成長(zhǎng)路徑作為典型模式,指導(dǎo)他人的科研道路。

人才服務(wù)推薦根據(jù)用戶和企業(yè)信息分別畫像和抽取特征。對(duì)政府發(fā)布過(guò)的服務(wù)和政策采用自然語(yǔ)言處理等方法對(duì)內(nèi)容進(jìn)行抽象表達(dá),然后根據(jù)用戶使用過(guò)的政府服務(wù)歷史記錄、企業(yè)感興趣的政策記錄,使用協(xié)同過(guò)濾方法對(duì)用戶和企業(yè)分別進(jìn)行個(gè)性化服務(wù)和政策推薦[22-23]。推薦系統(tǒng)架構(gòu)如圖3 所示,面向科技政務(wù)的大數(shù)據(jù)服務(wù)平臺(tái)架構(gòu)分為3 個(gè)層面:最底層是科技政務(wù)大數(shù)據(jù)資源中心,匯集各類大數(shù)據(jù);第二層推薦系統(tǒng)使用相應(yīng)的數(shù)據(jù)接口,獲取相應(yīng)數(shù)據(jù)。這些數(shù)據(jù)首先經(jīng)過(guò)預(yù)處理模塊,比如特征工程等。處理過(guò)的數(shù)據(jù)分別進(jìn)入政府服務(wù)推薦模型和政策推薦模型中[7]。為了更精確地表現(xiàn)用戶和企業(yè)特點(diǎn),大數(shù)據(jù)智能計(jì)算平臺(tái)的畫像模塊用來(lái)獲取人才和企業(yè)特征,經(jīng)過(guò)推薦模型,提供針對(duì)企業(yè)和個(gè)人的個(gè)性化推薦。

Fig.3 Framework of the proposed recommender system圖3 推薦系統(tǒng)架構(gòu)

基于神經(jīng)網(wǎng)絡(luò)的推薦模型如圖4 所示。以對(duì)人才進(jìn)行政府服務(wù)推薦為例,將用戶和服務(wù)信息作為輸入,在第一層的神經(jīng)網(wǎng)絡(luò)中分別轉(zhuǎn)換成低維度的向量表達(dá)。然后將用戶向量和服務(wù)向量合并,輸入到多個(gè)隱藏層疊加起來(lái)的網(wǎng)絡(luò)中,最后輸出得到匹配程度的估計(jì)值。針對(duì)每個(gè)用戶,使用模型估計(jì)得到所有服務(wù)的匹配程度,進(jìn)行排序推薦。

Fig.4 Structure of the proposed recommendation model圖4 推薦模型結(jié)構(gòu)

本文以某省市近兩年用戶訪問政府網(wǎng)站政策的數(shù)據(jù)為基礎(chǔ)驗(yàn)證推薦模型的有效性。把每個(gè)用戶最近訪問記錄的20%作為測(cè)試集,針對(duì)每個(gè)用戶推薦10 項(xiàng)政策文件計(jì)算精度和召回率。實(shí)驗(yàn)結(jié)果顯示,本文提出的基于深度學(xué)習(xí)的方法相比于經(jīng)典的矩陣分解方法在召回率上要高出8%左右。

5 結(jié)語(yǔ)

本文通過(guò)對(duì)科技政務(wù)現(xiàn)有系統(tǒng)和業(yè)務(wù)的深入研究,發(fā)現(xiàn)目前科技政務(wù)系統(tǒng)存在的一些缺陷,如多個(gè)子系統(tǒng)共存、子系統(tǒng)之間相互獨(dú)立、信息不能互通;主要以業(yè)務(wù)流程完成為主,缺乏數(shù)據(jù)分析和輔助決策的能力;無(wú)法面向用戶提供個(gè)性化服務(wù)等。針對(duì)這些問題,本文提出面向科技政務(wù)的大數(shù)據(jù)管理和挖掘平臺(tái)框架,集數(shù)據(jù)采集、數(shù)據(jù)管理、分析挖掘和上層應(yīng)用為一體,推動(dòng)科技服務(wù)便利化。通過(guò)數(shù)據(jù)挖掘組件,特別是提出的基于多時(shí)間粒度的企業(yè)成長(zhǎng)預(yù)測(cè)模型和基于深度學(xué)習(xí)的政策推薦模型,有效提升了科技政務(wù)系統(tǒng)輔助決策能力和個(gè)性化程度。該平臺(tái)能夠幫助政府轉(zhuǎn)變服務(wù)理念,創(chuàng)新治理方式,由電子政務(wù)向智慧政務(wù)升級(jí)。在未來(lái)的工作中,將結(jié)合業(yè)務(wù)場(chǎng)景和相關(guān)數(shù)據(jù)設(shè)計(jì)更多的數(shù)據(jù)分析與挖掘組件,如根據(jù)相關(guān)企業(yè)的發(fā)展?fàn)顩r和政策制定情況,客觀評(píng)價(jià)政府對(duì)經(jīng)濟(jì)的促進(jìn)能力;根據(jù)市民每年事務(wù)辦理的數(shù)目、投訴情況、微博輿論情況等,對(duì)政府服務(wù)公眾能力進(jìn)行評(píng)價(jià)等。

猜你喜歡
政務(wù)科技企業(yè)
企業(yè)
企業(yè)
企業(yè)
敢為人先的企業(yè)——超惠投不動(dòng)產(chǎn)
科技助我來(lái)看云
科技在線
政務(wù)
廣東飼料(2016年5期)2016-12-01 03:43:19
政務(wù)
廣東飼料(2016年3期)2016-12-01 03:43:09
政務(wù)
廣東飼料(2016年2期)2016-12-01 03:43:04
政務(wù)
廣東飼料(2016年1期)2016-12-01 03:42:58
景泰县| 西丰县| 仙游县| 牡丹江市| 南皮县| 绥德县| 龙江县| 桑植县| 嘉荫县| 琼海市| 黑龙江省| 饶平县| 黔东| 哈尔滨市| 临清市| 巴南区| 贡觉县| 泽库县| 西畴县| 腾冲县| 云浮市| 永定县| 牙克石市| 板桥市| 峨眉山市| 民勤县| 封丘县| 宁陕县| 老河口市| 化州市| 阜平县| 沁阳市| 临城县| 岳阳市| 尉犁县| 镇赉县| 延安市| 文化| 手机| 贵南县| 申扎县|