四、我國大數據發(fā)展的態(tài)勢
黨的十八屆五中全會將大數據上升為國家戰(zhàn)略。回顧過去幾年的發(fā)展,我國大數據發(fā)展可總結為:“進步長足,基礎漸厚;喧囂已逝,理性回歸;成果豐碩,短板仍在;勢頭強勁,前景光明”。
作為人口大國和制造大國,我國數據產生能力巨大,大數據資源極為豐富。隨著數字中國建設的推進,各行業(yè)的數據資源采集、應用能力不斷提升,將會導致更快更多的數據積累。預計到2020年,我國數據總量有望達到8000EB(1018),占全球數據總量的21%,將成為名列前茅的數據資源大國和全球數據中心。
我國互聯網大數據領域發(fā)展態(tài)勢良好,市場化程度較高,一些互聯網公司建成了具有國際領先水平的大數據存儲與處理平臺,并在移動支付、網絡征信、電子商務等應用領域取得國際先進甚至領先的重要進展。然而,大數據與實體經濟融合還遠遠不夠,行業(yè)大數據應用的廣度和深度明顯不足,生態(tài)系統亟待形成和發(fā)展。
隨著政務信息化的不斷發(fā)展,各級政府積累了大量與公眾生產生活息息相關的信息系統和數據,并成為最具價值數據的保有者。如何盤活這些數據,更好地支撐政府決策和便民服務,進而引領促進大數據事業(yè)發(fā)展,是事關全局的關鍵。2015年9月,國務院發(fā)布《促進大數據發(fā)展行動綱要》,其中重要任務之一就是“加快政府數據開放共享,推動資源整合,提升治理能力”,并明確了時間節(jié)點,2017年跨部門數據資源共享共用格局基本形成;2018年建成政府主導的數據共享開放平臺,打通政府部門、企事業(yè)單位間的數據壁壘,并在部分領域開展應用試點;2020年實現政府數據集的普遍開放。隨后,國務院和國務院辦公廳又陸續(xù)印發(fā)了系列文件,推進政務信息資源共享管理、政務信息系統整合共享、互聯網+政務服務試點、政務服務一網一門一次改革等,推進跨層級、跨地域、跨系統、跨部門、跨業(yè)務的政務信息系統整合、互聯、協同和數據共享,用政務大數據支撐“放管服”改革落地,建設數字政府和智慧政府。目前,我國政務領域的數據開放共享已取得了重要進展和明顯效果。例如:浙江省推出的“最多跑一次”改革,是推進供給側結構性改革、落實“放管服”改革、優(yōu)化營商環(huán)境的重要舉措。以衢州市不動產交易為例,通過設立綜合窗口再造業(yè)務流程,群眾由原來跑國土、住建、稅務3個窗口8次提交3套材料,變?yōu)橹慌芫C合窗口1個窗口1次提交1套材料,效率大幅提高。據有關統計,截至2019年上半年,我國已有82個省級、副省級和地級政府上線了數據開放平臺,涉及41.93%的省級行政區(qū)、66.67%的副省級城市和18.55%的地級城市。
我國已經具備加快技術創(chuàng)新的良好基礎。在科研投入方面,前期通過國家科技計劃在大規(guī)模集群計算、服務器、處理器芯片、基礎軟件等方面系統性部署了研發(fā)任務,成績斐然?!笆濉逼陂g在國家重點研發(fā)計劃中實施了“云計算和大數據”重點專項。當前科技創(chuàng)新2030大數據重大項目正在緊鑼密鼓地籌劃、部署中。我國在大數據內存計算、協處理芯片、分析方法等方面突破了一些關鍵技術,特別是打破“信息孤島”的數據互操作技術和互聯網大數據應用技術已處于國際領先水平;在大數據存儲、處理方面,研發(fā)了一些重要產品,有效地支撐了大數據應用;國內互聯網公司推出的大數據平臺和服務,處理能力躋身世界前列。
國家大數據戰(zhàn)略實施以來,地方政府紛紛響應聯動、積極謀劃布局。國家發(fā)改委組織建設11個國家大數據工程實驗室,為大數據領域相關技術創(chuàng)新提供支撐和服務。發(fā)改委、工信部、中央網信辦聯合批復貴州、上海、京津冀、珠三角等8個綜合試驗區(qū),正在加快建設。各地方政府紛紛出臺促進大數據發(fā)展的指導政策、發(fā)展方案、專項政策和規(guī)章制度等,使大數據發(fā)展呈蓬勃之勢。
然而,我們也必須清醒地認識到我國在大數據方面仍存在一系列亟待補上的短板。
一是大數據治理體系尚待構建。首先,法律法規(guī)滯后。目前,我國尚無真正意義上的數據管理法規(guī),只在少數相關法律條文中有涉及到數據管理、數據安全等規(guī)范的內容,難以滿足快速增長的數據管理需求。其次,共享開放程度低。推動數據資源共享開放,將有利于打通不同部門和系統的壁壘,促進數據流轉,形成覆蓋全面的大數據資源,為大數據分析應用奠定基礎。我國政府機構和公共部門已經掌握巨大的數據資源,但存在“不愿”“不敢”和“不會”共享開放的問題。例如:在“最多跑一次”改革中,由于技術人員缺乏,政務業(yè)務流程優(yōu)化不足,涉及部門多、鏈條長,長期以來多頭管理、各自為政等問題,導致很多地區(qū)、鄉(xiāng)鎮(zhèn)的綜合性窗口難建立、數據難流動、業(yè)務系統難協調。同時,由于辦事流程不規(guī)范,網上辦事大廳指南五花八門,以至于同一個縣市辦理同一項事件,需要的材料、需要集成的數據在各鄉(xiāng)鎮(zhèn)的政務審批系統里卻各有不同,造成群眾不能一次性獲得準確的相關信息而需要“跑多次”。當前,我國的政務數據共享開放進程,相對于《行動綱要》明確的時間節(jié)點,已明顯落后,且數據質量堪憂。不少地方的政務數據開放平臺,仍然存在標準不統一、數據不完整、不好用甚至不可用等問題。政務數據共享開放意義重大,仍需堅持不懈地持續(xù)推進。此外,在數據共享與開放的實施過程中,各地還存在片面強調數據物理集中的“一刀切”現象,對已有信息化建設投資保護不足,造成新的浪費。第三,安全隱患增多。近年來,數據安全和隱私數據泄露事件頻發(fā),凸顯大數據發(fā)展面臨的嚴峻挑戰(zhàn)。在大數據環(huán)境下,數據在采集、存儲、跨境跨系統流轉、利用、交易和銷毀等環(huán)節(jié)的全生命周期過程中,所有權與管理權分離,真假難辨,多系統、多環(huán)節(jié)的信息隱性留存,導致數據跨境跨系統流轉追蹤難、控制難,數據確權和可信銷毀也更加困難。
二是核心技術薄弱。基礎理論與核心技術的落后導致我國信息技術長期存在“空心化”和“低端化”問題,大數據時代需避免此問題在新一輪發(fā)展中再次出現。近年來,我國在大數據應用領域取得較大進展,但是基礎理論、核心器件和算法、軟件等層面,較之美國等技術發(fā)達國家仍明顯落后。在大數據管理、處理系統與工具方面,我國主要依賴國外開源社區(qū)的開源軟件,然而,由于我國對國際開源社區(qū)的影響力較弱,導致對大數據技術生態(tài)缺乏自主可控能力,成為制約我國大數據產業(yè)發(fā)展和國際化運營的重大隱患。
三是融合應用有待深化。我國大數據與實體經濟融合不夠深入,主要問題表現在:基礎設施配置不到位,數據采集難度大;缺乏有效引導與支撐,實體經濟數字化轉型緩慢;缺乏自主可控的數據互聯共享平臺等。當前,工業(yè)互聯網成為互聯網發(fā)展的新領域,然而仍存在不少問題:政府熱、企業(yè)冷,政府時有“項目式”“運動式”推進,而企業(yè)由于沒看到直接、快捷的好處,接受度低;設備設施的數字化率和聯網率偏低;大多數大企業(yè)仍然傾向打造難以與外部系統交互數據的封閉系統,而眾多中小企業(yè)數字化轉型的動力和能力嚴重不足;國外廠商的設備在我國具有壟斷地位,這些企業(yè)紛紛推出相應的工業(yè)互聯網平臺,搶占工業(yè)領域的大數據基礎服務市場。
五、若干思考和建議
最后,我想基于自己在大數據領域的研究實踐,匯報若干思考和建議。一家之見,僅供參考。
(一)大力發(fā)展行業(yè)大數據應用
當前,我國互聯網領域的大數據應用市場化程度高、發(fā)展較好,但行業(yè)應用廣度和深度明顯不足,生態(tài)系統亟待形成和發(fā)展。事實上,與實體經濟緊密結合的行業(yè)大數據應用蘊含了更加巨大的發(fā)展?jié)摿蛢r值。以制造業(yè)為例,麥肯錫研究報告稱:制造企業(yè)在利用大數據技術后,其生產成本能夠降低10%—15%。而大數據技術對制造業(yè)的影響遠非成本這一個方面。利用源于產品生命周期中市場、設計、制造、服務、再利用等各個環(huán)節(jié)數據,制造業(yè)企業(yè)可以更加精細、個性化地了解客戶需求;建立更加精益化、柔性化、智能化的生產系統;創(chuàng)造包括銷售產品、服務、價值等多樣的商業(yè)模式;并實現從應激式到預防式的工業(yè)系統運轉管理模式的轉變。制造業(yè)是國民經濟不可或缺的一環(huán),也是一個國家競爭力背后的強大力量支撐。我國制造業(yè)位居世界第一,卻大而不強。企業(yè)創(chuàng)新能力不足,高端和高價值產品欠缺,在國際產業(yè)分工中處于中低端,大力推動制造業(yè)大數據應用的發(fā)展,對產業(yè)升級轉型至關重要。
當前,我國不同行業(yè)領域正在積極推進數字化轉型、網絡化重構、智能化提升,推動行業(yè)大數據應用,也是推進數字中國建設的重要途徑和基礎。
(二)建立系統全面的大數據治理體系
大數據是數字經濟的關鍵要素,強大的信息技術產業(yè)和全面深度信息化賦能的傳統行業(yè)無疑是數字經濟的基礎!大數據治理須從營造大數據產業(yè)發(fā)展環(huán)境的視角予以全面、系統化考慮!
我以為,在一國之范圍內,大數據治理體系建設涉及國家、行業(yè)和組織三個層次,至少包含數據的資產地位確立、管理體制機制、共享與開放、安全與隱私保護等四方面內容,需要從制度法規(guī)、標準規(guī)范、應用實踐和支撐技術等視角多管齊下,提供支撐。
在國家層次,重點是要在法律法規(guī)層面明確數據的資產地位,奠定數據確權、流通、交易和保護的基礎,制定促進數據共享開放的政策法規(guī)和標準規(guī)范,促進政務數據和行業(yè)數據的融合應用,并且出臺數據安全與隱私保護的法律法規(guī),保障國家、組織和個人的數據安全。在行業(yè)層次,重點是要在國家相關法律法規(guī)框架下,充分考慮本行業(yè)中企業(yè)的共同利益與長效發(fā)展,建立規(guī)范行業(yè)數據管理的組織機構和數據管控制度,制定行業(yè)內數據共享與開放的規(guī)則和技術規(guī)范,促進行業(yè)內數據的共享交換和融合應用。在組織層次,重點是要提升企業(yè)對數據全生命期的管理能力,促進企業(yè)內部和企業(yè)間的數據流通,提升數據變現能力,保障企業(yè)自身的數據安全及客戶的數據安全和隱私信息。
在數據治理體系建設中,數據共享開放是大數據資源建設的前提,在現階段重要性尤其突出。在平衡數據共享開放和隱私保護、數據安全的關系時,我以為,還是需要強調應用先行、安全并重的原則。數據共享開放不應被孤立看待,可能需要綜合考慮數據的使用場合及數據主體的權益。如,數據集中管理可能帶來保管上的安全問題,然而數據融合才能產生價值,一定程度的集中是趨勢所在,也更利于建立更強大可靠的保護機制;多源數據的融合可能導致信息泄露,然而在確知風險前,是否需要因其“可能性”而拒絕技術的應用?數據脫敏仍然可能存在隱私泄露的風險,是否允許個體在知情前提下“用隱私換方便”“用隱私換治療換健康”?是否允許使用符合當前“標準”、但無法確保未來一定不出現信息泄露的脫敏方法,并對相關應用予以免責?當然,加強兼顧隱私保護、數據安全和數據流動利用的新技術研發(fā),也非常必要。當前,如安全多方計算、同態(tài)加密、聯邦學習等技術研發(fā),希望允許擁有數據的各方在不向其他組織或個人公開數據中所含敏感信息的情況下,實現數據的融合利用。雖然這些技術尚處于發(fā)展的初級階段,但因其廣闊的應用前景而受到普遍關注。
另外,打破信息孤島、盤活數據存量是當前一項緊迫的任務,而在此過程中,不宜過分強調物理集中,而應將邏輯互聯作為打通信息“孤島”的手段,邏輯互聯先行,物理集中跟進。在數據共享體系建設中,需要在一定層級上構建物理分散、邏輯統一、管控可信、標準一致的政務信息資源共享交換體系,在不改變現有信息系統與數據資源的所有權及管理格局的前提下,明晰責權利,即:數據應用部門提需求、數據擁有部門做響應、交換平臺管理部門保流轉。同時,集約化的政務云建設正成為政府、企業(yè)建設新的信息系統的首選方案,如何在新一輪建設熱潮中,從規(guī)劃、立項審批、建設、審計等環(huán)節(jié)以及方案指導、標準規(guī)范和技術支持等方面給予全方位保障,盡可能避免新“孤島”的產生,也是一項重大挑戰(zhàn)。
(三)以開源為基礎構建自主可控的大數據產業(yè)生態(tài)
在大數據時代,軟件開源和硬件開放已成為不可逆的趨勢,掌控開源生態(tài),已成為國際產業(yè)競爭的焦點。建議采用“參與融入、蓄勢引領”的開源推進策略,一方面鼓勵我國企業(yè)積極“參與融入”國際成熟的開源社區(qū),爭取話語權;另一方面,也要在建設基于中文的開源社區(qū)方面加大投入,匯聚國內軟硬件資源和開源人才,打造自主可控開源生態(tài),在學習實踐中逐漸成長壯大,伺機實現引領發(fā)展。中文開源社區(qū)的建設,需要國家在開源相關政策法規(guī)和開源基金會制度建立方面給予支持。此外,在開源背景下,對“自主可控”的內涵定義也有待更新,不一定強調硬件設計和軟件代碼的所有權,更多應體現在對硬件設計方案和軟件代碼的理解、掌握、改進及應用能力。
(四)積極推動國際合作并籌劃布局跨國數據共享機制
2018年11月17日,習近平總書記在APEC工商領導人峰會上發(fā)表主旨演講指出“經濟全球化是人類社會發(fā)展必經之路”“各國都是全球合作鏈條中的一環(huán)”。在數字經濟快速發(fā)展的時代背景下,我國應該積極推動在大數據技術和應用方面的國際合作,建立跨國數據共享機制,與其他國家一起分享數字經濟的紅利,同時也使我國獲得更多發(fā)展機遇和更大發(fā)展空間,積極促進數字經濟下人類利益共同體和命運共同體的構建。當前,我國正在積極推動“一帶一路”合作發(fā)展。各國在合作的各個領域都將產生大量的數據。建議積極推進跨國的大數據治理合作,在保障數據安全的前提下,促進數據跨境流動,從而形成圍繞國家合作各個領域的大數據資源,為數字經濟領域的國際合作奠定堅實的基礎?!耙粠б宦贰毖鼐€大都屬發(fā)展中國家,無論技術還是經濟水平較之發(fā)達國家都有明顯差距。而數字經濟這一新經濟形態(tài)的成型發(fā)展將帶給包括中國在內的各發(fā)展中國家經濟轉型發(fā)展的歷史性機遇期。經濟后發(fā)國家有機會在新經濟的全球壟斷性格局形成之前,與發(fā)達國家站在同一起跑線上,并且由于沒有“路徑依賴”所帶來的歷史包袱,也有可能在新一輪的競爭中占有優(yōu)勢。
(五)未雨綢繆,防范大數據發(fā)展可能帶來的新風險
大數據發(fā)展可能導致一系列新的風險。例如,數據壟斷可能導致數據“黑洞”現象。一些企業(yè)憑借先發(fā)展起來的行業(yè)優(yōu)勢,不斷獲取行業(yè)數據,但卻“有收無放”,呈現出數據壟斷的趨勢。這種數據壟斷不僅不利于行業(yè)的健康發(fā)展,而且有可能對國家安全帶來沖擊和影響。又如,數據和算法可能導致人們對其過分“依賴”及社會“被割裂”等倫理問題。大數據分析算法根據各種數據推測用戶的偏好并推薦內容,在帶來便利的同時,也導致人們只看到自己“希望看到的”信息,從而使人群被割裂為多個相互之間難以溝通、理解的群體,其可能引發(fā)的社會問題將是難以“亡羊補牢”的。
需要看到,以互聯網為代表的新一代信息技術所帶來的這場社會經濟“革命”,在廣度、深度和速度上都將是空前的,也會是遠遠超出我們從工業(yè)社會獲得的常識和認知、遠遠超出我們的預期的,適應信息社會的個體素質的養(yǎng)成、滿足未來各種新興業(yè)態(tài)就業(yè)需求的合格勞動者的培養(yǎng),將是我們面臨的巨大挑戰(zhàn)!唯有全民提升對大數據的正確認知,具備用大數據思維認識和解決問題的基本素質和能力,才有可能積極防范大數據帶來的新風險;唯有加快培養(yǎng)適應未來需求的合格人才,才有可能在數字經濟時代形成國家的綜合競爭力。
(作者簡介:梅宏,院士,軍事科學院副院長)