楊寧
中國聯(lián)合網(wǎng)絡(luò)通信有限公司莘縣分公司 山東聊城 252400
隨著云時代的來臨,大數(shù)據(jù)也吸引了越來越多的關(guān)注。大數(shù)據(jù)應(yīng)用范圍廣泛,影響著生活的方方面面。因此,國家要核心數(shù)據(jù)要進(jìn)行嚴(yán)格保護(hù),要區(qū)分好涉密數(shù)據(jù),對非涉密性大數(shù)據(jù)的共享也要做到有效的管理,加強(qiáng)國際間的交流與合作,積極應(yīng)對國家大數(shù)據(jù)秘密保護(hù)挑戰(zhàn)[1]。
大數(shù)據(jù)指的是在相應(yīng)時間內(nèi)無法用常規(guī)方法對信息開展采集、捕捉及管理的數(shù)據(jù)集合,是需要借助其他處理手段方可有效提煉信息價值的資產(chǎn)??偟膩碚f,大數(shù)據(jù)具有數(shù)據(jù)存儲量大、多樣性、高速性等特征,其中,數(shù)據(jù)存儲量大表明大數(shù)據(jù)的數(shù)據(jù)量十分龐大,如今在一些大型企業(yè)、專業(yè)工業(yè)計算機(jī)中的數(shù)據(jù)容量可達(dá)到EB級別;多樣性表明大數(shù)據(jù)既包含以往的結(jié)構(gòu)化數(shù)據(jù),還包含廣泛采用文件系統(tǒng)存儲的半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù);高速性則表明大數(shù)據(jù)要求數(shù)據(jù)分析處理應(yīng)具備實時性。通常而言,大數(shù)據(jù)的處理流程主要可分為:數(shù)據(jù)采集與集成、數(shù)據(jù)分析及數(shù)據(jù)解釋[2]。
對于大數(shù)據(jù)的關(guān)鍵技術(shù)而言,主要包括數(shù)據(jù)采集技術(shù),數(shù)據(jù)儲存技術(shù),數(shù)據(jù)表示、檢索與訪問,數(shù)據(jù)應(yīng)用與深層挖掘等,具體而言:①數(shù)據(jù)采集技術(shù)。數(shù)據(jù)采集技術(shù)是大數(shù)據(jù)技術(shù)實現(xiàn)各項功能的重要基礎(chǔ),換言之,大數(shù)據(jù)技術(shù)要想實現(xiàn)對各項數(shù)據(jù)的有效處理,切實提升數(shù)據(jù)應(yīng)用準(zhǔn)確性,必須要得到數(shù)據(jù)采集技術(shù)所提供的有力數(shù)據(jù)支持。一般來說,大數(shù)據(jù)技術(shù)的數(shù)據(jù)采集主要通過管理系統(tǒng)、科學(xué)實驗、物理信息系統(tǒng)等系統(tǒng)進(jìn)行實現(xiàn),依托對該部分系統(tǒng)的整合應(yīng)用,可實現(xiàn)對一系列數(shù)據(jù)的高效、全面采集,進(jìn)而為大數(shù)據(jù)技術(shù)實際應(yīng)用提供可靠的數(shù)據(jù)支撐。將數(shù)據(jù)采集技術(shù)應(yīng)用于人工智能中,可支持人工智能設(shè)備對采集數(shù)據(jù)進(jìn)行讀取,并開展好初步化分析工作,實現(xiàn)統(tǒng)計分析功能,進(jìn)一步提升數(shù)據(jù)應(yīng)用精準(zhǔn)性。②數(shù)據(jù)儲存技術(shù)。數(shù)據(jù)采集結(jié)束后,可通過數(shù)據(jù)存儲技術(shù),以實現(xiàn)對龐大數(shù)據(jù)的統(tǒng)一存儲。因為大數(shù)據(jù)技術(shù)應(yīng)用對數(shù)據(jù)提出了十分嚴(yán)格的要求,所以應(yīng)設(shè)置相應(yīng)的存儲空間以對海量數(shù)據(jù)進(jìn)行存儲,同時要確保數(shù)據(jù)的安全性、穩(wěn)定性。目前,常用的數(shù)據(jù)存儲技術(shù)主要可分為傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)存儲、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)存儲、結(jié)構(gòu)化和非結(jié)構(gòu)化混合數(shù)據(jù)存儲。對于人工智能設(shè)備而言,設(shè)備運行必須引入數(shù)據(jù)存儲技術(shù),實現(xiàn)可靠的數(shù)據(jù)存儲功能。在人工智能終端上,相關(guān)人員通過數(shù)據(jù)調(diào)取操作,可實現(xiàn)對應(yīng)用數(shù)據(jù)直接調(diào)取,以此不僅可提升人工智能運行效率,還可降低數(shù)據(jù)傳輸成本。③數(shù)據(jù)表示、檢索與訪問。如前文所述,大數(shù)據(jù)具有數(shù)據(jù)存儲量大、多樣性等特征?;诖髷?shù)據(jù)技術(shù)支持,對于數(shù)據(jù)的獲取要在數(shù)據(jù)庫中通過關(guān)鍵詞檢索進(jìn)行實踐,而由于檢索操作通常處在平行狀態(tài)下,這使得檢索結(jié)果可能會存在漏洞,難以滿足數(shù)據(jù)檢索需求。為此,通過引入HDFS系統(tǒng),可實現(xiàn)隨訪訪問數(shù)據(jù)檢索功能,保障各項工作有序運行。④數(shù)據(jù)應(yīng)用與深層挖掘。鑒于大數(shù)據(jù)的特征,還應(yīng)對數(shù)據(jù)開展深層挖掘及分析。面對龐大數(shù)據(jù),數(shù)據(jù)應(yīng)用與深層挖掘可迅速挖掘數(shù)據(jù),并在數(shù)據(jù)庫中獲取對應(yīng)數(shù)據(jù)。在大型數(shù)據(jù)庫中,通過這一技術(shù)可保證獲取數(shù)據(jù)的準(zhǔn)確性,依托深層挖掘分析功能,可有效降低數(shù)據(jù)應(yīng)用風(fēng)險,切實提升數(shù)據(jù)評定與選擇的科學(xué)性[3]。
當(dāng)前,大數(shù)據(jù)處理技術(shù)已經(jīng)在各行各業(yè)中得到廣泛應(yīng)用,而且很多國家已經(jīng)將此技術(shù)和人工智能技術(shù)進(jìn)行良好結(jié)合,進(jìn)而充分發(fā)揮出了這兩項技術(shù)的優(yōu)勢。從目前我國的大數(shù)據(jù)技術(shù)來看,其應(yīng)用和發(fā)展都十分迅速,該技術(shù)在信息管理、企業(yè)管理、電子政務(wù)、金融、制造、科研、教育、能源等各個領(lǐng)域的發(fā)展與變革中都發(fā)揮出了顯著優(yōu)勢。以下是大數(shù)據(jù)技術(shù)在我國幾個典型領(lǐng)域的應(yīng)用現(xiàn)狀的分析。
所謂工業(yè)物聯(lián)網(wǎng),就是在工業(yè)生產(chǎn)過程中所涉及的產(chǎn)品、設(shè)備等各項數(shù)據(jù)的采集和管理。通常情況下,其數(shù)據(jù)管理采用遠(yuǎn)程管理形式,如設(shè)備的歷史數(shù)據(jù)處理、運行狀態(tài)監(jiān)控等。而在工業(yè)生產(chǎn)設(shè)備長期運行監(jiān)控過程中,獲取的大量數(shù)據(jù)則是對工業(yè)生產(chǎn)企業(yè)進(jìn)行產(chǎn)能分析、設(shè)備故障發(fā)生概率以及產(chǎn)品合格率檢測等主要信息來源。因這些數(shù)據(jù)十分龐大,我們就將其稱為工業(yè)大數(shù)據(jù)。在對工業(yè)大數(shù)據(jù)進(jìn)行采集、預(yù)處理、挖掘、分析和儲存的過程中,一方面需要通過專業(yè)化平臺進(jìn)行分析、儲存與展現(xiàn);另一方面則需要借助于大數(shù)據(jù)技術(shù)中的數(shù)據(jù)驅(qū)動技術(shù)進(jìn)行各種設(shè)備故障的檢測,以此實現(xiàn)工業(yè)生產(chǎn)設(shè)備的合理優(yōu)化。
網(wǎng)絡(luò)信息時代,人們會將大多數(shù)閑暇時間花在手機(jī)上,在這樣的情況下,各種基于手機(jī)客戶端的視頻平臺、音樂平臺、咨詢平臺以及購物平臺等相繼出現(xiàn)。比如,在手機(jī)購物平臺的應(yīng)用中,人們進(jìn)行商品選擇就像是對“消費者數(shù)據(jù)填空題”進(jìn)行的回答,借助大數(shù)據(jù)技術(shù)中的數(shù)據(jù)挖掘技術(shù),平臺能夠總結(jié)出用戶的購物類型,當(dāng)用戶下一次登錄該購物平臺時,平臺終端會根據(jù)用戶之前購買的商品進(jìn)行類似商品推送。同樣的,在其他平臺的應(yīng)用中,借助于數(shù)據(jù)挖掘技術(shù),也可以挖掘并記錄下用戶的習(xí)慣,以此實現(xiàn)相關(guān)信息的推送。由此可見,大數(shù)據(jù)技術(shù)中的數(shù)據(jù)挖掘技術(shù)可通過用戶對相應(yīng)平臺的應(yīng)用習(xí)慣進(jìn)行用戶“畫像”,以此實現(xiàn)對用戶年齡、性格、愛好以及消費等級等各項信息的推斷。另外,運用數(shù)據(jù)挖掘技術(shù)也可以對用戶的人口屬性、興趣特征、資產(chǎn)情況、消費特征、常駐城市以及位置特征等進(jìn)行科學(xué)推斷,讓用戶畫像更加具體[4]。
隨著智能醫(yī)療的不斷發(fā)展,其應(yīng)用逐漸擴(kuò)展至診療活動的各個環(huán)節(jié),以此不僅提升了診療、管理的質(zhì)量效率,還可促進(jìn)了區(qū)域醫(yī)療資源的優(yōu)化整合。以精準(zhǔn)醫(yī)療為例,作為一項新型診療技術(shù),精準(zhǔn)醫(yī)療通過人類基因測序技術(shù),依托大數(shù)據(jù)技術(shù)探究個體蛋白質(zhì)組、基因組與相關(guān)疾病之間的聯(lián)系,精確定位相關(guān)疾病的發(fā)病機(jī)制,進(jìn)一步獲得精準(zhǔn)治療靶點,評估重大缺陷性疾病。和傳統(tǒng)治療手段相比,精準(zhǔn)醫(yī)療既精確又高效便捷,并可極大減少對患者的創(chuàng)傷,對已確診和未確診的治療及防御均具備十分重要的臨床價值?,F(xiàn)階段,精準(zhǔn)醫(yī)療在腫瘤、遺傳病、婦科等領(lǐng)域得到廣泛推廣。
在科學(xué)技術(shù)發(fā)展與教育改革深化的過程中,大數(shù)據(jù)技術(shù)在教育領(lǐng)域發(fā)揮的作用日益顯著。目前來看,大數(shù)據(jù)技術(shù)在我國教育領(lǐng)域的應(yīng)用主要分為3個方面:第一是在適應(yīng)性教學(xué)中的應(yīng)用,第二是在教學(xué)規(guī)律發(fā)現(xiàn)中的應(yīng)用,第三是在校園信息化管理中的應(yīng)用。比如,運用基于大數(shù)據(jù)技術(shù)的Learnsprout系統(tǒng),可對高考備考進(jìn)行科學(xué)評價,及時發(fā)現(xiàn)學(xué)生學(xué)習(xí)過程中的問題所在,通過早期干預(yù)的方式來解決學(xué)生的學(xué)習(xí)問題,并根據(jù)實際情況提供輔助,這樣可有效提升學(xué)生的學(xué)習(xí)效率與質(zhì)量。大數(shù)據(jù)技術(shù)與應(yīng)用實驗室配置。由于我國的院校目前申請大數(shù)據(jù)技術(shù)與應(yīng)用才剛剛經(jīng)過三年,因此,在教學(xué)中教學(xué)基礎(chǔ)設(shè)施的配置、軟硬件設(shè)施的資源都不是很到位。有些各大學(xué)院在大數(shù)據(jù)實驗室的建立上正處在籌備階段,或是剛剛獲得相關(guān)部門批準(zhǔn)。盡管如此,大部分的高校還是缺少可以讓學(xué)生實際參與的實踐案例及大數(shù)據(jù)發(fā)展行業(yè)的數(shù)據(jù),使得學(xué)生直接受到了理論知識的灌輸,而沒有辦法進(jìn)行實際的操作。如果理論和實際無法相結(jié)合,將會導(dǎo)致所培養(yǎng)的學(xué)生在畢業(yè)時無法找到合適的行業(yè)就業(yè),也沒有辦法達(dá)到市場對大數(shù)據(jù)人才的需求。因此,這將對各大院校大數(shù)據(jù)技術(shù)運用專業(yè)人才培養(yǎng)適應(yīng)社會需求產(chǎn)生了極大的挑戰(zhàn)[5]。
隨著社會經(jīng)濟(jì)的不斷發(fā)展,各種先進(jìn)科技不斷被引入至城市化發(fā)展中,其中大數(shù)據(jù)技術(shù)便在智能建筑中得到應(yīng)用,為智能建筑發(fā)展提供了可靠技術(shù)支持。首先,面對近年來城市中不斷增多的高層建筑,如果采用以往的消防技術(shù)必然會帶來一系列不利影響,由于樓層較高,加之發(fā)生火災(zāi)時無法使用電梯,這便很大程度上加大了消防工作的難度。而在如今的智能建筑中,這些問題均得到了有效解決,通過應(yīng)用大數(shù)據(jù)技術(shù)可在高層建筑設(shè)計時在相應(yīng)區(qū)域安裝消防噴淋頭,一旦發(fā)生火災(zāi),可保證及時實現(xiàn)滅火效果。并且消防噴淋頭還可實現(xiàn)攝像功能,通過對現(xiàn)場情況進(jìn)行監(jiān)控,為消防人員提供現(xiàn)場數(shù)據(jù),進(jìn)而實現(xiàn)對火災(zāi)的有效防范。其次,還可將大數(shù)據(jù)技術(shù)應(yīng)用于智能建筑中的溫度調(diào)節(jié)系統(tǒng)。相關(guān)技術(shù)人員可通過智能技術(shù)對建筑的溫濕度進(jìn)行調(diào)節(jié),同時通過大數(shù)據(jù)技術(shù)可監(jiān)測區(qū)域的人員情況,依托模型建立匹配,然后對數(shù)據(jù)信息開展分析,獲取室內(nèi)溫度的最佳數(shù)值,對區(qū)域溫度開展調(diào)節(jié),以此為居住者創(chuàng)造良好的居住環(huán)境,顯著提升人們的居住體驗。
在生態(tài)系統(tǒng)中涉及的大數(shù)據(jù)主要包括植被、土壤、海洋以及大氣等各種生態(tài)數(shù)據(jù)。這些數(shù)據(jù)不僅具有非常龐大的信息量,而且信息類型十分復(fù)雜,傳統(tǒng)形式的數(shù)據(jù)分析和處理技術(shù)并不能有效滿足實際的分析與處理需求,而通過大數(shù)據(jù)技術(shù)的合理應(yīng)用,便可實現(xiàn)各項生態(tài)系統(tǒng)數(shù)據(jù)信息的分析與處理。比如,在氣象觀測中,將大數(shù)據(jù)技術(shù)應(yīng)用到大氣數(shù)據(jù)分析與可視化系統(tǒng)中,便可通過數(shù)據(jù)分析系統(tǒng)和數(shù)據(jù)處理算法的科學(xué)結(jié)合實現(xiàn)對氣象數(shù)據(jù)的精準(zhǔn)分析和處理。近年來,生態(tài)退化的表現(xiàn)越來越突出,相關(guān)的問題也在快速擴(kuò)散,森林與土地的退化對生物多樣性造成了不良的影響,而水資源的退化則直接影響到了人們的生活。生態(tài)系統(tǒng)是一個循環(huán)性的體系,而生態(tài)退化問題的發(fā)生也并不是一蹴而就的,而是在多種因素共同影響的作用下發(fā)生的復(fù)雜反應(yīng),是量變逐漸積累、最終形成質(zhì)變的結(jié)果。在對這一問題進(jìn)行完善的過程中,除了需要運用生態(tài)學(xué)、環(huán)境學(xué)的知識之外,還需要了解生物學(xué)、地質(zhì)學(xué)等方面的內(nèi)容。
2019年的新冠肺炎疫情得到充分證明。這種全國性、全球性使城市公共衛(wèi)生事件的輿情通過互聯(lián)網(wǎng)延伸到全球任何一個角落,大數(shù)據(jù)發(fā)揮出了特別大的優(yōu)點。首先,疫情防控期間每天各地方感染者數(shù)據(jù)公開,政府此番舉動讓人民及時了解到新冠疫情感染性極強(qiáng),提高了人民對于新冠疫情的重視程度,從而讓疫情得到了有效控制。從每天感染者數(shù)字的增加到最后治愈人數(shù)的增加,降低了人民的恐懼感。大數(shù)據(jù)技術(shù)帶來了網(wǎng)絡(luò)輿情引導(dǎo)的精準(zhǔn)化。通過基于大數(shù)據(jù)技術(shù)的健康碼、行程碼等數(shù)據(jù)的精準(zhǔn)分析,為城市攜起手來共同應(yīng)對公共衛(wèi)生事件,為城市、國家和全球的安全與安寧作出歷史性貢獻(xiàn)。其次,疫情防控期間需要注冊健康碼,只有綠碼才能正常通行,通過掃描防疫大數(shù)據(jù)碼可查詢到活動軌跡,去過高風(fēng)險地區(qū)或者健康碼呈現(xiàn)紅色和橙色需要隔離,這也是疫情得到快速控制的主要因素之一。
任何事情都具有兩面性,有利必有弊,大數(shù)據(jù)的弊主要體現(xiàn)在誤導(dǎo)網(wǎng)絡(luò)輿情及數(shù)據(jù)的泄露。首先,在經(jīng)濟(jì)全球化的今天,重大突發(fā)公共衛(wèi)生事件處理不好,就可能發(fā)展成為影響政治、經(jīng)濟(jì)、社會穩(wěn)定和外交的重大問題。過去那種家丑不可外揚的觀念,在今天的信息時代一定要改變。疫情是捂不住的,延誤時機(jī)只能使自己被動,這個教訓(xùn)是深刻的?!睂嶋H上,在網(wǎng)絡(luò)輿情引導(dǎo)中,網(wǎng)絡(luò)輿情混亂很多都是源自政府信息不公開。少數(shù)城市政府知情而說謊,公眾不知情而造謠,網(wǎng)民傳播網(wǎng)絡(luò)輿情就越混亂。再如在2019年12月發(fā)生的新冠病毒肺炎疫情中,同樣發(fā)生了壓制網(wǎng)絡(luò)輿情現(xiàn)象,吹哨人李文亮等8位醫(yī)生最先發(fā)布的信息被隱瞞,以致出現(xiàn)了“萬家宴”等本可避免的悲劇,這給網(wǎng)絡(luò)輿情引導(dǎo)及疫情防控埋下后患。當(dāng)公共衛(wèi)生事件沒有控制住時,來自全球各地的多個不利網(wǎng)絡(luò)輿情疊加時,公眾必然極度恐慌。其次,數(shù)據(jù)泄露的例子比比皆是,人們經(jīng)常會接收到各種推銷電話和騷擾信息,這可能是人們無意中的泄露甚至也可能是不法分子進(jìn)行的數(shù)據(jù)買賣。數(shù)據(jù)買賣往小了說侵犯個人的隱私,往大了說可能危害國家利益。對于國家來說,大數(shù)據(jù)不斷積累,有可能發(fā)生從量變到質(zhì)變。最終會對國家?guī)砦:?,隨著數(shù)據(jù)的積累,可能現(xiàn)在用處不大的數(shù)據(jù)對將來的研究會產(chǎn)生重要的影響,也會出現(xiàn)隱患。因此,要確保無用數(shù)據(jù)的處理不留痕跡。
綜上所述,在今后的工作中,要加大監(jiān)督力度嚴(yán)格把關(guān)數(shù)據(jù)應(yīng)用的隱秘性,同時加大對數(shù)據(jù)保護(hù)高層次人才培養(yǎng),對國家核心數(shù)據(jù)要進(jìn)行嚴(yán)格保護(hù),要區(qū)分好涉密數(shù)據(jù),充分發(fā)揮大數(shù)據(jù)技術(shù)的應(yīng)用優(yōu)勢,推進(jìn)對大數(shù)據(jù)技術(shù)的科學(xué)合理應(yīng)用,為現(xiàn)代社會發(fā)展進(jìn)步貢獻(xiàn)一份力。