◆王劭方
信息時代的數(shù)據(jù)安全研究與分析
◆王劭方
(國家計算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心甘肅分中心 甘肅 730030)
由于近些年來的科學(xué)技術(shù),電子信息技術(shù)已經(jīng)將人類文明推進(jìn)到了信息化新時代?,F(xiàn)階段社會的高速智慧城市建設(shè)、工業(yè)化的人工智能化生產(chǎn)以及人們的日常生活娛樂都已經(jīng)與信息數(shù)據(jù)緊密相連,在體驗到信息化數(shù)據(jù)提供的便捷、高效、精準(zhǔn)服務(wù)的同時,也需要做好各方面的信息數(shù)據(jù)安全防范工作。本文通過對人工智能信息化平臺進(jìn)行調(diào)研評估,分析人工智能信息數(shù)據(jù)中可能出現(xiàn)的安全隱患,研究針對這些隱患所提出的合理化建議,有效地提高了人工智能信息數(shù)據(jù)的安全性和可靠性。
電子信息技術(shù);人工智能;數(shù)據(jù);安全防范
人工智能系統(tǒng)是以IaaS系統(tǒng)平臺為基礎(chǔ)開發(fā),在其上搭建如docker、Kubernetes等的各類容器,且具備機(jī)器學(xué)習(xí)模型、算法、功能以及TensorFlow、MXNet等接口,能夠根據(jù)機(jī)器學(xué)習(xí)模型產(chǎn)生應(yīng)用,然后通過從處理數(shù)據(jù)、搭建模型、對模型分別進(jìn)行訓(xùn)練與評估等相關(guān)的系統(tǒng)功能為客戶提供開發(fā)設(shè)計的全流程服務(wù)。
人工智能系統(tǒng)平臺一般按技術(shù)和應(yīng)用兩個方面進(jìn)行劃分。技術(shù)系統(tǒng)方面可分為:視覺與語音的功能識別技術(shù)、機(jī)器學(xué)習(xí)技術(shù)、語言處理技術(shù)以及知識圖譜等。在應(yīng)用技術(shù)方面又可以分為:自主無人控制技術(shù)、人工智能交通技術(shù)、人工智能教育技術(shù)、人工智能醫(yī)療技術(shù)、人工智能工業(yè)化生產(chǎn)技術(shù)以及人工智能互聯(lián)網(wǎng)技術(shù)等。
人工智能系統(tǒng)平臺通過基于分布式計算云系統(tǒng)IaaS平臺,將包括人工智能的學(xué)習(xí)、算法、接口等功能通過云端,為客戶提供信息數(shù)據(jù)存儲、分析及軟件應(yīng)用等服務(wù)。加快了客戶通信息數(shù)據(jù)的處理分析能力,并計算出更加精準(zhǔn)的結(jié)果,便于客戶對信息數(shù)據(jù)的判斷與決策。
信息數(shù)據(jù)中毒一般是指人工智能信息數(shù)據(jù)被非法修改或者篡改,導(dǎo)致人工智能決策層對數(shù)據(jù)信息的判斷出現(xiàn)問題,并給出了錯誤的決策方案指令。其工作原理是通過在給人工智能訓(xùn)練數(shù)據(jù)中添加進(jìn)去惡意樣本或者是虛假偽造數(shù)據(jù),然后對原有的數(shù)據(jù)信息進(jìn)行攻擊破壞,造成完整性缺失,使訓(xùn)練算法模型運(yùn)算判斷出錯,導(dǎo)致決策層的決策出現(xiàn)偏離。一般導(dǎo)致信息數(shù)據(jù)中毒的方式有如下兩種:
第一、信息數(shù)據(jù)中毒的攻擊方式是偏斜方式,主要是通過對訓(xùn)練數(shù)據(jù)的原始數(shù)據(jù)進(jìn)行篡改,修改分類模塊的范圍值,達(dá)到使訓(xùn)練數(shù)據(jù)的運(yùn)算分析方向出現(xiàn)偏移的目的;
第二、使用反饋信息的誤導(dǎo)牽引模式,主要是把人工智能的自身機(jī)器學(xué)習(xí)模型作為攻擊對象,將篡改好的信息數(shù)據(jù)反饋至需要接受客戶反饋信息的機(jī)器學(xué)習(xí)模型,利用修改后的數(shù)據(jù)信息對人工智能的運(yùn)算進(jìn)行誤導(dǎo),使其決策層給出錯誤的決策。
信息數(shù)據(jù)中毒具有較大的安全風(fēng)險,比如,現(xiàn)在比較火熱的自動駕駛汽車領(lǐng)域,當(dāng)自動駕駛控制接收到的信息數(shù)據(jù)是被污染后的信息數(shù)據(jù),其就是根據(jù)這些錯誤的信息做出相應(yīng)的判斷,輕者會造成自動駕駛車輛對路況信息誤判,做出違反道路交通規(guī)則的行為,重者就有可能使自動駕駛車輛發(fā)生嚴(yán)重的交通安全事故。
數(shù)據(jù)異常會出現(xiàn)致使人工智能系統(tǒng)在運(yùn)算過程中,識別判斷運(yùn)算出現(xiàn)偏差或錯誤,也會將自身模型暴露出來,遭受黑客的惡意攻擊。另外,因開源學(xué)習(xí)框架本身存在一定的安全風(fēng)險,其數(shù)據(jù)異常也表現(xiàn)出在開源學(xué)習(xí)框架的人工智能系統(tǒng)出現(xiàn)了數(shù)據(jù)泄漏的情況。
人工智能技術(shù)已經(jīng)成功地應(yīng)用到了很多領(lǐng)域中,就會出現(xiàn)數(shù)據(jù)信息收集過剩的現(xiàn)象,導(dǎo)致這些過剩的數(shù)據(jù)信息存在泄漏的風(fēng)險。比如,現(xiàn)在比較流行的人工智能手環(huán)等智能設(shè)備,以及醫(yī)療智能系統(tǒng)或生物識別系統(tǒng)等,這些智能設(shè)備或智能系統(tǒng)就會對個人信息進(jìn)行全方面的收集,如個人的臉部特征、心跳、虹膜以及指紋等個人信息數(shù)據(jù),而這些個人信息都是具有唯一性和不變形的,當(dāng)這些個人信息數(shù)據(jù)沒有得到很好的保護(hù)時,出現(xiàn)泄漏或被收集個人信息的企業(yè)誤用,就會給這些信息的所屬者造成嚴(yán)重的后果。
隨著人工智能技術(shù)的提升,也變相提升了黑客對智能化的網(wǎng)絡(luò)攻擊能力,導(dǎo)致出現(xiàn)信息數(shù)據(jù)被智能化竊取行為的出現(xiàn)。通過使用人工智能系統(tǒng)就可以自動鎖定需求目標(biāo),并開始對數(shù)據(jù)進(jìn)攻擊和盜取,而且因為人工智能可以通過機(jī)器學(xué)習(xí)的方式,進(jìn)行掃描和發(fā)現(xiàn)系統(tǒng)的漏洞,并有效地提高了對關(guān)鍵目標(biāo)的識別能力,從而提升了對關(guān)鍵目標(biāo)的攻擊效率。然后,人工智能可以自動編輯或生產(chǎn)海量的虛假威脅信息,來迷惑和攻擊系統(tǒng);人工智能因其具有機(jī)器學(xué)習(xí)技術(shù)、自然語言處理技術(shù)以及數(shù)據(jù)挖掘技術(shù)等能力,可以在有效且安全的大數(shù)據(jù)中,對其自動生產(chǎn)各種虛假、錯誤以及威脅的信息,使系統(tǒng)無法正常判別信息的真?zhèn)?。人工智能現(xiàn)在還具有自動識別圖像和驗證碼功能的能力,使其竊取系統(tǒng)數(shù)據(jù)信息更加容易。
由于人工智能技術(shù)的快速普及發(fā)展,人工智能人臉識別等新技術(shù)也帶來的新風(fēng)險,如出現(xiàn)了人臉“隔空盜刷”等個人信息數(shù)據(jù)安全隱患,因為人的臉是長時間裸露在外,現(xiàn)在人工智能技術(shù)就可以通過在三公里之外對人臉進(jìn)行識別,用戶根本沒有表達(dá)出主觀意愿去刷臉,就可以將個人賬戶的現(xiàn)金進(jìn)行轉(zhuǎn)移,帶來了巨大的風(fēng)險。
現(xiàn)在眾多人工智能技術(shù)軟件平臺都沒有相關(guān)的技術(shù)數(shù)據(jù)備案信息,并且平臺內(nèi)部對個人的相關(guān)身份數(shù)據(jù)信息也沒有做好安全防護(hù)工作,出現(xiàn)客戶可以任意替換、合成、生成新的信息數(shù)據(jù),就會嚴(yán)重影響了個人信息數(shù)據(jù)安全,并為個人信息安全埋下隱患,也為不法分子帶來可乘之機(jī)。
2018年上半年,國外就有媒體報道出美國的臉書公司,私自將臉書的近五千多萬的個人用戶信息交給第三方公司,用作大數(shù)據(jù)信息分析這些客戶的潛在利用價值,如通過對這些客戶個人信息中的興趣愛好等特點進(jìn)行分析,根據(jù)其愛好準(zhǔn)確投放相應(yīng)的廣告或資訊內(nèi)容等,報道上稱其有可能利用大數(shù)據(jù)進(jìn)行預(yù)測客戶的政治意向,造成可能影響美國總統(tǒng)大選的不利因素。已經(jīng)嚴(yán)重?fù)p害了網(wǎng)絡(luò)領(lǐng)域消費者的合法權(quán)益,針對上述事件,如何規(guī)范人工智能信息數(shù)據(jù)的使用,保護(hù)個人信息數(shù)據(jù)安全,成為社會所關(guān)注的重點。
由于人工智能系統(tǒng)的開發(fā)和利用,其產(chǎn)生的數(shù)據(jù)安全已經(jīng)覆蓋方方面面,小到個人信息安全、企業(yè)信息、企業(yè)秘密以及大到國家信息安全等。所以,人工智能領(lǐng)域中的數(shù)據(jù)安全保護(hù)問題需要涵蓋整個環(huán)節(jié),這些環(huán)節(jié)就包括了對信息數(shù)據(jù)的收集、存儲、傳輸和使用等方面。
數(shù)據(jù)收集風(fēng)險:主要是體現(xiàn)在數(shù)據(jù)采集的安全風(fēng)險是否合規(guī)管控方面。如數(shù)據(jù)傳輸環(huán)節(jié)是否存在數(shù)據(jù)泄露、數(shù)據(jù)篡改等安全隱患。
數(shù)據(jù)存儲風(fēng)險:數(shù)據(jù)存儲又可以分為本地現(xiàn)場前端存儲、后端數(shù)據(jù)存儲和云存儲等三個方面。其中在前端和后端的設(shè)備存儲,有較大的安全風(fēng)險,具有數(shù)據(jù)存儲的安全隱患。由于云數(shù)據(jù)庫的硬件技術(shù)能力不一,數(shù)據(jù)存儲具有不小的泄漏可能。
數(shù)據(jù)使用風(fēng)險:在人工智能的開發(fā)和應(yīng)用中對數(shù)據(jù)預(yù)處理、數(shù)據(jù)標(biāo)注、模型訓(xùn)練、模型測試、實際數(shù)據(jù)處理都涉及到數(shù)據(jù)的使用中,也會存在諸多安全問題。
數(shù)據(jù)傳輸風(fēng)險:數(shù)據(jù)收集和標(biāo)注是人工智能模型訓(xùn)練前的重要步驟。在數(shù)據(jù)采集和標(biāo)注環(huán)節(jié),數(shù)據(jù)鏈中出現(xiàn)對數(shù)據(jù)保護(hù)能力不一致。當(dāng)涉及敏感數(shù)據(jù)的處理和多方之間的數(shù)據(jù)流動時,會面臨數(shù)據(jù)泄露等安全風(fēng)險。
首先,要加強(qiáng)加快立法,細(xì)化法律規(guī)范,進(jìn)一步落實到企業(yè)責(zé)任、個人行為等社會化日常行為當(dāng)中。主要是針對當(dāng)前人工智能數(shù)據(jù)信息安全使用和保護(hù)問題進(jìn)行操作。
第二,組織形成網(wǎng)絡(luò)安全新技術(shù)新應(yīng)用的評估隊伍,對企業(yè)、個人凡是要在平臺上發(fā)布應(yīng)用程序的,均需通過評估、整改、再評估后,符合信息安全各項要求后再上線。
第三,針對各領(lǐng)域的企業(yè),需要控制企業(yè)收集個人信息數(shù)據(jù)的界限,并規(guī)定企業(yè)對個人信息數(shù)據(jù)的使用范圍,行政部門定期對其收集的信息進(jìn)行規(guī)范性核查。
第四,進(jìn)行內(nèi)容安全標(biāo)注工作,將內(nèi)容進(jìn)行分級、分類,尤其是使用AI合成技術(shù)創(chuàng)造的內(nèi)容,要嚴(yán)格進(jìn)行審核、標(biāo)注,對于侵犯隱私、違反著作權(quán)、肖像權(quán)、隱私權(quán)、專利權(quán)的行為進(jìn)行打擊。
第五,加強(qiáng)對個人信息數(shù)據(jù)安全保護(hù)的技術(shù)能力,如對個人信息數(shù)據(jù)進(jìn)行隱私的同步狀態(tài)加密保護(hù)技術(shù)、機(jī)器學(xué)習(xí)、差分隱私的個人隱私保護(hù)技術(shù)等技術(shù)能力的開發(fā)或能力的提升,并利用數(shù)據(jù)偏移監(jiān)督監(jiān)測技術(shù)來防止人工智能系統(tǒng)在訓(xùn)練數(shù)據(jù)中出現(xiàn)的偏差或偏移現(xiàn)象。
第六,開發(fā)新的模型,減少數(shù)據(jù)需求,使用遷移學(xué)習(xí)、小數(shù)據(jù)等優(yōu)化各類算法。
第七,大力開發(fā)數(shù)據(jù)投毒的防御技術(shù)。
數(shù)據(jù)污染防范訓(xùn)練技術(shù)主要有兩種,分別是抗訓(xùn)練數(shù)據(jù)污染和抗對抗樣本攻擊。
抗訓(xùn)練數(shù)據(jù)污染主要是通過監(jiān)測和過濾來防止數(shù)據(jù)的污染或被植入惡性數(shù)據(jù)作為預(yù)防措施??箤箻颖竟糁饕峭ㄟ^提高人工智能模型的對抗防御能力,利用監(jiān)測模型對其進(jìn)行提升自身防御能力或消除對抗樣本的不良影響。
本文從人工智能信息數(shù)據(jù)安全方面進(jìn)行了研究,針對人工智能平臺數(shù)據(jù)管理中,可能出現(xiàn)或者會面臨的安全隱患進(jìn)行了分析,如數(shù)據(jù)中毒、數(shù)據(jù)異常、數(shù)據(jù)泄漏以及網(wǎng)絡(luò)攻擊等幾個方面深入化的分析。就上述的安全隱患風(fēng)險進(jìn)行安全風(fēng)險分析其可能或?qū)⒃斐傻膰?yán)重后果,提出相應(yīng)的合理化建議,如加強(qiáng)法律方面保障效應(yīng)以及開發(fā)信息數(shù)據(jù)安全防范技術(shù)等,從法律和技術(shù)雙方面進(jìn)行保護(hù)信息化的數(shù)據(jù)安全。
[1]何文君.影響數(shù)據(jù)通信網(wǎng)絡(luò)穩(wěn)定性和安全性的因素研究[J].山西青年,2017(20):10-11.
[2]袁鵬達(dá).數(shù)據(jù)加密技術(shù)在計算機(jī)網(wǎng)絡(luò)通信安全中的應(yīng)用[J].中國管理信息化,2017,20(3):129-130.
[3]李觀發(fā).試論計算機(jī)網(wǎng)絡(luò)通信安全中數(shù)據(jù)加密技術(shù)的應(yīng)用[J].信息記錄材料,2019(7):25-26.
[4]孫洪玉,牛保疆.數(shù)據(jù)通信網(wǎng)絡(luò)維護(hù)與網(wǎng)絡(luò)安全問題的探討[J].數(shù)字通信世界,2019(2):14-15.
[5]龔德旭.大數(shù)據(jù)背景下信息通信網(wǎng)絡(luò)安全管理策略研究[J].數(shù)字通信世界,2018(1):13-14.
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2022年1期