景濤
摘要:本文研究構(gòu)建多媒體大數(shù)據(jù)隱私保護和安全共享平臺,旨在保障多媒體大數(shù)據(jù)的安全性和隱私性,提高數(shù)據(jù)共享的效率和質(zhì)量。以多媒體大數(shù)據(jù)應用的金融場景為例,構(gòu)建如實還原金融機構(gòu)生產(chǎn)場景的驗證環(huán)境,統(tǒng)籌解決多媒體數(shù)據(jù)分域或邏輯隔離存儲問題。本文的研究成果對于多媒體數(shù)據(jù)隱私保護和安全共享具有重要的意義。該平臺的提出不僅可以保護個人隱私,還能夠促進多媒體數(shù)據(jù)的有效利用和社會共享。同時,該研究也為相關領域的研究提供了新的思路和方法,有助于推動多媒體大數(shù)據(jù)技術的發(fā)展和應用。
關鍵詞:多媒體大數(shù)據(jù);隱私查詢;隱私保護;安全共享
引言
隨著大數(shù)據(jù)和移動互聯(lián)網(wǎng)技術的快速發(fā)展和廣泛應用,多媒體大數(shù)據(jù)已經(jīng)成為人們?nèi)粘I詈凸ぷ髦械闹匾畔碓?,多媒體數(shù)據(jù)逐漸成為推動社會市場經(jīng)濟發(fā)展的中堅力量,但在網(wǎng)絡安全層面,大數(shù)據(jù)技術卻成為個人隱私和企業(yè)隱私泄露的“隱患”,數(shù)據(jù)隱私保護和安全共享的問題也日益突出。因此,研究多媒體大數(shù)據(jù)隱私保護與安全共享平臺具有重要的現(xiàn)實意義和社會價值。如何在滿足數(shù)據(jù)安全和隱私保護的同時,實現(xiàn)數(shù)據(jù)的流動和價值的最大化、最優(yōu)化,成為“數(shù)據(jù)控制者”或“數(shù)據(jù)處理者”的普遍訴求。
1. 研究背景
隨著大數(shù)據(jù)時代的到來,大數(shù)據(jù)技術已經(jīng)被廣泛應用于金融、能源、醫(yī)療、交通等領域,在應用高速發(fā)展的同時,數(shù)據(jù)安全和隱私邊界也愈加重要?,F(xiàn)有的隱私保護技術還不能完全滿足多媒體大數(shù)據(jù)的特點和需求,存在隱私泄露的風險。目前,多媒體大數(shù)據(jù)處理和分析技術還比較煩瑣和復雜,需要耗費大量的人力和時間成本。在大數(shù)據(jù)訪問控制中,涉及數(shù)據(jù)的采集、傳輸、存儲、處理等一系列行為,針對視頻、圖像、語音、文本等多媒體大數(shù)據(jù)的隱私保護差異化、隱私共享多級訪問控制、隱私保護加密算法等問題,本研究面向多媒體大數(shù)據(jù)的隱私保護與安全模型,建立多媒體大數(shù)據(jù)共享隱私動態(tài)保護機制。
2. 研究內(nèi)容
為解決多媒體大數(shù)據(jù)處理過程中存在的隱私內(nèi)容多樣化、隱私屬性動態(tài)量化難、多因素關聯(lián)的隱私內(nèi)容價值與泄露風險動態(tài)評估手段缺乏、延伸控制弱化等問題,需要研發(fā)適用于多媒體大數(shù)據(jù)的隱私保護技術和安全共享機制,保障數(shù)據(jù)的安全性和隱私性。本文以金融行業(yè)數(shù)據(jù)安全管理為例,在多媒體大數(shù)據(jù)隱私內(nèi)容檢測、分級保護和安全共享平臺研究方面,在金融保險機構(gòu)示范應用并建設圖像、語音數(shù)據(jù)集。針對涉及多媒體應用的不同金融場景,搭建如實還原金融機構(gòu)生產(chǎn)場景的測試環(huán)境,平臺架構(gòu)如圖1所示。
系統(tǒng)架構(gòu):采用分層架構(gòu),分為基礎設施層、數(shù)據(jù)層、平臺層和應用層。其中,基礎設施層負責多媒體大數(shù)據(jù)的存儲和管理,數(shù)據(jù)層和平臺層負責數(shù)據(jù)的分析和處理,應用層負責提供用戶接口和服務支持。
功能模塊:包括數(shù)據(jù)處理、隱私保護、安全共享、數(shù)據(jù)檢索等功能模塊。其中,數(shù)據(jù)處理模塊負責對上傳的數(shù)據(jù)進行預處理和分析,隱私保護模塊負責對敏感數(shù)據(jù)進行加密和匿名化處理,安全共享模塊負責控制數(shù)據(jù)的訪問權限和共享范圍,數(shù)據(jù)檢索模塊負責根據(jù)用戶需求提供數(shù)據(jù)查詢和下載服務。
數(shù)據(jù)傳輸安全:采用加密技術和身份認證技術,確保數(shù)據(jù)在傳輸過程中的安全性和完整性。
2.1 可行性分析
多媒體數(shù)據(jù)容量大,格式復雜多樣,其加密算法設計需要考慮加密效率性和密文格式兼容性。為了提升加密效率,現(xiàn)有的多媒體數(shù)據(jù)加密算法大都選擇采用部分加密技術,通過加密壓縮數(shù)據(jù)中的部分關鍵信息,以減少加密操作來降低加密算法的時間開銷?,F(xiàn)有的并行處理技術相對成熟,將大容量的多媒體數(shù)據(jù)進行分塊,然后用并行加密處理,可進一步提升大容量多媒體數(shù)據(jù)的加密速度。因此,輕量級的多媒體數(shù)據(jù)加密算法的設計與實現(xiàn)是具備可行性的。
針對多媒體隱私數(shù)據(jù)多源、多維、異構(gòu)特性時表現(xiàn)出通用性、完備性、一致性差,信息泄露風險高等問題,根據(jù)研究基礎分別定量和定性構(gòu)建安全評價標準。在定量安全評價標準中,通過特征處理技術對原始數(shù)據(jù)和加密數(shù)據(jù)進行多分辨率表示,并提取視覺和聲譜圖的特征,最后對提取特征進行相似性度量和加權融合,構(gòu)建定量安全評價標準。同樣地,在定性安全評價標準中,以自主研發(fā)的數(shù)據(jù)處理算法為基礎,融合最先進的深度學習思想,分別從圖像和音頻兩方面對隱私數(shù)據(jù)安全性進行評估,并構(gòu)建多媒體大數(shù)據(jù)安全綜合評價系統(tǒng)。
多媒體大數(shù)據(jù)加密存儲平臺采用全新的硬件構(gòu)架和軟件算法,全方位地釋放NVME閃存顆粒的性能。在工程層面進行大量優(yōu)化,包括在數(shù)據(jù)的讀取、加密、傳輸、計算、解密、存儲等各個階段實現(xiàn)優(yōu)化,進而將整體性能提升到最優(yōu)狀態(tài),以滿足高吞吐、低時延,以及特定場景的實時性要求。
2.2 先進性分析
通過隱私保護與多媒體數(shù)據(jù)安全性技術,對多媒體隱私數(shù)據(jù)內(nèi)容進行分析,從技術路線和理論基礎兩方面構(gòu)建的多媒體大數(shù)據(jù)安全綜合評價系統(tǒng)均具有先進性。
多媒體大數(shù)據(jù)加密存儲平臺具備自主可信根,從可信根到硬件平臺,到操作系統(tǒng),再到應用,在體系架構(gòu)上實現(xiàn)自主可控的防御機制,保證平臺系統(tǒng)的數(shù)據(jù)存儲安全、傳輸安全和計算安全。在硬件加速層面,通過新的密碼學技術和算法協(xié)議,結(jié)合硬件加速技術和專有算法實現(xiàn)算力加速,提升平臺整體算力性能。平臺在結(jié)構(gòu)化數(shù)據(jù)的加密存儲與隱私保護、傳輸過程去標識化、匿蹤查詢以及底層硬件的算力和安全性支撐方面已有相對成熟的方法論,具有較好的先進性。
3. 關鍵科學問題
多媒體大數(shù)據(jù)隱私保護與安全共享是信息社會的重要問題之一。在多媒體大數(shù)據(jù)的處理和共享過程中,涉及許多隱私和安全問題。本文以金融行業(yè)數(shù)據(jù)安全管理為例。
在金融數(shù)據(jù)安全管理方面,按照中國人民銀行發(fā)布的《金融數(shù)據(jù)安全 數(shù)據(jù)生命周期安全規(guī)范》(JR/T 0223-2021)金融行業(yè)標準要求,金融機構(gòu)“應根據(jù)安全級別、重要性、量級、使用頻率等因素,將數(shù)據(jù)分域分級存儲”“脫敏后的數(shù)據(jù)應與用于還原數(shù)據(jù)的恢復文件隔離存儲,并留存相關審批及操作記錄”“3級數(shù)據(jù)的存儲應采取加密等技術措施保證數(shù)據(jù)存儲的保密性”“4級及以上數(shù)據(jù)應使用密碼算法加密存儲”[1]。
針對個人金融信息管理,中國人民銀行在遵循《個人信息保護法》基礎上,發(fā)布了《個人金融信息保護技術規(guī)范》(JR/T 0171—2020)金融行業(yè)標準,根據(jù)信息遭到未經(jīng)授權的查看或未經(jīng)授權的變更后所產(chǎn)生的影響和危害,將個人金融信息按敏感程度從高到低分為C3、C2、C1三個類別[2]。
針對C2、C3類別信息,標準規(guī)定:“金融機構(gòu)應使用加密通道或數(shù)據(jù)加密的方式進行傳輸,保障個人金融信息傳輸過程的安全”“對于C3類別信息,通過受理終端、客戶端應用軟件、瀏覽器等方式收集時,應采取加密等技術措施保證數(shù)據(jù)的保密性,防止其被未授權的第三方獲取”“C3類別個人金融信息應采用加密措施確保數(shù)據(jù)存儲的保密性”“應將去標識化、匿名化后的數(shù)據(jù)與可用于恢復識別個人的信息采取邏輯隔離的方式進行存儲,確保去標識化、匿名化后的信息與個人金融信息不被混用”“除銀行卡有效期外,C3類別信息不應明文展示”。
金融機構(gòu)的多媒體信息主要是指個人生物識別信息過程中產(chǎn)生的影像、圖片、聲紋等,其存儲方式大多是非結(jié)構(gòu)化的,且按要求均應該使用密碼算法加密存儲,采用加密通道或數(shù)據(jù)加密方式傳輸,采取去標識化或匿名化手段展示,并與個人信息邏輯隔離存儲。金融保險業(yè)務場景多媒體大數(shù)據(jù)中的隱私內(nèi)容精準高效檢測和分級保護,結(jié)合輕量化的多媒體數(shù)據(jù)加密算法,研究構(gòu)建高效安全的分布式存儲應用系統(tǒng),實現(xiàn)多級用戶的差異化隱私保護需求和數(shù)據(jù)安全共享。
3.1 身份照片核驗場景
隱私信息具體內(nèi)容涉及身份證照片、活體檢測時隨機抓取照片。身份照片核驗如圖2所示,身份證照片會通過OCR抓取姓名、身份證號、有效期信息。因此有必要進行隱私脫敏處理的圖片既包括身份證和活體照片中的人臉圖片信息,又包括身份證號、姓名等個人信息??蛻粼俅钨徺I保險產(chǎn)品時,會再次觸發(fā)活體認證環(huán)節(jié),隨機抓取的圖片會與之前加密存儲的身份證照片、公安個人信息庫身份證照片做三方比對。
信息流方面,客戶手機端隨機抓取的照片,明文傳輸至保險公司業(yè)務系統(tǒng)(已進入公司信息管理安全域)。通過特征提取功能模塊對照片進行特征值提取后,與數(shù)據(jù)庫中加密存儲的存量身份證特征值庫進行檢索比對,最終反饋業(yè)務系統(tǒng)成功與否。
3.2 前端脫敏展示場景
金融保險業(yè)務場景,保險公司分支機構(gòu)業(yè)務前臺和客戶手機需要展示客戶照片進行身份核實或展示等功能,有可能會出保險公司信息系統(tǒng)安全域,因此需要在人工可識別的前提下對照片進行脫敏處理,具體流程如圖3所示。
處理流程方面,邊緣端發(fā)起申請,通過匿蹤查詢技術從加密的圖片庫中進行匿蹤檢索,查得后,保險公司對加密的身份照片(可能是身份證或活體照片)進行快速解密,通過隱私計算技術進行脫敏化處理(去特征值化)后,在分支機構(gòu)業(yè)務前臺系統(tǒng)或客戶手機進行脫敏展示。
4. 研究意義
多媒體大數(shù)據(jù)隱私保護關鍵技術集成平臺,支持海量多媒體隱私內(nèi)容的精準高效檢測技術及綜合安全評價系統(tǒng)。通過平臺的金融場景的示范應用,將有助于補齊數(shù)字保護短板,提升我國大數(shù)據(jù)隱私保護水平。本項目探索搭建隱私內(nèi)容檢測、分級保護和安全共享平臺,并在金融保險行業(yè)開展示范應用,一方面有利于保護數(shù)據(jù)存儲、傳輸、展示安全,補齊數(shù)字保護短板問題;另一方面能加快圖像、視頻等典型多媒體大數(shù)據(jù)保護技術落地,提升對金融保險用戶隱私數(shù)據(jù)的保護水平。同時以此為基礎,未來還可以在金融保險行業(yè)其他場景,以及智慧能源、智慧醫(yī)療、智慧政務、智慧交通等其他行業(yè)進行探索推廣,幫助提升我國大數(shù)據(jù)行業(yè)的隱私保護整體水平。
結(jié)語
多媒體大數(shù)據(jù)隱私安全綜合評價系統(tǒng)研究對于保護多媒體大數(shù)據(jù)隱私具有重大意義,防止因數(shù)據(jù)隱私泄露造成的經(jīng)濟損失,為多媒體大數(shù)據(jù)安全隱私保駕護航,可以在多領域進行應用,有力推動信息化進程。該平臺可以有效地保護多媒體大數(shù)據(jù)的隱私性和安全性,同時可以提高數(shù)據(jù)共享的效率和質(zhì)量。為聯(lián)合風控、聯(lián)合營銷、聯(lián)合建模等數(shù)據(jù)融合場景和金融機構(gòu)的隱私計算應用提供數(shù)據(jù)安全保障,幫助組織構(gòu)建安全、開放、共贏的數(shù)據(jù)生態(tài),助力數(shù)據(jù)融合計算的健康發(fā)展和數(shù)據(jù)價值釋放。未來,我們將繼續(xù)深入研究多媒體大數(shù)據(jù)隱私保護與安全共享平臺的相關技術和服務,為用戶提供更加安全、高效、便捷的數(shù)據(jù)服務和支持。
參考文獻:
[1]中國人民銀行,全國金融標準化技術委員會.金融數(shù)據(jù)安全 數(shù)據(jù)生命周期安全規(guī)范:JR/T 0223-2021[S/OL].2021:5 [2023-9-10].https://www.cfstc.org/bzgk/detail/?id=0&bzId=1913.
[2]中國人民銀行,全國金融標準化技術委員會.個人金融信息保護技術規(guī)范:JR/T 0171-2020[S/OL].2020:12 [2023-9-10].https://www.cfstc.org/bzgk/detail/?id=0&bzId=1856.
作者簡介:景濤,碩士研究生,研究方向:IT基礎設施信創(chuàng)國產(chǎn)化。