鄒宗慶 唐蔚
摘要:本文分析了日益增長(zhǎng)的科技稿件公開發(fā)表需求對(duì)稿件脫敏審查工作帶來的技術(shù)挑戰(zhàn),結(jié)合科技稿件中需標(biāo)注已不涉密的科研計(jì)劃項(xiàng)目,如何進(jìn)行數(shù)據(jù)脫敏的難點(diǎn),探討數(shù)據(jù)脫敏方法在科技稿件脫敏審查業(yè)務(wù)中的應(yīng)用,并對(duì)數(shù)據(jù)脫敏的實(shí)現(xiàn)方法予以重點(diǎn)論述,提出了怎樣提高科技稿件投稿錄用率的幾點(diǎn)建議,以期為科技稿件投稿人掌握稿件脫敏審查方法,順利投稿提供參考。
關(guān)鍵詞:科技稿件;脫敏;審查方法
數(shù)據(jù)脫敏技術(shù)作為近年來解決數(shù)據(jù)安全問題的重要技術(shù)得到了快速發(fā)展,在政府部門、金融行業(yè)、高等院校、科研院所、醫(yī)療體系等諸多行業(yè)領(lǐng)域中得以應(yīng)用。本文將數(shù)據(jù)脫敏技術(shù)應(yīng)用到科技稿件脫敏審查工作中,通過對(duì)指定的敏感數(shù)據(jù)進(jìn)行編輯,使得敏感數(shù)據(jù)不再含有敏感內(nèi)容,從而保障科技稿件中敏感數(shù)據(jù)安全,同時(shí)保留數(shù)據(jù)原有格式、屬性,實(shí)現(xiàn)數(shù)據(jù)的可用性最大化。
1.難點(diǎn)分析
1.1科技稿件脫敏審查的難點(diǎn)
對(duì)基于科研計(jì)劃項(xiàng)目而產(chǎn)生的科技稿件,如果投稿人只是截取項(xiàng)目的部分少量?jī)?nèi)容,經(jīng)過脫密審查確定已不涉密,則可公開發(fā)表,但投稿人在標(biāo)注不涉密的科研計(jì)劃項(xiàng)目時(shí),往往不知如何進(jìn)行數(shù)據(jù)脫敏處理。從近年來科技稿件審查情況來看,科技稿件中標(biāo)注的科研計(jì)劃項(xiàng)目?jī)?nèi)容也是風(fēng)險(xiǎn)高發(fā)領(lǐng)域,其科技稿件如果公開發(fā)表,覆蓋范圍廣、傳播速度快,帶來很大風(fēng)險(xiǎn)。
1.2數(shù)據(jù)脫敏與數(shù)據(jù)加密的區(qū)別
數(shù)據(jù)脫敏是采用專業(yè)的數(shù)據(jù)脫敏算法,可以兼顧數(shù)據(jù)安全與數(shù)據(jù)使用;數(shù)據(jù)加密是通過對(duì)數(shù)據(jù)進(jìn)行密碼保護(hù),使用密碼檢索原始值。數(shù)據(jù)加密不能完全從技術(shù)上保證數(shù)據(jù)的安全,任何有權(quán)限訪問數(shù)據(jù)的人員,均有可能導(dǎo)致數(shù)據(jù)泄露。數(shù)據(jù)脫敏,敏感數(shù)據(jù)的實(shí)際值轉(zhuǎn)換為虛構(gòu)的,但是看起來非常逼真的數(shù)值,原始值具有不可逆性,無法復(fù)原,能夠更好的保護(hù)數(shù)據(jù)安全。
數(shù)據(jù)脫敏和數(shù)據(jù)加密是兩種不同的技術(shù),在不同的工作要求中廣泛應(yīng)用,在科研單位內(nèi)部交流時(shí),往往采用數(shù)據(jù)加密,在科技稿件公開發(fā)表時(shí),必須采用數(shù)據(jù)脫敏保護(hù)數(shù)據(jù)安全。
2.脫敏審查方法
2.1脫敏主體
科技稿件的所有署名人是稿件脫敏的責(zé)任主體。稿件所有署名人需要通過在實(shí)踐中不斷摸索,尋求科技稿件公開發(fā)表和稿件脫敏之間的平衡點(diǎn),對(duì)標(biāo)注的科研計(jì)劃項(xiàng)目?jī)?nèi)容先行嚴(yán)格把關(guān),提高認(rèn)知能力和水平,提升綜合防控能力。
2.2脫敏方法
“先靜之,再思之,五六分把握即做之”是一種謹(jǐn)慎的智慧,同樣適用于科技稿件脫敏審查工作。
(一) 投稿前,先靜之
投稿前,稿件作者應(yīng)再三思考,科技稿件數(shù)據(jù)脫敏是否符合要求。稿件脫敏流程主要包括敏感數(shù)據(jù)識(shí)別、算法選擇、任務(wù)執(zhí)行、結(jié)果輸出四個(gè)步驟。
1. 敏感數(shù)據(jù)識(shí)別
為了科技稿件能夠安全公開發(fā)表,充分發(fā)揮其價(jià)值,需要對(duì)稿件敏感數(shù)據(jù)進(jìn)行脫敏,確保稿件中敏感數(shù)據(jù)不被泄露,而敏感數(shù)據(jù)識(shí)別是稿件脫敏的前提和關(guān)鍵。
2.脫敏算法選擇
依據(jù)不同的科技稿件敏感數(shù)據(jù)類型、特征和脫敏需求,選擇不同的脫敏算法,科技稿件所采用的脫敏算法一般包括隱藏、偏移、平均值、替換、遮蔽、隨機(jī)等等。
3.脫敏任務(wù)執(zhí)行
科技稿件敏感數(shù)據(jù)脫敏執(zhí)行過程包括啟動(dòng)、暫停、終止等操作。
4.脫敏結(jié)果輸出
依據(jù)稿件脫敏流程,脫敏任務(wù)執(zhí)行完畢,輸出科技稿件敏感數(shù)據(jù)脫敏結(jié)果。
(二)靜后,再思之
靜中細(xì)思,當(dāng)思奮爭(zhēng)。仔細(xì)檢查,反復(fù)修改,總會(huì)發(fā)現(xiàn)數(shù)據(jù)脫敏還有不恰當(dāng)、不完善之處,原先估計(jì)不到的問題,經(jīng)過反復(fù)審查和修改,十分必要。所以,一定要再思之,再思的過程實(shí)際上就是之前思考的結(jié)論二次復(fù)盤,認(rèn)真地再次梳理數(shù)據(jù)脫敏有無差錯(cuò)、有無遺漏。
(三)五六分把握即做之
靜之再思之方可成立。當(dāng)稿件作者對(duì)數(shù)據(jù)脫敏流程和脫敏要求非常清楚時(shí),便可開展稿件脫敏審查。
1. 科研計(jì)劃項(xiàng)目來源核查法
對(duì)基于科研計(jì)劃項(xiàng)目而產(chǎn)出的科技稿件,如果投稿人只選取部分內(nèi)容,并且進(jìn)行了脫密處理,經(jīng)審查確定已經(jīng)不涉密,則可公開發(fā)表,但在科技稿件中如需標(biāo)注項(xiàng)目?jī)?nèi)容時(shí),首先需要識(shí)別出項(xiàng)目來源中的“項(xiàng)目的完整名稱”、“項(xiàng)目完成時(shí)間”、“臺(tái)套數(shù)”、“生產(chǎn)計(jì)劃”、“應(yīng)用前景”等敏感數(shù)據(jù),接著對(duì)其敏感數(shù)據(jù)選擇脫敏算法,然后啟動(dòng)脫敏,最后輸出脫敏后的數(shù)據(jù)。
2.3隱藏法
在處理“項(xiàng)目的完整名稱”這個(gè)待脫敏的數(shù)據(jù)時(shí),投稿人通過對(duì)敏感數(shù)據(jù)進(jìn)行隱藏,讓敏感數(shù)據(jù)無價(jià)值,使它無效。一般采用特殊字符(*或X)代替真實(shí)值,這種隱藏敏感數(shù)據(jù)的方法簡(jiǎn)單便捷。
2.4偏移法
在處理“項(xiàng)目完成時(shí)間”這個(gè)待脫敏的數(shù)據(jù)時(shí),投稿人通過隨機(jī)移位改變?nèi)掌跀?shù)據(jù),偏移法在保持了數(shù)據(jù)的安全性的同時(shí)保證了日期范圍的大致真實(shí)性。
2.5平均值
在處理“臺(tái)套數(shù)”這個(gè)待脫敏的數(shù)據(jù)時(shí),投稿人通過先計(jì)算它們的均值,然后使脫敏后的值在均值附近隨機(jī)分布,從而保持臺(tái)套數(shù)的總和不變。
(一)科研計(jì)劃項(xiàng)目關(guān)鍵詞檢索法
科技稿件關(guān)鍵詞檢索即在脫敏范圍所列的條款中選取關(guān)鍵詞,對(duì)科技稿件進(jìn)行全文查驗(yàn)、比對(duì)。例如:科技稿件中如標(biāo)注項(xiàng)目?jī)?nèi)容,需要對(duì)敏感數(shù)據(jù)“生產(chǎn)計(jì)劃”進(jìn)行數(shù)據(jù)脫敏。通常分為精確匹配和廣泛匹配兩種。
2.6精確匹配
當(dāng)投稿人搜索詞與關(guān)鍵詞完全一致時(shí)才能匹配。例如精確匹配下“生產(chǎn)計(jì)劃”這個(gè)關(guān)鍵詞,投稿人只有搜索“生產(chǎn)計(jì)劃”才能啟動(dòng)。
2.7廣泛匹配
當(dāng)投稿人搜索與關(guān)鍵詞高度相關(guān)的詞即可啟動(dòng)。例如廣泛匹配下“生產(chǎn)計(jì)劃”這個(gè)關(guān)鍵詞,投稿人可以啟動(dòng)搜索出“項(xiàng)目生產(chǎn)計(jì)劃”、“生產(chǎn)計(jì)劃進(jìn)展”、“計(jì)劃生產(chǎn)”、“生產(chǎn)安排”、“生產(chǎn)方案”等等。
在科技稿件脫敏審查中,往往采用廣泛匹配,全文查驗(yàn),比對(duì)相應(yīng)的法律法規(guī)和管理要求,確保敏感數(shù)據(jù)完成脫敏。
(一)稿件內(nèi)容鑒別法
稿件內(nèi)容鑒別法就是逐一分析稿件內(nèi)容,對(duì)敏感技術(shù)或者領(lǐng)域中易造成風(fēng)險(xiǎn)的關(guān)鍵點(diǎn)進(jìn)行嚴(yán)格審查把關(guān)。例如:科技稿件中如標(biāo)注項(xiàng)目?jī)?nèi)容,需要對(duì)敏感數(shù)據(jù)“應(yīng)用前景”進(jìn)行數(shù)據(jù)脫敏。脫敏審查不僅包括文字內(nèi)容,還應(yīng)該包括圖片、音視頻等內(nèi)容。圖像脫敏除了使用馬賽克,可以采用圖像分析和圖像合成等技術(shù),音頻脫敏可以通過差分隱私技術(shù),為數(shù)據(jù)添加噪聲等方式進(jìn)行數(shù)據(jù)脫敏。
3.結(jié)語
科技稿件脫敏審查是一項(xiàng)專業(yè)性很強(qiáng)的工作,需要嚴(yán)把數(shù)據(jù)脫敏關(guān),須臾不能松懈。本文探討的數(shù)據(jù)脫敏方法在科技稿件脫敏審查業(yè)務(wù)中的應(yīng)用,以期為科技稿件投稿人掌握稿件脫敏審查方法,順利投稿提供參考。
參考文獻(xiàn):
[1]孫允凱.科技稿件脫密審查小議[J].保密工作,2021.
[2]武薇.全媒體語境下新聞出版泄密風(fēng)險(xiǎn)與防控[J].保密工作,2021.
[3]畢婷.工業(yè)數(shù)據(jù)脫敏技術(shù)研究[J].保密科技技術(shù),2021.
[4]蔡玉琪.科技期刊編輯如何利用專家審稿意見提高審稿能力[J].編輯學(xué)報(bào),2006.