崔淑潔
(西安交通大學(xué) 法學(xué)院,陜西 西安 710049)
依托大數(shù)據(jù)技術(shù)、云計(jì)算、物聯(lián)網(wǎng)的迅猛發(fā)展,人類(lèi)社會(huì)步入大數(shù)據(jù)時(shí)代。數(shù)據(jù)作為新型資源備受關(guān)注,數(shù)據(jù)應(yīng)用日漸深入。我國(guó)作為數(shù)據(jù)大國(guó),數(shù)據(jù)產(chǎn)業(yè)增長(zhǎng)態(tài)勢(shì)迅猛,數(shù)字經(jīng)濟(jì)規(guī)模巨大。2015年,《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》首次將大數(shù)據(jù)提升到戰(zhàn)略發(fā)展高度,數(shù)據(jù)治理成為新型治理模式,在國(guó)家治理中意義重大。隨后,《“十三五”國(guó)家信息化規(guī)劃》提出了建設(shè)“數(shù)字中國(guó)”,將充分釋放數(shù)據(jù)紅利及構(gòu)建統(tǒng)一開(kāi)放的數(shù)字市場(chǎng)體系作為重要的發(fā)展目標(biāo)。2020年4月,《中共中央國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》將數(shù)據(jù)認(rèn)定為生產(chǎn)要素,要求加快培育數(shù)據(jù)要素市場(chǎng)。當(dāng)前,《數(shù)據(jù)安全法》已正式出臺(tái),其順應(yīng)國(guó)家發(fā)展戰(zhàn)略和時(shí)代發(fā)展需求,提出了數(shù)據(jù)安全與數(shù)據(jù)利用并重的目標(biāo)。
數(shù)據(jù)挖掘是數(shù)據(jù)利用和數(shù)據(jù)價(jià)值開(kāi)發(fā)的關(guān)鍵環(huán)節(jié),具有技術(shù)中立性和工具中立性。然而,隨著數(shù)據(jù)量的激增和技術(shù)應(yīng)用的推進(jìn),數(shù)據(jù)挖掘不再僅作為技術(shù)術(shù)語(yǔ)出現(xiàn),其所帶來(lái)的社會(huì)法律問(wèn)題不容忽視,技術(shù)與法律能否實(shí)現(xiàn)良好的對(duì)接備受質(zhì)疑。在此情形下,論證數(shù)據(jù)挖掘這一技術(shù)手段的正當(dāng)性是技術(shù)能否合理應(yīng)用的關(guān)鍵,也是對(duì)技術(shù)進(jìn)行法律規(guī)制的前提。現(xiàn)有法律機(jī)制缺乏對(duì)數(shù)據(jù)挖掘技術(shù)的全面回應(yīng),本文試圖分析數(shù)據(jù)挖掘技術(shù)的正當(dāng)性,進(jìn)而提出這一技術(shù)難題的法律規(guī)制路徑,旨在實(shí)現(xiàn)技術(shù)與法律制度的良性互動(dòng),推進(jìn)我國(guó)大數(shù)據(jù)發(fā)展戰(zhàn)略的實(shí)施。
現(xiàn)階段,數(shù)據(jù)挖掘作為數(shù)據(jù)價(jià)值發(fā)現(xiàn)的重要技術(shù)存在法律規(guī)制的空白。明確數(shù)據(jù)挖掘的概念及內(nèi)涵、關(guān)注數(shù)據(jù)挖掘的現(xiàn)實(shí)應(yīng)用、實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)術(shù)語(yǔ)與法律語(yǔ)意的統(tǒng)一是數(shù)據(jù)挖掘正當(dāng)性論述的邏輯起點(diǎn),也是探討數(shù)據(jù)挖掘法律問(wèn)題的前提[1]309。
數(shù)據(jù)挖掘(data mining)是指從大量、不完全、模糊的數(shù)據(jù)中提取隱含、未知及潛在有用信息和知識(shí)的數(shù)據(jù)處理技術(shù)[2]。2005年,美國(guó)政府問(wèn)責(zé)局(U.S. Government Accountability Office)將其定義為應(yīng)用數(shù)據(jù)庫(kù)技術(shù)和統(tǒng)計(jì)分析、建模等算法技術(shù)發(fā)現(xiàn)數(shù)據(jù)中的隱藏關(guān)系,并能夠預(yù)測(cè)未來(lái)結(jié)果的數(shù)據(jù)開(kāi)發(fā)應(yīng)用模式[3]。其綜合運(yùn)用數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)學(xué)、人工智能、可視化等學(xué)科的技術(shù)和方法,通過(guò)挖掘算法對(duì)數(shù)據(jù)進(jìn)行深層挖掘分析,實(shí)現(xiàn)了數(shù)據(jù)到知識(shí)的轉(zhuǎn)換。具體而言,數(shù)據(jù)挖掘可分為基于數(shù)據(jù)主題(subjective)的描述分析和基于數(shù)據(jù)模式(mode)的預(yù)測(cè)分析?;谥黝}的描述分析又被稱(chēng)為連接分析,包括概念描述、關(guān)聯(lián)分析、分類(lèi)、聚類(lèi)等,用于描述對(duì)象內(nèi)涵和特征,發(fā)現(xiàn)數(shù)據(jù)聯(lián)系和規(guī)律;基于模式的分析則是從數(shù)據(jù)統(tǒng)計(jì)和歸納中發(fā)現(xiàn)未知的可能,用于預(yù)測(cè)未來(lái)[4]。
數(shù)據(jù)挖掘源自實(shí)踐的直接需求。依托強(qiáng)大的分析和預(yù)測(cè)能力,數(shù)據(jù)挖掘在數(shù)據(jù)分類(lèi)、系統(tǒng)優(yōu)化、智能識(shí)別和趨勢(shì)預(yù)測(cè)等方面發(fā)揮著巨大功效,被廣泛應(yīng)用于商業(yè)、公共事務(wù)管理以及個(gè)人生活[5]。數(shù)據(jù)挖掘最早源于商業(yè)發(fā)展的需求,商業(yè)實(shí)體是數(shù)據(jù)挖掘的主力軍,也是數(shù)據(jù)挖掘的重要應(yīng)用主體。數(shù)據(jù)挖掘在商業(yè)領(lǐng)域的應(yīng)用包括但不限于金融、零售、廣告等領(lǐng)域,如銀行機(jī)構(gòu)應(yīng)用數(shù)據(jù)挖掘進(jìn)行客戶(hù)信用的識(shí)別,電商通過(guò)數(shù)據(jù)挖掘分析顧客的購(gòu)買(mǎi)行為、購(gòu)買(mǎi)喜好進(jìn)行精準(zhǔn)營(yíng)銷(xiāo),廣告部門(mén)利用數(shù)據(jù)挖掘定向投放廣告等。數(shù)據(jù)挖掘有助于商家在服務(wù)端控制物品及服務(wù)狀況,在銷(xiāo)售端精準(zhǔn)把握消費(fèi)者的購(gòu)買(mǎi)需求、購(gòu)買(mǎi)行為、信用情況和經(jīng)濟(jì)能力等,進(jìn)而提高服務(wù)質(zhì)量并進(jìn)行商業(yè)趨勢(shì)的預(yù)測(cè),創(chuàng)造商業(yè)價(jià)值,推動(dòng)經(jīng)濟(jì)發(fā)展。近年來(lái),除商業(yè)應(yīng)用之外,政府等公共事務(wù)部門(mén)對(duì)數(shù)據(jù)挖掘的應(yīng)用不斷深入,既包括政府部門(mén)通過(guò)數(shù)據(jù)挖掘致力于智能政府、智能城市的打造,也包括數(shù)據(jù)挖掘在科教文衛(wèi)等社會(huì)公共事務(wù)中的應(yīng)用,如醫(yī)療機(jī)構(gòu)借助數(shù)據(jù)挖掘推進(jìn)精準(zhǔn)醫(yī)療、疾病防治以及新藥研發(fā),教育機(jī)構(gòu)實(shí)現(xiàn)應(yīng)用數(shù)據(jù)挖掘智能教育,科研機(jī)構(gòu)通過(guò)數(shù)據(jù)挖掘進(jìn)行深度調(diào)研等。當(dāng)然,數(shù)據(jù)挖掘在反恐防控、刑事偵查及社會(huì)安全治理領(lǐng)域的應(yīng)用也是其公共事務(wù)應(yīng)用價(jià)值的重要體現(xiàn)。此外,數(shù)據(jù)挖掘在私人應(yīng)用中作用顯著,移動(dòng)互聯(lián)網(wǎng)的普及使人們的思想行為日漸數(shù)字化,智能交通記錄日常出行,社交軟件識(shí)別交際網(wǎng)絡(luò),電商平臺(tái)采集購(gòu)買(mǎi)所需,電子媒體引導(dǎo)思想動(dòng)態(tài)。數(shù)據(jù)挖掘與私人應(yīng)用之間相互影響和塑造,一方面,個(gè)人基本信息及行為數(shù)據(jù)是數(shù)據(jù)挖掘的基礎(chǔ);另一方面,數(shù)據(jù)挖掘能夠分析和預(yù)測(cè)個(gè)人行為,影響私人決策,個(gè)體已然成為數(shù)據(jù)的創(chuàng)造者、數(shù)據(jù)挖掘的參與者和數(shù)據(jù)紅利的享受者。
如上所述,數(shù)據(jù)挖掘廣泛影響社會(huì)生活的各領(lǐng)域。探討技術(shù)的正當(dāng)性是技術(shù)合法化的前提,也是法律對(duì)技術(shù)進(jìn)行規(guī)制的基礎(chǔ)。
1.信息增值的必要條件
信息增值理論是信息經(jīng)濟(jì)學(xué)中的重要理論,主張信息在運(yùn)動(dòng)過(guò)程中出現(xiàn)了質(zhì)上、量上和價(jià)值上的遞增[6]。這種遞增是一種具有目的性、非線性關(guān)聯(lián)的,按照一定的方向和速度,高效更新的信息流通方式[7]。信息量的增值是指信息量度的增加,信息質(zhì)的增值則是信息使用效益的增大,而信息價(jià)值的增值對(duì)應(yīng)信息滿(mǎn)足受眾需求度的增強(qiáng)。信息增值源于信息在交流、加工以及交合等過(guò)程中的擴(kuò)散和傳播。其中,先進(jìn)的信息化技術(shù)平臺(tái)和暢通的信息挖掘系統(tǒng)是信息增值的重要保障。
數(shù)據(jù)作為重要的信息源泉,具有深度加工增值特性,海量數(shù)據(jù)集合形成大數(shù)據(jù),實(shí)現(xiàn)了數(shù)據(jù)量上的增值。未經(jīng)加工的數(shù)據(jù)又稱(chēng)原始數(shù)據(jù),其本身的使用價(jià)值有限,但經(jīng)數(shù)據(jù)挖掘后生成衍生數(shù)據(jù)和衍生數(shù)據(jù)關(guān)系,可用于現(xiàn)狀描述和未來(lái)預(yù)測(cè),如商業(yè)趨勢(shì)推斷、社會(huì)危險(xiǎn)因素排查等,具有極大的經(jīng)濟(jì)價(jià)值和社會(huì)效益,形成數(shù)據(jù)質(zhì)上與價(jià)值上的增值。數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)了數(shù)據(jù)的深度開(kāi)發(fā),使其從普通的電子代碼變成可識(shí)別、可分析、可深度利用的大數(shù)據(jù),催生了數(shù)據(jù)收集、存儲(chǔ)、加工、交易等系列數(shù)據(jù)產(chǎn)業(yè),促進(jìn)新型業(yè)態(tài)的發(fā)展并推動(dòng)數(shù)據(jù)治理,成為信息增值的必要條件。
2.數(shù)字經(jīng)濟(jì)發(fā)展的技術(shù)引擎
以使用數(shù)字化的知識(shí)、信息、數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素,以信息網(wǎng)絡(luò)作為主要載體,以數(shù)據(jù)信息技術(shù)作為經(jīng)濟(jì)結(jié)構(gòu)優(yōu)化推動(dòng)力的數(shù)字經(jīng)濟(jì)是大數(shù)據(jù)時(shí)代的新型經(jīng)濟(jì)業(yè)態(tài)[8],在促進(jìn)經(jīng)濟(jì)發(fā)展、實(shí)現(xiàn)經(jīng)濟(jì)轉(zhuǎn)型、提高經(jīng)濟(jì)效率、發(fā)掘新型經(jīng)濟(jì)增長(zhǎng)點(diǎn)等方面發(fā)揮著重要作用。《中國(guó)數(shù)字經(jīng)濟(jì)發(fā)展白皮書(shū)(2020年)》顯示,2019年,我國(guó)數(shù)字經(jīng)濟(jì)增加值規(guī)模達(dá)35.8萬(wàn)億元,占GDP比重近四成,數(shù)字經(jīng)濟(jì)已成為國(guó)民經(jīng)濟(jì)核心增長(zhǎng)極之一[9]。2017年,上海社科院應(yīng)用經(jīng)濟(jì)研究所發(fā)布的《中國(guó)數(shù)字經(jīng)濟(jì)宏觀影響力評(píng)估及中長(zhǎng)期稅收政策走向設(shè)計(jì)》報(bào)告預(yù)測(cè),到2030年,中國(guó)數(shù)字經(jīng)濟(jì)規(guī)模有望超過(guò)150萬(wàn)億元人民幣,將占GDP比重80%左右[10]。
區(qū)別于傳統(tǒng)工業(yè)經(jīng)濟(jì),數(shù)字經(jīng)濟(jì)以數(shù)據(jù)作為驅(qū)動(dòng)經(jīng)濟(jì)發(fā)展的關(guān)鍵生產(chǎn)要素,以數(shù)據(jù)技術(shù)進(jìn)步作為發(fā)展動(dòng)力。數(shù)據(jù)挖掘技術(shù)作為重要的數(shù)據(jù)信息技術(shù)之一,成為數(shù)字經(jīng)濟(jì)發(fā)展的重要技術(shù)引擎。以數(shù)字經(jīng)濟(jì)中電商平臺(tái)經(jīng)濟(jì)為例,電商平臺(tái)為消費(fèi)者與賣(mài)家提供交互平臺(tái),實(shí)現(xiàn)便捷的網(wǎng)上購(gòu)物服務(wù),在此過(guò)程中,電商平臺(tái)收集消費(fèi)者的瀏覽痕跡、購(gòu)買(mǎi)記錄等個(gè)人行為數(shù)據(jù)并進(jìn)行深度挖掘,發(fā)現(xiàn)用戶(hù)喜好和潛在需求,向客戶(hù)進(jìn)行精準(zhǔn)營(yíng)銷(xiāo)和定向廣告投送,引導(dǎo)消費(fèi)趨向,并不斷推陳出新迎合市場(chǎng)需求,實(shí)現(xiàn)消費(fèi)者、賣(mài)家和電商平臺(tái)的多贏局面,推動(dòng)數(shù)字經(jīng)濟(jì)的發(fā)展。數(shù)字經(jīng)濟(jì)的發(fā)展離不開(kāi)數(shù)據(jù)挖掘技術(shù)的保障,其對(duì)數(shù)據(jù)挖掘的需求將隨數(shù)據(jù)這一生產(chǎn)要素的應(yīng)用不斷深化。
3.政府?dāng)?shù)據(jù)開(kāi)放的內(nèi)在要求
政府?dāng)?shù)據(jù)作為重要的數(shù)據(jù)源,其開(kāi)放使用可以更好地滿(mǎn)足經(jīng)濟(jì)和社會(huì)發(fā)展需求,為世界各國(guó)所重視。2009年,美國(guó)總統(tǒng)奧巴馬簽署了《開(kāi)放透明政府備忘錄》,對(duì)政府?dāng)?shù)據(jù)進(jìn)行公開(kāi),隨后,美國(guó)數(shù)據(jù)門(mén)戶(hù)data.gov上線,拉開(kāi)了全球政府?dāng)?shù)據(jù)開(kāi)放運(yùn)動(dòng)(Government Open Data)的序幕。作為數(shù)據(jù)大國(guó),我國(guó)亦高度重視政府?dāng)?shù)據(jù)開(kāi)放,2020年4月發(fā)布的《中共中央國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》將推進(jìn)政府?dāng)?shù)據(jù)開(kāi)放作為加快培育數(shù)據(jù)要素市場(chǎng)的重要舉措,而《數(shù)據(jù)安全法》更是專(zhuān)章規(guī)定了政務(wù)數(shù)據(jù)的安全與開(kāi)放,強(qiáng)調(diào)大力推進(jìn)電子政務(wù)建設(shè)。
政府?dāng)?shù)據(jù)具有公共屬性,在不違反國(guó)家安全、不侵害商業(yè)秘密和個(gè)人信息安全的前提下,最大限度地對(duì)社會(huì)開(kāi)放,不僅有助于增加政府工作的透明度,提高政務(wù)工作效率、服務(wù)水平和社會(huì)治理能力,而且更能夠?yàn)閿?shù)字經(jīng)濟(jì)發(fā)展提供資源,激發(fā)數(shù)據(jù)創(chuàng)新。政府?dāng)?shù)據(jù)開(kāi)放并不是最終目的,數(shù)據(jù)開(kāi)放是為了促進(jìn)數(shù)據(jù)資源的有效獲取,實(shí)現(xiàn)數(shù)據(jù)資源的挖掘和利用,發(fā)掘數(shù)字價(jià)值進(jìn)而推進(jìn)數(shù)字經(jīng)濟(jì)發(fā)展和社會(huì)治理。因而,數(shù)據(jù)挖掘技術(shù)的推進(jìn)是政府?dāng)?shù)據(jù)開(kāi)放得以實(shí)現(xiàn)和發(fā)揮效能的保障,符合政府?dāng)?shù)據(jù)開(kāi)放的內(nèi)在要求。數(shù)據(jù)挖掘與政府?dāng)?shù)據(jù)開(kāi)放相輔相成,成為推動(dòng)數(shù)據(jù)產(chǎn)業(yè)發(fā)展、構(gòu)建數(shù)字政府以及推進(jìn)數(shù)據(jù)社會(huì)治理的重要手段。
技術(shù)如同一把雙刃劍,其在帶來(lái)技術(shù)紅利的同時(shí),不可避免地會(huì)產(chǎn)生社會(huì)法律問(wèn)題。數(shù)據(jù)挖掘亦不能幸免。通過(guò)上文分析可知,數(shù)據(jù)挖掘的正當(dāng)性不容置疑,但正當(dāng)性審視的背后,不能忽視數(shù)據(jù)挖掘產(chǎn)生的系列社會(huì)法律隱憂(yōu)。
收集存儲(chǔ)的個(gè)人數(shù)據(jù)進(jìn)入挖掘階段,經(jīng)數(shù)據(jù)預(yù)處理形成去個(gè)人身份信息的匿名數(shù)據(jù),經(jīng)統(tǒng)計(jì)分析、挖掘算法執(zhí)行等深度加工處理,隱藏的數(shù)據(jù)關(guān)系和數(shù)據(jù)模式被發(fā)掘。挖掘算法不受個(gè)人控制,數(shù)據(jù)挖掘過(guò)程極有可能超出處理者的初始預(yù)測(cè),更有甚者,反向識(shí)別技術(shù)可以對(duì)匿名化的數(shù)據(jù)進(jìn)行再識(shí)別。美國(guó)在線(AOL)曾對(duì)用戶(hù)搜索數(shù)據(jù)進(jìn)行匿名處理,刪除用戶(hù)姓名、地址等個(gè)人標(biāo)識(shí),并采用隨機(jī)ID的方式公布,但部分用戶(hù)仍被記者識(shí)別出來(lái)[11]1765。而數(shù)據(jù)挖掘產(chǎn)生的隱藏?cái)?shù)據(jù)結(jié)果很多時(shí)候被再次利用,由數(shù)據(jù)挖掘主體出售或分享給其他方,數(shù)據(jù)多次交易和使用過(guò)程中隱私暴露的風(fēng)險(xiǎn)不可忽視。
除個(gè)人隱私侵害之外,數(shù)據(jù)挖掘還在一定程度上對(duì)個(gè)人自治造成困擾。個(gè)人數(shù)據(jù)使用程度、使用目的和使用場(chǎng)所很難由個(gè)人所控制,數(shù)據(jù)挖掘通過(guò)對(duì)個(gè)人數(shù)據(jù)的挖掘分析,洞察個(gè)人行為動(dòng)向、興趣偏好,向個(gè)人推送個(gè)性化和定制化資料,干擾個(gè)人選擇和決策,一定程度上影響了個(gè)人自治的能動(dòng)性。如電商平臺(tái)通過(guò)挖掘用戶(hù)的搜索和購(gòu)買(mǎi)記錄,分析預(yù)測(cè)用戶(hù)購(gòu)買(mǎi)喜好和潛在需求,并進(jìn)行定制化推動(dòng),增加用戶(hù)黏性。數(shù)據(jù)挖掘的分析和預(yù)測(cè)功能提高了商業(yè)效率和個(gè)人生活的便捷度,但也在很大程度上影響和左右個(gè)人自我治理的動(dòng)機(jī)和途徑,使人們成為被動(dòng)性數(shù)字驅(qū)動(dòng)人。
除私人困擾外,數(shù)據(jù)挖掘亦帶來(lái)了系列社會(huì)治理難題。其一是數(shù)據(jù)歧視,數(shù)據(jù)挖掘掌握個(gè)人數(shù)據(jù),通過(guò)對(duì)個(gè)人數(shù)據(jù)的分析能夠發(fā)現(xiàn)隱藏的信息資料,進(jìn)而對(duì)群體進(jìn)行劃分并區(qū)別對(duì)待。最為明顯的是購(gòu)買(mǎi)歧視,商家依托數(shù)據(jù)挖掘掌握消費(fèi)者的購(gòu)買(mǎi)喜好、消費(fèi)能力、消費(fèi)需求緊迫度等相關(guān)信息,并據(jù)此設(shè)計(jì)不同的定價(jià)機(jī)制,導(dǎo)致不同用戶(hù)在同平臺(tái)同時(shí)段以不同價(jià)位購(gòu)買(mǎi)相同產(chǎn)品的現(xiàn)象發(fā)生。此外,同一商家會(huì)針對(duì)不同購(gòu)買(mǎi)力的群體提供不同等級(jí)的服務(wù),如為具有強(qiáng)購(gòu)買(mǎi)力的消費(fèi)者提供優(yōu)先服務(wù)而忽視低購(gòu)買(mǎi)力群體。除價(jià)格歧視外,數(shù)據(jù)挖掘帶來(lái)的另一典型歧視存在于求職過(guò)程中,用人單位利用數(shù)據(jù)挖掘分析個(gè)人數(shù)據(jù),獲得個(gè)人健康、個(gè)人性格、個(gè)人社會(huì)資源等資料信息影響招聘結(jié)果,產(chǎn)生職場(chǎng)歧視。這些由數(shù)據(jù)挖掘帶來(lái)的社會(huì)歧視會(huì)破壞有序的市場(chǎng)秩序,影響社會(huì)治理的公平和正義,產(chǎn)生和激化社會(huì)矛盾。
除社會(huì)歧視外,數(shù)據(jù)挖掘還可能引發(fā)個(gè)人自治以及社會(huì)治理的沖突。數(shù)據(jù)挖掘很大程度上實(shí)現(xiàn)了私人定制化,是滿(mǎn)足個(gè)人自我需求的有力推手[1]366-368。然而,個(gè)人過(guò)分追求自我會(huì)導(dǎo)致個(gè)人化和小團(tuán)體化,從而割裂社會(huì)整體,激化獨(dú)立個(gè)體與社會(huì)的矛盾。
數(shù)據(jù)挖掘是數(shù)據(jù)價(jià)值開(kāi)發(fā)的重要技術(shù)手段。原始數(shù)據(jù)雖然量大,但不能交易,不具有直接經(jīng)濟(jì)價(jià)值。原始數(shù)據(jù)經(jīng)數(shù)據(jù)挖掘處理形成衍生數(shù)據(jù)及數(shù)據(jù)關(guān)系,可用于描述及預(yù)測(cè)未來(lái)需求及趨勢(shì),被廣泛應(yīng)用于經(jīng)濟(jì)發(fā)展和社會(huì)治理,具有極高的經(jīng)濟(jì)和社會(huì)價(jià)值。數(shù)據(jù)是多元利益集合體,挖掘后的數(shù)據(jù)更具有多重價(jià)值屬性,涉及眾多利益主體,包括原始數(shù)據(jù)擁有者、數(shù)據(jù)挖掘主體等,涵蓋個(gè)人、政府等公共部門(mén)、商業(yè)主體等。挖掘產(chǎn)生的數(shù)據(jù)利益分割困難,引發(fā)社會(huì)分配難題。
以電商平臺(tái)為例,消費(fèi)者注冊(cè)電商平臺(tái),提供自己的個(gè)人數(shù)據(jù)以獲得平臺(tái)提供的服務(wù)。電商平臺(tái)作為數(shù)據(jù)挖掘主體收集并深度挖掘消費(fèi)者的個(gè)人數(shù)據(jù),預(yù)測(cè)消費(fèi)需求和消費(fèi)趨勢(shì),推出適應(yīng)市場(chǎng)需求的產(chǎn)品而獲得收益。此例中,對(duì)于因數(shù)據(jù)挖掘獲得的數(shù)據(jù)利益該如何分配?是由商家全部獲得還是應(yīng)分割利益于提供原始數(shù)據(jù)的消費(fèi)者?商家和消費(fèi)者的利益為何?是否都為經(jīng)濟(jì)利益還是應(yīng)有所區(qū)別?數(shù)據(jù)利益交易或提供給他方后的獲益如何劃分?類(lèi)似問(wèn)題不勝枚舉,并會(huì)隨數(shù)據(jù)挖掘技術(shù)的進(jìn)步和應(yīng)用的擴(kuò)展而不斷產(chǎn)生。如何平衡數(shù)據(jù)利益、合理分配社會(huì)財(cái)富和社會(huì)責(zé)任成為數(shù)據(jù)挖掘正當(dāng)性背后不可忽視的社會(huì)法律問(wèn)題。
現(xiàn)代社會(huì),法律成為社會(huì)控制和治理的主要手段,法律規(guī)制有助于實(shí)現(xiàn)社會(huì)公正,維護(hù)社會(huì)秩序[12]。對(duì)數(shù)據(jù)挖掘進(jìn)行法律規(guī)制是數(shù)據(jù)挖掘正當(dāng)性的歸屬,也是解決數(shù)據(jù)挖掘社會(huì)法律問(wèn)題,實(shí)現(xiàn)技術(shù)與法律統(tǒng)一的有效手段?;谝陨蠈?duì)數(shù)據(jù)挖掘正當(dāng)性及其困境的分析,本部分聚焦數(shù)據(jù)挖掘法律規(guī)制路徑的構(gòu)建,包括規(guī)制目標(biāo)的確立、規(guī)制依據(jù)的完善、規(guī)制方式的選擇以及具體規(guī)制措施的實(shí)施。
規(guī)制目標(biāo)旨在解決規(guī)制什么,是規(guī)制架構(gòu)中的基礎(chǔ)性命題。數(shù)據(jù)挖掘的規(guī)制目標(biāo)復(fù)雜而多元,針對(duì)數(shù)據(jù)挖掘發(fā)展的需求和其所帶來(lái)的社會(huì)法律問(wèn)題,應(yīng)確立鼓勵(lì)數(shù)據(jù)挖掘、確保個(gè)人數(shù)據(jù)安全、平衡協(xié)調(diào)數(shù)據(jù)利益的多元規(guī)制目標(biāo)。
首先,鼓勵(lì)數(shù)據(jù)挖掘是規(guī)制的根本目標(biāo)。小數(shù)據(jù)時(shí)代的數(shù)據(jù)資源有限且集中,數(shù)據(jù)享有者傾向于將數(shù)據(jù)私有,數(shù)據(jù)由享有者集中私密使用。大數(shù)據(jù)時(shí)代,人們對(duì)數(shù)據(jù)的關(guān)注從靜態(tài)的儲(chǔ)存轉(zhuǎn)向動(dòng)態(tài)的使用,數(shù)據(jù)價(jià)值發(fā)現(xiàn)成為重點(diǎn),數(shù)據(jù)成為新型戰(zhàn)略資源和生產(chǎn)要素。數(shù)據(jù)挖掘能力將在很大程度上決定大數(shù)據(jù)時(shí)代經(jīng)濟(jì)社會(huì)的發(fā)展速度,成為國(guó)家競(jìng)爭(zhēng)力的重要組成部分和數(shù)字經(jīng)濟(jì)發(fā)展的直接驅(qū)動(dòng)力[13]。數(shù)據(jù)挖掘作為改變世界的大數(shù)據(jù)技術(shù),是數(shù)據(jù)價(jià)值開(kāi)發(fā)的技術(shù)支撐和數(shù)字經(jīng)濟(jì)的基礎(chǔ)推手,對(duì)其采取鼓勵(lì)和促進(jìn)的態(tài)度是數(shù)據(jù)挖掘法律規(guī)制必須堅(jiān)持的根本性目標(biāo)。信息安全領(lǐng)域的著名學(xué)者Kim Taipale認(rèn)為,給予新技術(shù)發(fā)展機(jī)會(huì)之前便將其扼殺在搖籃中是極不公平的,鼓勵(lì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用并采取適當(dāng)?shù)囊?guī)制措施可以較好地解決其帶來(lái)的困擾[14]。無(wú)論是世界范圍內(nèi)的數(shù)據(jù)發(fā)展風(fēng)潮還是我國(guó)數(shù)據(jù)發(fā)展的實(shí)踐需求,否認(rèn)數(shù)據(jù)挖掘的重要性無(wú)異于畫(huà)地為牢,唯有持續(xù)鼓勵(lì)數(shù)據(jù)挖掘,促進(jìn)技術(shù)創(chuàng)新,才能夠真正迎合我國(guó)數(shù)據(jù)發(fā)展戰(zhàn)略。
同時(shí),針對(duì)技術(shù)發(fā)展的爭(zhēng)議性,我們?cè)诠膭?lì)技術(shù)創(chuàng)新的同時(shí)需正視數(shù)據(jù)挖掘暗含的風(fēng)險(xiǎn)。數(shù)據(jù)挖掘帶來(lái)的困擾以個(gè)人隱私侵害等個(gè)人數(shù)據(jù)安全保護(hù)問(wèn)題最為突出。個(gè)人數(shù)據(jù)是數(shù)據(jù)挖掘的基本單元,確保個(gè)人數(shù)據(jù)安全是數(shù)據(jù)挖掘的前提,也是數(shù)據(jù)挖掘的防火線。小數(shù)據(jù)時(shí)代,數(shù)據(jù)量有限且聯(lián)系并不緊密,數(shù)據(jù)安全問(wèn)題易發(fā)現(xiàn)和解決,個(gè)人隱私相對(duì)隱秘不易侵犯。大數(shù)據(jù)時(shí)代,伴隨著個(gè)人數(shù)據(jù)的持續(xù)獲取和使用,確保海量多樣的個(gè)人數(shù)據(jù)被合法地挖掘,防止惡意泄漏和隱私侵害,保障公民個(gè)人數(shù)據(jù)安全是數(shù)據(jù)挖掘規(guī)制的重要目標(biāo)。
此外,數(shù)據(jù)挖掘的過(guò)程中所體現(xiàn)的多重利益沖突不容忽視,公共利益、個(gè)人利益和第三方利益是數(shù)據(jù)挖掘過(guò)程中最為突出的利益表現(xiàn)。數(shù)據(jù)挖掘所涉及的公共利益包括數(shù)據(jù)挖掘在推進(jìn)社會(huì)治理、增加社會(huì)福利等方面的體現(xiàn),應(yīng)受到優(yōu)先保護(hù)。數(shù)據(jù)挖掘的基礎(chǔ)資料是個(gè)人數(shù)據(jù),個(gè)人數(shù)據(jù)之上個(gè)人的人格尊嚴(yán)與自由、個(gè)人隱私私密及信息自決等人格利益具有天然的利己性和內(nèi)向性[15]42,是公共利益的基礎(chǔ)和最終落腳點(diǎn)[16],不可只強(qiáng)調(diào)公共利益而忽視個(gè)人數(shù)據(jù)中的個(gè)人利益。此外,以數(shù)據(jù)挖掘企業(yè)為代表的第三方利益亦是數(shù)據(jù)利益中的重要體現(xiàn),對(duì)第三方利益的保護(hù)是數(shù)據(jù)市場(chǎng)有序運(yùn)轉(zhuǎn)的核心,也是數(shù)據(jù)創(chuàng)新和數(shù)據(jù)產(chǎn)業(yè)發(fā)展的動(dòng)力。公共利益、個(gè)人利益、第三方利益的平衡成為數(shù)據(jù)挖掘規(guī)制目標(biāo)中極為重要的一環(huán),通過(guò)法律之器進(jìn)行利益識(shí)別和劃分,平衡利益沖突并解決社會(huì)矛盾成為必須。
個(gè)人數(shù)據(jù)保護(hù)以及數(shù)據(jù)權(quán)屬分配是數(shù)據(jù)挖掘法律規(guī)制的核心命題,在“鼓勵(lì)挖掘-安全保護(hù)-平衡協(xié)調(diào)”規(guī)制目標(biāo)的指引下,通過(guò)完善立法明確規(guī)制規(guī)則,為數(shù)據(jù)挖掘法律規(guī)制提供依據(jù)。
其一,對(duì)個(gè)人數(shù)據(jù)進(jìn)行分類(lèi)立法保護(hù)。從內(nèi)容上看,可將個(gè)人數(shù)據(jù)分為關(guān)聯(lián)性個(gè)人數(shù)據(jù)和非關(guān)聯(lián)性個(gè)人數(shù)據(jù),關(guān)聯(lián)性個(gè)人數(shù)據(jù)又可分為直接關(guān)聯(lián)性和非直接關(guān)聯(lián)性個(gè)人數(shù)據(jù)。直接關(guān)聯(lián)性個(gè)人數(shù)據(jù)指可以直接識(shí)別個(gè)人身份的數(shù)據(jù),如個(gè)人姓名、電話、證件號(hào)碼、家庭住址等外在性身份標(biāo)識(shí)數(shù)據(jù),是個(gè)體最基本、表層的外向標(biāo)志。非直接關(guān)聯(lián)性個(gè)人數(shù)據(jù)是指無(wú)法直接關(guān)聯(lián)到個(gè)人,但可通過(guò)與其他數(shù)據(jù)結(jié)合發(fā)現(xiàn)個(gè)人身份,包括個(gè)人的性別、郵編、醫(yī)療信息、性別取向、網(wǎng)購(gòu)習(xí)慣、消費(fèi)喜好等潛在表達(dá)。直接關(guān)聯(lián)性個(gè)人數(shù)據(jù)帶有直接標(biāo)識(shí)符,無(wú)需通過(guò)與其他數(shù)據(jù)關(guān)聯(lián)可直接定位識(shí)別個(gè)人[17],具有極強(qiáng)的私密性,這類(lèi)數(shù)據(jù)的挖掘使用必須獲得個(gè)人的同意,并給予嚴(yán)格的保護(hù),這在世界范圍內(nèi)已經(jīng)達(dá)成共識(shí)。非直接關(guān)聯(lián)性個(gè)人數(shù)據(jù)無(wú)法單獨(dú)用于識(shí)別,但可通過(guò)與其他數(shù)據(jù)的結(jié)合識(shí)別到個(gè)體,且伴隨大數(shù)據(jù)技術(shù)的應(yīng)用,此類(lèi)數(shù)據(jù)數(shù)量驟增,是數(shù)據(jù)價(jià)值開(kāi)發(fā)的重要元素?;诖耍瑢?duì)該類(lèi)數(shù)據(jù)的使用無(wú)需做到嚴(yán)苛的個(gè)人知情和同意,法律保護(hù)力度可相應(yīng)降低,應(yīng)根據(jù)使用主體、目的、途徑等綜合估量。非關(guān)聯(lián)性個(gè)人數(shù)據(jù)是指數(shù)據(jù)處理后的衍生數(shù)據(jù),該類(lèi)數(shù)據(jù)為去個(gè)人身份化的匿名數(shù)據(jù),由數(shù)據(jù)挖掘主體控制,嚴(yán)格意義上不屬于個(gè)人數(shù)據(jù)范疇。但由于該類(lèi)數(shù)據(jù)在使用過(guò)程中仍存在去識(shí)別化的可能,個(gè)人隱私再發(fā)現(xiàn)和侵害的風(fēng)險(xiǎn)仍然存在,需要給予一定程度的保護(hù)。
個(gè)人數(shù)據(jù)在數(shù)字化時(shí)代極易被收集和記錄,很多時(shí)候已處于公開(kāi)狀態(tài)。因而依據(jù)個(gè)人數(shù)據(jù)是否已公開(kāi),可從形式上將其分為個(gè)人已公開(kāi)數(shù)據(jù)和未公開(kāi)數(shù)據(jù)。前者是已經(jīng)通過(guò)合法渠道為公眾所知的個(gè)人數(shù)據(jù)或個(gè)人已公開(kāi)的數(shù)據(jù),后者則仍處于未被獲知狀態(tài)。對(duì)于前者,再收集和利用無(wú)需個(gè)人同意,但應(yīng)通知相關(guān)主體;對(duì)于后者,仍需按照個(gè)人數(shù)據(jù)的內(nèi)容進(jìn)行分類(lèi)識(shí)別獲取和應(yīng)用[15]44。
其二,識(shí)別數(shù)據(jù)之上的利益并進(jìn)行數(shù)據(jù)確權(quán)。如上所述,數(shù)據(jù)挖掘過(guò)程中涉及多種數(shù)據(jù)表現(xiàn)形態(tài)和數(shù)據(jù)主體,不同數(shù)據(jù)之上體現(xiàn)了不同的數(shù)據(jù)利益,區(qū)分?jǐn)?shù)據(jù)利益并進(jìn)行相應(yīng)的賦權(quán)是解決現(xiàn)有數(shù)據(jù)利益分配難題的根本之策,也是數(shù)字經(jīng)濟(jì)持續(xù)發(fā)展的保障。學(xué)術(shù)界對(duì)此形成了數(shù)據(jù)權(quán)利說(shuō)、數(shù)據(jù)利益說(shuō)、數(shù)據(jù)非權(quán)益客體說(shuō)等觀點(diǎn),但在《民法典》《數(shù)據(jù)安全法》等立法文件中均未見(jiàn)此類(lèi)規(guī)定。2020年7月,深圳市發(fā)布《深圳經(jīng)濟(jì)特區(qū)數(shù)據(jù)條例(征求意見(jiàn)稿)》,開(kāi)創(chuàng)性地提出了數(shù)據(jù)權(quán)這一概念,并區(qū)分主體設(shè)置了個(gè)人數(shù)據(jù)權(quán)、公共數(shù)據(jù)權(quán)和數(shù)據(jù)要素市場(chǎng)主體的數(shù)據(jù)權(quán),但因?qū)Σ煌瑪?shù)據(jù)缺乏屬性界定,不同權(quán)利重合交織,相關(guān)規(guī)定與既有法律規(guī)定矛盾等問(wèn)題而備受爭(zhēng)議[18]。日前,《深圳經(jīng)濟(jì)特區(qū)數(shù)據(jù)條例》通過(guò),刪除原稿中第4條“數(shù)據(jù)權(quán)”的提法,代之“數(shù)據(jù)權(quán)益”的稱(chēng)謂。
在數(shù)據(jù)挖掘過(guò)程中,根據(jù)數(shù)據(jù)主體的不同,可區(qū)分為個(gè)人數(shù)據(jù)主體、數(shù)據(jù)挖掘主體和公共數(shù)據(jù)主體,不同數(shù)據(jù)主體對(duì)應(yīng)不同數(shù)據(jù),分別享有數(shù)據(jù)人格權(quán)益、數(shù)據(jù)財(cái)產(chǎn)權(quán)益以及公共利益。在數(shù)據(jù)挖掘之前的數(shù)據(jù)收集、存儲(chǔ)過(guò)程中,數(shù)據(jù)主要以可識(shí)別的個(gè)人數(shù)據(jù)和政府等公共事務(wù)組織持有的公共數(shù)據(jù)為主,收集存儲(chǔ)的數(shù)據(jù)進(jìn)入挖掘階段,數(shù)據(jù)挖掘主體通過(guò)清洗、脫敏、算法等數(shù)據(jù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行深度挖掘,產(chǎn)生具有財(cái)產(chǎn)價(jià)值的衍生數(shù)據(jù)。個(gè)人數(shù)據(jù)又可稱(chēng)為個(gè)人信息,因具有可識(shí)別性特征被視作個(gè)人數(shù)據(jù)主體的組成部分,是自然人參與社會(huì)交往互動(dòng)的載體,也是個(gè)體人格表現(xiàn)和發(fā)展的工具[19]。個(gè)人數(shù)據(jù)主體享有個(gè)人數(shù)據(jù)之上的人格權(quán)益,其以個(gè)人信息自決為核心,包括個(gè)人數(shù)據(jù)復(fù)制權(quán)、異議權(quán)、刪除權(quán)等積極權(quán)益以及被侵害后的救濟(jì)權(quán)益,這在我國(guó)《民法典》的個(gè)人信息保護(hù)相關(guān)章節(jié)進(jìn)行了規(guī)定。數(shù)據(jù)挖掘主體對(duì)其付出時(shí)間、技術(shù)等成本挖掘形成的衍生數(shù)據(jù)享有財(cái)產(chǎn)權(quán)益,既可以占有、使用、交易(1)此處的交易為廣義的交易,包括轉(zhuǎn)讓、商事交易、共享等交換性數(shù)據(jù)獲取行為。并享有相關(guān)收益,又可以阻止其他數(shù)據(jù)處理機(jī)構(gòu)未經(jīng)其允許擅自獲取衍生數(shù)據(jù)。除個(gè)人數(shù)據(jù)主體和數(shù)據(jù)挖掘主體外,政府等公共事務(wù)組織所掌握的公共數(shù)據(jù)具有公共價(jià)值,公共數(shù)據(jù)及挖掘后產(chǎn)生的數(shù)據(jù)之上的利益應(yīng)歸屬全體社會(huì)成員所有,公共數(shù)據(jù)的使用權(quán)益則應(yīng)由政府等公共事務(wù)組織及其所授權(quán)的機(jī)構(gòu)代表社會(huì)成員行使。
合作規(guī)制是指通過(guò)多主體圍繞多中心進(jìn)行多層次的合作治理從而實(shí)現(xiàn)規(guī)制目標(biāo)的治理方式,是世界法律規(guī)制的重要方式和趨勢(shì)[20]。數(shù)據(jù)挖掘的規(guī)制是一項(xiàng)系統(tǒng)性工程,并非依靠單個(gè)個(gè)體可完成,需依賴(lài)于數(shù)據(jù)挖掘生態(tài)系統(tǒng)中的各主體進(jìn)行合作[21]。數(shù)據(jù)挖掘規(guī)制涉及的主體主要包括個(gè)人數(shù)據(jù)主體、數(shù)據(jù)挖掘主體和政府。
1.賦予個(gè)人數(shù)據(jù)主體事后選擇權(quán)
數(shù)據(jù)挖掘主體基于其所具有的信息優(yōu)勢(shì)、技術(shù)優(yōu)勢(shì)形成一定的數(shù)據(jù)權(quán)力,極易對(duì)個(gè)人數(shù)據(jù)主體的數(shù)據(jù)權(quán)利產(chǎn)生影響。對(duì)此,《民法典》《網(wǎng)絡(luò)安全法》等法律在知情同意原則基礎(chǔ)上賦予了個(gè)人數(shù)據(jù)主體復(fù)制查閱、異議更正、刪除等數(shù)據(jù)權(quán)益,并對(duì)個(gè)人隱私數(shù)據(jù)給予隱私權(quán)保護(hù),這些規(guī)定有利于保證個(gè)人對(duì)其數(shù)據(jù)的自主控制權(quán)能,保護(hù)個(gè)人數(shù)據(jù)安全和個(gè)人隱私不受侵害。
除此之外,應(yīng)賦予個(gè)人是否接受數(shù)據(jù)挖掘及數(shù)據(jù)挖掘結(jié)果的選擇權(quán),這是知情同意原則在數(shù)據(jù)挖掘中的拓展。數(shù)據(jù)挖掘作為數(shù)據(jù)加工的重要環(huán)節(jié),使用自動(dòng)化決策及其他算法技術(shù)對(duì)個(gè)人數(shù)據(jù)深度挖掘,對(duì)個(gè)體及個(gè)體行為進(jìn)行深入觀察和刻畫(huà),形成有針對(duì)性的挖掘結(jié)果影響個(gè)人選擇、決策等個(gè)人自治能力,基于數(shù)據(jù)挖掘的個(gè)性化推薦是典型體現(xiàn)。同時(shí),因數(shù)據(jù)挖掘具有強(qiáng)技術(shù)依賴(lài)性,受其影響的個(gè)體很難參與到數(shù)據(jù)挖掘的過(guò)程中,個(gè)人成為數(shù)據(jù)挖掘結(jié)果的被動(dòng)承擔(dān)者,甚至為錯(cuò)誤的挖掘結(jié)果買(mǎi)單,個(gè)人被動(dòng)自治、個(gè)人受到數(shù)據(jù)歧視均可歸為此類(lèi)。挖掘前的知情同意固然能夠在一定程度上保護(hù)個(gè)體權(quán)利,但因無(wú)法影響挖掘過(guò)程和挖掘結(jié)果而效果不甚理想。對(duì)此,應(yīng)賦予個(gè)人事后選擇權(quán),即當(dāng)數(shù)據(jù)挖掘結(jié)果可能對(duì)個(gè)體產(chǎn)生重大影響時(shí),權(quán)利人可自主決定是否接受數(shù)據(jù)挖掘結(jié)果,并有權(quán)對(duì)錯(cuò)誤的、片面的數(shù)據(jù)挖掘結(jié)果提出質(zhì)疑、要求更正。歐盟第29 條工作組將重大影響限定為能夠?qū)€(gè)人的選擇、行為或處境產(chǎn)生重大影響或具有重大影響的強(qiáng)潛在可能性,極端的情況下甚至?xí):€(gè)人權(quán)利,如個(gè)人權(quán)利排除或歧視[22]184。我國(guó)《電子商務(wù)法》中數(shù)據(jù)平臺(tái)向用戶(hù)提供個(gè)性化推薦服務(wù)時(shí)應(yīng)同時(shí)提供無(wú)個(gè)性化推薦選項(xiàng)的相關(guān)規(guī)定從側(cè)面肯定了事后選擇權(quán)。事后選擇權(quán)是個(gè)人數(shù)據(jù)主體參與影響數(shù)據(jù)挖掘結(jié)果的體現(xiàn),其實(shí)現(xiàn)有賴(lài)于數(shù)據(jù)挖掘主體所提供的保障,將在下文中詳細(xì)闡述。
2.明確數(shù)據(jù)挖掘主體的保護(hù)義務(wù)
其一,采用數(shù)據(jù)脫敏及匿名化技術(shù)保護(hù)個(gè)人數(shù)據(jù)安全和隱私。數(shù)據(jù)脫敏是大數(shù)據(jù)安全及隱私保護(hù)的關(guān)鍵技術(shù),其通過(guò)數(shù)據(jù)變形處理敏感數(shù)據(jù),降低數(shù)據(jù)敏感程度,減少敏感數(shù)據(jù)暴露的可能和泄露的風(fēng)險(xiǎn),以實(shí)現(xiàn)敏感數(shù)據(jù)的保護(hù)。數(shù)據(jù)脫敏針對(duì)不同場(chǎng)景、不同數(shù)據(jù)處理目的以及不同數(shù)據(jù)敏感程度,采取有差異的脫敏規(guī)則和算法,對(duì)數(shù)據(jù)給予不同程度的脫敏處理,實(shí)現(xiàn)數(shù)據(jù)安全、私密與數(shù)據(jù)可用性的統(tǒng)一。常用的脫敏算法包括數(shù)據(jù)加密、數(shù)據(jù)掩碼、數(shù)據(jù)替換以及數(shù)據(jù)模糊[23]。此外,為實(shí)現(xiàn)更高程度的脫敏保護(hù),滿(mǎn)足高敏感度數(shù)據(jù)保護(hù)的需求,匿名化應(yīng)運(yùn)而生,成為保障個(gè)人數(shù)據(jù)安全和隱私保護(hù)的重要方式之一。個(gè)人數(shù)據(jù)匿名化又稱(chēng)為個(gè)人數(shù)據(jù)去身份化,該技術(shù)已為世界主要數(shù)據(jù)體所普遍應(yīng)用。歐盟GDPR將匿名化界定為通過(guò)某種方式對(duì)個(gè)人數(shù)據(jù)處理后,沒(méi)有額外數(shù)據(jù)則不能識(shí)別數(shù)據(jù)主體的數(shù)據(jù)處理方式[24]。我國(guó)《網(wǎng)絡(luò)安全法》第42條采取“經(jīng)過(guò)處理無(wú)法識(shí)別特定個(gè)人且不能復(fù)原”的規(guī)定側(cè)面體現(xiàn)了匿名化這一理念(2)我國(guó)多項(xiàng)個(gè)人信息規(guī)范性文件中存在匿名化的相關(guān)規(guī)定:2014年發(fā)布的《中國(guó)互聯(lián)網(wǎng)定向廣告用戶(hù)信息保護(hù)去身份化指引》將匿名化界定為“通過(guò)對(duì)某項(xiàng)信息或信息的集合(例如數(shù)據(jù)集)進(jìn)行變更,以達(dá)到去除或模糊個(gè)人身份關(guān)聯(lián)信息目的的過(guò)程,從而實(shí)現(xiàn)信息轉(zhuǎn)移或公開(kāi)時(shí)的保密和隱私目的”。2020年3月發(fā)布、2020年10月生效的GB/T 35273-2020《信息安全技術(shù) 個(gè)人信息安全規(guī)范》將匿名化規(guī)定為“通過(guò)對(duì)個(gè)人信息的技術(shù)處理,使得個(gè)人信息主體無(wú)法被識(shí)別或者關(guān)聯(lián),且處理后的信息不能被復(fù)原的過(guò)程”,并認(rèn)為經(jīng)匿名化處理后所得的信息不屬于個(gè)人信息。日前發(fā)布的《網(wǎng)絡(luò)安全標(biāo)準(zhǔn)實(shí)踐指南——移動(dòng)互聯(lián)網(wǎng)應(yīng)用程序(App)收集使用個(gè)人信息自評(píng)估指南》評(píng)估點(diǎn)五中規(guī)定向他人提供個(gè)人信息前須征得用戶(hù)同意,經(jīng)匿名化處理的除外。。匿名化的目的是通過(guò)技術(shù)手段將個(gè)人數(shù)據(jù)中的人格要素剝離,降低數(shù)據(jù)流通中的隱私風(fēng)險(xiǎn),發(fā)揮數(shù)據(jù)的使用價(jià)值。
在數(shù)據(jù)挖掘的過(guò)程中,個(gè)人數(shù)據(jù)匿名化屬于數(shù)據(jù)預(yù)處理階段,是數(shù)據(jù)挖掘主體應(yīng)采取的重要技術(shù)。個(gè)人數(shù)據(jù)匿名化的重點(diǎn)包括:第一,結(jié)合個(gè)人數(shù)據(jù)分類(lèi)確立匿名化的標(biāo)準(zhǔn)。根據(jù)上文對(duì)個(gè)人數(shù)據(jù)的劃分,關(guān)聯(lián)性個(gè)人數(shù)據(jù)是匿名化的重點(diǎn),直接關(guān)聯(lián)性個(gè)人數(shù)據(jù)含有識(shí)別個(gè)體的直接標(biāo)識(shí)符,如姓名、身份證號(hào)碼、家庭住址等,屬于個(gè)人隱私數(shù)據(jù)或與個(gè)人密切相關(guān)的數(shù)據(jù),需將直接標(biāo)識(shí)符去除或改變方可實(shí)現(xiàn)此類(lèi)數(shù)據(jù)的匿名化。非直接關(guān)聯(lián)性個(gè)人數(shù)據(jù)中包含的間接標(biāo)識(shí)符可識(shí)別性相對(duì)較弱,無(wú)法直接關(guān)聯(lián)到個(gè)體,但具有潛在識(shí)別性和關(guān)聯(lián)識(shí)別性。伴隨網(wǎng)絡(luò)服務(wù)范圍的不斷擴(kuò)展,網(wǎng)絡(luò)行為驟增,購(gòu)物潛能、出行喜好等新型間接標(biāo)識(shí)符層出不窮,是數(shù)據(jù)價(jià)值開(kāi)發(fā)的重要元素?;诖?,針對(duì)非直接關(guān)聯(lián)性個(gè)人數(shù)據(jù)中的間接標(biāo)識(shí)符的處理不可一概而論,應(yīng)結(jié)合具體的使用場(chǎng)景和隱私風(fēng)險(xiǎn)評(píng)估決定[25]。第二,個(gè)人數(shù)據(jù)匿名化必須高度重視再識(shí)別技術(shù)的規(guī)制。匿名化的個(gè)人數(shù)據(jù)在實(shí)踐中屢次被再識(shí)別,引發(fā)專(zhuān)家學(xué)者的質(zhì)疑,美國(guó)學(xué)者Paul Ohm 認(rèn)為,匿名化這一技術(shù)手段在個(gè)人隱私保護(hù)中的作用甚微,其無(wú)法阻止惡意入侵和再識(shí)別,并指出匿名化這一理念已走向滅亡[11]1732。然而,匿名化追求的是風(fēng)險(xiǎn)最小化,而非絕對(duì)無(wú)風(fēng)險(xiǎn)。匿名化和再識(shí)別兩項(xiàng)技術(shù)在發(fā)展中相互博弈,我們不能因此直接否認(rèn)匿名化的作用,而是應(yīng)對(duì)再識(shí)別進(jìn)行限制。需從法律層面要求數(shù)據(jù)挖掘主體承諾不再重新進(jìn)行個(gè)人數(shù)據(jù)的識(shí)別,且在向第三方提供數(shù)據(jù)時(shí)以協(xié)議等形式要求第三方不得再識(shí)別匿名化的個(gè)人數(shù)據(jù)。這在《中國(guó)互聯(lián)網(wǎng)定向廣告用戶(hù)信息保護(hù)行業(yè)框架標(biāo)準(zhǔn)》中有所體現(xiàn),但因標(biāo)準(zhǔn)效力不足,禁止再識(shí)別并未引起業(yè)界的重視。美國(guó)法對(duì)此做了詳細(xì)規(guī)定,將數(shù)據(jù)處理機(jī)構(gòu)承諾不進(jìn)行數(shù)據(jù)再識(shí)別并通過(guò)協(xié)議禁止其下游接收方再識(shí)別作為匿名化的標(biāo)準(zhǔn)之一。我國(guó)相關(guān)立法應(yīng)對(duì)此進(jìn)行吸納,并設(shè)置相應(yīng)的處罰措施[26]。同時(shí),從技術(shù)層面對(duì)數(shù)據(jù)挖掘過(guò)程中的安全和隱私風(fēng)險(xiǎn)進(jìn)行持續(xù)監(jiān)測(cè),將安全和隱私風(fēng)險(xiǎn)監(jiān)測(cè)鑲嵌到數(shù)據(jù)挖掘過(guò)程中,做到實(shí)時(shí)持續(xù)監(jiān)控識(shí)別風(fēng)險(xiǎn)。
其二,防止數(shù)據(jù)挖掘行為影響其他個(gè)人權(quán)益和社會(huì)公共秩序。通過(guò)對(duì)數(shù)據(jù)挖掘正當(dāng)性困境的分析發(fā)現(xiàn),除個(gè)人數(shù)據(jù)安全和隱私侵害外,數(shù)據(jù)挖掘易產(chǎn)生數(shù)據(jù)歧視、個(gè)人自治難題等,對(duì)個(gè)人權(quán)益及社會(huì)治理造成不利影響,究其根源是數(shù)據(jù)挖掘所依賴(lài)的算法的黑箱性所致。外部個(gè)體很難獲知算法運(yùn)行的過(guò)程,從而成為數(shù)據(jù)挖掘結(jié)果的被動(dòng)承擔(dān)者。對(duì)此,應(yīng)明確數(shù)據(jù)挖掘主體對(duì)挖掘算法的評(píng)估義務(wù)以及對(duì)挖掘結(jié)果的解釋義務(wù),并為個(gè)人數(shù)據(jù)主體提供應(yīng)對(duì)數(shù)據(jù)挖掘結(jié)果的選擇、異議及更正的渠道。
首先,數(shù)據(jù)挖掘主體應(yīng)在挖掘開(kāi)始前對(duì)挖掘所依托的算法進(jìn)行審查和評(píng)估,對(duì)其中可能存在危害個(gè)人權(quán)益及公共秩序的設(shè)計(jì)進(jìn)行整改,即數(shù)據(jù)挖掘所依托的算法必須符合社會(huì)倫理準(zhǔn)則[22]186。其既包括對(duì)算法所使用的數(shù)據(jù)準(zhǔn)確性的審查,防止因基礎(chǔ)數(shù)據(jù)錯(cuò)誤而導(dǎo)致的算法偏差,又包括排除數(shù)據(jù)挖掘主體主觀因素干預(yù)算法設(shè)計(jì)運(yùn)轉(zhuǎn)。此外,數(shù)據(jù)挖掘主體還應(yīng)進(jìn)行算法影響評(píng)估,通過(guò)落實(shí)審查和評(píng)估義務(wù),數(shù)據(jù)挖掘主體能夠在事前對(duì)挖掘所依賴(lài)的算法進(jìn)行全面掌握和排查,降低算法設(shè)計(jì)層面的侵害可能。其次,數(shù)據(jù)挖掘?qū)?shù)據(jù)的加工是一個(gè)持續(xù)且未知的過(guò)程,這加劇了數(shù)據(jù)挖掘主體和受影響的個(gè)體之間的信息不對(duì)稱(chēng)以及力量失衡的狀況,對(duì)數(shù)據(jù)行業(yè)長(zhǎng)期健康發(fā)展極為不利。解決這一問(wèn)題的關(guān)鍵便是使受挖掘結(jié)果影響的個(gè)體能夠參與到數(shù)據(jù)挖掘中并有權(quán)反向影響挖掘結(jié)果,除上文提到的賦予個(gè)人數(shù)據(jù)主體事后選擇權(quán)外,為數(shù)據(jù)挖掘主體配置相應(yīng)的義務(wù)必不可少。選擇權(quán)的前提是知情,這要求數(shù)據(jù)挖掘主體對(duì)影響個(gè)體權(quán)利和公共利益的結(jié)果作出解釋并通知相應(yīng)主體,解釋內(nèi)容并非挖掘使用的源代碼、依托的算法模型及體現(xiàn)的運(yùn)算邏輯,而應(yīng)指影響挖掘結(jié)果的輸入變量及變量影響權(quán)重。此外,數(shù)據(jù)挖掘主體還需明示對(duì)數(shù)據(jù)挖掘結(jié)果進(jìn)行異議及更正的方式和渠道。如征信機(jī)構(gòu)需解釋影響個(gè)人信用的因素(信用歷史、當(dāng)前負(fù)債等),并提供異議和修復(fù)信用的方式和渠道。
3.落實(shí)政府的數(shù)據(jù)推進(jìn)和監(jiān)管職責(zé)
政府在數(shù)據(jù)挖掘規(guī)制中具有雙重身份,其既是政府?dāng)?shù)據(jù)的管理者,肩負(fù)推進(jìn)政府?dāng)?shù)據(jù)挖掘利用的職責(zé),同時(shí),作為監(jiān)管方又需要承擔(dān)數(shù)據(jù)挖掘監(jiān)管責(zé)任。
政府部門(mén)掌握的政府?dāng)?shù)據(jù)是政府部門(mén)在履行行政職能、進(jìn)行社會(huì)事務(wù)管理的過(guò)程中收集并積累的數(shù)據(jù),其屬于公共物品和社會(huì)公共資源。近年來(lái),我國(guó)政府高度重視政府?dāng)?shù)據(jù)開(kāi)放共享,出臺(tái)相關(guān)法律和政策文件鼓勵(lì)支持政府?dāng)?shù)據(jù)的利用,不斷推出數(shù)據(jù)開(kāi)放平臺(tái),并取得了較大成效。但現(xiàn)階段我國(guó)政府?dāng)?shù)據(jù)的開(kāi)放利用水平仍處于初級(jí)階段,存在不同政府部門(mén)間數(shù)據(jù)割裂,部門(mén)關(guān)于數(shù)據(jù)利用的職能交叉、模糊,數(shù)據(jù)利用率低等問(wèn)題。政府應(yīng)著力解決現(xiàn)有數(shù)據(jù)開(kāi)放中存在的問(wèn)題,制定相應(yīng)的法律法規(guī)及指導(dǎo)性文件,在保證國(guó)家秘密、商業(yè)秘密和個(gè)人隱私不受侵害的前提下,設(shè)置政府?dāng)?shù)據(jù)挖掘使用的脫敏規(guī)則、風(fēng)險(xiǎn)防控體系及數(shù)據(jù)溯源體系等,并可與數(shù)據(jù)挖掘主體合作,推進(jìn)政府?dāng)?shù)據(jù)挖掘進(jìn)程,促進(jìn)政府?dāng)?shù)據(jù)價(jià)值發(fā)掘[27]。
此外,政府應(yīng)承擔(dān)數(shù)據(jù)挖掘監(jiān)管職責(zé)。對(duì)于數(shù)據(jù)挖掘行為,一方面,政府應(yīng)發(fā)揮引導(dǎo)規(guī)范作用,通過(guò)行政規(guī)章、辦法、指南等規(guī)范數(shù)據(jù)挖掘行為,其既包括標(biāo)準(zhǔn)性規(guī)范引導(dǎo)數(shù)據(jù)挖掘行為,如GB/T 35273-2020《信息安全技術(shù) 個(gè)人信息安全規(guī)范》對(duì)匿名化的要求,又包括針對(duì)不法或不合理的數(shù)據(jù)挖掘行為的限制性規(guī)定,表現(xiàn)為不得、不能、不準(zhǔn)等類(lèi)型的規(guī)定。未來(lái),有必要在現(xiàn)有標(biāo)準(zhǔn)基礎(chǔ)上出臺(tái)涵蓋數(shù)據(jù)挖掘全周期的標(biāo)準(zhǔn)規(guī)范,并上升到立法層面。具體包括挖掘前的數(shù)據(jù)收集、分類(lèi)標(biāo)準(zhǔn),挖掘過(guò)程中的數(shù)據(jù)脫敏標(biāo)準(zhǔn),挖掘結(jié)果的輸出轉(zhuǎn)化及交易等應(yīng)用標(biāo)準(zhǔn),以及整個(gè)挖掘過(guò)程中隱私保護(hù)和數(shù)據(jù)安全標(biāo)準(zhǔn)等。此外,政府應(yīng)承擔(dān)數(shù)據(jù)挖掘市場(chǎng)監(jiān)管責(zé)任,對(duì)非法挖掘、數(shù)據(jù)寡頭等危害市場(chǎng)秩序的行為進(jìn)行干預(yù),既可采用行政約談、行政處罰等方式懲罰非法挖掘等行為,又可以通過(guò)技術(shù)支持和稅收引導(dǎo)適當(dāng)傾斜新技術(shù)企業(yè)或中小企業(yè),防止數(shù)據(jù)壟斷。此外,對(duì)于惡意損害個(gè)人權(quán)益、危害社會(huì)公共利益的數(shù)據(jù)挖掘主體,政府可給予吊銷(xiāo)營(yíng)業(yè)執(zhí)照、取消市場(chǎng)準(zhǔn)入資格等嚴(yán)厲的處罰。
數(shù)據(jù)挖掘作為數(shù)據(jù)價(jià)值實(shí)現(xiàn)的基本技術(shù)手段本身是中立的,但技術(shù)發(fā)展所帶來(lái)的利益和問(wèn)題使其具有了正當(dāng)性探討的必要和法律規(guī)制的需求。新技術(shù)的法律規(guī)制必須處理好技術(shù)發(fā)展和法律規(guī)則的關(guān)系,技術(shù)的進(jìn)步和法律的規(guī)制不是零和博弈,拋開(kāi)法律一味地發(fā)展技術(shù)必將引發(fā)社會(huì)危機(jī),完全依靠法律解決技術(shù)問(wèn)題亦不可行。應(yīng)立足我國(guó)數(shù)據(jù)發(fā)展實(shí)踐,實(shí)現(xiàn)技術(shù)信仰和法律信仰的平衡,鼓勵(lì)數(shù)據(jù)挖掘技術(shù)應(yīng)用,推進(jìn)數(shù)據(jù)挖掘與個(gè)人數(shù)據(jù)保護(hù)的統(tǒng)一,做到數(shù)據(jù)價(jià)值開(kāi)發(fā)與數(shù)據(jù)利益分配的協(xié)調(diào),創(chuàng)新技術(shù)手段和法律規(guī)則的設(shè)計(jì)來(lái)實(shí)現(xiàn)二者的互動(dòng),通過(guò)個(gè)人數(shù)據(jù)主體、數(shù)據(jù)挖掘主體及政府的合作規(guī)制實(shí)現(xiàn)我國(guó)數(shù)據(jù)治理戰(zhàn)略目標(biāo)。數(shù)據(jù)挖掘所產(chǎn)生的規(guī)制需求歸根結(jié)底是技術(shù)性問(wèn)題向社會(huì)問(wèn)題、法律問(wèn)題的拓展,技術(shù)的進(jìn)步先于法律,但又需與法律相統(tǒng)一,方可實(shí)現(xiàn)二者的良性互動(dòng)。