韓新遠
鄭州大學(xué)法學(xué)院 河南鄭州 450001
高速發(fā)展的網(wǎng)絡(luò)信息技術(shù)使生產(chǎn)、收集、存儲、整理、分析個人信息比以往任何時候都更廣泛、快捷和深入,人類開啟了全景記錄鏡頭,世界進入了記憶模式[1],個人信息的法律保護問題逐漸成為理論研究的熱點和實務(wù)爭議的焦點。目前,學(xué)術(shù)界從個人信息的法律屬性、權(quán)屬權(quán)能、保護進路等多種角度進行了討論,產(chǎn)生了諸多優(yōu)秀成果,推動了相關(guān)立法實踐,呈現(xiàn)百家爭鳴之勢。易言之,一門新興的法學(xué)—數(shù)據(jù)法學(xué)正在蓬勃發(fā)展。然而,對數(shù)據(jù)法學(xué)尤其是對個人信息權(quán)利/權(quán)益核心范疇的個人信息概念本身的研究,卻長期受到法學(xué)界的忽視[2],這直接導(dǎo)致“個人信息的范疇與邊界存在不確定性”[3]。在技術(shù)驅(qū)動和認知迭代的加持下,個人信息似乎成了一個規(guī)范性稀薄的流動概念,這既不利于個人信息權(quán)利/權(quán)益的科學(xué)設(shè)定,又對司法裁判中的法律論證造成困擾。
概念是一切認識的邏輯前提,也是一切知識的結(jié)構(gòu)基石。為了避免個人信息概念陷入相對主義的氤氳,本文從域內(nèi)外定義建構(gòu)類型的考察入手,分析個人信息概念認定的困境和問題癥結(jié),繼而提出個人信息內(nèi)涵的二元架構(gòu)理論,并剖析其運行邏輯,以追尋特定時空條件下法律術(shù)語邊界劃定的客觀性,明晰個人信息概念家族圖式的內(nèi)在理路和明朗個人信息內(nèi)部區(qū)分的風(fēng)險考量,期望為個人信息保護的相關(guān)學(xué)術(shù)研究提供更加堅實的法理基礎(chǔ)。
在社會分工越來越精細、社會連帶越來越緊密、人際關(guān)系越來越復(fù)雜的社會生活條件下,對個人信息的保護成為人們的一種現(xiàn)代性需求。據(jù)統(tǒng)計,截至2021 年1 月,世界上擁有個人信息保護法規(guī)的國家和地區(qū)已增至145 個[4]。一些國家的正式規(guī)范性文件,抑或一些國際組織的框架性協(xié)議,均對個人信息做了相應(yīng)定義。目前雖然在個人信息概念的語詞上呈現(xiàn)出一種趨同態(tài)勢,但從形式結(jié)構(gòu)、要素結(jié)構(gòu)和風(fēng)險結(jié)構(gòu)等層面來看,域內(nèi)外對個人信息定義的建構(gòu)卻體現(xiàn)了不同維度的考量和相異角度的取舍。
從定義的形式結(jié)構(gòu)來看,當(dāng)前個人信息定義模式可以劃分為“概括式”和“概括+列舉式”兩種[5]。也有學(xué)者稱之為“單純定義”模式和“定義加列舉”模式,前者僅僅指出構(gòu)成個人信息的核心要素,如自然人、記錄、可識別等,并進行抽象概括,沒有明確將姓名、身份證號、社保號、郵箱地址、IP 地址等含有明顯識別符的信息列為個人信息,也沒有將特定的信息類型排除在外;后者在對個人信息的本質(zhì)特征進行一般概括后,將明顯符合概念標(biāo)準的信息類型或明顯不符合概念標(biāo)準的信息類型予以列舉,進行典型示例,從而強化個人信息的具體性、降低范圍的模糊性和增強司法適用的可操作性[6]。
從域內(nèi)外現(xiàn)行規(guī)范來看,并無統(tǒng)一做法,上述兩種立法模式均有被普遍采用。采取概括式方案的有:澳大利亞《隱私法》(2016)、芬蘭《個人數(shù)據(jù)法》(1999)、瑞典《個人數(shù)據(jù)法》(1998)、歐盟《有關(guān)個人數(shù)據(jù)自動化處理的個人數(shù)據(jù)保護協(xié)定》(1981)、經(jīng)濟合作組織《OECD 隱私框架》(2013)、中國工信部《規(guī)范互聯(lián)網(wǎng)信息服務(wù)市場秩序若干規(guī)定》(2011)、中國《中華人民共和國個人信息保護法》(以下簡稱《個人信息保護法》)(2021)等。采取“概括+列舉式”方案的有:德國《聯(lián)邦個人數(shù)據(jù)保護法》(1977)、加拿大《信息自由和隱私保護法》(1990)、中國《中華人民共和國網(wǎng)絡(luò)安全法》(以下簡稱《網(wǎng)絡(luò)安全法》)(2016)、中國《中華人民共和國民法典》(以下簡稱《民法典》)(2020)等[7]。
歐盟委員會內(nèi)部咨詢機構(gòu)第29 條工作組(WP29)在《關(guān)于個人數(shù)據(jù)概念的意見》中指出了個人數(shù)據(jù)有四大要素,即自然人、相關(guān)性、可識別性和任何信息。這四個要素成為“識別+關(guān)聯(lián)型”定義模式不可或缺的組件,然而,在進一步的區(qū)分下,不同的規(guī)范文件卻呈現(xiàn)相異的要素結(jié)構(gòu),主要分為以下兩類。其一,功用定義之識別效用式。此種定義模式以是否具有識別效用作為個人信息的本質(zhì)要求,只要能夠單獨識別或與其他信息結(jié)合能夠識別自然人的信息就認定為個人信息。其二,關(guān)系定義之關(guān)聯(lián)關(guān)系式。此種定義模式以與自然人相關(guān)的任何(各種)信息為個人信息的本質(zhì)要求,只要該自然人能被識別出來或可能被識別出來,有關(guān)該自然人的任何(各種)信息就可歸為個人信息。
識別效用式的典型立法實踐為中國的《民法典》,其規(guī)定“個人信息是以電子或者其他方式記錄的能夠單獨或者與其他信息結(jié)合識別特定自然人的各種信息”;關(guān)聯(lián)關(guān)系式立法的代表是歐盟的《通用數(shù)據(jù)保護條例》(以下簡稱GDPR),其認為“個人數(shù)據(jù)指的是任何已識別或可識別的自然人相關(guān)的信息”,可識別的自然人是能夠被直接或間接識別的個體,隨后列舉了一些典型的識別符或識別要素。通過對語詞表述的辨析可發(fā)現(xiàn),若去除修飾語,識別效用式可化約為“具有識別自然人效用的信息為個人信息”,關(guān)聯(lián)關(guān)系式則可化約為“被識別后的自然人有關(guān)的信息為個人信息”。兩種類型雖然均指向“各種信息”或“所有信息”,但前者落腳于識別要素,后者著眼于關(guān)聯(lián)要素,相較前者,后者的識別要素在邏輯上前置于關(guān)聯(lián)要素,識別效用直接作用于自然人,當(dāng)特定自然人被“捕捉”后,個人信息的范圍便得以確定。這樣一來,關(guān)聯(lián)關(guān)系式的個人信息概念要比識別效用式在范圍上更為廣泛,申言之,不管以任何信息、任何方式和手段達至識別自然人的狀態(tài)后,該自然人的相關(guān)信息就屬于個人信息,這種邏輯安排使個人信息的概念內(nèi)涵具有強韌的開放性張力,可以在特定的時空條件下?lián)碛虚L期的規(guī)范穩(wěn)定度①。
一般類型與特殊類型是對個人信息概念的內(nèi)部區(qū)分。歐盟的個人數(shù)據(jù)保護立法以風(fēng)險預(yù)防為原則,而且是一種以人格尊嚴為核心的風(fēng)險預(yù)防[8]。自GDPR 生效后,風(fēng)險進路成為個人信息保護立法的重要趨勢。與歐盟“高度意識形態(tài)化的個人數(shù)據(jù)被保護權(quán)”立法不同,“中國的《個人信息保護法》更具實用主義傾向,其防范的風(fēng)險也更加多元化和貼近實際”[9]。風(fēng)險控制的實踐需求決定了對個人信息進行分類分級保護成為一種可欲措施[10]。依照不同的風(fēng)險等級,可以區(qū)分出個人信息的一般類型和特殊類型。
雖然域內(nèi)外規(guī)范性文件大多采用了“一般與特殊”的個人信息二分法,但各國采取了不同的稱謂,甚至做出了更精細的劃分。比如有的采用似乎帶有更強客觀評價色彩的“特殊類型”,如歐盟GDPR 第二章的前3 條和后4 條內(nèi)容分別對應(yīng)了個人信息的一般類型和特殊類型②。有的則采用主觀評價空間更為寬泛的“敏感”數(shù)據(jù),如美國《數(shù)據(jù)隱私和保護法》(草案2022)采用消費者基本數(shù)據(jù)隱私權(quán)利的保護路徑,將消費者數(shù)據(jù)區(qū)分為涵蓋數(shù)據(jù)和敏感涵蓋數(shù)據(jù)③。在中國法律體系之內(nèi),除了敏感信息還有私密信息的概念④,雖然兩者的內(nèi)涵和外延并不相同[11]。總之,相比一般類型,特殊類型的個人信息更容易導(dǎo)致自然人的人格尊嚴受到侵害或人身、財產(chǎn)安全受到危害,故法律給予了信息處理者更嚴格的告知義務(wù)和更嚴厲的責(zé)任負擔(dān),形成了個人信息內(nèi)部基于風(fēng)險等級的差序評價格局。
不同的定義結(jié)構(gòu)卻面臨共同的定義困境。“在定義一個術(shù)語或是詞語的過程中,我們要盡可能嚴格地劃定它所代表的事物的邊界?!盵12]然而,通過前文對域內(nèi)外個人信息定義結(jié)構(gòu)的考察可以看出,作為一個較為晚近產(chǎn)生的法律概念,無論從外部視角定義的形式結(jié)構(gòu)和要素結(jié)構(gòu)入手,還是從內(nèi)部視角定義的風(fēng)險結(jié)構(gòu)著眼,個人信息都面臨著準確認定的諸多困境。造成這種狀況,既有技術(shù)遮蔽因素,又有認知迭代緣由,對此,我們有必要予以深入解析。
1. 識別標(biāo)準難以認定
絕大多數(shù)規(guī)范性文件中個人信息的定義都含有“識別”這個關(guān)鍵要素?!白R別”指的是通過信息將特定個人認出來,是自然人的一個“顯名”過程[13]。對識別要素的表述均采用“復(fù)合識別”結(jié)構(gòu),一類是“已識別+可識別”[14],另一類是“單獨識別+結(jié)合識別”或“直接識別+間接識別”。其中“單獨識別”和“直接識別”是一種同步狀態(tài),意味著憑借該信息可以直接將特定個人從其所處的群體中“區(qū)分”出來;“可識別”是一種潛在狀態(tài),意味著通過該信息能夠在人群中“追索”到特定個人的預(yù)判。由此可見,區(qū)別于其他信息的“特殊性”構(gòu)成了識別的標(biāo)準,而“可識別”則是識別標(biāo)準的重點和難點,所有關(guān)于識別標(biāo)準的解釋空間和分歧爭議均系于此。
從信息識別者的視角出發(fā),“可識別”標(biāo)準便可分為三類,且均存在異議。其一,具體處理者視角,即以信息處理者自身的條件和能力作為識別標(biāo)準[15];其二,一般公眾視角,即認為應(yīng)從普通大眾、一般人的角度出發(fā)判斷個人信息的識別性[16];其三,任意主體視角,即以該信息是否能夠被世界上任何一個人或機構(gòu)所識別為標(biāo)準。前兩種標(biāo)準主觀性明顯,難以把握和量化,比如具體處理者視角,是僅僅依據(jù)其當(dāng)時當(dāng)?shù)氐哪芰Γ€是要兼顧其信息收集的規(guī)模和時長?一般公眾視角是否忽視了不同主體識別能力的差異性?即使被稱為絕對標(biāo)準的任意主體視角,也難以預(yù)留技術(shù)發(fā)展對識別能力突破的空間。識別標(biāo)準的繁雜導(dǎo)致了個人信息外延的伸縮。
2. 風(fēng)險等級難以界分
誠然,基于風(fēng)險等級可以將個人信息劃分為一般和特殊兩個類別,但是區(qū)分的依據(jù),即基于什么樣的理由確定何為特殊信息、敏感信息抑或私密信息卻缺乏一個明晰的標(biāo)準。各國法規(guī)中要么直接例舉特殊信息類型,要么以“容易導(dǎo)致自然人人格尊嚴受到侵害或者人身財產(chǎn)安全受到危害”這種富有評價彈性的語詞進行說明。以敏感信息為例,其“敏感性”是依據(jù)信息主體自身的心理感受,側(cè)重個體差異性,還是基于社會一般合理認知的客觀評判,甚至綜合考量國別地域、文化傳統(tǒng)、法治理念、宗教信仰、風(fēng)俗習(xí)慣、經(jīng)濟發(fā)展?fàn)顩r、主流價值觀等因素影響?
另外,隨著理論研究的深入和認知水平的迭代,個人信息逐漸實現(xiàn)了從身份識別到行為識別或特征識別。有學(xué)者提出了行為識別(Activity recognition)和認知型識別(recognition identifiability)的概念。行為識別指的是基于計算機科技的發(fā)展而產(chǎn)生的一種對于用戶行為方式的一種識別,通過一個未知主體某種行為的時間、地點和活動場景等能推斷出其真實身份[17];認知型識別在于不與顯名的個人產(chǎn)生聯(lián)系的情況下對其進行認知[18]。也有學(xué)者認為“識別”除身份識別外還包括步態(tài)、語音等個體特征識別[19]。這種識別路徑的更新,更讓不同信息風(fēng)險等級之間的界線更加模糊和游移。
1. 全景記憶—信息來源的范圍突破
緣于傳統(tǒng)社會生產(chǎn)力水平的低下和社會關(guān)系的簡單,對個人信息的關(guān)注和記錄的動因稀缺,除去有限的檔案和文學(xué)記載,絕大部分將在當(dāng)事人的記憶中自然消退。即使在信息社會,其初期,公眾已然成為信息主體,但由于收集條件的限制、存儲成本的高昂和信息價值的稀薄,很多在線交互的信息(如搜索關(guān)鍵詞、購物記錄)在完成它的功能使命后,就被丟進了數(shù)據(jù)墳?zāi)?,普通人可以輕易做到“大隱隱于世”[20]。然而,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展、數(shù)據(jù)技術(shù)的普及和硬件成本的降低,個人信息電子化、可存儲越來越便捷,這使獲得整體樣本的全數(shù)據(jù)模式得以實現(xiàn),數(shù)據(jù)在理論上得以永存和沉積,每一個自然人都成為信息的不竭源泉,并且該自然人產(chǎn)生的信息可以無限期疊加,使其擁有一份趨向“透明化”和“永久化”的電子檔案。
2. 多元識別—標(biāo)簽信息的身份突破
隨著個人信息保護力度的不斷增強和保護機制的不斷完善,我國規(guī)范性文件對個人信息的認定,除了身份識別之外,還出現(xiàn)了行為識別、特征識別等新識別路徑,識別的對象已經(jīng)超越了自然人的“具體身份”,只要確定一個特定主體的存在即可⑤。之所以出現(xiàn)這種多元識別態(tài)勢,緣于技術(shù)升級和認知迭代,譬如Cookie 技術(shù)以及其升級版本,如Flash Cookie、Ever Cookie 的出現(xiàn),甚至出現(xiàn)了與Cookie 技術(shù)機理完全不同的通過交叉比對關(guān)鍵信息驗證來識別計算機的Fingerprinting 技術(shù)[21]。另外,還有 web beacon(網(wǎng)站信標(biāo))、Log files(日志文件)、ET Tag(實體標(biāo)簽)、JavaScript 等技術(shù)。在這些技術(shù)的加持下,諸如國際移動設(shè)備身份碼IMEI、網(wǎng)絡(luò)設(shè)備硬件地址MAC、廣告標(biāo)識符IDFA 或其他任意標(biāo)注,在無須識別特定主體下就可進行信息的標(biāo)簽化,使這些之前不具有身份識別的信息具有了識別性,或者幾類不具有身份識別的信息經(jīng)過交叉驗證具有了可識別性(交叉驗證的聯(lián)結(jié)點也可以說是一種標(biāo)識信息),使匿名化的信息被再次識別[22]。
3. 數(shù)據(jù)分析—痕跡信息的識別突破
網(wǎng)絡(luò)用戶在使用計算機和網(wǎng)絡(luò)的行為過程中被計算機硬件或軟件記錄下來的行為事件或過程數(shù)據(jù)是個人在網(wǎng)絡(luò)空間留下的痕跡信息[23]。在模擬數(shù)據(jù)時代和信息技術(shù)發(fā)展初期階段,這類瞬時性的痕跡信息很難說具有獨立的身份識別功能。但是,隨著信息的電子化、可存儲越來越便捷,在大數(shù)據(jù)強大的聚合、分析能力前,在數(shù)據(jù)運用利益驅(qū)動下,痕跡信息的“可識別性”不斷增強。這些痕跡信息起初表現(xiàn)為靜態(tài)的孤立信息點,隨著行為的重復(fù)、事件的疊加,由點成線,呈現(xiàn)出一個動態(tài)過程,標(biāo)記相應(yīng)主體的購買記錄、行蹤信息、搜索歷史等,勾勒出用戶的網(wǎng)絡(luò)行為痕跡,完成數(shù)字畫像[24]。就這樣,“依技術(shù)本身的處理及其結(jié)合的可能性,可能使一項無關(guān)緊要的數(shù)據(jù)獲得新價值”[25],痕跡信息實現(xiàn)了從不可識別到可識別的突破。
現(xiàn)實困境呼喚新的分析視角。依照本體論信息說,任何物體都成為一個直接存在和間接存在的統(tǒng)一體,既是物質(zhì)體又是信息體[26]。當(dāng)個人作為信源,被自己、他人或類人的各類機器所觀察、感知、分析,其中有關(guān)存在方式、運動狀態(tài)、交互效應(yīng)的信息類型構(gòu)成痕跡信息,而對作為信源的自然人進行“區(qū)分識別”的信息類型則構(gòu)成標(biāo)識信息。當(dāng)前的個人信息保護主要采取的是以“識別”為抓手,將具有標(biāo)識自然人身份功效的標(biāo)識信息納入個人信息范疇進行法律保護的進路,其落腳點在于對標(biāo)識信息的處理,與此同時,痕跡信息卻在規(guī)范制定之初就被排除在評價之外。由此可見,現(xiàn)有的個人信息保護對痕跡信息與標(biāo)識信息的二元隔離是一種人為的制度設(shè)計。傳統(tǒng)個人信息保護制度的原理是從割裂標(biāo)識信息與痕跡信息的聯(lián)系切入的,易言之,是通過對法律意義上的個人信息—標(biāo)識信息的模糊、掩蓋即匿名化來實現(xiàn)對個人信息(隱私)的保護,重心在于通過確?!皹?biāo)識信息”不被識別來實現(xiàn)與“痕跡信息”的“脫鉤”。當(dāng)前人們所爭議的個人信息范圍擴張難以界定以及從之前的“身份識別”到如今的“行為識別”“認知型識別”或“特征識別”等困惑和難題,其產(chǎn)生原因正是計算機在信息處理的速度、精度和深度上的能力極大提升,“可能產(chǎn)生‘新’的個人信息”,“使得原來不具有意義的信息片段同樣具有了意義”[27],使在既有機制環(huán)境下被隔離的痕跡信息與標(biāo)識信息再度勾連起來,使數(shù)據(jù)控制者知道了痕跡信息的“信源”。如此,個人信息內(nèi)涵的模糊和個人信息范圍的飄忽導(dǎo)致了以標(biāo)識信息為保護重心的二元隔離制度設(shè)計失靈。
作為一個法律專業(yè)術(shù)語,個人信息應(yīng)歸為一個“描述性概念”[28],但是既有的定義卻使用了涉及判斷的語詞,形成了帶有規(guī)范色彩的陳述?!爱?dāng)維特根斯坦(L. Wittgenstein)從零開始重新研究語言時,他把注意力集中在話語的作用上,將通過這種方法找到的各種陳述叫做語言游戲?!盵29]受此啟發(fā),筆者嘗試用不同的陳述類型對個人信息概念開展一次架構(gòu)解剖,剖析其底層邏輯。其實,被人為隔離的標(biāo)識信息和痕跡信息同為有關(guān)個人的信息,兩者相伴相生,申言之,自被信息主體生產(chǎn)出來的那一刻起,這兩類信息就作為一個統(tǒng)一體而共同呈現(xiàn)。如果類比使用語言游戲中陳述類型的話,標(biāo)識信息和痕跡信息分別對應(yīng)了個人信息概念的指稱性構(gòu)件和描述性構(gòu)件,由此形成個人信息內(nèi)涵的二元架構(gòu)。
個人標(biāo)識信息(諸如姓名、身份證號碼、電話號碼、郵箱、IP 地址等是通常意義上的個人信息)構(gòu)成了個人信息內(nèi)涵的指稱性構(gòu)件,即通過指稱性陳述將某個特定的自然人安放并暴露在“信源”位置。孤立的指稱性陳述對自然人僅僅起到標(biāo)識作用,并無信源的描述性信息,不附帶任何價值判斷,如同一個中立的識別符號。譬如姓名與稱號,還包括字號、外號、昵稱、用戶名等;身份證號碼與其他身份編碼,包括護照號碼、駕駛證號碼、社會保障號碼、醫(yī)療記錄號、學(xué)號、工作證號等;住址、郵政編碼、電話號碼與電子郵件地址;固定IP 地址,還包括IMEI、MAC、IDFA 等;個人生物識別信息,包括個人基因、指紋、聲紋、掌紋、耳廓、虹膜等。某個具體的標(biāo)識信息可歸為單獨概念類型[30],其外延是一個獨一無二的事物—某個特定的自然人。作為形式符號的指稱性構(gòu)件在語詞上具有可替代性,并非是恒定的,用以標(biāo)記和表達特定自然人的符號可以包羅萬象,無法窮盡⑥。若未與其他信息關(guān)聯(lián),指稱性構(gòu)件不具有直接的意義和價值,無法作為個人信息、敏感信息或私密信息的法律評價依據(jù)。
痕跡信息是個人信息內(nèi)涵的描述性構(gòu)件,它是特定自然人在這個物質(zhì)世界以數(shù)字化方式或其他方式記錄和存儲的一切活動的證據(jù)(證明、跡象),在數(shù)字化社會里呈現(xiàn)為“電子腳印”。痕跡信息或體現(xiàn)自然人區(qū)別于其他主體的個體特征(自然屬性),或展現(xiàn)自我與他者接觸產(chǎn)生的社會關(guān)系(社會屬性),包括公共管理關(guān)系、社會交往關(guān)系和商業(yè)消費關(guān)系[3],總之是對屬性或關(guān)系的一種描述。根據(jù)是否以認識主體的條件為轉(zhuǎn)移,描述性構(gòu)件可分為客觀描述和主觀描述,前者指被傳感器、智能終端、軟件程序、視頻監(jiān)控等感官化的工具手段(間接信宿)機械性地收集和記錄的鏡像信息或?qū)⑵渚C合分析后的衍生信息,后者指個體內(nèi)在思想的外化表達、有關(guān)該個體的任何意見表達和信息處理者或任意其他人有關(guān)該個體的意圖表示。描述性構(gòu)件是個人信息的價值源泉:一方面其關(guān)乎信息主體的外在形象、精神安寧和決策自由;另一方面其成為互聯(lián)網(wǎng)企業(yè)精準廣告投放、個性化推薦以及其他增值服務(wù)的數(shù)據(jù)支撐,是互聯(lián)網(wǎng)“依靠廣告提供免費服務(wù)”這一商業(yè)模式的基本條件[31]。
個人信息內(nèi)涵的二元構(gòu)件在自然狀態(tài)下彼此關(guān)聯(lián),但是為了實現(xiàn)保密或隱私保護,人類社會往往將兩種構(gòu)件之一進行遮蔽,以熔斷兩者之間的自然關(guān)聯(lián)。比如傳統(tǒng)社會的紙質(zhì)信件采取的是對描述性構(gòu)件的遮蔽方式,而對收發(fā)信件主體的姓名、郵政編碼和地址等指稱性構(gòu)件卻予以顯名;在信息社會的當(dāng)下,個人信息保護采取的是把指稱性構(gòu)件評價為規(guī)范意義上的個人信息,并將其遮蔽以實現(xiàn)匿名化,從而阻斷其與描述性構(gòu)件的關(guān)聯(lián),或者阻止不同的描述性構(gòu)件之間混合交叉形成新的指稱性構(gòu)件。大數(shù)據(jù)時代下,數(shù)據(jù)最重要的價值核心便是兩類構(gòu)件之間的關(guān)聯(lián),即將描述性構(gòu)件所蘊含的各種屬性和關(guān)系與特定個人對應(yīng)起來,獲得特定自然人的電子檔案,如此,政府才能更高效地實現(xiàn)公共治理,企業(yè)才能更好地發(fā)展電子商務(wù)和數(shù)字經(jīng)濟。畢竟,個人數(shù)據(jù)要么是高價值的,要么是兩要件熔斷后匿名的,但絕不可能兩者兼得。
概念是思維之網(wǎng)的紐結(jié),內(nèi)涵清晰的概念有助于確認和鞏固我們對世界的認識成果。理清個人信息內(nèi)涵的二元架構(gòu),對明確個人信息認定的客觀依據(jù)、明晰個人信息概念家族圖式的內(nèi)在理路、明朗個人信息內(nèi)部區(qū)分的風(fēng)險考量以及嘗試區(qū)分個人信息與個人數(shù)據(jù)等具有不可或缺的實踐價值。
法律并非是一種固定和永久的可以超越時空局限的實體,而是一種能動的人類文明現(xiàn)象,因此并不存在一種可以放之四海而皆準的普世性的法律制度和法律規(guī)則,但是在某個時間段內(nèi),法律規(guī)范必須具有穩(wěn)定性,否則將會陷入虛無主義[32]。由此,在特定時空之文明條件下,我們不能放棄對作為法律規(guī)范和法律制度建筑材料的法律概念的客觀性追尋。為了更正部分學(xué)者認為個人信息界定具有動態(tài)性、相對性和場景性的觀點[33],避免個人信息的認定上演一場無限循環(huán)的“貓捉老鼠”游戲,筆者認為應(yīng)摒棄標(biāo)識信息中心主義的理念,從本體論信息說出發(fā),依托指稱性構(gòu)件和描述性構(gòu)件的二元架構(gòu),用兩者之間的熔斷與關(guān)聯(lián)狀態(tài)來構(gòu)造個人信息定義的底層邏輯,即個人信息在本質(zhì)上是標(biāo)識信息與痕跡信息發(fā)生關(guān)聯(lián)時的一種信息形態(tài)。要運行這種底層邏輯,依托現(xiàn)有的規(guī)范表述便可實現(xiàn),并不需要另起爐灶重構(gòu)個人信息的概念定義。通過前文的梳理,我們可以發(fā)現(xiàn)“關(guān)聯(lián)關(guān)系式”定義模式可以很好地容納個人信息的新概念蘊涵,即只要該自然人被識別出來或可能被識別出來,有關(guān)該自然人的任何信息就可歸為個人信息。與“識別效用式”定義模式由信息到個人不同,“關(guān)聯(lián)關(guān)系式”定義模式采取的是從個人到信息的識別路徑,后者將識別的重心放在“知曉”特定個人之上,故能否被納入個人信息范疇的焦點就落在了能否“識別”特定主體之上(已經(jīng)超越了對具體身份的識別),而是否能識別特定主體就可轉(zhuǎn)換為標(biāo)識信息與痕跡信息是否能發(fā)生匹配這一關(guān)聯(lián)關(guān)系上。
通過上述邏輯遞歸,個人信息的認定,抑或識別標(biāo)準的確定就化約為對指稱性構(gòu)件與描述性構(gòu)件的關(guān)聯(lián)判斷上,而這種關(guān)聯(lián)判斷可以盡量避免法律上的價值評判,即采用絕對標(biāo)準的任意主體視角,如歐盟的“所有合理可能的方法”,具體為GDPR 鑒于條款26 條所稱的“應(yīng)考慮所有客觀因素,如識別所需的成本和時間,并考慮處理時的現(xiàn)有技術(shù)和技術(shù)發(fā)展”。這種看似頗受爭議的絕對標(biāo)準⑦恰恰可以將個人信息的認定轉(zhuǎn)化為對既有技術(shù)的考察,即確認兩構(gòu)件之間是否存在鏈接錨點(關(guān)系接觸點),以及抓取該錨點所承擔(dān)的代價,從而在個人信息的認定上掙脫相對主義的泥淖,實現(xiàn)當(dāng)前技術(shù)水平下語言游戲規(guī)則的“局部決定論”⑧。申言之,作為一個普遍概念,個人信息外延所包含的分子必然是多數(shù)的,雖然不能窮舉,但在特定時空的技術(shù)條件和可量化的技術(shù)成本下是能夠把握的,有一個明確的范圍邊界。
為了說明不同語言游戲之間有無共同本質(zhì),維特根斯坦引入了“家族相似”的概念?!跋嗨菩浴迸c“親緣關(guān)系”是家族相似概念之間的關(guān)聯(lián)特征,一組相互關(guān)聯(lián)的家族相似概念構(gòu)成一個概念圖式[34]。匿名信息和假名信息與個人信息共同繪制了語言組織體中的一個圖案,而采用個人信息的二元架構(gòu)分析視角,可以很好地闡釋這些家族相似概念的內(nèi)在理路。
1. 匿名信息
匿名化本身是指一種隱私增強技術(shù),要求具有不可逆轉(zhuǎn)性。GDPR 鑒于條款第26 條指出匿名數(shù)據(jù)指“與已識別的或可識別的自然人無關(guān)的信息,或以使數(shù)據(jù)主體不可識別或不再可識別的方式進行匿名化的個人數(shù)據(jù)”,美國和中國的法律中也有相關(guān)表述⑨。如果采用包含指稱性構(gòu)件和描述性構(gòu)件的二元架構(gòu)分析視角,就可以清晰地辨識出匿名信息的內(nèi)在理路,即匿名信息是個人信息兩類構(gòu)件發(fā)生熔斷狀態(tài)下的信息類型。通過數(shù)據(jù)隨機化和數(shù)據(jù)概括化的技術(shù)處理⑩,指稱性構(gòu)件和描述性構(gòu)件之間不能或很難產(chǎn)生對應(yīng)關(guān)系;而描述性構(gòu)件之間,不管多種類型的痕跡信息如何匯合交叉,均不能或很難對痕跡信息的“信源”進行回溯從而與個人產(chǎn)生關(guān)聯(lián)。如此,只知道標(biāo)識信息而不知曉與之關(guān)聯(lián)的痕跡信息,或單知曉痕跡信息而不知曉與之對應(yīng)的標(biāo)識信息,個人信息就實現(xiàn)了匿名狀態(tài)。
2. 假名信息(去標(biāo)識化信息)
歐盟數(shù)據(jù)保護法規(guī)中出現(xiàn)了“假名”(Pseudonymization)的稱謂,但并未給出假名信息的概念。德國《聯(lián)邦數(shù)據(jù)保護法》第3.6(a)中規(guī)定:假名指用其他標(biāo)志替代姓名或者識別符號,以便無法確認數(shù)據(jù)當(dāng)事人或者實質(zhì)性增加確認數(shù)據(jù)當(dāng)事人的困難?。假名化不同于匿名化,其只是運用輕度去標(biāo)識化的技術(shù)手段,對信息主體身份進行偽裝,如使用加密、哈希函數(shù)等方式為特定自然人創(chuàng)建一個新的形式符號以替代原先的標(biāo)識符,以弱化指稱性構(gòu)件與描述性構(gòu)件的關(guān)聯(lián)度或增加其關(guān)聯(lián)成本,降低所涉信息主體的風(fēng)險。當(dāng)假名信息在不利用額外信息無法指向特定信息主體,且該額外信息被分別存儲,并附加了相應(yīng)的技術(shù)和組織措施的情況下,便實現(xiàn)了個人信息兩大構(gòu)件之間的熔斷,成為匿名信息。然而,這種熔斷比較脆弱,往往可以被復(fù)原,故除了達到匿名程度的部分類型,大部分假名化是一種較為初級的安全措施,此類假名信息仍然受到數(shù)據(jù)保護原則的約束?。我國《個人信息保護法》第七十三條提出的“去標(biāo)識化”與GDPR 的“假名化”是相同概念。
采用個人信息概念的二元架構(gòu)分析框架,可恰當(dāng)?shù)卦忈屪罡呷嗣穹ㄔ喊l(fā)布的第35 批指導(dǎo)性案例195 號《羅某、瞿某侵犯公民個人信息刑事附帶民事公益訴訟案》的裁判要點。該案例裁判認為服務(wù)提供者專門發(fā)給特定手機號碼的數(shù)字、字母等單獨或者其組合構(gòu)成的驗證碼具有獨特性、隱秘性,能夠單獨或者與其他信息結(jié)合識別特定自然人身份或者反映特定自然人活動情況的,屬于刑法規(guī)定的公民個人信息?。手機驗證碼可視為個人信息的描述性構(gòu)件,其只有與對應(yīng)的手機號碼即指稱性構(gòu)件相關(guān)聯(lián)時才構(gòu)成個人信息,若兩者通過其他信息可輕易實現(xiàn)關(guān)聯(lián),驗證碼歸為假名(去標(biāo)識化)信息,若兩者發(fā)生了當(dāng)前技術(shù)條件下難以關(guān)聯(lián)的熔斷,則驗證碼歸為匿名信息。
從概念關(guān)系來看,匿名信息與個人信息是全異關(guān)系,而敏感信息或私密信息等特殊信息類型則是個人信息的內(nèi)部劃分,與后者是從屬關(guān)系,易言之,特殊信息類型的指稱性構(gòu)件和描述性構(gòu)件處于對應(yīng)和關(guān)聯(lián)狀態(tài)。之所以將敏感信息或私密信息歸入個人信息定義的特殊類型,其原因正如有的學(xué)者指出的那樣,不管是“特殊”還是“敏感”,都并非單純個體的心理特征,而是指法律規(guī)制基于風(fēng)險意識的高反應(yīng)度,將某些信息類型從一般中區(qū)分出來予以特殊對待,是基于其客觀的法律基準—權(quán)益侵害風(fēng)險基準,即該類特殊信息更容易引起違法處理主體的關(guān)注,其泄露和濫用對信息主體將造成更為嚴重的權(quán)益侵害[35]。
通過二元概念架構(gòu)來進行穿透式解析,我們可以發(fā)現(xiàn)個人信息特殊類型的風(fēng)險系數(shù)與其內(nèi)涵構(gòu)件特性密切相關(guān):首先,特殊個人信息的指稱性構(gòu)件具有更強的標(biāo)識能力,如在公共管理關(guān)系中的公民身份信息(姓名、身份證號碼、護照號碼等)和生物識別信息(指紋、聲紋、虹膜、基因序列等),前者的強“顯名”效力來源于信息主體對政府社會管理的權(quán)利讓渡,后者的強“顯名”效力來源于自然人生物特征的唯一與極難更改;其次,特殊個人信息的描述性構(gòu)件具有更強的描述能力,如自然人的某項面部特征、醫(yī)療健康記錄、金融交易記錄、通訊錄、行為蹤跡等,這類痕跡信息要么強烈顯現(xiàn)其本體特征,要么清晰描繪其社會關(guān)系,對信息主體的自然屬性和社會屬性進行深度掃描,直接決定著個人在數(shù)字社會的“透明度”。總之,權(quán)益侵害風(fēng)險考量既與個人信息本身的性質(zhì)有關(guān),譬如人臉信息、基因信息等,又和信息流動的場景相連。場景包含應(yīng)用性場景和社會性場景[36],前者依托于信息主體和信息處理者的自由意志,后者強調(diào)兼顧既有法律的規(guī)定和社會共同認可的價值觀念等。至于私密信息與敏感信息這兩個具有交叉關(guān)系的概念的異同,是個雜糅主客觀因素、富含價值色彩的論題,目前國內(nèi)已有部分學(xué)者進行了有益探索?。
另外,目前學(xué)界對個人信息與個人數(shù)據(jù)的區(qū)分問題存在爭議,有“等同說”“混同說”和“區(qū)別說”:“等同說”認為兩者并無區(qū)別;“混同說”在實踐運用中將兩者無意識地混為一談;“區(qū)別說”認為兩者存在差別,但有關(guān)聯(lián),其認為前者是一種知識,后者是一種載體,前者是“神”,后者是其“形”,且分別具有不同的權(quán)利類型[37]。也有學(xué)者認為個人信息是個人數(shù)據(jù)經(jīng)處理后的結(jié)果,乃至認為個人信息權(quán)是財產(chǎn)權(quán),個人數(shù)據(jù)權(quán)是人格權(quán)等[38]。筆者認為本著實用主義精神,遵循平衡個人信息保護與流通的原則,依托個人信息內(nèi)涵的二元分析架構(gòu),可以嘗試區(qū)分個人信息與個人數(shù)據(jù),將個人信息中與指稱性構(gòu)件發(fā)生熔斷或經(jīng)過適度隔離的描述性構(gòu)件歸為個人數(shù)據(jù),以數(shù)據(jù)的“可用而不可見”來探索個人數(shù)據(jù)的財產(chǎn)化路徑,從而促進個人信息的流通和共享。
蓬勃發(fā)展的數(shù)據(jù)法學(xué)奠基于內(nèi)涵明確的法律概念,這些概念是數(shù)據(jù)法律規(guī)范和法律制度的建筑材料。在必須加強個人信息法律保護已成共識的當(dāng)下,理論界對個人信息權(quán)利/權(quán)益核心范疇的個人信息概念本身的研究也須給予應(yīng)有的重視。然而,無論從技術(shù)因素入手,還是從規(guī)范視角著眼,個人信息的定義都面臨著準確界定的諸多困境,使得其成為一種“不確定的法律概念”。目前雖然在個人信息概念的稱謂上呈現(xiàn)出一種趨同態(tài)勢,但是通過解構(gòu)分析可發(fā)現(xiàn),這些個人信息定義在形式結(jié)構(gòu)、要素結(jié)構(gòu)和風(fēng)險結(jié)構(gòu)等層面存在諸多差異。要走出當(dāng)前個人信息定義的困境,需要對基于標(biāo)識信息與痕跡信息二元隔離且以標(biāo)識信息為重心的既有進路進行檢視,從而提出一種更契合個人信息本質(zhì)的包含指稱性構(gòu)件與描述性構(gòu)件的二元內(nèi)涵架構(gòu),并解析其運行邏輯。厘清個人信息內(nèi)涵的二元架構(gòu),對明確個人信息認定的客觀依據(jù)、明晰個人信息概念家族圖式的內(nèi)在理路、明朗個人信息內(nèi)部區(qū)分的風(fēng)險考量以及嘗試區(qū)分個人信息與個人數(shù)據(jù)等具有強烈的理論與實踐意義。當(dāng)然,人們對事物本質(zhì)屬性的認識是一個漸進過程,本文的一些觀點還需要經(jīng)進一步的理論萃取和實踐檢驗,但是筆者堅持的一個理念是明確的,即“保護”是個人信息處理的第一原則,在充分尊重和保障信息主體運用自身理性的自由意志下,才能更好地推動個人信息的流動和共享,使數(shù)字化真正實現(xiàn)“技術(shù)歸化”[39],切實做到造福人類。
注釋:
① 例如從歐盟沿用德國1977 年制定的《聯(lián)邦個人數(shù)據(jù)保護法》中關(guān)聯(lián)關(guān)系類型的個人信息定義伊始,一直到2016 年的GDPR,條文的抽象概括部分近五十年沒有發(fā)生變化,由此該定義類型愈加受到各國青睞。中國經(jīng)過《網(wǎng)絡(luò)安全法》《中華人民共和國民法通則》《民法典》等多部規(guī)范迭代,最終在《個人信息保護法》中采用了關(guān)聯(lián)關(guān)系模式的概念定義。
② 歐盟GDPR 第二章前三條(第5、6、7 條)規(guī)定了與個人數(shù)據(jù)處理有關(guān)的原則、處理的合法性和同意的條件后,后四條(第8、9、10、11 條)分別涉及了兒童數(shù)據(jù)、特殊類別個人數(shù)據(jù)、有關(guān)刑事定罪與犯罪和無需識別數(shù)據(jù)的處理原則。參見李世剛, 包丁裕睿, 王崢. GDPR:歐盟一般數(shù)據(jù)保護條例:文本和實用工具[M]. 北京:人民日報出版社, 2018:142 - 152。
③ 參見美國《數(shù)據(jù)隱私和保護法》(草案2022)SEC.2(8)、(22)。
④ 中國《民法典》(2020)將個人信息區(qū)分為一般信息和私密信息;中國《個人信息保護法》(2021)則區(qū)分出一般信息和敏感信息。
⑤ 中國《網(wǎng)絡(luò)安全法》第76 條認定個人信息是單一的身份識別;《電信和互聯(lián)網(wǎng)用戶個人信息保護規(guī)定》第4 條將識別對象擴展為“用戶信息以及用戶使用服務(wù)的時間、地點等信息”;《最高人民法院、最高人民檢察院關(guān)于辦理侵犯公民個人信息刑事案件適用法律若干問題的解釋》第1 條將識別范圍進一步擴展為“身份”和“活動情況”(行蹤軌跡等)。
⑥ 需要注意的是,姓名、身份證號碼等公民身份標(biāo)識信息具有一定門檻的不可更改性;生物識別信息在通常情況下具有唯一性;面部識別特征兼具指稱性陳述和描述性陳述雙重信息特性;出生日期、網(wǎng)絡(luò)訪問日期、圖片拍攝日期、接受治療日期、死亡日期等日期信息更多具有描述性構(gòu)件的特征,單純的日期信息則歸為指稱性構(gòu)件類型。
⑦ 在歐盟2016 年Breyer 案中,雖然德國法院對判定路徑的選擇產(chǎn)生巨大爭議,但歐洲法院最終支持了絕對標(biāo)準。參見FREDERIK Zuiderveen Borgesius. The Breyer case of the court of justice of the European Union:IP addresses and the personal data definition [J]. European data protection law review, 2017(3):130 - 137。
⑧ 利奧塔的局部決定論認為,有關(guān)游戲規(guī)則的任何共識以及在游戲中可以走出的任何“走法”,都必須是局部的,都只是在一定的時間與空間范圍內(nèi)有效的,或者說,都必須是當(dāng)時的游戲者所同意并且是可以最終取消的。參見陳嘉明, 吳開明, 李智, 等. 現(xiàn)代性與后現(xiàn)代性[M]. 北京:人民出版社, 2001:374。
⑨ 美國法律中與匿名數(shù)據(jù)相對應(yīng)的表達是“去身份”或“去標(biāo)識”,意味著所有可能與特定個人的身份相關(guān)聯(lián)的信息已被從相關(guān)的報告、數(shù)據(jù)或其他信息中移除。例如美國政府2010 年發(fā)布的《個人信息保護指引》中,去身份指“通過移除足夠的個人可識別信息以至于剩余的信息不能識別特定個人,以及沒有合理的理由相信這些信息能被用于識別特定個人”。參見韓旭至. 大數(shù)據(jù)時代下匿名信息的法律規(guī)制[J]. 大連理工大學(xué)學(xué)報(社會科學(xué)版), 2018(4):64-75。我國法律條文中目前沒有明確的匿名信息概念,只是或間接予以提及,或以“匿名化”進行說明。如我國《網(wǎng)絡(luò)安全法》第四十二條規(guī)定“網(wǎng)絡(luò)運營者不得泄露、篡改、毀損其收集的個人信息;未經(jīng)被收集者同意,不得向他人提供個人信息。但是,經(jīng)過處理無法識別特定個人且不能復(fù)原的除外”;《個人信息保護法》第七十三條規(guī)定了匿名化,即個人信息經(jīng)過處理無法識別特定自然人且不能復(fù)原的過程。
⑩ 前者包括“噪音添加”“屬性交換”和“差分隱私”,后者包括“數(shù)據(jù)聚合”“K-匿名”和“L-多樣性”(L-diversity),參見張濤. 歐盟個人數(shù)據(jù)匿名化治理:法律、技術(shù)與風(fēng)險[J]. 圖書館論壇, 2019(12):90 - 101。
? 歐盟GDPR 第4 條(5)規(guī)定:“‘假名化’是一種使得個人數(shù)據(jù)在不參照其他數(shù)據(jù)的情況下無法指向特定數(shù)據(jù)主體的個人數(shù)據(jù)處理方式。該處理方式將個人數(shù)據(jù)與其他數(shù)據(jù)分別存儲,并會采取相應(yīng)的技術(shù)和組織措施而使得個人數(shù)據(jù)無法指向一個已識別的或可識別的自然人?!?/p>
? GDPR 鑒于條款(26)認為:“經(jīng)假名化處理的個人數(shù)據(jù),若通過使用額外信息即可指向某一自然人的,應(yīng)被視為可被識別的自然人的信息。”
? 參見(法〔2022〕265 號)《最高人民法院關(guān)于發(fā)布第35 批指導(dǎo)性案例的通知》。
? 具體參見王利明. 敏感個人信息保護的基本問題—以《民法典》和《個人信息保護法》的解釋為背景[J]. 當(dāng)代法學(xué), 2022(1):3 - 14;申衛(wèi)星.數(shù)字權(quán)利體系再造:邁向隱私、信息與數(shù)據(jù)的差序格局[J]. 政法論壇, 2022(3):89 - 102;程嘯. 論個人信息保護法中的個人信息處理規(guī)則[J].清華法學(xué), 2021(3):55 - 73。