張 威
(北京師范大學(xué) 刑事法律科學(xué)研究院,北京 100875)
大數(shù)據(jù)時(shí)代的到來(lái),影響著社會(huì)生活的方方面面,犯罪防控領(lǐng)域也不例外。犯罪防控作為社會(huì)治理以及公共安全體系的重要組成部分,也越來(lái)越重視對(duì)大數(shù)據(jù)技術(shù)的應(yīng)用。西方許多國(guó)家已經(jīng)率先將大數(shù)據(jù)應(yīng)用于反恐、國(guó)家安全、犯罪預(yù)測(cè)、犯罪偵查等領(lǐng)域,并收到了積極的效果。我國(guó)在2015年9月召開(kāi)的全國(guó)社會(huì)治安防控體系建設(shè)工作會(huì)議上,首次明確提出要充分依托大數(shù)據(jù)、云計(jì)算中心,善于從多源的、分散的、碎片化的大數(shù)據(jù)中找到規(guī)律,為維護(hù)公共安全提供創(chuàng)造性服務(wù)[1]。同時(shí),各級(jí)公安機(jī)關(guān)也在不斷嘗試?yán)么髷?shù)據(jù)技術(shù),建立大數(shù)據(jù)警務(wù)平臺(tái)用于犯罪防控,并且已經(jīng)取得了一定的成效。但科技永遠(yuǎn)都是一把雙刃劍。在大多數(shù)人都對(duì)技術(shù)充滿了崇拜和迷戀的背景下,如何正確理解并理性對(duì)待大數(shù)據(jù),如何能在應(yīng)用大數(shù)據(jù)進(jìn)行犯罪防控的同時(shí)科學(xué)應(yīng)對(duì)大數(shù)據(jù)帶來(lái)的困境,未雨綢繆地合理規(guī)避大數(shù)據(jù)帶來(lái)的風(fēng)險(xiǎn),是非常值得研究的一個(gè)重要課題。
關(guān)于大數(shù)據(jù),目前還沒(méi)有較為統(tǒng)一的定義,但是普遍認(rèn)為大數(shù)據(jù)具有四個(gè)主要特征:第一,數(shù)據(jù)規(guī)模龐大,要遠(yuǎn)遠(yuǎn)大于傳統(tǒng)數(shù)據(jù)的規(guī)模;第二,數(shù)據(jù)流轉(zhuǎn)迅速,不僅數(shù)據(jù)產(chǎn)生得快,而且數(shù)據(jù)處理也快;第三,數(shù)據(jù)類(lèi)型具有多樣性,不僅包含傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),還包含了大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);第四,數(shù)據(jù)價(jià)值密度低。大數(shù)據(jù)的價(jià)值密度相對(duì)較低,但是有巨大的潛在價(jià)值。
大數(shù)據(jù)并不單指數(shù)據(jù),本質(zhì)上是數(shù)據(jù)和大數(shù)據(jù)技術(shù)的綜合體。大數(shù)據(jù)技術(shù)包含四個(gè)方面的內(nèi)容,即:大數(shù)據(jù)采集,大數(shù)據(jù)存儲(chǔ)和管理,大數(shù)據(jù)的分析和挖掘,大數(shù)據(jù)應(yīng)用。其中,大數(shù)據(jù)的分析與挖掘是較為關(guān)鍵的一步,目前的數(shù)據(jù)分析和挖掘方法主要有分類(lèi)、估計(jì)、預(yù)測(cè)、關(guān)聯(lián)分析、聚類(lèi)、描述和可視化等,每種分析方法又可以通過(guò)多種不同的算法來(lái)實(shí)現(xiàn)。
1.重全樣而非抽樣
大數(shù)據(jù)時(shí)代,處理的數(shù)據(jù)從樣本數(shù)據(jù)變成全部數(shù)據(jù)。以前,因?yàn)槿藗儫o(wú)法獲得大量的總體數(shù)據(jù),所以只能采用抽樣的方法獲取數(shù)據(jù)。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的收集、存儲(chǔ)和分析技術(shù)都有了很大進(jìn)步,人們對(duì)全部數(shù)據(jù)的收集與分析變?yōu)榭赡?。通過(guò)對(duì)全數(shù)據(jù)的分析,能夠更準(zhǔn)確、更深刻地發(fā)現(xiàn)之前的小樣本研究無(wú)法得出的信息,進(jìn)而使我們對(duì)事物整體的認(rèn)識(shí)更加全面、系統(tǒng)。
2.重效率而非精確
大數(shù)據(jù)時(shí)代,大部分?jǐn)?shù)據(jù)都是非標(biāo)準(zhǔn)化的數(shù)據(jù),混雜性強(qiáng),同時(shí)由于對(duì)效率的追求,人們的思維方式從小數(shù)據(jù)時(shí)代的精確思維轉(zhuǎn)向容錯(cuò)思維,對(duì)精確度的癡迷將減弱[2]。也就是說(shuō),當(dāng)擁有海量且多樣化的數(shù)據(jù)時(shí),絕對(duì)精準(zhǔn)就不再是追求的主要目標(biāo),而是可以容許一定程度的錯(cuò)誤與混雜。而且,大數(shù)據(jù)時(shí)代更多關(guān)注的是效率、相關(guān)性及概率性。因此,在大數(shù)據(jù)時(shí)代,可以適當(dāng)忽略微觀層面上的精確度,追求宏觀層面上更為深刻的洞察。
3.重相關(guān)而非因果
大數(shù)據(jù)時(shí)代,人們不再像傳統(tǒng)的因果思維時(shí)代那樣注重挖掘事物或現(xiàn)象背后的因果關(guān)系,而是試圖通過(guò)大數(shù)據(jù)發(fā)現(xiàn)事物之間隱蔽的、普遍的相關(guān)關(guān)系,然后通過(guò)這種相關(guān)關(guān)系來(lái)進(jìn)行預(yù)測(cè)。這不僅是大數(shù)據(jù)一個(gè)最為突出的特點(diǎn),這種建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)也正是大數(shù)據(jù)的核心。與因果思維相比,相關(guān)思維更關(guān)注的是事物或現(xiàn)象間的關(guān)聯(lián)或聯(lián)系,而不必非得深究背后的深層次原因。舍恩伯格指出,知道“是什么”就夠了,沒(méi)必要知道“為什么”。大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己“發(fā)聲”。
4.重?cái)?shù)據(jù)主導(dǎo)
大數(shù)據(jù)時(shí)代,數(shù)據(jù)成為核心和主導(dǎo),海量數(shù)據(jù)的潛在價(jià)值不斷增大,讓數(shù)據(jù)發(fā)聲成為常態(tài),也就是主要靠對(duì)數(shù)據(jù)的分析發(fā)現(xiàn)其中的巨大價(jià)值。對(duì)于一個(gè)企業(yè)或者一個(gè)部門(mén)來(lái)說(shuō),擁有了數(shù)據(jù)就擁有了更大的主動(dòng)權(quán)和更多的資源,可以通過(guò)大數(shù)據(jù)分析發(fā)現(xiàn)關(guān)聯(lián)因素,并據(jù)此做出預(yù)測(cè)。在這種趨勢(shì)下,通過(guò)大數(shù)據(jù)來(lái)進(jìn)行決策將會(huì)成為常態(tài),人們會(huì)越來(lái)越依賴大數(shù)據(jù)。
隨著大數(shù)據(jù)的發(fā)展,大數(shù)據(jù)技術(shù)已經(jīng)逐漸被應(yīng)用于犯罪防控領(lǐng)域,對(duì)犯罪防控的理念和模式產(chǎn)生了深刻的影響。
犯罪偵查離不開(kāi)對(duì)各種信息和數(shù)據(jù)的收集與分析。大數(shù)據(jù)時(shí)代的到來(lái),對(duì)犯罪偵查的理念、策略以及工作模式都產(chǎn)生了極大的影響,使之發(fā)生了深刻的變革。
1.犯罪偵查理念的變革
(1)數(shù)據(jù)主導(dǎo)型偵查
大數(shù)據(jù)時(shí)代,偵查理念上最大的變化就是形成了以數(shù)據(jù)為主導(dǎo)的偵查理念。由大數(shù)據(jù)驅(qū)動(dòng)的偵查理念,以大數(shù)據(jù)庫(kù)作為偵查的基礎(chǔ)資源平臺(tái),讓數(shù)據(jù)處于核心地位,支配偵查工作的全過(guò)程[3]。傳統(tǒng)的偵查,主要是通過(guò)對(duì)犯罪嫌疑人的訊問(wèn)來(lái)獲取口供,然后通過(guò)口供來(lái)尋找犯罪證據(jù),并最終查清犯罪事實(shí),偵破案件。在大數(shù)據(jù)模式下,可以依靠大數(shù)據(jù)掌握大量的犯罪證據(jù)和信息,只需要在訊問(wèn)階段進(jìn)行核實(shí)就可以。也就是說(shuō),大數(shù)據(jù)技術(shù)的應(yīng)用將打破傳統(tǒng)的“重口供,輕證據(jù)”的證據(jù)收集規(guī)則,從而形成以客觀證據(jù)為主,犯罪嫌疑人口供為輔的證據(jù)規(guī)則[4]。
(2)主動(dòng)型偵查
大數(shù)據(jù)背景下,犯罪偵查的模式由反應(yīng)型偵查模式向主動(dòng)型偵查模式過(guò)渡。按照偵查模式采取的措施和行動(dòng)是否具有超前意識(shí)的標(biāo)準(zhǔn),偵查模式可以分為反應(yīng)型偵查模式和主動(dòng)型偵查模式[5]。反應(yīng)型偵查是一種“由案到人”的偵查,即是在犯罪行為發(fā)生后,根據(jù)案情來(lái)確定犯罪嫌疑人,這是傳統(tǒng)偵查方式的主要特征。大數(shù)據(jù)技術(shù)的出現(xiàn),使偵查人員能夠獲得足夠的情報(bào)和關(guān)聯(lián)信息,從而能夠更為主動(dòng)地追蹤犯罪嫌疑人,實(shí)現(xiàn)快速破案,這就發(fā)生了“由案到人”到“由人到案”的偵查理念的轉(zhuǎn)變。
(3)預(yù)測(cè)型偵查
如上所述,傳統(tǒng)的偵查模式實(shí)質(zhì)上是一種回溯型偵查。偵查人員根據(jù)案件情況進(jìn)行調(diào)查,通過(guò)不斷的偵查來(lái)重建過(guò)去。而大數(shù)據(jù)時(shí)代的預(yù)測(cè)型偵查能夠?qū)⒔槿氲臅r(shí)間提前,可以與犯罪行為發(fā)生的時(shí)間同步,甚至還可以再提前進(jìn)行。借助大數(shù)據(jù)既可以預(yù)測(cè)某一區(qū)域乃至全國(guó)的某類(lèi)犯罪的趨勢(shì),還可以預(yù)測(cè)某一個(gè)體的犯罪概率。根據(jù)預(yù)測(cè),我們可以提前制訂應(yīng)急預(yù)案,優(yōu)化警力配置,及時(shí)采取行動(dòng)。這樣,對(duì)于犯罪偵查來(lái)說(shuō),過(guò)去的“犯罪發(fā)生—再反應(yīng)”模式或?qū)⒏淖優(yōu)椤邦A(yù)測(cè)—行動(dòng)”模式[6]。因此,在大數(shù)據(jù)時(shí)代,預(yù)測(cè)型偵查將成為常態(tài)。
2.大數(shù)據(jù)在犯罪偵查中的應(yīng)用
大數(shù)據(jù)在犯罪偵查中的應(yīng)用大致可以分為兩個(gè)方面。首先,大數(shù)據(jù)可以實(shí)現(xiàn)多種數(shù)據(jù)的快速查詢及比對(duì),如可以進(jìn)行文字、圖像、指紋、人臉識(shí)別等多種數(shù)據(jù)的搜尋比對(duì)。任何時(shí)間,都可以根據(jù)偵查需要,在辦公室、車(chē)上或任何一個(gè)有行動(dòng)裝置的地點(diǎn)進(jìn)行查詢。其次,大數(shù)據(jù)可以分析犯罪模式,幫助辦案人員快速破案。一方面可以運(yùn)用數(shù)據(jù)分析、探勘、分群、分類(lèi)、建立關(guān)聯(lián)、特征識(shí)別等技術(shù)來(lái)分析罪犯的行為模式,并可將匯整的數(shù)據(jù)顯示至地圖或制作各種表格,協(xié)助警察偵查犯罪[7];另一方面,可以對(duì)犯罪人進(jìn)行犯罪畫(huà)像、預(yù)測(cè)嫌疑人逃亡去向、將案件進(jìn)行關(guān)聯(lián)對(duì)比,有助于解決懸案和連環(huán)犯罪案件[8]。
1.大數(shù)據(jù)對(duì)犯罪預(yù)測(cè)的影響
大數(shù)據(jù)的核心在于預(yù)測(cè),大數(shù)據(jù)的發(fā)展提升了犯罪預(yù)測(cè)的可能性和精確性?;诖髷?shù)據(jù)的犯罪預(yù)測(cè),能夠幫助公安機(jī)關(guān)高效地利用已知的犯罪數(shù)據(jù),對(duì)未來(lái)可能發(fā)生的犯罪行為進(jìn)行預(yù)測(cè),并以此預(yù)測(cè)結(jié)果進(jìn)行行動(dòng)部署,使有限的警力和資源發(fā)揮最大的功效。
基于大數(shù)據(jù)的預(yù)測(cè)體系標(biāo)志著個(gè)體化的分析轉(zhuǎn)變?yōu)榛谑录姆治?。在個(gè)體化分析情況下,監(jiān)控?cái)?shù)據(jù)被用來(lái)為已經(jīng)存在嫌疑的人提供證據(jù)?;谑录姆治鰝?cè)重于通過(guò)將數(shù)據(jù)與負(fù)面事件的關(guān)聯(lián)來(lái)識(shí)別犯罪模式,然后尋求將這種相關(guān)性反過(guò)來(lái)用于進(jìn)行個(gè)體或群體預(yù)測(cè)。在這樣的系統(tǒng)中,就有可能將Facebook上某篇帖子的某些言語(yǔ)與可能的校園槍擊聯(lián)系起來(lái),允許警察審查或逮捕一些符合危險(xiǎn)模式的人[9]。
2.大數(shù)據(jù)在犯罪預(yù)測(cè)中的應(yīng)用
大數(shù)據(jù)在犯罪預(yù)測(cè)中的應(yīng)用主要包括以下三個(gè)方面。第一,可以進(jìn)行犯罪高發(fā)區(qū)域的預(yù)測(cè)。在大數(shù)據(jù)時(shí)代,可以通過(guò)對(duì)以往犯罪數(shù)據(jù)的挖掘和分析,以可視化的方式生成犯罪熱點(diǎn)圖,進(jìn)而就可以直觀地看到各個(gè)地區(qū)的犯罪率情況、熱點(diǎn)犯罪類(lèi)型以及犯罪的季節(jié)性或短期趨勢(shì)。通過(guò)這些熱點(diǎn)圖,公安機(jī)關(guān)可以合理部署巡邏力量或相應(yīng)的預(yù)防措施,有效地避免或減少犯罪案件發(fā)生。第二,可以識(shí)別犯罪模式,預(yù)測(cè)個(gè)體或群體犯罪?;诖髷?shù)據(jù)技術(shù),可以找出某些個(gè)體特征與具體犯罪類(lèi)型或犯罪特征之間的關(guān)聯(lián),從而確定某些高風(fēng)險(xiǎn)個(gè)體或群體,然后就可以針對(duì)這些個(gè)人和群體,進(jìn)行排查、監(jiān)控和適當(dāng)?shù)母深A(yù)。第三,可以進(jìn)行科學(xué)的再犯罪預(yù)測(cè)。在大數(shù)據(jù)時(shí)代,可以利用大數(shù)據(jù)分析處理技術(shù)提取罪犯危險(xiǎn)性特征,建立服刑人員危險(xiǎn)性識(shí)別與動(dòng)態(tài)預(yù)測(cè)模型。利用機(jī)器學(xué)習(xí)等技術(shù),根據(jù)后期測(cè)試結(jié)果不斷完善模型,提高預(yù)測(cè)精度,使其成為一個(gè)循環(huán)反饋環(huán)路,從而建立一套服刑人員危險(xiǎn)性識(shí)別與動(dòng)態(tài)預(yù)測(cè)體系。通過(guò)這一體系可以實(shí)現(xiàn)對(duì)服刑人員危險(xiǎn)性的個(gè)性化、精準(zhǔn)化預(yù)警,為大數(shù)據(jù)時(shí)代監(jiān)獄的監(jiān)管安全提供可靠保障[10]。
1.數(shù)據(jù)獲取和所有權(quán)困境
數(shù)據(jù)獲取階段存在的倫理問(wèn)題主要包括兩個(gè)方面。第一是數(shù)據(jù)的獲得是否合規(guī),是否是在個(gè)人知情并同意的情況下進(jìn)行的。大數(shù)據(jù)環(huán)境下,有些數(shù)據(jù)的獲得是經(jīng)過(guò)用戶同意和許可的,但是有些數(shù)據(jù)并未得到授權(quán)和許可。在目前開(kāi)放性的互聯(lián)網(wǎng)環(huán)境下,授權(quán)行為實(shí)際執(zhí)行比例太低[11]。這就導(dǎo)致很多人在并未授權(quán)和不知情的情況下就被收集了個(gè)人信息數(shù)據(jù)。而用作犯罪防控的大數(shù)據(jù)的收集,很多時(shí)候更是完全忽視了個(gè)人的知情權(quán)。
第二,數(shù)據(jù)所有權(quán)問(wèn)題。數(shù)據(jù)的所有權(quán)屬于“收集者”還是“創(chuàng)造者”?即便是所有數(shù)據(jù)的獲得都得到了個(gè)人的授權(quán)和許可,這些數(shù)據(jù)的所有權(quán)仍然是存在爭(zhēng)議的。從某種意義上來(lái)說(shuō),個(gè)人的信息數(shù)據(jù)就相當(dāng)于個(gè)人的私有財(cái)產(chǎn),尤其在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值越來(lái)越凸顯。在這種情況下,個(gè)人的信息數(shù)據(jù)是否僅僅經(jīng)過(guò)簡(jiǎn)單的授權(quán)就可以被拿去進(jìn)行存儲(chǔ)、分析、處理,甚至用來(lái)共享?即便是將大數(shù)據(jù)用作犯罪防控也是如此,是否僅以社會(huì)穩(wěn)定或國(guó)家利益的名義,就能夠直接收集、使用公民的個(gè)人信息數(shù)據(jù)?
2.個(gè)人隱私權(quán)侵犯困境
個(gè)人隱私權(quán)的侵犯是一個(gè)重要的倫理問(wèn)題。從本質(zhì)上講,大數(shù)據(jù)并不能做到完全匿名化。雖然單個(gè)數(shù)據(jù)或者單一數(shù)據(jù)庫(kù)中的數(shù)據(jù)是匿名的或者經(jīng)過(guò)模糊處理,但是大數(shù)據(jù)處理技術(shù)的一個(gè)基本前提是,眾多獨(dú)立的小數(shù)據(jù)在數(shù)據(jù)庫(kù)中組合在一起,才可以產(chǎn)生一個(gè)足夠充分的個(gè)人畫(huà)像,才足以預(yù)測(cè)他或她的行為。也就是說(shuō)零星的或者部分搜集數(shù)據(jù)的行為,可能是單獨(dú)無(wú)害的、被使用者授權(quán)的,但是這些數(shù)據(jù)結(jié)合在一起,在量上的積累就有可能造成對(duì)隱私權(quán)的侵犯。無(wú)論是用于商業(yè)用途還是用于犯罪防控,通過(guò)大數(shù)據(jù)技術(shù),能夠完全掌握一個(gè)人的各種隱私信息,如通信隱私、社交隱私、身體隱私等。
3.偏見(jiàn)和歧視困境
以數(shù)據(jù)為主導(dǎo)的思維方式和大數(shù)據(jù)的預(yù)測(cè)性特征,會(huì)不可避免地導(dǎo)致對(duì)個(gè)人、群體以及地域的偏見(jiàn)和歧視。大數(shù)據(jù)的核心在于預(yù)測(cè),大數(shù)據(jù)技術(shù)使人們相信可以通過(guò)數(shù)據(jù)的分析和挖掘來(lái)預(yù)測(cè)人的行為,即便是在缺少因果關(guān)系及理論基礎(chǔ)的情況下,也會(huì)依據(jù)分析的結(jié)果來(lái)進(jìn)行主動(dòng)防控。這會(huì)使人們產(chǎn)生先入為主的觀念,從而逐漸產(chǎn)生偏見(jiàn)和歧視。如對(duì)犯罪熱點(diǎn)區(qū)域或高發(fā)區(qū)域的偏見(jiàn),對(duì)那些被大數(shù)據(jù)技術(shù)篩選出來(lái)的符合某些特征的人或群體的歧視。人們?cè)炯南M跈C(jī)器或者自動(dòng)化來(lái)減少乃至消除人類(lèi)的偏見(jiàn),但是大數(shù)據(jù)不僅不會(huì)避免群體歧視,還有可能加重這一趨勢(shì)。
4.“被遺忘權(quán)”之困境
“被遺忘權(quán)”也是大數(shù)據(jù)時(shí)代必須要面對(duì)的一個(gè)難題。所謂“被遺忘權(quán)”就是指?jìng)€(gè)人有權(quán)刪除或禁止別人使用涉及自身的不良或隱私信息。被遺忘權(quán)本身就是在大數(shù)據(jù)背景下產(chǎn)生的。大數(shù)據(jù)時(shí)代,一旦數(shù)據(jù)被收集、存儲(chǔ),將會(huì)長(zhǎng)時(shí)間保存,這些涉及隱私甚至是包含某些個(gè)體不良記錄的數(shù)據(jù)信息能否定期刪除或者被大眾遺忘,是一個(gè)非常重要的問(wèn)題。每個(gè)人都有犯錯(cuò)誤的可能,如果一些之前生活中的非常小的錯(cuò)誤被永久記錄,那么就有可能在以后的某個(gè)時(shí)候?qū)ζ洚a(chǎn)生重要影響,特別是一些較為負(fù)面的、令人尷尬的信息都有可能導(dǎo)致被放大、濫用,最終使當(dāng)事人成為大數(shù)據(jù)的受害者。
1.數(shù)據(jù)質(zhì)量困境
(1)大數(shù)據(jù)仍非全數(shù)據(jù)
大數(shù)據(jù)看似全面,但實(shí)際上往往存在系統(tǒng)偏差,難以做到全數(shù)據(jù)。首先,大數(shù)據(jù)難以涵蓋所有的“黑天鵝事件”①“黑天鵝事件”通常是指難以預(yù)測(cè)的但影響甚大的事件,一旦發(fā)生,便會(huì)引起整個(gè)局面連鎖負(fù)面反應(yīng)甚至顛覆。。影響人的行為或事件產(chǎn)生的因素很多,有些影響因素可以通過(guò)對(duì)歷史數(shù)據(jù)或者其他關(guān)聯(lián)數(shù)據(jù)的分析獲得,但是還存在一些類(lèi)似“黑天鵝事件”的因素難以獲取,這勢(shì)必會(huì)影響數(shù)據(jù)的全面性。其次,數(shù)據(jù)在生成或采集的過(guò)程中并不都是平等的,大數(shù)據(jù)采集存在“信號(hào)問(wèn)題”——即某些個(gè)體和群體會(huì)被忽略或未得到充分代表。最后,當(dāng)前的大數(shù)據(jù)采集缺乏頂層設(shè)計(jì),大多仍處在各自為戰(zhàn)的層次,共享水平較低。
(2)數(shù)據(jù)正確性難以保證
數(shù)據(jù)的正確性是影響大數(shù)據(jù)結(jié)果的最明顯因素。由于數(shù)據(jù)來(lái)源的復(fù)雜和類(lèi)型的多樣,數(shù)據(jù)很容易在細(xì)節(jié)方面出現(xiàn)錯(cuò)誤。例如,可能會(huì)知道一個(gè)人的名字,但是可能會(huì)完全弄錯(cuò)他的年齡、種族或者購(gòu)物習(xí)慣。在搜集的是非結(jié)構(gòu)數(shù)據(jù)的情況下,這種錯(cuò)誤可能更大。將這些數(shù)據(jù)用于犯罪預(yù)測(cè)系統(tǒng)將會(huì)放大數(shù)據(jù)錯(cuò)誤以及有缺陷的解讀帶來(lái)的傷害。
2.預(yù)測(cè)錯(cuò)誤率困境
大數(shù)據(jù)預(yù)測(cè)系統(tǒng)的一個(gè)先天的局限是存在固有錯(cuò)誤率。所有的預(yù)測(cè)系統(tǒng)都會(huì)存在基準(zhǔn)謬誤,在犯罪預(yù)測(cè)中,如果系統(tǒng)出現(xiàn)錯(cuò)誤否定,也稱(chēng)假陰性,就有可能錯(cuò)誤地漏掉一個(gè)有罪個(gè)體;而假陽(yáng)性是指一個(gè)無(wú)辜的個(gè)體被懷疑有罪,會(huì)導(dǎo)致需要去審查大量的正常個(gè)人的檔案,這不僅會(huì)不必要地侵犯人們的隱私和自由權(quán),還會(huì)增加工作量。這一基本的統(tǒng)計(jì)局限表明,即使一個(gè)非常精確的預(yù)測(cè)模型,也有可能造成難以接受的錯(cuò)誤率。在犯罪防控領(lǐng)域,這種局限帶來(lái)的成本是巨大的。例如,如果一個(gè)用來(lái)識(shí)別恐怖陰謀的系統(tǒng)存在0.1%的誤報(bào)率和0.1%的漏報(bào)率,那么在檢查了萬(wàn)億條信息的情況下,系統(tǒng)就會(huì)產(chǎn)生10億的誤報(bào)。
3.存在“預(yù)測(cè)即干涉”悖論
大數(shù)據(jù)分析中還存在“預(yù)測(cè)即干涉”的問(wèn)題?!邦A(yù)測(cè)即干涉”悖論類(lèi)似于量子物理中的“測(cè)不準(zhǔn)原理”②量子物理創(chuàng)始人之一維爾納·海森堡(Werner Heisenberg)曾在1927年的一篇論文中指出,在量子世界中,測(cè)量粒子位置必然會(huì)影響粒子的速度,即存在“測(cè)不準(zhǔn)原理”。。也就是說(shuō),一旦進(jìn)行預(yù)測(cè),就會(huì)對(duì)實(shí)際情況產(chǎn)生干涉。比如,如果因?yàn)楫?dāng)年的大白菜賣(mài)價(jià)不錯(cuò)而預(yù)計(jì)明年的賣(mài)價(jià)也不錯(cuò),于是眾多菜農(nóng)在這個(gè)預(yù)測(cè)的指導(dǎo)下,第二年都去種大白菜,結(jié)果反而是菜多價(jià)賤傷農(nóng)。在犯罪預(yù)測(cè)的情況中也會(huì)出現(xiàn)這種情況,比如,當(dāng)向某些預(yù)測(cè)的犯罪高發(fā)區(qū)增加警力的時(shí)候,雖然確實(shí)有些人會(huì)停止犯罪,但是有些人可能會(huì)選擇其他地點(diǎn)實(shí)施犯罪行為。
4.過(guò)于注重相關(guān)關(guān)系
對(duì)相關(guān)關(guān)系的分析是大數(shù)據(jù)技術(shù)的核心任務(wù)。如前所述,大數(shù)據(jù)技術(shù)的主要分析方法就是利用相關(guān)關(guān)系的分析來(lái)進(jìn)行預(yù)測(cè),而不再去關(guān)注更為深層次的因果關(guān)系。很多時(shí)候,大數(shù)據(jù)追求的是實(shí)驗(yàn)性,也就是很偶然地發(fā)現(xiàn)非預(yù)期但很有價(jià)值的信息,這與統(tǒng)計(jì)分析中對(duì)確定性的追求是不同的。這明顯是存在問(wèn)題的。相關(guān)性普遍存在于很多事物或因素之間,所以即使存在相關(guān)關(guān)系也不能說(shuō)明什么。在大數(shù)據(jù)中,看起來(lái)毫不相關(guān)的兩件事同時(shí)或相繼出現(xiàn)的現(xiàn)象比比皆是,相關(guān)性本身并沒(méi)有多大價(jià)值,關(guān)鍵是找到了“相關(guān)性”背后的理由,才是新知識(shí)或新發(fā)現(xiàn)。
5.存在自我強(qiáng)化和自動(dòng)化偏差
基于大數(shù)據(jù)的犯罪防控會(huì)形成自我強(qiáng)化偏差。人們對(duì)模型的評(píng)估是按照發(fā)現(xiàn)犯罪的成功率來(lái)判斷的,而不是按照降低犯罪或社會(huì)監(jiān)控成本的成功率進(jìn)行判斷的。這就是說(shuō),如果經(jīng)常在系統(tǒng)模型所標(biāo)識(shí)出來(lái)的地區(qū)尋找犯罪,每找到一次就會(huì)更加認(rèn)為系統(tǒng)是有效的。同時(shí)這也會(huì)導(dǎo)致盲區(qū)的存在,就是對(duì)目標(biāo)群體之外的群體缺乏監(jiān)管。實(shí)質(zhì)上,對(duì)目標(biāo)群體的監(jiān)控并不會(huì)降低所針對(duì)犯罪的發(fā)生率,甚至?xí)黾印A硗?,在自我?qiáng)化的基礎(chǔ)上大數(shù)據(jù)還會(huì)產(chǎn)生自動(dòng)化偏差,進(jìn)而會(huì)導(dǎo)致人們對(duì)基于計(jì)算機(jī)的操作特別是機(jī)器的計(jì)算過(guò)于相信,缺少理性思考。在審校機(jī)器的結(jié)果時(shí),常常缺少信心和經(jīng)驗(yàn)去否決機(jī)器的錯(cuò)誤或者對(duì)機(jī)器的結(jié)果做事后批評(píng)。
1.信息安全困境
大數(shù)據(jù)時(shí)代,信息安全問(wèn)題是需要面對(duì)的首要法律問(wèn)題。在大數(shù)據(jù)背景下,數(shù)據(jù)收集、分析、流轉(zhuǎn)等任何環(huán)節(jié)都有可能出現(xiàn)數(shù)據(jù)濫用、泄露等問(wèn)題。而且,從實(shí)際情況來(lái)看,信息安全事件也層出不窮。但是,我國(guó)的互聯(lián)網(wǎng)法制化道路還很遙遠(yuǎn),在大數(shù)據(jù)的背景下,還有很多法律困境需要我們?nèi)フ暫蛻?yīng)對(duì)。而在大數(shù)據(jù)警務(wù)時(shí)代,用于犯罪防控的大數(shù)據(jù)更是需要注重安全性。這是因?yàn)橛糜诜缸锓揽氐拇髷?shù)據(jù),涉及太多個(gè)人的隱私信息數(shù)據(jù),一旦泄露將會(huì)對(duì)個(gè)人造成難以估計(jì)的影響。我國(guó)并沒(méi)有賦予個(gè)人對(duì)自身信息數(shù)據(jù)像財(cái)產(chǎn)權(quán)保護(hù)一樣的權(quán)利,國(guó)家部門(mén)在收集使用數(shù)據(jù)的時(shí)候也并沒(méi)有明確的法規(guī)限制,沒(méi)有建立這些數(shù)據(jù)使用和管理的規(guī)則條例或法律。這就會(huì)造成數(shù)據(jù)的濫用,給個(gè)人的信息安全帶來(lái)極大的威脅。
2.偵查權(quán)的過(guò)度擴(kuò)張困境
大數(shù)據(jù)背景下的犯罪防控,是一種主動(dòng)型、預(yù)測(cè)型的防控,會(huì)導(dǎo)致公權(quán)力特別是偵查權(quán)的過(guò)度擴(kuò)張。基于大數(shù)據(jù)的犯罪防控,首先要通過(guò)大數(shù)據(jù)技術(shù)的分析,確定某些高危個(gè)人或群體,然后有針對(duì)性地進(jìn)行排查和監(jiān)控,甚至是審查逮捕,這極易造成偵查權(quán)的擴(kuò)張。偵查權(quán)的擴(kuò)張不利于尊重和保障人權(quán),不利于公民基本權(quán)利與國(guó)家偵查權(quán)力之間的平衡。人權(quán)保障之得失取決于偵查權(quán)制約之成敗。公民的基本權(quán)利和自由是否能獲得保障,關(guān)鍵取決于偵查權(quán)制約之成敗[12]。如果僅憑大數(shù)據(jù)系統(tǒng)的預(yù)測(cè)就直接實(shí)施審查和抓捕,啟動(dòng)偵查權(quán),是對(duì)數(shù)據(jù)和機(jī)器的盲目信任,同時(shí)也是對(duì)當(dāng)事人人權(quán)的極大傷害。
大數(shù)據(jù)作為一種方興未艾的新技術(shù),必然存在優(yōu)勢(shì)和缺陷。我們既不能盲目相信,讓大數(shù)據(jù)主宰一切,也不能故步自封,盲目排斥。在運(yùn)用大數(shù)據(jù)進(jìn)行犯罪防控的時(shí)候,應(yīng)當(dāng)正確認(rèn)識(shí)到大數(shù)據(jù)技術(shù)存在的問(wèn)題,并加以修正,避免出現(xiàn)自動(dòng)化的偏見(jiàn)。
1.注重將大數(shù)據(jù)與小數(shù)據(jù)相結(jié)合
在進(jìn)行犯罪防控的時(shí)候,要注重將大數(shù)據(jù)與小數(shù)據(jù)研究相結(jié)合,這樣才有利于得出客觀公正的結(jié)論。如上所述,大數(shù)據(jù)具有數(shù)據(jù)量大的優(yōu)點(diǎn),但是卻容易存在數(shù)據(jù)質(zhì)量問(wèn)題,而且其更加注重的是混雜性而不是精確性。而傳統(tǒng)的小數(shù)據(jù)預(yù)測(cè),注重科學(xué)抽樣,保證抽象的隨機(jī)性,在此基礎(chǔ)上得出的結(jié)果更值得信賴。所以,大數(shù)據(jù)在結(jié)果的正確性上并不必然優(yōu)于小數(shù)據(jù)。因此,在當(dāng)前大數(shù)據(jù)并非全數(shù)據(jù),而且多為不均勻的大量數(shù)據(jù)的情況下,將大數(shù)據(jù)分析和小數(shù)據(jù)研究相結(jié)合,不失為一個(gè)最優(yōu)的選擇。也只有以這樣的態(tài)度利用大數(shù)據(jù)進(jìn)行犯罪防控,才是一種負(fù)責(zé)和審慎的態(tài)度。
2.數(shù)據(jù)分析與人工分析相結(jié)合
基于大數(shù)據(jù)的犯罪防控,要注重將數(shù)據(jù)分析與人工分析相結(jié)合。大數(shù)據(jù)終究是一種技術(shù),本質(zhì)上仍然是一種人類(lèi)發(fā)明的工具。人類(lèi)最偉大之處恰恰是算法和硅芯片不能夠揭示的。我們要在正確認(rèn)識(shí)大數(shù)據(jù)弊端的基礎(chǔ)上,合理運(yùn)用大數(shù)據(jù)分析技術(shù),盡可能提升我們對(duì)事物的分析處理能力。但是,我們不可完全受其主導(dǎo),將大數(shù)據(jù)的分析結(jié)果奉為真理。若對(duì)其過(guò)分依賴,自動(dòng)化的偏見(jiàn)就會(huì)超過(guò)人類(lèi)的偏見(jiàn)。因此,在獲取大數(shù)據(jù)分析結(jié)果的基礎(chǔ)上,還要根據(jù)以往的經(jīng)驗(yàn)和理論進(jìn)行一定的人工分析,對(duì)其結(jié)果進(jìn)行甄別、篩選,最終獲得科學(xué)的分析結(jié)果。只有這樣,才能達(dá)到理想的犯罪防控效果。
為了促進(jìn)大數(shù)據(jù)健康發(fā)展,我們必須盡快采取措施,確立正確的倫理觀念和倫理準(zhǔn)則。具體來(lái)說(shuō),就是要盡快確定道德底線和行業(yè)規(guī)范,明確何種行為是正確、何種行為是錯(cuò)誤的道德判斷,構(gòu)建起是與非的判斷準(zhǔn)則。同時(shí),還要注重進(jìn)行大數(shù)據(jù)的道德倫理教育,并使之內(nèi)化為道德標(biāo)準(zhǔn),最終建立基于數(shù)據(jù)倫理道德的新公序良俗。
為此,需要確立以下三個(gè)方面的原則。首先,確立無(wú)害原則。無(wú)害原則是最低的倫理道德標(biāo)準(zhǔn),要求盡可能地避免給他人造成不必要的傷害[13]。不能因?yàn)檫M(jìn)行犯罪防控,就可以肆無(wú)忌憚地傷害公民的權(quán)利和自由。其次,確立保密原則。大數(shù)據(jù)下的犯罪防控,涉及眾多的個(gè)人隱私信息。同時(shí),基于大數(shù)據(jù)的犯罪預(yù)測(cè)和犯罪預(yù)防,又很容易產(chǎn)生偏見(jiàn)和歧視。這就要求對(duì)數(shù)據(jù)的內(nèi)容以及數(shù)據(jù)處理的結(jié)果嚴(yán)格執(zhí)行保密紀(jì)律。最后,確立人本主義原則。在使用大數(shù)據(jù)進(jìn)行犯罪防控過(guò)程中,要以人為本,尊重每個(gè)人、關(guān)懷每個(gè)人。明確賦予個(gè)人知情權(quán)、被遺忘權(quán)以及其他與個(gè)人信息數(shù)據(jù)相關(guān)的權(quán)利,真正確立技術(shù)的發(fā)展是為人的全面發(fā)展服務(wù)的技術(shù)倫理觀。
法律是社會(huì)公平正義的最后保障,因此要盡量通過(guò)法律途徑嚴(yán)格大數(shù)據(jù)程序,明確大數(shù)據(jù)適用范圍。當(dāng)前,我國(guó)在大數(shù)據(jù)方面的立法基本處于空白狀態(tài),地方性條例法規(guī)也是鳳毛麟角。而傳統(tǒng)的法律在個(gè)人數(shù)據(jù)保護(hù)等方面難以操作。另外,還存在邊界模糊、責(zé)任不清的問(wèn)題。這不利于大數(shù)據(jù)的健康發(fā)展以及在犯罪防控中的應(yīng)用。
相關(guān)法律的完善可以從以下方面著手。第一,明確個(gè)人信息數(shù)據(jù)的獲取程序。是否需要個(gè)人的授權(quán)和許可,以何種方式獲得個(gè)人的許可,這都需要在法律中加以明確規(guī)定。第二,明確個(gè)人信息數(shù)據(jù)的所有權(quán)、處分權(quán)歸屬,明確使用權(quán)的界限。第三,明確個(gè)人隱私權(quán)的內(nèi)涵和邊界,確立保護(hù)個(gè)人信息安全的內(nèi)容和策略。第四,在主動(dòng)性偵查、預(yù)測(cè)性偵查背景下,需要明確執(zhí)法機(jī)構(gòu)的權(quán)限和偵查程序,防止公權(quán)力的過(guò)度擴(kuò)張和偵查權(quán)的無(wú)限放大,防止個(gè)人的正常生活受到妨礙、正當(dāng)權(quán)益受到侵害。
參考文獻(xiàn):
[1]孫春英.主動(dòng)適應(yīng)新形勢(shì) 增強(qiáng)風(fēng)險(xiǎn)意識(shí) 堅(jiān)持創(chuàng)新驅(qū)動(dòng)切實(shí)提高維護(hù)公共安全能力水平[N].法制日?qǐng)?bào),2015-09-24(001).
[2]維克托·邁爾-舍恩伯格,肯尼思·庫(kù)克耶.大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013:18,67,75.
[3]印大雙.偵查模式從現(xiàn)場(chǎng)驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng)的邏輯演進(jìn)[J].貴州警官職業(yè)學(xué)院學(xué)報(bào),2016(6):3-10.
[4]徐良峰.大數(shù)據(jù)背景下偵查模式變革研究[D].上海:華東政法大學(xué),2016:24-26.
[5]王曉楠.大數(shù)據(jù)時(shí)代下的主動(dòng)型偵查模式研究[J].遼寧警專(zhuān)學(xué)報(bào),2015(3):18-21.
[6]何軍.大數(shù)據(jù)與偵查模式變革研究[J].中國(guó)人民公安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2015(1):72-80.
[7]章光明,黃文志.大數(shù)據(jù)在犯罪偵查中的應(yīng)用[J].上海公安高等專(zhuān)科學(xué)校學(xué)報(bào),2016(1):84-89.
[8]李熙,黃力.大數(shù)據(jù)背景下的犯罪預(yù)測(cè)與預(yù)防——基于犯罪預(yù)測(cè)分析模型的應(yīng)用及構(gòu)建[J].山西科技,2015(3):133-135.
[9]Miller K.Total Surveillance,Big Data,and Predictive Crime Technology:Privacy's Perfect Storm,Journal of Technology Law&Policy,2014(19):106-145.
[10]馬國(guó)富,王子賢,馬勝利.基于大數(shù)據(jù)的服刑人員危險(xiǎn)性預(yù)測(cè)[J].河北大學(xué)學(xué)報(bào)(自然科學(xué)版),2016(6):657-666.
[11]臧一博.大數(shù)據(jù)時(shí)代下信息倫理問(wèn)題探究[D].錦州:渤海大學(xué),2016:17.
[12]孫煜華.偵查權(quán)的憲法控制[M].北京:法律出版社,2014:3.
[13]理查德·A斯皮內(nèi)洛.劉鋼譯.世紀(jì)道德:信息技術(shù)的倫理方面[M].北京:中央編譯出版社,1999:53.