徐惠,李曉東
(中南財經(jīng)政法大學(xué)刑事司法學(xué)院,湖北 武漢 430070)
在大數(shù)據(jù)時代背景下,有學(xué)者提出“一切皆可量化”[1]的觀點,人們在大數(shù)據(jù)中發(fā)現(xiàn)未知習(xí)慣、規(guī)律甚至能夠在數(shù)據(jù)空間還原一個更加真實的自己。大數(shù)據(jù)作為一種技術(shù)、思維和方法逐步應(yīng)用到人們?nèi)粘I畹姆椒矫婷?。在此過程中,人們運用海量數(shù)據(jù)進行分析,進一步挖掘數(shù)據(jù)價值,誰都難以預(yù)料到下一步數(shù)據(jù)將會如何被利用、被發(fā)掘。人們越來越關(guān)注“是什么”,而忽視“為什么”,越來越注重“相關(guān)性”,而忽視“因果性”。同時,數(shù)據(jù)的挖掘和分析可以進一步預(yù)測人們的行為,為預(yù)防犯罪的發(fā)生提供一種可能性。在當前司法實踐中,大數(shù)據(jù)作為一種證據(jù)更為廣泛地出現(xiàn)在庭審過程中。通過檢索發(fā)現(xiàn),大數(shù)據(jù)證據(jù)多被表述為“大數(shù)據(jù)檢測技術(shù)”、“大數(shù)據(jù)分析”、“車輛軌跡分析”、“大數(shù)據(jù)搜索(查詢)”、“大數(shù)據(jù)比對”、“鑒定意見”等,還有某些案件判決書中并沒有對大數(shù)據(jù)進行表述,只是展示利用大數(shù)據(jù)分析所得出的相關(guān)結(jié)論。大數(shù)據(jù)證據(jù)的混亂表述直接證明大數(shù)據(jù)在法定證據(jù)種類中的定位遠未明確。因此,大數(shù)據(jù)作為一種有極大應(yīng)用價值的方法能否應(yīng)用到證據(jù)領(lǐng)域,形成大數(shù)據(jù)證據(jù)這一新的證據(jù)類型,進而為犯罪預(yù)防和偵破犯罪案件提供一定程度的支持是本文所力求解決的核心問題。
大數(shù)據(jù)的應(yīng)用對傳統(tǒng)的證據(jù)種類、證據(jù)規(guī)則造成了一定的沖擊,出現(xiàn)了一些新情景、新問題。當前大數(shù)據(jù)證據(jù)的提出源于大數(shù)據(jù)技術(shù)的興起,是建立在區(qū)別于傳統(tǒng)“小數(shù)據(jù)”、“全數(shù)據(jù)”基礎(chǔ)之上的。2016年出臺的《關(guān)于辦理刑事案件收集提取和審查判斷電子數(shù)據(jù)若干問題的規(guī)定》(以下簡稱《規(guī)定》)中,對電子數(shù)據(jù)的定義和分類、電子數(shù)據(jù)的收集、提取以及移送、展示等內(nèi)容作了較為詳細的規(guī)定。規(guī)定中明確指出了電子數(shù)據(jù)的數(shù)據(jù)性,并以之作為電子數(shù)據(jù)定義的中心語。(1)《規(guī)定》對電子數(shù)據(jù)的定義為,電子數(shù)據(jù)是案件發(fā)生過程中形成的,以數(shù)字化形式存儲、處理、傳輸?shù)?,能夠證明案件事實的數(shù)據(jù),強調(diào)電子數(shù)據(jù)的數(shù)字化及其處理的過程,強調(diào)對數(shù)字化所形成數(shù)據(jù)的認知功用。大數(shù)據(jù)作為一種技術(shù)、思維、方法,其核心方法同樣是“數(shù)字化—數(shù)據(jù)化”的過程,最終仍可能會以電子證據(jù)或鑒定意見等實體形式呈現(xiàn)給法庭,但是在這個過程中大數(shù)據(jù)證據(jù)并不完全等同于電子證據(jù)等證據(jù)形式。
1.大數(shù)據(jù)證據(jù)的概念
大數(shù)據(jù)證據(jù)概念的提出需要首先從語義學(xué)、內(nèi)涵及外延角度進行概念界定。大數(shù)據(jù)不同于數(shù)據(jù)的概念,同時大數(shù)據(jù)證據(jù)又不同于電子數(shù)據(jù)。電子數(shù)據(jù)是指存在于虛擬空間或網(wǎng)絡(luò)空間的具有某種特定意義或內(nèi)涵的數(shù)字,既突出了其數(shù)據(jù)性又突出了其電子性。(2)劉品新教授認為,電子證據(jù)與傳統(tǒng)證據(jù)的主要區(qū)別在于電子證據(jù)存在于不為人感知的虛擬空間、數(shù)字空間,人類必須借助某些電子設(shè)備才能予以解讀,而傳統(tǒng)證據(jù)則存在于物理空間,即便其需要借助某些工具予以認知,其本體也是存在于現(xiàn)實的物理世界。所謂大數(shù)據(jù)最為突出的是“大”,其中天然蘊含數(shù)據(jù)總量大(3)總量在逐步接近全數(shù)據(jù)并無限逼近。、數(shù)據(jù)類型多、進而存在著數(shù)據(jù)雜亂無章、關(guān)聯(lián)度低、結(jié)構(gòu)性差的特點。而大數(shù)據(jù)正因為存在于虛擬空間或網(wǎng)絡(luò)空間才為公安機關(guān)、檢察機關(guān)、監(jiān)察機關(guān)偵查、調(diào)查某些案件并獲取事實材料提供了無可比擬的便捷性和高效性。大數(shù)據(jù)和電子數(shù)據(jù)的共同點在于其存在的場域具有一致性,而不同點也尤為明顯,在偵破和預(yù)防案件的過程中,電子數(shù)據(jù)僅僅作為一種能夠證明案件事實的材料存在,而大數(shù)據(jù)不僅作為一種事實材料存在,其更大的價值性體現(xiàn)在作為一種思維方式、分析方法、分析技術(shù)存在,更為重要的是思維、方法、技術(shù)的理性選擇對其分析結(jié)果以及數(shù)據(jù)事實材料的證據(jù)轉(zhuǎn)化具有極大的影響性。大數(shù)據(jù)證據(jù)是一種兼具證明案件事實材料和分析思維、方法、技術(shù)的綜合體,同時可以為預(yù)防犯罪提供一定的依據(jù)。
大數(shù)據(jù)之父舍恩伯格從證據(jù)的價值角度強調(diào)大數(shù)據(jù)是從海量數(shù)據(jù)中提取出價值和服務(wù)。[2]也有學(xué)者認為大數(shù)據(jù)就是海量的、非結(jié)構(gòu)化并具有附加價值的數(shù)據(jù)。[3]2018年中國信息通信研究院發(fā)布的《大數(shù)據(jù)白皮書》從政策、技術(shù)、產(chǎn)業(yè)、應(yīng)用等多個方面描述大數(shù)據(jù),強調(diào)了大數(shù)據(jù)的應(yīng)用價值,把大數(shù)據(jù)視為信息化發(fā)展的新階段并作為一種國家戰(zhàn)略。因此,本文認為大數(shù)據(jù)是一種以數(shù)據(jù)技術(shù)為引領(lǐng)的創(chuàng)造應(yīng)用價值的方式、方法,其本質(zhì)仍是一種方法論概念。
針對大數(shù)據(jù)證據(jù)的定義,需要有機結(jié)合“大數(shù)據(jù)”和“證據(jù)”的相關(guān)概念。本文認為,大數(shù)據(jù)證據(jù)是將大數(shù)據(jù)技術(shù)、方法、思維等方式、方法用以證明案件事實或者預(yù)測案件所得出的一切材料。對于大數(shù)據(jù)證據(jù)的外延,不僅包括最終呈現(xiàn)的數(shù)據(jù)材料,還應(yīng)當包括關(guān)于案件的全數(shù)據(jù),對于非結(jié)構(gòu)化數(shù)據(jù)處理所采用大數(shù)據(jù)技術(shù)的說明材料,對于大數(shù)據(jù)分析方法(主要包括算法)運用合理性的說明材料,有關(guān)案件關(guān)聯(lián)性、合法性、真實性的說明材料,對于案件預(yù)測結(jié)果的說明等內(nèi)容的說明材料。
2.大數(shù)據(jù)證據(jù)與其他證據(jù)種類之比較界說
法定證據(jù)確認的準則在于,每種證據(jù)在其收集和認定的方法上均有區(qū)別于其他證據(jù)形態(tài)的特質(zhì)。[4]大數(shù)據(jù)證據(jù)與電子證據(jù)最為相似,因此對電子數(shù)據(jù)的性質(zhì)認定可以為大數(shù)據(jù)證據(jù)性質(zhì)的認定提供一定的參照。對電子數(shù)據(jù)的屬性認定,學(xué)界仍然眾說紛紜,目前的觀點包括視聽資料說[5]、書證說[6]、物證說[7]、獨立證據(jù)說[8]。對于大數(shù)據(jù)證據(jù)的屬性首先需要明確它是借助大數(shù)據(jù)方法、技術(shù)、思維而得到的一系列與案件事實有關(guān)的材料,它所處理的關(guān)系是數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系以及數(shù)據(jù)與案件事實之間的關(guān)系。在處理數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系時,通過借助數(shù)據(jù)搜索、數(shù)據(jù)挖掘、數(shù)據(jù)碰撞、數(shù)據(jù)畫像等方式將非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化,尋找數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系,進行一定關(guān)聯(lián)。在這個過程中,所利用的數(shù)據(jù)之間呈現(xiàn)出相關(guān)、弱相關(guān)甚至無相關(guān)的關(guān)系。但是,經(jīng)過一定的大數(shù)據(jù)技術(shù)處理,排除所有的虛假相關(guān)和可能引起困惑的弱相關(guān)之后,在近乎全數(shù)據(jù)的背景下,最后得到的相關(guān)性即便難以置信,其也會與案件事實有這樣或那樣的關(guān)系。因此,大數(shù)據(jù)方法、技術(shù)和思維指導(dǎo)了兩個環(huán)節(jié),一個是使得數(shù)據(jù)與數(shù)據(jù)之間結(jié)構(gòu)化,另一個是將結(jié)構(gòu)化的數(shù)據(jù)進行解析,形成與案件事實具有相關(guān)性的結(jié)論,而這兩個過程均屬于大數(shù)據(jù)證據(jù)的范疇。因此,大數(shù)據(jù)證據(jù)既包含與案件直接相關(guān)的證據(jù),同時包含與案件事實間接相關(guān)的證據(jù),大數(shù)據(jù)證據(jù)也因此成為一個綜合體。
與大數(shù)據(jù)證據(jù)相比,電子證據(jù)更注重數(shù)據(jù)與事實的直接關(guān)聯(lián)性,即通過簡單的、單一的數(shù)據(jù)類型分析即可產(chǎn)生與案件事實相關(guān)聯(lián)的關(guān)系。雖然同為對數(shù)據(jù)的應(yīng)用,但是大數(shù)據(jù)證據(jù)更注重對多樣化、非結(jié)構(gòu)數(shù)據(jù)的分析,更關(guān)注對數(shù)據(jù)分析方法的運用,更注重對關(guān)聯(lián)性的把握,更注重對未發(fā)生案件的預(yù)測,所關(guān)注的證明對象更豐富;而電子證據(jù)則更注重對單一、結(jié)構(gòu)化數(shù)據(jù)的分析,更注重對數(shù)據(jù)的運用,更關(guān)注數(shù)據(jù)與案件的因果關(guān)系,更針對已經(jīng)發(fā)生的案件的破獲。雖然電子證據(jù)和大數(shù)據(jù)證據(jù)在呈現(xiàn)形式上具有一定的質(zhì)性上的一致性(4)呈現(xiàn)形式都是依靠可認知的數(shù)據(jù),因此雖然大數(shù)據(jù)更傾向一種方法、技術(shù),但是其表現(xiàn)形式仍然需借助客觀載體——數(shù)據(jù),因此與電子數(shù)據(jù)的表現(xiàn)形式具有一致性。,在結(jié)構(gòu)上具有一定的相似性(5)有學(xué)者將電子數(shù)據(jù)理解為原始電磁信號經(jīng)過解析后的可被認知的數(shù)據(jù),而該數(shù)據(jù)則是可以被用作證據(jù)證明案件事實的一種證據(jù)材料。因此電子證據(jù)與大數(shù)據(jù)證據(jù)所具有的“處理數(shù)據(jù)間關(guān)系以及數(shù)據(jù)與案件事實之間關(guān)系”的結(jié)構(gòu)具有一定的相似性。,但電子證據(jù)是簡單、結(jié)構(gòu)化數(shù)據(jù)的分析,僅僅停留在大數(shù)據(jù)方法應(yīng)用的最初始階段,因此可以視為大數(shù)據(jù)證據(jù)包含電子證據(jù)。大數(shù)據(jù)證據(jù)作為一種綜合性較強的證據(jù),既需要對應(yīng)用的技術(shù)、方法進行證成,又需要對數(shù)據(jù)間關(guān)系進行證成,還需要對數(shù)據(jù)結(jié)果與案件事實之間關(guān)系進行證成。在應(yīng)用大數(shù)據(jù)方法進行犯罪分析、證成的過程中所形成的與犯罪事實、犯罪預(yù)測具有一定科學(xué)性、關(guān)聯(lián)性和蓋然性的材料進入證據(jù)領(lǐng)域,成為一種集物證、書證、鑒定意見等證據(jù)種類諸多特征于一體的新型證據(jù)。
有學(xué)者認為,“最好把資金大數(shù)據(jù)分析納入司法鑒定范疇。這有利于司法實踐的展開,在法律上也可以找到依據(jù)。”[9]該學(xué)者意在把大數(shù)據(jù)報告視為一種鑒定意見。無可爭議的是大數(shù)據(jù)證據(jù)的核心是大數(shù)據(jù)分析報告,大數(shù)據(jù)分析報告中包含大數(shù)據(jù)分析結(jié)果、使用的算法模型以及數(shù)據(jù)的范圍,大數(shù)據(jù)報告的核心在于對算法模型的分析和選擇,算法模型的有效性和適用性很大程度上決定著分析結(jié)果的準確性和可采性。傳統(tǒng)的鑒定意見大部分借助相關(guān)科學(xué)儀器以及科學(xué)知識對材料的真實性作出實質(zhì)性判斷(6)鑒定意見的對象既包括筆跡、痕跡、DNA等存在于物理空間的材料,又包括電子數(shù)據(jù)完整性、真實性等存在于虛擬空間的材料,均未涉及到方法論選擇的鑒定。,而對于算法模型(7)算法中包括理論算法,如C4.5算法、K-means算法、樸素貝葉斯算法、最近監(jiān)督分類算法、EM最大期望算法等。理論算法保證數(shù)據(jù)平臺擁有自我學(xué)習(xí)、自我完善的能力。依據(jù)理論算法,結(jié)合實際案件類型則會產(chǎn)生更為具體的應(yīng)用算法。其實,應(yīng)用算法的選擇是一個不斷試錯和糾錯的過程,最終尋找到匹配度高的有效算法模型。的判斷是一種對方法論的判斷[10],與傳統(tǒng)的鑒定意見在對象上具有質(zhì)的差別,而且算法模型選擇的有效性和適用性是依據(jù)多年來的經(jīng)驗或者相關(guān)數(shù)據(jù)驗證得出的,因此具有一定的經(jīng)驗性和實驗性,在一定程度上突破了科學(xué)證據(jù)的范疇。綜上所述,大數(shù)據(jù)證據(jù)雖然與鑒定意見具有些許共性,但基于以上差異點,作為獨立的證據(jù)種類更為妥當。
1.符合刑事司法的價值導(dǎo)向
有學(xué)者認為現(xiàn)代社會進入到了風(fēng)險社會之后,經(jīng)濟、社會、技術(shù)和醫(yī)療結(jié)構(gòu)處于高速改進過程中,社會肌體對混亂的抵抗力完全喪失,面臨著越來越多的威脅其生存的由社會所制造的風(fēng)險。在此觀點基礎(chǔ)上提出的預(yù)防性刑法觀,將危險犯置于刑法的中心,并引起了刑法學(xué)界的持續(xù)討論。其中所顯現(xiàn)的通過減少、消除犯罪機會或者條件來預(yù)防犯罪理念,正在并且將來必然還會對刑法學(xué)的發(fā)展產(chǎn)生影響。[11]隨著刑事政策從“打擊犯罪”轉(zhuǎn)向“預(yù)防犯罪”,證據(jù)法作為認定案件事實的依據(jù),一定程度上應(yīng)當與刑事政策相契合,以便實現(xiàn)整個社會對犯罪的預(yù)防控制。同時,人民警察具有預(yù)防、制止和懲治違法犯罪活動的職權(quán)。隨著大數(shù)據(jù)技術(shù)在偵查部門的廣泛應(yīng)用,大數(shù)據(jù)偵查作為一種新型的警務(wù)模式被提出,偵查部門在很大程度上由打擊犯罪向預(yù)防犯罪的終極追求目標轉(zhuǎn)化。隨著預(yù)防犯罪的理念在刑事政策以及偵查中被越來越廣泛地應(yīng)用,證據(jù)作為連接偵查和審判階段的橋梁理應(yīng)具有逐步探索預(yù)防性證據(jù)的認定標準和認定機制。大數(shù)據(jù)證據(jù)作為一種新型證據(jù)種類,符合當前刑事司法中的價值導(dǎo)向,能確保其在正確的方向指引下成為司法活動中的有益力量。
2.相關(guān)性作為其基礎(chǔ)價值分析
在傳統(tǒng)的證據(jù)三大基本屬性中,最基本的屬性為證據(jù)的關(guān)聯(lián)性,這是證據(jù)被采納的前提和基石。大數(shù)據(jù)證據(jù)通過對非結(jié)構(gòu)化、弱相關(guān)甚至無相關(guān)數(shù)據(jù)進行結(jié)構(gòu)化分析,主要運用歸納邏輯、數(shù)理邏輯以進行證成,得出人們難以發(fā)現(xiàn)的相關(guān)性,在這個意義上大數(shù)據(jù)證據(jù)在傳統(tǒng)的證據(jù)理論上進行突破,相關(guān)性因此成為其核心特征。
在傳統(tǒng)的司法證明過程中,由于獲取數(shù)據(jù)手段和技術(shù)的局限性,證據(jù)獲取是以“小數(shù)據(jù)”為基礎(chǔ),其證明規(guī)則依賴因果邏輯關(guān)系。而當前,大數(shù)據(jù)使得數(shù)據(jù)量的限制在逐步消失,通過無限接近甚至是“樣本=總體”的域范圍來處理數(shù)據(jù),數(shù)據(jù)之間往往呈現(xiàn)“非結(jié)構(gòu)化關(guān)系”、“弱相關(guān)關(guān)系”的特點。因此,大數(shù)據(jù)更注重相關(guān)性和模糊性,并不注重因果性和精確性。在實務(wù)中,大數(shù)據(jù)已經(jīng)應(yīng)用于偵查過程中,大數(shù)據(jù)偵查作為新興的研究方向正在崛起[12]。大數(shù)據(jù)證據(jù)作為一種證據(jù),關(guān)鍵是要解決相關(guān)性與因果性相沖突而產(chǎn)生的正當性問題。
在刑事證據(jù)中,舊有證明觀念是建構(gòu)價值無涉基礎(chǔ)上的因果關(guān)系,其典型代表是條件因果關(guān)系說,后來相當因果關(guān)系說對條件因果關(guān)系說進行修正。相當因果關(guān)系雖以條件因果關(guān)系為基礎(chǔ),但解釋論上的關(guān)鍵點在于對“相當”的解析,并呈現(xiàn)出與條件因果關(guān)系不同的法律判斷:以一般人在日常生活中對于常見的兩種現(xiàn)象之間所形成的因果聯(lián)系觀念為標準,判斷行為與結(jié)果之間客觀存在的必要條件聯(lián)系能否成為法律上的因果關(guān)系。[13]在此基礎(chǔ)上,相當因果關(guān)系的關(guān)鍵在于“相當”,即以一般的社會理性去評判因果關(guān)系,將客觀蓋然率引入到因果關(guān)系中,將因果關(guān)系的判斷在某種程度上轉(zhuǎn)化為對概率大小的判斷。因此,對于因果關(guān)系的判斷,既包含了對于案件事實客觀性的判斷,又包含了法官一定程度上的主觀判斷,成為客觀見之于主觀,同時主觀又為客觀所評判的綜合性結(jié)構(gòu)體。(8)客觀見之于主觀是指對于因果關(guān)系的認知,是由具有客觀性的證據(jù)通過法官的邏輯、經(jīng)驗、科學(xué)理性對因果關(guān)系作出判斷,進而反映于法官的主觀映像之中??陀^見之于主觀是指法官所作出的因果關(guān)系判斷需要接受社會公眾的評判,在符合大眾一般的因果關(guān)系認知時,其判斷才是適當?shù)?。因果關(guān)系概念和標準的變化勢必會導(dǎo)致法官內(nèi)心確信標準的轉(zhuǎn)變,進而影響到整個刑事司法過程中證明標準以及司法成本的轉(zhuǎn)變。在相當因果關(guān)系概念體系下,概率從100%有所下降,人們認識因果關(guān)系成為一個蓋然的關(guān)系,并可以通過相關(guān)關(guān)系進行一定的判斷和衡量。美國學(xué)者通常認為優(yōu)勢證據(jù)意味著為真的概率大于50%,排除合理懷疑意味著為真的概率大于95%。[14]通過相關(guān)關(guān)系的強弱可以證成因果關(guān)系的強弱,這個標準需要通過法官的內(nèi)心確信去判斷。因此,概率為相關(guān)關(guān)系和因果關(guān)系提供了聯(lián)通的橋梁,相關(guān)性與因果性的沖突問題在一定程度上得以消解掉。
3.真實性作為其最高的價值追求
真實性是證據(jù)三個基本屬性中的最高價值追求。證據(jù)真實性要求證據(jù)不僅在形式上為真,而且在內(nèi)容上也為真。[15]《刑事訴訟法》規(guī)定,任何證據(jù)未經(jīng)法庭質(zhì)證,不得作為定案依據(jù)。因此,涉及真實性的問題,必定需要經(jīng)過法官的價值判斷和邏輯判斷的過程。人們所做的事是經(jīng)過最大努力還原事實真相,但其中不可避免會存在由于主體間性所產(chǎn)生的認識偏差以及案件的不可還原性所產(chǎn)生的事實認定偏差。因此,在認定案件事實的情況下,需要將外在的證明標準與法官所形成的內(nèi)心確信相統(tǒng)一。此時,還原案件事實的核心是理性,即通過邏輯之理性、事實之理性、科學(xué)之理性、法律之理性對證據(jù)進行判斷,對案件事實進行證成。證據(jù)是一種稀缺的資源,證據(jù)短缺是人類司法的永恒規(guī)律。[16]證據(jù)的獲取、案件的證成需要耗費極大的時間和成本。在不可能完全還原案件事實的情況下,借助技術(shù)、方法手段,可以在追求效益最大化的同時,最大程度地為還原案件事實提供依據(jù)。因此,大數(shù)據(jù)證據(jù)作為技術(shù)性、科學(xué)性、經(jīng)驗性并存的證據(jù),在規(guī)律性總結(jié)和概率演算基礎(chǔ)上,為具有相關(guān)性并隱藏在表象之下證據(jù)的發(fā)現(xiàn)提供了很大可能性,也為法官能夠認識整個案件的全貌提供了可能性,一定程度上降低了司法證明的難度。
1.行為規(guī)律理論
個體行為具有一定的規(guī)律性。任何犯罪行為都是在一定機制作用下形成的,各種犯罪行為既有自己的特性,又存在此類犯罪行為所具有的共性。這些共性在大數(shù)據(jù)分析方法面前是可歸納、可識別的。首先,任何犯罪的發(fā)生都有其動機形成,動機的根源在于需求的不滿足。隨著個體需求的欲望逐漸強化,便產(chǎn)生了動機,動機逐步強化為其行動意志,通過行為的方式以求滿足其個體需求,因此便形成了犯罪。犯罪結(jié)果的成功與否進一步反作用于個人需求。需求是個體行為規(guī)律的形成因素之一。人類實踐引起的外部環(huán)境的變化以及人所處的現(xiàn)實社會環(huán)境,是人產(chǎn)生有規(guī)律行為的又一根源。[17]犯罪分子所實施的犯罪行為是由歷史環(huán)境、社會環(huán)境以及家庭環(huán)境共同塑造的。他人的犯罪行為、犯罪分子所受到的懲罰以及行為獎懲是否合理都在一定程度上影響著個體是否實施犯罪行為。個體在現(xiàn)實生活中不斷接觸甚至學(xué)習(xí)歷史以及社會上的犯罪行為,其中勢必會產(chǎn)生一定的犯罪行為規(guī)律。此觀點在班杜拉的社會學(xué)習(xí)理論和哈貝馬斯的行為交往理論中均有體現(xiàn)。每種犯罪都有一種或幾種特定的行為模式,根據(jù)每種行為模式來建立特定預(yù)測模型,并將預(yù)測模型運用于對關(guān)聯(lián)數(shù)據(jù)的監(jiān)控中,就能夠達到預(yù)測犯罪的效果。[18]刑法之所以能夠誕生同樣是基于犯罪行為的規(guī)律性,從犯罪過程中歸納提取出行為要素加以明晰規(guī)定。因此,基于個體行為的規(guī)律性,犯罪作為一個循序漸進的發(fā)展過程,進行預(yù)測和預(yù)警是有行為規(guī)律理論作為支撐的。
2.證明標準的差異化理論
對于已發(fā)生的案件,我們在追求案件事實本身的時候,不可能完全還原案件本身,只能盡力接近100%的真相。因此在現(xiàn)實證成過程中,必然涉及證明標準的問題。當法官形成內(nèi)心確信,即其依據(jù)邏輯的、經(jīng)驗的、科學(xué)的理性認為達到了證明標準時,對案件所作出的判斷即為合理。在現(xiàn)實中,不同的司法階段對案件的證明標準是有差異的,不同階段證明標準的合理化有助于我們?nèi)嬲J識案件,排除非法證據(jù),認定能夠作為定案依據(jù)的證據(jù)。無論是大陸法系還是英美法系,隨著案件階段的深入,不同階段的證明標準將會越來越高,對廣泛的案件材料進行排除和采納,最終可能僅僅依靠與案件事實密切相關(guān)的法定要素證據(jù),基本呈現(xiàn)一個正金字塔形狀。這在美國的證據(jù)法則和證據(jù)理論中體現(xiàn)得非常完整[19],其將證明的程度一共分為9等。(9)9等證明標準分別為第1等是絕對確定,第2等是排除合理懷疑,第3等是清楚和有說服力的證據(jù),第4等是優(yōu)勢證據(jù),第5等是可能的原因;第6等是有理由的相信,第7等是有理由的懷疑,第8等是懷疑,第9等是無線索。由此可見,在美國開始偵查、提起公訴、作出有罪判決的標準都是不同的。[20]在審判中心主義背景下,大數(shù)據(jù)證據(jù)在與案件具有一定相關(guān)性的情況時,應(yīng)當根據(jù)不同階段證明標準的差異性不同,使其進入偵查、起訴和審判階段。而不能一刀切,徹底否定大數(shù)據(jù)的證據(jù)作用,在事先不影響法官價值判斷的情況下,依據(jù)理性對大數(shù)據(jù)證據(jù)作出正確的認定。
3.概率和博弈理論
概率本來是一個數(shù)學(xué)問題,是指在同一條件下不確定事件發(fā)生的可能性大小的比率。通過大數(shù)據(jù)技術(shù)可以獲得社會中大量現(xiàn)象的數(shù)據(jù),從而可以應(yīng)用概率理論對數(shù)據(jù)進行分析,發(fā)現(xiàn)事件發(fā)生的概率。結(jié)合博弈論相關(guān)知識,進一步發(fā)現(xiàn)事件之間的聯(lián)系。
概率論理論認為,當樣本數(shù)據(jù)足夠多時,樣本數(shù)據(jù)中事件發(fā)生的概率接近于總體中事件發(fā)生的概率。通過大數(shù)據(jù)收集大量樣本數(shù)據(jù),利用這些數(shù)據(jù)得出事件發(fā)生的概率可以看成事件本身發(fā)生的概率。在人類社會中,不同事件之間往往是相互聯(lián)系的,當一個事件發(fā)生時,會影響另一個事件的發(fā)生。通過貝葉斯公式,可以了解某個事件的發(fā)生對另一個事件發(fā)生的概率的影響。
假設(shè)事件A有a1、a2…an,n種結(jié)果,且滿足三個條件:
①P(ai)>0,i=1,2…n;
②a1、a2…an之間互不相容,即ai×aj=?(i≠j);
③a1∪a2∪…∪an=Ω。
則對于任何一個事件B (P(B)>0),有:
上式為全概率公式,在知道事件A各種結(jié)果發(fā)生的概率以及在各種結(jié)果發(fā)生的情況下事件B發(fā)生的概率的情況下,就可以用全概率公式求出事件B發(fā)生的概率。對全概率公式進行推導(dǎo),可以得到貝葉斯公式。
以上就是貝葉斯公式,可以求出在事件B發(fā)生的情況下,事件A發(fā)生aj結(jié)果的概率。若事件A和B是相互獨立的,則P(aj|B)=P(aj),即事件B是否發(fā)生不影響事件A的結(jié)果。
當知道事件發(fā)生的概率以及相互間的影響后,就可以將這些概率應(yīng)用于博弈分析。社會中的博弈往往是一個動態(tài)博弈,貝葉斯納什均衡理論可以用來分析這些動態(tài)博弈。在完全且完美信息動態(tài)博弈中,可以逆推子博弈的納什均衡,從而求出子博弈完美納什均衡,也就是完美貝葉斯均衡。但是在現(xiàn)實社會中,信息往往是不充分的,所以經(jīng)常會出現(xiàn)完全但不完美的動態(tài)博弈。我國法律界以前追求客觀真實說,客觀真實說所要求的完全還原已逝去案件事實的證明標準是不現(xiàn)實的,給案件的審理帶來了極大的壓力,當前是法律真實說占據(jù)主流地位,這就為借助概率論來判斷具有證明責任的一方是否達到證明標準解決了理論前提上的障礙。[21]而大數(shù)據(jù)技術(shù)的應(yīng)用,進一步解決了信息不對稱、不完全的問題,使得盡量在全數(shù)據(jù)的基礎(chǔ)上推出完美貝葉斯均衡,追求概率最大化,為進一步還原案件事實真相提供了有益幫助。
1.為打擊犯罪提供了新的可能
大數(shù)據(jù)證據(jù)具有全數(shù)據(jù)的特征。隨著大數(shù)據(jù)技術(shù)的發(fā)展,一切皆可數(shù)據(jù)化,包括我們的文字、方位、溝通乃至生活的方方面面,[22]同時人類數(shù)據(jù)儲存技術(shù)也在急速發(fā)展。(10)當前數(shù)據(jù)的計量單位可以明顯體現(xiàn)出數(shù)據(jù)儲存技術(shù)的提升,如1PiB(Pebibyte,千萬億字節(jié),拍字節(jié))=1024TB= 2^50 B;1EiB(Exbibyte,百億億字節(jié),艾字節(jié))=1024PB= 2^60 B;1ZiB(Zebibyte,十萬億億字節(jié),澤字節(jié))= 1024EB= 2^70 B;1YiB(Yobibyte,一億億億字節(jié),堯字節(jié))= 1024ZB= 2^80 B,參見https://baike.baidu.com/item/字節(jié)。數(shù)據(jù)化和數(shù)據(jù)儲存技術(shù)的發(fā)展使得司法機關(guān)不必再拘泥于“小數(shù)據(jù)”時代儲存技術(shù)的限制,而能將關(guān)于案件的所搜集到的全部數(shù)據(jù)予以保存,帶來了司法機關(guān)儲存技術(shù)的革新。隨著數(shù)據(jù)應(yīng)用價值的提升,案件全數(shù)據(jù)的儲存也為未來案件的新發(fā)現(xiàn)、新發(fā)展提供了無限的可能性。
大數(shù)據(jù)證據(jù)所處理的是數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,真正的大數(shù)據(jù)并不僅僅是體量大,而是其數(shù)據(jù)具有多樣性。大數(shù)據(jù)可以處理挖掘全數(shù)據(jù)中的大量非結(jié)構(gòu)化、無關(guān)聯(lián)數(shù)據(jù),將數(shù)據(jù)結(jié)構(gòu)化、關(guān)聯(lián)化,進而呈現(xiàn)數(shù)據(jù)之間的關(guān)系。案件的發(fā)生是多方因素共同作用的結(jié)果,在分析案件時,大數(shù)據(jù)作為一項以技術(shù)為主導(dǎo)的方法,盡可能搜集到全部的數(shù)據(jù)樣本,既包括關(guān)聯(lián)樣本又包括無關(guān)樣本,并且主要從無關(guān)聯(lián)的、弱關(guān)聯(lián)的數(shù)據(jù)之間進行結(jié)構(gòu)化分析、清洗,尋找到人們難以發(fā)現(xiàn)的數(shù)據(jù)之間的關(guān)聯(lián),力圖尋找到有用的信息。在這個意義上,大數(shù)據(jù)所獲得的關(guān)聯(lián)性是一個大概率關(guān)聯(lián),是一個只知道“是什么”而不知道“為什么”的關(guān)聯(lián)。例如,美國波士頓馬拉松爆炸案發(fā)生后,警方幾乎調(diào)取了與案件現(xiàn)場有關(guān)的所有大數(shù)據(jù),收集了近10TB的數(shù)據(jù)量,包括案發(fā)現(xiàn)場周圍所有的監(jiān)控錄像,附近12個街區(qū)居民所拍攝的有關(guān)照片、視頻,社交網(wǎng)站上的相關(guān)照片、文字及視頻信息,通過大數(shù)據(jù)技術(shù)對這些海量的、多樣化數(shù)據(jù)進行挖掘分析,警方最終找到了相關(guān)證據(jù)并在3天后確定了犯罪嫌疑人,于次日將其抓獲。[23]再比如2015 年公安部會同國家稅務(wù)總局、中國人民銀行用8 個月時間查處了一起虛開增值稅專用發(fā)票犯罪案件。辦案人員收集到10 億多條資金流水,利用分析模型分析虛開公司資金流向,清楚地將涉案公司分為開票公司、收票公司、中轉(zhuǎn)公司三層,根據(jù)資金流向區(qū)分出會員單位、二級單位等,繪制出資金流的閉環(huán)關(guān)系。(11)案例摘自劉品新.論大數(shù)據(jù)證據(jù)[J].環(huán)球法律評論,2019,(1):24.諸多條流水信息中,勢必充斥著大量無關(guān)聯(lián)、弱關(guān)聯(lián)數(shù)據(jù)。然而公安機關(guān)通過數(shù)據(jù)清洗、數(shù)據(jù)碰撞、數(shù)據(jù)學(xué)習(xí)等方法選取相應(yīng)的算法參數(shù)分析數(shù)據(jù),尋找數(shù)據(jù)規(guī)律,進而厘清數(shù)據(jù)流動規(guī)律和案件層級結(jié)構(gòu)。在大數(shù)據(jù)分析過程中,偵查人員并不知道資金為何會這樣流動以及該案件為何形成這樣的層級結(jié)構(gòu)。當兩行為之間發(fā)生的概率達到很高程度的時候,我們就可以說這兩者存在關(guān)聯(lián),進而去對兩行為進行分析,而不需要判斷兩行為之間為什么存在關(guān)聯(lián),不過具體關(guān)聯(lián)的概率需要到達多高程度是需要不同訴訟階段的司法實務(wù)部門通過實踐去制定的。
2.預(yù)防犯罪行為的發(fā)生
通過預(yù)測犯罪進而預(yù)防犯罪是當今偵查機關(guān)乃至整個司法系統(tǒng)所追求的終極目標,而大數(shù)據(jù)的顯著特征就是可預(yù)測性。大數(shù)據(jù)預(yù)測的原理就在于相關(guān)關(guān)系的分析,通過找出一個關(guān)聯(lián)物并監(jiān)控它,并對其發(fā)展的走向進行預(yù)測。大數(shù)據(jù)所具有的預(yù)測性給偵查機關(guān)預(yù)防犯罪提供了一個良好的契機,借助大數(shù)據(jù)技術(shù),分析數(shù)據(jù)之間的關(guān)系,通過大量非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化分析,借助算法對犯罪行為進行預(yù)測,找到犯罪行為的關(guān)聯(lián)行為,通過對關(guān)聯(lián)行為的實時監(jiān)控,搜集固定相關(guān)證據(jù)材料以求作為認定案件的依據(jù),從而對即將發(fā)生的犯罪行為進行制止。犯罪預(yù)測的理論基礎(chǔ)是根據(jù)行為規(guī)律理論進行的。在一定程度上行為規(guī)律理論將人的行為作為可認識的、可學(xué)習(xí)的甚至是可預(yù)測的,因為個體存在于個體與個體、個體與群體、個體與社會、個體與國家、群體與群體、群體與社會、群體與國家的關(guān)系之間,其個體行為受到歷史和現(xiàn)實中其他個體、群體、社會、國家的潛在或顯著的影響,具有一定的規(guī)律性。同量刑預(yù)測系統(tǒng)原理(12)比如,盜竊罪的量刑預(yù)測系統(tǒng)為盜竊罪的知識圖譜(要素)—情節(jié)提取—類案識別—模型訓(xùn)練(函數(shù)關(guān)系)—量刑預(yù)測—偏離預(yù)警。相類似,犯罪行為預(yù)測運行的原理為:行為規(guī)律通過大數(shù)據(jù)技術(shù)首先進行量化,隨后通過算法對數(shù)據(jù)進行規(guī)律分析,提取犯罪行為的知識圖譜——將分析出的規(guī)律再通過算法進行編程,應(yīng)用于現(xiàn)實的實例進行實踐修正,最終抽象出關(guān)于犯罪行為具有高概率性的數(shù)百種行為模型——最后實際應(yīng)用于實際生活中,對現(xiàn)實生活中的行為要素進行提取,進行類似行為識別——信息庫數(shù)據(jù)實時更新,可以對犯罪行為及時預(yù)警、必要時及時采取制止措施。
當前,已經(jīng)應(yīng)用大數(shù)據(jù)預(yù)警的犯罪防控主要集中在預(yù)防電信詐騙中,并且成績較為顯著。由于大數(shù)據(jù)技術(shù)背景下,所有的數(shù)據(jù)都是實時更新的,當大數(shù)據(jù)算法分析出潛在受害人可能陷入電信詐騙犯罪嫌疑人的圈套時,公安部門會采取預(yù)警被害人和反制犯罪嫌疑人的手段,包括對潛在受害人的短信提醒、電話提醒、電話回訪、通知密切聯(lián)系人等方式進行告知提醒;對潛在犯罪人通過通話切斷、信息攔截、資金攔截以及通過詢問、監(jiān)控、盤問、檢查等行政強制措施等方式進行反制。對于上述相關(guān)的犯罪預(yù)測和預(yù)警手段,一旦被調(diào)查的對象對偵查機關(guān)的行為提出異議,甚至提起相關(guān)的行政訴訟時,對于措施合理性、合法性的證明責任就需要偵查和司法機關(guān)進行解釋,此時就會涉及大數(shù)據(jù)證據(jù)的取證、證成以及采信工作,因此大數(shù)據(jù)證據(jù)在犯罪預(yù)測預(yù)警之中的作用至關(guān)重要。
當然,在犯罪預(yù)測的過程中,過于依賴算法對犯罪行為規(guī)律的提煉和識別,很可能出現(xiàn)數(shù)據(jù)獨裁(13)數(shù)據(jù)獨裁就是讓數(shù)據(jù)統(tǒng)治我們,一切依靠數(shù)據(jù)作出相應(yīng)的判斷和決策,不摻雜感情,屬于超理性主義。的情況,進而出現(xiàn)錯誤的預(yù)判,甚至發(fā)生侵犯人權(quán)的現(xiàn)象,進一步消解公安機關(guān)在案件預(yù)防、制止和偵破中的主體地位。基于這種可能的現(xiàn)象,應(yīng)用大數(shù)據(jù)預(yù)測犯罪應(yīng)當慎之又慎,從保障人權(quán)的角度出發(fā),完善各項人權(quán)保障制度和機制。同時,對于風(fēng)險等級較高的潛在犯罪嫌疑人,在采取較強程度強制措施的同時應(yīng)當注重對傳統(tǒng)證據(jù)的收集提取,將大數(shù)據(jù)證據(jù)與傳統(tǒng)的物證、書證、電子證據(jù)結(jié)合起來,形成交叉印證,共同判斷是否應(yīng)當根據(jù)相應(yīng)的大數(shù)據(jù)預(yù)測結(jié)果采取較強程度的措施。
在大數(shù)據(jù)時代,大數(shù)據(jù)作為一種技術(shù)、方法和思維被越來越廣泛地應(yīng)用到各個領(lǐng)域。法律人應(yīng)當擁有最縝密的邏輯理性,還要擁有高尚的法價值情懷。大數(shù)據(jù)為法律人提供了前所未有的機遇和風(fēng)險。在這個混沌的時代,必須摒棄固守、舊有的思想,敞開心扉擁抱大數(shù)據(jù)時代,順應(yīng)歷史發(fā)展之潮流,看清已知,探索未來。大數(shù)據(jù)證據(jù)作為聯(lián)結(jié)現(xiàn)實與未來的橋梁,作為實現(xiàn)人類所追求終極價值的材料,應(yīng)當被發(fā)掘、探索,最終被合理利用。