摘 要:數(shù)字信息技術(shù)對(duì)刑事司法的深度介入產(chǎn)生了算法證據(jù)。刑事算法證據(jù)應(yīng)限于“人輔機(jī)主”型的機(jī)器學(xué)習(xí)算法證據(jù),可歸屬于專門性問題報(bào)告范疇。算法通過數(shù)據(jù)結(jié)構(gòu)化的過程,揭示大數(shù)據(jù)與待證事實(shí)之間的因果關(guān)系,算法證據(jù)是在司法證明整體主義模式下對(duì)大數(shù)據(jù)評(píng)價(jià)的結(jié)果,包括預(yù)測(cè)類算法證據(jù)、識(shí)別類算法證據(jù)和分析類算法證據(jù)。算法證據(jù)的司法適用存在三層風(fēng)險(xiǎn):對(duì)無罪推定和自由心證的沖擊;“概率近似正確(PAC)”理論下的事實(shí)認(rèn)定錯(cuò)誤性或歧視性問題;權(quán)力行使的隱化和異化趨勢(shì)。同時(shí)存在雙維困境:在實(shí)體困境維度,算法透明度和可解釋性、個(gè)人數(shù)據(jù)賦權(quán)與反算法身份歧視等手段難以實(shí)現(xiàn)對(duì)算法的有效規(guī)制和監(jiān)管,影響算法證據(jù)合理適用;在程序困境維度,數(shù)據(jù)選擇與算法設(shè)計(jì)監(jiān)督程序、結(jié)果告知與解釋程序以及異議或質(zhì)證程序的規(guī)則闕如,制約算法證據(jù)適用實(shí)效。對(duì)此,應(yīng)當(dāng)以事實(shí)認(rèn)定的輔助性、技術(shù)性正當(dāng)程序、比例原則作為算法證據(jù)司法適用的理念指引;依據(jù)算法證據(jù)生成流程,從數(shù)據(jù)可靠性、算法可靠性角度明確算法證據(jù)可靠性的具體要素;構(gòu)建取證、開示、質(zhì)證與認(rèn)證規(guī)則,強(qiáng)化算法證據(jù)適用的程序規(guī)制。
關(guān)鍵詞:算法證據(jù) 數(shù)字司法 證據(jù)可靠性 正當(dāng)程序 專門性問題報(bào)告
一、算法證據(jù)的提出:數(shù)字時(shí)代刑事證據(jù)制度的新發(fā)展
在數(shù)字時(shí)代,刑事證據(jù)制度面臨著前所未有的挑戰(zhàn)和變革。尤其是互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等技術(shù)的應(yīng)用對(duì)證據(jù)的形式和收集方式、證據(jù)的分析和解讀以及證據(jù)可靠性和有效性的審查判斷等提出了新的要求。例如,數(shù)字時(shí)代產(chǎn)生了包括電子郵件、社交媒體信息、數(shù)字交易記錄等在內(nèi)的大量電子數(shù)據(jù),這些數(shù)據(jù)往往具有非結(jié)構(gòu)化的形式,呈現(xiàn)多樣的內(nèi)部結(jié)構(gòu)與特征。一般情況下,司法通過利用數(shù)字技術(shù)對(duì)大數(shù)據(jù)材料進(jìn)行分析,實(shí)現(xiàn)大數(shù)據(jù)材料高效運(yùn)用的目的,但此類數(shù)字證據(jù)材料與傳統(tǒng)的物證和書證有著本質(zhì)的不同,在缺乏技術(shù)適用理性和程序規(guī)則指導(dǎo)的情況下,存在著司法認(rèn)知偏差與決策錯(cuò)誤的風(fēng)險(xiǎn)。因此,刑事證據(jù)制度必須適應(yīng)數(shù)字時(shí)代的發(fā)展,提供新的規(guī)則和方法來處理和評(píng)估這些證據(jù),以確保司法的現(xiàn)代化、科技化和公正性,提高司法效率和公信力。
在大數(shù)據(jù)和人工智能等數(shù)字技術(shù)的應(yīng)用中,算法是實(shí)現(xiàn)數(shù)據(jù)處理、模式識(shí)別、決策支持和自動(dòng)化等關(guān)鍵功能的核心。在大數(shù)據(jù)和人工智能等數(shù)字技術(shù)融入刑事司法的過程中,算法扮演著至關(guān)重要的角色。算法能夠有效地實(shí)現(xiàn)司法對(duì)大數(shù)據(jù)材料的運(yùn)用目的,關(guān)鍵在于其并不需要深入解析數(shù)據(jù)的內(nèi)在深層次含義,而是通過建立基于數(shù)據(jù)的概率統(tǒng)計(jì)模型來識(shí)別數(shù)據(jù)之間的客觀聯(lián)系,并據(jù)此進(jìn)行預(yù)測(cè)。這種方法能夠得出與人類利用高級(jí)認(rèn)知技術(shù)在相似情況下得出的結(jié)論相同或相近的結(jié)果。那么,如何認(rèn)識(shí)和界定算法對(duì)大數(shù)據(jù)材料分析結(jié)果的證據(jù)屬性與證據(jù)種類?對(duì)此,當(dāng)前刑事證據(jù)法學(xué)界較為流行“大數(shù)據(jù)證據(jù)”概念,也有學(xué)者提出了“人工智能證據(jù)”“算法證據(jù)”的觀點(diǎn)。在大數(shù)據(jù)時(shí)代,算法應(yīng)當(dāng)是相關(guān)數(shù)字證據(jù)的核心要素和主要規(guī)制對(duì)象。在處理和分析大數(shù)據(jù)時(shí),算法既能夠決定數(shù)據(jù)如何被解釋和應(yīng)用,還能夠影響證據(jù)的合法性和真實(shí)性。因此,對(duì)算法的有效規(guī)制和監(jiān)督是確保司法公正和數(shù)據(jù)利用合規(guī)的關(guān)鍵環(huán)節(jié),在刑事證據(jù)理論研究中,用算法證據(jù)對(duì)大數(shù)據(jù)證據(jù)、人工智能證據(jù)進(jìn)行界定較為科學(xué)。
在司法實(shí)踐中,對(duì)算法證據(jù)的適用還處于探索階段,其技術(shù)概念和具體規(guī)則的缺失,增加了司法審查運(yùn)用的難度。當(dāng)前針對(duì)算法證據(jù)的理論探討中,對(duì)算法本體的研究不足,以及對(duì)算法介入司法證明過程的邏輯、路徑與風(fēng)險(xiǎn)分析的充分性不夠,導(dǎo)致算法證據(jù)的研究成果無法充分反映算法技術(shù)與司法證明規(guī)則交融的實(shí)質(zhì)性,算法證據(jù)的司法適用建議也缺乏一定的實(shí)操性。為此,在互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等信息技術(shù)快速介入刑事司法的背景下,本文以算法證據(jù)為分析視角,明確刑事證據(jù)與司法證明制度轉(zhuǎn)型與發(fā)展的著力點(diǎn),重塑算法證據(jù)優(yōu)化適用的規(guī)則,以輔助司法辦案人員客觀準(zhǔn)確地認(rèn)定案件事實(shí),切實(shí)有效地推進(jìn)技術(shù)理性與司法理性的融合。
二、算法證據(jù)的匡正:證明路徑、證據(jù)屬性與證據(jù)類型
(一)算法的“人機(jī)交互”性與機(jī)器學(xué)習(xí)算法證據(jù)
目前尚無公認(rèn)的關(guān)于算法的定義,不過至少可從狹義、廣義和中義三種維度對(duì)算法進(jìn)行界分。從狹義角度看,算法被定義為用于解決某一類問題的一種明確的、機(jī)械的規(guī)則或過程,是運(yùn)行獨(dú)立于人腦的計(jì)算機(jī)系統(tǒng)的具體步驟或方法,即從問題的初始狀態(tài)開始,在合理的時(shí)間內(nèi),經(jīng)過有限次的運(yùn)算和判斷,最終達(dá)到問題的結(jié)束狀態(tài)。狹義的算法可被視為純粹的科學(xué)或技術(shù)。從廣義角度看,算法的本質(zhì)只是一種求解邏輯,無關(guān)于具體的適用領(lǐng)域,廣義的算法被寬泛地界定為所有決策程序或步驟,而不僅是與機(jī)器相關(guān)的自動(dòng)化決策。從中義角度看,算法則被界定為人類和機(jī)器交互的決策,即人類通過代碼設(shè)置、數(shù)據(jù)運(yùn)算與機(jī)器自動(dòng)化判斷進(jìn)行決策的一套機(jī)制。結(jié)合犯罪追訴與人權(quán)保障的司法情境,在算法證據(jù)的理論研究中,應(yīng)當(dāng)突出算法適用中“人”的作用,以深入理解算法的“人機(jī)交互”性(非中立性)與算法證據(jù)運(yùn)用的程序可規(guī)制性。
由于數(shù)字時(shí)代新技術(shù)的迅猛發(fā)展和現(xiàn)實(shí)需要,算法的“人機(jī)交互”性出現(xiàn)了“人主機(jī)輔”和“人輔機(jī)主”兩種情況,技術(shù)層面的算法規(guī)則構(gòu)建也相應(yīng)地呈現(xiàn)出兩種模式,即專家系統(tǒng)模式與機(jī)器學(xué)習(xí)模式。專家系統(tǒng)模式下的算法規(guī)則以人類的經(jīng)驗(yàn)和專門知識(shí)為基礎(chǔ),通過人類專家預(yù)先設(shè)定的編碼程序?qū)⑤斎霐?shù)據(jù)輸出為算法結(jié)果,其旨在建造能用于代替人類高級(jí)腦力勞動(dòng)的專家系統(tǒng)。DNA 比對(duì)、指紋比對(duì)等即是基于專家系統(tǒng)算法自動(dòng)化分析的結(jié)果。機(jī)器學(xué)習(xí)模式則是指計(jì)算機(jī)通過算法學(xué)習(xí)數(shù)據(jù)中隱藏的規(guī)律和信息,從而獲得新的經(jīng)驗(yàn)和知識(shí),便于計(jì)算機(jī)處理類似任務(wù)時(shí),能夠像人一樣思考與決策。這一過程對(duì)人類和其他生物而言稱為“生物學(xué)習(xí)”,對(duì)計(jì)算機(jī)而言稱為“機(jī)器學(xué)習(xí)”?!皺C(jī)器學(xué)習(xí)”既不按照人類預(yù)先編碼進(jìn)行數(shù)據(jù)分析運(yùn)算,也不是對(duì)人類設(shè)計(jì)的算法的簡(jiǎn)單運(yùn)用,而是能夠利用云服務(wù)器上收集、存儲(chǔ)與處理的海量數(shù)據(jù)集,不斷訓(xùn)練與優(yōu)化算法模型,自主性產(chǎn)生自己算法,以此解析數(shù)據(jù),并作出相關(guān)決策和預(yù)測(cè)。因此,較之一般自動(dòng)化決策算法,可將機(jī)器學(xué)習(xí)算法歸屬于自主自治的系統(tǒng)。面部識(shí)別、大規(guī)模監(jiān)控等技術(shù)手段所獲取的證據(jù)材料均為機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行分析后所產(chǎn)生的信息或結(jié)論。
當(dāng)前學(xué)界對(duì)專家系統(tǒng)模式與機(jī)器學(xué)習(xí)模式下的算法證據(jù)似乎僅作了籠統(tǒng)性研究,而未加以區(qū)分,如有學(xué)者認(rèn)為“算法證據(jù)主要指基于算法所產(chǎn)生的證據(jù),既包括案件過程中所產(chǎn)生的與大數(shù)據(jù)相關(guān)的算法,又可指通過算法對(duì)案內(nèi)外大數(shù)據(jù)進(jìn)行分析后所產(chǎn)生的證據(jù)”。以及“算法證據(jù)是將海量的案件信息數(shù)據(jù)進(jìn)行計(jì)算整合,形成結(jié)構(gòu)化和信息化的案件場(chǎng)景自動(dòng)解讀與自動(dòng)推理結(jié)果,強(qiáng)調(diào)算法證據(jù)由計(jì)算機(jī)算法程序和模型推導(dǎo)而來”。上述觀點(diǎn)具有一定的合理性,但其局限性也較為明顯。一方面,既弱化了事實(shí)認(rèn)定中算法的特殊作用,也模糊了算法之間的區(qū)別,難以依據(jù)不同算法技術(shù)的特點(diǎn),對(duì)傳統(tǒng)證據(jù)學(xué)框架下或證據(jù)法場(chǎng)域中的算法證據(jù)構(gòu)建實(shí)質(zhì)性的審查判斷規(guī)則;另一方面,有礙于結(jié)合算法技術(shù)等相關(guān)專業(yè)領(lǐng)域的研究成果,開展刑訴法領(lǐng)域中算法合理運(yùn)用的跨學(xué)科研究。
在刑事訴訟語(yǔ)境中,算法證據(jù)應(yīng)當(dāng)限于機(jī)器學(xué)習(xí)算法證據(jù),指的是機(jī)器學(xué)習(xí)模型對(duì)大數(shù)據(jù)進(jìn)行分析后所產(chǎn)生的信息或結(jié)論,在證明活動(dòng)中可能作為證據(jù)使用的材料。原因如下:一方面,算法獨(dú)立表達(dá)結(jié)果的證據(jù)理論研究需要。專家系統(tǒng)模式下的算法證據(jù)一般產(chǎn)生于實(shí)現(xiàn)固定功能的傳統(tǒng)計(jì)算機(jī)算法,數(shù)據(jù)分析內(nèi)容為算法規(guī)則預(yù)設(shè)的機(jī)械式輸出結(jié)果,輸出結(jié)果的創(chuàng)造性價(jià)值也主要來源于人而非機(jī)器,換言之,算法僅是對(duì)輸入數(shù)據(jù)元素的自動(dòng)整合或機(jī)械式調(diào)動(dòng),輸出結(jié)果并未體現(xiàn)出算法獨(dú)立表達(dá)能力,仍存在于算法設(shè)計(jì)者可期待范圍內(nèi)。因此,從證據(jù)的產(chǎn)生過程來看,此類算法證據(jù)可納入電子數(shù)據(jù)一列。在保障數(shù)據(jù)源可靠性的基礎(chǔ)上,對(duì)算法規(guī)則或編程指令的合理性予以檢驗(yàn)鑒定,以評(píng)估算法證據(jù)結(jié)果的有效性,這涉及電子數(shù)據(jù)鑒真問題。但機(jī)器學(xué)習(xí)算法具有自我編程、自我進(jìn)化的能力,這種獨(dú)立性與自主性是其智慧化的主要展現(xiàn)方式。這也就意味著,算法正由“工具”向“主體”跨越,此時(shí)的算法證據(jù)產(chǎn)生了不同于既有數(shù)據(jù)的新信息,如何認(rèn)識(shí)算法證據(jù)的事實(shí)認(rèn)定作用與方式,以及如何界定算法證據(jù)的法律屬性,亟待刑事證據(jù)理論予以回應(yīng)和更新。另一方面,處理龐大且復(fù)雜數(shù)據(jù)的刑事司法現(xiàn)實(shí)需要。數(shù)據(jù)要素是推動(dòng)刑事偵查與司法數(shù)字化轉(zhuǎn)型的重要?jiǎng)幽?,但刑事司法?shí)踐卻面臨著犯罪數(shù)據(jù)爆發(fā)式增長(zhǎng)與涉案信息海量集聚所蘊(yùn)藏的巨大證明價(jià)值難以挖掘的困境。例如,在網(wǎng)絡(luò)犯罪案件中,作為罪量評(píng)價(jià)的網(wǎng)絡(luò)動(dòng)態(tài)行為數(shù)據(jù)如點(diǎn)擊數(shù)、瀏覽數(shù)、轉(zhuǎn)發(fā)數(shù)等,無法簡(jiǎn)單直接用以對(duì)物理空間主體行為的刑法評(píng)價(jià),因?yàn)槲锢砜臻g行為與網(wǎng)絡(luò)空間行為存在互異的可能,難以辨析物理空間主體是否存在機(jī)刷數(shù)據(jù)等數(shù)據(jù)造假行為。對(duì)此,機(jī)器學(xué)習(xí)算法數(shù)據(jù)挖掘方法可適用于系統(tǒng)地分析大型數(shù)據(jù)集,如通過機(jī)器學(xué)習(xí)算法對(duì)物體、人和動(dòng)作進(jìn)行識(shí)別的“計(jì)算機(jī)視覺”方法,支持偵查活動(dòng)中的大數(shù)據(jù)分析工作,此時(shí)的算法識(shí)別結(jié)果經(jīng)嚴(yán)格審查后可作為證據(jù)使用。這與主要依賴于規(guī)則和事實(shí),對(duì)于處理需要?jiǎng)?chuàng)新和直覺的復(fù)雜問題能力有限的專家系統(tǒng)算法,在數(shù)據(jù)分析與推理功能方面有著本質(zhì)區(qū)別。
(二)機(jī)器學(xué)習(xí)算法輔助司法證明構(gòu)造及其證據(jù)屬性
1. 算法證明構(gòu)造論
證據(jù)是與案件事實(shí)相關(guān)的信息,是事實(shí)認(rèn)定的必要條件。證據(jù)對(duì)事實(shí)的證明路徑主要包括證明模式的選擇與證據(jù)推理和證明評(píng)價(jià)的推進(jìn)。(1)整體主義證明模式。整體主義證明模式與原子主義證明模式相對(duì),二者實(shí)際上是宏觀視角與微觀視角的關(guān)系。根據(jù)司法證明的原子主義模式,事實(shí)認(rèn)定的智力過程可以分解為獨(dú)立部分,證明力取決于個(gè)別存在的單個(gè)證據(jù)和離散式的系列推論,最終的事實(shí)認(rèn)定由彼此分離的證明力以某種疊加的方式聚合而成。但從算法證據(jù)事實(shí)認(rèn)定的內(nèi)部視角來看,算法通過分析和處理龐大且復(fù)雜的數(shù)據(jù)集,能夠從中提取有價(jià)值的信息、預(yù)測(cè)趨勢(shì),并形成算法事實(shí)信息。這一過程強(qiáng)調(diào)算法對(duì)數(shù)據(jù)之間相關(guān)關(guān)系立場(chǎng)的表述,而非對(duì)數(shù)據(jù)進(jìn)行全然解構(gòu)并對(duì)數(shù)據(jù)“項(xiàng)”進(jìn)行獨(dú)立的證明價(jià)值分析。因此,原子主義證明模式與大數(shù)據(jù)的數(shù)量特征和算法技術(shù)的運(yùn)行邏輯不相兼容。整體主義可以成為算法證明的模式選擇。整體主義證明模式主張一項(xiàng)材料的證明力源于所有已輸入信息材料之間的相互作用,單項(xiàng)證據(jù)自身的證明力,無法游離于證據(jù)的總體判斷。在算法證明中,其強(qiáng)調(diào)對(duì)大數(shù)據(jù)的整體評(píng)價(jià),通過數(shù)據(jù)結(jié)構(gòu)化的過程,揭示大數(shù)據(jù)與待證事實(shí)之間的相關(guān)性或因果關(guān)系。不過應(yīng)予以明確的是,證明模式的整體主義與原子主義均為證據(jù)評(píng)價(jià)與事實(shí)認(rèn)定的重要方式,整體主義證明模式的回歸僅是算法證明視域下的特殊意涵,將二者視為不可調(diào)和的或者相互排斥的觀點(diǎn)是錯(cuò)誤的。(2)證據(jù)推理。證據(jù)推理結(jié)構(gòu)主要依賴的是經(jīng)驗(yàn)和邏輯,如艾倫所主張的經(jīng)驗(yàn)推論模型、威格莫爾所強(qiáng)調(diào)的圖式體系,強(qiáng)調(diào)的是“證與待證”之間因果關(guān)系性質(zhì)的邏輯推演。但有學(xué)者認(rèn)為,在智慧司法中,算法對(duì)事實(shí)的證明模式將從“因果分析”發(fā)展到“關(guān)聯(lián)分析”,這種認(rèn)知存在一定的狹隘性。算法證明機(jī)理的核心在于對(duì)海量數(shù)據(jù)的收集和分析,側(cè)重基于數(shù)理的因果關(guān)系判斷,相關(guān)關(guān)系實(shí)際上是因果關(guān)系的派生。具體來說,利用機(jī)器學(xué)習(xí)和統(tǒng)計(jì)分析算法對(duì)涉案大數(shù)據(jù)進(jìn)行分析處理和測(cè)算推斷,可以識(shí)別數(shù)據(jù)中的異常點(diǎn)、趨勢(shì)線和相關(guān)性,揭示數(shù)據(jù)背后的規(guī)律性結(jié)論,為事實(shí)認(rèn)定提供科學(xué)依據(jù)。算法于其中發(fā)揮了兩種功用:其一,為推理創(chuàng)建基礎(chǔ)數(shù)據(jù)事實(shí)(算法證據(jù)事實(shí))。神經(jīng)網(wǎng)絡(luò)算法、決策樹算法、聚類算法等常用機(jī)器算法基于相關(guān)性對(duì)鏡像數(shù)據(jù)進(jìn)行關(guān)聯(lián)處理,產(chǎn)生相應(yīng)的算法證據(jù)事實(shí),這通常能夠揭示出數(shù)據(jù)背后隱藏的往往超出人類經(jīng)驗(yàn)和直覺范疇的深層次信息。其二,為推理提供基于大數(shù)據(jù)分析的經(jīng)驗(yàn)支持。有實(shí)證研究結(jié)果表明,同一犯罪構(gòu)成要件之下,個(gè)罪案件中的證據(jù)分布有一定的規(guī)律性。算法模型通過對(duì)司法實(shí)踐數(shù)據(jù)的廣泛抽取、存儲(chǔ)和分析處理,能夠歸納、整理出類罪犯罪構(gòu)成要件事實(shí)的類型數(shù)據(jù)庫(kù),并可以在深度學(xué)習(xí)算法驅(qū)動(dòng)下不斷予以自我優(yōu)化,從而為個(gè)案中證據(jù)性事實(shí)到次待證事實(shí)(構(gòu)成要件事實(shí))的推論提供算法經(jīng)驗(yàn)支持。程序性事實(shí)與量刑事實(shí)的算法證明同樣需要以大數(shù)據(jù)分析經(jīng)驗(yàn)作為推理的可信基礎(chǔ)。(3)證明評(píng)價(jià)。在證明評(píng)價(jià)層面,算法技術(shù)可以輔助校驗(yàn)證據(jù)標(biāo)準(zhǔn)和對(duì)證明力進(jìn)行科學(xué)的概率評(píng)價(jià),但依通說,證明對(duì)象范圍僅限于實(shí)體法事實(shí)和程序法事實(shí),此時(shí)的算法分析結(jié)論因是對(duì)證據(jù)事實(shí)的證明而并不屬于訴訟法學(xué)領(lǐng)域的證據(jù)范疇,因此限于文章主旨,本文對(duì)此不作闡述。
2. 算法證據(jù)屬性
目前理論界較為關(guān)注算法證據(jù)屬于何種證據(jù)種類以及如何加以規(guī)制的問題。有學(xué)者認(rèn)為當(dāng)前法定證據(jù)種類制度不夠周延,難以包含較為特殊的算法證據(jù),因此主張將算法證據(jù)完全獨(dú)立為一種新的法定證據(jù)種類。該觀點(diǎn)值得商榷。一方面,雖然我國(guó)刑事證據(jù)法學(xué)對(duì)證據(jù)種類采取了封閉式列舉的做法,但從縱向維度來看,這是基于我國(guó)基本訴訟國(guó)情的考慮,從橫向維度來看,在立法層面上證據(jù)種類法定化能夠成為其他證據(jù)規(guī)則設(shè)置或調(diào)整的邏輯起點(diǎn),具有一定的合理性和必要性。因此,客觀地說,算法證據(jù)“獨(dú)立”并不利于刑事證據(jù)制度的穩(wěn)定發(fā)展,甚至?xí)o司法裁判活動(dòng)帶來嚴(yán)重阻礙。另一方面,盡管較之傳統(tǒng)書證、物證等證據(jù),算法證據(jù)較為特殊,但這種特殊性主要體現(xiàn)在算法證據(jù)內(nèi)在的專業(yè)性、技術(shù)性原理,而這可以通過專家制度予以應(yīng)對(duì)。對(duì)此,在司法裁判中,許多法院已將算法分析的結(jié)論看成鑒定意見的證據(jù)形式。該觀點(diǎn)也不完全準(zhǔn)確。因?yàn)樗惴ǚ治鼋Y(jié)論并不屬于司法鑒定范圍。當(dāng)前,我國(guó)司法鑒定實(shí)行統(tǒng)一管理,僅包括法醫(yī)類、物證類、聲像資料、環(huán)境損害鑒定等“四大類”鑒定,算法分析結(jié)論并不在其列,無法稱之為鑒定意見,也無法全然參照鑒定意見加以審查認(rèn)定。
從證據(jù)運(yùn)用角度來看,算法證據(jù)應(yīng)屬于專門性問題報(bào)告。需要指出的是,針對(duì)主張算法證據(jù)獨(dú)立的學(xué)者所提出的“算法證據(jù)的生成過程與專門性問題報(bào)告之間存在一定差異。比如算法證據(jù)由算法生成,而非有專門知識(shí)的人所給出的意見”的觀點(diǎn),算法證據(jù)證明作用的發(fā)揮一般需經(jīng)多個(gè)環(huán)節(jié),包括數(shù)據(jù)收集與預(yù)處理、算法選擇與應(yīng)用、模型訓(xùn)練與優(yōu)化、結(jié)果分析與解釋以及證據(jù)整合與呈現(xiàn)等。實(shí)踐中,算法證據(jù)通常是以書面分析報(bào)告的形式向辦案人員說明數(shù)據(jù)來源、提取與算法規(guī)則的設(shè)計(jì)等內(nèi)容,這一過程需要有專門知識(shí)的人參與算法技術(shù)的運(yùn)行,以及利用專門性知識(shí)解讀算法分析結(jié)論,使最終結(jié)果可視化。這也是算法“人機(jī)交互”性的重要體現(xiàn)。因此,根據(jù)2021 年《最高人民法院關(guān)于適用〈中華人民共和國(guó)刑事訴訟法〉的解釋》第100 條“允許有專門知識(shí)的人就專門性問題出具的報(bào)告作為刑事證據(jù)使用”的規(guī)定,算法證據(jù)應(yīng)屬于專門性問題報(bào)告。
(三)機(jī)器學(xué)習(xí)算法證據(jù)的類型及其場(chǎng)景化適用
針對(duì)算法證據(jù)的類型,已有學(xué)者以大數(shù)據(jù)的來源為主要依據(jù),作了基于案內(nèi)大數(shù)據(jù)的算法證據(jù)與基于案外大數(shù)據(jù)的算法證據(jù)的界定。這種劃分標(biāo)準(zhǔn)有助于在一定程度上對(duì)算法證據(jù)的適用目的加以反映,但其屬于界分算法證據(jù)類型的形式標(biāo)準(zhǔn),不夠科學(xué)合理。應(yīng)當(dāng)遵循實(shí)質(zhì)標(biāo)準(zhǔn),結(jié)合算法的應(yīng)用場(chǎng)景、工作原理和輸出結(jié)果明晰算法證據(jù)的具體類型,包括預(yù)測(cè)類算法證據(jù)、識(shí)別類算法證據(jù)、分析類算法證據(jù)。采取此種實(shí)質(zhì)標(biāo)準(zhǔn),第一,有利于明確不同算法證據(jù)的證明方式和特點(diǎn),幫助辦案人員和法律專業(yè)人士更好地理解和處理這些證據(jù)。第二,有利于厘清相關(guān)算法司法治理活動(dòng)的對(duì)象與邊界,建立算法證據(jù)的標(biāo)準(zhǔn)化審查處理流程和評(píng)價(jià)體系,確保算法證據(jù)的運(yùn)用更加公正和合理。第三,有利于證據(jù)學(xué)、技術(shù)和計(jì)算機(jī)科學(xué)等多個(gè)領(lǐng)域知識(shí)的融合,提高司法透明度,增強(qiáng)算法證據(jù)的可信度。
1. 預(yù)測(cè)類算法證據(jù)
預(yù)測(cè)類算法證據(jù)通常指的是利用統(tǒng)計(jì)學(xué)技術(shù)、機(jī)器學(xué)習(xí)算法和復(fù)雜的預(yù)測(cè)模型對(duì)大數(shù)據(jù)進(jìn)行分析,以預(yù)測(cè)未來可能發(fā)生的事件、行為或結(jié)果的證據(jù)。在刑事司法系統(tǒng)中,預(yù)測(cè)類算法證據(jù)主要用作犯罪嫌疑人、被告人危險(xiǎn)性評(píng)估的材料,輔助辦案人員作出是否采取強(qiáng)制措施或采取何種強(qiáng)制措施、是否采取或解除強(qiáng)制醫(yī)療等程序性事實(shí)的評(píng)估和判斷。這些評(píng)估通?;诜缸锵右扇?、被告人的歷史記錄、犯罪類型和其他個(gè)人特征等。例如,當(dāng)前世界范圍內(nèi)已有超過200 種算法驅(qū)動(dòng)的風(fēng)險(xiǎn)評(píng)估工具被用于刑事司法和司法精神病領(lǐng)域,該類算法評(píng)估結(jié)果在某種意義上即可以歸屬于預(yù)測(cè)類算法證據(jù)。當(dāng)然,在預(yù)測(cè)性警務(wù)或者初查活動(dòng)中產(chǎn)生的算法證據(jù)材料也有可能會(huì)在后續(xù)刑事訴訟證明中作為定罪證據(jù)加以使用。
2. 識(shí)別類算法證據(jù)
識(shí)別類算法證據(jù)是指利用人工智能和機(jī)器學(xué)習(xí)技術(shù)對(duì)特定數(shù)據(jù)進(jìn)行分析、識(shí)別和篩選,以確定數(shù)據(jù)對(duì)象的身份或分類的證據(jù)。這類證據(jù)通常涉及圖像識(shí)別、語(yǔ)音識(shí)別、文本分析等領(lǐng)域,通過算法對(duì)輸入的數(shù)據(jù)進(jìn)行處理,從而識(shí)別出個(gè)體或?qū)?shù)據(jù)歸入特定的類別。例如,在刑事偵查領(lǐng)域通過運(yùn)用面部識(shí)別技術(shù)比對(duì)監(jiān)控視頻中的人臉與已知身份信息的面部數(shù)據(jù)來核查個(gè)體身份、追捕在逃人員、實(shí)時(shí)視頻監(jiān)控與確定受害人身份。
3. 分析類算法證據(jù)
分析類算法證據(jù)是指利用機(jī)器算法對(duì)大數(shù)據(jù)進(jìn)行深入分析,以揭示數(shù)據(jù)之間的關(guān)系、趨勢(shì)或模式,并據(jù)此提供對(duì)案件事實(shí)的解釋或推斷的證據(jù)。這類證據(jù)通常涉及復(fù)雜的數(shù)據(jù)處理技術(shù),如數(shù)據(jù)挖掘和統(tǒng)計(jì)分析等,旨在從數(shù)據(jù)中提取有價(jià)值的信息,輔助司法決策過程。分析類算法證據(jù)在刑事司法中的運(yùn)用主要體現(xiàn)在:其一,拓展事實(shí)認(rèn)定的范圍。通過分析案件相關(guān)的數(shù)據(jù)集,算法可以幫助辦案人員發(fā)現(xiàn)潛在的證據(jù)線索,如通過嫌疑人手機(jī)通信記錄進(jìn)行社會(huì)網(wǎng)絡(luò)關(guān)系分析,依據(jù)數(shù)據(jù)的聚類結(jié)構(gòu)來揭示嫌疑人之間以及嫌疑人與其他社會(huì)關(guān)系人之間的聯(lián)系。其二,促進(jìn)事實(shí)認(rèn)定的準(zhǔn)確性。機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)算法可以處理復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù),并從中提取有用信息。這使得司法機(jī)關(guān)能夠深入分析案件事實(shí),揭示隱藏在數(shù)據(jù)背后的規(guī)律和聯(lián)系。例如,運(yùn)用深度神經(jīng)網(wǎng)絡(luò)對(duì)相關(guān)數(shù)據(jù)特征進(jìn)行提取,發(fā)現(xiàn)犯罪組織的資金轉(zhuǎn)移規(guī)律。其三,輔助量刑事實(shí)的認(rèn)定。利用歷史判例和相關(guān)數(shù)據(jù),算法可以輔助法官在量刑時(shí)考慮各種因素,提供量刑建議,以實(shí)現(xiàn)量刑的公平公正。
三、算法證據(jù)的判識(shí):適用風(fēng)險(xiǎn)與困境
(一)算法證據(jù)的適用風(fēng)險(xiǎn)
1. 證明制度的沖擊:無罪推定與自由心證
無罪推定與自由心證是法治現(xiàn)代化國(guó)家的重要刑事司法證明規(guī)范和準(zhǔn)則。無罪推定在《世界人權(quán)宣言》第11(1)條即有規(guī)定:任何被控有違法行為、應(yīng)受處罰的人,在其經(jīng)公開審判、充分辯護(hù)并依法被證實(shí)有罪之前,應(yīng)當(dāng)視為無罪。自由心證則是探索事實(shí)真相的直覺感知模式,指法官通過證據(jù)自由評(píng)價(jià)實(shí)現(xiàn)從客觀確信至判決責(zé)任倫理的跨越。但“自由”并不意味著“隨意”,法官應(yīng)對(duì)各種證據(jù)進(jìn)行理性的批判性審查,確保其心證建立在對(duì)證據(jù)的充分審查基礎(chǔ)之上。總的來說,無罪推定是司法開啟法治思維的關(guān)鍵抓手,自由心證是司法良性發(fā)展的重要推手。算法證據(jù)作為智慧科技時(shí)代的訴訟產(chǎn)物,必須在無罪推定原則的框架內(nèi)適用,接受司法人員基于理性的邏輯判斷評(píng)價(jià),以保障被追訴人的合法權(quán)益。但有國(guó)外學(xué)者認(rèn)為,算法的預(yù)測(cè)性質(zhì)必然在不久的將來導(dǎo)致有罪推定。從實(shí)然性角度來看,算法證據(jù)的內(nèi)在特性與司法的不當(dāng)運(yùn)用確易使其成為無罪推定與自由心證的實(shí)現(xiàn)阻礙。具體而言,一方面,算法證據(jù)生成過程缺乏透明性。算法決策過程的“黑箱”特性可能導(dǎo)致司法人員和公眾無法充分理解算法處理數(shù)據(jù)的具體過程和邏輯。因此,司法人員難以全然根據(jù)自己的專業(yè)知識(shí)、經(jīng)驗(yàn)和邏輯推理能力,自由地評(píng)價(jià)和判斷算法證據(jù)。同時(shí),算法“黑箱”掩藏了算法證據(jù)對(duì)被追訴人可能的不利偏見,從而在一定程度上削弱了司法對(duì)無罪推定原則的尊重和執(zhí)行。另一方面,對(duì)算法證據(jù)事實(shí)的過分依賴。從本質(zhì)上來說,算法證據(jù)屬于一種基于新類型科技而生成的科學(xué)證據(jù),但在技術(shù)復(fù)雜性之下,證據(jù)事實(shí)的呈現(xiàn)缺乏了司法人員的親歷性,導(dǎo)致其內(nèi)在的心證過程難以被充分感知。在當(dāng)前科學(xué)證據(jù)審查規(guī)范缺乏、實(shí)質(zhì)審查難開展的訴訟狀況下,司法易出現(xiàn)過度依賴算法證據(jù),忽視案件中其他重要證據(jù)和人為因素的問題,進(jìn)而在證據(jù)審查不夠充分的情況下對(duì)被追訴人做出有罪推斷,違背了無罪推定原則和證據(jù)裁判原則。
2. 事實(shí)認(rèn)定的妨害:錯(cuò)誤性或歧視性
機(jī)器學(xué)習(xí)算法憑借強(qiáng)大的數(shù)據(jù)處理能力,能夠高效處理大量數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)中人類難以識(shí)別的模式和關(guān)聯(lián),從而輔助或替代人類進(jìn)行事實(shí)認(rèn)定。但機(jī)器學(xué)習(xí)作為一種從數(shù)據(jù)中學(xué)習(xí)的方法,不精確性和不確定性是其本質(zhì)特征。在計(jì)算機(jī)科學(xué)領(lǐng)域,“概率近似正確(PAC)”理論是機(jī)器學(xué)習(xí)算法的基本原理,能夠用于描述機(jī)器學(xué)習(xí)算法在給定數(shù)據(jù)集上的性能和泛化能力。PAC 原理提供了一個(gè)理論框架,用于分析和理解機(jī)器學(xué)習(xí)算法在面對(duì)未知數(shù)據(jù)時(shí)的行為,相應(yīng)地,算法的分析結(jié)果或者產(chǎn)生的假設(shè)存在“近似正確”與“可能正確”兩種表述。因此,在PAC 原理下,只能希望計(jì)算機(jī)基于某種學(xué)習(xí)算法學(xué)得的模型所對(duì)應(yīng)的假設(shè)盡可能接近目標(biāo)概念。這與司法人員裁決刑事案件事實(shí)要求達(dá)到嚴(yán)格證明標(biāo)準(zhǔn)的本質(zhì)相同。與人類對(duì)事實(shí)的判斷可能受到個(gè)人偏見、情緒和認(rèn)知偏差的影響,進(jìn)而可能導(dǎo)致事實(shí)認(rèn)定的不一致和不公正相似,算法分析結(jié)果也存在歧視甚至錯(cuò)誤的可能,例如美國(guó)法院所使用的COMPAS 自動(dòng)化決策算法被證實(shí)了對(duì)黑種人的系統(tǒng)性歧視,即較之于白種人,黑種人被認(rèn)定為具有更高犯罪風(fēng)險(xiǎn)的錯(cuò)誤率更大。這主要存在多方面原因,其一,數(shù)據(jù)質(zhì)量問題。數(shù)據(jù)可能包含噪聲、缺失值、不一致性或偏差,這些都會(huì)影響算法的分析結(jié)果。如果輸入數(shù)據(jù)或算法訓(xùn)練數(shù)據(jù)集不準(zhǔn)確或不完整,算法的輸出也很可能失真。其二,算法局限性。每個(gè)算法都有其適用的范圍和局限性,如果算法不適用于特定的數(shù)據(jù)集或問題類型,其分析結(jié)果可能不準(zhǔn)確。其三,模型過擬合。過擬合往往發(fā)生在模型過于復(fù)雜的情況下。當(dāng)算法模型過擬合時(shí),它會(huì)試圖通過記憶訓(xùn)練數(shù)據(jù)來達(dá)到更高的準(zhǔn)確率,而非從數(shù)據(jù)中學(xué)習(xí)基本的模式和規(guī)律,這就意味著模型無法泛化到新的數(shù)據(jù)集上,進(jìn)而導(dǎo)致算法在實(shí)際應(yīng)用中的錯(cuò)誤。其四,參數(shù)設(shè)置不當(dāng)。算法的性能很大程度上取決于參數(shù)的選擇,如果參數(shù)沒有經(jīng)過適當(dāng)?shù)恼{(diào)整,或者不公平、不準(zhǔn)確的歷史數(shù)據(jù)沒有被及時(shí)地剔除,在機(jī)器算法的持續(xù)擬合和泛化過程中,這類數(shù)據(jù)將逐漸轉(zhuǎn)化為決策參數(shù),并被應(yīng)用于隨后的分析活動(dòng)中,那么就可能會(huì)導(dǎo)致不理想的算法分析結(jié)果。此外,人類活動(dòng)因素與算法的“黑箱”特性也于其中發(fā)揮了重要作用。
3. 權(quán)力行使的趨勢(shì):隱化與異化
算法證據(jù)的適用所帶來的公權(quán)力隱化與異化的問題可以放置在算法證據(jù)的生成過程中加以認(rèn)識(shí)和理解。(1)算法證據(jù)生成的權(quán)力背景。刑事司法中的算法應(yīng)用呈現(xiàn)出一種顯著的“國(guó)家推進(jìn)主義”色彩,全程由官方主導(dǎo)推進(jìn),算法證據(jù)生成過程隱含于權(quán)力運(yùn)行之中,嚴(yán)重缺乏透明性。例如從偵查取證視角來看,在利用算法技術(shù)取證的過程中,公安機(jī)關(guān)作為算法技術(shù)使用者與科技企業(yè)作為算法設(shè)計(jì)者之間本應(yīng)分離,但為了提高偵查效率,通常雙方會(huì)共同在公安機(jī)關(guān)的辦公區(qū)域設(shè)立數(shù)據(jù)實(shí)驗(yàn)室,以便在各種實(shí)際場(chǎng)景中構(gòu)建和優(yōu)化算法模型。這種合作模式增強(qiáng)了公安機(jī)關(guān)在技術(shù)應(yīng)用方面的優(yōu)勢(shì)地位,并在一定程度上形成了技術(shù)使用的“偵查中心主義”。(2)數(shù)據(jù)收集與使用。由于機(jī)器學(xué)習(xí)技術(shù)可用于將看似無關(guān)的信息聯(lián)系在一起,因此任何人類行為都可以有效地對(duì)其數(shù)字表示作出積極或消極的貢獻(xiàn)。算法證據(jù)的生成首先依賴于對(duì)大量數(shù)字?jǐn)?shù)據(jù)的收集和存儲(chǔ)。這些數(shù)據(jù)可能來源于不同的渠道,如社交媒體、傳感器、監(jiān)控設(shè)備、在線交易記錄等,從而可能導(dǎo)致個(gè)人隱私的泄露。并且通過利用數(shù)據(jù)挖掘和比對(duì)技術(shù),算法還能夠揭示出那些傳統(tǒng)人力分析方法難以發(fā)現(xiàn)的數(shù)據(jù)關(guān)聯(lián)性,進(jìn)而深入挖掘出超越原始數(shù)據(jù)內(nèi)容的數(shù)據(jù)信息,這可能進(jìn)一步觸及到個(gè)人隱私的敏感領(lǐng)域。而對(duì)個(gè)人數(shù)據(jù)的收集、使用卻基本不會(huì)告知數(shù)據(jù)權(quán)人。(3)算法模型及其分析結(jié)果。算法模型可能會(huì)因?yàn)闄?quán)力者的偏見、數(shù)據(jù)集中的不平衡或歷史數(shù)據(jù)的不完整性而表現(xiàn)出不公正性,這種不公正性可能針對(duì)性別、年齡、教育程度、職業(yè)情況等,但由于缺乏監(jiān)督和問責(zé)機(jī)制,使得算法模型及其基于數(shù)據(jù)相關(guān)性對(duì)人類行為的預(yù)測(cè)、識(shí)別和分析結(jié)果難以受到質(zhì)疑和糾正,司法辦案人員對(duì)算法分析結(jié)果的把關(guān)也就演變成了對(duì)結(jié)果的確認(rèn),從而產(chǎn)生了權(quán)力濫用和異化的風(fēng)險(xiǎn)。
(二)算法證據(jù)適用的實(shí)體困境
刑事司法中算法證據(jù)的適用存在諸多風(fēng)險(xiǎn),這與“算法”難以規(guī)制和監(jiān)管直接相關(guān)。當(dāng)前針對(duì)算法規(guī)制和監(jiān)管的手段主要分為算法公開、個(gè)人數(shù)據(jù)賦權(quán)與反算法歧視三種。國(guó)外有關(guān)政策制定者和學(xué)者也較為推崇將算法的透明度和可解釋性(可等同于算法公開手段)作為關(guān)鍵的算法監(jiān)管準(zhǔn)則。不過,在刑事訴訟場(chǎng)域中,通過上述手段實(shí)現(xiàn)對(duì)算法的規(guī)制和監(jiān)管仍缺乏一定的有效性。
1. 算法透明度和可解釋性
算法透明度和可解釋性是指在進(jìn)行數(shù)據(jù)的搜集、處理、分析和應(yīng)用過程中,算法的運(yùn)營(yíng)者需向數(shù)據(jù)的所有者和使用者等披露和解釋算法的運(yùn)作機(jī)制和計(jì)算原理,并提供關(guān)于算法應(yīng)用的目的和可能帶來的結(jié)果等重要信息。然而,一方面,由于機(jī)器學(xué)習(xí)算法技術(shù)已發(fā)展到能夠自我設(shè)計(jì)和自我演化的階段,因此,即便算法對(duì)外公開,也可能已經(jīng)歷了更新變化;并且“算法透明≠算法可知”,算法的可解釋性同樣面臨著技術(shù)挑戰(zhàn),因?yàn)闄C(jī)器學(xué)習(xí)算法采用的高維度特征優(yōu)化技術(shù)與人類的邏輯推理和語(yǔ)義解釋活動(dòng)在思維和方法上存在本質(zhì)差異,這使得用常規(guī)的語(yǔ)義表達(dá)方式來闡釋算法變得更困難,更遑論訴訟中作為普通公眾的被追訴人對(duì)此能夠完全理解。另一方面,算法作為一個(gè)整體系統(tǒng),其設(shè)計(jì)不僅涉及程序本身的構(gòu)建,還包括對(duì)數(shù)據(jù)輸入、預(yù)期用途和實(shí)際應(yīng)用環(huán)境的深思熟慮。這意味著,僅僅披露算法本身并不足以完全消除其濫用的風(fēng)險(xiǎn),例如,通過有偏差的數(shù)據(jù)輸入,同樣可以實(shí)現(xiàn)對(duì)算法的操控。
2. 個(gè)人數(shù)據(jù)賦權(quán)
作為算法監(jiān)管策略,個(gè)人數(shù)據(jù)賦權(quán)側(cè)重于對(duì)算法的基礎(chǔ)資源——數(shù)據(jù)本身的監(jiān)管。其旨在通過立法手段,增強(qiáng)個(gè)人在數(shù)據(jù)創(chuàng)新方面的權(quán)利,并通過提升個(gè)體對(duì)于算法數(shù)據(jù)收集、處理和使用過程的了解和控制能力,從而有效防止算法的不當(dāng)使用對(duì)個(gè)人造成的潛在損害或風(fēng)險(xiǎn)。但其實(shí)際效果可能并不理想。其一,立法不足。當(dāng)前,刑事司法領(lǐng)域并未就個(gè)人數(shù)據(jù)權(quán)益進(jìn)行專門性立法,其所存在的一些涉及個(gè)人數(shù)據(jù)權(quán)益的法律或規(guī)范性文件的規(guī)定較為離散,提供的保護(hù)程度不夠,難以實(shí)現(xiàn)對(duì)個(gè)人數(shù)據(jù)的實(shí)質(zhì)性賦權(quán)。雖然《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》在更廣泛的層面上對(duì)網(wǎng)絡(luò)環(huán)境下的個(gè)人數(shù)據(jù)權(quán)益保護(hù)進(jìn)行了規(guī)定,但并未明確涉及刑事訴訟過程中的相關(guān)保護(hù)措施。其二,行權(quán)阻礙。一方面,由于受到能力、資質(zhì)以及成本效益等因素的影響,數(shù)據(jù)主體未必能夠合理行使數(shù)據(jù)權(quán)。另一方面,面對(duì)算法的不透明性,即使數(shù)據(jù)權(quán)主體意識(shí)到可能遭受算法濫用的風(fēng)險(xiǎn),也難以提出有效的辯駁。即便算法對(duì)外公開,數(shù)據(jù)權(quán)主體仍可能缺乏必要的專業(yè)知識(shí)和對(duì)算法深入理解的能力,數(shù)據(jù)的控制權(quán)依然主要集中于司法權(quán)力者手中。
3. 反算法身份歧視
在刑事訴訟中,反算法歧視意指反算法身份歧視,其主要聚焦于禁止基于算法收集數(shù)據(jù)主體的個(gè)人特征信息,如種族、宗教信仰和性別等,以預(yù)防算法在自動(dòng)化的數(shù)據(jù)分析或預(yù)測(cè)過程中,導(dǎo)致個(gè)體面臨不公平的對(duì)待或遭受惡意的歧視,即便這些數(shù)據(jù)所反映的身份歧視可能是無意識(shí)的。雖然該規(guī)制手段具有一定的理論意義,但是實(shí)效有限,主要原因在于:(1)關(guān)聯(lián)數(shù)據(jù)。以美國(guó)威斯康星州訴盧米斯案(Statev.Loomis)中的算法量刑結(jié)果歧視問題為例,在盧米斯案中,法官承認(rèn)COMPAS 算法存在種族歧視問題,導(dǎo)致黑人群體被錯(cuò)誤地標(biāo)記為具有較高犯罪風(fēng)險(xiǎn)。盡管COMPAS 算法并未將“種族”直接納入其計(jì)算過程中,但它卻通過考慮如犯罪記錄、居住地信息、教育背景和職業(yè)經(jīng)歷等其他信息數(shù)據(jù),間接地反映出算法評(píng)估對(duì)象的種族屬性。因此,對(duì)于算法模型而言,即便在初始數(shù)據(jù)輸入階段完全排除了種族、性別、膚色等身份歧視屬性數(shù)據(jù),機(jī)器學(xué)習(xí)算法依然能夠通過其他相關(guān)聯(lián)的數(shù)據(jù),隱蔽地傳達(dá)出歧視性意圖,并產(chǎn)生歧視性的結(jié)果。(2)目的指向。算法分析目的是算法運(yùn)行的指向,算法歧視可能附隨于算法分析目的之中,例如出于國(guó)家安全和機(jī)場(chǎng)安檢效率考慮,全球大部分國(guó)際機(jī)場(chǎng)均實(shí)施了選擇性安檢措施,即在標(biāo)準(zhǔn)安檢程序以外,針對(duì)特定群體執(zhí)行更為嚴(yán)格而復(fù)雜的檢查,以篩查出恐怖分子等潛在犯罪人員。(3)歷史歧視。歷史歧視是個(gè)人無意識(shí)的社會(huì)認(rèn)知,即便刪除算法中可能導(dǎo)致歧視性的數(shù)據(jù)變量,事實(shí)認(rèn)定者仍可能依據(jù)算法證據(jù)信息對(duì)部分群體施以不公平的對(duì)待,而且這種歧視現(xiàn)象可能比使用算法進(jìn)行決策或輔助決策的情況更為廣泛。
(三)算法證據(jù)適用的程序困境
從算法證據(jù)適用的實(shí)體困境來看,算法規(guī)制和監(jiān)管實(shí)效不彰的原因在一定程度上存在于司法權(quán)力者或者算法設(shè)計(jì)者、使用者的主體主觀層面,而非純粹的算法適用不能。因此,面對(duì)算法證據(jù)適用的實(shí)體困境,不能采取放任或默許的態(tài)度,而應(yīng)在法律維度設(shè)計(jì)具有應(yīng)用限制和技術(shù)引導(dǎo)作用的正當(dāng)化程序,減少主觀意識(shí)及其它局限對(duì)算法證據(jù)結(jié)果正義的影響。當(dāng)前算法證據(jù)的收集與審查運(yùn)用程序尚處于規(guī)則真空狀態(tài),難以切實(shí)地保障算法證據(jù)適用的合理性、可靠性。具體體現(xiàn)在以下三個(gè)方面。
1. 數(shù)據(jù)選擇與算法設(shè)計(jì)監(jiān)督程序
在實(shí)踐中,算法需要通過分析大量數(shù)據(jù)來確定“特定輸入與特定輸出之間的關(guān)系”,實(shí)現(xiàn)算法分析任務(wù),完成從設(shè)計(jì)成型到解決具體問題的轉(zhuǎn)變。這一過程可稱之為算法證據(jù)收集的前置程序。在此前置程序中,應(yīng)當(dāng)保證算法設(shè)計(jì)所需的訓(xùn)練、驗(yàn)證和測(cè)試數(shù)據(jù)集具備相關(guān)性和代表性,以更切實(shí)地實(shí)現(xiàn)算法運(yùn)用的預(yù)期目的。但由于當(dāng)前算法技術(shù)使用的“偵查中心主義”,算法證據(jù)收集的前置程序缺乏外部監(jiān)督,呈現(xiàn)出封閉性的特征,進(jìn)而增加了審查數(shù)據(jù)集選擇、存儲(chǔ)、傳輸和處理過程是否符合《數(shù)據(jù)安全法》等相關(guān)法律法規(guī)要求的難度,降低了算法的透明度。當(dāng)然,國(guó)家公共利益或偵查秘密原則或許能夠成為算法證據(jù)收集前置程序封閉的理由,但算法的技術(shù)性、復(fù)雜性以及算法證據(jù)適用的實(shí)際風(fēng)險(xiǎn),決定了其與傳統(tǒng)證據(jù)的收集存在著實(shí)質(zhì)差異。因此,在數(shù)字時(shí)代背景下,更應(yīng)當(dāng)關(guān)注的是偵查程序的轉(zhuǎn)型與價(jià)值革新,而非絕對(duì)的偵查秘密原則。
2. 結(jié)果告知與解釋程序
司法程序的核心是公正和透明,而公正和透明的關(guān)鍵在于司法人員對(duì)程序結(jié)果的告知和解釋,這是被追訴人知情權(quán)的應(yīng)有之義。算法證據(jù)作為技術(shù)與法律結(jié)合的產(chǎn)物,其專業(yè)性是被追訴人所難以理解的,強(qiáng)調(diào)對(duì)算法證據(jù)事實(shí)的解釋與說明,有利于被追訴人權(quán)利保障的充分性和有效性,否則,被追訴人將因此陷入知情難、辯護(hù)難的境地。此外,算法證據(jù)的特殊性決定了被追訴人應(yīng)及時(shí)知悉并獲取算法證據(jù)事實(shí)信息,以消解算法技術(shù)適用所帶來的權(quán)利侵害。但同時(shí)算法證據(jù)結(jié)果的告知與解釋也可能帶來一定的訴訟妨害,因此為兼顧案件辦理的順利性,在特殊情況下,可對(duì)被追訴人算法證據(jù)知情權(quán)予以適當(dāng)限制,但在條件允許時(shí),應(yīng)當(dāng)及時(shí)告知與解釋算法證據(jù)事實(shí)??傮w而言,針對(duì)算法證據(jù)事實(shí)的告知與解釋問題,目前尚存在理論架構(gòu)與司法實(shí)現(xiàn)之間的程序鴻溝。(1)算法證據(jù)結(jié)果的告知程序。根據(jù)《刑事訴訟法》第148 條的規(guī)定,偵查機(jī)關(guān)應(yīng)當(dāng)將用作證據(jù)的鑒定意見告知犯罪嫌疑人、被害人。算法證據(jù)作為專門性問題報(bào)告,而非鑒定意見,是否可以適用前述規(guī)定并不明確。即便可以參照適用該條規(guī)定,由于規(guī)定過于寬泛化,如告知的時(shí)間、方式等并無說明,且缺乏對(duì)證據(jù)結(jié)果進(jìn)行輔助解釋的要求,因此難以達(dá)到被追訴人知情權(quán)的預(yù)期權(quán)利效果。(2)程序性算法證據(jù)結(jié)果的告知與解釋程序。立法層面缺乏對(duì)程序性算法證據(jù)結(jié)果告知與解釋的有效程序設(shè)計(jì)。雖然我國(guó)近年來已逐步試點(diǎn)使用算法評(píng)估系統(tǒng)量化評(píng)估逮捕社會(huì)危險(xiǎn)性,但對(duì)于算法證據(jù)結(jié)果的說理性不夠,評(píng)估程序較為形式化。(3)實(shí)體性算法證據(jù)結(jié)果的告知與解釋程序。被追訴人實(shí)現(xiàn)其算法證據(jù)知情權(quán)似乎還可以《刑事訴訟法》第40 條有關(guān)閱卷權(quán)的規(guī)定為依據(jù),但仍存在如下程序障礙:其一,知情權(quán)主體?!缎淌略V訟法》第40 條僅規(guī)定了辯護(hù)人的閱卷權(quán),被追訴人能否查閱包括算法證據(jù)在內(nèi)的案卷材料尚處于法律爭(zhēng)議狀態(tài)。其二,知情時(shí)間?!缎淌略V訟法》第40 條僅將閱卷的起始時(shí)間限定為案件審查起訴之日,這不僅與算法證據(jù)產(chǎn)生時(shí)間的多元性(如人臉識(shí)別算法證據(jù)產(chǎn)生于偵查環(huán)節(jié)、量刑算法證據(jù)則可能產(chǎn)生于審判環(huán)節(jié))相沖突,也可能違背了算法證據(jù)知情的及時(shí)性要求。雖然《刑事訴訟法》第38 條規(guī)定了辯護(hù)律師在偵查期間可以向偵查機(jī)關(guān)了解犯罪嫌疑人涉嫌的罪名和案件有關(guān)情況,提出意見,但根據(jù)《公安機(jī)關(guān)辦理刑事案件程序規(guī)定》第50 條的規(guī)定,“案件有關(guān)情況”應(yīng)當(dāng)包括當(dāng)時(shí)已查明的該罪的主要事實(shí),犯罪嫌疑人被采取、變更、解除強(qiáng)制措施以及延長(zhǎng)偵查羈押期限等情況,而在案證據(jù)包括算法證據(jù)并不屬于“案件有關(guān)情況”,不在證據(jù)開示范圍內(nèi)。其三,知情方式。一方面,從一定意義上來說,閱卷僅為辯方對(duì)證據(jù)事實(shí)信息的被動(dòng)知曉,這與司法辦案人員對(duì)算法證據(jù)事實(shí)的主動(dòng)告知要求存在質(zhì)的區(qū)別;另一方面,閱卷權(quán)內(nèi)容并未直接體現(xiàn)出司法辦案機(jī)關(guān)對(duì)證據(jù)事實(shí)的解釋或加重解釋義務(wù),這與算法證據(jù)的說理解釋性適用不相適配。當(dāng)然,根據(jù)司法解釋的規(guī)定,偵查人員、技術(shù)人員或?qū)<易C人可以出庭參與訴訟,對(duì)算法證據(jù)的生成與適用作出闡釋和說明,但這可能變相違背了被追訴人算法證據(jù)知情權(quán)的及時(shí)性要求,也不利于將被追訴人置于辯解與辯護(hù)的優(yōu)勢(shì)地位,實(shí)現(xiàn)控辯平等對(duì)抗。
3. 異議或質(zhì)證程序
對(duì)于算法證據(jù)結(jié)果,被追訴人有權(quán)提出異議,并要求相關(guān)人員對(duì)可能存在的問題進(jìn)行解釋和澄清,異議內(nèi)容包括但不限于數(shù)據(jù)收集的過程、數(shù)據(jù)處理的方法、分析所用的算法以及算法證據(jù)的可靠性。推動(dòng)落實(shí)算法證據(jù)異議權(quán)是維護(hù)司法公正和保障被追訴人合法權(quán)益的必然要求,有利于促進(jìn)算法技術(shù)應(yīng)用的科學(xué)性和嚴(yán)謹(jǐn)性,確保算法分析結(jié)果的公正性和合理性。當(dāng)前對(duì)算法證據(jù)提出異議或質(zhì)證的程序性規(guī)則缺位問題較為突出,尤其是對(duì)于部分程序性算法證據(jù)事實(shí)而言,由于缺乏兩造平等對(duì)抗的程序性構(gòu)造,嚴(yán)格的質(zhì)證活動(dòng)難以開展,增加了算法證據(jù)事實(shí)不確定性的可能。不過,即便對(duì)算法證據(jù)開展質(zhì)證程序,仍可能存在程序?qū)嵸|(zhì)性不夠的問題。原因在于,一方面,質(zhì)證程序的強(qiáng)職權(quán)主義色彩。雖然我國(guó)正在積極探索引入對(duì)抗式庭審模式的合理做法作為司法改革的重要方向,但由于長(zhǎng)期受到職權(quán)主義訴訟模式的影響,加之諸如證人出庭作證和證據(jù)展示等相關(guān)制度尚未完備,當(dāng)前質(zhì)證程序仍具有明顯的職權(quán)主義色彩。司法人員在質(zhì)證過程中發(fā)揮著絕對(duì)的主導(dǎo)作用,決定著質(zhì)證程序的啟動(dòng)、進(jìn)行及終結(jié)。另一方面,算法證據(jù)的形式性審查。作為專門性問題報(bào)告的算法證據(jù),對(duì)其審查與運(yùn)用主要參照鑒定意見進(jìn)行。在司法質(zhì)證實(shí)踐中,控辯雙方很少會(huì)對(duì)鑒定意見背后的科學(xué)原理提出質(zhì)疑,司法人員針對(duì)鑒定意見的審查也主要是一種對(duì)外在表象的審查,即主要根據(jù)鑒定人員資格、鑒定意見形式、專門性知識(shí)在專業(yè)內(nèi)的接受程度等這些外在形式,推測(cè)專門性意見的可靠程度,而基本上不對(duì)鑒定意見進(jìn)行實(shí)質(zhì)審查。
四、算法證據(jù)的重述:適用理念與規(guī)則
(一)算法證據(jù)適用的理念先行
1. 事實(shí)認(rèn)定的輔助性
機(jī)器算法能夠依據(jù)外部環(huán)境的反饋進(jìn)行自我動(dòng)態(tài)調(diào)整,使得其結(jié)果輸出帶有一定的不確定性。這種不確定性決定了算法證據(jù)在事實(shí)認(rèn)定過程中的輔助性地位。“輔助性”包含三層含義:其一,尊重人的主體性。維護(hù)人類在司法決策中的主體角色,確保算法證據(jù)對(duì)事實(shí)的認(rèn)定僅為輔助而非主導(dǎo)作用,以防止可能隱藏在算法證據(jù)中的“認(rèn)知偏見”等不公正因素對(duì)事實(shí)認(rèn)定產(chǎn)生負(fù)面效應(yīng)。例如在網(wǎng)絡(luò)犯意證明中,算法證據(jù)對(duì)主觀方面的證明應(yīng)當(dāng)是初步的、參考性的,其重要作用在于證據(jù)指引或事實(shí)驗(yàn)證。至于算法證據(jù)的證據(jù)能力和證明力的實(shí)質(zhì)性評(píng)估問題,則需由司法人員依據(jù)法律規(guī)定、經(jīng)驗(yàn)法則等價(jià)值標(biāo)準(zhǔn)進(jìn)行綜合判斷。其二,算法證據(jù)不宜單獨(dú)作為事實(shí)認(rèn)定的依據(jù)。一方面,當(dāng)算法證據(jù)為間接證據(jù)或僅能夠證明中間事實(shí)時(shí),其需要結(jié)合其他證據(jù)或其他幾組證據(jù)對(duì)事實(shí)加以認(rèn)定;另一方面,如果強(qiáng)調(diào)算法證據(jù)對(duì)待證事實(shí)的單獨(dú)直接證明作用,則可能導(dǎo)致司法人員對(duì)算法證據(jù)的過度依賴,進(jìn)而會(huì)忽視其他類型的證據(jù)和傳統(tǒng)的事實(shí)調(diào)查方法,并最終影響對(duì)案件事實(shí)的全面性和多角度的考量。其三,算法證據(jù)事實(shí)的可推翻性。算法證據(jù)事實(shí)僅具有參考性,可以被司法人員在給出適當(dāng)理由后予以推翻。當(dāng)前,已有部分地區(qū)如上海、貴州在刑事司法中探索使用集多項(xiàng)技術(shù)于一體的人工智能輔助系統(tǒng)。以上?!靶淌掳讣悄茌o助辦案系統(tǒng)”(又稱“206 工程”)為例,該系統(tǒng)有別于依賴知識(shí)庫(kù)的傳統(tǒng)專家系統(tǒng),其通過機(jī)器學(xué)習(xí)算法,在龐大的數(shù)據(jù)集輔助下進(jìn)行持續(xù)的學(xué)習(xí)與訓(xùn)練,以此實(shí)現(xiàn)功能的持續(xù)迭代和優(yōu)化,發(fā)揮著社會(huì)危險(xiǎn)性評(píng)估、量刑輔助等功能。未來在算法證據(jù)適用過程中,應(yīng)當(dāng)進(jìn)一步規(guī)范算法證據(jù)的適用場(chǎng)域,重申其對(duì)事實(shí)認(rèn)定的輔助性作用。
2. 技術(shù)性正當(dāng)程序
證據(jù)的收集與適用應(yīng)當(dāng)遵循正當(dāng)程序原則。算法證據(jù)的適用能夠極大地提高事實(shí)認(rèn)定的效率,但其同時(shí)給司法公正性帶來了沖擊。就我國(guó)司法制度發(fā)展的基本方向來看,首先應(yīng)當(dāng)強(qiáng)調(diào)建立一套公正司法的程序機(jī)制,然后才能在司法公正的前提下追求訴訟效率。在當(dāng)前數(shù)字技術(shù)高速發(fā)展的態(tài)勢(shì)下,公正司法的程序機(jī)制構(gòu)建還應(yīng)當(dāng)結(jié)合時(shí)代特色尋求新發(fā)展??梢钥紤]將融合技術(shù)適用特點(diǎn)作為構(gòu)建公正司法程序機(jī)制的重要著力點(diǎn)。對(duì)此,美國(guó)學(xué)者丹尼爾·西特倫(Danielle Citron)提出了“技術(shù)性正當(dāng)程序”理念,具體包括,其一,確保結(jié)果告知的實(shí)質(zhì)性。算法系統(tǒng)應(yīng)當(dāng)具備審計(jì)跟蹤(audit trails)的功能,記錄支持其決策的事實(shí)和規(guī)則,以提高算法運(yùn)行的透明度,確保算法運(yùn)行結(jié)果告知的實(shí)質(zhì)性。其二,聽證。一方面,調(diào)整Mathews 標(biāo)準(zhǔn)。Mathews v. Eldridge 案中的成本效益分析方法被用于判斷被追訴人在生命、自由或財(cái)產(chǎn)受到威脅時(shí)應(yīng)否享有正當(dāng)程序聽證權(quán)。傳統(tǒng)的Mathews 測(cè)試標(biāo)準(zhǔn)主要考慮了三個(gè)因素:個(gè)人利益的價(jià)值、額外或替代程序的可能收益,以及政府為此付出的成本,包括額外保障措施的成本。然而,在技術(shù)深度嵌入司法的背景下,應(yīng)以更現(xiàn)實(shí)的方式如比較錯(cuò)誤糾正措施的固定成本與未來收益、算法系統(tǒng)的特性、專家證言的價(jià)值等,判斷是否對(duì)在算法自動(dòng)化決策中發(fā)現(xiàn)的錯(cuò)誤進(jìn)行聽證。另一方面,聽證官員應(yīng)詳細(xì)說明算法系統(tǒng)決策的理由。其三,制定透明度和問責(zé)性規(guī)則,包括公開算法系統(tǒng)的源代碼、測(cè)試系統(tǒng)軟件以及允許公眾參與算法系統(tǒng)的構(gòu)建。“技術(shù)性正當(dāng)程序”理念可為我國(guó)刑事司法中算法證據(jù)適用的程序機(jī)制構(gòu)建提供一定的方向指導(dǎo)和方法借鑒。不過從根本意義上來說,在技術(shù)與司法的交融中,只有將人的主體性以及對(duì)人性尊嚴(yán)的尊重置于司法程序開展的底層邏輯之中,正當(dāng)程序理念才能在算法技術(shù)及其結(jié)果的適用中得以落實(shí)。
3. 比例原則
刑事算法證據(jù)的合理適用,以算法技術(shù)的有效規(guī)制為前提。算法技術(shù)的適用風(fēng)險(xiǎn)在刑事偵查包括預(yù)測(cè)性偵查中較為突出。應(yīng)當(dāng)在偵查活動(dòng)中落實(shí)比例原則,這是貫徹偵查理性的重要標(biāo)志。比例原則包含適合性原則、必要性原則與相稱性原則。其中,相稱性原則是對(duì)“目的—手段”實(shí)質(zhì)權(quán)衡最為直接的方法。作為偵查手段,算法技術(shù)的適用也應(yīng)符合比例原則的要求。其一,算法技術(shù)適用前,應(yīng)當(dāng)根據(jù)比例原則對(duì)算法取證措施進(jìn)行嚴(yán)格審查,判斷司法辦案人員是否存在違反適當(dāng)性和必要性的要求,確保手段的負(fù)面影響不會(huì)超過預(yù)期的偵查效果。其二,算法技術(shù)適用時(shí),比例原則強(qiáng)調(diào)在追求公共利益的同時(shí),應(yīng)盡量減少對(duì)個(gè)人權(quán)利的侵犯,確保個(gè)人權(quán)利得到應(yīng)有的尊重和保護(hù)。為此,一方面需要加強(qiáng)個(gè)人數(shù)據(jù)的刑事立法保護(hù),另一方面還應(yīng)以權(quán)利受侵損最小化、危害最低為指向,在偵查的必要范圍內(nèi)選擇適當(dāng)?shù)乃惴夹g(shù)實(shí)現(xiàn)偵查目的。其三,算法技術(shù)適用后,應(yīng)及時(shí)停止算法技術(shù)對(duì)權(quán)利不必要的持續(xù)干預(yù)。如果算法技術(shù)的適用對(duì)公民權(quán)利造成了過度的限制或侵害,應(yīng)當(dāng)提供相應(yīng)的法律救濟(jì)途徑,如申訴、賠償?shù)取?/p>
(二)算法證據(jù)可靠性要素界定
算法通過其“數(shù)據(jù)輸入—算法運(yùn)作—結(jié)論輸出”的技術(shù)操作流程,似乎獨(dú)立于現(xiàn)行法律規(guī)范的范疇。但算法證據(jù)仍需符合證據(jù)“三性”才可能在刑事司法中得以適用。其中,合法性主要關(guān)注“輸入數(shù)據(jù)”的收集程序是否合法合規(guī),關(guān)聯(lián)性主要關(guān)注算法證據(jù)事實(shí)與系爭(zhēng)事實(shí)是否存在一定的相關(guān)關(guān)系,可靠性則主要關(guān)注算法程序的可靠性和準(zhǔn)確性。合法性對(duì)證據(jù)證明力的影響較為有限,且算法證據(jù)合法性問題尚無明文規(guī)定,因此在算法證據(jù)研究中,對(duì)合法性不作特別展開。而算法證據(jù)是否具有關(guān)聯(lián)性,當(dāng)前并無明確的判斷方法。在司法證明中,證據(jù)關(guān)聯(lián)性的標(biāo)準(zhǔn)要求每一個(gè)具體的證據(jù)都必須對(duì)證明案件事實(shí)具有實(shí)質(zhì)性意義。從算法證據(jù)內(nèi)部視角來看,似乎無法完全保障算法分析的大數(shù)據(jù)的每個(gè)“項(xiàng)”均與待證事實(shí)相關(guān),不過在整體主義證明模式下,算法證據(jù)與待證事實(shí)至少存在弱相關(guān)性。因此,只要算法運(yùn)用符合司法證明要求,其分析結(jié)果能夠證明待證事實(shí)即可。算法程序的可靠性是決定算法證據(jù)可靠性的核心因素。因此,算法證據(jù)可靠性可依據(jù)證據(jù)生成流程從數(shù)據(jù)可靠性、算法可靠性兩個(gè)層面予以明確。在這一認(rèn)識(shí)維度下,對(duì)算法證據(jù)的相關(guān)性與可靠性的判斷也呈現(xiàn)出某種程度的趨同性。
1. 數(shù)據(jù)可靠性
數(shù)據(jù)可靠性主要指的是算法“訓(xùn)練數(shù)據(jù)集”可靠性和“輸入數(shù)據(jù)”可靠性?!拜斎霐?shù)據(jù)”是指作為算法分析對(duì)象的基礎(chǔ)大數(shù)據(jù),其是否具有可靠性主要取決于收集、對(duì)比過程中是否存在篡改、偽造以及較大誤差等情況,大數(shù)據(jù)與全數(shù)據(jù)之間的偏差是否在合理區(qū)間,數(shù)據(jù)載體是否足以確保數(shù)據(jù)的完整、準(zhǔn)確。“訓(xùn)練數(shù)據(jù)集”則是指與機(jī)器學(xué)習(xí)算法適用目的相關(guān)的,能夠用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)集合。在機(jī)器學(xué)習(xí)的過程中,算法通過從訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)模式和關(guān)系,從而構(gòu)建出一個(gè)能夠?qū)π碌臄?shù)據(jù)進(jìn)行預(yù)測(cè)或決策的模型。訓(xùn)練數(shù)據(jù)集通常由大量的樣本組成,每個(gè)樣本都包含輸入特征和對(duì)應(yīng)的標(biāo)簽或結(jié)果。輸入特征是模型用來進(jìn)行預(yù)測(cè)的數(shù)據(jù),而標(biāo)簽是模型需要預(yù)測(cè)的目標(biāo)。例如,在圖像識(shí)別任務(wù)中,輸入特征可能是圖像的像素值,而標(biāo)簽則是圖像所代表的對(duì)象類別。保障機(jī)器學(xué)習(xí)有效性和算法證據(jù)可靠性的重點(diǎn)在于確?!坝?xùn)練數(shù)據(jù)集”的可靠性。“訓(xùn)練數(shù)據(jù)集”可靠性包括以下多方面要素:其一,數(shù)據(jù)多樣性和代表性。為了算法能夠?qū)W習(xí)到數(shù)據(jù)的多種可能性和變化,應(yīng)盡可能保證訓(xùn)練數(shù)據(jù)集包含多種樣本。多樣性有助于提高算法的泛化能力,防止其對(duì)特定類型的數(shù)據(jù)過度擬合。同時(shí),數(shù)據(jù)集應(yīng)具有對(duì)實(shí)際問題的代表性,以代表算法可能遇到的不同場(chǎng)景。數(shù)據(jù)代表性意在突出算法結(jié)果與司法判決的適配性。其二,數(shù)據(jù)準(zhǔn)確性、完整性和一致性。數(shù)據(jù)準(zhǔn)確性、完整性和一致性是對(duì)訓(xùn)練數(shù)據(jù)集質(zhì)量的基礎(chǔ)保障。在數(shù)據(jù)采集階段,由于“訓(xùn)練數(shù)據(jù)集”的電子數(shù)據(jù)形式?jīng)Q定了其存在內(nèi)容易破壞性和易篡改性的特性,因此,對(duì)于“訓(xùn)練數(shù)據(jù)集”的采集應(yīng)當(dāng)注重提取、保管的合法合規(guī),不存在數(shù)據(jù)缺失和篡改情況等;在數(shù)據(jù)預(yù)處理階段,主要是對(duì)數(shù)據(jù)進(jìn)行清洗和標(biāo)注。數(shù)據(jù)清洗的目的是發(fā)現(xiàn)并糾正數(shù)據(jù)中可能存在的錯(cuò)誤,如處理缺失值、數(shù)據(jù)去重、異常值處理以及對(duì)敏感信息進(jìn)行脫敏處理。數(shù)據(jù)標(biāo)注是指對(duì)數(shù)據(jù)進(jìn)行歸類、整理、糾錯(cuò)、轉(zhuǎn)錄、翻譯和添加標(biāo)簽等操作,以生成滿足機(jī)器學(xué)習(xí)訓(xùn)練要求的數(shù)據(jù)編碼,確保數(shù)據(jù)質(zhì)量和提高機(jī)器學(xué)習(xí)算法能力。其三,數(shù)據(jù)數(shù)量充分性。理論上,“訓(xùn)練數(shù)據(jù)集”應(yīng)足夠大,以便模型能夠從中學(xué)習(xí)到足夠的信息。然而,也需要避免數(shù)據(jù)集過大導(dǎo)致訓(xùn)練效率低下或者過擬合的問題,合理的數(shù)據(jù)量規(guī)劃應(yīng)根據(jù)實(shí)際需求和資源限制進(jìn)行。
2. 算法可靠性
其一,算法選擇的適當(dāng)性。機(jī)器學(xué)習(xí)算法模型通??梢苑譃槿悾罕O(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。監(jiān)督學(xué)習(xí)是從有標(biāo)記的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)一個(gè)模型,然后根據(jù)這個(gè)模型對(duì)未知樣本進(jìn)行預(yù)測(cè)。常見的監(jiān)督學(xué)習(xí)算法包括回歸分析和統(tǒng)計(jì)分類。無監(jiān)督學(xué)習(xí)又稱為非監(jiān)督式學(xué)習(xí),它的輸入樣本并不需要標(biāo)記,而是自動(dòng)從樣本中學(xué)習(xí)特征實(shí)現(xiàn)預(yù)測(cè)。常見的無監(jiān)督學(xué)習(xí)算法有聚類和關(guān)聯(lián)分析等。強(qiáng)化學(xué)習(xí)是通過觀察來學(xué)習(xí)做成什么樣的動(dòng)作。每個(gè)動(dòng)作都會(huì)對(duì)環(huán)境有所影響,學(xué)習(xí)對(duì)象根據(jù)觀察到的周圍環(huán)境的反饋來做出判斷。強(qiáng)化學(xué)習(xí)強(qiáng)調(diào)如何基于環(huán)境而行動(dòng),以取得最大化的預(yù)期利益。在刑事司法中8hW5J5aeaoYoiYDEbYiR/Q4tEu1FlL4G/VlL5KhcO3g=,監(jiān)督學(xué)習(xí)可用于行為預(yù)測(cè)、案件分類、量刑建議等多種場(chǎng)景,無監(jiān)督學(xué)習(xí)主要用以解決涉案數(shù)據(jù)聚類問題,強(qiáng)化學(xué)習(xí)則側(cè)重于解決偵查決策問題。為保障算法可靠性,在處理特定司法問題時(shí),應(yīng)根據(jù)適用目的、環(huán)境等選擇適當(dāng)?shù)乃惴?。例如,在網(wǎng)絡(luò)販毒案件中,偵查人員為明確涉毒嫌疑人的社會(huì)關(guān)系網(wǎng)絡(luò),偵查毒品犯罪鏈條,可以通過無監(jiān)督學(xué)習(xí)算法對(duì)犯罪嫌疑人社交設(shè)備中的通聯(lián)記錄進(jìn)行分析,以數(shù)據(jù)的聚類結(jié)構(gòu)來追溯上下游犯罪或者篩選犯罪嫌疑人的密切聯(lián)絡(luò)人。其二,算法模型復(fù)雜度與簡(jiǎn)潔性的平衡。算法模型的復(fù)雜度決定了其擬合數(shù)據(jù)的能力。過于復(fù)雜的模型可能會(huì)導(dǎo)致過擬合,而過于簡(jiǎn)單的模型則可能會(huì)導(dǎo)致欠擬合。選擇適當(dāng)?shù)乃惴P蛷?fù)雜度,以及使用正則化等技術(shù)來避免過擬合,是提高算法可靠性的關(guān)鍵之一。其三,穩(wěn)定性。穩(wěn)定性是算法對(duì)數(shù)據(jù)變化敏感性的評(píng)估,算法的穩(wěn)定性與可靠性成正相關(guān)關(guān)系。對(duì)此,可以通過在不同數(shù)據(jù)集上訓(xùn)練模型,并比較其性能的變化來評(píng)估穩(wěn)定性。其四,可解釋性。可解釋性包括兩方面內(nèi)容,其一,算法可解釋性。算法分析結(jié)果需要能夠被當(dāng)事人和社會(huì)公眾理解,因此選擇的算法應(yīng)當(dāng)具備一定的可解釋性,使得其分析過程和結(jié)果相對(duì)透明,從而提高其可靠性。其二,參數(shù)可解釋性。在工程技術(shù)領(lǐng)域,參數(shù)通常被認(rèn)為具有較高的技術(shù)客觀性。但當(dāng)機(jī)器算法實(shí)現(xiàn)基礎(chǔ)智能,并且數(shù)據(jù)的合法性和可信度得到保障時(shí),參數(shù)的設(shè)置往往會(huì)更多地反映算法使用者的主觀意圖,顯示出較強(qiáng)的主觀性。在這種情況下,參數(shù)的設(shè)定或選擇更容易與諸如偏見等不公正行為產(chǎn)生聯(lián)系。因此,參數(shù)可解釋性要求有助于遠(yuǎn)離技術(shù)黑盒,強(qiáng)化算法設(shè)計(jì)的監(jiān)管力度。
總之,明確數(shù)據(jù)可靠性和算法可靠性各要素:其一,有利于更好地發(fā)揮實(shí)踐中機(jī)器學(xué)習(xí)算法模型的司法適用性。其二,有利于提高在數(shù)據(jù)選擇和算法設(shè)計(jì)過程中的外部程序監(jiān)督實(shí)效,增強(qiáng)算法透明度和可解釋性。其三,有利于輔助司法辦案人員明晰算法證據(jù)可靠性的審查要點(diǎn)。不過,對(duì)于數(shù)據(jù)可靠性和算法可靠性各要素的判斷與認(rèn)定仍然需要強(qiáng)調(diào)相關(guān)技術(shù)專家的參與,算法分析結(jié)論是否可靠也需要通過專家加以檢驗(yàn)和判斷,只有確認(rèn)算法分析結(jié)論可靠,算法證據(jù)才相對(duì)具有可靠性。因此,需要確保這一過程中專家的專業(yè)資質(zhì)和中立地位。
(三)算法證據(jù)適用的程序規(guī)制
1. 算法證據(jù)取證:算法影響評(píng)估
在狹義層面上,算法證據(jù)取證實(shí)為算法證據(jù)生成。由于數(shù)據(jù)選擇與算法設(shè)計(jì)缺乏外部監(jiān)督,因此算法證據(jù)生成過程較為隱蔽。為充分保障算法證據(jù)可靠性,應(yīng)針對(duì)算法證據(jù)生成過程,構(gòu)建促進(jìn)司法算法透明、實(shí)現(xiàn)公正的算法影響評(píng)估程序機(jī)制?!八惴ㄓ绊懺u(píng)估”是指依據(jù)系統(tǒng)制定的衡量標(biāo)準(zhǔn)對(duì)自動(dòng)化決策系統(tǒng)的應(yīng)用流程、數(shù)據(jù)使用和系統(tǒng)設(shè)計(jì)等內(nèi)容進(jìn)行系統(tǒng)評(píng)判,以明確該系統(tǒng)的影響水平和風(fēng)險(xiǎn)等級(jí)的一種算法治理實(shí)踐。當(dāng)前,在美國(guó)、加拿大、歐盟等國(guó)家和地區(qū),“算法影響評(píng)估”已被納入其人工智能監(jiān)管和問責(zé)的法律框架中。我國(guó)2023 年《信息安全技術(shù)機(jī)器學(xué)習(xí)算法安全評(píng)估規(guī)范》對(duì)此也作了相關(guān)規(guī)定。在刑事算法證據(jù)取證程序中,構(gòu)建算法影響評(píng)估程序應(yīng)從算法研發(fā)與設(shè)計(jì)、算法運(yùn)行、算法運(yùn)行結(jié)果三個(gè)方面展開。第一,算法研發(fā)與設(shè)計(jì)。雖然機(jī)器學(xué)習(xí)算法可以自我迭代和自編碼,進(jìn)而“自主自為”地形成偏見和規(guī)則,但從根本意義上來說,這僅是放大人類在初始階段植入的偏見和規(guī)則。因此應(yīng)當(dāng)在算法技術(shù)適用之初,通過確保相關(guān)技術(shù)人員在數(shù)據(jù)選擇和代碼編寫方面的目的正當(dāng),以保障算法取證手段及其結(jié)果的公正合理。作為刑事司法算法的實(shí)際使用者,司法辦案機(jī)關(guān)應(yīng)是算法影響評(píng)估的主體。對(duì)此可由省級(jí)公檢法機(jī)關(guān)統(tǒng)籌協(xié)作,組織內(nèi)部專業(yè)部門和技術(shù)公司、科研院所、審計(jì)機(jī)構(gòu)、社會(huì)公眾等第三方中立機(jī)構(gòu)和人員,結(jié)合數(shù)據(jù)可靠性與算法可靠性等要素對(duì)算法進(jìn)行研發(fā)與設(shè)計(jì),以及圍繞算法的合法合理、尊重隱私、安全可信進(jìn)行全面的評(píng)估和測(cè)試。第二,算法運(yùn)行。為盡可能保證機(jī)器算法運(yùn)行的穩(wěn)定性和相對(duì)可視性,并確保結(jié)果告知的實(shí)質(zhì)性,可在前述“技術(shù)性正當(dāng)程序”理念下開展“審計(jì)跟蹤”工作,即能夠追蹤到算法分析結(jié)果相應(yīng)的事實(shí)依據(jù)和法律的審計(jì)記錄。第三,算法運(yùn)行結(jié)果。一方面,算法影響評(píng)估是一個(gè)持續(xù)的過程,需要對(duì)算法進(jìn)行動(dòng)態(tài)監(jiān)測(cè)和測(cè)試,以應(yīng)對(duì)數(shù)據(jù)變化、算法更新和新的應(yīng)用場(chǎng)景。根據(jù)算法運(yùn)行結(jié)果,不斷調(diào)整和優(yōu)化算法,以減少其負(fù)面影響。另一方面,司法人員應(yīng)當(dāng)通過第三方專業(yè)機(jī)構(gòu)、人員對(duì)算法運(yùn)行結(jié)果進(jìn)行證據(jù)化審核和評(píng)估,保證算法運(yùn)行結(jié)果作為證據(jù)使用的客觀可靠性。
2. 算法證據(jù)開示:告知- 知情- 異議
第一,告知。在審前程序中,司法辦案機(jī)關(guān)應(yīng)在依據(jù)算法證據(jù)對(duì)被追訴人采取限制人身自由的相關(guān)措施前的三日內(nèi),或者在庭前程序中,控方在審判人員組織下,在不涉及國(guó)家秘密、商業(yè)秘密、案件秘密等內(nèi)容的基礎(chǔ)上,向被追訴人、辯護(hù)人告知并解釋說明算法生成記錄,包括公開算法系統(tǒng)的源代碼,以及算法證據(jù)類型與結(jié)果。第二,知情。為避免被追訴人知而不明,首先,可以通過電子化閱卷的形式,賦予被追訴人查閱算法證據(jù)報(bào)告的權(quán)利;其次,允許被追訴人、辯護(hù)人在合理范圍內(nèi),要求司法辦案人員提供并釋明與算法證據(jù)相關(guān)的記錄內(nèi)容;最后,應(yīng)當(dāng)賦予被追訴人、辯護(hù)人申請(qǐng)相關(guān)領(lǐng)域技術(shù)人員或者具有專門知識(shí)人幫助的權(quán)利,以輔助其認(rèn)識(shí)和理解算法證據(jù)中的事實(shí)和權(quán)利問題。第三,異議。由于算法事實(shí)認(rèn)定存在一定風(fēng)險(xiǎn),既容易造成個(gè)人數(shù)據(jù)權(quán)益的侵害,也難以保證算法證據(jù)結(jié)果的精確無誤,因此,如果被追訴人、辯護(hù)人認(rèn)為算法證據(jù)結(jié)果錯(cuò)誤,或者因此而遭受不利后果,有權(quán)提出異議。
3. 算法證據(jù)質(zhì)證:專家輔助人參與及全面質(zhì)證
針對(duì)存在異議、嚴(yán)重影響被追訴人合法權(quán)益的ad1346a52044aa84f5a9575dd82cc1f1c9d883eabd0e398e287202e117f2878a算法證據(jù)事實(shí),應(yīng)在訴訟化聽證程序或庭審程序中允許控辯雙方對(duì)算法證據(jù)進(jìn)行質(zhì)辯。從提升質(zhì)證效果來看,辯方應(yīng)充分行使知情權(quán)和異議權(quán),利用專家輔助人制度,對(duì)算法證據(jù)的取得、保管、分析與使用的全流程展開質(zhì)詢。對(duì)證明力較弱、可靠性存疑的算法證據(jù),可申請(qǐng)重新檢驗(yàn)鑒定,必要時(shí)可主動(dòng)收集對(duì)辯護(hù)有利的算法證據(jù)。從質(zhì)證內(nèi)容來看,第一,相關(guān)性。一般而言,證據(jù)內(nèi)容與待證事實(shí)之間的聯(lián)系越緊密,證據(jù)的證明力就越大,若算法證據(jù)內(nèi)容對(duì)待證事實(shí)的認(rèn)定明顯無實(shí)質(zhì)證明效用,則算法證據(jù)不具有相關(guān)性。第二,可靠性。對(duì)算法證據(jù)可靠性的質(zhì)證,可圍繞算法證據(jù)可靠性各要素展開。如針對(duì)算法模型是否排除歧視、訓(xùn)練數(shù)據(jù)是否確保純凈、參數(shù)權(quán)重是否設(shè)計(jì)公正等問題提出異議。第三,相關(guān)專家的專業(yè)資質(zhì)和中立地位。如控方技術(shù)專家與案件處理結(jié)果存在利益關(guān)系,其對(duì)算法證據(jù)解釋的可信度便存在問題。為保證專家輔助人參與質(zhì)證的實(shí)質(zhì)性,一方面,應(yīng)為專家輔助人提供必要的質(zhì)證條件,如提供對(duì)數(shù)據(jù)和算法進(jìn)行檢驗(yàn)性分析的合理時(shí)間;另一方面,賦予專家輔助人意見證據(jù)效力,提高質(zhì)證意見的訴訟影響力和可審查性。
4. 算法證據(jù)認(rèn)證:排除合理懷疑
判斷算法證據(jù)有無證據(jù)能力以及證明力的大小,需要司法裁判人員在充分聽取控辯雙方質(zhì)證意見,并結(jié)合自身經(jīng)驗(yàn)的基礎(chǔ)上做出判斷。但算法證據(jù)要成為事實(shí)認(rèn)定的依據(jù),必須達(dá)到排除合理懷疑的標(biāo)準(zhǔn)。有觀點(diǎn)認(rèn)為在我國(guó)刑事訴訟中,排除合理懷疑是對(duì)總體證據(jù)適用的要求,屬于概括性證據(jù)標(biāo)準(zhǔn),但如果算法證據(jù)本身存在無法排除的合理懷疑,這可能會(huì)影響整體證據(jù)鏈的可靠性,從而帶來證明上的風(fēng)險(xiǎn)。因此,應(yīng)當(dāng)采取排除合理懷疑的標(biāo)準(zhǔn)對(duì)算法證據(jù)加以認(rèn)定。同時(shí),由于“合理”源于主觀認(rèn)知對(duì)客觀現(xiàn)實(shí)的反映,為防止司法裁判人員對(duì)排除合理懷疑標(biāo)準(zhǔn)適用的主觀恣意,一方面,可以進(jìn)一步完善專家咨詢制度,建立健全司法專家數(shù)據(jù)庫(kù),要求技術(shù)咨詢專家或司法技術(shù)人員對(duì)算法證據(jù)審查認(rèn)定的司法幫助,以彌補(bǔ)司法裁判人員自身對(duì)相關(guān)算法科學(xué)知識(shí)的空缺;另一方面,應(yīng)當(dāng)建立司法裁判人員對(duì)算法證據(jù)審查認(rèn)定結(jié)果的說理制度和對(duì)辯護(hù)意見的回應(yīng)機(jī)制,以實(shí)現(xiàn)排除合理懷疑標(biāo)準(zhǔn)適用的相對(duì)客觀化,確保裁判的公信力。