數(shù)字時(shí)代刑事證據(jù)運(yùn)用的風(fēng)險(xiǎn)及其規(guī)制

2024-11-30 00:00:00潘金貴

法治研究 2024年6期

摘要：數(shù)字信息技術(shù)對(duì)刑事司法的深度介入產(chǎn)生了算法證據(jù)。刑事算法證據(jù)應(yīng)限于“人輔機(jī)主”型的機(jī)器學(xué)習(xí)算法證據(jù)，可歸屬于專門性問題報(bào)告范疇。算法通過數(shù)據(jù)結(jié)構(gòu)化的過程，揭示大數(shù)據(jù)與待證事實(shí)之間的因果關(guān)系，算法證據(jù)是在司法證明整體主義模式下對(duì)大數(shù)據(jù)評(píng)價(jià)的結(jié)果，包括預(yù)測(cè)類算法證據(jù)、識(shí)別類算法證據(jù)和分析類算法證據(jù)。算法證據(jù)的司法適用存在三層風(fēng)險(xiǎn)：對(duì)無罪推定和自由心證的沖擊；“概率近似正確（PAC）”理論下的事實(shí)認(rèn)定錯(cuò)誤性或歧視性問題；權(quán)力行使的隱化和異化趨勢(shì)。同時(shí)存在雙維困境：在實(shí)體困境維度，算法透明度和可解釋性、個(gè)人數(shù)據(jù)賦權(quán)與反算法身份歧視等手段難以實(shí)現(xiàn)對(duì)算法的有效規(guī)制和監(jiān)管，影響算法證據(jù)合理適用；在程序困境維度，數(shù)據(jù)選擇與算法設(shè)計(jì)監(jiān)督程序、結(jié)果告知與解釋程序以及異議或質(zhì)證程序的規(guī)則闕如，制約算法證據(jù)適用實(shí)效。對(duì)此，應(yīng)當(dāng)以事實(shí)認(rèn)定的輔助性、技術(shù)性正當(dāng)程序、比例原則作為算法證據(jù)司法適用的理念指引；依據(jù)算法證據(jù)生成流程，從數(shù)據(jù)可靠性、算法可靠性角度明確算法證據(jù)可靠性的具體要素；構(gòu)建取證、開示、質(zhì)證與認(rèn)證規(guī)則，強(qiáng)化算法證據(jù)適用的程序規(guī)制。

關(guān)鍵詞：算法證據(jù) 數(shù)字司法證據(jù)可靠性正當(dāng)程序專門性問題報(bào)告

一、算法證據(jù)的提出：數(shù)字時(shí)代刑事證據(jù)制度的新發(fā)展

在數(shù)字時(shí)代，刑事證據(jù)制度面臨著前所未有的挑戰(zhàn)和變革。尤其是互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等技術(shù)的應(yīng)用對(duì)證據(jù)的形式和收集方式、證據(jù)的分析和解讀以及證據(jù)可靠性和有效性的審查判斷等提出了新的要求。例如，數(shù)字時(shí)代產(chǎn)生了包括電子郵件、社交媒體信息、數(shù)字交易記錄等在內(nèi)的大量電子數(shù)據(jù)，這些數(shù)據(jù)往往具有非結(jié)構(gòu)化的形式，呈現(xiàn)多樣的內(nèi)部結(jié)構(gòu)與特征。一般情況下，司法通過利用數(shù)字技術(shù)對(duì)大數(shù)據(jù)材料進(jìn)行分析，實(shí)現(xiàn)大數(shù)據(jù)材料高效運(yùn)用的目的，但此類數(shù)字證據(jù)材料與傳統(tǒng)的物證和書證有著本質(zhì)的不同，在缺乏技術(shù)適用理性和程序規(guī)則指導(dǎo)的情況下，存在著司法認(rèn)知偏差與決策錯(cuò)誤的風(fēng)險(xiǎn)。因此，刑事證據(jù)制度必須適應(yīng)數(shù)字時(shí)代的發(fā)展，提供新的規(guī)則和方法來處理和評(píng)估這些證據(jù)，以確保司法的現(xiàn)代化、科技化和公正性，提高司法效率和公信力。

在大數(shù)據(jù)和人工智能等數(shù)字技術(shù)的應(yīng)用中，算法是實(shí)現(xiàn)數(shù)據(jù)處理、模式識(shí)別、決策支持和自動(dòng)化等關(guān)鍵功能的核心。在大數(shù)據(jù)和人工智能等數(shù)字技術(shù)融入刑事司法的過程中，算法扮演著至關(guān)重要的角色。算法能夠有效地實(shí)現(xiàn)司法對(duì)大數(shù)據(jù)材料的運(yùn)用目的，關(guān)鍵在于其并不需要深入解析數(shù)據(jù)的內(nèi)在深層次含義，而是通過建立基于數(shù)據(jù)的概率統(tǒng)計(jì)模型來識(shí)別數(shù)據(jù)之間的客觀聯(lián)系，并據(jù)此進(jìn)行預(yù)測(cè)。這種方法能夠得出與人類利用高級(jí)認(rèn)知技術(shù)在相似情況下得出的結(jié)論相同或相近的結(jié)果。那么，如何認(rèn)識(shí)和界定算法對(duì)大數(shù)據(jù)材料分析結(jié)果的證據(jù)屬性與證據(jù)種類？對(duì)此，當(dāng)前刑事證據(jù)法學(xué)界較為流行“大數(shù)據(jù)證據(jù)”概念，也有學(xué)者提出了“人工智能證據(jù)”“算法證據(jù)”的觀點(diǎn)。在大數(shù)據(jù)時(shí)代，算法應(yīng)當(dāng)是相關(guān)數(shù)字證據(jù)的核心要素和主要規(guī)制對(duì)象。在處理和分析大數(shù)據(jù)時(shí)，算法既能夠決定數(shù)據(jù)如何被解釋和應(yīng)用，還能夠影響證據(jù)的合法性和真實(shí)性。因此，對(duì)算法的有效規(guī)制和監(jiān)督是確保司法公正和數(shù)據(jù)利用合規(guī)的關(guān)鍵環(huán)節(jié)，在刑事證據(jù)理論研究中，用算法證據(jù)對(duì)大數(shù)據(jù)證據(jù)、人工智能證據(jù)進(jìn)行界定較為科學(xué)。

在司法實(shí)踐中，對(duì)算法證據(jù)的適用還處于探索階段，其技術(shù)概念和具體規(guī)則的缺失，增加了司法審查運(yùn)用的難度。當(dāng)前針對(duì)算法證據(jù)的理論探討中，對(duì)算法本體的研究不足，以及對(duì)算法介入司法證明過程的邏輯、路徑與風(fēng)險(xiǎn)分析的充分性不夠，導(dǎo)致算法證據(jù)的研究成果無法充分反映算法技術(shù)與司法證明規(guī)則交融的實(shí)質(zhì)性，算法證據(jù)的司法適用建議也缺乏一定的實(shí)操性。為此，在互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能等信息技術(shù)快速介入刑事司法的背景下，本文以算法證據(jù)為分析視角，明確刑事證據(jù)與司法證明制度轉(zhuǎn)型與發(fā)展的著力點(diǎn)，重塑算法證據(jù)優(yōu)化適用的規(guī)則，以輔助司法辦案人員客觀準(zhǔn)確地認(rèn)定案件事實(shí)，切實(shí)有效地推進(jìn)技術(shù)理性與司法理性的融合。

二、算法證據(jù)的匡正：證明路徑、證據(jù)屬性與證據(jù)類型

（一）算法的“人機(jī)交互”性與機(jī)器學(xué)習(xí)算法證據(jù)

目前尚無公認(rèn)的關(guān)于算法的定義，不過至少可從狹義、廣義和中義三種維度對(duì)算法進(jìn)行界分。從狹義角度看，算法被定義為用于解決某一類問題的一種明確的、機(jī)械的規(guī)則或過程，是運(yùn)行獨(dú)立于人腦的計(jì)算機(jī)系統(tǒng)的具體步驟或方法，即從問題的初始狀態(tài)開始，在合理的時(shí)間內(nèi)，經(jīng)過有限次的運(yùn)算和判斷，最終達(dá)到問題的結(jié)束狀態(tài)。狹義的算法可被視為純粹的科學(xué)或技術(shù)。從廣義角度看，算法的本質(zhì)只是一種求解邏輯，無關(guān)于具體的適用領(lǐng)域，廣義的算法被寬泛地界定為所有決策程序或步驟，而不僅是與機(jī)器相關(guān)的自動(dòng)化決策。從中義角度看，算法則被界定為人類和機(jī)器交互的決策，即人類通過代碼設(shè)置、數(shù)據(jù)運(yùn)算與機(jī)器自動(dòng)化判斷進(jìn)行決策的一套機(jī)制。結(jié)合犯罪追訴與人權(quán)保障的司法情境，在算法證據(jù)的理論研究中，應(yīng)當(dāng)突出算法適用中“人”的作用，以深入理解算法的“人機(jī)交互”性（非中立性）與算法證據(jù)運(yùn)用的程序可規(guī)制性。

由于數(shù)字時(shí)代新技術(shù)的迅猛發(fā)展和現(xiàn)實(shí)需要，算法的“人機(jī)交互”性出現(xiàn)了“人主機(jī)輔”和“人輔機(jī)主”兩種情況，技術(shù)層面的算法規(guī)則構(gòu)建也相應(yīng)地呈現(xiàn)出兩種模式，即專家系統(tǒng)模式與機(jī)器學(xué)習(xí)模式。專家系統(tǒng)模式下的算法規(guī)則以人類的經(jīng)驗(yàn)和專門知識(shí)為基礎(chǔ)，通過人類專家預(yù)先設(shè)定的編碼程序?qū)⑤斎霐?shù)據(jù)輸出為算法結(jié)果，其旨在建造能用于代替人類高級(jí)腦力勞動(dòng)的專家系統(tǒng)。DNA 比對(duì)、指紋比對(duì)等即是基于專家系統(tǒng)算法自動(dòng)化分析的結(jié)果。機(jī)器學(xué)習(xí)模式則是指計(jì)算機(jī)通過算法學(xué)習(xí)數(shù)據(jù)中隱藏的規(guī)律和信息，從而獲得新的經(jīng)驗(yàn)和知識(shí)，便于計(jì)算機(jī)處理類似任務(wù)時(shí)，能夠像人一樣思考與決策。這一過程對(duì)人類和其他生物而言稱為“生物學(xué)習(xí)”，對(duì)計(jì)算機(jī)而言稱為“機(jī)器學(xué)習(xí)”?！皺C(jī)器學(xué)習(xí)”既不按照人類預(yù)先編碼進(jìn)行數(shù)據(jù)分析運(yùn)算，也不是對(duì)人類設(shè)計(jì)的算法的簡(jiǎn)單運(yùn)用，而是能夠利用云服務(wù)器上收集、存儲(chǔ)與處理的海量數(shù)據(jù)集，不斷訓(xùn)練與優(yōu)化算法模型，自主性產(chǎn)生自己算法，以此解析數(shù)據(jù)，并作出相關(guān)決策和預(yù)測(cè)。因此，較之一般自動(dòng)化決策算法，可將機(jī)器學(xué)習(xí)算法歸屬于自主自治的系統(tǒng)。面部識(shí)別、大規(guī)模監(jiān)控等技術(shù)手段所獲取的證據(jù)材料均為機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)進(jìn)行分析后所產(chǎn)生的信息或結(jié)論。

當(dāng)前學(xué)界對(duì)專家系統(tǒng)模式與機(jī)器學(xué)習(xí)模式下的算法證據(jù)似乎僅作了籠統(tǒng)性研究，而未加以區(qū)分，如有學(xué)者認(rèn)為“算法證據(jù)主要指基于算法所產(chǎn)生的證據(jù)，既包括案件過程中所產(chǎn)生的與大數(shù)據(jù)相關(guān)的算法，又可指通過算法對(duì)案內(nèi)外大數(shù)據(jù)進(jìn)行分析后所產(chǎn)生的證據(jù)”。以及“算法證據(jù)是將海量的案件信息數(shù)據(jù)進(jìn)行計(jì)算整合，形成結(jié)構(gòu)化和信息化的案件場(chǎng)景自動(dòng)解讀與自動(dòng)推理結(jié)果，強(qiáng)調(diào)算法證據(jù)由計(jì)算機(jī)算法程序和模型推導(dǎo)而來”。上述觀點(diǎn)具有一定的合理性，但其局限性也較為明顯。一方面，既弱化了事實(shí)認(rèn)定中算法的特殊作用，也模糊了算法之間的區(qū)別，難以依據(jù)不同算法技術(shù)的特點(diǎn)，對(duì)傳統(tǒng)證據(jù)學(xué)框架下或證據(jù)法場(chǎng)域中的算法證據(jù)構(gòu)建實(shí)質(zhì)性的審查判斷規(guī)則；另一方面，有礙于結(jié)合算法技術(shù)等相關(guān)專業(yè)領(lǐng)域的研究成果，開展刑訴法領(lǐng)域中算法合理運(yùn)用的跨學(xué)科研究。

在刑事訴訟語(yǔ)境中，算法證據(jù)應(yīng)當(dāng)限于機(jī)器學(xué)習(xí)算法證據(jù)，指的是機(jī)器學(xué)習(xí)模型對(duì)大數(shù)據(jù)進(jìn)行分析后所產(chǎn)生的信息或結(jié)論，在證明活動(dòng)中可能作為證據(jù)使用的材料。原因如下：一方面，算法獨(dú)立表達(dá)結(jié)果的證據(jù)理論研究需要。專家系統(tǒng)模式下的算法證據(jù)一般產(chǎn)生于實(shí)現(xiàn)固定功能的傳統(tǒng)計(jì)算機(jī)算法，數(shù)據(jù)分析內(nèi)容為算法規(guī)則預(yù)設(shè)的機(jī)械式輸出結(jié)果，輸出結(jié)果的創(chuàng)造性價(jià)值也主要來源于人而非機(jī)器，換言之，算法僅是對(duì)輸入數(shù)據(jù)元素的自動(dòng)整合或機(jī)械式調(diào)動(dòng)，輸出結(jié)果并未體現(xiàn)出算法獨(dú)立表達(dá)能力，仍存在于算法設(shè)計(jì)者可期待范圍內(nèi)。因此，從證據(jù)的產(chǎn)生過程來看，此類算法證據(jù)可納入電子數(shù)據(jù)一列。在保障數(shù)據(jù)源可靠性的基礎(chǔ)上，對(duì)算法規(guī)則或編程指令的合理性予以檢驗(yàn)鑒定，以評(píng)估算法證據(jù)結(jié)果的有效性，這涉及電子數(shù)據(jù)鑒真問題。但機(jī)器學(xué)習(xí)算法具有自我編程、自我進(jìn)化的能力，這種獨(dú)立性與自主性是其智慧化的主要展現(xiàn)方式。這也就意味著，算法正由“工具”向“主體”跨越，此時(shí)的算法證據(jù)產(chǎn)生了不同于既有數(shù)據(jù)的新信息，如何認(rèn)識(shí)算法證據(jù)的事實(shí)認(rèn)定作用與方式，以及如何界定算法證據(jù)的法律屬性，亟待刑事證據(jù)理論予以回應(yīng)和更新。另一方面，處理龐大且復(fù)雜數(shù)據(jù)的刑事司法現(xiàn)實(shí)需要。數(shù)據(jù)要素是推動(dòng)刑事偵查與司法數(shù)字化轉(zhuǎn)型的重要?jiǎng)幽?，但刑事司法?shí)踐卻面臨著犯罪數(shù)據(jù)爆發(fā)式增長(zhǎng)與涉案信息海量集聚所蘊(yùn)藏的巨大證明價(jià)值難以挖掘的困境。例如，在網(wǎng)絡(luò)犯罪案件中，作為罪量評(píng)價(jià)的網(wǎng)絡(luò)動(dòng)態(tài)行為數(shù)據(jù)如點(diǎn)擊數(shù)、瀏覽數(shù)、轉(zhuǎn)發(fā)數(shù)等，無法簡(jiǎn)單直接用以對(duì)物理空間主體行為的刑法評(píng)價(jià)，因?yàn)槲锢砜臻g行為與網(wǎng)絡(luò)空間行為存在互異的可能，難以辨析物理空間主體是否存在機(jī)刷數(shù)據(jù)等數(shù)據(jù)造假行為。對(duì)此，機(jī)器學(xué)習(xí)算法數(shù)據(jù)挖掘方法可適用于系統(tǒng)地分析大型數(shù)據(jù)集，如通過機(jī)器學(xué)習(xí)算法對(duì)物體、人和動(dòng)作進(jìn)行識(shí)別的“計(jì)算機(jī)視覺”方法，支持偵查活動(dòng)中的大數(shù)據(jù)分析工作，此時(shí)的算法識(shí)別結(jié)果經(jīng)嚴(yán)格審查后可作為證據(jù)使用。這與主要依賴于規(guī)則和事實(shí)，對(duì)于處理需要?jiǎng)?chuàng)新和直覺的復(fù)雜問題能力有限的專家系統(tǒng)算法，在數(shù)據(jù)分析與推理功能方面有著本質(zhì)區(qū)別。

（二）機(jī)器學(xué)習(xí)算法輔助司法證明構(gòu)造及其證據(jù)屬性

1. 算法證明構(gòu)造論

證據(jù)是與案件事實(shí)相關(guān)的信息，是事實(shí)認(rèn)定的必要條件。證據(jù)對(duì)事實(shí)的證明路徑主要包括證明模式的選擇與證據(jù)推理和證明評(píng)價(jià)的推進(jìn)。（1）整體主義證明模式。整體主義證明模式與原子主義證明模式相對(duì)，二者實(shí)際上是宏觀視角與微觀視角的關(guān)系。根據(jù)司法證明的原子主義模式，事實(shí)認(rèn)定的智力過程可以分解為獨(dú)立部分，證明力取決于個(gè)別存在的單個(gè)證據(jù)和離散式的系列推論，最終的事實(shí)認(rèn)定由彼此分離的證明力以某種疊加的方式聚合而成。但從算法證據(jù)事實(shí)認(rèn)定的內(nèi)部視角來看，算法通過分析和處理龐大且復(fù)雜的數(shù)據(jù)集，能夠從中提取有價(jià)值的信息、預(yù)測(cè)趨勢(shì)，并形成算法事實(shí)信息。這一過程強(qiáng)調(diào)算法對(duì)數(shù)據(jù)之間相關(guān)關(guān)系立場(chǎng)的表述，而非對(duì)數(shù)據(jù)進(jìn)行全然解構(gòu)并對(duì)數(shù)據(jù)“項(xiàng)”進(jìn)行獨(dú)立的證明價(jià)值分析。因此，原子主義證明模式與大數(shù)據(jù)的數(shù)量特征和算法技術(shù)的運(yùn)行邏輯不相兼容。整體主義可以成為算法證明的模式選擇。整體主義證明模式主張一項(xiàng)材料的證明力源于所有已輸入信息材料之間的相互作用，單項(xiàng)證據(jù)自身的證明力，無法游離于證據(jù)的總體判斷。在算法證明中，其強(qiáng)調(diào)對(duì)大數(shù)據(jù)的整體評(píng)價(jià)，通過數(shù)據(jù)結(jié)構(gòu)化的過程，揭示大數(shù)據(jù)與待證事實(shí)之間的相關(guān)性或因果關(guān)系。不過應(yīng)予以明確的是，證明模式的整體主義與原子主義均為證據(jù)評(píng)價(jià)與事實(shí)認(rèn)定的重要方式，整體主義證明模式的回歸僅是算法證明視域下的特殊意涵，將二者視為不可調(diào)和的或者相互排斥的觀點(diǎn)是錯(cuò)誤的。（2）證據(jù)推理。證據(jù)推理結(jié)構(gòu)主要依賴的是經(jīng)驗(yàn)和邏輯，如艾倫所主張的經(jīng)驗(yàn)推論模型、威格莫爾所強(qiáng)調(diào)的圖式體系，強(qiáng)調(diào)的是“證與待證”之間因果關(guān)系性質(zhì)的邏輯推演。但有學(xué)者認(rèn)為，在智慧司法中，算法對(duì)事實(shí)的證明模式將從“因果分析”發(fā)展到“關(guān)聯(lián)分析”，這種認(rèn)知存在一定的狹隘性。算法證明機(jī)理的核心在于對(duì)海量數(shù)據(jù)的收集和分析，側(cè)重基于數(shù)理的因果關(guān)系判斷，相關(guān)關(guān)系實(shí)際上是因果關(guān)系的派生。具體來說，利用機(jī)器學(xué)習(xí)和統(tǒng)計(jì)分析算法對(duì)涉案大數(shù)據(jù)進(jìn)行分析處理和測(cè)算推斷，可以識(shí)別數(shù)據(jù)中的異常點(diǎn)、趨勢(shì)線和相關(guān)性，揭示數(shù)據(jù)背后的規(guī)律性結(jié)論，為事實(shí)認(rèn)定提供科學(xué)依據(jù)。算法于其中發(fā)揮了兩種功用：其一，為推理創(chuàng)建基礎(chǔ)數(shù)據(jù)事實(shí)（算法證據(jù)事實(shí)）。神經(jīng)網(wǎng)絡(luò)算法、決策樹算法、聚類算法等常用機(jī)器算法基于相關(guān)性對(duì)鏡像數(shù)據(jù)進(jìn)行關(guān)聯(lián)處理，產(chǎn)生相應(yīng)的算法證據(jù)事實(shí)，這通常能夠揭示出數(shù)據(jù)背后隱藏的往往超出人類經(jīng)驗(yàn)和直覺范疇的深層次信息。其二，為推理提供基于大數(shù)據(jù)分析的經(jīng)驗(yàn)支持。有實(shí)證研究結(jié)果表明，同一犯罪構(gòu)成要件之下，個(gè)罪案件中的證據(jù)分布有一定的規(guī)律性。算法模型通過對(duì)司法實(shí)踐數(shù)據(jù)的廣泛抽取、存儲(chǔ)和分析處理，能夠歸納、整理出類罪犯罪構(gòu)成要件事實(shí)的類型數(shù)據(jù)庫(kù)，并可以在深度學(xué)習(xí)算法驅(qū)動(dòng)下不斷予以自我優(yōu)化，從而為個(gè)案中證據(jù)性事實(shí)到次待證事實(shí)（構(gòu)成要件事實(shí)）的推論提供算法經(jīng)驗(yàn)支持。程序性事實(shí)與量刑事實(shí)的算法證明同樣需要以大數(shù)據(jù)分析經(jīng)驗(yàn)作為推理的可信基礎(chǔ)。（3）證明評(píng)價(jià)。在證明評(píng)價(jià)層面，算法技術(shù)可以輔助校驗(yàn)證據(jù)標(biāo)準(zhǔn)和對(duì)證明力進(jìn)行科學(xué)的概率評(píng)價(jià)，但依通說，證明對(duì)象范圍僅限于實(shí)體法事實(shí)和程序法事實(shí)，此時(shí)的算法分析結(jié)論因是對(duì)證據(jù)事實(shí)的證明而并不屬于訴訟法學(xué)領(lǐng)域的證據(jù)范疇，因此限于文章主旨，本文對(duì)此不作闡述。

2. 算法證據(jù)屬性

目前理論界較為關(guān)注算法證據(jù)屬于何種證據(jù)種類以及如何加以規(guī)制的問題。有學(xué)者認(rèn)為當(dāng)前法定證據(jù)種類制度不夠周延，難以包含較為特殊的算法證據(jù)，因此主張將算法證據(jù)完全獨(dú)立為一種新的法定證據(jù)種類。該觀點(diǎn)值得商榷。一方面，雖然我國(guó)刑事證據(jù)法學(xué)對(duì)證據(jù)種類采取了封閉式列舉的做法，但從縱向維度來看，這是基于我國(guó)基本訴訟國(guó)情的考慮，從橫向維度來看，在立法層面上證據(jù)種類法定化能夠成為其他證據(jù)規(guī)則設(shè)置或調(diào)整的邏輯起點(diǎn)，具有一定的合理性和必要性。因此，客觀地說，算法證據(jù)“獨(dú)立”并不利于刑事證據(jù)制度的穩(wěn)定發(fā)展，甚至?xí)o司法裁判活動(dòng)帶來嚴(yán)重阻礙。另一方面，盡管較之傳統(tǒng)書證、物證等證據(jù)，算法證據(jù)較為特殊，但這種特殊性主要體現(xiàn)在算法證據(jù)內(nèi)在的專業(yè)性、技術(shù)性原理，而這可以通過專家制度予以應(yīng)對(duì)。對(duì)此，在司法裁判中，許多法院已將算法分析的結(jié)論看成鑒定意見的證據(jù)形式。該觀點(diǎn)也不完全準(zhǔn)確。因?yàn)樗惴ǚ治鼋Y(jié)論并不屬于司法鑒定范圍。當(dāng)前，我國(guó)司法鑒定實(shí)行統(tǒng)一管理，僅包括法醫(yī)類、物證類、聲像資料、環(huán)境損害鑒定等“四大類”鑒定，算法分析結(jié)論并不在其列，無法稱之為鑒定意見，也無法全然參照鑒定意見加以審查認(rèn)定。

從證據(jù)運(yùn)用角度來看，算法證據(jù)應(yīng)屬于專門性問題報(bào)告。需要指出的是，針對(duì)主張算法證據(jù)獨(dú)立的學(xué)者所提出的“算法證據(jù)的生成過程與專門性問題報(bào)告之間存在一定差異。比如算法證據(jù)由算法生成，而非有專門知識(shí)的人所給出的意見”的觀點(diǎn)，算法證據(jù)證明作用的發(fā)揮一般需經(jīng)多個(gè)環(huán)節(jié)，包括數(shù)據(jù)收集與預(yù)處理、算法選擇與應(yīng)用、模型訓(xùn)練與優(yōu)化、結(jié)果分析與解釋以及證據(jù)整合與呈現(xiàn)等。實(shí)踐中，算法證據(jù)通常是以書面分析報(bào)告的形式向辦案人員說明數(shù)據(jù)來源、提取與算法規(guī)則的設(shè)計(jì)等內(nèi)容，這一過程需要有專門知識(shí)的人參與算法技術(shù)的運(yùn)行，以及利用專門性知識(shí)解讀算法分析結(jié)論，使最終結(jié)果可視化。這也是算法“人機(jī)交互”性的重要體現(xiàn)。因此，根據(jù)2021 年《最高人民法院關(guān)于適用〈中華人民共和國(guó)刑事訴訟法〉的解釋》第100 條“允許有專門知識(shí)的人就專門性問題出具的報(bào)告作為刑事證據(jù)使用”的規(guī)定，算法證據(jù)應(yīng)屬于專門性問題報(bào)告。

（三）機(jī)器學(xué)習(xí)算法證據(jù)的類型及其場(chǎng)景化適用

針對(duì)算法證據(jù)的類型，已有學(xué)者以大數(shù)據(jù)的來源為主要依據(jù)，作了基于案內(nèi)大數(shù)據(jù)的算法證據(jù)與基于案外大數(shù)據(jù)的算法證據(jù)的界定。這種劃分標(biāo)準(zhǔn)有助于在一定程度上對(duì)算法證據(jù)的適用目的加以反映，但其屬于界分算法證據(jù)類型的形式標(biāo)準(zhǔn)，不夠科學(xué)合理。應(yīng)當(dāng)遵循實(shí)質(zhì)標(biāo)準(zhǔn)，結(jié)合算法的應(yīng)用場(chǎng)景、工作原理和輸出結(jié)果明晰算法證據(jù)的具體類型，包括預(yù)測(cè)類算法證據(jù)、識(shí)別類算法證據(jù)、分析類算法證據(jù)。采取此種實(shí)質(zhì)標(biāo)準(zhǔn)，第一，有利于明確不同算法證據(jù)的證明方式和特點(diǎn)，幫助辦案人員和法律專業(yè)人士更好地理解和處理這些證據(jù)。第二，有利于厘清相關(guān)算法司法治理活動(dòng)的對(duì)象與邊界，建立算法證據(jù)的標(biāo)準(zhǔn)化審查處理流程和評(píng)價(jià)體系，確保算法證據(jù)的運(yùn)用更加公正和合理。第三，有利于證據(jù)學(xué)、技術(shù)和計(jì)算機(jī)科學(xué)等多個(gè)領(lǐng)域知識(shí)的融合，提高司法透明度，增強(qiáng)算法證據(jù)的可信度。

1. 預(yù)測(cè)類算法證據(jù)

預(yù)測(cè)類算法證據(jù)通常指的是利用統(tǒng)計(jì)學(xué)技術(shù)、機(jī)器學(xué)習(xí)算法和復(fù)雜的預(yù)測(cè)模型對(duì)大數(shù)據(jù)進(jìn)行分析，以預(yù)測(cè)未來可能發(fā)生的事件、行為或結(jié)果的證據(jù)。在刑事司法系統(tǒng)中，預(yù)測(cè)類算法證據(jù)主要用作犯罪嫌疑人、被告人危險(xiǎn)性評(píng)估的材料，輔助辦案人員作出是否采取強(qiáng)制措施或采取何種強(qiáng)制措施、是否采取或解除強(qiáng)制醫(yī)療等程序性事實(shí)的評(píng)估和判斷。這些評(píng)估通?；诜缸锵右扇?、被告人的歷史記錄、犯罪類型和其他個(gè)人特征等。例如，當(dāng)前世界范圍內(nèi)已有超過200 種算法驅(qū)動(dòng)的風(fēng)險(xiǎn)評(píng)估工具被用于刑事司法和司法精神病領(lǐng)域，該類算法評(píng)估結(jié)果在某種意義上即可以歸屬于預(yù)測(cè)類算法證據(jù)。當(dāng)然，在預(yù)測(cè)性警務(wù)或者初查活動(dòng)中產(chǎn)生的算法證據(jù)材料也有可能會(huì)在后續(xù)刑事訴訟證明中作為定罪證據(jù)加以使用。

2. 識(shí)別類算法證據(jù)

識(shí)別類算法證據(jù)是指利用人工智能和機(jī)器學(xué)習(xí)技術(shù)對(duì)特定數(shù)據(jù)進(jìn)行分析、識(shí)別和篩選，以確定數(shù)據(jù)對(duì)象的身份或分類的證據(jù)。這類證據(jù)通常涉及圖像識(shí)別、語(yǔ)音識(shí)別、文本分析等領(lǐng)域，通過算法對(duì)輸入的數(shù)據(jù)進(jìn)行處理，從而識(shí)別出個(gè)體或?qū)?shù)據(jù)歸入特定的類別。例如，在刑事偵查領(lǐng)域通過運(yùn)用面部識(shí)別技術(shù)比對(duì)監(jiān)控視頻中的人臉與已知身份信息的面部數(shù)據(jù)來核查個(gè)體身份、追捕在逃人員、實(shí)時(shí)視頻監(jiān)控與確定受害人身份。

3. 分析類算法證據(jù)

分析類算法證據(jù)是指利用機(jī)器算法對(duì)大數(shù)據(jù)進(jìn)行深入分析，以揭示數(shù)據(jù)之間的關(guān)系、趨勢(shì)或模式，并據(jù)此提供對(duì)案件事實(shí)的解釋或推斷的證據(jù)。這類證據(jù)通常涉及復(fù)雜的數(shù)據(jù)處理技術(shù)，如數(shù)據(jù)挖掘和統(tǒng)計(jì)分析等，旨在從數(shù)據(jù)中提取有價(jià)值的信息，輔助司法決策過程。分析類算法證據(jù)在刑事司法中的運(yùn)用主要體現(xiàn)在：其一，拓展事實(shí)認(rèn)定的范圍。通過分析案件相關(guān)的數(shù)據(jù)集，算法可以幫助辦案人員發(fā)現(xiàn)潛在的證據(jù)線索，如通過嫌疑人手機(jī)通信記錄進(jìn)行社會(huì)網(wǎng)絡(luò)關(guān)系分析，依據(jù)數(shù)據(jù)的聚類結(jié)構(gòu)來揭示嫌疑人之間以及嫌疑人與其他社會(huì)關(guān)系人之間的聯(lián)系。其二，促進(jìn)事實(shí)認(rèn)定的準(zhǔn)確性。機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)算法可以處理復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)，并從中提取有用信息。這使得司法機(jī)關(guān)能夠深入分析案件事實(shí)，揭示隱藏在數(shù)據(jù)背后的規(guī)律和聯(lián)系。例如，運(yùn)用深度神經(jīng)網(wǎng)絡(luò)對(duì)相關(guān)數(shù)據(jù)特征進(jìn)行提取，發(fā)現(xiàn)犯罪組織的資金轉(zhuǎn)移規(guī)律。其三，輔助量刑事實(shí)的認(rèn)定。利用歷史判例和相關(guān)數(shù)據(jù)，算法可以輔助法官在量刑時(shí)考慮各種因素，提供量刑建議，以實(shí)現(xiàn)量刑的公平公正。

三、算法證據(jù)的判識(shí)：適用風(fēng)險(xiǎn)與困境

（一）算法證據(jù)的適用風(fēng)險(xiǎn)

1. 證明制度的沖擊：無罪推定與自由心證

無罪推定與自由心證是法治現(xiàn)代化國(guó)家的重要刑事司法證明規(guī)范和準(zhǔn)則。無罪推定在《世界人權(quán)宣言》第11（1）條即有規(guī)定：任何被控有違法行為、應(yīng)受處罰的人，在其經(jīng)公開審判、充分辯護(hù)并依法被證實(shí)有罪之前，應(yīng)當(dāng)視為無罪。自由心證則是探索事實(shí)真相的直覺感知模式，指法官通過證據(jù)自由評(píng)價(jià)實(shí)現(xiàn)從客觀確信至判決責(zé)任倫理的跨越。但“自由”并不意味著“隨意”，法官應(yīng)對(duì)各種證據(jù)進(jìn)行理性的批判性審查，確保其心證建立在對(duì)證據(jù)的充分審查基礎(chǔ)之上。總的來說，無罪推定是司法開啟法治思維的關(guān)鍵抓手，自由心證是司法良性發(fā)展的重要推手。算法證據(jù)作為智慧科技時(shí)代的訴訟產(chǎn)物，必須在無罪推定原則的框架內(nèi)適用，接受司法人員基于理性的邏輯判斷評(píng)價(jià)，以保障被追訴人的合法權(quán)益。但有國(guó)外學(xué)者認(rèn)為，算法的預(yù)測(cè)性質(zhì)必然在不久的將來導(dǎo)致有罪推定。從實(shí)然性角度來看，算法證據(jù)的內(nèi)在特性與司法的不當(dāng)運(yùn)用確易使其成為無罪推定與自由心證的實(shí)現(xiàn)阻礙。具體而言，一方面，算法證據(jù)生成過程缺乏透明性。算法決策過程的“黑箱”特性可能導(dǎo)致司法人員和公眾無法充分理解算法處理數(shù)據(jù)的具體過程和邏輯。因此，司法人員難以全然根據(jù)自己的專業(yè)知識(shí)、經(jīng)驗(yàn)和邏輯推理能力，自由地評(píng)價(jià)和判斷算法證據(jù)。同時(shí)，算法“黑箱”掩藏了算法證據(jù)對(duì)被追訴人可能的不利偏見，從而在一定程度上削弱了司法對(duì)無罪推定原則的尊重和執(zhí)行。另一方面，對(duì)算法證據(jù)事實(shí)的過分依賴。從本質(zhì)上來說，算法證據(jù)屬于一種基于新類型科技而生成的科學(xué)證據(jù)，但在技術(shù)復(fù)雜性之下，證據(jù)事實(shí)的呈現(xiàn)缺乏了司法人員的親歷性，導(dǎo)致其內(nèi)在的心證過程難以被充分感知。在當(dāng)前科學(xué)證據(jù)審查規(guī)范缺乏、實(shí)質(zhì)審查難開展的訴訟狀況下，司法易出現(xiàn)過度依賴算法證據(jù)，忽視案件中其他重要證據(jù)和人為因素的問題，進(jìn)而在證據(jù)審查不夠充分的情況下對(duì)被追訴人做出有罪推斷，違背了無罪推定原則和證據(jù)裁判原則。

2. 事實(shí)認(rèn)定的妨害：錯(cuò)誤性或歧視性

機(jī)器學(xué)習(xí)算法憑借強(qiáng)大的數(shù)據(jù)處理能力，能夠高效處理大量數(shù)據(jù)，發(fā)現(xiàn)數(shù)據(jù)中人類難以識(shí)別的模式和關(guān)聯(lián)，從而輔助或替代人類進(jìn)行事實(shí)認(rèn)定。但機(jī)器學(xué)習(xí)作為一種從數(shù)據(jù)中學(xué)習(xí)的方法，不精確性和不確定性是其本質(zhì)特征。在計(jì)算機(jī)科學(xué)領(lǐng)域，“概率近似正確（PAC）”理論是機(jī)器學(xué)習(xí)算法的基本原理，能夠用于描述機(jī)器學(xué)習(xí)算法在給定數(shù)據(jù)集上的性能和泛化能力。PAC 原理提供了一個(gè)理論框架，用于分析和理解機(jī)器學(xué)習(xí)算法在面對(duì)未知數(shù)據(jù)時(shí)的行為，相應(yīng)地，算法的分析結(jié)果或者產(chǎn)生的假設(shè)存在“近似正確”與“可能正確”兩種表述。因此，在PAC 原理下，只能希望計(jì)算機(jī)基于某種學(xué)習(xí)算法學(xué)得的模型所對(duì)應(yīng)的假設(shè)盡可能接近目標(biāo)概念。這與司法人員裁決刑事案件事實(shí)要求達(dá)到嚴(yán)格證明標(biāo)準(zhǔn)的本質(zhì)相同。與人類對(duì)事實(shí)的判斷可能受到個(gè)人偏見、情緒和認(rèn)知偏差的影響，進(jìn)而可能導(dǎo)致事實(shí)認(rèn)定的不一致和不公正相似，算法分析結(jié)果也存在歧視甚至錯(cuò)誤的可能，例如美國(guó)法院所使用的COMPAS 自動(dòng)化決策算法被證實(shí)了對(duì)黑種人的系統(tǒng)性歧視，即較之于白種人，黑種人被認(rèn)定為具有更高犯罪風(fēng)險(xiǎn)的錯(cuò)誤率更大。這主要存在多方面原因，其一，數(shù)據(jù)質(zhì)量問題。數(shù)據(jù)可能包含噪聲、缺失值、不一致性或偏差，這些都會(huì)影響算法的分析結(jié)果。如果輸入數(shù)據(jù)或算法訓(xùn)練數(shù)據(jù)集不準(zhǔn)確或不完整，算法的輸出也很可能失真。其二，算法局限性。每個(gè)算法都有其適用的范圍和局限性，如果算法不適用于特定的數(shù)據(jù)集或問題類型，其分析結(jié)果可能不準(zhǔn)確。其三，模型過擬合。過擬合往往發(fā)生在模型過于復(fù)雜的情況下。當(dāng)算法模型過擬合時(shí)，它會(huì)試圖通過記憶訓(xùn)練數(shù)據(jù)來達(dá)到更高的準(zhǔn)確率，而非從數(shù)據(jù)中學(xué)習(xí)基本的模式和規(guī)律，這就意味著模型無法泛化到新的數(shù)據(jù)集上，進(jìn)而導(dǎo)致算法在實(shí)際應(yīng)用中的錯(cuò)誤。其四，參數(shù)設(shè)置不當(dāng)。算法的性能很大程度上取決于參數(shù)的選擇，如果參數(shù)沒有經(jīng)過適當(dāng)?shù)恼{(diào)整，或者不公平、不準(zhǔn)確的歷史數(shù)據(jù)沒有被及時(shí)地剔除，在機(jī)器算法的持續(xù)擬合和泛化過程中，這類數(shù)據(jù)將逐漸轉(zhuǎn)化為決策參數(shù)，并被應(yīng)用于隨后的分析活動(dòng)中，那么就可能會(huì)導(dǎo)致不理想的算法分析結(jié)果。此外，人類活動(dòng)因素與算法的“黑箱”特性也于其中發(fā)揮了重要作用。

3. 權(quán)力行使的趨勢(shì)：隱化與異化

算法證據(jù)的適用所帶來的公權(quán)力隱化與異化的問題可以放置在算法證據(jù)的生成過程中加以認(rèn)識(shí)和理解。（1）算法證據(jù)生成的權(quán)力背景。刑事司法中的算法應(yīng)用呈現(xiàn)出一種顯著的“國(guó)家推進(jìn)主義”色彩，全程由官方主導(dǎo)推進(jìn)，算法證據(jù)生成過程隱含于權(quán)力運(yùn)行之中，嚴(yán)重缺乏透明性。例如從偵查取證視角來看，在利用算法技術(shù)取證的過程中，公安機(jī)關(guān)作為算法技術(shù)使用者與科技企業(yè)作為算法設(shè)計(jì)者之間本應(yīng)分離，但為了提高偵查效率，通常雙方會(huì)共同在公安機(jī)關(guān)的辦公區(qū)域設(shè)立數(shù)據(jù)實(shí)驗(yàn)室，以便在各種實(shí)際場(chǎng)景中構(gòu)建和優(yōu)化算法模型。這種合作模式增強(qiáng)了公安機(jī)關(guān)在技術(shù)應(yīng)用方面的優(yōu)勢(shì)地位，并在一定程度上形成了技術(shù)使用的“偵查中心主義”。（2）數(shù)據(jù)收集與使用。由于機(jī)器學(xué)習(xí)技術(shù)可用于將看似無關(guān)的信息聯(lián)系在一起，因此任何人類行為都可以有效地對(duì)其數(shù)字表示作出積極或消極的貢獻(xiàn)。算法證據(jù)的生成首先依賴于對(duì)大量數(shù)字?jǐn)?shù)據(jù)的收集和存儲(chǔ)。這些數(shù)據(jù)可能來源于不同的渠道，如社交媒體、傳感器、監(jiān)控設(shè)備、在線交易記錄等，從而可能導(dǎo)致個(gè)人隱私的泄露。并且通過利用數(shù)據(jù)挖掘和比對(duì)技術(shù)，算法還能夠揭示出那些傳統(tǒng)人力分析方法難以發(fā)現(xiàn)的數(shù)據(jù)關(guān)聯(lián)性，進(jìn)而深入挖掘出超越原始數(shù)據(jù)內(nèi)容的數(shù)據(jù)信息，這可能進(jìn)一步觸及到個(gè)人隱私的敏感領(lǐng)域。而對(duì)個(gè)人數(shù)據(jù)的收集、使用卻基本不會(huì)告知數(shù)據(jù)權(quán)人。（3）算法模型及其分析結(jié)果。算法模型可能會(huì)因?yàn)闄?quán)力者的偏見、數(shù)據(jù)集中的不平衡或歷史數(shù)據(jù)的不完整性而表現(xiàn)出不公正性，這種不公正性可能針對(duì)性別、年齡、教育程度、職業(yè)情況等，但由于缺乏監(jiān)督和問責(zé)機(jī)制，使得算法模型及其基于數(shù)據(jù)相關(guān)性對(duì)人類行為的預(yù)測(cè)、識(shí)別和分析結(jié)果難以受到質(zhì)疑和糾正，司法辦案人員對(duì)算法分析結(jié)果的把關(guān)也就演變成了對(duì)結(jié)果的確認(rèn)，從而產(chǎn)生了權(quán)力濫用和異化的風(fēng)險(xiǎn)。

（二）算法證據(jù)適用的實(shí)體困境

刑事司法中算法證據(jù)的適用存在諸多風(fēng)險(xiǎn)，這與“算法”難以規(guī)制和監(jiān)管直接相關(guān)。當(dāng)前針對(duì)算法規(guī)制和監(jiān)管的手段主要分為算法公開、個(gè)人數(shù)據(jù)賦權(quán)與反算法歧視三種。國(guó)外有關(guān)政策制定者和學(xué)者也較為推崇將算法的透明度和可解釋性（可等同于算法公開手段）作為關(guān)鍵的算法監(jiān)管準(zhǔn)則。不過，在刑事訴訟場(chǎng)域中，通過上述手段實(shí)現(xiàn)對(duì)算法的規(guī)制和監(jiān)管仍缺乏一定的有效性。

1. 算法透明度和可解釋性

算法透明度和可解釋性是指在進(jìn)行數(shù)據(jù)的搜集、處理、分析和應(yīng)用過程中，算法的運(yùn)營(yíng)者需向數(shù)據(jù)的所有者和使用者等披露和解釋算法的運(yùn)作機(jī)制和計(jì)算原理，并提供關(guān)于算法應(yīng)用的目的和可能帶來的結(jié)果等重要信息。然而，一方面，由于機(jī)器學(xué)習(xí)算法技術(shù)已發(fā)展到能夠自我設(shè)計(jì)和自我演化的階段，因此，即便算法對(duì)外公開，也可能已經(jīng)歷了更新變化；并且“算法透明≠算法可知”，算法的可解釋性同樣面臨著技術(shù)挑戰(zhàn)，因?yàn)闄C(jī)器學(xué)習(xí)算法采用的高維度特征優(yōu)化技術(shù)與人類的邏輯推理和語(yǔ)義解釋活動(dòng)在思維和方法上存在本質(zhì)差異，這使得用常規(guī)的語(yǔ)義表達(dá)方式來闡釋算法變得更困難，更遑論訴訟中作為普通公眾的被追訴人對(duì)此能夠完全理解。另一方面，算法作為一個(gè)整體系統(tǒng)，其設(shè)計(jì)不僅涉及程序本身的構(gòu)建，還包括對(duì)數(shù)據(jù)輸入、預(yù)期用途和實(shí)際應(yīng)用環(huán)境的深思熟慮。這意味著，僅僅披露算法本身并不足以完全消除其濫用的風(fēng)險(xiǎn)，例如，通過有偏差的數(shù)據(jù)輸入，同樣可以實(shí)現(xiàn)對(duì)算法的操控。

2. 個(gè)人數(shù)據(jù)賦權(quán)

作為算法監(jiān)管策略，個(gè)人數(shù)據(jù)賦權(quán)側(cè)重于對(duì)算法的基礎(chǔ)資源——數(shù)據(jù)本身的監(jiān)管。其旨在通過立法手段，增強(qiáng)個(gè)人在數(shù)據(jù)創(chuàng)新方面的權(quán)利，并通過提升個(gè)體對(duì)于算法數(shù)據(jù)收集、處理和使用過程的了解和控制能力，從而有效防止算法的不當(dāng)使用對(duì)個(gè)人造成的潛在損害或風(fēng)險(xiǎn)。但其實(shí)際效果可能并不理想。其一，立法不足。當(dāng)前，刑事司法領(lǐng)域并未就個(gè)人數(shù)據(jù)權(quán)益進(jìn)行專門性立法，其所存在的一些涉及個(gè)人數(shù)據(jù)權(quán)益的法律或規(guī)范性文件的規(guī)定較為離散，提供的保護(hù)程度不夠，難以實(shí)現(xiàn)對(duì)個(gè)人數(shù)據(jù)的實(shí)質(zhì)性賦權(quán)。雖然《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》在更廣泛的層面上對(duì)網(wǎng)絡(luò)環(huán)境下的個(gè)人數(shù)據(jù)權(quán)益保護(hù)進(jìn)行了規(guī)定，但并未明確涉及刑事訴訟過程中的相關(guān)保護(hù)措施。其二，行權(quán)阻礙。一方面，由于受到能力、資質(zhì)以及成本效益等因素的影響，數(shù)據(jù)主體未必能夠合理行使數(shù)據(jù)權(quán)。另一方面，面對(duì)算法的不透明性，即使數(shù)據(jù)權(quán)主體意識(shí)到可能遭受算法濫用的風(fēng)險(xiǎn)，也難以提出有效的辯駁。即便算法對(duì)外公開，數(shù)據(jù)權(quán)主體仍可能缺乏必要的專業(yè)知識(shí)和對(duì)算法深入理解的能力，數(shù)據(jù)的控制權(quán)依然主要集中于司法權(quán)力者手中。

3. 反算法身份歧視

在刑事訴訟中，反算法歧視意指反算法身份歧視，其主要聚焦于禁止基于算法收集數(shù)據(jù)主體的個(gè)人特征信息，如種族、宗教信仰和性別等，以預(yù)防算法在自動(dòng)化的數(shù)據(jù)分析或預(yù)測(cè)過程中，導(dǎo)致個(gè)體面臨不公平的對(duì)待或遭受惡意的歧視，即便這些數(shù)據(jù)所反映的身份歧視可能是無意識(shí)的。雖然該規(guī)制手段具有一定的理論意義，但是實(shí)效有限，主要原因在于：（1）關(guān)聯(lián)數(shù)據(jù)。以美國(guó)威斯康星州訴盧米斯案（Statev.Loomis）中的算法量刑結(jié)果歧視問題為例，在盧米斯案中，法官承認(rèn)COMPAS 算法存在種族歧視問題，導(dǎo)致黑人群體被錯(cuò)誤地標(biāo)記為具有較高犯罪風(fēng)險(xiǎn)。盡管COMPAS 算法并未將“種族”直接納入其計(jì)算過程中，但它卻通過考慮如犯罪記錄、居住地信息、教育背景和職業(yè)經(jīng)歷等其他信息數(shù)據(jù)，間接地反映出算法評(píng)估對(duì)象的種族屬性。因此，對(duì)于算法模型而言，即便在初始數(shù)據(jù)輸入階段完全排除了種族、性別、膚色等身份歧視屬性數(shù)據(jù)，機(jī)器學(xué)習(xí)算法依然能夠通過其他相關(guān)聯(lián)的數(shù)據(jù)，隱蔽地傳達(dá)出歧視性意圖，并產(chǎn)生歧視性的結(jié)果。（2）目的指向。算法分析目的是算法運(yùn)行的指向，算法歧視可能附隨于算法分析目的之中，例如出于國(guó)家安全和機(jī)場(chǎng)安檢效率考慮，全球大部分國(guó)際機(jī)場(chǎng)均實(shí)施了選擇性安檢措施，即在標(biāo)準(zhǔn)安檢程序以外，針對(duì)特定群體執(zhí)行更為嚴(yán)格而復(fù)雜的檢查，以篩查出恐怖分子等潛在犯罪人員。（3）歷史歧視。歷史歧視是個(gè)人無意識(shí)的社會(huì)認(rèn)知，即便刪除算法中可能導(dǎo)致歧視性的數(shù)據(jù)變量，事實(shí)認(rèn)定者仍可能依據(jù)算法證據(jù)信息對(duì)部分群體施以不公平的對(duì)待，而且這種歧視現(xiàn)象可能比使用算法進(jìn)行決策或輔助決策的情況更為廣泛。

（三）算法證據(jù)適用的程序困境

從算法證據(jù)適用的實(shí)體困境來看，算法規(guī)制和監(jiān)管實(shí)效不彰的原因在一定程度上存在于司法權(quán)力者或者算法設(shè)計(jì)者、使用者的主體主觀層面，而非純粹的算法適用不能。因此，面對(duì)算法證據(jù)適用的實(shí)體困境，不能采取放任或默許的態(tài)度，而應(yīng)在法律維度設(shè)計(jì)具有應(yīng)用限制和技術(shù)引導(dǎo)作用的正當(dāng)化程序，減少主觀意識(shí)及其它局限對(duì)算法證據(jù)結(jié)果正義的影響。當(dāng)前算法證據(jù)的收集與審查運(yùn)用程序尚處于規(guī)則真空狀態(tài)，難以切實(shí)地保障算法證據(jù)適用的合理性、可靠性。具體體現(xiàn)在以下三個(gè)方面。

1. 數(shù)據(jù)選擇與算法設(shè)計(jì)監(jiān)督程序

在實(shí)踐中，算法需要通過分析大量數(shù)據(jù)來確定“特定輸入與特定輸出之間的關(guān)系”，實(shí)現(xiàn)算法分析任務(wù)，完成從設(shè)計(jì)成型到解決具體問題的轉(zhuǎn)變。這一過程可稱之為算法證據(jù)收集的前置程序。在此前置程序中，應(yīng)當(dāng)保證算法設(shè)計(jì)所需的訓(xùn)練、驗(yàn)證和測(cè)試數(shù)據(jù)集具備相關(guān)性和代表性，以更切實(shí)地實(shí)現(xiàn)算法運(yùn)用的預(yù)期目的。但由于當(dāng)前算法技術(shù)使用的“偵查中心主義”，算法證據(jù)收集的前置程序缺乏外部監(jiān)督，呈現(xiàn)出封閉性的特征，進(jìn)而增加了審查數(shù)據(jù)集選擇、存儲(chǔ)、傳輸和處理過程是否符合《數(shù)據(jù)安全法》等相關(guān)法律法規(guī)要求的難度，降低了算法的透明度。當(dāng)然，國(guó)家公共利益或偵查秘密原則或許能夠成為算法證據(jù)收集前置程序封閉的理由，但算法的技術(shù)性、復(fù)雜性以及算法證據(jù)適用的實(shí)際風(fēng)險(xiǎn)，決定了其與傳統(tǒng)證據(jù)的收集存在著實(shí)質(zhì)差異。因此，在數(shù)字時(shí)代背景下，更應(yīng)當(dāng)關(guān)注的是偵查程序的轉(zhuǎn)型與價(jià)值革新，而非絕對(duì)的偵查秘密原則。

2. 結(jié)果告知與解釋程序

司法程序的核心是公正和透明，而公正和透明的關(guān)鍵在于司法人員對(duì)程序結(jié)果的告知和解釋，這是被追訴人知情權(quán)的應(yīng)有之義。算法證據(jù)作為技術(shù)與法律結(jié)合的產(chǎn)物，其專業(yè)性是被追訴人所難以理解的，強(qiáng)調(diào)對(duì)算法證據(jù)事實(shí)的解釋與說明，有利于被追訴人權(quán)利保障的充分性和有效性，否則，被追訴人將因此陷入知情難、辯護(hù)難的境地。此外，算法證據(jù)的特殊性決定了被追訴人應(yīng)及時(shí)知悉并獲取算法證據(jù)事實(shí)信息，以消解算法技術(shù)適用所帶來的權(quán)利侵害。但同時(shí)算法證據(jù)結(jié)果的告知與解釋也可能帶來一定的訴訟妨害，因此為兼顧案件辦理的順利性，在特殊情況下，可對(duì)被追訴人算法證據(jù)知情權(quán)予以適當(dāng)限制，但在條件允許時(shí)，應(yīng)當(dāng)及時(shí)告知與解釋算法證據(jù)事實(shí)?？傮w而言，針對(duì)算法證據(jù)事實(shí)的告知與解釋問題，目前尚存在理論架構(gòu)與司法實(shí)現(xiàn)之間的程序鴻溝。（1）算法證據(jù)結(jié)果的告知程序。根據(jù)《刑事訴訟法》第148 條的規(guī)定，偵查機(jī)關(guān)應(yīng)當(dāng)將用作證據(jù)的鑒定意見告知犯罪嫌疑人、被害人。算法證據(jù)作為專門性問題報(bào)告，而非鑒定意見，是否可以適用前述規(guī)定并不明確。即便可以參照適用該條規(guī)定，由于規(guī)定過于寬泛化，如告知的時(shí)間、方式等并無說明，且缺乏對(duì)證據(jù)結(jié)果進(jìn)行輔助解釋的要求，因此難以達(dá)到被追訴人知情權(quán)的預(yù)期權(quán)利效果。（2）程序性算法證據(jù)結(jié)果的告知與解釋程序。立法層面缺乏對(duì)程序性算法證據(jù)結(jié)果告知與解釋的有效程序設(shè)計(jì)。雖然我國(guó)近年來已逐步試點(diǎn)使用算法評(píng)估系統(tǒng)量化評(píng)估逮捕社會(huì)危險(xiǎn)性，但對(duì)于算法證據(jù)結(jié)果的說理性不夠，評(píng)估程序較為形式化。（3）實(shí)體性算法證據(jù)結(jié)果的告知與解釋程序。被追訴人實(shí)現(xiàn)其算法證據(jù)知情權(quán)似乎還可以《刑事訴訟法》第40 條有關(guān)閱卷權(quán)的規(guī)定為依據(jù)，但仍存在如下程序障礙：其一，知情權(quán)主體?！缎淌略V訟法》第40 條僅規(guī)定了辯護(hù)人的閱卷權(quán)，被追訴人能否查閱包括算法證據(jù)在內(nèi)的案卷材料尚處于法律爭(zhēng)議狀態(tài)。其二，知情時(shí)間?！缎淌略V訟法》第40 條僅將閱卷的起始時(shí)間限定為案件審查起訴之日，這不僅與算法證據(jù)產(chǎn)生時(shí)間的多元性（如人臉識(shí)別算法證據(jù)產(chǎn)生于偵查環(huán)節(jié)、量刑算法證據(jù)則可能產(chǎn)生于審判環(huán)節(jié)）相沖突，也可能違背了算法證據(jù)知情的及時(shí)性要求。雖然《刑事訴訟法》第38 條規(guī)定了辯護(hù)律師在偵查期間可以向偵查機(jī)關(guān)了解犯罪嫌疑人涉嫌的罪名和案件有關(guān)情況，提出意見，但根據(jù)《公安機(jī)關(guān)辦理刑事案件程序規(guī)定》第50 條的規(guī)定，“案件有關(guān)情況”應(yīng)當(dāng)包括當(dāng)時(shí)已查明的該罪的主要事實(shí)，犯罪嫌疑人被采取、變更、解除強(qiáng)制措施以及延長(zhǎng)偵查羈押期限等情況，而在案證據(jù)包括算法證據(jù)并不屬于“案件有關(guān)情況”，不在證據(jù)開示范圍內(nèi)。其三，知情方式。一方面，從一定意義上來說，閱卷僅為辯方對(duì)證據(jù)事實(shí)信息的被動(dòng)知曉，這與司法辦案人員對(duì)算法證據(jù)事實(shí)的主動(dòng)告知要求存在質(zhì)的區(qū)別；另一方面，閱卷權(quán)內(nèi)容并未直接體現(xiàn)出司法辦案機(jī)關(guān)對(duì)證據(jù)事實(shí)的解釋或加重解釋義務(wù)，這與算法證據(jù)的說理解釋性適用不相適配。當(dāng)然，根據(jù)司法解釋的規(guī)定，偵查人員、技術(shù)人員或?qū)＜易C人可以出庭參與訴訟，對(duì)算法證據(jù)的生成與適用作出闡釋和說明，但這可能變相違背了被追訴人算法證據(jù)知情權(quán)的及時(shí)性要求，也不利于將被追訴人置于辯解與辯護(hù)的優(yōu)勢(shì)地位，實(shí)現(xiàn)控辯平等對(duì)抗。

3. 異議或質(zhì)證程序

對(duì)于算法證據(jù)結(jié)果，被追訴人有權(quán)提出異議，并要求相關(guān)人員對(duì)可能存在的問題進(jìn)行解釋和澄清，異議內(nèi)容包括但不限于數(shù)據(jù)收集的過程、數(shù)據(jù)處理的方法、分析所用的算法以及算法證據(jù)的可靠性。推動(dòng)落實(shí)算法證據(jù)異議權(quán)是維護(hù)司法公正和保障被追訴人合法權(quán)益的必然要求，有利于促進(jìn)算法技術(shù)應(yīng)用的科學(xué)性和嚴(yán)謹(jǐn)性，確保算法分析結(jié)果的公正性和合理性。當(dāng)前對(duì)算法證據(jù)提出異議或質(zhì)證的程序性規(guī)則缺位問題較為突出，尤其是對(duì)于部分程序性算法證據(jù)事實(shí)而言，由于缺乏兩造平等對(duì)抗的程序性構(gòu)造，嚴(yán)格的質(zhì)證活動(dòng)難以開展，增加了算法證據(jù)事實(shí)不確定性的可能。不過，即便對(duì)算法證據(jù)開展質(zhì)證程序，仍可能存在程序?qū)嵸|(zhì)性不夠的問題。原因在于，一方面，質(zhì)證程序的強(qiáng)職權(quán)主義色彩。雖然我國(guó)正在積極探索引入對(duì)抗式庭審模式的合理做法作為司法改革的重要方向，但由于長(zhǎng)期受到職權(quán)主義訴訟模式的影響，加之諸如證人出庭作證和證據(jù)展示等相關(guān)制度尚未完備，當(dāng)前質(zhì)證程序仍具有明顯的職權(quán)主義色彩。司法人員在質(zhì)證過程中發(fā)揮著絕對(duì)的主導(dǎo)作用，決定著質(zhì)證程序的啟動(dòng)、進(jìn)行及終結(jié)。另一方面，算法證據(jù)的形式性審查。作為專門性問題報(bào)告的算法證據(jù)，對(duì)其審查與運(yùn)用主要參照鑒定意見進(jìn)行。在司法質(zhì)證實(shí)踐中，控辯雙方很少會(huì)對(duì)鑒定意見背后的科學(xué)原理提出質(zhì)疑，司法人員針對(duì)鑒定意見的審查也主要是一種對(duì)外在表象的審查，即主要根據(jù)鑒定人員資格、鑒定意見形式、專門性知識(shí)在專業(yè)內(nèi)的接受程度等這些外在形式，推測(cè)專門性意見的可靠程度，而基本上不對(duì)鑒定意見進(jìn)行實(shí)質(zhì)審查。

四、算法證據(jù)的重述：適用理念與規(guī)則

（一）算法證據(jù)適用的理念先行

1. 事實(shí)認(rèn)定的輔助性

機(jī)器算法能夠依據(jù)外部環(huán)境的反饋進(jìn)行自我動(dòng)態(tài)調(diào)整，使得其結(jié)果輸出帶有一定的不確定性。這種不確定性決定了算法證據(jù)在事實(shí)認(rèn)定過程中的輔助性地位。“輔助性”包含三層含義：其一，尊重人的主體性。維護(hù)人類在司法決策中的主體角色，確保算法證據(jù)對(duì)事實(shí)的認(rèn)定僅為輔助而非主導(dǎo)作用，以防止可能隱藏在算法證據(jù)中的“認(rèn)知偏見”等不公正因素對(duì)事實(shí)認(rèn)定產(chǎn)生負(fù)面效應(yīng)。例如在網(wǎng)絡(luò)犯意證明中，算法證據(jù)對(duì)主觀方面的證明應(yīng)當(dāng)是初步的、參考性的，其重要作用在于證據(jù)指引或事實(shí)驗(yàn)證。至于算法證據(jù)的證據(jù)能力和證明力的實(shí)質(zhì)性評(píng)估問題，則需由司法人員依據(jù)法律規(guī)定、經(jīng)驗(yàn)法則等價(jià)值標(biāo)準(zhǔn)進(jìn)行綜合判斷。其二，算法證據(jù)不宜單獨(dú)作為事實(shí)認(rèn)定的依據(jù)。一方面，當(dāng)算法證據(jù)為間接證據(jù)或僅能夠證明中間事實(shí)時(shí)，其需要結(jié)合其他證據(jù)或其他幾組證據(jù)對(duì)事實(shí)加以認(rèn)定；另一方面，如果強(qiáng)調(diào)算法證據(jù)對(duì)待證事實(shí)的單獨(dú)直接證明作用，則可能導(dǎo)致司法人員對(duì)算法證據(jù)的過度依賴，進(jìn)而會(huì)忽視其他類型的證據(jù)和傳統(tǒng)的事實(shí)調(diào)查方法，并最終影響對(duì)案件事實(shí)的全面性和多角度的考量。其三，算法證據(jù)事實(shí)的可推翻性。算法證據(jù)事實(shí)僅具有參考性，可以被司法人員在給出適當(dāng)理由后予以推翻。當(dāng)前，已有部分地區(qū)如上海、貴州在刑事司法中探索使用集多項(xiàng)技術(shù)于一體的人工智能輔助系統(tǒng)。以上?！靶淌掳讣悄茌o助辦案系統(tǒng)”（又稱“206 工程”）為例，該系統(tǒng)有別于依賴知識(shí)庫(kù)的傳統(tǒng)專家系統(tǒng)，其通過機(jī)器學(xué)習(xí)算法，在龐大的數(shù)據(jù)集輔助下進(jìn)行持續(xù)的學(xué)習(xí)與訓(xùn)練，以此實(shí)現(xiàn)功能的持續(xù)迭代和優(yōu)化，發(fā)揮著社會(huì)危險(xiǎn)性評(píng)估、量刑輔助等功能。未來在算法證據(jù)適用過程中，應(yīng)當(dāng)進(jìn)一步規(guī)范算法證據(jù)的適用場(chǎng)域，重申其對(duì)事實(shí)認(rèn)定的輔助性作用。

2. 技術(shù)性正當(dāng)程序

證據(jù)的收集與適用應(yīng)當(dāng)遵循正當(dāng)程序原則。算法證據(jù)的適用能夠極大地提高事實(shí)認(rèn)定的效率，但其同時(shí)給司法公正性帶來了沖擊。就我國(guó)司法制度發(fā)展的基本方向來看，首先應(yīng)當(dāng)強(qiáng)調(diào)建立一套公正司法的程序機(jī)制，然后才能在司法公正的前提下追求訴訟效率。在當(dāng)前數(shù)字技術(shù)高速發(fā)展的態(tài)勢(shì)下，公正司法的程序機(jī)制構(gòu)建還應(yīng)當(dāng)結(jié)合時(shí)代特色尋求新發(fā)展?？梢钥紤]將融合技術(shù)適用特點(diǎn)作為構(gòu)建公正司法程序機(jī)制的重要著力點(diǎn)。對(duì)此，美國(guó)學(xué)者丹尼爾·西特倫（Danielle Citron）提出了“技術(shù)性正當(dāng)程序”理念，具體包括，其一，確保結(jié)果告知的實(shí)質(zhì)性。算法系統(tǒng)應(yīng)當(dāng)具備審計(jì)跟蹤（audit trails）的功能，記錄支持其決策的事實(shí)和規(guī)則，以提高算法運(yùn)行的透明度，確保算法運(yùn)行結(jié)果告知的實(shí)質(zhì)性。其二，聽證。一方面，調(diào)整Mathews 標(biāo)準(zhǔn)。Mathews v. Eldridge 案中的成本效益分析方法被用于判斷被追訴人在生命、自由或財(cái)產(chǎn)受到威脅時(shí)應(yīng)否享有正當(dāng)程序聽證權(quán)。傳統(tǒng)的Mathews 測(cè)試標(biāo)準(zhǔn)主要考慮了三個(gè)因素：個(gè)人利益的價(jià)值、額外或替代程序的可能收益，以及政府為此付出的成本，包括額外保障措施的成本。然而，在技術(shù)深度嵌入司法的背景下，應(yīng)以更現(xiàn)實(shí)的方式如比較錯(cuò)誤糾正措施的固定成本與未來收益、算法系統(tǒng)的特性、專家證言的價(jià)值等，判斷是否對(duì)在算法自動(dòng)化決策中發(fā)現(xiàn)的錯(cuò)誤進(jìn)行聽證。另一方面，聽證官員應(yīng)詳細(xì)說明算法系統(tǒng)決策的理由。其三，制定透明度和問責(zé)性規(guī)則，包括公開算法系統(tǒng)的源代碼、測(cè)試系統(tǒng)軟件以及允許公眾參與算法系統(tǒng)的構(gòu)建。“技術(shù)性正當(dāng)程序”理念可為我國(guó)刑事司法中算法證據(jù)適用的程序機(jī)制構(gòu)建提供一定的方向指導(dǎo)和方法借鑒。不過從根本意義上來說，在技術(shù)與司法的交融中，只有將人的主體性以及對(duì)人性尊嚴(yán)的尊重置于司法程序開展的底層邏輯之中，正當(dāng)程序理念才能在算法技術(shù)及其結(jié)果的適用中得以落實(shí)。

3. 比例原則

刑事算法證據(jù)的合理適用，以算法技術(shù)的有效規(guī)制為前提。算法技術(shù)的適用風(fēng)險(xiǎn)在刑事偵查包括預(yù)測(cè)性偵查中較為突出。應(yīng)當(dāng)在偵查活動(dòng)中落實(shí)比例原則，這是貫徹偵查理性的重要標(biāo)志。比例原則包含適合性原則、必要性原則與相稱性原則。其中，相稱性原則是對(duì)“目的—手段”實(shí)質(zhì)權(quán)衡最為直接的方法。作為偵查手段，算法技術(shù)的適用也應(yīng)符合比例原則的要求。其一，算法技術(shù)適用前，應(yīng)當(dāng)根據(jù)比例原則對(duì)算法取證措施進(jìn)行嚴(yán)格審查，判斷司法辦案人員是否存在違反適當(dāng)性和必要性的要求，確保手段的負(fù)面影響不會(huì)超過預(yù)期的偵查效果。其二，算法技術(shù)適用時(shí)，比例原則強(qiáng)調(diào)在追求公共利益的同時(shí)，應(yīng)盡量減少對(duì)個(gè)人權(quán)利的侵犯，確保個(gè)人權(quán)利得到應(yīng)有的尊重和保護(hù)。為此，一方面需要加強(qiáng)個(gè)人數(shù)據(jù)的刑事立法保護(hù)，另一方面還應(yīng)以權(quán)利受侵損最小化、危害最低為指向，在偵查的必要范圍內(nèi)選擇適當(dāng)?shù)乃惴夹g(shù)實(shí)現(xiàn)偵查目的。其三，算法技術(shù)適用后，應(yīng)及時(shí)停止算法技術(shù)對(duì)權(quán)利不必要的持續(xù)干預(yù)。如果算法技術(shù)的適用對(duì)公民權(quán)利造成了過度的限制或侵害，應(yīng)當(dāng)提供相應(yīng)的法律救濟(jì)途徑，如申訴、賠償?shù)取?/p>

（二）算法證據(jù)可靠性要素界定

算法通過其“數(shù)據(jù)輸入—算法運(yùn)作—結(jié)論輸出”的技術(shù)操作流程，似乎獨(dú)立于現(xiàn)行法律規(guī)范的范疇。但算法證據(jù)仍需符合證據(jù)“三性”才可能在刑事司法中得以適用。其中，合法性主要關(guān)注“輸入數(shù)據(jù)”的收集程序是否合法合規(guī)，關(guān)聯(lián)性主要關(guān)注算法證據(jù)事實(shí)與系爭(zhēng)事實(shí)是否存在一定的相關(guān)關(guān)系，可靠性則主要關(guān)注算法程序的可靠性和準(zhǔn)確性。合法性對(duì)證據(jù)證明力的影響較為有限，且算法證據(jù)合法性問題尚無明文規(guī)定，因此在算法證據(jù)研究中，對(duì)合法性不作特別展開。而算法證據(jù)是否具有關(guān)聯(lián)性，當(dāng)前并無明確的判斷方法。在司法證明中，證據(jù)關(guān)聯(lián)性的標(biāo)準(zhǔn)要求每一個(gè)具體的證據(jù)都必須對(duì)證明案件事實(shí)具有實(shí)質(zhì)性意義。從算法證據(jù)內(nèi)部視角來看，似乎無法完全保障算法分析的大數(shù)據(jù)的每個(gè)“項(xiàng)”均與待證事實(shí)相關(guān)，不過在整體主義證明模式下，算法證據(jù)與待證事實(shí)至少存在弱相關(guān)性。因此，只要算法運(yùn)用符合司法證明要求，其分析結(jié)果能夠證明待證事實(shí)即可。算法程序的可靠性是決定算法證據(jù)可靠性的核心因素。因此，算法證據(jù)可靠性可依據(jù)證據(jù)生成流程從數(shù)據(jù)可靠性、算法可靠性兩個(gè)層面予以明確。在這一認(rèn)識(shí)維度下，對(duì)算法證據(jù)的相關(guān)性與可靠性的判斷也呈現(xiàn)出某種程度的趨同性。

1. 數(shù)據(jù)可靠性

數(shù)據(jù)可靠性主要指的是算法“訓(xùn)練數(shù)據(jù)集”可靠性和“輸入數(shù)據(jù)”可靠性?！拜斎霐?shù)據(jù)”是指作為算法分析對(duì)象的基礎(chǔ)大數(shù)據(jù)，其是否具有可靠性主要取決于收集、對(duì)比過程中是否存在篡改、偽造以及較大誤差等情況，大數(shù)據(jù)與全數(shù)據(jù)之間的偏差是否在合理區(qū)間，數(shù)據(jù)載體是否足以確保數(shù)據(jù)的完整、準(zhǔn)確。“訓(xùn)練數(shù)據(jù)集”則是指與機(jī)器學(xué)習(xí)算法適用目的相關(guān)的，能夠用于訓(xùn)練機(jī)器學(xué)習(xí)模型的數(shù)據(jù)集合。在機(jī)器學(xué)習(xí)的過程中，算法通過從訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)模式和關(guān)系，從而構(gòu)建出一個(gè)能夠?qū)π碌臄?shù)據(jù)進(jìn)行預(yù)測(cè)或決策的模型。訓(xùn)練數(shù)據(jù)集通常由大量的樣本組成，每個(gè)樣本都包含輸入特征和對(duì)應(yīng)的標(biāo)簽或結(jié)果。輸入特征是模型用來進(jìn)行預(yù)測(cè)的數(shù)據(jù)，而標(biāo)簽是模型需要預(yù)測(cè)的目標(biāo)。例如，在圖像識(shí)別任務(wù)中，輸入特征可能是圖像的像素值，而標(biāo)簽則是圖像所代表的對(duì)象類別。保障機(jī)器學(xué)習(xí)有效性和算法證據(jù)可靠性的重點(diǎn)在于確?！坝?xùn)練數(shù)據(jù)集”的可靠性。“訓(xùn)練數(shù)據(jù)集”可靠性包括以下多方面要素：其一，數(shù)據(jù)多樣性和代表性。為了算法能夠?qū)W習(xí)到數(shù)據(jù)的多種可能性和變化，應(yīng)盡可能保證訓(xùn)練數(shù)據(jù)集包含多種樣本。多樣性有助于提高算法的泛化能力，防止其對(duì)特定類型的數(shù)據(jù)過度擬合。同時(shí)，數(shù)據(jù)集應(yīng)具有對(duì)實(shí)際問題的代表性，以代表算法可能遇到的不同場(chǎng)景。數(shù)據(jù)代表性意在突出算法結(jié)果與司法判決的適配性。其二，數(shù)據(jù)準(zhǔn)確性、完整性和一致性。數(shù)據(jù)準(zhǔn)確性、完整性和一致性是對(duì)訓(xùn)練數(shù)據(jù)集質(zhì)量的基礎(chǔ)保障。在數(shù)據(jù)采集階段，由于“訓(xùn)練數(shù)據(jù)集”的電子數(shù)據(jù)形式?jīng)Q定了其存在內(nèi)容易破壞性和易篡改性的特性，因此，對(duì)于“訓(xùn)練數(shù)據(jù)集”的采集應(yīng)當(dāng)注重提取、保管的合法合規(guī)，不存在數(shù)據(jù)缺失和篡改情況等；在數(shù)據(jù)預(yù)處理階段，主要是對(duì)數(shù)據(jù)進(jìn)行清洗和標(biāo)注。數(shù)據(jù)清洗的目的是發(fā)現(xiàn)并糾正數(shù)據(jù)中可能存在的錯(cuò)誤，如處理缺失值、數(shù)據(jù)去重、異常值處理以及對(duì)敏感信息進(jìn)行脫敏處理。數(shù)據(jù)標(biāo)注是指對(duì)數(shù)據(jù)進(jìn)行歸類、整理、糾錯(cuò)、轉(zhuǎn)錄、翻譯和添加標(biāo)簽等操作，以生成滿足機(jī)器學(xué)習(xí)訓(xùn)練要求的數(shù)據(jù)編碼，確保數(shù)據(jù)質(zhì)量和提高機(jī)器學(xué)習(xí)算法能力。其三，數(shù)據(jù)數(shù)量充分性。理論上，“訓(xùn)練數(shù)據(jù)集”應(yīng)足夠大，以便模型能夠從中學(xué)習(xí)到足夠的信息。然而，也需要避免數(shù)據(jù)集過大導(dǎo)致訓(xùn)練效率低下或者過擬合的問題，合理的數(shù)據(jù)量規(guī)劃應(yīng)根據(jù)實(shí)際需求和資源限制進(jìn)行。

2. 算法可靠性

其一，算法選擇的適當(dāng)性。機(jī)器學(xué)習(xí)算法模型通?？梢苑譃槿悾罕O(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。監(jiān)督學(xué)習(xí)是從有標(biāo)記的訓(xùn)練數(shù)據(jù)中學(xué)習(xí)一個(gè)模型，然后根據(jù)這個(gè)模型對(duì)未知樣本進(jìn)行預(yù)測(cè)。常見的監(jiān)督學(xué)習(xí)算法包括回歸分析和統(tǒng)計(jì)分類。無監(jiān)督學(xué)習(xí)又稱為非監(jiān)督式學(xué)習(xí)，它的輸入樣本并不需要標(biāo)記，而是自動(dòng)從樣本中學(xué)習(xí)特征實(shí)現(xiàn)預(yù)測(cè)。常見的無監(jiān)督學(xué)習(xí)算法有聚類和關(guān)聯(lián)分析等。強(qiáng)化學(xué)習(xí)是通過觀察來學(xué)習(xí)做成什么樣的動(dòng)作。每個(gè)動(dòng)作都會(huì)對(duì)環(huán)境有所影響，學(xué)習(xí)對(duì)象根據(jù)觀察到的周圍環(huán)境的反饋來做出判斷。強(qiáng)化學(xué)習(xí)強(qiáng)調(diào)如何基于環(huán)境而行動(dòng)，以取得最大化的預(yù)期利益。在刑事司法中8hW5J5aeaoYoiYDEbYiR/Q4tEu1FlL4G/VlL5KhcO3g=，監(jiān)督學(xué)習(xí)可用于行為預(yù)測(cè)、案件分類、量刑建議等多種場(chǎng)景，無監(jiān)督學(xué)習(xí)主要用以解決涉案數(shù)據(jù)聚類問題，強(qiáng)化學(xué)習(xí)則側(cè)重于解決偵查決策問題。為保障算法可靠性，在處理特定司法問題時(shí)，應(yīng)根據(jù)適用目的、環(huán)境等選擇適當(dāng)?shù)乃惴?。例如，在網(wǎng)絡(luò)販毒案件中，偵查人員為明確涉毒嫌疑人的社會(huì)關(guān)系網(wǎng)絡(luò)，偵查毒品犯罪鏈條，可以通過無監(jiān)督學(xué)習(xí)算法對(duì)犯罪嫌疑人社交設(shè)備中的通聯(lián)記錄進(jìn)行分析，以數(shù)據(jù)的聚類結(jié)構(gòu)來追溯上下游犯罪或者篩選犯罪嫌疑人的密切聯(lián)絡(luò)人。其二，算法模型復(fù)雜度與簡(jiǎn)潔性的平衡。算法模型的復(fù)雜度決定了其擬合數(shù)據(jù)的能力。過于復(fù)雜的模型可能會(huì)導(dǎo)致過擬合，而過于簡(jiǎn)單的模型則可能會(huì)導(dǎo)致欠擬合。選擇適當(dāng)?shù)乃惴Ｐ蛷?fù)雜度，以及使用正則化等技術(shù)來避免過擬合，是提高算法可靠性的關(guān)鍵之一。其三，穩(wěn)定性。穩(wěn)定性是算法對(duì)數(shù)據(jù)變化敏感性的評(píng)估，算法的穩(wěn)定性與可靠性成正相關(guān)關(guān)系。對(duì)此，可以通過在不同數(shù)據(jù)集上訓(xùn)練模型，并比較其性能的變化來評(píng)估穩(wěn)定性。其四，可解釋性。可解釋性包括兩方面內(nèi)容，其一，算法可解釋性。算法分析結(jié)果需要能夠被當(dāng)事人和社會(huì)公眾理解，因此選擇的算法應(yīng)當(dāng)具備一定的可解釋性，使得其分析過程和結(jié)果相對(duì)透明，從而提高其可靠性。其二，參數(shù)可解釋性。在工程技術(shù)領(lǐng)域，參數(shù)通常被認(rèn)為具有較高的技術(shù)客觀性。但當(dāng)機(jī)器算法實(shí)現(xiàn)基礎(chǔ)智能，并且數(shù)據(jù)的合法性和可信度得到保障時(shí)，參數(shù)的設(shè)置往往會(huì)更多地反映算法使用者的主觀意圖，顯示出較強(qiáng)的主觀性。在這種情況下，參數(shù)的設(shè)定或選擇更容易與諸如偏見等不公正行為產(chǎn)生聯(lián)系。因此，參數(shù)可解釋性要求有助于遠(yuǎn)離技術(shù)黑盒，強(qiáng)化算法設(shè)計(jì)的監(jiān)管力度。

總之，明確數(shù)據(jù)可靠性和算法可靠性各要素：其一，有利于更好地發(fā)揮實(shí)踐中機(jī)器學(xué)習(xí)算法模型的司法適用性。其二，有利于提高在數(shù)據(jù)選擇和算法設(shè)計(jì)過程中的外部程序監(jiān)督實(shí)效，增強(qiáng)算法透明度和可解釋性。其三，有利于輔助司法辦案人員明晰算法證據(jù)可靠性的審查要點(diǎn)。不過，對(duì)于數(shù)據(jù)可靠性和算法可靠性各要素的判斷與認(rèn)定仍然需要強(qiáng)調(diào)相關(guān)技術(shù)專家的參與，算法分析結(jié)論是否可靠也需要通過專家加以檢驗(yàn)和判斷，只有確認(rèn)算法分析結(jié)論可靠，算法證據(jù)才相對(duì)具有可靠性。因此，需要確保這一過程中專家的專業(yè)資質(zhì)和中立地位。

（三）算法證據(jù)適用的程序規(guī)制

1. 算法證據(jù)取證：算法影響評(píng)估

在狹義層面上，算法證據(jù)取證實(shí)為算法證據(jù)生成。由于數(shù)據(jù)選擇與算法設(shè)計(jì)缺乏外部監(jiān)督，因此算法證據(jù)生成過程較為隱蔽。為充分保障算法證據(jù)可靠性，應(yīng)針對(duì)算法證據(jù)生成過程，構(gòu)建促進(jìn)司法算法透明、實(shí)現(xiàn)公正的算法影響評(píng)估程序機(jī)制?！八惴ㄓ绊懺u(píng)估”是指依據(jù)系統(tǒng)制定的衡量標(biāo)準(zhǔn)對(duì)自動(dòng)化決策系統(tǒng)的應(yīng)用流程、數(shù)據(jù)使用和系統(tǒng)設(shè)計(jì)等內(nèi)容進(jìn)行系統(tǒng)評(píng)判，以明確該系統(tǒng)的影響水平和風(fēng)險(xiǎn)等級(jí)的一種算法治理實(shí)踐。當(dāng)前，在美國(guó)、加拿大、歐盟等國(guó)家和地區(qū)，“算法影響評(píng)估”已被納入其人工智能監(jiān)管和問責(zé)的法律框架中。我國(guó)2023 年《信息安全技術(shù)機(jī)器學(xué)習(xí)算法安全評(píng)估規(guī)范》對(duì)此也作了相關(guān)規(guī)定。在刑事算法證據(jù)取證程序中，構(gòu)建算法影響評(píng)估程序應(yīng)從算法研發(fā)與設(shè)計(jì)、算法運(yùn)行、算法運(yùn)行結(jié)果三個(gè)方面展開。第一，算法研發(fā)與設(shè)計(jì)。雖然機(jī)器學(xué)習(xí)算法可以自我迭代和自編碼，進(jìn)而“自主自為”地形成偏見和規(guī)則，但從根本意義上來說，這僅是放大人類在初始階段植入的偏見和規(guī)則。因此應(yīng)當(dāng)在算法技術(shù)適用之初，通過確保相關(guān)技術(shù)人員在數(shù)據(jù)選擇和代碼編寫方面的目的正當(dāng)，以保障算法取證手段及其結(jié)果的公正合理。作為刑事司法算法的實(shí)際使用者，司法辦案機(jī)關(guān)應(yīng)是算法影響評(píng)估的主體。對(duì)此可由省級(jí)公檢法機(jī)關(guān)統(tǒng)籌協(xié)作，組織內(nèi)部專業(yè)部門和技術(shù)公司、科研院所、審計(jì)機(jī)構(gòu)、社會(huì)公眾等第三方中立機(jī)構(gòu)和人員，結(jié)合數(shù)據(jù)可靠性與算法可靠性等要素對(duì)算法進(jìn)行研發(fā)與設(shè)計(jì)，以及圍繞算法的合法合理、尊重隱私、安全可信進(jìn)行全面的評(píng)估和測(cè)試。第二，算法運(yùn)行。為盡可能保證機(jī)器算法運(yùn)行的穩(wěn)定性和相對(duì)可視性，并確保結(jié)果告知的實(shí)質(zhì)性，可在前述“技術(shù)性正當(dāng)程序”理念下開展“審計(jì)跟蹤”工作，即能夠追蹤到算法分析結(jié)果相應(yīng)的事實(shí)依據(jù)和法律的審計(jì)記錄。第三，算法運(yùn)行結(jié)果。一方面，算法影響評(píng)估是一個(gè)持續(xù)的過程，需要對(duì)算法進(jìn)行動(dòng)態(tài)監(jiān)測(cè)和測(cè)試，以應(yīng)對(duì)數(shù)據(jù)變化、算法更新和新的應(yīng)用場(chǎng)景。根據(jù)算法運(yùn)行結(jié)果，不斷調(diào)整和優(yōu)化算法，以減少其負(fù)面影響。另一方面，司法人員應(yīng)當(dāng)通過第三方專業(yè)機(jī)構(gòu)、人員對(duì)算法運(yùn)行結(jié)果進(jìn)行證據(jù)化審核和評(píng)估，保證算法運(yùn)行結(jié)果作為證據(jù)使用的客觀可靠性。

2. 算法證據(jù)開示：告知- 知情- 異議

第一，告知。在審前程序中，司法辦案機(jī)關(guān)應(yīng)在依據(jù)算法證據(jù)對(duì)被追訴人采取限制人身自由的相關(guān)措施前的三日內(nèi)，或者在庭前程序中，控方在審判人員組織下，在不涉及國(guó)家秘密、商業(yè)秘密、案件秘密等內(nèi)容的基礎(chǔ)上，向被追訴人、辯護(hù)人告知并解釋說明算法生成記錄，包括公開算法系統(tǒng)的源代碼，以及算法證據(jù)類型與結(jié)果。第二，知情。為避免被追訴人知而不明，首先，可以通過電子化閱卷的形式，賦予被追訴人查閱算法證據(jù)報(bào)告的權(quán)利；其次，允許被追訴人、辯護(hù)人在合理范圍內(nèi)，要求司法辦案人員提供并釋明與算法證據(jù)相關(guān)的記錄內(nèi)容；最后，應(yīng)當(dāng)賦予被追訴人、辯護(hù)人申請(qǐng)相關(guān)領(lǐng)域技術(shù)人員或者具有專門知識(shí)人幫助的權(quán)利，以輔助其認(rèn)識(shí)和理解算法證據(jù)中的事實(shí)和權(quán)利問題。第三，異議。由于算法事實(shí)認(rèn)定存在一定風(fēng)險(xiǎn)，既容易造成個(gè)人數(shù)據(jù)權(quán)益的侵害，也難以保證算法證據(jù)結(jié)果的精確無誤，因此，如果被追訴人、辯護(hù)人認(rèn)為算法證據(jù)結(jié)果錯(cuò)誤，或者因此而遭受不利后果，有權(quán)提出異議。

3. 算法證據(jù)質(zhì)證：專家輔助人參與及全面質(zhì)證

針對(duì)存在異議、嚴(yán)重影響被追訴人合法權(quán)益的ad1346a52044aa84f5a9575dd82cc1f1c9d883eabd0e398e287202e117f2878a算法證據(jù)事實(shí)，應(yīng)在訴訟化聽證程序或庭審程序中允許控辯雙方對(duì)算法證據(jù)進(jìn)行質(zhì)辯。從提升質(zhì)證效果來看，辯方應(yīng)充分行使知情權(quán)和異議權(quán)，利用專家輔助人制度，對(duì)算法證據(jù)的取得、保管、分析與使用的全流程展開質(zhì)詢。對(duì)證明力較弱、可靠性存疑的算法證據(jù)，可申請(qǐng)重新檢驗(yàn)鑒定，必要時(shí)可主動(dòng)收集對(duì)辯護(hù)有利的算法證據(jù)。從質(zhì)證內(nèi)容來看，第一，相關(guān)性。一般而言，證據(jù)內(nèi)容與待證事實(shí)之間的聯(lián)系越緊密，證據(jù)的證明力就越大，若算法證據(jù)內(nèi)容對(duì)待證事實(shí)的認(rèn)定明顯無實(shí)質(zhì)證明效用，則算法證據(jù)不具有相關(guān)性。第二，可靠性。對(duì)算法證據(jù)可靠性的質(zhì)證，可圍繞算法證據(jù)可靠性各要素展開。如針對(duì)算法模型是否排除歧視、訓(xùn)練數(shù)據(jù)是否確保純凈、參數(shù)權(quán)重是否設(shè)計(jì)公正等問題提出異議。第三，相關(guān)專家的專業(yè)資質(zhì)和中立地位。如控方技術(shù)專家與案件處理結(jié)果存在利益關(guān)系，其對(duì)算法證據(jù)解釋的可信度便存在問題。為保證專家輔助人參與質(zhì)證的實(shí)質(zhì)性，一方面，應(yīng)為專家輔助人提供必要的質(zhì)證條件，如提供對(duì)數(shù)據(jù)和算法進(jìn)行檢驗(yàn)性分析的合理時(shí)間；另一方面，賦予專家輔助人意見證據(jù)效力，提高質(zhì)證意見的訴訟影響力和可審查性。

4. 算法證據(jù)認(rèn)證：排除合理懷疑

判斷算法證據(jù)有無證據(jù)能力以及證明力的大小，需要司法裁判人員在充分聽取控辯雙方質(zhì)證意見，并結(jié)合自身經(jīng)驗(yàn)的基礎(chǔ)上做出判斷。但算法證據(jù)要成為事實(shí)認(rèn)定的依據(jù)，必須達(dá)到排除合理懷疑的標(biāo)準(zhǔn)。有觀點(diǎn)認(rèn)為在我國(guó)刑事訴訟中，排除合理懷疑是對(duì)總體證據(jù)適用的要求，屬于概括性證據(jù)標(biāo)準(zhǔn)，但如果算法證據(jù)本身存在無法排除的合理懷疑，這可能會(huì)影響整體證據(jù)鏈的可靠性，從而帶來證明上的風(fēng)險(xiǎn)。因此，應(yīng)當(dāng)采取排除合理懷疑的標(biāo)準(zhǔn)對(duì)算法證據(jù)加以認(rèn)定。同時(shí)，由于“合理”源于主觀認(rèn)知對(duì)客觀現(xiàn)實(shí)的反映，為防止司法裁判人員對(duì)排除合理懷疑標(biāo)準(zhǔn)適用的主觀恣意，一方面，可以進(jìn)一步完善專家咨詢制度，建立健全司法專家數(shù)據(jù)庫(kù)，要求技術(shù)咨詢專家或司法技術(shù)人員對(duì)算法證據(jù)審查認(rèn)定的司法幫助，以彌補(bǔ)司法裁判人員自身對(duì)相關(guān)算法科學(xué)知識(shí)的空缺；另一方面，應(yīng)當(dāng)建立司法裁判人員對(duì)算法證據(jù)審查認(rèn)定結(jié)果的說理制度和對(duì)辯護(hù)意見的回應(yīng)機(jī)制，以實(shí)現(xiàn)排除合理懷疑標(biāo)準(zhǔn)適用的相對(duì)客觀化，確保裁判的公信力。

法治研究2024年6期

法治研究的其它文章: 輕罪治理背景下我國(guó)刑事案件程序分流體系之完善; 生成式人工智能反壟斷論綱; 論人工智能治理體系中綠色原則的建構(gòu)方式; 歐盟生成式人工智能立法實(shí)踐及鏡鑒; 涉外法治下我國(guó)南極立法的思考; 涉外法制的回歸與超越

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

數(shù)字時(shí)代刑事證據(jù)運(yùn)用的風(fēng)險(xiǎn)及其規(guī)制