□ 張若楓
充分運(yùn)用人工智能技術(shù)、建設(shè)智慧法院已成為深化司法改革、推動(dòng)審判體系和審判能力現(xiàn)代化的重要引擎。最高人民法院發(fā)布的《人民法院信息化五年發(fā)展規(guī)劃(2021—2025)》,要求基于大數(shù)據(jù)管理和服務(wù)平臺(tái)構(gòu)建智慧法院大腦,匯聚人民法院已有和將有的人工智能共性能力,為各類應(yīng)用提供智能化支持[1]。人工智能可以模擬人類諸如判斷、預(yù)測(cè)等認(rèn)知能力,甚至具備優(yōu)越于常人的存儲(chǔ)、計(jì)算能力,由此不難想象“人工智能+審判”令人振奮的前景:機(jī)器人法官如無(wú)人駕駛汽車一般,游刃有余地分析路線(案由),根據(jù)隨機(jī)路況(具體案件事實(shí))操控方向盤(適用法律),能夠處理各種突發(fā)意外(法律適用疑難問(wèn)題),高速又安全(公正、高效)地抵達(dá)終點(diǎn)(作出裁判)。但面臨的難題是,如何量化審判活動(dòng)以便讓機(jī)器深度學(xué)習(xí),如何將法官的思維過(guò)程轉(zhuǎn)化為計(jì)算機(jī)的算法,從而得出正確答案?筆者選擇目前機(jī)器學(xué)習(xí)領(lǐng)域應(yīng)用最廣的“神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)”,適用于程序證據(jù)規(guī)則相對(duì)嚴(yán)苛、自由裁量空間相對(duì)限縮的刑事案件,試圖將算法與審判規(guī)律、法官思維相融合,建立人工智能判案的初級(jí)模型。
談及人工智能在司法領(lǐng)域的應(yīng)用時(shí),總有一種擔(dān)憂的聲音,認(rèn)為法官將被機(jī)器取而代之,從而延伸出一系列對(duì)人工智能進(jìn)行倫理規(guī)制的討論。遺憾的是,這種杞人之憂恐怕為時(shí)尚早,人工智能在我國(guó)司法領(lǐng)域的運(yùn)用程度還處于初級(jí)階段,甚至勉強(qiáng)稱之為“智能”。
與商業(yè)主體自主、分散式的研發(fā)工作不同,法院推行審判信息化大體遵循自上而下、謀篇布局的模式:2016年7月中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)的《國(guó)家信息化發(fā)展戰(zhàn)略綱要》中首次將“智慧法院”建設(shè)納入國(guó)家信息化發(fā)展戰(zhàn)略[2],次年國(guó)務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》明確了人工智能在審判領(lǐng)域的應(yīng)用方向和功能定位[3],繼而信息化建設(shè)順理成章地納入人民法院的發(fā)展目標(biāo)與工作重點(diǎn)[4],2017年《最高人民法院關(guān)于加快建設(shè)智慧法院的意見(jiàn)》制定了智慧法院建設(shè)的路線圖。隨后,各地法院紛紛運(yùn)用大數(shù)據(jù),開(kāi)發(fā)人工智能系統(tǒng)。
誠(chéng)然,國(guó)家信息化的發(fā)展戰(zhàn)略和司法系統(tǒng)審判信息化的頂層設(shè)計(jì)是有充分依據(jù)的:人工智能遵循了法律思維的形式理性,能夠限制法官行使自由裁量權(quán),避免冤假錯(cuò)案,實(shí)現(xiàn)同案同判,提高司法效率……但是這些主觀預(yù)期的實(shí)現(xiàn)程度究竟如何?筆者通過(guò)主觀訪談了解到,與專業(yè)法官會(huì)議、訴訟參與主體發(fā)表的意見(jiàn)相比,智能審判系統(tǒng)的輔助作用不盡如人意,法官利用率較高的系統(tǒng)功能集中在類案推送、法律法規(guī)檢索和量刑建議,也就是說(shuō),智能審判系統(tǒng)多是作為“資料庫(kù)”使用的,在審查判斷證據(jù)、認(rèn)定法律事實(shí)、形成裁判結(jié)論等方面發(fā)揮的作用不明顯。實(shí)際參與審判的法院工作人員并未體會(huì)到信息化帶來(lái)的巨大效用,人工智能在輔助判案領(lǐng)域的核心功能利用率較低或者欠開(kāi)發(fā),二者尚未深度融合。
在全國(guó)法院推行信息化建設(shè)的進(jìn)程中,“智慧法院”捷報(bào)頻傳,筆者通過(guò)收集最高人民法院官方紙媒刊登的經(jīng)驗(yàn)做法,選取較有代表性、先進(jìn)性的B直轄市[5]、S直轄市[6]、C直轄市[7]、 J省[8]、G省[9]為實(shí)踐樣本,排除了司法公開(kāi)、訴訟服務(wù)、審判管理等與輔助法官判案無(wú)關(guān)的功能,梳理各智能系統(tǒng)的開(kāi)發(fā)原理和運(yùn)行效果(表1)。
表1 五省市審判智能系統(tǒng)的運(yùn)行功能
受資料來(lái)源限制,以上信息與實(shí)際運(yùn)行情況恐稍有偏差,但是不難看出審判智能系統(tǒng)的基本框架,各樣本的識(shí)別、分析、處理能力可見(jiàn)一斑。那么它們是如何習(xí)得這些能力的呢?筆者歸納為以下三種類型。
1.“死記硬背式”學(xué)習(xí)
“死記硬背式”的機(jī)器就像一個(gè)圖書(shū)館,能夠存放大量信息,以備在需要時(shí)原封不動(dòng)地提取出來(lái)。這種系統(tǒng)從事的只是機(jī)械地存儲(chǔ)和檢索工作,根據(jù)具體案件情況匹配、檢索相似案例和相關(guān)法律法規(guī),進(jìn)行相似度排序,推送給法官。這些處理操作自主性的含量很低。
2.教給機(jī)器如何去做
這是目前審判智能系統(tǒng)中應(yīng)用比較廣泛、有效的一種方式,即以“指令”的形式教給系統(tǒng)如何從大數(shù)據(jù)案例庫(kù)中查找相似案例,通過(guò)統(tǒng)計(jì)的方法生成預(yù)判結(jié)果。系統(tǒng)學(xué)習(xí)的教程大致如表2所示。
表2 指令型智能判案系統(tǒng)的運(yùn)作流程
簡(jiǎn)單說(shuō),該系統(tǒng)就是以要素匹配的方法來(lái)準(zhǔn)確鎖定類案群,保證生成的裁判建議在概率上符合以往判例,實(shí)現(xiàn)同案同判。雖然這種模型是基于大數(shù)據(jù)和算法的結(jié)合,但是系統(tǒng)在此過(guò)程中的作業(yè)依然比較機(jī)械,其“智能”在很大程度取決于給出指令的科學(xué)性,要素設(shè)置很容易以偏概全,尤其遇到復(fù)雜案件,簡(jiǎn)單的要素提取遠(yuǎn)遠(yuǎn)模擬不了法官的思維模式。解決這些問(wèn)題,就要讓系統(tǒng)擺脫人為設(shè)定的框架,自主挖掘數(shù)據(jù)、深度學(xué)習(xí),“教給機(jī)器如何去做”不如“讓機(jī)器自己學(xué)習(xí)如何去做”。
3.機(jī)器學(xué)習(xí)的雛形
S直轄市刑事案件智能輔助辦案系統(tǒng)比前兩種類型都先進(jìn),并得到中央認(rèn)可且在全國(guó)推廣。據(jù)研發(fā)人員介紹,該系統(tǒng)基于神經(jīng)網(wǎng)絡(luò)模型建構(gòu)。機(jī)器學(xué)習(xí)的大致模式為:公檢法機(jī)關(guān)的業(yè)務(wù)專家對(duì)大數(shù)據(jù)案例庫(kù)的卷宗內(nèi)容進(jìn)行精細(xì)化標(biāo)注,為機(jī)器學(xué)習(xí)提供樣例,通過(guò)大量的樣例訓(xùn)練,形成模型算法,應(yīng)用于實(shí)際操作。這在機(jī)器學(xué)習(xí)領(lǐng)域被稱為“有監(jiān)督學(xué)習(xí)”,即由專家?guī)ьI(lǐng)機(jī)器學(xué)習(xí)。
但是,由于機(jī)器學(xué)習(xí)深度不夠,依然存在一些“不智能”的問(wèn)題。以該系統(tǒng)的亮點(diǎn)之一——嵌入證據(jù)標(biāo)準(zhǔn)指引為例,筆者分析發(fā)現(xiàn)其存在以下問(wèn)題。
其一,少量專家意見(jiàn)決定證據(jù)標(biāo)準(zhǔn)。參與研發(fā)的工作人員介紹,“高院抽取精兵強(qiáng)將……幾乎天天加班,從案件審理報(bào)告和卷宗中提取具體證據(jù),分類整理法律和審判經(jīng)驗(yàn)中的證據(jù)規(guī)范,最終明確各種證據(jù)的收集程序、形式要件、內(nèi)容要素和不可采的情況”,由此可見(jiàn),證據(jù)規(guī)則的生成是辦案專家學(xué)習(xí)海量數(shù)據(jù)的結(jié)果。誠(chéng)然,專家意見(jiàn)具有正當(dāng)性,但在發(fā)現(xiàn)證據(jù)、篩選有用證據(jù)和進(jìn)行法律價(jià)值評(píng)判的過(guò)程中,專家認(rèn)知畢竟具有個(gè)體差異性,機(jī)器學(xué)習(xí)的應(yīng)當(dāng)是數(shù)以千萬(wàn)的法官的思維,而不是少量專家的意見(jiàn)。
其二,訓(xùn)練集的先天不足易陷入“案卷中心主義”。S市辦案系統(tǒng)的研發(fā)初衷是“推進(jìn)以審判為中心的訴訟制度改革”,在實(shí)際運(yùn)行中,系統(tǒng)確實(shí)能夠通過(guò)證據(jù)校驗(yàn)功能提示辦案人員進(jìn)行補(bǔ)強(qiáng),從而貫徹證據(jù)裁判原則。但是,“以審判為中心”不僅是以審判的證據(jù)標(biāo)準(zhǔn)倒逼偵查、審查起訴階段的取證工作,而且是庭審實(shí)質(zhì)化,舉證質(zhì)證和裁判形成在法庭。然而,以案卷為數(shù)據(jù)庫(kù)訓(xùn)練的系統(tǒng),就如同只學(xué)會(huì)單憑閱卷斷案的法官,缺乏對(duì)庭審信息的識(shí)別、采擇、分析能力,系統(tǒng)判案將陷入“案卷中心主義”。
其三,模型結(jié)構(gòu)單一。筆者通過(guò)電話訪談了解到,S市某基層法院法官普遍認(rèn)為,輔助辦案系統(tǒng)在單一證據(jù)校驗(yàn)上能夠?qū)崿F(xiàn)形式審查、預(yù)警提示等功能,但對(duì)案件證據(jù)鏈的分析仍然依賴人工。證據(jù)鏈?zhǔn)蔷哂衅叫?、包含、主次、因果等各種關(guān)系的證據(jù)相互鏈接構(gòu)成的,機(jī)器在處理這些關(guān)系時(shí)必須靠結(jié)構(gòu)分層實(shí)現(xiàn),即在輸入層與輸出層之間構(gòu)建多個(gè)隱含層,層次越多,能夠處理的證據(jù)鏈越復(fù)雜。
在研究如何讓機(jī)器進(jìn)行類似人的思維活動(dòng)時(shí),人們從生物神經(jīng)細(xì)胞結(jié)構(gòu)中受到啟發(fā):神經(jīng)元接受外界刺激后被“激活”,繼而會(huì)向相連的神經(jīng)元發(fā)送“信號(hào)”,在網(wǎng)狀結(jié)構(gòu)的神經(jīng)系統(tǒng)中,各神經(jīng)元相互連接、相互激發(fā)、相互協(xié)同,完成信息處理。神經(jīng)網(wǎng)絡(luò)就是這樣的類似神經(jīng)系統(tǒng)的網(wǎng)狀結(jié)構(gòu)算法體系,隨著網(wǎng)絡(luò)層級(jí)的增多,可以滿足復(fù)雜模型建構(gòu)和大數(shù)據(jù)樣本學(xué)習(xí)。將神經(jīng)網(wǎng)絡(luò)應(yīng)用于審判領(lǐng)域,是因?yàn)閷徟兴季S和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)上的同質(zhì)性,能夠使機(jī)器學(xué)習(xí)的結(jié)果符合審判規(guī)律。
“以事實(shí)為依據(jù),以法律為準(zhǔn)繩”“認(rèn)定案件事實(shí),必須以證據(jù)為依據(jù)”,這兩大原則構(gòu)成我國(guó)刑事訴訟裁判的基本遵循:證據(jù)—事實(shí)—法律評(píng)價(jià)。對(duì)神經(jīng)網(wǎng)絡(luò)而言,接收的信息是證據(jù),輸出的結(jié)果是裁判結(jié)論,那么如何演繹處理證據(jù)的過(guò)程才最符合法官的思維呢?這個(gè)過(guò)程顯然不是只做一次大前提和小前提的三段論推理這么簡(jiǎn)單。恩吉施曾提及的“在大前提與生活事實(shí)間之眼光的往返流轉(zhuǎn)”[10],筆者用思維導(dǎo)圖展示(圖1)。雖然機(jī)器學(xué)習(xí)還有決策樹(shù)、支持向量機(jī)(適合兩分類問(wèn)題)等許多類型,但受限于結(jié)構(gòu),均難以模擬這種復(fù)雜的思維過(guò)程。
圖1 案件事實(shí)與法律規(guī)定之間往返流轉(zhuǎn)的思維導(dǎo)圖
事實(shí)上,一個(gè)案件中包含的證據(jù),更像是老中醫(yī)開(kāi)出的藥方,每味藥都有各自的功效(證據(jù)的法律意義),在相互促進(jìn)(印證)或者排斥(矛盾)下,共同發(fā)揮療效(證明結(jié)果)。在這個(gè)體系中,證據(jù)和證據(jù)之間、證據(jù)和法律事實(shí)之間其實(shí)是一張聯(lián)通的網(wǎng),網(wǎng)中各點(diǎn)連接的強(qiáng)度取決于法官對(duì)單個(gè)證據(jù)證明力、證據(jù)之間關(guān)系的主觀評(píng)價(jià),其中包含各種“與”“或”“非”的運(yùn)算,這恰好符合神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。
早在18—19世紀(jì),法律形式主義就為機(jī)器判案提供了理論依據(jù)。該理論主張“法律推理應(yīng)該依據(jù)客觀事實(shí)、明確的規(guī)則以及邏輯去解決一切被法律所要求的具體行為”[11]。由于機(jī)器具有計(jì)算精神和嚴(yán)峻克制的風(fēng)格,這種裁判的邏輯應(yīng)當(dāng)是人工智能擅長(zhǎng)的。但是案件事實(shí)不全是非黑即白:指向兩種不同事實(shí)的證據(jù)可能勢(shì)均力敵,法律對(duì)某一要件事實(shí)可能欠缺精確的界限而留有中間地帶……都需要法官在兩個(gè)或更多的“均無(wú)不可”的判斷中作出選擇,憑借的就是經(jīng)驗(yàn)。對(duì)于機(jī)器而言,經(jīng)驗(yàn)就是“數(shù)據(jù)”。處理隨機(jī)疑難事件的邏輯指令是無(wú)法預(yù)先給定的,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)是通過(guò)挖掘海量數(shù)據(jù),自主解構(gòu)要素,找到要素與結(jié)果間的算法,正如資深法官經(jīng)歷的漫長(zhǎng)的經(jīng)驗(yàn)積累過(guò)程。
舉一個(gè)單層神經(jīng)網(wǎng)絡(luò)的例子:訓(xùn)練機(jī)器識(shí)別“惡意透支信用卡”案件中,是否構(gòu)成以“非法占有”為目的的主觀事實(shí)。首先,給機(jī)器一個(gè)可供學(xué)習(xí)的數(shù)據(jù)庫(kù)(通常稱之為“訓(xùn)練集”),如表3所示,學(xué)習(xí)的過(guò)程就是通過(guò)不斷假設(shè)、迭代、校驗(yàn),直到訓(xùn)練出一個(gè)能夠普遍適用于訓(xùn)練集所有樣本的算法(各證據(jù)與主觀事實(shí)間的潛在規(guī)律)。用符號(hào)∧代表“并且”,表達(dá)式可以寫成:非法占有=(信用記錄=?)∧(申領(lǐng)材料=?)∧(催收記錄=?)∧(消費(fèi)明細(xì)=?)∧……把其中的“?”確定下來(lái),就可以將這種算法“泛化”到新樣本,很好地適用于訓(xùn)練集以外的新案例。
表3 信用卡詐騙案例庫(kù)中關(guān)于主觀事實(shí)的訓(xùn)練集(虛構(gòu))
通說(shuō)認(rèn)為,司法證明的標(biāo)準(zhǔn)在于讓法官達(dá)到內(nèi)心確信的程度,但這并不是說(shuō)裁判是隨心所欲的,相反,自由心證的結(jié)果必須是可以驗(yàn)證的,比如另一個(gè)法官亦會(huì)就此作出相同裁判。這正如神經(jīng)網(wǎng)絡(luò)形成的算法“黑箱”,數(shù)據(jù)從一邊輸入,結(jié)果從另一邊輸出,雖然“黑箱”中的運(yùn)算原理鮮為人知,但是卻可以通過(guò)輸出結(jié)果的質(zhì)量評(píng)價(jià)算法的優(yōu)劣。那么,設(shè)想當(dāng)自由心證與算法“黑箱”碰撞時(shí)會(huì)產(chǎn)生怎樣奇妙的反應(yīng)??jī)烧咄矗继N(yùn)含著邏輯的科學(xué)和經(jīng)驗(yàn)的理性,結(jié)論應(yīng)當(dāng)相互印證。在我國(guó)刑事審判實(shí)踐中存在的一個(gè)普遍問(wèn)題:法官易受控方影響,先入為主,審判活動(dòng)成為以指控事實(shí)為“預(yù)設(shè)”開(kāi)展的一次印證,或補(bǔ)證活動(dòng)。這背離了從證據(jù)出發(fā)進(jìn)行邏輯推理、運(yùn)用經(jīng)驗(yàn)法則作出裁判的審判規(guī)律,易形成冤假錯(cuò)案。所以,以指控事實(shí)先入為主,毋寧以神經(jīng)網(wǎng)絡(luò)算法結(jié)果先入為主,后者提供的參照可能更加接近真相。
現(xiàn)有的數(shù)據(jù)集合是以樣本的每個(gè)屬性作為一個(gè)坐標(biāo)軸向外延伸的多維空間,正如同表3的各列均可視為一個(gè)坐標(biāo)向量,證據(jù)表達(dá)的內(nèi)容就是這個(gè)向量中的一個(gè)值,每個(gè)案例都是這個(gè)多維向量中的一個(gè)點(diǎn),這個(gè)點(diǎn)就代表了案件事實(shí)。空間里的所有樣本服從一個(gè)未知的“分布”(distribution),一個(gè)潛在的規(guī)律。機(jī)器學(xué)習(xí)的目的就是用模型和算法盡可能地把這個(gè)規(guī)律表達(dá)出來(lái)。神經(jīng)網(wǎng)絡(luò)提供的只是一種概念上的網(wǎng)狀模型結(jié)構(gòu),最終算法的結(jié)構(gòu)層次、參數(shù)權(quán)重都要通過(guò)大數(shù)據(jù)反復(fù)訓(xùn)練而習(xí)得,訓(xùn)練的每一個(gè)環(huán)節(jié)決定了建模結(jié)果的性能。
神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的基礎(chǔ)是海量數(shù)據(jù),“你給我多少知識(shí)(數(shù)據(jù)),我給你多少智能”[12]。數(shù)據(jù)庫(kù)建構(gòu)作為機(jī)器學(xué)習(xí)的第一步,對(duì)結(jié)果而言將是“差之毫厘,謬以千里”。
1.增容數(shù)據(jù)庫(kù)
為了使訓(xùn)練出來(lái)的模型具有強(qiáng)“泛化”能力,訓(xùn)練集的樣本必須較好地反映樣本空間的特征。目前,我國(guó)司法數(shù)據(jù)庫(kù)已初具規(guī)模,尤其是裁判文書(shū)、司法案例、法律法規(guī)幾大數(shù)據(jù)庫(kù)的容量已經(jīng)足夠達(dá)標(biāo)。但是,這些審判的成品只能部分或間接地反映法官思維,人工智能學(xué)習(xí)的必由之路在法庭。法庭是控辯交鋒的主戰(zhàn)場(chǎng),貫穿著法官的心路歷程。所以,數(shù)據(jù)庫(kù)增容的關(guān)鍵在于數(shù)據(jù)類型的多元化,除傳統(tǒng)的裁判文書(shū)、案例、案卷、法律法規(guī)數(shù)據(jù)庫(kù)外,系統(tǒng)還應(yīng)收集庭審視頻、合議庭評(píng)議音頻等記錄審判過(guò)程的數(shù)據(jù)供機(jī)器學(xué)習(xí),以訓(xùn)練機(jī)器學(xué)習(xí)庭審中的司法證明規(guī)則,而非以偵查案卷為中心的印證邏輯。當(dāng)然,OCR(optical character recognition,光學(xué)字符識(shí)別)、ASR(automated speech recognition,自動(dòng)語(yǔ)音識(shí)別)、NLP(natural language processing,自然語(yǔ)言處理)、MMML(multimodal machine learning,多模態(tài)機(jī)器學(xué)習(xí))技術(shù)的應(yīng)用為此提供了可行性。
2.清洗處理
收入數(shù)據(jù)庫(kù)的可能是視頻、圖片、文字,但這些數(shù)據(jù)應(yīng)該經(jīng)過(guò)技術(shù)處理,以便于計(jì)算機(jī)發(fā)現(xiàn)和進(jìn)行推理[13]。為了神經(jīng)網(wǎng)絡(luò)能夠更有效地學(xué)習(xí),需要對(duì)數(shù)據(jù)庫(kù)進(jìn)行適時(shí)“標(biāo)注”,分層級(jí)、分階段標(biāo)注刑事案例中的各類屬性、關(guān)系和過(guò)程,比如法律規(guī)定中的要件、要件事實(shí)和法律規(guī)定之間的關(guān)系、控訴—辯護(hù)—再控訴過(guò)程中的證明責(zé)任和證明標(biāo)準(zhǔn)、直接證明和間接證明的方式、裁判結(jié)果等?,F(xiàn)有的標(biāo)注工具,如視頻標(biāo)注工具CDVA和Vatic、圖片標(biāo)注工具LabImage和文本標(biāo)注工具BRAT等為數(shù)據(jù)庫(kù)中的視頻、圖片和文本標(biāo)注提供了有力的支撐。
從原始數(shù)據(jù)中抽取標(biāo)注信息,并進(jìn)行格式轉(zhuǎn)化,這就完成了數(shù)據(jù)庫(kù)的結(jié)構(gòu)化存儲(chǔ)的過(guò)程,抽取的信息都將成為結(jié)果輸出(裁判)的影響“因子”。案例集就如同被清洗掉雜質(zhì),再分類擺放好,成為一個(gè)標(biāo)準(zhǔn)化、類型化、向量化的數(shù)據(jù)集,做好了被機(jī)器學(xué)習(xí)的準(zhǔn)備。
3.劃分訓(xùn)練集/驗(yàn)證集/測(cè)試集
如前所述,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目的不止于形成模型,而在于“泛化”,即在遇到新案例時(shí)也能得到正確的解。因此,為了更好地訓(xùn)練模型,需要在訓(xùn)練過(guò)程中進(jìn)行微調(diào)以確保訓(xùn)練的準(zhǔn)確性,最后通過(guò)測(cè)試來(lái)評(píng)估模型的“泛化”性能。理想的做法是將數(shù)據(jù)集劃分為三個(gè)互斥的集合,一個(gè)作為訓(xùn)練集,一個(gè)作為驗(yàn)證集,一個(gè)作為測(cè)試集。訓(xùn)練集通常占數(shù)據(jù)集的2/3至4/5,用以訓(xùn)練生成模型;驗(yàn)證集用于在訓(xùn)練時(shí)對(duì)當(dāng)前模型進(jìn)行驗(yàn)證,調(diào)整模型參數(shù)和對(duì)模型進(jìn)行初步評(píng)估;測(cè)試集則用來(lái)評(píng)估誤差。驗(yàn)證集和測(cè)試集一般大小相同,通常兩者共占數(shù)據(jù)集的1/5至1/3。比如,如果通過(guò)學(xué)習(xí),誤將“使用右手”也作為構(gòu)成扒竊的要素,則屬于“過(guò)擬合”錯(cuò)誤;如果沒(méi)能將“貼身財(cái)物”作為扒竊要素,則出現(xiàn)了“欠擬合”錯(cuò)誤,均應(yīng)當(dāng)通過(guò)驗(yàn)證發(fā)現(xiàn),并及時(shí)調(diào)適,以此才能更好地保證訓(xùn)練出的模型在測(cè)試集具有較高的泛化性。
計(jì)算機(jī)得到了格式化的“訓(xùn)練集”后,基于給定數(shù)據(jù)產(chǎn)生“模型”,在遇到新案例時(shí),“模型”會(huì)提供裁判參考。構(gòu)建、調(diào)試、檢測(cè)、輸出模型的過(guò)程都依賴學(xué)習(xí)算法,這是機(jī)器學(xué)習(xí)的核心內(nèi)容。
1.單個(gè)神經(jīng)元算法
神經(jīng)網(wǎng)絡(luò)中的每個(gè)神經(jīng)元都能夠接收來(lái)自其他n個(gè)神經(jīng)元傳遞過(guò)來(lái)的輸入信號(hào),這些輸入信號(hào)通過(guò)帶權(quán)重的連接進(jìn)行傳遞,神經(jīng)元接收到的總輸入值與神經(jīng)元的閾值進(jìn)行比較,然后通過(guò)“激活函數(shù)”處理,產(chǎn)生神經(jīng)元的輸出[14]。
圖2 “非法占有”神經(jīng)元模型
圖3 神經(jīng)元的激活函數(shù)
2.“多層前饋神經(jīng)網(wǎng)絡(luò)”算法:以某類案由為例
單個(gè)神經(jīng)元的學(xué)習(xí)能力非常有限,神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于可以通過(guò)多層功能神經(jīng)元運(yùn)算復(fù)雜問(wèn)題——審判問(wèn)題。最常見(jiàn)的層級(jí)結(jié)構(gòu)是“多層前饋神經(jīng)網(wǎng)絡(luò)”:每層神經(jīng)元與下一層神經(jīng)元完全互連,神經(jīng)元之間不存在同層連接,也不存在跨層連接。筆者以“以危險(xiǎn)方法危害公共安全罪”為例展示該神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及訓(xùn)練方法。
案件事實(shí)[15]:劉某于2014年3月20日7時(shí)許,酒后駕駛,與路邊停放的小轎車發(fā)生碰撞,后駕車逃逸,在途中先后與5輛機(jī)動(dòng)車及1輛自行車相撞,導(dǎo)致車輛損壞和人員受傷。
主要證據(jù)包括:x1=劉某的供述,x2=7名被害人陳述,x3=酒精檢驗(yàn)報(bào)告(劉某血液中酒精含量為217.1mg/100ml),x4=鑒定意見(jiàn)書(shū)(1人受輕微傷)、北京市價(jià)格評(píng)估結(jié)論書(shū)(造成車輛損壞,價(jià)值24150元),x5=監(jiān)控錄像,x6=照片、道路事故責(zé)任認(rèn)定書(shū)、道路事故現(xiàn)場(chǎng)勘察筆錄,x7=受案登記表、“122”報(bào)警臺(tái)事故電話記錄表、到案經(jīng)過(guò),x8=駕駛證信息,x9=劉某身份信息等。構(gòu)建神經(jīng)網(wǎng)絡(luò)拓?fù)鋱D(圖4)。
圖4 “多層前饋神經(jīng)網(wǎng)絡(luò)”拓?fù)鋱D
以上三個(gè)表達(dá)式只是選取神經(jīng)網(wǎng)絡(luò)每一層次的某一個(gè)功能神經(jīng)元為例,事實(shí)上,每個(gè)神經(jīng)元都有輸出表達(dá)式。其中,只有輸入層各神經(jīng)元(x=現(xiàn)有證據(jù))的輸出值已知,神經(jīng)元之間的連接權(quán)重、每個(gè)功能神經(jīng)元的閾值都是變量。連接權(quán)重表示輸入端對(duì)輸出端的重要程度、貢獻(xiàn)度。比如,對(duì)主觀故意(d1)這一要素,顯然口供的權(quán)重要比其他間接證明的證據(jù)要大,而身份信息這類證據(jù)的權(quán)重可能為0。閾值是神經(jīng)元被激活的臨界值,代表某要素得以證實(shí)的標(biāo)準(zhǔn)。
再借用本節(jié)的案例,假設(shè)訓(xùn)練集中有m個(gè)以危險(xiǎn)方法危害公共安全罪案例,那么就有m個(gè)x和y的值。訓(xùn)練流程其實(shí)是一個(gè)計(jì)算機(jī)的for循環(huán)(圖5):先用初始參數(shù)正向預(yù)測(cè)結(jié)果,再根據(jù)預(yù)測(cè)結(jié)果和實(shí)際結(jié)果的誤差逆向?qū)訉诱{(diào)整參數(shù),通過(guò)一次又一次迭代、修正,最終確定誤差最小的模型。
圖5 BP算法確定連接權(quán)和閾值
表4 預(yù)測(cè)結(jié)果的混淆矩陣
刑事錯(cuò)案對(duì)司法公信力的影響是不言而喻的,預(yù)測(cè)的精確度是評(píng)價(jià)模型的標(biāo)準(zhǔn),但如果在查全率和查準(zhǔn)率不能兩全的情況下,應(yīng)當(dāng)毫不猶豫地把機(jī)器學(xué)習(xí)的偏好設(shè)置為查全率,即在訓(xùn)練、驗(yàn)證和測(cè)試的各環(huán)節(jié),將準(zhǔn)確率公式設(shè)置為查全率公式。如果錯(cuò)誤必然存在,則寧可放縱有罪的案件被判無(wú)罪,也要盡可能將所有無(wú)罪案件都預(yù)測(cè)正確,因?yàn)殄e(cuò)誤定罪比錯(cuò)判無(wú)罪代價(jià)更大。
當(dāng)然,神經(jīng)網(wǎng)絡(luò)算法即使完成上述改良,其在刑事審判領(lǐng)域的作用也不可過(guò)分夸大,價(jià)值選擇和判斷方面的先天缺陷,是其無(wú)法取代法官思維的不可破解的壁壘。
神經(jīng)網(wǎng)絡(luò)算法是通過(guò)拆分事實(shí)和證據(jù)、標(biāo)注要素進(jìn)行學(xué)習(xí)和推理的,對(duì)于法律要件與案件事實(shí)能夠無(wú)縫對(duì)應(yīng)的傳統(tǒng)類型案件,神經(jīng)網(wǎng)絡(luò)算法具有很強(qiáng)的實(shí)用性。但是,日新月異的社會(huì)發(fā)展和層出不窮的犯罪樣態(tài)帶來(lái)的新情況、新問(wèn)題,往往在法律規(guī)定的灰色地帶向司法提出考驗(yàn)和挑戰(zhàn),需要法官運(yùn)用普遍聯(lián)系的方法,調(diào)動(dòng)可用的論據(jù)導(dǎo)出結(jié)論。這些論據(jù)不僅包括整個(gè)現(xiàn)行法律體系,而且可能涉及歷史的、社會(huì)的、倫理的價(jià)值評(píng)判。如考夫曼所言,“法是某種聯(lián)系的事物,它存在于人的相互關(guān)系之中,并面對(duì)物而存在。這種法思維,只能存在一種敞開(kāi)的體系,在敞開(kāi)的體系中,只能存在主體間性,此乃不可言喻”[16]。這種創(chuàng)造性、開(kāi)放性是神經(jīng)網(wǎng)絡(luò)有限的庫(kù)存要素?zé)o法窮盡的,再智能的系統(tǒng)也是基于已知數(shù)據(jù)庫(kù)開(kāi)展“學(xué)習(xí)”,面對(duì)沒(méi)有出現(xiàn)過(guò)的陌生對(duì)象很容易出現(xiàn)“失靈”,就像某件新事物超出了一個(gè)保守派的想象范圍,需要再進(jìn)行一定數(shù)量的樣本學(xué)習(xí)周期才能積累“經(jīng)驗(yàn)”;它是很好的遵循者,而非應(yīng)變者。如果神經(jīng)網(wǎng)絡(luò)系統(tǒng)被神化、被濫用,這必將削弱司法的能動(dòng)性和自我更新能力,喪失其作為立法先驅(qū)與反饋的作用。
比如,基于“法律效果與社會(huì)效果統(tǒng)一”的裁判目標(biāo),社會(huì)輿情和訴求逐漸成為辦理熱點(diǎn)案件需要慎重考量的因素,這顯然超出一般性案件算法的預(yù)見(jiàn)范圍。不難設(shè)想該算法在處理“辱母殺人案”(可參見(jiàn)“最高人民法院指導(dǎo)案例96號(hào)于歡故意傷害案”)時(shí),無(wú)法捕捉公眾經(jīng)過(guò)“換位想象”引發(fā)的“民意風(fēng)暴”,很可能忽略褻瀆人倫的不法侵害對(duì)行為人心理和情緒的刺激,從而低估了被害方的過(guò)錯(cuò)程度,對(duì)是否構(gòu)成正當(dāng)防衛(wèi)及量刑作出決策偏差,造成裁判結(jié)果難以被社會(huì)接受。再比如,司法尺度會(huì)隨著國(guó)家治理重心的轉(zhuǎn)移而發(fā)生變化,逐漸從 “嚴(yán)懲惡性犯罪”向“化解社會(huì)矛盾”傾斜,而基于大量歷史案例建立的數(shù)據(jù)庫(kù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)系統(tǒng),容易在價(jià)值導(dǎo)向上滯后,形成固執(zhí)的“算法偏見(jiàn)”:弱化“犯罪誘因”“賠償表現(xiàn)”“到案經(jīng)過(guò)”等因素對(duì)量刑的影響力,導(dǎo)致從輕處罰或適用緩刑的門檻偏高,偏離促進(jìn)社會(huì)和諧的主流價(jià)值觀。
神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)運(yùn)用的是歸納方法,通過(guò)挖掘海量數(shù)據(jù),確定某類案件的關(guān)鍵要素、連接權(quán)重及各級(jí)神經(jīng)元的閾值,處理待證案件時(shí)直接鎖定要素,代入演算。如何借助法律實(shí)現(xiàn)正當(dāng)?shù)膫€(gè)案裁判,是司法裁判以及現(xiàn)代法學(xué)方法的核心議題[17],而神經(jīng)網(wǎng)絡(luò)系統(tǒng)這種從一般到特殊的算法與個(gè)案的彌合程度,實(shí)則是個(gè)有待商榷的問(wèn)題。關(guān)鍵要素代表的法律原則和社會(huì)價(jià)值在不同個(gè)案中的正當(dāng)性和必要性是存在差異的,有可能兩個(gè)以上的要素表達(dá)式會(huì)產(chǎn)生相反作用。無(wú)論是尋找關(guān)鍵要素,還是在此要素和彼要素之間作出選擇,都需要法官根據(jù)個(gè)案的具體情形進(jìn)行價(jià)值權(quán)衡。
比如,神經(jīng)網(wǎng)絡(luò)通過(guò)學(xué)習(xí)得出:“追逐競(jìng)駛”的行為是構(gòu)成危險(xiǎn)駕駛罪的關(guān)鍵要素,其代表的法益是“保護(hù)公共安全”。假設(shè)行為人是為了搶救生命垂危的病人而“追逐競(jìng)駛”,那么“現(xiàn)實(shí)而緊迫的生命安全”就與“公共安全的潛在危險(xiǎn)”形成矛盾,各自導(dǎo)向相反的結(jié)論,法官需要對(duì)病人病情的嚴(yán)重程度、其他救助方式的可行性及道路狀況等進(jìn)行綜合評(píng)判后作出價(jià)值選擇,確定哪個(gè)是需要優(yōu)先考慮的要素——有助于實(shí)現(xiàn)個(gè)案正義價(jià)值的要素,而不是簡(jiǎn)單套用類案的算法。再如,在神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)中,無(wú)罪判決的樣本必然占少數(shù)(這是司法現(xiàn)狀決定的),訓(xùn)練出的算法就會(huì)傾向于認(rèn)可公訴機(jī)關(guān)的指控,當(dāng)遇到類似“無(wú)證照買賣玉米無(wú)罪案”(見(jiàn)“最高人民法院指導(dǎo)案例97號(hào)非法經(jīng)營(yíng)案”)時(shí),很可能給“無(wú)照經(jīng)營(yíng)”的違法行為賦予很高的連接權(quán)重,乃至突破“有罪”神經(jīng)元的閾值,判定構(gòu)成非法經(jīng)營(yíng)罪。然而,公正的判決應(yīng)當(dāng)基于綜合評(píng)估個(gè)案中的具體行為對(duì)市場(chǎng)秩序的破壞程度,而這種評(píng)估已經(jīng)超出算法的能力,上升到價(jià)值判斷的范疇。
司法裁判是裁判者運(yùn)用法律理由、通過(guò)對(duì)話和論辯來(lái)證成判決的過(guò)程[18]。司法裁判的過(guò)程不全是嚴(yán)謹(jǐn)縝密、答案唯一的,面對(duì)證據(jù)互相矛盾、法律規(guī)定模糊的案件時(shí),擺在法官面前的是兩個(gè)以上均無(wú)不可的結(jié)論,拷問(wèn)著法官合理行使裁量權(quán)的水平[19]。這更像是進(jìn)行一場(chǎng)開(kāi)放式作答,需要通過(guò)言語(yǔ)的證立和證偽增加結(jié)果的可接受性,使正面論據(jù)表現(xiàn)得充分、飽和,反面結(jié)論被排除得毋庸置疑——這就是論證的過(guò)程。甚至有學(xué)者認(rèn)為,只要遵循了論證過(guò)程的規(guī)則,得出的結(jié)論就是有說(shuō)服力的[20]。近年來(lái),最高人民法院也不斷以印發(fā)正式文件的方式要求各級(jí)法院加強(qiáng)裁判文書(shū)釋法說(shuō)理,將其作為提升司法公信力的重要抓手。邏輯連貫、價(jià)值協(xié)調(diào)的司法論證是裁判結(jié)果可接受的有力保證,積極回應(yīng)各方意見(jiàn)是證明結(jié)果正確的必由之路,而這對(duì)神經(jīng)網(wǎng)絡(luò)系統(tǒng)恰恰是道“超綱題”,算法生成及運(yùn)用過(guò)程中的“機(jī)器語(yǔ)言”無(wú)法被一般公眾理解,人工智能提供的只是沒(méi)有過(guò)程的結(jié)果,其輔助作用只在于強(qiáng)化法官的內(nèi)心確信或者謹(jǐn)慎作出相反決定,而無(wú)論是否采納神經(jīng)網(wǎng)絡(luò)系統(tǒng)的建議,都不能省略以裁判主體的主觀能動(dòng)性去充實(shí)論證的過(guò)程。
所以,神經(jīng)網(wǎng)絡(luò)系統(tǒng)的定位必須且只能限于輔助和參考,或者可以說(shuō)作為刑事審判的特殊“參與者”,和控辯雙方一樣提出意見(jiàn),供法官考量。只是與其他參與主體不同的是,神經(jīng)網(wǎng)絡(luò)代表的是過(guò)去案例的普遍做法,角色定位更加中立,但法官同樣需要批判地審查人工智能的意見(jiàn),并拿出充分的理由論證采納或者不采納的原因。
“人工智能+審判”是一個(gè)交叉學(xué)科,需要科技知識(shí)與司法實(shí)踐深度結(jié)合,筆者的目的并非得出審判的“終極算法”,而是試圖闡明這樣一個(gè)理念:人工智能就像一面鏡子,它會(huì)反射出你展示給它的內(nèi)容。所以,在機(jī)器學(xué)習(xí)過(guò)程中,應(yīng)當(dāng)不斷地將“以審判為中心”、證據(jù)裁判原則、無(wú)罪推定等原則量化并融入算法中,讓機(jī)器預(yù)測(cè)的每一步都符合審判規(guī)律,成為科學(xué)、理性與經(jīng)驗(yàn)的完美結(jié)合。
審判思維具有隨機(jī)應(yīng)變、不可復(fù)制的特性,它比棋局更精妙,比寫詩(shī)更藝術(shù)。本文雖以“讓機(jī)器學(xué)習(xí)如何審判”為出發(fā)點(diǎn),但并不主張用人工智能替代法官(這也是不值得期待的),只是基于這種大膽假設(shè),讓人工智能最大限度接近法官思維,提供更準(zhǔn)確的參考和輔助。
華中科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2021年6期