国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

美國司法數(shù)據(jù)應(yīng)用的過去、現(xiàn)實及爭議
——兼論對我國司法大數(shù)據(jù)應(yīng)用的啟示

2020-01-09 18:39
科技與法律 2020年1期
關(guān)鍵詞:司法犯罪

涂 釩

(華東政法大學(xué)法律學(xué)院,上海200042)

引言

我國司法大數(shù)據(jù)的深度應(yīng)用助力法治工作理念創(chuàng)新、提質(zhì)增效,支撐現(xiàn)代化訴訟服務(wù)體系的全面建立。大數(shù)據(jù)應(yīng)用正持續(xù)深入司法決策體系之中,成果頗豐惠民便民。同時,也應(yīng)識別大數(shù)據(jù)陷阱,提前防范應(yīng)用風(fēng)險。因為風(fēng)險已經(jīng)在美國發(fā)生,尤以美國犯罪數(shù)據(jù)在司法實踐中的應(yīng)用爭議最為明顯。

基于美國社會的實踐經(jīng)驗和浮出表面的現(xiàn)實困境,不難發(fā)現(xiàn)這些爭議只是數(shù)據(jù)陷阱因地生發(fā)的不同面相,數(shù)據(jù)本身的陷阱及需要防范的風(fēng)險具有普遍性和本質(zhì)性,是所有裹身進入大數(shù)據(jù)和人工智能時代的國家都需審慎應(yīng)對的,尤其對已占有司法人工智能領(lǐng)域高地的我國來說,更具有現(xiàn)實意義。

一、美國傳統(tǒng)統(tǒng)計數(shù)據(jù)時代的特征與局限

傳統(tǒng)統(tǒng)計數(shù)據(jù)時代是采取傳統(tǒng)統(tǒng)計學(xué)方法,先假設(shè)后對各種犯罪相關(guān)指標(biāo)、絕對數(shù)進行驗證,將犯罪現(xiàn)象轉(zhuǎn)化為數(shù)據(jù)形式進行記錄和觀察,實現(xiàn)“測量犯罪狀況及其對社會造成的損失程度、分析犯罪原因,預(yù)測犯罪動向與趨勢的目的”[1]。

(一)統(tǒng)計數(shù)據(jù)時代的特征

特征十分鮮明,包括數(shù)據(jù)來源窄、人為介入因素多、數(shù)據(jù)收集功效弱,綜合概括為美國統(tǒng)計數(shù)據(jù)時代是拓展數(shù)據(jù)集邊界的人工摸索。

數(shù)據(jù)來源窄。運用傳統(tǒng)統(tǒng)計學(xué)分析犯罪的研究方法在19世紀孕育,大西洋彼岸的英國于1856年開始探索犯罪統(tǒng)計數(shù)據(jù)的應(yīng)用,致力于衡量英國刑法法典化改革的成效,以及為未來刑法的發(fā)展提供思路[2]。那時的美國研究因缺乏統(tǒng)一的刑法典而十分依賴各種形式的官方數(shù)據(jù),以研究犯罪活動、監(jiān)獄活動為主,旨在提高司法實踐的效率與公正。

十九世紀末,犯罪學(xué)研究的先驅(qū)威廉·道格拉斯·莫里森率先將司法數(shù)據(jù)的應(yīng)用研究基礎(chǔ)分為三類,即警務(wù)數(shù)據(jù)(Police statistics)、司法審判數(shù)據(jù)和監(jiān)獄數(shù)據(jù),并依據(jù)權(quán)威的官方統(tǒng)計衡量了三類數(shù)據(jù)的價值權(quán)重,得出警務(wù)數(shù)據(jù)最優(yōu)的結(jié)論[3]。莫里森指出“監(jiān)獄數(shù)據(jù)以服刑統(tǒng)計為主,必須有經(jīng)過司法過程認定的違法行為,但并不是所有的違法者、被法律裁定的有罪者都會被判監(jiān)禁刑罰;司法審判數(shù)據(jù)是司法機關(guān)在刑事訴訟過程中所做的犯罪統(tǒng)計,只反應(yīng)審判過程及結(jié)果;而警務(wù)數(shù)據(jù)來源于一系列在警局備案的犯罪調(diào)查和記錄,是對年度犯罪情況最全面、綜合性最強的統(tǒng)計,具有司法審判數(shù)據(jù)和監(jiān)獄數(shù)據(jù)無可比擬的優(yōu)勢”[3]。

二十世紀中期,數(shù)據(jù)應(yīng)用的思維和研究發(fā)生了變化。為了增加可供取樣的司法數(shù)據(jù)集合,美國犯罪統(tǒng)一報告計劃(UCR)開始了①全稱“Uniform Crime Reporting Program”,包括四個數(shù)據(jù)集:國家事件報告系統(tǒng)(NIBRS),摘要報告系統(tǒng)(SRS),執(zhí)法人員被殺和被攻擊(LEOKA)計劃以及仇恨犯罪統(tǒng)計計劃。。首個被害者調(diào)查計劃新鮮出爐,致力于找出公眾所知但警方未記錄的犯罪數(shù)據(jù)。被害人回憶的價值被重新認識,這被視作犯罪學(xué)研究的一個重大突破。遺憾的是,被調(diào)查者似乎原先被認為回憶犯罪行為是一件容易的事,因為犯罪行為通常較為不平凡,但事實上記憶衰退和自我記憶修正使回憶無法精準復(fù)刻。因而,數(shù)據(jù)來源始終未能充分擴大。

人為介入因素多。新理論的出現(xiàn)對官方數(shù)據(jù)衡量犯罪行為的可靠性和完整性提出了質(zhì)疑。有限的數(shù)據(jù)集因人為介入因素過多,引發(fā)了數(shù)據(jù)分析結(jié)果的異常。警務(wù)數(shù)據(jù)的價值討論最為激烈。賦予其高階價值的觀點認為應(yīng)以立案、起訴和審判數(shù)據(jù)為衡量犯罪發(fā)生率、影響范圍的主要指標(biāo)[4]。我國部分學(xué)者也稱,“基于“漏斗效應(yīng)”,警方的立案、抓捕統(tǒng)計最接近實際犯罪數(shù)量,應(yīng)是犯罪統(tǒng)計中最有價值的數(shù)據(jù)集[1]。

然而,由于警務(wù)記錄通常與犯罪行為、政策措施和警民關(guān)系有著復(fù)雜的多向關(guān)系,公眾的不信任感似乎也在情理之中②本杰明·迪斯雷利的名言是,“世界上有三種謊言:謊言、鬼話連篇和統(tǒng)計”(There are three kinds of lies:lies,damned lies and statistics)。。1940年,反對者也曾提出,警局的立案數(shù)據(jù)、抓捕數(shù)據(jù)會為了歌頌當(dāng)?shù)卣兌倪^飾非,也因誣告、無聊指控和假想防衛(wèi)有不可靠傾向,雖然并不絕對,但此類情形當(dāng)然存在[3]。著名的心理學(xué)家及人權(quán)擁護者拉爾夫·克勞肖諷刺地說,“有時候,原本應(yīng)該保護我們安全的人卻成為了我們最害怕的人”[5]。無獨有偶,警務(wù)數(shù)據(jù)的可靠性在英國的地位始終居于司法數(shù)據(jù)之下。英國官方司法統(tǒng)計報告表示,“司法統(tǒng)計結(jié)果之表格乃最重要、最確定、最精準的犯罪數(shù)據(jù)統(tǒng)計,警務(wù)數(shù)據(jù)次之,居附屬地位”[6]。

數(shù)據(jù)收集功效弱。收集方法主要是國家主導(dǎo)與零星的公民報告相結(jié)合。1930年,國會授權(quán)國家移民局身份識別及信息搜集與編輯部門統(tǒng)計全美犯罪數(shù)據(jù)[7],開啟了建立在小數(shù)據(jù)之上的全國犯罪數(shù)據(jù)應(yīng)用分析方法。以警務(wù)數(shù)據(jù)集為重點,公民報告與監(jiān)獄數(shù)據(jù)次之,再輔以調(diào)查研究、定義描述與概念構(gòu)建、量化模型等手段。警務(wù)數(shù)據(jù)的價值爭議上文已述,其他研究方法成效也不明顯,功效性較弱。

公民報告數(shù)據(jù)的搜集主要是通過基于“特殊電話亭”到“雙向無線電交流”等輿情應(yīng)答系統(tǒng)③最早有記可考的輿情應(yīng)答記錄回溯到了英格蘭時期,那時的警員手持響鈴,民眾一旦發(fā)現(xiàn)新情況就主動報告,警員立即用響鈴?fù)ㄖ渌ぷ骰锇?。發(fā)展而來的緊急通訊熱線實現(xiàn)的。而專門從事犯罪人研究的監(jiān)獄機構(gòu),天然有著便捷抽出“犯罪人”樣本的途徑[8],監(jiān)獄數(shù)據(jù)也有統(tǒng)計學(xué)意義上的可靠性。但是,二者的樣本數(shù)量都偏少。據(jù)統(tǒng)計,80%的公民撥打熱線都是因為突發(fā)事件影響了自身生活,譬如噪音投訴、報告路邊無人認領(lǐng)的汽車,只有不到20%的公民打求助電話是因為嚴重的刑事案件發(fā)生[5]。而辯訴交易的存在讓大部分刑事案件都未進入最后的司法程序,降低了監(jiān)獄犯罪人數(shù)統(tǒng)計數(shù)量。

此外,UCR報告也未能破除管中窺豹的問題。因為只有通過刑偵找到佐證,具備“事實上的違法要件”的犯罪才會錄入UCR報告[4],“不是所有犯罪都達到了被警署重視的程度,不是所有犯罪在指數(shù)統(tǒng)計時都有足夠重要的分量,不是每次富有意義的指標(biāo)展現(xiàn)出充分規(guī)律時就有要案發(fā)生旁以佐證”[9]。

(二)抽樣調(diào)查方法的局限

在小數(shù)據(jù)時代,數(shù)據(jù)化基礎(chǔ)薄弱,數(shù)據(jù)化的信息較少,信息傳播速度較慢,信息實時共享功能尚未開發(fā),抽樣調(diào)查測量分析方法是當(dāng)時的最優(yōu)解。在解決簡單問題時,抽樣調(diào)查可以發(fā)現(xiàn)快速變化的量,找到數(shù)據(jù)之間的特殊函數(shù)關(guān)系。但是,它卻無法迅速地關(guān)顧到慢變量,即隱藏著深刻影響力的變量[10]。并且,測量方法設(shè)計的再完善也無法避免漏掉在“未抽樣”信息中的重要數(shù)據(jù),數(shù)據(jù)之間的相關(guān)性也不會總表現(xiàn)出結(jié)構(gòu)性。

許多學(xué)者指出,傳統(tǒng)數(shù)據(jù)時代的實驗邏輯使統(tǒng)計數(shù)據(jù)系統(tǒng)性的少計算了犯罪行為,無法反映事實全貌,未被假設(shè)的結(jié)論自然也不在計算實驗的考量之內(nèi)。那些未被納入的所謂的“隱藏的犯罪事例”被稱為“犯罪暗數(shù)”。其概念十分模糊,既可以指“那些在某一標(biāo)準上可被定義為犯罪的事件,卻沒有被任意一個數(shù)據(jù)提供機構(gòu)當(dāng)作犯罪行為記錄儲存”[4],也可以指“人們對尚未發(fā)現(xiàn)的犯罪行為和犯罪人的圖景或意象”[8]。暗數(shù)曾經(jīng)一度使美國的下層社會承擔(dān)了更多壓力,尤其是居住在偏遠地區(qū)的青少年,他們被看作是犯罪亞文化的潛在成員[8]。

除了時代和方法的局限,二十一世紀數(shù)據(jù)爆炸帶來了更多問題。低質(zhì)量的數(shù)據(jù)輸入和以此為據(jù)的預(yù)測引發(fā)的擔(dān)憂已不是新鮮事,在不斷地嘗試避免“垃圾輸入,廢物輸出”④“garbage in,garbage out.”之時,司法數(shù)據(jù)的應(yīng)用已不再局限于官方統(tǒng)計,也不再囿于犯罪研究,而是悄然深入生活的各個方面,后大數(shù)據(jù)時代的來臨開啟了數(shù)據(jù)智能新時代。

二、后大數(shù)據(jù)時代的深度應(yīng)用與爭議

以“容量巨大、速度迅捷、種類繁多”為特征的大數(shù)據(jù)時代[11]顛覆了統(tǒng)計數(shù)據(jù)的應(yīng)用邏輯思維,也重新賦予統(tǒng)計學(xué)更多含義。進入后大數(shù)據(jù)時代,諸多學(xué)科迅速頻繁地交叉融合,以算法為驅(qū)動,結(jié)合數(shù)據(jù)挖掘、機器學(xué)習(xí)、人機交互、可視化等技術(shù)做出“預(yù)測”與“決策”[12]。以三大數(shù)據(jù)智能應(yīng)用為代表的三大特征或三大轉(zhuǎn)變已在當(dāng)下來臨,爭議,也隨之而來。

(一)以全域采集為目標(biāo)的司法數(shù)據(jù)

預(yù)計在2021年徹底淘汰傳統(tǒng)UCR計劃里摘要報告系統(tǒng)的國家事故報告系統(tǒng)⑤全稱National Incident Based Reporting System,簡稱“NIBRS”。宣告全美范圍內(nèi)的司法數(shù)據(jù)從抽樣統(tǒng)計向全樣本數(shù)據(jù)采集過渡,智能數(shù)據(jù)集成管理系統(tǒng)逐漸完善。

其優(yōu)勢十分顯著。第一,數(shù)據(jù)質(zhì)量整體提升。系統(tǒng)記錄了每一起犯罪事件的來龍去脈,包括共同犯罪中的單獨犯罪行為,受害者與已知罪犯之間的關(guān)系等全景信息;第二,違法行為標(biāo)簽增多。系統(tǒng)收集了52項違法行為的整體數(shù)據(jù),提供10項違規(guī)行為的犯罪地點,案發(fā)時間及犯罪背景的匹配;第三,比較分析能力提升。執(zhí)法部門借此可以看到犯罪行為的諸多面相,以及非結(jié)構(gòu)化因素之間隱藏的多重關(guān)聯(lián)[13]。同時,對司法數(shù)據(jù),尤其是犯罪數(shù)據(jù)的深入挖掘展示了更為清晰的社會犯罪圖景。

但是,NIBRS的司法數(shù)據(jù)無法實現(xiàn)對政治性扭曲或操作的完全免疫。事實上,越是高質(zhì)量的數(shù)據(jù)越可能是偽裝和矯飾的產(chǎn)物,因為它代表著美國對于司法實踐中犯罪控制活動的積極態(tài)度,而負面數(shù)據(jù)或消極證據(jù)或許會被執(zhí)法機構(gòu)自動忽視。而且從程序上來說,項目決策的隱秘性也很強[14]。

此外,生態(tài)謬論的傾向性較為明顯。對此最直接的理解是,用高層次、大范圍的集合數(shù)據(jù)為基數(shù)展開分析,推出低層次、窄范圍的個體結(jié)論。例如,從未有過任何犯罪記錄的羅伯特·麥克丹尼爾卻意外地被芝加哥警署人員登門警告他不要逾矩,原因是芝加哥警署依據(jù)抓捕記錄和犯罪地點制作了犯罪高發(fā)區(qū)域預(yù)警名單,麥克丹尼爾成為了400人名單上的一員[15]。這是智能警務(wù)預(yù)測系統(tǒng)的結(jié)果,也是數(shù)據(jù)智能可能陷入生態(tài)謬論的直接表現(xiàn)。

(二)以預(yù)測警務(wù)為向?qū)У乃痉▽嵺`

以預(yù)防犯罪為主導(dǎo)的司法態(tài)度的轉(zhuǎn)變以智能警務(wù)預(yù)測系統(tǒng)的大范圍運用為標(biāo)志。智能警務(wù)預(yù)測尚未有統(tǒng)一概念,有人說“是從不同的集成源里摘取犯罪數(shù)據(jù)進行分析預(yù)測,實現(xiàn)對已發(fā)生罪案的有效應(yīng)答,阻止未來犯罪的發(fā)生”[16]。

基本共識是,它是從對犯罪人的空間分布轉(zhuǎn)向?qū)Ψ缸镄袨榈目臻g分布研究的成果之一。理論基礎(chǔ)是,“罪案的發(fā)生是當(dāng)?shù)丨h(huán)境條件、侵害者與受害者在情景中的不同決策交互作用的結(jié)果,警員每日有規(guī)律地巡邏可以改變或摧毀為罪惡提供溫床的環(huán)境條件,然而犯罪發(fā)生的概率不會整齊劃一的按照時間或空間排布,智能警務(wù)預(yù)測軟件可以有效彌補這個缺陷,在海量數(shù)據(jù)中直接鎖定非均勻發(fā)生的罪案模型”[17]。

預(yù)測警務(wù)的正效果得到多方肯定⑥預(yù)測警務(wù)的正效果包括“除夕之夜里士滿的突發(fā)槍聲減少了47%,繳械武器數(shù)量提高了246%,實現(xiàn)了提高效率與降低成本的目的,節(jié)省資金15000美元”,以及英國肯特警署的服務(wù)分析部門表示“軟件預(yù)測率比數(shù)據(jù)分析部門預(yù)測率平均每周高出3.16%,四個月內(nèi)犯罪率降低了6%”等。。美國洛杉磯與英國肯特警局采取隨機對照實驗的田野調(diào)查[17]表明,警員們利用算法繪制的路線巡邏平均減少了7.4%的犯罪率,而依據(jù)人類犯罪學(xué)家預(yù)測的統(tǒng)計信息巡邏,對犯罪率基本無影響⑦對比的參照物一個是運用ETAS算法繪制的美國洛杉磯警署的三個轄區(qū),另一個來源于犯罪學(xué)家分析的英國肯特警署的兩個轄區(qū)。The Epidemic Type Aftershock-Sequences(ETAS)模型反應(yīng)的是一定地理區(qū)域中地震活動的隨機點過程,需要精確度高、反應(yīng)度靈敏的計算機數(shù)據(jù)。。

然而,“預(yù)測無用”之聲似乎更多。針對路易斯安納州什里夫波特城的一項隨機對照實驗結(jié)果表明,在該區(qū)域,無法得出因為應(yīng)用了新科技,就顯著減少知識產(chǎn)權(quán)犯罪案件的結(jié)論[18]。

爭議不止于此。一是企圖“先發(fā)制人”的警務(wù)預(yù)測變相地把未來的風(fēng)險當(dāng)作現(xiàn)實的危險,就像把犯罪率等指標(biāo)的下降當(dāng)作犯罪被消除的標(biāo)志一樣,也許會引發(fā)更多麻煩。自由主義倡導(dǎo)者們的觀點認為,看似通過犯罪預(yù)測模型開展的活動,卻無法代表所有犯罪行為的表象。而且,預(yù)測系統(tǒng)實際上試圖阻止的人,他根本還沒有犯罪,還不是法律意義上的“嫌疑人”?!胺缸飻?shù)據(jù)的不可靠性、非全面性、易篡改性、及隱含的種族歧視性是眾所周知的”[19]。二是傳統(tǒng)被動反應(yīng)式警務(wù)轉(zhuǎn)為以司法數(shù)據(jù)主導(dǎo)式預(yù)防性警務(wù)時,直覺、經(jīng)驗、常識在各種模型中被摒棄,雖然迎合了“防范勝于未然”的設(shè)想,但是,即便是在“數(shù)據(jù)加工廠的生產(chǎn)下,警方可以每天向普通市民提供類似天氣預(yù)報那樣的“犯罪預(yù)報”[20],數(shù)字化的“標(biāo)簽”也無法完全概括每位自然人的道德操行,其所作“預(yù)報”也無法像地震預(yù)報般準確靈敏。

(三)以人工智能為依據(jù)的司法量刑

正確的量刑是法官的重要責(zé)任,這是一個懲罰犯罪、預(yù)防再犯風(fēng)險、預(yù)測再犯可能的綜合裁量過程[21]。在美國,智能風(fēng)險評估系統(tǒng)逐漸代替法官對刑事司法量刑工作深度干預(yù)。

最初的風(fēng)險評估軟件是作為保釋和假釋的裁判依據(jù),起到了良好的保護社區(qū)的作用⑧譬如,美國最高法院裁決加州監(jiān)獄嚴重違憲,判決認為監(jiān)獄人滿為患,為囚犯帶來“不必要的痛苦和死亡”,并支持了下級法院做出的加州監(jiān)獄系統(tǒng)必須減少3萬囚犯的裁決。如今加州正在一邊減少監(jiān)獄人口,一邊運用風(fēng)險評估系統(tǒng)分析被提早釋放的囚犯對社區(qū)可能造成的威脅。。隨著公眾焦點集中到降低累犯、重視證據(jù)等方面,更多的法院和懲戒署開始了參考風(fēng)險評估報告作為重要刑事案件判刑依據(jù)的摸索,由此掀起了“不能任由計算機把人們關(guān)進監(jiān)獄”的評論熱潮。

艾瑞克·盧米斯的案件極受關(guān)注⑨美國威斯康星州適用量刑輔助軟件COMPAS的評估報告,判處有犯罪歷史并因偷竊警車而被判刑的盧米斯六年有期徒刑及五年延期監(jiān)督。COMPAS顯示盧米斯“暴力風(fēng)險高,再犯風(fēng)險高,預(yù)審風(fēng)險高,是對社區(qū)構(gòu)成高風(fēng)險的人”。參見:朱體正,《人工智能輔助刑事裁判的不確定性風(fēng)險及其防范——美國威斯康星州訴盧米斯案的啟示》,載《浙江社會科學(xué)》2018年第6期,第77頁。,在威斯康星州最高法院稱“COMPAS報告為他們的決定帶來了有價值的信息”[22],裁決駁回了盧米斯的上訴案以后,美國首席大法官約翰·羅伯茨在一期訪談中說道,“人工智能更多地介入法庭調(diào)查程序,有爭議性的司法決策頻出,司法部門正面臨著強壓”。

巨大的問號懸掛在量刑輔助風(fēng)險評估系統(tǒng)的上方。在紐約北部的懲戒所里服刑的格倫·羅德里格斯也因COMPAS的評估報告被拒絕假釋,即便他有著近乎完美的服刑表現(xiàn)[23]。評估系統(tǒng)內(nèi)部的調(diào)查過程、報告細節(jié)、推理和歸納結(jié)論的過程人們都一無所知。推測該文件可能包含大量生活數(shù)據(jù)、犯罪歷史數(shù)據(jù)、與司法活動有關(guān)的數(shù)據(jù)、自動生成地蘊含規(guī)律的犯罪行為圖表,譬如所在居住地、受教育水平、關(guān)系親密人群的犯罪狀況、以量化羅德里格斯的生活,行為和重新犯罪地可能性。還可能包括他的年齡、種族、性別認同、瀏覽習(xí)慣,也許還有一些看起來不相關(guān)的問題,譬如“頭骨維度等,以此評估被告人在一定時期內(nèi)重新犯罪的可能性”[24]。

此外,系統(tǒng)量刑的公平性也飽受質(zhì)疑。一方面缺乏透明度影響了司法公平。這些軟件的開發(fā)商以商業(yè)秘密為由,即便是面對法院頒發(fā)禁制令都不會公開任何技術(shù)細節(jié)[23]。另一方面可能強化既存于犯罪數(shù)據(jù)集中的種族、性別差異。一篇研究分析了種族對犯罪歷史和累犯的影響,表明未再犯的黑人被告被錯誤預(yù)測的概率為44.9%,幾乎是白人被告的兩倍[25]。這意味著白人被告容易被評估為低風(fēng)險,黑人被告更難從評估結(jié)果中獲得自由。

三、爭議的原因:數(shù)據(jù)的陷阱

數(shù)據(jù)應(yīng)用引發(fā)地諸多爭議的解決還應(yīng)回歸數(shù)據(jù)本身。因為以數(shù)據(jù)為核心的應(yīng)用研究,必然受到采集數(shù)據(jù)集本身固有缺陷的影響,即便“數(shù)據(jù)應(yīng)用在中美之間,存在著話語與實踐層面的認識差異、態(tài)度上的冷熱不均”[26],究其根本,還是因研究方式、驅(qū)動緣由、實踐目的不同,激發(fā)了數(shù)據(jù)缺陷或數(shù)據(jù)陷阱在不同地緣地貌中映射出多樣化的表象,孕育出個異化的內(nèi)涵。

“數(shù)據(jù)陷阱”在統(tǒng)計學(xué)中與“數(shù)據(jù)信仰”常自動匹配,數(shù)據(jù)信仰者認為統(tǒng)計數(shù)據(jù)即為科學(xué),對漂亮的圖表極度自信,反而容易因?qū)?shù)據(jù)的盲信,落入數(shù)據(jù)陷阱之中。誠然,數(shù)據(jù)普遍存在的問題及特征,由此引發(fā)的正負效果,都是共通的。數(shù)據(jù)陷阱是司法數(shù)據(jù)研究,乃至整個司法大數(shù)據(jù)研究都無法繞越的障礙,是中美都需應(yīng)對的共同課題。

(一)全樣本數(shù)據(jù)的想象

數(shù)據(jù)化基礎(chǔ)參差,智能化程度不足。全樣本數(shù)據(jù)的原理是,當(dāng)數(shù)據(jù)體量足夠大時,越容易對不確定的事做出判斷,越能畫出結(jié)構(gòu)化的規(guī)律,越有利于法院做出公正裁決。法律文書電子化、法律信息數(shù)據(jù)化、司法應(yīng)用智能化是獲得全樣本數(shù)據(jù)的三大基石。盡管美國2002年就開始建設(shè)電子化法庭[27],猶他州、密歇根州法院已實現(xiàn)較高智能化水平[28],現(xiàn)有的數(shù)據(jù)采集已實現(xiàn)犯罪行為的縱橫比較,譬如2017年有10 236人犯了縱火罪,主要集中在成人年齡段[29]等。國內(nèi)人臉識別的高端技術(shù)天眼系統(tǒng)已對接全國二十多個省,智慧法院研究中心,天平司法大數(shù)據(jù)分析平臺已然確立,投入使用科技法庭28 055個。但是,因為數(shù)據(jù)化基礎(chǔ)在全域范圍內(nèi)的發(fā)展不均,智能化程度仍需提升等現(xiàn)實問題的存在,使大數(shù)據(jù)本身并不具備完整性。

智能化法院不是簡單的轉(zhuǎn)移傳統(tǒng)審判空間或硬件升級,而是司法與互聯(lián)網(wǎng)技術(shù)的深度融合。國內(nèi)部分,中西部法院電子卷宗隨案同步生成率不足一半,近25%的法院未開通案件警示系統(tǒng),許多法院雖然開始使用了初級的智能軟件,但尚未有能力拓展大數(shù)據(jù)的應(yīng)用并形成報告。此外,司法管理系統(tǒng)的完備性較強,但安全性仍需提升[30]。

數(shù)據(jù)閉環(huán)流通,開放與共享不充分。裁判文書上網(wǎng)總量已接近七千萬篇⑩http://wenshu.court.gov.cn,數(shù)據(jù)截止于2019年6月10日。,審判流程信息公開網(wǎng)、執(zhí)行信息公開網(wǎng)的縱向推進已使我國司法數(shù)據(jù)的開放體量居于世界領(lǐng)先地位。美國的數(shù)據(jù)智能更多源自市場對大數(shù)據(jù)分析和挖掘急迫需求的推動,所以依托數(shù)據(jù)智能整合的搜索引擎,如vtesify,提供法律建議的預(yù)測系統(tǒng),如lexmachine.com等應(yīng)用似春筍般勃發(fā),實現(xiàn)了一定程度的數(shù)據(jù)開放與共享。

但無論是橫亙在公安機關(guān)、人民法院、人民檢察院之間的數(shù)據(jù)壁壘,還是美國本就獨立運行的兩個司法系統(tǒng),都是司法大數(shù)據(jù)流的分隔符,控制著數(shù)據(jù)在各自閉環(huán)里流通。國內(nèi)的一體化辦公系統(tǒng)尚未鋪開,技術(shù)與業(yè)務(wù)之間的壁壘還在,國外法院的類案同判主要依靠聯(lián)邦最高法院的判例引導(dǎo),打通司法數(shù)據(jù)的全域流通更是難題。深化司法數(shù)據(jù)共享還在通往高速的路上。

(二)臟數(shù)據(jù)誘發(fā)的非靶向結(jié)果

優(yōu)質(zhì)數(shù)據(jù)較為缺乏。數(shù)據(jù)爆炸式增長的同時,質(zhì)量標(biāo)準應(yīng)處首位。機器學(xué)習(xí)尤其是深度學(xué)習(xí),強化學(xué)習(xí)的完善和迭代促成了人工智能與各個領(lǐng)域的結(jié)合,是上海刑事案件智能輔助辦案系統(tǒng)的核心引擎,也是美國犯罪數(shù)據(jù)應(yīng)用開發(fā)的主要方式。因此,不良數(shù)據(jù)會導(dǎo)致數(shù)據(jù)應(yīng)用產(chǎn)生不連貫、不完整或不準確的結(jié)果。

如果提前將給機器學(xué)習(xí)的數(shù)據(jù)集作摘選、甄別處理,就能為應(yīng)用模型提供優(yōu)質(zhì)數(shù)據(jù),確保數(shù)據(jù)集準確、一致、有用,較大程度地減少低質(zhì)輸出的概率。尤其是刑事司法領(lǐng)域的預(yù)測活動極度依賴輸入的數(shù)據(jù),一旦算法無法調(diào)整長久以來深埋在數(shù)據(jù)源里的瑕疵,不良結(jié)果會在未來更多次的重復(fù)應(yīng)用中不斷固化[31]。

自我誘發(fā)的數(shù)據(jù)偏差。數(shù)據(jù)偏差包括具有結(jié)構(gòu)性缺陷、數(shù)據(jù)所含并非關(guān)鍵性內(nèi)容、數(shù)據(jù)于真實情況相背離等表現(xiàn)。許多人把谷歌流感預(yù)測失敗的原因歸結(jié)于算法,實際上,搜索引擎的表現(xiàn)完全符合人們的期待,反而是數(shù)據(jù)源出現(xiàn)了問題,自我誘發(fā)了數(shù)據(jù)偏差?谷歌的流感預(yù)測引擎搜集了大量的與流感有關(guān)的問卷,依據(jù)搜集的數(shù)據(jù)開始預(yù)測。在取得了些許成功后,該引擎完美地錯過了2009年流感病毒爆發(fā)的預(yù)警,固執(zhí)地過度預(yù)測了2011年至2014年爆發(fā)流感的情形。。

一份針對警務(wù)數(shù)據(jù)對于預(yù)測模型影響的實證研究報告指出,所記錄的犯罪數(shù)據(jù)會從兩個方面產(chǎn)生極具偏差的預(yù)測結(jié)果。一方面,原始數(shù)據(jù)存在的偏差直接導(dǎo)致了預(yù)測結(jié)果的偏離。另一方面,警官們在軟件標(biāo)注的區(qū)域內(nèi)巡邏,不斷地在系統(tǒng)里更新著新發(fā)案件的記錄,隨著時間的推移,這些累積的數(shù)據(jù)被填充進算法里作為基礎(chǔ)數(shù)據(jù)時,對于該范圍預(yù)測的偏差將不可避免地越來越大[31]。

(三)隱秘的算法對直覺主義的挑戰(zhàn)

如果數(shù)據(jù)是原材料,算法就是把雜亂紛繁的數(shù)據(jù)轉(zhuǎn)化為特定決策依據(jù)的工具,司法決策中的算法是司法決策數(shù)據(jù)化的需求與計算機程序相結(jié)合的產(chǎn)物。公眾對司法的信任建立在司法透明的基礎(chǔ)上,實現(xiàn)看得見的正義。而司法量刑中試用算法“一錘定音”的美國正處于這風(fēng)口浪尖上。

缺乏透明度的“技術(shù)恐怖”。行為表現(xiàn)算法(be?havioral algorithms)已在猶他州實行,弗吉尼亞州用算法判刑也有十年經(jīng)驗。美國政府并不開發(fā)自己使用的算法,而是將流程外包給私營企業(yè)。這意味著,購買者僅根據(jù)所有者告知的內(nèi)容,在有限的程度上知道機器決策的過程。當(dāng)我們不理解百度競價廣告的排序方式或淘寶推薦商品的算法時,并不影響我們的生活,因為這和決定命運的司法裁判的利害關(guān)系完全不同。

理想中立卻有現(xiàn)實偏見。算法中立是數(shù)據(jù)智能應(yīng)用中最常見的觀念,認為無倫理的計算機不關(guān)心堂下案犯的性別或膚色,只依據(jù)他一直以來的社會行為及犯罪行為判定是否有罪。一篇調(diào)查計算機決策與一個人面部特征關(guān)聯(lián)性的研究表明,那些嘴唇較小,上唇較曲,眼距較近的人更容易被貼上罪犯的標(biāo)簽,原因并不清楚。正是存在許多的不清楚,遮蓋了司法決策中算法偏見幾乎與性別和種族偏見一樣客觀存在的事實[32]。許多軟件公司也提出了類似隱憂,如向警局售賣犯罪預(yù)測軟件的“市民之景”公司?見 https://www.civicscape.com/官網(wǎng)。,將部分源代碼的一個版本公布在互聯(lián)網(wǎng)上,提醒司法機關(guān)切勿使用此版本,因為潛在偏差很難從模型中排除[33]。

逐漸探入量刑深處的隱憂。上海刑事案件智能輔助辦案系統(tǒng)敢為全球之先,以及時發(fā)現(xiàn)、及時提示進入系統(tǒng)的刑事案件中的證據(jù)標(biāo)準不統(tǒng)一、辦案程序不統(tǒng)一、證據(jù)的瑕疵以及證據(jù)間的矛盾等問題,實現(xiàn)防止冤假錯案,減少司法任意性的目標(biāo)[34]。目前,智審系統(tǒng)實現(xiàn)了庭審智能化基礎(chǔ)之上的證據(jù)把關(guān),尚未成為真正的“智能法官”對刑事案件的裁判結(jié)果直接給出評估建議。但是,系統(tǒng)終將探入刑事裁判的核心環(huán)節(jié),左右法官的自由心證。至?xí)r,如何實現(xiàn)如目前類案檢索般能見度高、可重復(fù)驗證的算法邏輯,是數(shù)據(jù)智能逐步改變司法審判中的直覺主義[35]的高階挑戰(zhàn)。

(四)數(shù)據(jù)道德文化與主體責(zé)任的空白

數(shù)據(jù)道德文化的缺失剝奪了公民的隱私權(quán)。數(shù)據(jù)公民很難清除數(shù)據(jù)痕跡,發(fā)現(xiàn)個人信息在上游機構(gòu)的復(fù)制、移植、分析、截取活動,更無法掌控個人數(shù)據(jù)的下游市場使用。智能審判無法像承辦法官一樣受“終身負責(zé)制”監(jiān)督和束縛,人工智能只是在無道德與無感情的狀態(tài)下迭代,更無法成為平衡道德和法律的代理人,正如控制自動駕駛汽車的算法可能被編程為拯救乘客的生命而不是行人的。

數(shù)據(jù)主體責(zé)任的空白逃脫了法律的問責(zé)機制。由于它不具備法律上追責(zé)的主體資格,由它制造的“冤假錯案”以技術(shù)滯后與缺陷為由一筆帶過,那么誰來為人工智能法官的判決買單呢。從數(shù)據(jù)應(yīng)用的流程上看,機器學(xué)習(xí)是標(biāo)簽化法律話語的過程,在充分挖掘法律文本的基礎(chǔ)之上,仔細分析、篩選,打上標(biāo)簽。背負著耗費大量工時將文本錄入數(shù)據(jù)集,面臨著“數(shù)據(jù)信息處理能力的提升帶來信息處理范圍的擴大,信息處理負擔(dān)進一步加劇”[36]的風(fēng)險的司法人員是否要被追責(zé);開發(fā)數(shù)據(jù)應(yīng)用、建立案件訴訟請求、爭議焦點、適用法條等要素間單雙向相關(guān)性[37]程序的計算機學(xué)家和工程師們是否要被追責(zé)。這些不確定性與不精確性尚缺乏法律規(guī)制。

此外,司法實踐中對數(shù)據(jù)的依賴與日俱增。每天沿著智能地圖規(guī)劃地行車路線駕駛,每晚聽著音樂軟件依據(jù)偏好推薦地單曲,個性化服務(wù)仿佛多股無形的線,限縮了生活,限定了行為模式。犯罪數(shù)據(jù)定制了犯罪模式,司法數(shù)據(jù)定制了司法量刑。也許在我們還未嘗到甜頭時,已不知不覺被它左右。這種過度依賴十分危險。犯罪學(xué)家賽林說過,“犯罪數(shù)據(jù)的價值正日益降低,因為它或許拉開了我們與真實的犯罪情況的距離”[38]。

需知,數(shù)字不是唯一的數(shù)據(jù),定量研究并不是唯一方式。司法數(shù)據(jù)本質(zhì)上說,都是將存在于一個多因素影響的、多元素并存的復(fù)雜環(huán)境中的,一系列出于特殊偏好、特定目標(biāo)、特別因由的司法行為,轉(zhuǎn)化為數(shù)字形式的資料、圖表或指標(biāo)的過程。在量化過程中許多零散的經(jīng)驗、或未符合大致規(guī)律的信息容易丟失,且不是所有資料都能被成功量化?!皬姳I、持械搶劫者、詐騙犯和他們的同伙都表明了他們對調(diào)查問卷或大范圍的社會調(diào)查的熱情,人種學(xué)研究、生活史、口述史、傳記和新聞報道將會是非常寶貴的財富”[8]。

四、我國司法大數(shù)據(jù)應(yīng)用風(fēng)險防范之建議

上海高院“206工程”的先鋒創(chuàng)舉,北京高院“睿法官”和四川崇州法院“小崇”法官的順利上線,都顯示出我國司法大數(shù)據(jù)應(yīng)用的廣闊前景。因此美國犯罪數(shù)據(jù)應(yīng)用面臨的問題、存在的風(fēng)險是我們深度開發(fā)司法大數(shù)據(jù)應(yīng)當(dāng)警惕的,應(yīng)在堅持司法大數(shù)據(jù)應(yīng)用輔助性地位的前提下,深挖本土司法資源,貼合國情社情,警惕數(shù)據(jù)陷阱,防范數(shù)據(jù)風(fēng)險。

(一)堅持科技創(chuàng)新與司法改革深度融合

一是以信息化基礎(chǔ)建設(shè)雙管齊下為動力,夯實司法改革的科技支撐。作為官方提倡與推動,市場配合、市場發(fā)起而官方繼續(xù)回應(yīng)的雙重驅(qū)動的產(chǎn)物[39],要以司法系統(tǒng)基礎(chǔ)設(shè)施網(wǎng)絡(luò)的互聯(lián)互通為前提,夯實司法大數(shù)據(jù)使用主體,即司法機關(guān)的信息化建設(shè),重視數(shù)據(jù)應(yīng)用的開發(fā),提升人臉識別、身份驗證等技術(shù),提高科技法庭應(yīng)用率,實現(xiàn)在數(shù)據(jù)應(yīng)用智能化整合的條件下,簡單司法事務(wù)自動化高水平辦公。并且依托市場信息化建設(shè)的廣泛維度,豐滿“信息球”,構(gòu)建立體、綜合、統(tǒng)一的數(shù)據(jù)收集、應(yīng)用、流通的信息化平臺。

同時,政策指引資本加大投資市場信息化基礎(chǔ)設(shè)施的建設(shè)。典型的例子就是實現(xiàn)了人與物互聯(lián)新格局的5G技術(shù)的出現(xiàn),利用更少的物理連接、更輕便的智能設(shè)備,提供更快的挖掘分析速度,推動未來數(shù)據(jù)中心規(guī)模呈幾何倍數(shù)增加,打破體量巨大、靈活性較小的大數(shù)據(jù)應(yīng)用中心結(jié)構(gòu),任意部署存儲于分散的云端的迷你數(shù)據(jù)中心,司法數(shù)據(jù)應(yīng)用又將迎來新一輪的硬核升級。

二是以司法改革需求引領(lǐng)大數(shù)據(jù)應(yīng)用方向,助推司法智能化的高度實現(xiàn)。誠然,人工智能輔助量刑系統(tǒng)存在一定的風(fēng)險,但量刑輔助、要素審判、風(fēng)險預(yù)警、類案推送等智能輔助類應(yīng)用已成為了法律與事實的中介,是類案穩(wěn)定裁判的平衡器。司法人員對抽象的法律術(shù)語進行自我解讀,在寬幅性的法定刑幅度內(nèi)做出選擇。而犯罪事實與法律裁判的心證之間缺乏一種媒介,類案裁判容易出現(xiàn)量刑偏差,甚至畸輕畸重[40]。

司法智能化的高度實現(xiàn)一方面得益于硬實力的提升。微法院智能系統(tǒng)、高清數(shù)字化法庭、語言智能識別系統(tǒng)、電子卷宗隨案卷自動生成等現(xiàn)代科技的應(yīng)用升級了司法系統(tǒng)的硬件表現(xiàn)能力,拓寬了法院、檢察院提供司法服務(wù)的局限。另一方面離不開軟實力的增強。逐步實現(xiàn)輔助復(fù)雜審判工作的數(shù)據(jù)應(yīng)用在更大程度上挖掘判例等文本、數(shù)字信息,拓展了案例指導(dǎo)制度中對裁判理由和裁判摘要援引的局限,將判例進行多維類比,緊密聯(lián)結(jié)法律與事實,加大法官、檢察官在審判管理、決策分析等司法活動中科技支撐的分量,還將在未來大幅提升法官、檢察官在審判、決策工作方面的精確度和定向化程度,維護法律系統(tǒng)的穩(wěn)定運轉(zhuǎn)。

(二)推動數(shù)據(jù)質(zhì)量與評估模式雙效革新

應(yīng)高效生產(chǎn)優(yōu)質(zhì)標(biāo)簽數(shù)據(jù),提升司法數(shù)據(jù)挖掘能力,提升數(shù)據(jù)質(zhì)量。算法運行之前,海量數(shù)據(jù)需通過人工和自動兩種方式進行調(diào)整,并按照特定分類建立特征要素庫。除了人機共同修補不完整數(shù)據(jù)、修正錯誤、去除冗余數(shù)據(jù)和臟數(shù)據(jù)之外,數(shù)據(jù)中的偏差可以通過優(yōu)化數(shù)據(jù)集,提升審判質(zhì)效的方式在源頭調(diào)整。

我國司法大數(shù)據(jù)較為豐富,圖片、語音和文字識別技術(shù)的準確率非常高,還擁有全球最大的司法信息資源庫,尤其是中國司法大數(shù)據(jù)研究院的建立,實時匯聚了全國3 523個法院的司法審判信息資源。但是,獲取大量的、專業(yè)的行業(yè)知識標(biāo)簽數(shù)據(jù),全覆蓋法律專業(yè)標(biāo)簽數(shù)據(jù)仍是一個艱巨的長期工程,因為這可能需要許多懂法律的計算機學(xué)家與懂計算機的法律專家共同完成。當(dāng)前,提升審判質(zhì)效,裁判文書質(zhì)量,減少地域性裁判差異、預(yù)防數(shù)據(jù)污染,是以審判為中心的訴訟體制改革的應(yīng)有之意,也是數(shù)據(jù)源偏差的一種防治之法。

應(yīng)抓住國家現(xiàn)代化治理契機,轉(zhuǎn)變數(shù)據(jù)應(yīng)用評估思路,革新評估模式。為了防止已暗含偏差的數(shù)據(jù)在算法中反復(fù)固化,轉(zhuǎn)變數(shù)據(jù)智能應(yīng)用工具的評估方式或許是一個思路。譬如預(yù)測軟件,通常以定期統(tǒng)計預(yù)測結(jié)果是否真實發(fā)生、概率為何來判定預(yù)測工具的優(yōu)與劣,留與棄。在以社區(qū)或個人為單位的預(yù)測系統(tǒng)中,一旦識別危險則在該區(qū)域加強巡邏或采取逮捕或拘留等執(zhí)法措施。而逮捕拘留的人數(shù)多少又會作為衡量警員表現(xiàn)的重要標(biāo)準,變相地鼓勵了警員們?yōu)榱藰I(yè)績最大化頻繁巡邏固定區(qū)域、刻意增加使用司法手段,硬性拔高了正確率。

在推進國家現(xiàn)代化治理體系和治理能力的契機之下,新時代“楓橋經(jīng)驗”的基層治理模式提供了評估方式的新視角。公正司法、司法為民是恒定的價值理念,最大限度的匯集民力、尊重民意,讓網(wǎng)格化的基層社區(qū)成為評估效果的最終裁判者。將司法機構(gòu)作為連接社會問題的導(dǎo)管,而非專門回應(yīng)某片法律區(qū)域范圍內(nèi)多如牛毛的社會問題的司法工具[41]。譬如開辟統(tǒng)一的社區(qū)意見反饋平臺,定期發(fā)布專業(yè)調(diào)查問卷,評分內(nèi)容包括群眾獲得公平正義的感受、對某一具體案件裁判的看法、對司法機構(gòu)的信任程度、對數(shù)據(jù)搜集和分析的態(tài)度,以及對智能化司法服務(wù)的期待等。

(三)平衡陽光司法與技術(shù)保護雙重原則

首先,秉持司法公開原則,為算法設(shè)定適當(dāng)標(biāo)準的透明度。高科技的運用有利于縱深比較社會綜合治理大維度下,人民群眾是否在個案中感受到公平正義,深化執(zhí)法司法公開,贏得公眾信任?譬如杭州互聯(lián)網(wǎng)法院首創(chuàng)“5G+區(qū)塊鏈”涉網(wǎng)執(zhí)行新模式,法院執(zhí)行指揮中心、執(zhí)行現(xiàn)場和申請執(zhí)行人在三個不同物理空間的畫面無遲延同頻播放,實現(xiàn)了執(zhí)行正義的全程可視化。。在美國,知識產(chǎn)權(quán)保護優(yōu)先于司法公開的價值取向,市場逐利性與司法公正性經(jīng)常摩擦,以商業(yè)秘密為由拒絕公開算法仿佛成了訴訟中的“免死金牌”。在我國,正義要以看得見的方式實現(xiàn),這無疑對人工智能時代的司法審判提出了更高要求。雖然目前存在雙向知識人才較少,計算機專家開發(fā)的智審系統(tǒng)無法完全匹配司法人員的司法習(xí)慣,數(shù)據(jù)應(yīng)用與司法實踐不能無縫銜接等短板,但適度公開算法的政策呼吁得到了越來越多積極的市場回應(yīng)。包括百度宣布邊緣計算開源、騰訊阿里等大型企業(yè)的積極投入與參與,銜接了行業(yè)內(nèi)孤島的、零散的標(biāo)準,順應(yīng)了我國司法大數(shù)據(jù)應(yīng)用的需求和陽光司法的精神。

其次,注重產(chǎn)權(quán)保護原則,對算法進行必要法律規(guī)制。保護知識產(chǎn)權(quán)、塑造良好營商環(huán)境與陽光司法之間的取舍與協(xié)調(diào)需要審慎。美國近期看似出現(xiàn)了“以公開為主、不公開為例外”的技術(shù)使用信條。加州上訴法院做出了一項歷史性的裁決,被告公司軟件的源代碼必須向原告披露,該案現(xiàn)已成為對抗商業(yè)機密不公開的重要先例?See:People v.Chubbs,Court of Appeal of California,2015 WL 139069(2015)。該案不是個例。一個研發(fā)網(wǎng)絡(luò)犯罪調(diào)查軟件的機構(gòu)試圖援引商業(yè)秘密證據(jù)特權(quán)拒絕公開源代碼。盡管考慮到秘密的掃描計算機硬件違背了第四憲法修正案,法院仍然做出了相同裁決。還有臉部識別技術(shù)的開發(fā)者拒絕公開用戶名單,變相阻礙了辯護專家衡量軟件是否存在只允許特定用戶登錄的種族歧視。。同時,有關(guān)智能工具是否應(yīng)承擔(dān)刑事責(zé)任的討論甚多,而歐洲議會則直接承認了機器法律主體的地位,明確權(quán)力及義務(wù)。但是,這場博弈的大局似乎并未動搖。因為算法是所有數(shù)據(jù)智能工具的核心,是市場要“扎緊的籬笆”?譬如紐約在2017年出臺了專項法案,創(chuàng)立特別行動組,調(diào)查各機構(gòu)使用算法是否存在偏見,并提出整改報告。但是一年半過去,特別行動組面臨著解散。因為算法涉及到核心商業(yè)機密,至今他們?nèi)晕蠢砬甯鳈C構(gòu)的算法到底是如何操作運行的。。所以,如何公開、公開到什么程度,都是要在接下來的司法實踐中繼續(xù)探索的。

此外,應(yīng)減少核心軟件技術(shù)外包,加大自主研發(fā)力度。自主研發(fā)有其必要性。發(fā)揮市場在資源配置的關(guān)鍵性作用是必須的,然而各地發(fā)展并非齊頭并進,外包技術(shù)公司能力也參差不齊,未必有助于智慧司法的建設(shè),還可能影響司法公信。在尊重市場經(jīng)濟規(guī)律的前提下,減少核心軟件的技術(shù)外包,使各級法院不同的智能系統(tǒng)從硬件到平臺有效對接、暢通基礎(chǔ)信息共享。自主研發(fā)有其生命力。“周雖舊邦,其命維新”,自主創(chuàng)新的傳統(tǒng)在中華文明長河中貢獻良多,建國后第一個計算機中文信息處理系統(tǒng)就由我國自主研發(fā),數(shù)據(jù)處理技術(shù)早已與發(fā)達國家同步,體量上更占優(yōu)勢。以捍衛(wèi)司法公信為價值導(dǎo)向,節(jié)約成本,提高自主開發(fā)能力,司法系統(tǒng)可以探索擺脫向第三方購買軟件,與高校、學(xué)科合作共同研發(fā),或配備專業(yè)團隊獨立研發(fā)。

(四)加強數(shù)據(jù)安全與司法監(jiān)督多維管控

換臉軟件“ZAO”的霸王授權(quán)協(xié)議使企業(yè)免費使用、授權(quán)、和再許可用戶肖像權(quán)事件,讓人工智能深度偽造技術(shù)浮出水面。與公眾生活聯(lián)系最為緊密、起到定紛止?fàn)幾饔玫乃痉C關(guān)一旦在未來出現(xiàn)大數(shù)據(jù)偽造、核心信息泄露情形將十分危險。因此,需要高度警惕司法大數(shù)據(jù)偽造風(fēng)險,加固司法核心數(shù)據(jù)保護和個人信息保護,提升司法監(jiān)督等多維監(jiān)督的管控能力。

應(yīng)加快完善個人隱私相關(guān)立法。中國網(wǎng)民權(quán)益調(diào)查報告顯示,近幾年僅北京就有超過2億條個人信息被泄露。設(shè)計數(shù)據(jù)運用的道德準則,并將透明度、責(zé)任和可審計性納入其中,用法律制度解決道德困境,保護數(shù)字化時代的數(shù)據(jù)足跡?數(shù)據(jù)足跡的受保護的權(quán)力應(yīng)包括所有權(quán)、知情權(quán)、采集權(quán)、保存權(quán)、使用權(quán)及隱私權(quán)。,這也是數(shù)據(jù)智能時代人與產(chǎn)品之間的倫理挑戰(zhàn)。

需要指出的是,公共利益和個人利益之間的權(quán)衡又是一道難題。如德國的“信息自決權(quán)”,原則上每個人都應(yīng)知道并自行決定由誰收集和處理有關(guān)他的哪些數(shù)據(jù),這在實踐中引發(fā)了公共安全和個人隱私孰輕孰重的激辯。誠然,在信息化改革是司法主要驅(qū)動力的我國來說此法不太可取,并且,只有數(shù)據(jù)處理在具體損害自由或構(gòu)成損害自由的特別危險時,才應(yīng)與基本權(quán)利相結(jié)合。

還應(yīng)加強司法監(jiān)督,兼用智能監(jiān)督與人力監(jiān)督。一方面,運用數(shù)據(jù)智能系統(tǒng)開拓機械性、流程化、結(jié)構(gòu)化的科技監(jiān)督,包括要素偏離度分析系統(tǒng)、數(shù)據(jù)化證據(jù)標(biāo)準應(yīng)用系統(tǒng)、審判運行態(tài)勢分析應(yīng)用等;另一方面,發(fā)揮司法人員主觀能動性和經(jīng)驗智慧,定期核驗智審系統(tǒng),定時維護技術(shù)設(shè)備,定量分析運用效果,把控司法大數(shù)據(jù)的流動和研發(fā)方向。

再者,應(yīng)堅持數(shù)據(jù)應(yīng)用輔助性地位,發(fā)揮好工具性的“鏡子”作用。雖然,偏重邏輯與實證的英美法系司法傳統(tǒng)正不斷地將數(shù)據(jù)智能應(yīng)用拉入審判核心環(huán)節(jié)。譬如市場開發(fā)的司法結(jié)果預(yù)測系統(tǒng)如“解剖法律”,已經(jīng)可以分析法院文書資料的語言邏輯和特點?原名Ravel Law的搜索引擎可實現(xiàn)查找某一法官受用或排斥的某類用語、修辭和類比,同時標(biāo)注應(yīng)對該法官最具說服力的語言風(fēng)格和引文出處。見https://home.ravellaw.com/官網(wǎng)。。法官也對律師明確提出使用智能應(yīng)用的鼓勵,安大略高院在判處一筆有爭議的律師費時說道,“如果律師做功課時運用了人工智能軟件,毫無疑問將會顯著減少準備時間、降低律師費用”[42]。

無疑,中國文明傳統(tǒng)堅持數(shù)據(jù)應(yīng)用的輔助性地位的做法更值得堅守。在激勵市場主體的前提下對其進行必要的限制。國務(wù)院在《新一代人工智能發(fā)展規(guī)劃》中提出,“建立人工智能法律法規(guī)、倫理規(guī)范和政策體系,形成人工智能安全評估和管控能力”。許多法學(xué)專家也認為,“智能機器愈是以假亂真,愈能在更深的層次和更廣的范圍提高人類改造自然和改造自身的能力,機器人不能擔(dān)任法官,堅守司法應(yīng)是人類爭端解決的最后一道防線”?來源于2018年“智匯司法、相得益彰”清華RONG系列論壇之司法大數(shù)據(jù)專場討論會上諸多專家學(xué)者的發(fā)言。。因此,在構(gòu)建未來人機關(guān)系的格局上,應(yīng)強調(diào)通過法律和政策予以規(guī)范,以社會的穩(wěn)定有序發(fā)展為前提,回歸對司法從業(yè)人員本身價值的堅定認可。

結(jié) 語

信息超載是自人類開始認識外部世界以來始終面臨的重大問題,外部環(huán)境所蘊含的信息遠遠超乎想象[36]。深度應(yīng)用司法大數(shù)據(jù),以識別陷阱、防范風(fēng)險為雙前提,以科技創(chuàng)新與改革創(chuàng)新為雙驅(qū)動,以多重剖析與精準預(yù)測為雙目標(biāo),全面建設(shè)集約高效、開放互動、交融共享的現(xiàn)代化訴訟服務(wù)體系,為實現(xiàn)看得見、摸得著的公平正義提供有力司法服務(wù)和保障。

猜你喜歡
司法犯罪
少捕慎訴慎押刑事司法政策下偵羈關(guān)系的反思
公園里的犯罪
服務(wù)大局司法為民忠實履職
法律文本中的敘事:司法判決書及其敘事
制定法解釋中的司法自由裁量權(quán)
Televisions
司法所悉心調(diào)解 墊付款有了著落
環(huán)境犯罪的崛起
司法監(jiān)督的浙江實踐
“犯罪”種種
定边县| 宾阳县| 北京市| 伊通| 晋宁县| 三原县| 滨海县| 卓尼县| 锦州市| 玉山县| 田阳县| 乐清市| 封丘县| 广元市| 那曲县| 东乡族自治县| 绵阳市| 扶绥县| 泾阳县| 兰州市| 溆浦县| 柳河县| 靖州| 青铜峡市| 特克斯县| 鹤庆县| 醴陵市| 洮南市| 堆龙德庆县| 略阳县| 鹰潭市| 富源县| 富裕县| 汶川县| 维西| 宿迁市| 渑池县| 永丰县| 莱阳市| 盘山县| 沙河市|