陳琨
黨的十九大報(bào)告提出,要深化司法體制綜合配套改革,全面落實(shí)司法責(zé)任制,讓人民群眾在每一個(gè)司法案件中感受到公平正義。隨著司法責(zé)任制改革全面縱深推進(jìn),如何依托智慧法院建設(shè),完善法律統(tǒng)一適用機(jī)制,確保類案同判,成為關(guān)系改革成效評價(jià)的重要問題。2017年10月26日,中共中央辦公廳印發(fā)的《關(guān)于加強(qiáng)法官檢察官正規(guī)化專業(yè)化職業(yè)化建設(shè) 全面落實(shí)司法責(zé)任制的意見》,要求依托大數(shù)據(jù)技術(shù),完善智能輔助辦案系統(tǒng)的類案推送、結(jié)果比對、數(shù)據(jù)分析等功能,促進(jìn)法律適用統(tǒng)一。此前印發(fā)的《最高人民法院司法責(zé)任制實(shí)施意見(試行)》也提出,承辦法官在審理案件時(shí),應(yīng)對本院已審結(jié)或正在審理的類案與關(guān)聯(lián)案件進(jìn)行全面檢索,制作類案與關(guān)聯(lián)案件檢索報(bào)告?!邦惏笝z索”和“類案推送”正式從試點(diǎn)探索、政策倡導(dǎo)走向制度要求層面。
從邏輯關(guān)聯(lián)上看,類案檢索是類案推送的前提,只有在檢索基礎(chǔ)上的分門別類、確定標(biāo)記、匹配嵌入,才有可能識別“類案”、精準(zhǔn)推送。因此,本文將“類案推送”作為討論重點(diǎn)。事實(shí)上,作為人工智能切入司法領(lǐng)域的重要場景,各種以“類案推送”為核心功能的衍生產(chǎn)品已見諸市場,形成規(guī)模效應(yīng)和話題效應(yīng)。本文無意比較、臧否市面上各種“類案推送”產(chǎn)品,僅從應(yīng)用場景維度,探討類案推送嵌入“智慧法院”法官辦案場景的基礎(chǔ)原理和操作路徑。
“場景”原是影視劇創(chuàng)作中的概念,是指在一定時(shí)間、空間內(nèi)發(fā)生人物行動(dòng)或具體畫面?!?〕沈貽偉:《影視劇創(chuàng)作》,浙江大學(xué)出版社2012年版,第162頁。隨著互聯(lián)網(wǎng)產(chǎn)業(yè)蓬勃發(fā)展,場景化思維逐步成為產(chǎn)品開發(fā)設(shè)計(jì)的重要因素。所謂場景化思維,是指在設(shè)計(jì)產(chǎn)品時(shí),應(yīng)先考慮基礎(chǔ)場景,不斷打磨優(yōu)化環(huán)境場景,通過反復(fù)交互反饋,使產(chǎn)品充分適應(yīng)需求場景。對需求場景的分析,決定了產(chǎn)品開發(fā)的方向,也是衡量產(chǎn)品價(jià)值的重要指標(biāo)。從性質(zhì)上看,類案推送可以視為人工智能輔助辦案場景下的互聯(lián)網(wǎng)交互產(chǎn)品,場景化思維也必然貫穿其開發(fā)和應(yīng)用的全過程。
類案推送的基礎(chǔ)場景,包括應(yīng)用者的身份、目的和路徑。具體而言,就是要考慮法官基于什么目的,需要什么樣的類案推送服務(wù)。實(shí)踐中,主要可概括為以下幾個(gè)方面:
一是促進(jìn)司法公正的需求。通過司法責(zé)任制改革,“讓審理者裁判,由裁判者負(fù)責(zé)”成為常態(tài),院庭長不再審核自己未參與審理案件的裁判文書,但“法官是喜愛和厭惡、偏好和偏見、本能、情感、習(xí)慣和信念的復(fù)合體”。〔2〕〔美〕本杰明·卡多佐著:《司法過程的性質(zhì)》,蘇力譯,商務(wù)印書館1998年版,第22頁。加之不同地域、審級、經(jīng)驗(yàn)的差異,“類案不同判”現(xiàn)象有時(shí)發(fā)生,影響到司法權(quán)威和公信力。類案推送通過呈現(xiàn)相似案件的既往裁判思路和結(jié)果,為法官審判提供可資參考的推理邏輯和評價(jià)標(biāo)準(zhǔn),有利于防止自由裁量權(quán)的濫用。
二是提升辦案效率的需求。面對繁重的辦案任務(wù),加之輔助人員短缺,法官?zèng)]有時(shí)間、精力將每一起案件放到浩如煙海的判例中比對。類案推送能夠通過精準(zhǔn)匹配、合理篩除,直接快速地向法官呈現(xiàn)權(quán)威度最高、關(guān)聯(lián)度最強(qiáng)、相似度最大的既往判例,極大緩解法官的辦案壓力和工作負(fù)擔(dān)。
三是健全智識結(jié)構(gòu)的需求。經(jīng)濟(jì)社會(huì)迅速發(fā)展,思想文化交融互通,促使法律關(guān)系不斷復(fù)雜化,對法官的智識結(jié)構(gòu)提出更大挑戰(zhàn)。類案推送的前提,在于通過體系化梳理,形成“窮盡而不重復(fù)”的法律知識圖譜,促使法官不斷查漏補(bǔ)缺、補(bǔ)齊短板。
環(huán)境場景聚焦時(shí)間、地點(diǎn)和周圍條件。具體來說,就要考慮法官在何時(shí)何地何種情況下需要使用類案推送。結(jié)合審判實(shí)踐,可以概括為以下幾類:
一是庭前準(zhǔn)備階段的使用動(dòng)因。類案推送可以在庭前準(zhǔn)備階段,為法官提供審理要點(diǎn)參考。糾紛解決通常圍繞爭議焦點(diǎn)展開,為保障庭審流暢,法官在庭前需要整理庭審審理要點(diǎn),對于部分法律關(guān)系復(fù)雜的案件,審判要素認(rèn)定和裁量相對復(fù)雜,業(yè)務(wù)標(biāo)準(zhǔn)尚不統(tǒng)一,導(dǎo)致審理要點(diǎn)整理慢、精準(zhǔn)度低。而類案推動(dòng)可通過要素匹配,解構(gòu)所推送案例的事實(shí)、法律爭點(diǎn),使法官在庭前準(zhǔn)備階段,就能熟悉類型化案件的審理思路。
二是審理階段的使用動(dòng)因。類案推送可以在案件討論中為法官提供專業(yè)意見參考。案件審理期間,法官在主持庭審、參加合議、參加專業(yè)法官會(huì)議、列席審判委員會(huì)時(shí),都可能就法律適用、證據(jù)認(rèn)定問題與他人探討或爭論。通過類案推送,有利于法官形成內(nèi)心確信,并據(jù)以說服他人。
三是結(jié)案階段的使用動(dòng)因。類案推送可以為法官裁判文書說理、提煉審判經(jīng)驗(yàn)提供參考。法官既是“類案”的參考者、使用者,也是生產(chǎn)者、提供者。類案推送系統(tǒng)的研發(fā)過程,也是廣大法官貢獻(xiàn)智識的過程,使法官基于個(gè)案的思考和研究擺脫地域和時(shí)間的桎梏,形成規(guī)模效應(yīng)。
綜上,類案推送的場景化思維,就是要結(jié)合基礎(chǔ)場景和環(huán)境場景,從法官的實(shí)際使用角度出發(fā),將各種場景元素綜合起來的思維方式?;A(chǔ)場景和環(huán)境場景的結(jié)合將產(chǎn)生不同的需求場景(見表1),這既是類案推送的功能設(shè)計(jì)導(dǎo)向也是場景落地的檢驗(yàn)標(biāo)準(zhǔn)。從需求場景就可看出,類案推送是一系列包含篩除、判斷、識別、歸類、推送的復(fù)雜綜合行為,只有人工智能技術(shù)才足以支持。
表1 類案推送的需求場景組合
近兩年,由于商業(yè)應(yīng)用進(jìn)入新領(lǐng)域、新階段,人工智能再次成為熱點(diǎn)話題?!?〕參見鄧洲:《人工智能:昨天、今天和明天》,載《中國改革》2017年第9期。類案推送是人工智能在司法領(lǐng)域的重大運(yùn)用,理解類案推送的人工智能屬性,有助于開拓類案推送完善方案的視角,同時(shí)找準(zhǔn)升級推進(jìn)的正確途徑。
推送與檢索是兩個(gè)不同的概念,準(zhǔn)確區(qū)別推送與檢索是保證類案推送符合設(shè)計(jì)原意的根本前提。二者的區(qū)別主要包括:
一是語義差別。檢索指從文獻(xiàn)資料、網(wǎng)絡(luò)信息等信息集合中查找所需資料或信息的過程。推送則是指將經(jīng)過整理的信息資源發(fā)送給用戶,滿足用戶的多層次需求,使用戶能夠自己設(shè)定所需要的信息類別,并直接在用戶端接收定制信息的實(shí)現(xiàn)方式。從語義上看,檢索相較于推送,是被動(dòng)結(jié)果到自主結(jié)果的轉(zhuǎn)變、資訊繁雜到信息精細(xì)的轉(zhuǎn)變、機(jī)械回應(yīng)到智能操作的轉(zhuǎn)變。
二是行為差別。檢索行為通常由信息獲取者發(fā)出,檢索主體的一次行為方式包括輸入、瀏覽、判斷、篩除,通過反復(fù)的檢索行為,進(jìn)入信息集合的更深層子目錄,從而定位到有效信息,這一過程反饋主體始終保持機(jī)械回應(yīng)。推送行為通常由信息系統(tǒng)發(fā)出,而信息獲取者是推送的接收主體,推送接收主體的一次行為方式只包括輸入和反饋,輸入行為使系統(tǒng)獲取條件,進(jìn)行精確匹配,并自動(dòng)進(jìn)行瀏覽、判斷、篩除、輸出;反饋行為則對系統(tǒng)輸出內(nèi)容進(jìn)行正誤判斷,進(jìn)而使系統(tǒng)依據(jù)新的反饋指令對輸出內(nèi)容進(jìn)行完善和修改,全部取舍過程由系統(tǒng)自動(dòng)完成。可見,檢索主體的行為模式相較于推送接收主體而言更為復(fù)雜。
三是結(jié)果差別。檢索結(jié)果取決于關(guān)鍵詞的準(zhǔn)確性,而不論關(guān)鍵詞多準(zhǔn)確,也無法避免同義詞和關(guān)鍵詞不唯一導(dǎo)致的信息反饋疏漏或過盛,即結(jié)果無法做到精確定位。推送結(jié)果是基于用戶定制,實(shí)際上是對用戶行為習(xí)慣的畫像和輸入語義的理解,因此信息反饋圍繞理解和習(xí)慣展開,輸出結(jié)果在精確度和全面性上都遠(yuǎn)勝檢索。
為更直觀展示檢索和推送的區(qū)別,以三個(gè)實(shí)踐案例為例:
【案例1】甲未經(jīng)乙公司同意,以乙公司名義在網(wǎng)上開設(shè)乙公司旗艦店,并出售乙公司產(chǎn)品,獲得利潤,乙公司產(chǎn)品不涉及特許經(jīng)營,甲出售產(chǎn)品不涉及假冒偽劣。乙公司得知后起訴法院,認(rèn)為甲損害了自己的合法權(quán)益,案由為侵權(quán)。因立案登記制,法院受理該案,承辦人收到案件后,認(rèn)為該案應(yīng)變更案由,但由于經(jīng)驗(yàn)不足,遂希望通過信息查詢獲得答案。
方式一:類案檢索
結(jié)果:因無法準(zhǔn)確定位關(guān)鍵詞,在裁判文書網(wǎng)上將無法快速搜索出類似案例,因此無法判斷案由。
方式二:類案推送
結(jié)果:直接輸入起訴書事實(shí),系統(tǒng)自動(dòng)匹配案情,在海量裁判文書中篩選相似案情案例,并以匹配度為標(biāo)準(zhǔn),從高到低排列輸出案例。
【案例2】法官A近日新收一起重大疑難復(fù)雜未成年人共同犯罪,審理中合議庭出現(xiàn)分歧,希望通過類案提供審判參考。
方式一:類案檢索
結(jié)果:輸入案由,結(jié)果反饋上百份同罪名裁判文書,但在查看過程中發(fā)現(xiàn)案情并不匹配,在翻閱了幾十份裁判文書后,終于找到類似案例,但由于裁判結(jié)果沒有說理,參考價(jià)值并不大,只能繼續(xù)翻閱,試圖通過定量分析,了解裁判趨勢。
方式二:類案推送
結(jié)果:導(dǎo)入案件卷宗,系統(tǒng)通過案情匹配,自動(dòng)篩選相似案例,根據(jù)相似度、同類判決兩個(gè)因素進(jìn)行排序,結(jié)果反饋為案情相似度降序和同類判決集合,進(jìn)而通過定量分析,了解裁判趨勢。
【案例3】兄弟二人共同故意殺人,基于傳統(tǒng)“存留養(yǎng)親”的刑事政策,承辦法官想尋找類似案例,支持只判處一人死刑的判決依據(jù)。
方式一:類案檢索
結(jié)果:輸入“存留養(yǎng)親”,出現(xiàn)文書樣本有限或無匹配結(jié)果。
方式二:類案推送
結(jié)果:輸入“存留養(yǎng)親”,系統(tǒng)自動(dòng)根據(jù)在先標(biāo)簽定義,推送相似案例,并按照審級進(jìn)行排序。
上文三個(gè)案例也許不能涵蓋檢索和推送的全部情況,但較客觀反映了實(shí)踐中檢索與推送的差異。在應(yīng)用場景中,類案推送的智能屬性就在于做到了“照我說得做”到“自己看著辦”的轉(zhuǎn)變,主要表現(xiàn)為以下三個(gè)基本方面:〔4〕李智勇:《終極復(fù)制:人工智能將如何推動(dòng)社會(huì)巨變》,機(jī)械工業(yè)出版社2016年版,第32-42頁。
一是自動(dòng)化的再升級。1946年,美國福特公司的機(jī)械工程師D.S.哈德提出了“自動(dòng)化”一詞,此后各種提高自動(dòng)化程度的技術(shù)層出不窮,但就和傳統(tǒng)軟件一樣,過去的自動(dòng)化更多是處理能清楚界定邊界的工作,對于邊界不清晰、環(huán)境特別復(fù)雜的情形,則力不從心。在司法領(lǐng)域,類案檢索系統(tǒng)也符合技術(shù)的自動(dòng)化,具體表現(xiàn)為對關(guān)鍵詞識別后的自動(dòng)查詢,但同自動(dòng)化機(jī)械一樣,這種自動(dòng)查詢的準(zhǔn)確性同樣依賴被清楚界定的關(guān)鍵詞,否則無法實(shí)現(xiàn)目標(biāo)結(jié)果的輸出。而類案推送中的自動(dòng)化要更加高級,系統(tǒng)的結(jié)果反饋并不依賴明確的指令,而能夠通過對案情的識別,自主生成“主旨大意”,再以此精確匹配對應(yīng)案例,最后輸出目標(biāo)結(jié)果。
二是大數(shù)據(jù)的分析挖掘。隨著互聯(lián)網(wǎng)、智能硬件的發(fā)展,司法領(lǐng)域的數(shù)據(jù)化程度也將越來越復(fù)雜,隨著數(shù)據(jù)化程度加深,數(shù)據(jù)的不規(guī)則程度也將加深。龐大的數(shù)據(jù)量,不規(guī)則的數(shù)據(jù)格式,使信息整合成為人力不能及的復(fù)雜工程。相比于法官依據(jù)檢索結(jié)果進(jìn)行的樣本數(shù)據(jù)分析,類案推送不僅能夠?qū)D片、文字、聲音等數(shù)據(jù)進(jìn)行識別,還能夠進(jìn)行超強(qiáng)的全數(shù)據(jù)處理,并基于技術(shù)和算法,從不規(guī)則的數(shù)據(jù)中挖掘有效信息,使輸出的反饋結(jié)果與輸入信息條件完全匹配。這一結(jié)果與檢索最大的差別,就在于類案推送的語義理解機(jī)理,其中暗含的是交互技術(shù)、龐大數(shù)據(jù)和機(jī)器訓(xùn)練。
三是個(gè)性化定制。類案推送的個(gè)性化特征以自動(dòng)化和數(shù)據(jù)分析挖掘?yàn)榍疤?。個(gè)性化類案推送通過沉淀歸納與法官的交互數(shù)據(jù),獲取與法官相關(guān)的特征信息,構(gòu)建用戶模型,并根據(jù)用戶自定義需求,在每次反饋結(jié)果時(shí)充分參考這些特征信息,使輸出更加符合法官個(gè)人喜好和習(xí)慣,進(jìn)而使法官獲得更好的使用體驗(yàn),同時(shí)類案推送引入的反饋流程可以及時(shí)調(diào)整修改法官偏好,〔5〕張德:《自然語言處理技術(shù)在司法過程中的應(yīng)用研究》,載《計(jì)算機(jī)工程應(yīng)用技術(shù)》2017年第7期。進(jìn)而使類案推送的運(yùn)用界面更加友好。
總而言之,類案推送與類案檢索不同,是相比于類案檢索更高級的形態(tài),超級自動(dòng)化、對數(shù)據(jù)的分析挖掘、個(gè)性化定制是它的基本功能。
2017年7月20日,國務(wù)院公布《新一代人工智能發(fā)展規(guī)劃》,新規(guī)劃提出促進(jìn)人工智能在證據(jù)收集、案例分析、法律文件閱讀與分析中的應(yīng)用,實(shí)現(xiàn)法院審判體系和審判能力智能化。在這樣的大趨勢下,國內(nèi)法律科技市場開始從“互聯(lián)網(wǎng)+法律”向“人工智能+法律”轉(zhuǎn)變,各地法院也開始積極布局人工智能法律科技,類案推送是其中重要部分。雖然目前多地法院都推出了基于人工智能的類案推送產(chǎn)品,但實(shí)踐中卻面臨使用率不高、關(guān)聯(lián)性不強(qiáng)、認(rèn)同度不夠等問題。制約類案推送運(yùn)用的主要障礙是:
我國屬于成文法國家,尊重法條和司法解釋已成為長久以來的審判傳統(tǒng),加之我國地域遼闊,人文傳統(tǒng)各異,各地經(jīng)濟(jì)社會(huì)發(fā)展不平衡,審判活動(dòng)往往結(jié)合當(dāng)?shù)貙?shí)際展開,才能使裁判結(jié)果最大程度得到認(rèn)可。推行已久的案例指導(dǎo)制度之所以效果不彰,〔6〕左衛(wèi)民:《中國特色案例指導(dǎo)制度的發(fā)展與完善》,載《中國法學(xué)》2013年第3期。所面臨的適用困境與類案推送有部分相似之處。但與案例指導(dǎo)制度不同的是,類案推送是各地主導(dǎo)研發(fā)的審判輔助產(chǎn)品,具有更強(qiáng)的靈活性,也就有更大的改善空間。
通俗講,產(chǎn)品是否暢銷,很大程度取決于對場景的滿足程度。實(shí)踐中,大部分類案推送產(chǎn)品還很難滿足法官的基本需求場景,主要原因在于沒有在需求場景中合理考量法官的主觀意愿,具體可以概括為以下三個(gè)方面:一是對類案推送期許過高,甚至認(rèn)為可以成為法官辦案的“替代品”;二是推送案例的關(guān)聯(lián)度不夠,海量裁判文書數(shù)據(jù)沒有進(jìn)行標(biāo)簽化處理,無法形成符合要求的“類案”樣本庫,對案件的匹配無法做到最大相似;三是推送案例的權(quán)威度不足,忽視審級、地域?qū)Σ门械挠绊?,在同等情況下,沒有做到優(yōu)先推送本院、所屬上訴法院的關(guān)聯(lián)判決。
直至目前,不少法院都聲稱推出了基于大數(shù)據(jù)和人工智能的類案推送產(chǎn)品,但實(shí)踐中,大部分法官并沒有感受到類案推送有別以往審判模式的新穎和紅利,人工智能的概念還停留在只有人工沒有智能的層面,諸多類案推送產(chǎn)品,總體可以歸納為以下三種樣態(tài):
一是進(jìn)階版本的“類案檢索”。具體表現(xiàn)為細(xì)分案由和拆分關(guān)鍵詞,系統(tǒng)自檢索時(shí)實(shí)際無法做到匹配具體案情,推送結(jié)果只能說是更“精確”的案件集,〔7〕實(shí)踐中,多數(shù)法院開發(fā)的所謂“類案推送”系統(tǒng)就屬于此種情況,功能作用并不比裁判文書網(wǎng)、北大法寶等數(shù)據(jù)庫搜索更智能便捷。法官仍然需要通過人工篩查的方式,比對與承辦案件的相似程度,導(dǎo)致實(shí)踐中使用率不高。
二是弱人工智能下的初級推送。具體表現(xiàn)為卷宗數(shù)字化推進(jìn)較慢,裁判要素提煉還需反復(fù)推敲,圖像識別、語義理解技術(shù)無法準(zhǔn)確抓取案件要素,因此類案推送僅能滿足規(guī)范化、標(biāo)準(zhǔn)化操作程度高的部分簡單案由,且在匹配過程中準(zhǔn)確率并不高。
三是交互設(shè)計(jì)頻繁的推送系統(tǒng)。類案推送設(shè)置的前提條件過于復(fù)雜,層級過多,法官需要不斷細(xì)化篩選條件,對輸出結(jié)果進(jìn)行反饋,修正檢索參數(shù),多輪交互對話可能使結(jié)果更加精確,但也可能在每一次交互修正中都使關(guān)鍵詞與原意產(chǎn)生偏離,最終導(dǎo)向完全不合格的輸出結(jié)果。
綜上,類案推送如果缺乏人工智能助力,就只能是類案檢索的優(yōu)化,篩選、比對的壓力仍然要由法官承擔(dān),若想實(shí)現(xiàn)真正意義上的人工智能推送,必須突破識別、匹配上的技術(shù)壁壘。
實(shí)現(xiàn)“人工智能+類案推送”,還需要解決很多問題,而場景、數(shù)據(jù)、算力和人才都是關(guān)鍵的突破口。
“很多時(shí)候,人們喜歡的不是產(chǎn)品本身,而是產(chǎn)品所處的場景,以及場景中自己浸潤的情感”?!?〕吳聲:《場景革命》,機(jī)械工業(yè)出版社2017年版,第10頁。對司法工作者而言,無論何種輔助產(chǎn)品,一旦不能滿足司法實(shí)踐需求,就很難推廣并發(fā)揮作用。目前的類案推送即面臨這樣的問題。將需求場景作為前提,明確類案推送需要滿足的司法需求,才可以避免這一產(chǎn)品的研發(fā)陷于盲目。
辦案場景的嵌入,就是要聚焦深耕類案推送場景和數(shù)據(jù)處理背后的整體方案,主要包括以下步驟:
1.細(xì)分需求場景。開發(fā)者應(yīng)將視線不斷下沉,從基層獲取變革動(dòng)力,場景是最真實(shí)的以人為中心的體驗(yàn)細(xì)節(jié),因此在構(gòu)成上要非常細(xì)致,時(shí)間、地點(diǎn)、人事、事件、連接方式等等,都是構(gòu)成明確具體場景不可或缺的因素。
2.突出基礎(chǔ)場景。類案推送應(yīng)緊緊圍繞身份定位、目的功能和正確途徑展開,以法官為開發(fā)視角,產(chǎn)品使用應(yīng)簡單明快,符合司法規(guī)律和司法習(xí)慣。
3.健全環(huán)境場景。單點(diǎn)技術(shù)本身無法構(gòu)成完整的應(yīng)用產(chǎn)品,而需要與其他產(chǎn)品結(jié)合。類案推送是一系列行為的復(fù)合結(jié)果,技術(shù)突破固然重要,但數(shù)據(jù)分析加簽工作同樣重要,此外,為類案推送可持續(xù)發(fā)展而建立的規(guī)范、化標(biāo)準(zhǔn)化辦案流程等,也是類案推送環(huán)境場景追求優(yōu)化的方向。
需求場景為產(chǎn)品開發(fā)優(yōu)化指明了道路,數(shù)據(jù)則為產(chǎn)品落地提供了前提。類案推送最終向法官呈現(xiàn)全面、精確、有效的相似案例,背后運(yùn)作的則是一套在海量案例中進(jìn)行全量檢索的邏輯。因此,沒有龐大案例庫的支持,類案推送將無法實(shí)現(xiàn)精準(zhǔn)。目前各地法院都在推動(dòng)電子卷宗同步生成項(xiàng)目,然而電子卷宗是否意味著有效的數(shù)據(jù)呢?
眾所周知,計(jì)算機(jī)對于數(shù)據(jù)的提取基于識別,而識別的前提是規(guī)范化和標(biāo)準(zhǔn)化。電子卷宗同步生成產(chǎn)生大量結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)、復(fù)雜結(jié)構(gòu)化數(shù)據(jù),千差萬別的數(shù)據(jù)又給識別帶來了新的難題。數(shù)據(jù)質(zhì)量差是當(dāng)前類案推送面臨的重要難題。
提高數(shù)據(jù)質(zhì)量,至少應(yīng)做到以下五個(gè)方面:(1)標(biāo)準(zhǔn)化。對數(shù)據(jù)元素的定義和理解必須一致。(2)完整性。所有必須的數(shù)據(jù)都要存在并且錄入。(3)精確性數(shù)據(jù)應(yīng)缺地代表現(xiàn)實(shí)情況并且來源可靠。(4)有效性。數(shù)據(jù)的價(jià)值應(yīng)處在可接受的范圍內(nèi)。(5)唯一性。數(shù)據(jù)不能多次重復(fù)出現(xiàn)。擁有高質(zhì)量的數(shù)據(jù),才能有大數(shù)據(jù)分析的基礎(chǔ),否則,數(shù)據(jù)非但無法發(fā)揮作用,反而會(huì)變成一項(xiàng)危險(xiǎn)的累贅。
在提高數(shù)據(jù)質(zhì)量的前提下,分析統(tǒng)計(jì)的科學(xué)精準(zhǔn)依賴標(biāo)簽體系的完備,而在目前技術(shù)下,裁判文書的標(biāo)簽體系仍需歷經(jīng)人工標(biāo)簽、專家經(jīng)驗(yàn)、實(shí)踐反饋、數(shù)據(jù)迭代、標(biāo)簽優(yōu)化的循環(huán)流程,才可能實(shí)現(xiàn)數(shù)據(jù)清潔有效。
個(gè)案裁判結(jié)果受利益和情感影響,法官的審判邏輯通常在不同情形下有微妙調(diào)整,類案推送如果只以表面審判活動(dòng)的統(tǒng)一性為設(shè)計(jì)思路,將很難對輔助審判起到實(shí)質(zhì)性作用。清潔有效的數(shù)據(jù)為類案推送提供了機(jī)器學(xué)習(xí)的前提條件,而如何通過機(jī)器學(xué)習(xí)實(shí)現(xiàn)信息提取到通用知識圖譜的構(gòu)建,關(guān)鍵在于認(rèn)知技術(shù)的突破。
當(dāng)前類案推送在“智能”領(lǐng)域最大的缺陷集中于理解、識別案情等“認(rèn)知”行為。這種“認(rèn)知”反映到類案推送的技術(shù)層面主要包括圖像識別和語義理解,而不論是理解還是識別都應(yīng)先解決三個(gè)基本問題:(1)識別能力。即裁判文書的可識別率,這一要求依賴對數(shù)據(jù)的清潔和標(biāo)準(zhǔn)化。(2)識別什么。即裁判文書中哪些因素是司法裁判的考量因素,例如案件事實(shí)、法律法規(guī)以及隱藏在裁判文書背后法官隱形的智慧和經(jīng)驗(yàn)。(3)如何排列。即識別出了影響裁量的因素后,如何排列這些因素的權(quán)重,如何通過綜合模擬,形成合乎一般司法審判邏輯的輸出結(jié)果。
這就要求類案推送能夠?qū)⒉门羞^程精確模型化,第一層次的圖像識別需要能夠真正抓取重要因素,進(jìn)行拆解標(biāo)注,進(jìn)而在第二層次的語義理解和深度學(xué)習(xí)實(shí)現(xiàn)對不同情節(jié)案件乃至裁判法理的智能化區(qū)分和推送。當(dāng)前,司法領(lǐng)域數(shù)據(jù)開放和整理的步伐相對緩慢,基礎(chǔ)數(shù)據(jù)的不規(guī)范和算法對復(fù)雜理解能力的局限性,很大程度影響了數(shù)據(jù)分析的精確性和有效性,因此,目前仍舊需要人力與人工智能的結(jié)合,即由人設(shè)定方向,利用某種機(jī)器智能算法來獲得結(jié)果,和目標(biāo)進(jìn)行匹配,并人工進(jìn)行標(biāo)注??梢灶A(yù)見,這一過程可能還需要迭代多次,才能達(dá)到最終目的。
類案推送是基于法官需求場景而出現(xiàn)的職能產(chǎn)品,而場景設(shè)計(jì)本身是一個(gè)循環(huán)流程。(見圖1)
圖1 產(chǎn)品設(shè)計(jì)流程圖
場景完善和切換關(guān)鍵在于有效反饋,然而目前類案推送在反饋完善機(jī)制上存在明顯的不足,這一點(diǎn)深刻暴露出僅依靠技術(shù)專家推進(jìn)系統(tǒng)研發(fā)工作的局限性以及研發(fā)與應(yīng)用在互動(dòng)互補(bǔ)上的有限性。這種缺陷使類案推送的應(yīng)用場景無法向前更進(jìn)一步:基于現(xiàn)有需求場景的類案推送研發(fā),由于缺乏司法工作者的深度參與,無法真正滿足實(shí)際需求,再加之研發(fā)與應(yīng)用之間反饋機(jī)制的不完善,進(jìn)一步導(dǎo)致類案推送的應(yīng)用場景無法真正落地。
解決這一問題首要就是要解決好人的問題,而目前最為缺乏的是三類人才:
1.司法與技術(shù)的連接者。即能夠解釋供需雙方各自期待的人,能夠代表技術(shù)公司解釋服務(wù)內(nèi)容,能夠代表司法機(jī)關(guān)向技術(shù)公司描述具體需求和場景。
2.法律與技術(shù)的跨界者。即了解人工智能技術(shù)原理,同時(shí)也理解司法裁判過程原理,并且能夠利用目前技術(shù),將法律文本拆解成機(jī)器訓(xùn)練所需知識的專門人員。
3.研發(fā)運(yùn)用的反饋者。即在類案推送研發(fā)各個(gè)階段,充分參與使用,并精準(zhǔn)反饋使用體驗(yàn)和改進(jìn)建議用戶,類案推送必須堅(jiān)持以應(yīng)用開路,不斷更新迭代,才能促進(jìn)系統(tǒng)不斷升級。
場景思維、數(shù)據(jù)處理和科技進(jìn)步使我們相信,在不遠(yuǎn)的未來,人工智能將與司法審判實(shí)現(xiàn)深度融合,諸如類案推送等由機(jī)器深度學(xué)習(xí)發(fā)展而來的人工智能產(chǎn)品,深嵌于智慧法院辦案場景,并在每一次數(shù)據(jù)標(biāo)準(zhǔn)化、精準(zhǔn)化、標(biāo)簽化的迭代中,促進(jìn)司法能力和司法品質(zhì)加速飛越,進(jìn)而推動(dòng)司法體制向著更加公平正義高效權(quán)威的方向不斷邁進(jìn)。正如雷·庫茲韋爾在《奇點(diǎn)臨近》一書中寫道:“人類技術(shù)一直在加速進(jìn)步??傆幸惶欤覀?nèi)祟愐幻腌娝斐傻募夹g(shù)進(jìn)步和對文明的貢獻(xiàn),將超過之前上萬年所做的一切?!?/p>