周莉 成文武
“提升類案推送的智能化、精準化水平”是最高人民法院《關于統(tǒng)一法律適用加強檢索的指導意見(試行)》(以下簡稱《指導意見》)中明確提出的要求。①《關于統(tǒng)一法律適用加強檢索的指導意見(試行)》第12條規(guī)定,各級人民法院應當積極推進類案檢索工作,加強技術研發(fā)和應用培訓,提升類案推送的智能化、精準化水平。從關鍵詞主動搜索到類案智能推送,類案智能平臺確實已實現(xiàn)了從0到1的突破,但仍然有學者認為,“這些類案推送平臺仍處于只有人工沒有智能的層面。”①陳琨:《類案推送嵌入“智慧法院”辦案場景的原理和路徑》,載《中國應用法學》2018年第4期。亦有學者認為,“如果不將算法與法律思維相融合,這些類案推送平臺將是沒有靈魂的技術軀殼,不會在司法實踐中發(fā)揮出其應有作用?!雹趧Ⅳ敿骸额惐韧评碓诜扇斯ぶ悄苤械膽谩灾笇园咐悄芡扑拖到y(tǒng)的構建為例》,載《法律方法》2019年第2期。目前,學術界對類案推送的研究成果不多,主要集中在類案推送的制度構建、算法構架上,對類案推送在司法實踐中的實際效果如何、如何提高類案推送質量等方面鮮有研究。③質量可以用于形容產(chǎn)品或服務的好壞、優(yōu)劣程度,本文提到的類案推送質量主要指的是類案推送結果對用戶需求的滿足程度。為此,本文從類案推送質量的不同維度出發(fā),通過控制類案推送的每道關鍵工序,確保類案推送結果盡可能貼近法官用戶真實需求這一質量要求。
為考察類案推送在審判中的實際運行狀況,筆者通過人民法院官網(wǎng)報道、本院法官座談會、面向Z市法官隨機發(fā)放100份調查問卷等方式搜集資料,④筆者之所以選擇Z市法院法官作為調查對象,主要是考慮到Z市所有法院都配備最高院的類案智能推送系統(tǒng),沒有配備其他類案推送平臺。以定量調查方法呈現(xiàn)法官用戶使用類案智能推送系統(tǒng)的真實感知。其中,調查內容涵蓋:遇到何種情況時,需要使用類案推送;通常在哪個階段需要使用類案推送;基于哪些原因使用類案推送;對類案推送哪些方面表示滿意。
如果說通過主動輸入關鍵詞進行類案檢索的平臺屬于初代類案智能平臺,那么在以中國裁判文書網(wǎng)、法信為代表的初代類案智能平臺之后,主要出現(xiàn)了三種類案推送平臺:一是進階的“類案檢索”,通過細分案由、拆分關鍵詞進行檢索,雖能得到更準確的推送結果,但仍需法官進行人工甄別;二是初級類案推送,即通過圖像識別、語義理解抓取案件要素,但不能適用于規(guī)范化低的復雜案由,往往準確性不高;三是交互頻繁設計的類案推送,即通過設計多層級前提條件,法官通過多輪交互對話獲得精確結果,但每一次的交互對話都容易與原意偏離??梢?,在初代類案智能平臺之后,各種類案智能產(chǎn)品仍然沒有實現(xiàn)真正意義上的人工智能推送。
表1 類案智能平臺情況匯總表
《指導意見》第2條①《關于統(tǒng)一法律適用加強檢索的指導意見(試行)》第2條規(guī)定,人民法院辦理案件具有下列情形之一,應當進行類案檢索:(一)擬提交專業(yè)(主審)法官會議或者審判委員會討論的;(二)缺乏明確裁判規(guī)則或者尚未形成統(tǒng)一裁判規(guī)則的;(三)院長、庭長根據(jù)審判監(jiān)督管理權限要求進行類案檢索的;(四)其他需要進行類案檢索的。對類案檢索適用范圍予以明確,在一定程度上避免了全面檢索給法官帶來的負累。2019年,全國法院法官人均辦案228件,同比增長13.4%,有些地方法院法官人均辦案數(shù)量甚至超過500件。②參見于子平:《深化司法改革 建設智慧法院》,載中國法院網(wǎng)https://www.chinacourt.org/article/detail/2020/06/id/5285569.shtml,2020年6月20日訪問。在案多人少的今天,辦案法官并不會對全部案件采用類案檢索,全面推送顯然也缺乏推廣土壤。然而,《指導意見》沒有對“其他需要進行類案檢索的”這一條文進行明確規(guī)定,容易導致審判實踐中出現(xiàn)適用不統(tǒng)一的情形。根據(jù)調研結果,辦案法官對《指導意見》規(guī)定的三種類案檢索情形基本達成一致意見,但對其他需要進行類案檢索的情形產(chǎn)生了一定的分歧,遇到新型案件需進行類案推送有74人,遇到自由裁量權行使中存在裁判尺度不一需要進行類案推送有58人,遇到擬作出的裁判與本院或上級法院的類案裁判可能發(fā)生沖突有51人,遇到其他情形有33人??梢?,類案檢索范圍的模糊規(guī)定在一定程度上導致了類案推送范圍的適用不一。
從庭前準備階段到案件審理階段,再到結案階段,辦案法官都有類案推送的需求,且在不同的庭審階段,會有不一樣的需求。然而,現(xiàn)行類案智能推送系統(tǒng)只能滿足辦案法官的部分需求:一是在庭前準備階段,能輔助檢索類似案例,仍需要辦案法官自行整理審理要點;二是在案件審理階段,能提供大量相似事實情節(jié)的案例樣本,但無法根據(jù)法官類型、個人偏好進行及時地個性化推送;三是在結案階段,能提供類案集合的基本事實、爭議焦點、證據(jù)認定、判決結果等,但無法對裁判結果預判、對裁判偏離度提示、對類似裁判思路總結。可見,現(xiàn)行類案推送還不算真正意義上的人工智能推送,只是能夠有限滿足辦案法官的辦案需求。
類案智能推送系統(tǒng)是人工智能與法律深度融合的產(chǎn)物,而法官則是法律與技術之間的連接者,也是類案推送產(chǎn)品的最終質量檢測員。為了通過窺視法官對類案智能推送系統(tǒng)不同方面的滿意程度,進而呈現(xiàn)類案推送質量短板所在,筆者在調查問卷中融入以下評價指標:1.相關性,即智能推送的案例與法官真實需求很相關的;2.權威性,即智能推送的案例是令人信服的;3.準確性,即智能推送的案例是準確的、無錯誤的;4.精簡性,即智能推送結果簡練直觀、一目了然;5.易懂性,即智能推送結果易于理解;6.廣泛性,即智能推送的案例很多,涉及法院廣泛;7.審判輔助效用,即智能推送的案例有利于輔助審判工作。通過調研可見,現(xiàn)行類案推送在相關性、準確性方面明顯存在質量短板,在易懂性、廣泛性、精簡性、審判輔助效用方面亦有待提高。
“信息質量維度是指信息滿足用戶要求和使用目的的基本質量特性。”①劉冰:《網(wǎng)絡環(huán)境中基于用戶視角的信息質量評價研究》,中國社會科學出版社2015年版,第48頁。類案推送結果屬于信息的一種,自然可通過不同信息質量維度進行評價。為深入考察類案推送在審判實踐中的運行困境,需從不同維度對類案推送進行質量評估,具體如下:
目前類案推送系統(tǒng)的文書儲備基本來源于裁判文書網(wǎng)的判決書數(shù)據(jù)以及最高檢發(fā)布的指導案例及最高法、各省、直轄市、自治區(qū)高級人民法院、檢察院發(fā)布的典型案例。由于缺少過濾、整合的過程,導致有效資源難以提煉,過多冗余信息必然會導致有效信息的丟失,造成推送遺漏的窘境。
1.公開時間的斷層。中國裁判文書網(wǎng)于2013年才開始逐步建立,此后生效裁判文書才開始集中上傳至這一平臺。②參見陳燾、劉宇瓊:《“同案同判”的涵攝與超越——兼論區(qū)域法律統(tǒng)一適用與司法協(xié)同治理》,載《法學研究》2020年第3期。囿于案卷電子化的時間較晚,上網(wǎng)案例的發(fā)布時間大多在2013年之后,造成當前的數(shù)據(jù)庫缺乏“歷史底蘊”,可推送數(shù)據(jù)僅局限于2013年至今的上網(wǎng)裁判文書,以致推送結果存在年份上的遺漏。
2.公開地域的失衡。浙江、山東、安徽、河北、陜西公開結案比超過60%,而有些省份如黑龍江、西藏要低于20%,總體看,經(jīng)濟發(fā)達省份的公開文書量不僅超過經(jīng)濟落后省份,公開比例也相對更高,導致推送數(shù)據(jù)庫的完整性受到掣肘,可推送數(shù)據(jù)存在地域上的遺漏。③參見馬超、于曉虹、何海波:《大數(shù)據(jù)分析:中國司法裁判文書上網(wǎng)公開報告》,載《中國法律評論》2016年第4期。
3.公開技術的掣肘。類案推送目前采用搜索為主的推送方式,通過疊加多個關鍵詞,在一定程度上限定搜索范圍,以達到推送目的。然而,缺乏核心法律技術細節(jié)設計支撐,最終推送結果只是機械包含搜索關鍵詞的大量文書,而非真正意義上的類案,無法解決業(yè)務核心難點。
當待決案件為新類型案件或疑難復雜案件時,法官對類案推送的期待值和需求值也會相對較高,此類案件的復雜之處在于對事實或證據(jù)的認定以及案件中涉及的疑難法律問題的處理。
1.類案標注不全面,導致結果失真。目前的類案推送系統(tǒng)主要通過關鍵詞搜索方式運行,即由用戶通過檢索關鍵詞的形式達到推送目的。若爭議焦點、亟需解決的法律問題段落沒有被設置成相應的要素標簽,且數(shù)據(jù)庫中文書包含的表達詞匯與用戶鍵入的搜索關鍵詞不一致時,即使該文書實際上有關于該爭議焦點或者疑難法律問題的專段論述,也無法出現(xiàn)在最終推送結果中。
2.類案要件不標準,引發(fā)重復篩選。通過相關性選項排序的推送結果,往往是數(shù)據(jù)庫文書與用戶搜索關鍵詞的一致性體現(xiàn)結果,有的僅僅是案件特征形式上相似,實質法律關系上卻與待決案件大相徑庭,無法精準滿足用戶的推送需求。雖然通過多次篩選、甚至全文檢索逐一比照,用戶也能得到所需信息,但需以耗費大量時間成本為代價,時間成本與利用率不成正比。
可見,只有采用更精準的信息抓取方式、更先進的個性化推送技術,才是當前類案推送在人工智能輔助下的應有之意。
最高法第一批指導性案例于2011年12月發(fā)布,至今已發(fā)布21批共112件指導性案例。①參見潘子璇:《統(tǒng)一司法尺度維護司法公正 最高院七年來發(fā)布112件指導案例》,載騰訊網(wǎng)https://new.qq.com/omn/20190225/20190225A0FL81.heml?pc,2020年6月20日訪問。但對于裁判文書公開網(wǎng)公開的海量裁判文書來說,指導性案例的數(shù)量只是滄海一粟,涵蓋的爭議焦點和法律要素廖若星辰,而審判實踐中遇到的疑難問題千差萬別,大部分超出指導性案例的涵蓋范疇,故類案推送結果大部分來源于已公開的裁判文書,需要法官結合自身經(jīng)驗對推送結果進行甄別。一方面,在類案推送系統(tǒng)中,指導性案例和典型案例等沒有區(qū)別標識,混雜于普通案例之中;另一方面,未對普通案例文書進行篩選,很多數(shù)據(jù)存在錯別字、要素不全等形式上的缺失,又或存在不同程度的說理不清、論證不明的情況。類案推送呈現(xiàn)結果若沒有經(jīng)過濾、篩選、排序等流程,必然會導致法官用戶由于甄別耗時過長,引發(fā)對類案推送的信任斷裂,最終對類案推送結果產(chǎn)生質疑,這既有違類案推送系統(tǒng)設計的最初意圖,也有悖借助類案推送提高裁判文書質量的初衷。
如果說統(tǒng)一裁判尺度是類案推送的質量要求,那么,在案件審判流程公開,透明司法的大環(huán)境下,在人均辦案任務數(shù)日益增長的現(xiàn)狀下,時間于制度的價值備感重要。基于對過程和效果的整體考量,類案推送的主要目的應當定位在效率上。
1.精準推送的制約。法官真正需要的是某個疑難問題的主流觀點、案件裁判思路以及論證說理的方法等,而現(xiàn)行類案推送只能識別具有相似性的文書字段?,F(xiàn)階段文書格式化程度并不高,某一特定字段可能與檢索者的實際需求相去甚遠,且類案推送系統(tǒng)的數(shù)據(jù)獲取方法過于簡單,缺乏深層加工,易導致結果偏差。
2.智能推送的不暢。在全文顯示的推送模式下,法官需要花費大量時間去逐一甄別法律爭點,通過閱讀上述文書中的論證說理部分,自行提煉相關裁判思路、觀點,對多篇文書中不同的裁判思路、觀點進行對比,選擇最符合自身需求的文書論證說理部分采用。也就是說,傳統(tǒng)類案推送系統(tǒng)中的推送結果并非用戶最終的需求,只是從數(shù)據(jù)庫中完成了部分數(shù)據(jù)的初步篩選,原始推送結果不能清晰地體現(xiàn)出案件裁判價值取向的全樣本規(guī)律及不同地域法院的裁判價值考量。如果不結合法官自身的二次人工篩選,原始推送結果可提供的只是案件與法官之間點對點的推送,而不是具有不同價值取向或裁判規(guī)律的類案模塊與法官之間面與點的對接。
正因為大海撈針般的檢索可能遠不如按既有經(jīng)驗判決來得快,所以在衡量時間成本與效率價值后,很少會有法官愿意花費大量時間用于類案檢索以規(guī)避“質量”隱患。
只有了解人工智能輔助下類案推送的真實當下,才能預判和迎接它的可能未來。在清楚知道類案推送在審判實踐中存在的質量短板后,下一步才能從宏觀層面到微觀層面對類案推送進行全方位優(yōu)化。
“法律人工智能產(chǎn)品如果沒有立足法律人活動的場景需求,沒有尊重法律思維和體現(xiàn)法律方法,那么在實踐運行中難免水土不服并產(chǎn)生一系列問題,進而導致無法充分發(fā)揮法律人工智能產(chǎn)品的積極效能?!雹賱Ⅳ敿骸额惐韧评碓诜扇斯ぶ悄苤械膽谩灾笇园咐悄芡扑拖到y(tǒng)的構建為例》,載《法律方法》2019年第2期。首先,要將法律科學技術與法律業(yè)務場景緊密結合起來,確定標簽體系的合理性,類案推送的結果才能具有最佳的數(shù)據(jù)匹配效果;其次,需要具有法律業(yè)務知識的人加入法律知識圖譜的建立隊伍中,完善現(xiàn)有類案推送系統(tǒng)的知識架構體系,用“司法話語”充實類案推送知識圖譜,盡可能貼近法官思維規(guī)則和司法推理過程。“法律知識圖譜的提煉不僅需要足夠優(yōu)秀的專業(yè)法律知識,而且更是一項復雜工程。”②華宇元典法律人工智能研究院:《讓法律人讀懂人工智能》,法律出版社2018年版,第29頁。最后,要將裁判思維方法與類案推送相糅合,以民商事案件為例,曾有法官歸納了七種典型的民商事裁判思維,分別是回流型、往返型、衡平型、循環(huán)型、同步型、逆向型、順向型。③參見郝廷婷:《民事審判思維方法實證研究——“三段論”邏輯在中國基層法院的續(xù)造與驗算》,載《法律適用》2012年第1期。在以請求權為基礎的裁判思維指導下,根據(jù)不同類型案件的審理步驟,尤其是針對重大疑難復雜案件、新型案件進行裁判思路的歸納。將人工智能技術與法律思維最大限度地結合起來,在算法設計中融入法律思維,提高認知智能技術優(yōu)化程度,增強識別效果的準確性。
在人工智能輔助下,類案推送結果應當是基于科學的模型及算法產(chǎn)生的,相較于傳統(tǒng)類案檢索方式而言,不受用戶檢索操作水平的掣肘,能夠有針對性地為用戶提供經(jīng)過篩選的推送結果。就法官用戶而言,每個法官都有自己的特征,如何捕捉法官用戶的多維特征,進而挖掘其真實需求,對于類案精準推送至關重要。一是用戶的靜態(tài)特征,所處庭室、從事審判工作時間、受教育程度等。例如,在最高院發(fā)布新的典型案例時,通過智能對比識別,發(fā)現(xiàn)類案數(shù)據(jù)庫中有文書與某位法官用戶主辦的待決案件相似度較高,根據(jù)不同案例類型對不同庭室的法官進行精準化類案推送。二是用戶的動態(tài)特征,所處庭審階段、檢索習慣、查詢領域等。根據(jù)案件所處不同庭審階段,對法官用戶進行個性化類案推送,以便于法官用戶理清審判要點。只有將用戶特征與類案推送模型深度糅合,才能挖掘用戶的真實需求,使用戶逐步脫離“個體經(jīng)驗”依賴,建立對類案推送結果的信任關系。
類案推送是人工智能與法律深度融合的產(chǎn)物,而法官不僅是類案推送產(chǎn)品的使用者,亦是類案推送產(chǎn)品的最終質量檢測員。一方面,對于類案推送結果在審判實踐中運行效果如何、存在哪些不足、亟需從哪些方面進行完善等問題,法官更有話語權。根據(jù)法官用戶的反饋意見,對類案推送系統(tǒng)進行針對性調整、優(yōu)化,能讓類案推送結果更加切合法官用戶的真實需求。另一方面,建立一套科學的、操作性強的評價體系,既可以規(guī)范推送的模式、便于量化執(zhí)行,亦能提高推送結果的采納度、匹配度,滿足法官用戶更高層次的需求。通過量化評價體系,對推送結果從多個方面進行質量評價,法官用戶能從最終的綜合評分中,自行評估結果的參考價值度,從中篩選采納所需的推送結果。
為達到質量要求,在質量形成全過程的每一個環(huán)節(jié)所采取作業(yè)的技術和活動稱為質量控制。“廣義上的質量控制就是確定系統(tǒng)過程的狀態(tài)以及糾正質量過程的狀態(tài)以及糾正質量過程偏離質量目標的質量管理活動?!雹偻鹾Q啵骸顿|量分析與質量控制》,電子工業(yè)出版社2015年版,第18頁。簡言之,質量控制是為了通過監(jiān)視質量形成過程,消除質量環(huán)上所有階段引起不合格或不滿意效果的因素。要對類案推送的信息質量進行控制,就應當貫徹預防為主的原則,使信息推送過程中的每一個質量環(huán)節(jié)都處于有效的受控狀態(tài)。根據(jù)類案推送結果存在的質量問題,圍繞類案推送的特點,提出把握每個環(huán)節(jié)的關鍵點,構建類案推送質量控制機制,旨在保障類案推送的相關性、準確性、易懂性、及時性和可用性。
根據(jù)《指導意見》第3條①《關于統(tǒng)一法律適用加強檢索的指導意見(試行)》第3條規(guī)定,承辦法官依托中國裁判文書網(wǎng)、審判案例數(shù)據(jù)庫等進行類案檢索,并對檢索的真實性、準確性負責。的規(guī)定,辦案法官要依托中國裁判文書網(wǎng)、審判案例數(shù)據(jù)庫等進行類案檢索。假如沒有優(yōu)質的法律數(shù)據(jù)庫,類案推送就猶如空中樓閣,無法為辦案提供信息支撐和保障。類案推送并非需要浩如煙海的數(shù)據(jù),高質量的數(shù)據(jù)才是確保類案推送質量高的第一步。
本文認為,可以通過三增一減來建立目標數(shù)據(jù)庫。一是加強全國法院歷史裁判檔案的電子化,由各個法院對歷史數(shù)據(jù)進行逐步整理,實現(xiàn)司法數(shù)據(jù)系統(tǒng)化、完整化,減少時間跨度上的缺失和斷層,從中提煉經(jīng)過時間驗證的司法經(jīng)驗,以應對日益增長的新型、疑難、復雜案件的推送需求;二是加強全國各地法院裁判檔案的公開化,尤其是針對上網(wǎng)文書公開率偏低的地區(qū)法院,以避免目標數(shù)據(jù)庫在地域上的失衡;三是加強法律法規(guī)、司法解釋、指導意見、指導性案例的填充,及時更新目標數(shù)據(jù)庫的數(shù)據(jù);四是減少重復冗余信息。類案推送系統(tǒng)的數(shù)據(jù)庫可以基于中國裁判文書網(wǎng)、審判案例數(shù)據(jù)庫,但不能完全復制沿用上述數(shù)據(jù),在篩選目標數(shù)據(jù)庫的準入數(shù)據(jù)時,要以是否具有參考價值、參考價值高低作為準入標準。目標數(shù)據(jù)庫的篩選隊伍應配備相應的法律專業(yè)人士,以其專業(yè)的法律思維,對無法抓取裁判思路的、論證說理過于簡單的類案文書予以排除,對重復的類案文書進行過濾、整合,以此降低法官用戶獲取有用信息的時間成本,提高推送效率。
針對類案數(shù)據(jù)庫中的數(shù)據(jù)龐大、質量參差不齊且均為非結構化數(shù)據(jù)的特征,流程設計應從數(shù)據(jù)、用戶和結果為主體出發(fā),以法官用戶為中心,實現(xiàn)類案推送流程智能化、精準化。
1.以“數(shù)據(jù)深度加工”塑造法律知識圖譜
(1)加載法律專有名詞詞典,將類案數(shù)據(jù)庫中的文書樣本數(shù)據(jù)與待決案件的起訴狀、答辯狀等電子檔案中的非結構化數(shù)據(jù)進行深度加工;(2)構建法律同義詞詞表,并基于語言轉換策略實現(xiàn)同義關系的抽取,即將同義詞、近義詞進行匯聚歸類;(3)利用Jieba工具包的分詞功能和詞性標記功能,對文本數(shù)據(jù)進行分詞以及詞性標注,避免出現(xiàn)分詞時將法律專有名詞分開的情況,并對名詞集中的非領域概念進一步剔除。①參見鄭姝雅、黃奇、張戈、李雨軒、陳雪:《面向用戶生成內容的本體構建方法》,載《情報科學》2019年第11期。通過對數(shù)據(jù)的深度加工,進一步規(guī)范文書框架與文字表達,將類案數(shù)據(jù)庫的文書與待決案件自動生成為個案知識圖譜。
2.以“用戶特征+微觀行為”勾勒法官用戶畫像
在“門診式”審判新模式下,不同審判團隊的審判方向各有不同,即便在同一個審判團隊中,由于法官的性格、辦案經(jīng)驗、辦案風格各具特色,對類案推送的需求偏好,亦各有不同?!坝脩舢嬒竦目坍嬐ǔ:w用戶的多個屬性——需求、行為、興趣、心理、性格等。”②吳劍云、胥明珠:《基于用戶畫像和視頻興趣標簽的個性化推薦》,載《情報科學》2020年第1期。通過用戶畫像的構建,挖掘法官用戶的真實需求,有效提升類案推送的精準度和智能度。具體過程如下:
(1)用戶特征分析。采集與法官用戶相關的多源數(shù)據(jù),包括用戶的姓名、性別、所屬法院層級、審判團隊的類別、負責案件類型、年齡、辦案年限、辦案經(jīng)歷、推送需求偏好等數(shù)據(jù)。
(2)微觀行為挖掘。透過類案推送系統(tǒng)中的用戶日志信息,可以采集法官用戶的微觀行為信息,以此挖掘法官用戶偏好。從法官用戶在事實查明、說理論證、法條引用、判項表述等各部分停留的時長以及用戶復制引用的樣本結構頻率等微觀行為信息中,提取用戶關注的重點模塊。例如:法官用戶在閱讀類案文書時,在說理論證部分耗時最長,且復制引用的樣本多為類案數(shù)據(jù)中的說理論證部分,則可以得出該法官用戶重點關注說理論證部分的結論。在此后的推送中,可提高說理論證部分相似度的推送權重和賦值,并以區(qū)別字體、顏色顯示該部分推送內容。將法官用戶的行為信息利用神經(jīng)網(wǎng)絡進行建模,模擬微觀行為和宏觀交互信息,捕捉各類行為序列對推薦結果的影響力,得到行為偏好向量,即為實時的法官用戶畫像行為特征。③參見吳彥文、劉雪純、杜嘉薇、何華卿:《融合微觀行為特性的用戶畫像增強研究》,載《情報科學》2020年第1期。
(3)用戶畫像聚類。依據(jù)法官用戶的微觀行為特征進行實時地法官用戶畫像更新,通過法官用戶的相似度計算,在已構建單個法官用戶畫像的基礎上,進行法官用戶聚類,形成聚類法官用戶畫像。
3.以“分類逐層檢索”重塑推送呈現(xiàn)
在推送過程中,效力層級、地域范圍、推送類型、案件相似度、裁判日期均是優(yōu)先推送所需要考慮的因素。為提高推送精準度和推送質效,可實行“分類逐層檢索”的方式。
一方面,對于不同層級的案例,可以參考《指導意見》第4條①《關于統(tǒng)一法律適用加強檢索的指導意見(試行)》第4條規(guī)定,類案檢索范圍一般包括:(一)最高人民法院發(fā)布的指導性案例;(二)最高人民法院發(fā)布的典型案例及裁判生效的案件;(三)本?。ㄗ灾螀^(qū)、直轄市)高級人民法院發(fā)布的參考性案例及裁判生效的案件;(四)上一級人民法院及本院裁判生效的案件。除指導性案例以外,優(yōu)先檢索近三年的案例或者案件;已經(jīng)在前一順位中檢索到類案的,可以不再進行檢索。進行排序。在第一層級中,與新的法律、行政法規(guī)、司法解釋相沖突或者為新的指導性案例所取代的,一律不予推送。除第一層級外,均遵循已推送前一層級的類案,可不再推送后一層級的類案這一原則進行,并在推送結果中標明相應的層級信息。若在上述規(guī)定的范圍內無法找到類案,可以對本省其他法院(除本市)裁判的案件、全國其他法院(除本省)裁判的案件進行推送。
另一方面,對于同一層級的案例,需要結合相似度、歷史參考采納率、案例生效時間等因素進行排序,可以將因素權重初始設定為:相似度>歷史參考采納率>案例生效時間,通過融合算法形成最終的類案推送權重,并據(jù)此按照降序進行排列。(1)相似度。指的是與待決案件在訴訟請求、基本事實、爭議焦點、法律適用問題等方面的相似程度。(2)歷史參考采納率。對推送結果的采納過程,實際上也是法官用戶對推送類案文書樣本的檢驗過程。一篇類案文書被參考采納入待決案件裁判文書的次數(shù)越高,該文書質量高的可能性越大。(3)案例生效時間。法不溯及既往,法律條文更新的速度日新月異。裁判文書生效時間越新,運用已廢止、已修改法律條文的可能性就越小,蘊含的法律思維也會符合主流觀點。《指導意見》亦規(guī)定,優(yōu)先檢索近三年的案例或案件。
類案推送系統(tǒng)與法官用戶之間更多體現(xiàn)為一種單向互動,而法官用戶在推送過程中的認知和需求是一個不斷變化的過程,應意識到法官用戶對系統(tǒng)實時反饋的重要性,設計一種人機交互的動態(tài)評分機制,用于監(jiān)控推送質量,在法官用戶提供反饋的過程中不斷對系統(tǒng)進行調整和優(yōu)化。
根據(jù)法官用戶的真實需求,將類案推送質量拆分為以下幾個構成因素,進一步測度指標權重,對質量進行評分。1.相關度。指的是推送結果和用戶需求的匹配度,簡言之,就是推送案例與用戶真實需求的相關程度。推送案例與待決案件越相關,代表推送結果質量越高。2.準確度。即推送的案例是準確的、無錯誤的,小到字體錯誤、格式錯誤等,大到事實認定錯誤、證據(jù)采納錯誤等。推送案例錯誤越少,準確度越高。3.易懂度。即推送結果簡練、直觀、一目了然,易于理解。法律知識圖譜越層層遞進、越環(huán)環(huán)相扣,易懂度越高。4.及時性。即推送案例是否及時更新。假如推送案例所依據(jù)的法律條文內容或呈現(xiàn)的裁判觀點早已發(fā)生變化,則類案推送質量較低。5.采用度。即根據(jù)推送樣本被采用的次數(shù),對其進行相應的評分增減。采用次數(shù)越多,則該項評分越高。根據(jù)以上五個因素對推送結果的影響力及重要性,可以將因素權重初始設定為:相關度>準確度>易懂度>及時性>采用度,根據(jù)權重比例智能生成推送結果的質量估分。在法官用戶使用過程中,根據(jù)類案推送結果的滿意度,參與到推薦結果的反饋評分中,對質量估分進行動態(tài)調整,以實現(xiàn)人機交互的交流反饋,最終讓推送結果與法官用戶期望值不斷貼近。
對于辦案法官而言,真正的類案推送需求是尋找裁判思路,找到類案裁判規(guī)律,而不是大量案例的簡單匯總。目前,市面上的類案推送平臺不能算是真正意義上的類案推送產(chǎn)品,不能滿足辦案法官的真實需求,類案推送的質量短板沒有引起理論界和實務界的廣泛關注。本文將信息維度與用戶需求相結合,提出以質量控制為重點,以信息維度提高用戶需求為視角,通過將大數(shù)據(jù)及人工智能技術融入司法辦案中,實現(xiàn)類案知識推送的精細化;通過控制類案推送的每道關鍵工序,從而促使類案推送結果真正符合辦案法官的真實需求,以求不僅能減輕辦案法官的裁判負累,還能夠在一定程度上確保法律統(tǒng)一適用。