張虎,潘邦澤,譚紅葉,李茹,2
1. 山西大學(xué)計算機(jī)與信息技術(shù)學(xué)院,山西 太原 030006;
2. 山西大學(xué)計算智能與中文信息處理教育部重點實驗室,山西 太原 030006
在人工智能與大數(shù)據(jù)技術(shù)的推動下,從2013年起,我國各級司法機(jī)構(gòu)就進(jìn)入了以提供智能司法服務(wù)為目的的“智慧司法”建設(shè)時期。在2014年與2016年,最高人民法院相繼推出了人民法院數(shù)據(jù)集中管理平臺與國家司法審判系統(tǒng),并開通了中國裁判文書網(wǎng)與中國法律應(yīng)用數(shù)字網(wǎng)絡(luò)服務(wù)平臺。2017年7月,國家人工智能戰(zhàn)略《新一代人工智能發(fā)展規(guī)劃》對人工智能理論、技術(shù)和應(yīng)用做出前瞻布局,呼吁加強(qiáng)人工智能相關(guān)法律、倫理和社會問題研究。同時,該規(guī)劃力挺智慧法庭建設(shè),提出促進(jìn)人工智能在證據(jù)收集、案例分析、法律文件閱讀與分析中的應(yīng)用。
在同一時期,大數(shù)據(jù)與人工智能技術(shù)在各行各業(yè)都引起了高度的重視,并得到了廣泛的應(yīng)用,人工智能在司法領(lǐng)域的應(yīng)用已經(jīng)成為未來法律工作中必不可少的一部分。無論是法官、律師還是普通大眾,都會享受到智慧司法服務(wù)帶來的便捷。智慧司法的主要思想是將人工智能技術(shù),特別是自然語言處理(natural language processing,NLP)技術(shù)應(yīng)用于法律領(lǐng)域的任務(wù)。一方面,智慧司法可以為不熟悉法律術(shù)語和復(fù)雜判決程序的群眾提供低成本、高質(zhì)量的法律咨詢服務(wù);另一方面,它可以為專業(yè)人士(如律師和法官)提供參考,將法律專業(yè)人士從錯綜復(fù)雜的文書工作中解放出來,提高他們的工作效率。同時,利用人工智能技術(shù)提升法律服務(wù)水平的思想也將被進(jìn)一步普及,人們對正義與法律的理解將會被重新塑造,國家利用人工智能技術(shù)提升法律服務(wù)水平的目標(biāo)也將被實現(xiàn)。
法律判決預(yù)測是“智慧司法”服務(wù)體系下的一項重要研究任務(wù),在學(xué)術(shù)界和企業(yè)界受到廣泛關(guān)注。其任務(wù)的核心目標(biāo)是通過分析案件的相關(guān)信息,自動預(yù)測出案件最終的判決結(jié)果。然而,對于如何完成法律判決預(yù)測任務(wù)這一問題,面臨著如下幾個關(guān)鍵的挑戰(zhàn)。
● 法律判決預(yù)測任務(wù)的研究要求使用真實的法律案件數(shù)據(jù)集,而真實法律案件信息的獲取渠道較為廣泛,且數(shù)據(jù)形式與包含內(nèi)容各不相同。因此,統(tǒng)一各類數(shù)據(jù)的數(shù)據(jù)格式、構(gòu)建高質(zhì)量的數(shù)據(jù)集是法律判決預(yù)測任務(wù)的首要任務(wù)。
● 以往的判決預(yù)測大多將整篇法律文書作為輸入。但在人類法官審理案件的過程中,判決結(jié)果往往僅由案件的核心描述決定,法律文書中的大多數(shù)內(nèi)容對案件的判決結(jié)果影響較小,且大量無關(guān)內(nèi)容還會直接影響最終的判決預(yù)測結(jié)果。因此,探索判決要素抽取方法對提升法律判決預(yù)測結(jié)果具有重要的意義。
● 法律判決預(yù)測任務(wù)要求提出的方法可以高質(zhì)量地預(yù)測出案件的判決結(jié)果。然而,案件的判決結(jié)果同時包含了案件的法律條文(以下簡稱法條)、罪名、刑期等多種內(nèi)容,大多數(shù)傳統(tǒng)模型無法同時預(yù)測出多種信息。因此,如何使預(yù)測模型高質(zhì)量地預(yù)測出完整的案件判決結(jié)果是法律判決預(yù)測任務(wù)的重要難點。
本文針對這些關(guān)鍵性問題,使用從中國裁判文書網(wǎng)獲取的海量真實案件數(shù)據(jù)和2018“中國法研杯”司法人工智能挑戰(zhàn)賽的評測數(shù)據(jù)構(gòu)建實驗數(shù)據(jù)集,結(jié)合人類法官的判決思路,探究基于法律裁判文書大數(shù)據(jù)的法律判決預(yù)測流程與方法。首先從事實描述中抽取判決要素句,然后針對法律判決預(yù)測中的法條預(yù)測、罪名預(yù)測和刑期預(yù)測任務(wù)分別訓(xùn)練獨立的預(yù)測模型,最后結(jié)合所有子任務(wù)的結(jié)果形成案件的判決預(yù)測結(jié)果,具體案例如圖1所示。
在20世紀(jì)中葉,如何自動獲得司法判決結(jié)果引起了法學(xué)界研究者的關(guān)注。這一時期的研究主要是在具體的場景下,運用數(shù)學(xué)和統(tǒng)計算法對現(xiàn)有法律案例進(jìn)行分析。Kort F[1]運用經(jīng)典統(tǒng)計算法對司法數(shù)據(jù)進(jìn)行分析,使用經(jīng)典數(shù)學(xué)模型預(yù)測了最高法院的判決結(jié)果,并對“律師維權(quán)”案件進(jìn)行了定量分析。Nagel S[2]在分析大量法律文件后提出了“法律變量”的概念,從而達(dá)到為法官服務(wù)、幫助公眾更方便地獲得法律援助的目的。Ulmer S S[3]使用規(guī)則的方法分析了大量的法律案件,協(xié)助法官對案件證據(jù)的梳理工作。Ringquist E J[4]針對環(huán)境類的民事訴訟案,對司法判決做了深入的研究。Lauderdale B E等人[5]最早使用各類法律案件數(shù)據(jù)的相似信息來研究不同種類法律案件的相似性。上述研究都需要從法律文書與法律案件概要中人工提取出關(guān)鍵特征。這一階段開展的研究不僅需要大量的法律專業(yè)型人力參與完成,并且對不同種類法律案件的泛化能力也相對較差。
近年來,受到神經(jīng)網(wǎng)絡(luò)可以有效應(yīng)用于NLP任務(wù)的啟發(fā),諸多學(xué)者針對法律判決預(yù)測任務(wù)展開了相關(guān)研究。Luo B F等人[6]提出了基于注意力的神經(jīng)網(wǎng)絡(luò),并在統(tǒng)一的框架中對罪名預(yù)測任務(wù)與案件相關(guān)法條進(jìn)行聯(lián)合訓(xùn)練,有效提升了罪名預(yù)測任務(wù)的效果。Jiang X等人[7]提出了基于基本原理的增廣分類模型,有效提升了罪名預(yù)測的精度。Chen H J等人[8]針對被告往往被控多項罪行的問題,提出了一種基于罪名特定特征選擇和聚集的深度門控網(wǎng)絡(luò),有效提升了刑期預(yù)測的精度,為刑期預(yù)測提供了可解釋性。Hu Z K等人[9]總結(jié)出10種法律判別屬性,有助于提高針對易混淆法律案件的預(yù)測任務(wù)的準(zhǔn)確率。Zhang H等人[10]提出了數(shù)據(jù)離散化的方法,針對性地解決了普通模型對金額、年齡等數(shù)字類信息關(guān)注度較低的問題,進(jìn)一步提升了法條預(yù)測模型的性能。Long S B等人[11]分析了事實、請求與法律之間的語義交互關(guān)系,對事實描述、原告請求與法律條款之間的語義關(guān)系進(jìn)行建模,進(jìn)一步提升了判決預(yù)測的準(zhǔn)確性。Yang W M等人[12]發(fā)現(xiàn)判決預(yù)測的子任務(wù)間往往會忽略詞語的搭配信息,并就此問題設(shè)計了具有詞語搭配的注意力機(jī)制,提出了一種基于子任務(wù)間拓?fù)浣Y(jié)構(gòu)的多視角雙反饋網(wǎng)絡(luò)。Yang Z等人[13]提出了一種新的遞歸注意網(wǎng)絡(luò),通過設(shè)計一個遞歸過程來建模事實描述和文章之間的迭代交互,更有效地完成了法律判決預(yù)測任務(wù)。
同時,為了進(jìn)一步促進(jìn)判決預(yù)測研究的深入應(yīng)用,一些研究人員開始關(guān)注判決預(yù)測的實施過程,并探索了未來的方向。Zhong H X等人[14]提出了一種基于強(qiáng)化學(xué)習(xí)的預(yù)測過程可視化模型,有效推進(jìn)了法律判決預(yù)測的可解釋性。Zhong H X等人[15]深入研究了法律判決預(yù)測的子任務(wù),利用子任務(wù)的依賴關(guān)系構(gòu)建了有向無環(huán)圖,提出了拓?fù)涠嗳蝿?wù)的學(xué)習(xí)框架。Li J J等人[16]提出了一種基于馬爾可夫邏輯網(wǎng)絡(luò)的求解方法,對法律因素的語義進(jìn)行形式化描述和提取,然后建立、訓(xùn)練馬爾可夫邏輯網(wǎng)絡(luò)并進(jìn)行預(yù)測,最后在司法離婚數(shù)據(jù)集上證明了該方法對預(yù)測結(jié)果具有可解釋性。Liu Y H等人[17]提出了一種基于文本挖掘的方法,通過分析普通大眾的問題描述,為他們找到相似度較高的相關(guān)法律文書。Zhong H X等人[18]總結(jié)了法律人工智能的研究歷史、研究現(xiàn)狀與未來的研究方向,并展示了一些在法律人工智能中有代表性的應(yīng)用,深入分析現(xiàn)有工作的優(yōu)缺點,探索未來可能的發(fā)展方向。
顯然,現(xiàn)有研究大多針對法律判決預(yù)測的某一子任務(wù)開展,對完整的判決預(yù)測方法體系的研究相對較少。同時,現(xiàn)有方法大多以整篇的事實描述作為模型輸入,而事實描述中通常包含較多對案件的判決結(jié)果影響較小的語句,這些語句會大大影響模型的特征學(xué)習(xí),從而直接影響模型的判決預(yù)測效果。
本文提出的基于法律裁判文書大數(shù)據(jù)的 法律判決預(yù)測流程主要由數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理與判決結(jié)果預(yù)測三部分組成,具體流程如圖2所示。
圖2 法律判決預(yù)測流程
(1)數(shù)據(jù)采集
基 于法律裁判文書大數(shù)據(jù)的法律判決預(yù)測研究的實驗數(shù)據(jù)分別由裁判文書網(wǎng)、百科知識庫和相關(guān)司法類評測數(shù)據(jù)集三部分共同構(gòu)成。本文在中國裁判文書網(wǎng)中爬取了海量不同種類案件的法律裁判文書,在百科知識庫中獲取了法條和司法解釋等信息,在 2018“中國法研杯”司法人工智能挑戰(zhàn)賽中獲得了相應(yīng)的評測數(shù)據(jù)集,同時,還基于相關(guān)的司法評測任務(wù)定義了實驗數(shù)據(jù)的統(tǒng)一格式。本文使用的實驗數(shù)據(jù)集共包含150 000篇刑法類法律文書和24 060篇離婚類法律文書。其中,刑法類法律文書涉及相關(guān)法條202條,相關(guān)罪名183種,案件刑期236類,離婚類法律文書涉及相關(guān)法條48條,判決結(jié)果2類。由于不同類型的文書有明顯的差異,因此,實驗過程中對刑法類案例分別進(jìn)行了法條、罪名和刑期預(yù)測,對離婚類案例只采用判決預(yù)測模型進(jìn)行了判決結(jié)果(“離”或“不離”)預(yù)測。
(2)數(shù)據(jù)預(yù)處理
將法律裁判文書等不同種類的數(shù)據(jù)規(guī)范化為司法評測的數(shù)據(jù)格式,抽取出數(shù)據(jù)中每個案件對應(yīng)的事實描述、相關(guān)法條、涉及罪名和案件刑期等信息。再依照相關(guān)法條提取出不同種類案件事實描述中涉及的要素信息,如離婚類案件中的“婚后有子女”、勞動類案件中的“存在勞動關(guān)系”、借貸類案件中的“有書面還款承諾”等,這些要素信息是影響判決結(jié)果的關(guān)鍵信息,也是法律判決預(yù)測模型的輸入信息。本文基于判決要素抽取模型對案件事實描述中的要素句進(jìn)行抽取,并將每個案件的要素信息分別與該案件的相關(guān)法條、涉及罪名和案件刑期組合,得到法律判決預(yù)測3個子任務(wù)的數(shù)據(jù)集。
(3)判決結(jié)果預(yù)測
本文利用預(yù)處理后的大規(guī)模數(shù)據(jù)集,基于深度學(xué)習(xí)方法分別構(gòu)建了法條預(yù)測模型、罪名預(yù)測模型和刑期預(yù)測模型,并用3類模型分別對案件進(jìn)行法條預(yù)測、罪名預(yù)測和刑期預(yù)測,最終得到案例的判決預(yù)測結(jié)果。
首先,本文針對判決要素句長度差異明顯會對判決要素抽取結(jié)果影響較大這一問題,采用基于Mask方法的判決要素抽取方法,提高了案例的判決要素句自動抽取效果。然后通過分析法條、罪名和刑期3個預(yù)測任務(wù)的特點,分別對3個任務(wù)設(shè)計了獨立的預(yù)測模型,針對法條預(yù)測任務(wù)中存在大量易混淆法條的問題,提出了基于模型融合與分層學(xué)習(xí)的法條預(yù)測模型;針對罪名預(yù)測任務(wù)中不同罪名的詞語語義差異性問題,結(jié)合相關(guān)法條后提出了基于法條與語義差異性的罪名預(yù)測模型;針對事實描述中的重要因素對刑期預(yù)測任務(wù)的影響,總結(jié)了相關(guān)的量刑屬性,提出了基于刑期屬性與多模型投票的刑期預(yù)測模型。最后對3種模型進(jìn)行聯(lián)合訓(xùn)練,實現(xiàn)了案件的判決預(yù)測。
法律裁判文書主要由案件類型、事實描述和判決結(jié)果等部分組成。其中,事實描述是一個司法案件的核心,包含邏輯清晰的原被告關(guān)系、事情的起因經(jīng)過、案件涉及的傷亡程度和損失金額等相對關(guān)鍵的信息,這些信息是判決預(yù)測的重要依據(jù),一般被認(rèn)為是案件的判決要素。以往傳統(tǒng)的法律判決預(yù)測模型大多將整篇事實描述作為輸入,這一做法存在嚴(yán)重的缺陷。一方面,案件的判決結(jié)果往往主要側(cè)重于一些重要的信息,事實描述中大多數(shù)語句對案件判決結(jié)果的影響十分微小,模型中輸入過多的次要信息往往會直接影響模型的預(yù)測結(jié)果;另一方面,法律判決中最重要的問題之一是公平,但在現(xiàn)實世界中,由于審判過程中存在性別或種族歧視,判決不公的案件時有發(fā)生。而深度學(xué)習(xí)方法可能從事實描述中學(xué)習(xí)到這種偏見,并給法律體系帶來不公平。因此,本文根據(jù)不同案件各自的特點,為每種類型的案件設(shè)計了要素標(biāo)簽,并按照要素標(biāo)簽從事實描述中抽取要素句,將要素句作為法律判決預(yù)測模型的輸入部分,具體流程如圖3所示。利用判決要素句進(jìn)行判決預(yù)測不僅可以有效保留事實描述中影響判決結(jié)果的關(guān)鍵信息,一定程度上為模型消除了法官偏見,保證了判決公平性,同時也為模型給出的判決結(jié)果提供了可解釋性。
圖3 判決要素句抽取流程
在判決要素抽取的模型設(shè)計過程中,本文采用文本分類的思想,提出了基于BERT(bidirectional encoder representations from transformers)模型的判決要素句抽取方法。然而,由于事實描述中的要素句長度差別較大,導(dǎo)致一些較短的要素句的句向量會出現(xiàn)很多0填充,這會明顯影響最終的要素抽取結(jié)果?;诖?,進(jìn)一步在抽取模型中加入基于Mask方法的自注意力機(jī)制,以弱化輸入向量的填充部分。
案件的判決結(jié)果主要由案件的相關(guān)法條、涉及罪名與案件刑期三部分組成。人類法官給出的判決結(jié)果都是在綜合了事實描述中的所有關(guān)鍵信息后得出的。因此,本文依照人類法官的判案思路,將法律判決預(yù)測任務(wù)分成法條預(yù)測、罪名預(yù)測與刑期預(yù)測3個子任務(wù)。以事實描述中抽取出的判決要素句為輸入,基于深度學(xué)習(xí)的方法與文本分類的思想為法條預(yù)測、罪名預(yù)測和刑期預(yù)測任務(wù)分別構(gòu)建獨立的分類模型,具體過程如圖4所示。
圖4 法律判決預(yù)測模型
(1)法條預(yù)測
法條是國家對人民規(guī)定的行為準(zhǔn)則,它闡明了公民的權(quán)利和義務(wù),設(shè)置了相應(yīng)行為的法律后果,在一個法律案件的判決過程中,相關(guān)法條是判決的根本依據(jù)。本文分析大量真實案件與法條后發(fā)現(xiàn),在案件的相關(guān)法條中存在一些較難區(qū)分的法條,如走私、販賣、運輸、制造毒品的法條內(nèi)容與非法持有毒品的法條內(nèi)容會出現(xiàn)較多相似的詞匯,這些法條通常被稱為易混淆法條,它們的語義相似度極高,區(qū)分難度較大,傳統(tǒng)模型對易混淆法條的預(yù)測效果普遍較差。針對該問題,本文依據(jù)法條的相關(guān)司法解釋,深入挖掘了判決要素句與相關(guān)法條之間的關(guān)系,提出了基于模型融合與分層學(xué)習(xí)的法條預(yù)測方法。該方法的具體流程如下。
① 根據(jù)已有法條預(yù)測的結(jié)果,針對刑法中涉及的183個法條,將其中的136個分為易區(qū)分法條,47個分為易混淆法條。
② 使用基于模型融合的法條分類器對案件的判決要素進(jìn)行分類,預(yù)測出案件的法條編號。模型融合采用不同參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),結(jié)果輸出使用Softmax分類器。
③ 結(jié)合①中劃分的法條類別,判定輸出的法條標(biāo)簽屬于易區(qū)分法條還是易混淆法條。
④ 若法條屬于易區(qū)分法條,則直接輸出法條分類器的預(yù)測結(jié)果。
⑤ 若法條屬于易混淆法條,則進(jìn)一步將案件的判決要素輸入相應(yīng)的基于模型融合的易混淆法條分類器進(jìn)行二次分類,并輸出對應(yīng)的分類結(jié)果。
具體的模型結(jié)構(gòu)如圖5所示。該方法融合了多種模型的特點,在一定程度上提升了易混淆法條的分類效果,有效提高了法條預(yù)測的準(zhǔn)確性。
圖5 基于模型融合與分層學(xué)習(xí)的法條預(yù)測模型
(2)罪名預(yù)測
罪名預(yù)測指通過分析案件的犯罪事實自動預(yù)測出被告的最終罪名。犯罪事實句中的各詞語在區(qū)分不同罪名時,其語義重要性各不相同。例如對于盜竊罪與故意傷害罪,從犯罪目的來看,盜竊罪的犯罪目的為非法占有 他人財物,故意傷害罪的犯罪目的為故意傷害他人人身安全。此時,犯罪目的的語義是區(qū)分罪名的重點詞。當(dāng)兩種罪名的犯罪目的都為非法占有他人財物時,從犯罪手段來看,兩種罪名的犯罪手段分別為秘密竊取與使用暴力、脅迫的方式,此時的犯罪手段詞成為區(qū)分罪名的關(guān)鍵詞。而現(xiàn)有的方法大多忽略了這種語義性差異,從而對罪名預(yù)測的效果產(chǎn)生影響。同時,法條、司法解釋等法律知識是人類法官定罪量刑的關(guān)鍵依據(jù),引入外部法律知識對于罪名預(yù)測具有重要意義。針對這些問題,本文提出了基于法條與語義差異性的罪名預(yù)測方法,具體流程如下。
① 將判決要素句和相關(guān)法條分別輸入BERT模型的編碼器中,得到相應(yīng)的句子級事實表示s和法條表示a。
② 使用法條注意力交互機(jī)制計算每一個判決要素句s與每一個法條a之間的法條相容性值a’。
③ 使用語義自注意力交互機(jī)制計算每一個判決要素句s的語義重要性值a’’。
④ 利用得到的法條相容性值a’和語義重要性值a’’更新判決要素句s的向量表示。
⑤ 通過Sigmoid分類器實現(xiàn)每個罪名的0/1二元分類。
具體實現(xiàn)過程如圖6所示。實驗證明,將該方法應(yīng)用于罪名預(yù)測任務(wù)后,罪名預(yù)測的模型性能得到了有效提升。
圖6 基于法條與語義差異性的罪名預(yù)測模型
(3)刑期預(yù)測
刑期預(yù)測通常要求對判決要素句、相關(guān)法條與涉及罪名3個部分的信息進(jìn)行綜合考慮。本文分析了大量刑法類數(shù)據(jù),將0~25年的刑期劃分為20個刑期區(qū)間,根據(jù)數(shù)據(jù)中各種刑期的數(shù)據(jù)量分布,為不同刑期定義各自的預(yù)測偏差,在一定程度上縮小了預(yù)測結(jié)果與真實結(jié)果的偏差。同時,本文深入地分析了刑期預(yù)測任務(wù),發(fā)現(xiàn)在事實描述中存在一些影響判決結(jié)果的重要因素,這些因素在法官的判決過程中具有十分重要的作用。針對該問題,本文通過分析海量案件的事實描述與量刑結(jié)果,提出了基于刑期屬性與多模型投票的刑期預(yù)測方法,具體流程如下。
① 以每種案件的判決要素句標(biāo)簽為基礎(chǔ),結(jié)合具體法條、法律法規(guī)的內(nèi)容為刑期預(yù)測設(shè)計量刑屬性(大體可分為犯罪方式、受害者受傷程度、涉及財物規(guī)模、犯罪地點與其他屬性5個類別),再根據(jù)不同的案件類型具體劃分為多個案件專屬小類別。
② 使用BERT模型分別對判決要素句與量刑屬性進(jìn)行編碼,將判決要素句輸入最大池化層得到其普通特征,通過注意力機(jī)制的方式將量刑屬性融入判決要素句的向量表示中,并得到其屬性特征。
③ 使用線性拼接的方式將普通特征與屬性特征融合。
④ 將融合后的結(jié)果分別輸入CNN、長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)和門控循環(huán)單元(gated recurrent unit,GRU)3種模型進(jìn)行特征提取,再將3種模型的輸出概率累加,最終取3種模型結(jié)果的平均值對應(yīng)的類別作為預(yù)測的刑期類別,具體實現(xiàn)過程如圖7所示。
圖7 基于刑期屬性與多模型投票的刑期預(yù)測模型
本文采用精確率P、召回率R和F1值這3個指標(biāo)來評價針對要素抽取與判決預(yù)測任務(wù)提出的方法,精確率P、召回率R和F1值的計算式如式(1)、式(2)和式(3)所示,其中TP表示屬于該類也被分為該類的樣本數(shù)量;TN表示沒有被分為該類且不屬于該類的樣本數(shù)量;FN表示沒有被分到該類但屬于該類的樣本數(shù)量;FP表示被分到該類但不屬于該類的樣本數(shù)量。具體得出的實驗結(jié)果見表1和表2。
(1)要素抽取
在要素抽取任務(wù)上,本文按照8:1:1的比例劃分出訓(xùn)練集、驗證集與測試集,并在5種基線模型上分別進(jìn)行判決要素抽取實驗,結(jié)果見表1。實驗結(jié)果顯示,CNN模型的結(jié)果優(yōu)于LSTM模型,同樣,在將BERT作為詞嵌入方法的實驗中,BERTCNN模型的結(jié)果明顯優(yōu)于所有基線模型。而本文基于Mask方法的判決要素抽取模型取得了最好的結(jié)果,與BERT-CNN模型相比,其在F1值上得到了0.01%的提升。
表1 要素抽取任務(wù)實驗結(jié)果
(2)判決預(yù)測
對于判決預(yù)測任務(wù),本文將整理出的數(shù)據(jù)集按照8:1:1的比例劃分出訓(xùn)練集、驗證集與測試集,并選擇CNN與LSTM模型作為基線模型,具體實驗結(jié)果見表2。實驗結(jié)果顯示,CNN模型在3個判決預(yù)測任務(wù)中的結(jié)果都優(yōu)于LSTM模型,本文提出的方法在3個任務(wù)中都得到了最好的結(jié)果,與兩種基線模型相比都有明顯的提升。
表2 判決預(yù)測任務(wù)實驗結(jié)果
顯然,本文提出的判決要素抽取方法和法條、罪名、刑期預(yù)測方法都有效地提升了判決預(yù)測的最終效果。
本文結(jié)合中國裁判文書網(wǎng)、百科知識庫與相關(guān)司法類評測數(shù)據(jù)集構(gòu)建了高質(zhì)量的法律判決預(yù)測數(shù)據(jù)集,深入研究了基于法律裁判文書大數(shù)據(jù)的法律判決預(yù)測方法。首先基于BERT模型的判決要素句抽取模型對判決預(yù)測數(shù)據(jù)進(jìn)行了預(yù)處理,然后分別提出了基于模型融合與分層學(xué)習(xí)的法條預(yù)測方法、基于法條與語義差異性的罪名預(yù)測方法和基于量刑屬性與多模型投票的刑期預(yù)測方法,并對每種模型進(jìn)行了實驗驗證。本文開展的研究為法律判決預(yù)測任務(wù)進(jìn)行了有益的探索,為人工智能在智慧司法領(lǐng)域的應(yīng)用提供了重要的參考價值。