屈茂輝
摘要:知識圖譜分析結果表明.基于裁判文書的法學實證研究成果數(shù)量總體上呈現(xiàn)增長趨勢,但在近兩年出現(xiàn)明顯下降;基于裁判文書法學實證研究學術群體規(guī)模正在逐步緩慢擴大,但研究成果在研究主體間的分布呈較為集中趨勢;研究成果所涉及學科領域具有較為明顯的局限性.且具體研究內(nèi)容伴隨熱點問題獲得短暫爆發(fā)之后開始呈退縮之勢。在方法轉(zhuǎn)型背景之下,基于裁判文書法學實證研究的演變,受到研究方法在數(shù)據(jù)可得性、數(shù)據(jù)完整性以及數(shù)據(jù)客觀性等方面所存在之優(yōu)勢與缺陷影響。研究人員自身應當在研究過程中通過豐富研究數(shù)據(jù)、規(guī)范研究方法之適用以及推動數(shù)據(jù)處理技術的發(fā)展等方式尋求基于裁判文書法學實證研究的長遠發(fā)展之道。
關鍵詞:知識圖譜;裁判文書;實證研究;內(nèi)容分析法;數(shù)據(jù)處理
中圖分類號:DF920.0 文獻標志碼:A
DOI:10.3969/j.issn.1001-2397.2020.03.03
近年來,隨著我國裁判文書公開制度的不斷完善,以裁判文書法律大數(shù)據(jù)作為分析對象的法學實證研究越來越受到學者的青睞。然而,無論是基于裁判文書實證研究所對應的研究方法,還是作為具體數(shù)據(jù)來源的裁判文書本身,都存在可能阻礙法學實證研究整體發(fā)展的固有缺陷。因此,我國法學實證研究是否真如學界所期許的那樣,借助裁判文書可得性的提升,實現(xiàn)其自身的迅猛全面發(fā)展,還需要予以全面審視。長期以來,關于法學實證研究之審視的理論研究成果并不缺乏,遑論研究者對實證研究是秉持支持還是反對態(tài)度,但這些研究成果中,一則缺少將基于裁判文書法學實證研究作為獨立研究對象的審視,二則對于法學實證研究實然狀態(tài)的評判缺乏客觀數(shù)據(jù)的支持。因此,為明確裁判文書在法學實證研究中的具體應用,本文以eitespaee軟件為工具,擬以從中國知網(wǎng)檢索得到的612篇以裁判文書為數(shù)據(jù)來源的實證研究期刊文獻為分析對象,對我國基于裁判文書法學實證研究中的研究成果產(chǎn)出、研究參與者以及研究視域等三個主要方面進行實證考察,進而在剖析其演變內(nèi)因的基礎上對如何利用裁判文書進行實證研究的科學徑路陳一孔之見。
一、基于裁判文書法學實證研究發(fā)展狀況檢視
(一)研究成果產(chǎn)出
裁判文書作為司法過程的主要產(chǎn)物,其中承載著可為法學實證研究所用的豐富數(shù)據(jù)信息,其網(wǎng)絡公開數(shù)量在近年來的迅猛增長,則被諸多法學實證研究學者視為本領域發(fā)展的重要契機。而理論研究成果作為學科發(fā)展的主要表征之一,也必然隨著裁判文書網(wǎng)絡公開數(shù)量的增長而增多。申言之,基于裁判文書法學實證研究作為以裁判文書為基礎數(shù)據(jù)來源的具體研究形式,其所產(chǎn)出之研究成果數(shù)量,除受法學研究方法轉(zhuǎn)型之影響外,還應與裁判文書網(wǎng)絡公開數(shù)量在一定程度上呈現(xiàn)出正相關關系。
通過對中國知網(wǎng)中檢索所得的期刊文獻按年度進行統(tǒng)計,結果如圖1所示。根據(jù)發(fā)文量的年度分布數(shù)據(jù)所構建的線性方程系數(shù)為正,R方值為0.7539。這一結果表明,基于裁判文書法學實證研究成果的數(shù)量與時間序列成正相關,就總體趨勢而言,隨著時間的推進,基于裁判文書的實證研究成果數(shù)量也隨之增長。然而,如若對發(fā)文量在具體年份的分布情況進行觀測,在總體增長趨勢之下?;诓门形臅▽W實證研究成果數(shù)量變化仍可以劃分出較為明顯的三個階段:第一階段為2000年至2011年,該階段中,研究成果數(shù)量呈緩慢增長趨勢,年度發(fā)文量較少,且年度增長率較低;第二階段為2012年至2017年,與第一階段末的2011年發(fā)文量相比,本階段初2012年的發(fā)文量得到明顯提升,并且,本階段中的2013至2016年之間的發(fā)文量以較高的年度增長率明顯高于第一階段;第三階段,即2019年,本年度發(fā)文量與第二階段末的2018年發(fā)文量相比急劇下降。
期刊文獻年度發(fā)文數(shù)量在前兩個不同階段的界限劃分,即201 1年至2012年間發(fā)文量的明顯增長,與該階段我國裁判文書網(wǎng)絡公開數(shù)量的發(fā)展變化存在高度契合。然而,單就發(fā)文數(shù)量而言,第三階段的研究成果數(shù)量急劇下降,與之前較長時期內(nèi)的研究成果總體增長趨勢明顯相悖,進而表明該階段研究成果數(shù)量變化與我國裁判文書網(wǎng)絡公開裁判文書總量不斷增長趨勢明顯不相符合。據(jù)此,綜合比較各階段研究成果數(shù)量的變化趨勢,可以得知,基于裁判文書法學實證研究的發(fā)展確實與裁判文書網(wǎng)絡公開數(shù)量增長之間存在較為明顯的相關性,但該相關性本身可能受到其他因素的反向影響與調(diào)節(jié)。
(二)研究參與主體
基于本文所選取的期刊文獻樣本,通過使用citespace軟件對文獻中所涉及研究機構進行分析,首先得到研究機構的總體分析情況。如圖2所示,西南政法大學、中國政法大學、山東大學法學院、吉林大學法學院、四川大學法學院、北京大學法學院、浙江大學光華法學院、中國人民法學法學院、中南財經(jīng)政法大學法學院以及上海交通大學法學院等機構研究成果突出,其他研究機構所產(chǎn)出的成果數(shù)量則十分有限。即從總體上來看,雖然已有一定數(shù)量的研究機構開展基于裁判文書法學實證研究,但研究成果的產(chǎn)出則集中來自于以“五院四系”為典型的少數(shù)法學研究機構。對比當前我國法學院系及專門科研機構總體數(shù)量,可以得知,基于裁判文書開展法學實證研究的學術群體規(guī)模依然較小。
與此同時,圖中所展示的研究機構共現(xiàn)關系也表明,到目前為止,從事實證研究的科研機構之間的相互合作甚少。對于法學實證研究而言,在大數(shù)據(jù)與人工智能理論與技術不斷發(fā)展的背景之下,由關起門來做研究向合作共享的轉(zhuǎn)變應是其實現(xiàn)迅猛發(fā)展并真正實現(xiàn)自身價值的正確趨向。而圖中所揭示的“單兵作戰(zhàn)”為主的法學實證研究現(xiàn)狀,也在一定程度上進一步證實,實證研究方法在法學領域的應用尚處于初級階段,研究人員對于法學實證研究發(fā)展趨向尚未形成準確而深刻的認識。
如圖3所示,不同于研究成果數(shù)量的分布,開展基于裁判文書法學實證研究的機構并未隨著裁判文書可得性的提升而出現(xiàn)急劇增長,而是在基于裁判文書法學實證研究興起后較長一段時間內(nèi)學術群體規(guī)模成緩慢增長之勢。
具體而言,基于裁判文書法學實證研究的學術群體規(guī)模變化,同樣可以分為較為明顯的三個階段。在第一階段,參與研究之主體主要為西南政法大學、中南財經(jīng)政法大學以及山東大學等總體分布結果所顯示的本領域主要研究機構。結合總體分布結果可以得知,該部分研究機構不僅在本領域研究成果豐富,其開展本領域研究的時間跨度同樣長于其他研究機構。該階段中雖然也存在較少數(shù)量的其他研究機構,如廣東警官學院、四川師范大學等,但從其所對應的節(jié)點大小來判斷,該部分研究機構總體研究成果極少,說明該部分研究機構并沒有持續(xù)在本領域開展研究。在第二階段,新增研究機構數(shù)量總體較少,但在此階段中所新增的研究機構,如吉林大學、中國人民大學以及華東政法大學等,都在總體上產(chǎn)出了豐富的研究成果,其他新增機構則在本領域的研究成果有限,從而未體現(xiàn)出研究的持續(xù)性。而在第三階段中,即最近幾年以來,新增研究機構數(shù)量較第二階段明顯增多。本階段中,已有部分研究機構,如湖南大學、江西財經(jīng)大學、云南大學等,以較其他新增機構在研究成果數(shù)量方面顯現(xiàn)出一定的優(yōu)勢。
相比于研究成果數(shù)量,學術群體的規(guī)模發(fā)展能更為準確地揭示法學研究者對于實證研究方法的認可與接納狀況。綜合基于裁判文書法學實證研究機構數(shù)量增長的三個階段來看,與研究成果數(shù)量隨著裁判文書可得性增強而得到明顯提升不同,本領域?qū)W術群體的擴展經(jīng)歷了一個較為漫長的過程。并且,結合研究機構總體分布所呈現(xiàn)出的集中趨勢,可以證實,裁判文書網(wǎng)絡公開數(shù)量的增長主要促成了原有研究機構的成果產(chǎn)出數(shù)量,而非其他研究機構對于實證研究方法的認可接納,進而嘗試方法轉(zhuǎn)型。申言之,不同于研究成果數(shù)量在特定階段與裁判文書網(wǎng)絡公開數(shù)量之間明顯相關,實證分析方法在法學領域的傳播與發(fā)展表現(xiàn)得更加獨立且緩慢。
(三)研究領域
在通過citesp.dce軟件所得出的關鍵詞共現(xiàn)關系的基礎上,進一步進行關鍵詞聚類分析,聚類結果顯示Q值為0.6556且s值為0.5119,說明分析結果中的結構劃分是顯著的、聚類結果具有可靠性。如圖4所示,依據(jù)所占比重大小,聚類分析共得到實證研究、量刑建議、法定賠償、法治、司法改革以及司法鑒定在內(nèi)的6個主要類別。單從類別名稱來看,以學科劃分為標準,基于裁判文書法學實證研究成果中涉及最廣泛的“量刑建議”相關內(nèi)容應屬刑事訴訟領域,而廣泛程度緊隨其后的“法定賠償”相關內(nèi)容則屬于知識產(chǎn)權領域。關于其他類別,法治、司法改革以及司法鑒定屬于全局性或者說普遍性關鍵詞,則需要通過分析本類別中的關鍵詞共現(xiàn)關系,在明確本類研究成果論證基點的基礎上,來明確其所在研究成果涉及之具體研究領域。故此,為明確各類別研究成果所歸屬的具體學科領域,我們繼續(xù)結合各類別中所包含的主要關鍵詞進行探討。
如表一所示,綜合聚類分析結果及對各類別中所包含主要關鍵詞的解讀,可以得知,基于裁判文書的實證研究成果中涉及最廣泛的問題是刑事訴訟領域中的量刑問題,其次是知識產(chǎn)權侵權賠償與法治問題,最后是司法體制改革及環(huán)境糾紛等階段性熱點問題。而且,對于法治問題以及司法改革問題的研究也主要基于刑事訴訟程序來展開,對于知識產(chǎn)權的研究中同樣涉及刑事訴訟方面的具體問題,因此,完全可以確定,我國基于裁判文書法學實證研究所涉學科領域之中心在于刑事訴訟,對于其他領域的研究則極其缺乏。換言之,從總體分布上來看當前我國基于裁判文書法學實證研究之視域難謂寬闊。當然,我國法學實證研究尚處于發(fā)展進程中較為初級的階段,研究者視域需要隨著本領域的發(fā)展而不斷開拓。
為進一步明確基于裁判文書法學實證研究所涉及的具體研究內(nèi)容之發(fā)展,本文通過eitespaee軟件得出關鍵詞時區(qū)分布圖。如圖5所示,自基于裁判文書法學實證研究成果得到顯著增長以來,研究成果中所出現(xiàn)關鍵詞的時區(qū)分布同樣呈現(xiàn)出較為明確的三個階段。2011年至2015年之間,研究成果中所出現(xiàn)關鍵詞的總量與年度增量均不大,甚至可以稱之為匱乏。并且,本階段所出現(xiàn)的為數(shù)不多的關鍵詞中,半數(shù)以上均可明確被歸類于刑事訴訟領域,如量刑程序、量刑、量刑建議等。2016年與2017年,關鍵詞數(shù)量急劇增長,呈爆發(fā)狀態(tài)。關鍵詞類型同樣得到一定程度的豐富,知識產(chǎn)權、證券等領域歸屬明確的關鍵詞出現(xiàn),也說明基于裁判文書法學實證研究所涉及之領域得到拓展。由于在第一階段末期,即司法改革的總體規(guī)劃和具體方案陸續(xù)出臺之際,司法改革作為研究成果關鍵詞出現(xiàn),且其與第二階段關鍵詞存在密切的共現(xiàn)關系,即可認為,第二階段研究關鍵詞數(shù)量急劇增長在一定程度上得益于當前研究熱點與基于裁判文書法學實證研究的密切關聯(lián)性。當然,與前一發(fā)展階段一致,在本階段之中,刑事訴訟領域關鍵詞仍然大量存在,如刑事司法、死刑以及受賄罪等。2018年至今,關鍵詞數(shù)量急轉(zhuǎn)直下,且呈逐年下降之勢。由于2018年所出現(xiàn)之關鍵詞主要與司法改革相關,如庭審實質(zhì)化、以審判為中心等,且該相關性在2019年隨之減弱,即可認為,該階段關鍵詞數(shù)量下降同樣可在一定程度上歸結于司法改革作為研究熱點的消退。同時,這也可以在一定程度上對近年來參與本領域研究的研究機構數(shù)量增多而研究成果數(shù)量反而下降之現(xiàn)象予以解釋。即隨著研究熱點消退,研究者們的個體產(chǎn)量逐漸下降,即便有新的研究機構加入,也無法阻止研究成果總量的下降。
根據(jù)對關鍵詞時區(qū)分布的分析,可以得知,基于裁判文書法學實證研究所涉之學科領域在較長的發(fā)展進程中確實在一段時間內(nèi)得到明顯拓展,然而,由于該拓展本身具有一定的偶然性,學科領域的拓展進程隨著機遇的喪失而停滯,進而表現(xiàn)出退縮之勢。與此同時,結合前文關鍵詞總體分布結果,由于在基于裁判文書法學實證研究發(fā)展的各個階段均繞不開對于刑事訴訟領域問題的專門研究,以及以刑事訴訟實踐為基點對相關問題的分析探討,故難以認定基于裁判文書法學實證研究者們的視域得到了本質(zhì)性拓展。
而從理論上來說,實證研究作為一種獨立的研究方法,其所針對的研究對象具有廣泛性,即便是將其嚴格限定在以具有數(shù)量變化關系的法律現(xiàn)象為主要研究對象的定量研究范圍之內(nèi),該廣泛性依然存在。實證研究方法要得到發(fā)展并實現(xiàn)其自身價值,需要立基于習慣傳統(tǒng)研究方法的學者對其自身的認可與接納,進而主動對實證研究方法的研習。然而,對于實證方法在本領域的適用,不同法學研究領域?qū)W者所持堅守教義學陣地之信念有所差異。實證研究方法的適用最早開始于刑事司法領域,其在該領域的認可與接納程度較高。而以民法領域為代表的其他領域?qū)W者,對于實證研究方法在本領域的適用均在一定程度上持保守態(tài)度,即便是認為實證方法對本領域研究有所裨益的學者,也認為法律實證研究方法只能針對個別問題的、點對點的零碎研究方式,只能為法教義學提供體系建構、融合之素材,無法擔負起法律體系建構與融合的任務,“扛大旗者”非教義學方法莫屬。故而,法學實證研究的研究領域,可能受傳統(tǒng)研究理念的影響,在學科分布上存在一定的局限性。與此同時,在當前學界推崇使用統(tǒng)計分析模型進行定量研究的趨勢下,具有數(shù)量關系的法律現(xiàn)象是我國法學實證研究的重要研究對象。該類法律現(xiàn)象中,部分數(shù)量關系表現(xiàn)得較為直觀,可在相關的資料信息載體中直接體現(xiàn)出來,研究人員可通過直接觀測來實現(xiàn)對于數(shù)量關系的萃取與分析;另一部分數(shù)量關系,則并在資料信息載體中得以直觀顯現(xiàn),需要研究人員投入更多的成本,并借助一定的技術方法來實現(xiàn)對于數(shù)量關系的抽象與提取,即對研究人員對于方法的理解及方法適用能力要求高于直觀數(shù)量關系。而數(shù)量關系直觀程度的差異,在裁判文書之中同樣客觀存在。其中刑事審判結果中所體現(xiàn)的法定刑與宣告刑之間數(shù)量關系,即是直觀數(shù)量關系的典型。對于意欲從事實證研究以及剛剛步人法學實證研究領域的學者而言,成本投入大小以及方法適用的難以程度是其開展實證研究的重要考量因素。申言之,對于裁判文書之中數(shù)量關系抽象的難易程度,也在一定程度上影響基于裁判文書法學實證研究所涉足的具體學科領域。
二、基于裁判文書法學實證研究演變內(nèi)因剖析
盡管被視為法學實證研究發(fā)展契機的裁判文書公開數(shù)量提升,能夠在一定程度上對特定時期研究成果數(shù)量的發(fā)展變化之緣由予以解答,但對于基于裁判文書法學實證研究的總體概況,尤其是發(fā)展過程中所存在的具體問題,則明顯缺乏解釋力。故此,在當前法學方法轉(zhuǎn)型的外部環(huán)境之下,對于基于裁判文書法學實證研究發(fā)展演變之內(nèi)因,還需進一步基于方法論視閾予以闡釋。具體而言,依據(jù)以數(shù)據(jù)資料收集方法為標準所進行的社會科學研究方法劃分,基于裁判文書法學實證研究中所適用之主要方法為內(nèi)容分析法,即對裁判文書中所承載的內(nèi)容做客觀的、系統(tǒng)的量化描述和分析。對基于裁判文書法學實證研究發(fā)展演變內(nèi)因之闡釋,應圍繞內(nèi)容分析法自身的優(yōu)勢與缺陷來展開。
(一)從數(shù)據(jù)可得性方面的分析
適用內(nèi)容分析法開展實證研究,需要在獲取原始數(shù)據(jù)載體的基礎上,進一步提取可為分析所用的標準化數(shù)據(jù)。因此,對于數(shù)據(jù)可得性,需要從原始數(shù)據(jù)可得性與標準化數(shù)據(jù)可得性兩個層面予以闡述。
1.原始數(shù)據(jù)可得性
實地調(diào)查、訪談、問卷調(diào)查等其他較為常用的社會科學研究方法,均需要預先制定較為復雜的數(shù)據(jù)獲取方案,即如何對研究所需數(shù)據(jù)進行獲取并得以客觀記錄,并需要組建相對龐大的研究團隊,才能夠切實有效地獲得開展后續(xù)研究所需要的原始數(shù)據(jù),進而對原始數(shù)據(jù)進行編輯整理獲得研究所需的最終數(shù)據(jù)。對于內(nèi)容分析法而言,在開展數(shù)據(jù)整理與分析之前,研究所需的具體數(shù)據(jù)已經(jīng)被客觀地記錄于相應載體之中,研究人員僅需要直接對相關數(shù)據(jù)載體進行獲取,即可在一定程度上被認為已經(jīng)實現(xiàn)對于研究所需原始數(shù)據(jù)的獲取。申言之,通過比較內(nèi)容分析法與其他類研究方法的數(shù)據(jù)獲取過程可知,內(nèi)容分析方法在原始數(shù)據(jù)獲取方面具有較為明顯的便捷性。當然,在方法適用過程中,內(nèi)容分析法較之于其他分類方法的便捷性優(yōu)勢能否得以體現(xiàn),還需取決于數(shù)據(jù)載體獲取的便捷程度。如若數(shù)據(jù)載體獲取足夠便捷,內(nèi)容分析法的實施甚至可以無需組建研究團隊,而由一人獨立完成數(shù)據(jù)獲取工作。
對于仍然處于探索起步階段的法學實證研究學者而言,研究成本的降低,即意味著研究開展可行眭提升。據(jù)此,前文概況檢視部分所揭示的,基于裁判文書法學研究成果數(shù)量在裁判文書公開制度施行初期的顯著增長得以解釋。即該階段基于裁判文書法學研究成果數(shù)量,源自于裁判文書網(wǎng)絡公開對于研究開展便捷性的本質(zhì)提升。
2.標準化數(shù)據(jù)可得性
對于大部分研究方法而言,在開展具體的數(shù)據(jù)分析之前,都需要經(jīng)歷由原始數(shù)據(jù)向標準化數(shù)據(jù)的轉(zhuǎn)化。內(nèi)容分析的基本做法是對數(shù)據(jù)載體中的信息進行編碼,即根據(jù)特定的概念框架,對載體中的信息進行分類記錄,以獲得標準化數(shù)據(jù)。普遍意義上而言,內(nèi)容分析法與其他方法在標準化數(shù)據(jù)可得性方面并不存在明確差異。然而,隨著計算機與信息科學等相關領域的迅速發(fā)展,借助于技術手段的應用,社會科學研究中數(shù)據(jù)提取的效率得以顯著提升,但基于待提取數(shù)據(jù)類型之間的差異,技術手段應用所產(chǎn)生的效果也并不一致,并最終在一定程度上導致研究進程中數(shù)據(jù)提取效率的高下之分。
就數(shù)據(jù)結構類型而言,數(shù)據(jù)形式主要可分為結構化數(shù)據(jù)、非結構化數(shù)據(jù)與半結構化數(shù)據(jù)三個類型。其中結構化數(shù)據(jù),即包括預定義的數(shù)據(jù)類型、格式和結構的數(shù)據(jù),通常以二維表形式保存;半結構化數(shù)據(jù)系指具有可識別的模式并可以解析的文本數(shù)據(jù)文件,通常情況下是指xML數(shù)據(jù)文件;而非結構化數(shù)據(jù)則是沒有固定結構的數(shù)據(jù),通常保存為包括文本文檔、圖像和視頻在內(nèi)的不同類型的文件。由于結構化數(shù)據(jù)自身具備固定的類型、格式與結構,在進行數(shù)據(jù)分析之前并不需要對結構化數(shù)據(jù)進行過多處理,甚至可直接被用于數(shù)據(jù)分析與挖掘。但其他兩種類型數(shù)據(jù),尤其是非結構化數(shù)據(jù),在進行數(shù)據(jù)分析與挖掘之前,往往需要對其進行深入處理使其轉(zhuǎn)變?yōu)榉戏治鲆蟮慕Y構化數(shù)據(jù)?,F(xiàn)階段,裁判文書基本以純文本形式公開,即屬于典型的非結構化數(shù)據(jù)。
而實際上,在我們現(xiàn)階段所處的大數(shù)據(jù)時代,作為數(shù)據(jù)處理的重要內(nèi)容,如何將非結構化數(shù)據(jù)與半結構化數(shù)據(jù)轉(zhuǎn)化為可供使用的結構化數(shù)據(jù)不僅是大數(shù)據(jù)技術領域的關鍵技術之一,同時是大數(shù)據(jù)技術所面臨的關鍵問題之一。具體到計算機技術實現(xiàn)層面,數(shù)據(jù)處理,尤其是文本內(nèi)容抽取的有效實現(xiàn),在極大程度上依賴于自然語言處理技術的發(fā)展與應用。通過讓計算機“理解”自然語言,從而實現(xiàn)對以文本數(shù)據(jù)為典型非結構化數(shù)據(jù)的信息提取,進而實現(xiàn)非結構化向結構化的轉(zhuǎn)變。然而,就當前研究與應用成果來看,自然語言處理技術對于法學研究中的數(shù)據(jù)處理能夠提供的支持十分有限。裁判文書作為典型的非結構化數(shù)據(jù),當然也面臨著數(shù)據(jù)轉(zhuǎn)化方面的技術難題。而當缺乏有效技術支持時,數(shù)據(jù)量級的增長,即意味著人力成本增加,很顯然,這是目前以裁判文書為實證研究數(shù)據(jù)來源的一個重要缺陷。
因此,對基于裁判文書法學實證研究成果數(shù)量在2019年的急劇下降,我們可以尋得部分合理解釋。隨著計算科學等相關領域的快速發(fā)展,大數(shù)據(jù)不斷被各領域所推崇,法學領域也不例外。近年來,法學領域不斷有學者強調(diào)在大數(shù)據(jù)在法學領域的適用,并在強調(diào)全樣本優(yōu)越性的基礎上提倡獲取全面多樣數(shù)據(jù)。在當前裁判文書公開數(shù)量不斷攀升的情勢之下,獲取全面多樣數(shù)據(jù),即意味著數(shù)據(jù)量級的增長,進而使得研究成本大幅提升。在研究方法轉(zhuǎn)型的背景之下,相對于傳統(tǒng)研究方法對于文獻資料的梳理,大數(shù)據(jù)獲取對于人力物力需求的明顯增加,可能使得基于裁判文書法律實證研究的開展面臨困境,也可能使得意欲嘗試研究方法轉(zhuǎn)型的研究人員望而卻步。在“小數(shù)據(jù)”研究成果認可程度降低,“大數(shù)據(jù)”研究開展受阻的情境之下,實證研究成果的下降不可避免。
(二)從數(shù)據(jù)完整性方面的分析
數(shù)據(jù)分析之目的,在于從直觀數(shù)據(jù)之中,提取出有用的信息和知識。毋庸置疑,數(shù)據(jù)的完整性可以影響到所提取信息和知識的價值與厚度。涉及到目的性較強的數(shù)據(jù)分析,如果關鍵性數(shù)據(jù)的缺失,甚至可能導致分析目的無法實現(xiàn),從而進一步導致整體研究方案的可行性喪失。對于完全依賴于既有數(shù)據(jù)資料的內(nèi)容分析法而言,由于可獲取數(shù)據(jù)的完整性不由研究人員所掌控,可獲取數(shù)據(jù)的完整性程度不僅會影響到研究結果的可靠性及價值,甚至導致研究目的難以實現(xiàn)。而具體到基于裁判文書的實證研究中,由于現(xiàn)階段我國裁判文書公開所存在的缺陷,使得數(shù)據(jù)獲取缺乏完整性成為內(nèi)容分析方法相對于其他方法所表現(xiàn)出的主要劣勢之一。
從我國現(xiàn)階段數(shù)據(jù)公開來看,公開數(shù)據(jù)的完整性依然存在較大的問題?;诓门形臅▽W實證研究自身,則在原始數(shù)據(jù)與標準化數(shù)據(jù)獲取兩個層面都可能面臨數(shù)據(jù)完整性問題。從原始數(shù)據(jù)層面來看,目前裁判文書網(wǎng)公開的裁判文書數(shù)量與當年實際審結案件數(shù)量仍然存在較大差距,更為重要的是,裁判文書公開比例與案件類型、審判層級以及地域等因素均存在極為明顯的相關性。而從標準化數(shù)據(jù)層面來看,依據(jù)裁判文書制作規(guī)范,裁判文書主要對案件審理相關之要素進行記載,對于案件審理過程中所涉及的部分案件信息,在裁判文書制作過程中不可避免地需要進行簡化甚至省略。并且,雖然現(xiàn)行規(guī)范對于裁判文書的撰寫進行了較為明確的規(guī)定,但基于法院即審判人員自身的主觀原因,不同審判人員、不同法院之間出具裁判文書中所記載的具體內(nèi)容可能存在差異,部分審判人員依據(jù)其主觀意愿進行裁判文書制作時,即便是必需承載的案件要素信息同樣可能被其進一步簡化甚至省略。
裁判文書在總體上公開的不完整性,導致公開數(shù)據(jù)與真實數(shù)據(jù)總體存在非一致性,從而進一步導致基于不完整公開數(shù)據(jù)進行全樣本或抽樣分析所得出的研究結果與真實情況存在偏差,從而降低總體研究的可靠性。與此同時,裁判文書公開比率過低,會在一定程度上實證研究可用數(shù)據(jù)總量造成限制。而公開比率與案件類型等之間所存在的明顯相關性,則會導致擬適用具體案件類型裁判文書開展實證研究的可行性差異?;貧w到前文所論述的研究領域中,由于案件類型與學科領域分布密切相關,公開比率與案件類型相關性所導致的可行性差異,最終將表現(xiàn)為研究成果在學科領域部分上的差異性。申言之,對于前文所揭示的研究領域分布集中趨勢,除教義學方法堅守信念以及方法適用難易程度外,還可能受當前裁判文書公開缺陷之影響。
(三)從數(shù)據(jù)客觀性方面的分析
內(nèi)容分析法還具有另一個重要特性,即其無需對研究對象進行介入,無需與研究對象交流與互動。實際上,基于內(nèi)容分析法無需介人研究對象的特質(zhì),其也被劃歸為“非介入性研究法”。而非介入性研究法的優(yōu)勢,則在于,可以避免來自研究對象的主觀因素干擾,進而確保所獲取之數(shù)據(jù)的客觀性。
具體到基于裁判文書法學實證研究之中,其研究對象所涉及之個體主要以法官為主。任何職業(yè)都會或多或少地伴隨著一定的職業(yè)風險,而法官職業(yè)風險則來源于裁判權運行中對外或者對內(nèi)發(fā)揮作用是對法官自身產(chǎn)生的負面影響,這種負面影響則可以表現(xiàn)為對法官的心理壓力、身體損害、各種形式的責任承擔等等。在裁判權行使過程中,事實認定、適用法律、裁判可改變性及社會質(zhì)疑等都可能引發(fā)相應的法官職業(yè)風險??v觀我國司法體制改革歷程,制度設計所體現(xiàn)出的司法體制改革理念則主要在于防范權力濫用,而非在注重法官職業(yè)保障的基礎上保障權力實施。正確行使裁判權可以有效降低法官所面臨的執(zhí)業(yè)風險,但基于司法裁判本質(zhì),裁判過程中的事實認定與法律適用均具有一定的不確定性,裁判結果并不能完全避免錯誤出現(xiàn)。故此,對于我國法官而言,面對來自司法責任制與內(nèi)部考核制度方面的壓力,以及裁判錯誤的不可避免性,出于規(guī)避風險之目的,其必然不希望裁判行為被過分研究和解讀,以產(chǎn)生對其自身的不利的負面影響。申言之,對于任何研究對象的介入,都可能受主觀因素之干擾,但在我國法官所處的制度環(huán)境之下,介入性研究受到干擾的可能性及程度相對更高。
為盡可能避免受到來自研究對象的主觀因素干擾,研究人員在適用介入性研究方法獲取數(shù)據(jù)時,需要在全面了解可能出現(xiàn)之干擾因素的基礎上,不斷調(diào)整與完善數(shù)據(jù)采集方案。以問卷調(diào)查法為例,為盡量保證數(shù)據(jù)客觀性,問題本身是否清晰、問題長度是否適宜、問題本身是否包含偏見都需要根據(jù)研究目的及研究對象的具體情況進行設計與調(diào)整。對于知識體系相對單一的國內(nèi)法學研究者而言,在缺乏系統(tǒng)實證研究方法教育的情形下,基于介入性研究方法所獲取數(shù)據(jù)的客觀性必然更加容易受到質(zhì)疑。質(zhì)言之,適用內(nèi)容分析法所獲取數(shù)據(jù)的客觀性更容易得到認可,基于客觀數(shù)據(jù)所得出之研究結論必然更易為評閱者所接受。據(jù)此,研究成果數(shù)量與裁判文書網(wǎng)絡公開數(shù)量增長的高度契合,除裁判文書可得性外,還應當受到研究成果接受程度之影響。即,較高的接受程度,使得基于裁判文書法學實證研究的直接產(chǎn)出更易轉(zhuǎn)化為公開發(fā)表的研究成果,從而縮短裁判文書網(wǎng)絡公開數(shù)量增長與研究成果數(shù)量增加之間的時滯。
當然,在當前強調(diào)“大數(shù)據(jù)”,且數(shù)據(jù)提取技術尚未成熟之時,基于裁判文書法學實證研究同樣可能面臨數(shù)據(jù)客觀性方面的問題。具體而言,研究人員在進行編碼的過程中,對于編碼所需的特定概念框架,需要通過理解數(shù)據(jù)載體所承載的具體內(nèi)容進行抽象與確定,而基于主觀認知的差異,以及閱讀順序差異等外在因素,對于具體信息內(nèi)容的理解,在不同的研究人員之間則可能會存在一定的差異,進而影響到編碼結果的統(tǒng)一性與客觀性,當數(shù)據(jù)載體所承載的內(nèi)容主觀性非常強時,此類問題則會更加凸顯。申言之,當一項適用內(nèi)容分析法的研究需要由多個研究人員同時進行數(shù)據(jù)編碼工作時,同樣可能引發(fā)數(shù)據(jù)客觀性問題。
三、基于裁判文書法學實證研究推進路徑的思考
囿于傳統(tǒng)研究方法在研究對象方面所存在的局限性,以法律現(xiàn)象中的數(shù)量關系為主要研究對象的實證研究方法,因有助于全面把握法學研究對象,故有其在法學領域存在與發(fā)展之價值與必要。因此,在明確發(fā)展概況及與其相關影響因素的基礎上,為謀得基于裁判文書法學實證研究之長遠發(fā)展,除針對數(shù)據(jù)公開及技術發(fā)展方面的宏觀政策與制度支持外,研究人員同樣應當以研究方法為基點,在研究過程中積極主動尋求針對當前所處困境的破局之道。
(一)豐富數(shù)據(jù)來源
現(xiàn)階段,我國法學實證研究水平尚待提高,尤其是在團隊建設觀念及團隊協(xié)作能力都亟待提高的情況下,利用公開數(shù)據(jù)進行實證研究仍然是最為行之有效且可靠性最強的研究方式。具體到基于裁判文書法學實證研究中,基于公開數(shù)據(jù)對研究方法的完善,即可主要表現(xiàn)為,在堅持適用內(nèi)容分析法的基礎上,以裁判文書所承載內(nèi)容為依據(jù),通過廣泛搜集其他公開數(shù)據(jù)載體來充實可用于實現(xiàn)研究目的的數(shù)據(jù)類型與總量。以基于裁判文書法學實證研究成果中所涉及主要研究內(nèi)容中的司法鑒定而言,裁判文書中通常僅對出具鑒定意見的司法鑒定機構以及司法鑒定人名稱進行簡單記載,而更為詳細的信息則均由司法鑒定行政管理部門進行登記與公開。如若需要研究司法鑒定機構以及司法鑒定人所具有特性對鑒定意見審查結果的影響時,除去裁判文書中對于鑒定意見審查程序及結果的記載,司法鑒定行政主觀部門所公開的司法鑒定機構及司法鑒定人登記信息也是實現(xiàn)分析目的的重要數(shù)據(jù)來源。并且,由于該部分登記信息均得以通過互聯(lián)網(wǎng)渠道公開,對于項目開展所需人力成本的影響也十分微小,因而該種研究方法完善途徑具有較高的可能性。
當然,基于內(nèi)容分析法自身的局限性,以及我國現(xiàn)階段的信息公開制度,并非所有與裁判文書相關數(shù)據(jù)均能從公開渠道獲得。此時,對于研究方法的完善則意味著對于其他研究方法的引入。例如,當研究目的的實現(xiàn)需要分析審判人員背景信息,尤其是涉及審判人員性格特征等非公開資料能獲取的信息時,裁判文書不會對該部分信息予以記載,而對于該部分信息的獲取需要對審判人員進行介入,此時,內(nèi)容分析法作為非介入性研究方法,當然無法再有效滿足分析需求。在此種情況下,研究人員則可以借用問卷調(diào)查法或觀察法,對于該部分數(shù)據(jù)資料進行補充。具體而言,研究人員可通過向具體審判人員發(fā)放問卷,或?qū)徟腥藛T進行觀察訪談,獲取審判人員的背景特征信息,然后再結合承載該部分審判人員具體審判過程的裁判文書實現(xiàn)最終的研究目的。誠然,由于其他研究方法的數(shù)據(jù)獲取并沒有相對于裁判文書可通過統(tǒng)一平臺進行獲取的便捷性,其他方法的引入,對于整個研究項目的影響并非簡單的導致研究成本增加,而是直接影響抽樣方案的制定,進而造成整個研究方案的變化。
綜上,對于裁判文書內(nèi)容承載局限性所造成的阻礙,研究人員可以通過完善研究方法的形式予以彌補,對于研究方法的完善,以擴充數(shù)據(jù)類型與總量為目的,可以內(nèi)容分析法為基礎,通過公開渠道對研究所需數(shù)據(jù)進行擴充,也可以內(nèi)容分析法為中心,引入其他研究方法。而具體完善方案的選擇,則需要對研究目的實現(xiàn)、成本投入等多方面因素進行考量。
(二)科學適用買證研究方法
對于適用內(nèi)容分析法的實證研究而言,除定量分析中對于統(tǒng)計分析方法的理解與適用較易出現(xiàn)問題外,如前文所述,數(shù)據(jù)的采集與提取更可謂“雷區(qū)”。故此,謀求基于裁判文書法學實證研究的長遠發(fā)展,必然無法繞開對于研究方法適用的規(guī)范。與此同時,由于知識體系集體單一,所接受的研究方法教育均以教義學方法為主,法學研究者關于實證研究方法的知識儲備匱乏,缺乏系統(tǒng)量化研究思維。對于研究方法適用的規(guī)范,應以提升研究人員對于方法本身的理解與認知,并實現(xiàn)期思維從定性到定量之轉(zhuǎn)換為前提。
1.規(guī)范研究方案的制定。
任何研究項目的順利開展,都需要事先制定一個完整的研究方案,對研究實施的細節(jié)問題和實施步驟進行明確。對于基于裁判文書的實證研究而言,如上文所述,如何正確采集裁判文書,以及如何準確地從裁判文書中抽象與提取數(shù)據(jù),都需要在項目實施前予以明確。尤其對于需要團隊協(xié)作的項目,事先制定詳細的研究方案對于提升項目成員執(zhí)行項目的規(guī)范性與統(tǒng)一性尤為重要。具體而言,基于裁判文書的實證研究方案,除研究方案普遍應當具備之內(nèi)容外,還應著重強調(diào)以下幾點。第一,裁判文書抽樣方案,包括抽樣范圍與比例的確定,以及在裁判文書總體不可得的情況下,通過制定適當?shù)某闃愚k法以確保抽樣的隨機性與準確性。第二,數(shù)據(jù)編碼規(guī)則,如前文所述,內(nèi)容分析法最為基本的做法即為對載體中的信息進行編碼,事先制定詳細的數(shù)據(jù)編碼規(guī)則有利于研究人員在對裁判文書內(nèi)容進行抽象的過程中概念統(tǒng)一,從而提升數(shù)據(jù)提取的有效性。而在量化實證研究之中,數(shù)據(jù)編碼即定性內(nèi)容向定量數(shù)據(jù)轉(zhuǎn)變之關鍵。第三,明確團隊成員分工,尤其在數(shù)據(jù)采集與提取過程中,應當明確各個研究人員的職責范圍,以避免造成數(shù)據(jù)采集與提取的重復或遺漏,提升項目執(zhí)行之效率。
2.提升團隊協(xié)作能力與效率。
如前文所述,由于輔助技術對于法學實證研究,尤其是對于數(shù)據(jù)處理方面的支持十分有限,現(xiàn)階段基于裁判文書的實證研究開展,仍然需要以人工閱讀與整理的形式完成裁判文書內(nèi)容的提取,以及將定性內(nèi)容轉(zhuǎn)化為定量數(shù)據(jù)。然而,傳統(tǒng)的法教義學研究,對于團隊運行的形式并不十分依賴,通常只需要較少的研究人員,甚至是單獨的研究人員即可形成具體的研究成果。從傳統(tǒng)研究方法向定量的實證研究方法的轉(zhuǎn)變,尤其是向需要耗費大量人力資源的裁判文書分析研究來說,如何適應團隊協(xié)作,并提升團隊協(xié)作與效率,同樣是現(xiàn)階段謀求基于裁判文書的法學實證研究發(fā)展所需解決的問題。具體而言,實質(zhì)開展研究項目前,在研究方案中對團隊成員分工進行明確的基礎上,還需要在項目開展前對研究人員進行培訓,并在項目開展過程中注重研究團隊之間的溝通交流。而從長遠發(fā)展來看,組建較為固定的研究團隊,則是提升協(xié)作能力與效率的重要基礎。
3.重視研究結果的檢驗。
社會科學研究中任何一種精確的、系統(tǒng)的收集資料的方法,實際上都是一種特定形式的社會測量,而為了衡量收集資料的準確性,以及依據(jù)該部分數(shù)據(jù)資料分析所得的研究結論是否具有穩(wěn)定性,任何研究成果均需接受信度與效度的檢驗。法學作為一門社會科學,內(nèi)容分析法作為一種特定的資料搜集方法,基于裁判文書的實證研究結果必然也需要接受信度與效度檢驗。尤其是在多人協(xié)作進行裁判文書內(nèi)容提取的時候,為確保研究結果盡量少的受到數(shù)據(jù)提取瑕疵或錯誤的影響,對于研究結果的檢驗顯得更加必不可少。對于使用通過抽樣所獲得小數(shù)據(jù)進行分析的實證研究而言,抽樣方法的合理性則為影響最終研究結果穩(wěn)健型的關鍵因素之一。在當前國內(nèi)法學研究群體普遍缺乏實證研究系統(tǒng)知識背景及方法適用經(jīng)驗的背景下,研究人員不應對自身所開展的研究及所獲得之結果過分自信,結果的穩(wěn)健型必然應以檢驗結果為依據(jù)。研究成果受眾,無論是期刊編輯還是政策制定者,對于研究結果可靠性的判斷同樣應以檢驗結果為標準。然而,從現(xiàn)階段已有的基于裁判文書的研究成果來看,至少在期刊論文之中,極少存在研究人員對研究結果進行穩(wěn)健型檢驗。而基于前文對研究成果數(shù)量變化趨勢的分析,可以推測,當前法學實證研究領域?qū)εc研究結果檢驗的忽視,可能導致了不利于本領域發(fā)展的極端現(xiàn)象,即將研究數(shù)據(jù)的“量”與研究結果的“質(zhì)”進行絕對性關聯(lián),進而導致學界對于“量”的過分推崇,并最終導致近年來法學實證研究發(fā)展步伐放緩。為此,為提升基于裁判文書的實證研究成果在法學研究領域的認可度,以謀求法學實證研究的長遠發(fā)展,研究人員應重視對于研究成果信度與效度方面的檢驗,無論是全樣本“大數(shù)據(jù)”,還是抽樣“小數(shù)據(jù)”,從純粹的學術研究角度而言,只要方法適用得當且研究結果符合穩(wěn)健型檢驗要求,即應當被認可。
(三)推動數(shù)據(jù)處理技術的發(fā)展
從本質(zhì)上來講,提升裁判文書內(nèi)容提取效率的根本之策應在于加速相關數(shù)據(jù)處理輔助技術的發(fā)展。對于裁判文書內(nèi)容提取而言,核心的數(shù)據(jù)處理輔助技術即為自然語言處理技術。而自然語言處理技術的發(fā)展,及其在法學研究領域的有效應用,則是法學領域研究人員可以切身參與的。
數(shù)據(jù)處理技術的核心在于自然語言處理,而自然語言處理作為一項跨學科研究領域,其在特定領域范圍內(nèi)的研究與應用必然離不開本領域?qū)<覍W者的參與。自然語言處理研究早期,基于規(guī)則的自然語言處理方法,需要依靠本領域?qū)<液臅r數(shù)月或者更長時間總結并參與編寫語法規(guī)則,而機器學習以及現(xiàn)階段推動了自然語言處理技術飛速發(fā)展的深度學習方法則需要基于大量本領域數(shù)據(jù)進行長時間地訓練才能不斷提高數(shù)據(jù)處理的準確率,機器訓練的過程同樣需要本領域?qū)<业膮⑴c,以更好地引導機器做出涉及本領域?qū)I(yè)知識的正確判斷。因而,要實現(xiàn)自然語言處理技術在特定領域的應用,則不可避免地需要本領域?qū)<覅⑴c應用程序研制及開發(fā)。對于研發(fā)機構而言,在應用層面,基于訓練過程的大量投入,以及應用的領域性,研發(fā)人員不得不將產(chǎn)出作為應用程序開發(fā)的一個重要考量因素。相對于諸如金融等高收益、高回報領域,機器訓練階段較大的人力成本投入與預期產(chǎn)出的失調(diào),則正是阻卻自然語言處理領域研究成果在法律行業(yè)有效應用的主要原因之一。因而,法學研究學者作為本領域的專業(yè)人員,如果能通過其自身對于自然語言處理技術與應用產(chǎn)品研發(fā)過程的參與來降低法律行業(yè)應用程序研制開發(fā)成本,則能有效降低研發(fā)機構在投入產(chǎn)出方面的顧慮,進而促進研發(fā)人員在從事法律行業(yè)領域自然語言處理技術與應用產(chǎn)品研發(fā)方面的積極性,并最終導致法律行業(yè)領域自然語言處理技術的提升及相應應用產(chǎn)品的出現(xiàn)。
通俗來講,單純的基于自然語言處理技術的法學研究輔助工具及軟件研發(fā)并不能為投資者及研發(fā)人員帶來可觀的經(jīng)濟收益,但自然語言處理技術本身確是目前蓬勃發(fā)展且商業(yè)利益巨大的高階人工智能產(chǎn)品開發(fā)之基石。由于基于自然語言處理技術的法學研究輔助工具及軟件的應用可以間接地吸納較多地本領域?qū)<覍τ跈C器訓練過程的參與,如果可以創(chuàng)建一種雙贏模式,使法學研究人員及軟件開發(fā)主體均能在技術應用中獲利,即可有效促進數(shù)據(jù)處理技術在法律行業(yè)的有效利用,進而推動基于裁判文書法學實證研究的進一步提升與發(fā)展。具體而言,軟件開發(fā)主體可先投入少量成本研發(fā)出具備一定數(shù)據(jù)處理能力的軟件產(chǎn)品,并以開源形式供本領域?qū)<覍W者做學術研究之用,從而使得專家學者可以在學術研究過程中獲得計算機技術的輔助與支持,而軟件開發(fā)人員則可以通過專家反饋實現(xiàn)對于機器的訓練,訓練完成之后則可進一步用于開發(fā)更加高階的人工智能產(chǎn)品。