崔景旭
(中國刑警學院 遼寧 沈陽 110035)
證據(jù)真實性及其強度的科學性評估
崔景旭
(中國刑警學院遼寧沈陽110035)
結合DNA和語音證據(jù)的真實性和強度評估,討論如何使證據(jù)達到“確實、充分”標準。證據(jù)真實性和強度評估是通過刑事鑒定技術進行的,傳統(tǒng)鑒定方法是直接比對檢材與樣本的特征參數(shù),根據(jù)其特征參數(shù)的異同與相似度,由鑒定人員給出鑒定意見。貝葉斯似然率理論不直接比對檢材與樣本,而比較檢材與樣本同源與不同源的概率?;诮y(tǒng)計分析得到兩個概率比值,自然地給出證據(jù)的真實性和強度,使鑒定意見擺脫人為因素影響。
貝葉斯似然率理論源內變異與源間差異參考數(shù)據(jù)庫
刑訴法第五十四條規(guī)定“在偵查、審查起訴、審判時發(fā)現(xiàn)有應當排除的證據(jù)的,應當依法予以排除,不得作為起訴意見、起訴決定和判決的依據(jù)?!笔紫葢斠婪ㄓ枰耘懦氖欠欠ㄊ占难栽~類證據(jù),以及非法程序收集的實物證據(jù);其次是達不到“確實、充分”標準的證據(jù)材料。刑訴法規(guī)定八類證據(jù)都是材料,不是事實,證據(jù)材料可能為真,也可能為假,它們的真?zhèn)涡枰b定。鑒定是對涉案未知客體(檢材)和已知客體(樣本)進行同一認定的過程。為檢測客體同源與否,必須尋找客體源內變異(Within-source Variability) 和客體源間差異 (Between-sources Variability),同一認定的前提是源內變異小于源間差異。鑒定是采用物理的、化學的、生物的等不同技術方法實施查證核實的過程。修改前的刑訴法將鑒定結果稱之為“鑒定結論”,刑訴法將其改為“鑒定意見”,應該說這個修改比較準確地反映了鑒定結果的屬性。事實上,鑒定結果與技術方法,鑒定人員的專業(yè)水平和實踐經(jīng)驗,分析、提取特征參數(shù)的設備性能以及判斷同一認定模式,都會對鑒定結果產(chǎn)生影響。鑒定結果是鑒定人員的“一家之言”,不應該稱之為“鑒定結論”。國外對近20年不同證據(jù)發(fā)生的錯案率進行調查表明:DNA證據(jù)發(fā)生的錯誤率大約為1~2%,工具痕跡達35%,筆跡錯誤識別率為36%,咬痕的錯誤識別率為60%。中國缺少這類統(tǒng)計數(shù)據(jù),但是,2006年召開的全國刑事科學技術會議曾經(jīng)指出:在DNA、指紋、聲紋、筆跡、足跡等法庭證據(jù)的同一認定上都出現(xiàn)過錯誤。在“重結果輕過程”思想影響下,一些執(zhí)法、司法人員拿到鑒定書時,首先看的是“鑒定結論”,不關心鑒定結論的導出過程,也很少有人質疑“鑒定結論”。刑訴法規(guī)定“鑒定意見”是證據(jù)材料之一,公、檢、法部門查證核實它是法定任務。
為減少因證據(jù)導致的錯案,人們一直尋求評估證據(jù)真實性及其強度的科學方法。托馬斯·貝葉斯是18世紀數(shù)學家,貝葉斯概率論的一個核心思想是:從不確定事件里得到的實驗數(shù)據(jù),以何種方式解釋,才能給出符合事物本來面貌的結論?20世紀90年代末期,法庭科學家將貝葉斯概率理論應用于具有不確定性的案件證據(jù),發(fā)展出貝葉斯似然率理論(Bayes’Likelihood Ratio),用于評估證據(jù)真實性和強度。對DNA,玻璃、油漆、語音等證據(jù)材料的強度評估都取得了滿意的結果。本文結合DNA和語音證據(jù)的似然率評估,介紹貝葉斯似然率理論,并討論該理論對完善證據(jù)制度的意義。
2.1似然率的基本概念
傳統(tǒng)鑒定方法是對未知客體和已知客體直接比對,尋找其源間差異和源內變異。貝葉斯理論認為,檢材與樣本存在的差異使得同源與非同源都成為具有不確定性的概率事件,主張檢材與樣本同源也好,主張非同源也好,在未經(jīng)證實以前都是一種假設。貝葉斯理論將主張同源的稱為控方假設,主張非同源的稱為辯方假設,它們都是以概率形式出現(xiàn)的,通常H0表示同源假設,H1表示非同源假設,其概率形式是:其中,P代表概率,E代表證據(jù),|代表條件。(1)是控方假設概率,(2)是辯方假設概率,將兩個概率之比定義為似然率(Likelihood Ratio,LR):
似然率方法與傳統(tǒng)鑒定方法的最大區(qū)別是:不直接比較檢材與樣本,代之以同源與非同源概率之比,兩個概率競爭的結果決定證據(jù)的真實性和強度。
似然率的意義是:在證據(jù)E與檢材和樣本都存在差異的條件下,檢材與樣本同源的概率是非同源概率的LR倍。
因為P(E|H0)+P(E|H1)=1,在LR已知時,可以得到:
2.1.1似然率的定性作用
根據(jù)多種證據(jù)似然率的評估結果,可以將似然率的定性作用分為三種:①LR=1,從公式(4)得到:P(E|H0)=P(E|H1)=0.5,同源與非同源的概率都是0.5,與此對應的是無解,即無法判斷;②LR>1,預示檢材與樣本同源;③LR<1,預示檢材與樣本非同源。
2.1.2似然率定量作用
根據(jù)LR數(shù)值范圍,可以估計對控方和辯方的支持強度,表1給出了LR數(shù)值及與之對應的支持力度的文字解釋。
表1 LR數(shù)值及解釋
2.2DNA證據(jù)的似然率評估
在DNA檢驗中,似然率的定義是
該定義分子“嫌疑個體為物證DNA供體的可能性”等價于控方假設概率,分母“人群中隨機供體為物證DNA供體的可能性”等同于辯方假設概率。
DNA似然率評估公式是
Pm是基因型頻率(genotypic frequency),它是群體中某特定基因型個體數(shù)占全部個體數(shù)的比率。
滿足哈代-韋恩貝格(Hardy-Weinberg)平衡法則時,可用基因頻率計算基因型頻率。純合子基因型頻率等于基因頻率的平方,雜合子基因型頻率是一對等位基因頻率的乘積,再乘以2:
DNA似然率評估案例
表2給出的是某犯罪嫌疑人的基因型(樣本)與現(xiàn)場物證檢材的基因型的比對結果。表中列有短串聯(lián)重復序列STR(Short Tandem Repeat)的13份基因座,等位基因1、等位基因2分別來自樣本與檢材,LR是單個基因給出的似然率。由于基因座是彼此無關的,累計LR是單個基因似然率之積。表中的D7S820、TH01、TP0X、CSF1PO是純合子基因座,其余9個為雜合子基因座。
表中第一項是雜合子基因座D3S1358,它的等位基因頻率是
與之對應的似然率是
LR=1/Pm=1/0.1090203=9.17
同樣方法可以計算出第二個雜合子基因座VWA的LR=8.87。表2給出頭兩項的累計LR是81。
表2 樣本與檢材的基因型匹配數(shù)據(jù)
表中第9項D7S820屬于純合子基因座,它的等位基因頻率是
與之對應的似然率是
從表2可以看出,隨著基因座數(shù)目的增加,累計的似然率LR增加很快,前4項累計LR已經(jīng)達到16364,這意味著:嫌疑個體為DNA供體的可能性是人群中隨機個體為DNA供體的可能性的16364倍,對照表1可知,此時已經(jīng)是“非常強的證據(jù)支持控方”。根據(jù)公式(4),可以得到與此對應的控方假設概率是99.99%。
似然率方法在DNA證據(jù)評估上取得極大成功,主要歸功于:①DNA具有極大的個體差異。實驗發(fā)現(xiàn):單用一個探針,個體間完全相同的概率小于3× 10-11。如果用兩個探針,個體間的機會相關概率小于5×10-19。以當前世界70億人口計算,與這樣兩個概率對應的人數(shù)分別小于0.21個和3.5×10-9個,這意味著世界上沒有兩個人的DNA指紋完全相同(同卵孿生除外);②存在并且發(fā)現(xiàn)攜帶個體特征的基因座。在人類基因組中約有5萬~10萬個短串聯(lián)重復序列STR,它的重復單位小,僅為2~7bp,重復序列也很短,更易于擴增,分型檢測的靈敏度更高;③各國對STR序列做了深入實驗研究,已經(jīng)揭示出STR基因座頻率隨著人種、民族和居住地區(qū)的變化規(guī)律,建立了不同人種、民族的基因座頻率數(shù)據(jù)庫;④深厚的基礎研究。DNA是目前各國最為重視的學科。DNA的基礎研究實驗室、應用研究實驗室遍布世界各地,大批生物學、遺傳學、遺傳工程、信息技術、數(shù)理統(tǒng)計等方面專家紛紛加入DNA研究領域。他們的研究不斷加深對DNA本質的認識,能夠持續(xù)地提供最新研究成果,用于完善DNA似然率評估方法。
DNA似然率評估是建立在數(shù)理統(tǒng)計基礎上的,避免了經(jīng)驗式的主觀判斷,具有清晰和標準的分析過程,給出的是概率性的結果,不再是“認定/否定”絕對式的結論??梢哉f,DNA證據(jù)的評估方法為法庭物證鑒定提供了“標準樣本”。
2.3語音證據(jù)的似然率評估
語音證據(jù)似然率公式是
其中,E代表語音證據(jù),P(E|H0)是控方假設概率,P(E|H1)是辯方假設概率。
共振峰決定元音音色,它們也是話者語音聲學特征的承載元,早期選擇評估參數(shù)就是元音共振峰。表3給出利用澳大利亞英語“hello/hel?u”里第二個音節(jié)之/l/和/?u/的第二共振峰F2測算的LR數(shù)據(jù)。表中x代表未知和已知語樣F2的平均值,SD代表標準偏差,n代表提取語樣的次數(shù)。表中的RS、MD、EM、PS、JM、DM等均表示發(fā)音人,他們在不同時段所發(fā)的“hello”構成未知與已知語樣。表3給出了由/?u/和/l/的F2計算得到的LR,組合LR是二者的乘積。
從表3可以看到:①同一話者對RS1/RS2.1給出的LR都不大,組合LR也只有5.34;而同一話者對(MD1/MD2.2)的組合LR居然是0.06,與實際情況相反;②不同話者對EM2.1/RS2.1的LR都小于1,符合實際情況。而不同話者對JM1/DM2.2又出現(xiàn)與實際情況相反的結果:JM1/DM2.2之/?u/的F2給出LR=4.50,由于JM1/DM2.2的/l/之F2給出特別低LR值,它們的組合LR是小于1的。這些結果表明,元音共振峰雖然具有個體特征,但并不意味著每個共振峰評估結果都能給出符合真情況的結果。為改進評估效果,Aitken和 Lucy等人提出多變量似然率(Multivariate LR,MVLR)計算公式。
我們利用MVLR公式,測試了漢語普通話似然率區(qū)分能力。圖1給出一幅代表性的Tippett圖,也叫可靠性函數(shù)圖譜。它的橫坐標是以10為底的LR的對數(shù)值,縱坐標是累積的話者對得分。圖1左邊是/i/共振峰組合得到的Tippett圖,左邊是/y/共振峰組合得到的Tippett圖,其中實線表示F1、F2和F3的組合結果,虛線代表F2和F3的組合結果??梢钥吹剑簣D中代表不同話者對(DS)的左側曲線隨著Log10LR的增加逐漸下降,代表相同話者對(SS)的右側曲線隨著Log10LR的增加逐漸上升,二者的交匯點原則上出現(xiàn)在Log10LR=0處。DS和SS曲線的這種分布形態(tài)與前邊關于LR具有定性區(qū)分功能的討論是一致的。
在/i/的F1,F(xiàn)2和F3組合計算中,最大的Log10LR=2.397,即LR=249,根據(jù)表1,是中等強度的支持控方假設。最小LR值是2.0E-6,根據(jù)表1,該LR值非常強地支持辯方假設。
MVLR公式復雜,計算量很大,提取評估特征參數(shù)的工作量也很大。本世紀初,研制出基于貝葉斯原理的似然率自動評估系統(tǒng),圖2是該系統(tǒng)框圖。
圖1 利用元音/i/和/y/共振峰得到的Tippett圖
圖2 似然率自動評估系統(tǒng)框圖
圖底層的潛在人群樣本數(shù)據(jù)庫 P(Potential Population Database,P)、嫌疑話者參考數(shù)據(jù)庫R(Suspect Reference Database,R)以及嫌疑話者控制數(shù)據(jù)庫C(Suspect Ccontrol Database,C) 是整個計算的基礎。未知語樣(Trace)指的是在現(xiàn)場得到的語音檢材。
P庫:原則上它應該覆蓋人群中可能出現(xiàn)的所有嗓音,從P庫里應該能找到到和任何未知語樣相似的嗓音。未知語樣(Trace)錄音條件多種多樣,它們很難和P庫完全匹配,其中以信道不匹配對似然率影響最大。目前是按照信道類別如座機、手機、錄音機、MP3等建立幾個P庫。這樣才能從P庫找出與未知語樣相關的潛在人群數(shù)據(jù)庫。還可以按照性別、語種、方言等建立另外一些P庫。P庫用于計算源間差異的。
R庫:記錄嫌疑人的錄音。建立該庫時,其錄制條件和語音學條件應盡可能的與P庫記錄一致。R庫是用來構建嫌疑話者模型,用于計算源內變異。
C庫:存儲的是和檢材很相似的嫌疑人的錄音,C庫的記錄來自R庫。
該圖右路的任務是利用P庫和未知語樣,經(jīng)過比較分析,得到LR的分母;中路的任務是利用未知語樣與R庫比較,得到證據(jù)值E;左路是利用R庫與C庫經(jīng)過比較,得到得到LR的分子。
語音特征參數(shù)。早期話者話者自動識別系統(tǒng)使用的都是聲學意義明確的短時聲學特征量如基頻,共振峰,短時幀能量等?,F(xiàn)在自動識別系統(tǒng),包括似然率自動評估系統(tǒng),常用的特征量有梅爾倒譜系數(shù)(MFCC),線性預測倒譜系數(shù)(LPCC),感覺加權線性預測(PLP)等。
話者模型。目前似然率自動評估系統(tǒng)都采用MFCC構建的高斯混合模型(GMM)作為話者模型。GMM既能模擬瞬態(tài)、也能模擬穩(wěn)態(tài)的聲道特征,在信道噪聲以及頻譜失真的情況下表現(xiàn)比較穩(wěn)定。混合數(shù)為M階的GMM第i個話者的概率密度分布函數(shù)(probability density fuction,pdf)是:
其中,P(x/λ)是M階加權的GMM密度值;D是多維矢量空間的特征參數(shù),共有d個特征值;πi是混合權重;μi是某個分量密度的平均矢量也叫均值矢量;Σi是第i個分量密度的協(xié)方差矩陣,X是d維觀測矢量;(x-μi)T是(x-μi)的轉置。
GMM的一個話者模型可以表示為:
公式(12)的fi(x)和麥克斯韋速率分布f(v)物理意義相同。f(v)表示在平衡態(tài)下,分布在任一速率區(qū)間v~v+△v的分子數(shù)△N占總分子數(shù)N的百分率;fi(x)代表在在某個LR值附近的話者數(shù)目在統(tǒng)計人群里所占有的百分比。它們都是概率密度函數(shù),差別僅僅在于變量數(shù)目:f(v)是標量v的一維函數(shù),fi(x)是MFCC構成的多維變量函數(shù)。
圖3是自動評估系統(tǒng)給出的概率密度分布隨Log10LR的變化形態(tài)。虛線是P(E|H1)的pdf曲線,實線是P(E|H0)的pdf曲線。根據(jù)語音證據(jù)E計算得到Log10LR值,通過該值作橫坐標的垂線,在P(E|H0)和P(E|H1)上截取兩個概率密度值,二者之比即為語音證據(jù)E的似然率LR。圖3給出的是
2.4似然率應用案例
2.4.1西安敲詐案
西安張某接到一個恐嚇電話,一個男子要她往指定的卡上打10萬元。張某從嗓音上聽出他很年輕,問他哪里人,對方回答說“西安的”。敲詐電話(檢材)長度116秒,內有女、男二人對話。張某報案后,警方從犯罪嫌疑人吳某那里提取了語音樣本,制作了長度分別是68秒和44秒兩段樣本。送檢方要求判斷檢材與樣本是否同源。
圖3 概率密度曲線及LR的計算
我們利用西班牙的BATVOX系統(tǒng)測試了檢材與樣本的似然率,結果如圖4所示,左側高而窄的是P(E|H1)的pdf曲線,右側低而寬的是P(E|H0)的pdf曲線,語音證據(jù)E的是垂直橫坐標的綠線。根據(jù)證據(jù)的Log10LR與兩個pdf的交點,計算得到的LR=9.9999× 109,該值強烈支持控方假設,即檢材與樣本嗓音是同源的。似然率評估和聽覺感知與聲學分析是一致的。
圖4 西安敲詐案的P(E|H1)和P(E|H0)曲線
2.4.2房產(chǎn)糾紛案
大連某鄉(xiāng)鎮(zhèn)地區(qū)發(fā)生一起房產(chǎn)糾紛案。浦某將孫某告到法庭,因為孫在他的房屋居住十多年之久,一直不付購房款。在孫某到浦家交涉時,浦某做了錄音,以此為證,浦某將孫某告上法庭。法院錄制了浦、孫二人語音樣本,要求確認錄音中兩位男性是否是浦某與孫某。
圖5 孫某(左)浦某(右)的pdf曲線形態(tài)
利用BATVOX系統(tǒng),分別測試了浦某與孫某檢材與樣本的LR數(shù)值。圖5給出孫某(左)浦某(右)的pdf曲線分布以及語音證據(jù)E的位置。從該圖可以看出:浦某證據(jù)E在P(E|H0)的pdf曲線交點處于較高位置,與P(E|H1)的pdf曲線交點處于很低位置,因此,浦某的LR值高達3.68E7。和浦某相比,孫某證據(jù)E在P(E|H0)的pdf曲線交點處于較低位置,而與P (E|H1)的pdf曲線交點處于較高位置,導致LR=P(E|H0)/P(E|H1)之值下降,實測LR值是11.59,雖然支持控方假設,但是“有限強度地支持”。出現(xiàn)這樣結果的原因是:浦某是原告,錄制樣本時,他的發(fā)音狀態(tài)與檢材的狀態(tài)差別很小。而孫某是被告,他的樣本語音強度弱,基頻低,語氣和檢材的差異也很大,這意味著孫某的源內變異加大,后果就是支持控方假設的概率降低。
2.4.3昆明販毒案
昆明市公安局截獲某男性與某女的電話錄音(檢材),男性何某杰歸案后承認女的是帕·某某遜(女,維族),是他的販毒伙伴。市局分別制作何某杰的樣本1和帕·某某遜的樣本2,送檢方要求鑒別它們是否與男性、女性檢材同源。
聽覺感受到的男性檢材和樣本1里滿是沙啞、干澀的語句,嗓音里有大量隨機出現(xiàn)的清音濁化、濁音清化存在。聲帶疾患引起的嗓音個體特征非常明顯,它們足以證明男性檢材與樣本1是同源的。
女性檢材與樣本2的發(fā)音偏離漢語調形規(guī)范,如“再見”尾音jiàn是去聲,而她的尾部基頻卻呈現(xiàn)上揚態(tài)勢,聽起來有些洋腔洋調。元音三角形證明,兩份女性語樣發(fā)音者的舌位活動范圍比漢族女性的小得多,存在明顯的央化現(xiàn)象(圖7)。聽覺和聲學檢驗表明,女性檢材與樣本2是同源的。
圖6給出女性檢材與樣本2的似然率評估結果,LR=9.999×109,強烈支持帕·某某遜樣本與檢材女性語音同源的假設。男性檢材與樣本1的似然率評估結果卻是LR=0.844<1,給出男性檢材與樣本1不同源的錯誤結果。原因是:本案男性病態(tài)嗓音非常特殊,P庫也好,R庫也好,都缺乏能夠與之匹配的參考語音數(shù)據(jù),導致使得似然率的分子、分母的計算失常。本案例證明,參考語音數(shù)據(jù)庫與檢材/樣本的匹配功能對似然率評估影響很大。
圖6 昆明販毒案女性pdf曲線
圖7 檢材女性與漢族女性元音三角形的比較
貝葉斯似然率理論在DNA鑒定上的成功,證明該理論完全適用于法庭證據(jù)真實性及其強度的分析和評估。DNA似然率的分析和計算模式已經(jīng)成為其他證據(jù)似然率評估的“標準樣本”。
貝葉斯似然率理論已經(jīng)對英語、澳大利亞英語、法語、日語、漢語等多種語音做過評估。我們對漢語似然率計算有過實驗研究,并且將它應用于實際案例,這些實踐證明似然率評估方法適用于漢語語音證據(jù)分析和判斷。真實案例中嚴重影響人工鑒定的因素如檢材與樣本方言土語的差別,檢材與樣本基頻的差別,語速的差別等等,對似然率評估幾乎沒有影響。目前,基于高斯混合模型(GMM)的似然率自動評估系統(tǒng)已經(jīng)在中國公安、安全系統(tǒng)推廣使用。
筆者建議應該像采集指紋、DNA數(shù)據(jù)那樣,采集重點人口的語音數(shù)據(jù),建立大規(guī)模的語音數(shù)據(jù)庫,為語音證據(jù)似然率評提供包容性更強、適配性更高的參考語音數(shù)據(jù)庫。
[1]Michael 1.Saks,Forensic Identification Science:A SummaryoftheTheory,the Science,and the LegalHistory[R].NACDL,NewOrleans,2005.
[2]Joaquin,G.R.,et al.BayesianAnalysis of Fingerprint,Face and Signature Evidences with Automatic BiometricSystems[J].Forensicscienceinternational,vol. 155,2005:126-140.
[3]Meuwly,D.Biometrics in forensic science: fingerprint,voice,DNA,invited presentation.Iden tech. 2005.
[4]Meuwly,D.,Drygajlo,A.Forensic speaker recognition based on a Bayesian framework and Gaussian mixture modelling(GMM).In:Proceedings of the 2001 Speaker Odyssey Speaker recognition Workshop,2001: 145-150.
[5]Baldwin,D.J.Weight ofevidence for forensic DNA profiles[M].Chichester,U.K.Wiley,2005.
[6]Rose,P.Difference and Distinguish Ability in the AcousticCharacteristicsof HelloinVoiceof Similar-sounding Speakers-A Forensic Phonetic Investigation[J].Australian Review ofAppliedLinguistic,1999,21(2):1-42.
[7]Aitken,C.G.G.,Lucy,D.Evaluation of trace evidence in the form ofmultivariate data,Applied Statistics, 53/4,109-122,2004.
[8]Hollien,H.TheAcousticof Crime[M].New York: Plenum Press,1990:209-210.
[9]王彥吉,王世全.刑事科學技術教程[M].北京:中國人民公安大學出版社,2009.
[10]張艷云.法庭語音證據(jù)強度評估的新方法研究[D],沈陽:中國刑警學院,2008.
(責任編輯:郭帥)
D918
A
2095-7939(2015)01-0029-06
2014-10-25
崔景旭(1938-),男,遼寧本溪人,中國刑警學院教授,主要從事司法語音學研究。