国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

論打印類匿名信所用漢字輸入法的判定

2015-04-09 09:05歐陽國亮
關(guān)鍵詞:匿名信輸入法特點(diǎn)

□歐陽國亮, 何 琳

(1.中國刑警學(xué)院 文件檢驗(yàn)技術(shù)系,遼寧 沈陽 110035; 2.湖南省郴州市永興縣公安局,湖南 郴州 423300)

論打印類匿名信所用漢字輸入法的判定

□歐陽國亮1, 何琳2

(1.中國刑警學(xué)院 文件檢驗(yàn)技術(shù)系,遼寧 沈陽 110035; 2.湖南省郴州市永興縣公安局,湖南 郴州 423300)

摘要:探索不同輸入法產(chǎn)生的言語錯(cuò)誤類型,把握其規(guī)律,為打印類匿名信所用輸入法的判定提供依據(jù)。方法:對(duì)拼音輸入法、五筆輸入法、手寫輸入法的言語錯(cuò)誤類型進(jìn)行比較分析和分類統(tǒng)計(jì)。結(jié)果與結(jié)論:不同輸入法的言語錯(cuò)誤類型不盡相同,根據(jù)文字材料中錯(cuò)別字詞的類型與特征,可以推斷打字者所用的漢字輸入法,這對(duì)某些案件的偵查具有縮小范圍的作用。

關(guān)鍵詞:文件檢驗(yàn);匿名信;輸入法;特點(diǎn)

打印形成的匿名信給檢驗(yàn)鑒定工作帶來了諸多麻煩,一是這類信沒有手寫字跡,造成排查嫌疑人困難;二是國內(nèi)打印機(jī)具、打印材料及文字字庫都比較單一,造成確定打印來源困難,這都給案件的辦理增加了難度。但從另一個(gè)角度看,凡是打印的文件,就不得不涉及漢字輸入法。我國的漢字輸入法相比其他國家而言種類要多,大致可以分為三大類:五筆類、拼音類、手寫類。不同的人,對(duì)這三類輸入法的掌握及使用情況有所不同,匿名信制作者也不例外。這就為我們推斷匿名信制作者使用的輸入法提供了可能。

一、判定漢字輸入法的偵查學(xué)價(jià)值

對(duì)于某些打印類匿名信案件,如果能判定出該信制作者所用的漢字輸入法,那么對(duì)整個(gè)案件的偵查來說有其特殊的價(jià)值。這種價(jià)值主要表現(xiàn)在兩方面:

(一)可以推斷匿名信制作者的漢字錄入習(xí)慣,從而縮小偵查范圍

個(gè)人使用漢字輸入法具有很強(qiáng)的穩(wěn)定性,也就是說某個(gè)人習(xí)慣使用一種輸入法之后,在很長的一段時(shí)間內(nèi)都會(huì)選擇這種輸入法,從而形成既定的習(xí)慣。[1]對(duì)于某些具體案件而言,在嫌疑對(duì)象較多的情況下,如果能夠根據(jù)信文中的言語特征判定出匿名信作者的漢字錄入習(xí)慣,那么就可以起到縮小偵查范圍的作用。如東北某縣一散布虛假恐怖信息案,犯罪嫌疑人制作了多封匿名信郵寄往學(xué)校、政府機(jī)關(guān),造成不良影響。警方經(jīng)過對(duì)信紙、信封、信文打印痕跡進(jìn)行分析,初步判定該系列匿名信出自該縣教育局人事股。但人事股有七、八個(gè)人,難以確定具體是何人作案,于是將匿名信送檢至我部門。在檢驗(yàn)過程中,我們發(fā)現(xiàn)信文有幾處錯(cuò)別字比較扎眼:“響應(yīng)號(hào)召”打成了“響應(yīng)號(hào)如”,“聯(lián)合簽名”打成了“聯(lián)合答名”。這應(yīng)該是五筆輸入法輸錯(cuò)字根所致,因?yàn)椤罢佟焙汀叭纭钡淖指謩e是“VKF”“VKG”,“簽”和“答”的五筆字根分別是“TWGI”“TWG”,它們的字根都非常接近,據(jù)此判定匿名信制作者使用的是五筆字型輸入法。經(jīng)警方進(jìn)一步調(diào)查,平時(shí)人事股只有曲某一人有五筆打字習(xí)慣。事后,曲某對(duì)匿名信事件供認(rèn)不諱,交代了作案的動(dòng)機(jī)和過程。

(二)有助于推斷匿名信制作者的年齡及文化水平,為案件偵查提供線索

有些漢字輸入法跟文化水平以及年齡有較大的關(guān)系,如文化水平中上者一般對(duì)拼音輸入法較為熟悉,而年齡較大或者文化水平較低的人,一般習(xí)慣使用手寫輸入法。前幾年,山西一鐵路公安部門聯(lián)系到筆者,表示他們一部門領(lǐng)導(dǎo)連續(xù)兩年收到匿名恐嚇信,給其身心帶來很大影響。盡管多次進(jìn)行了排查,但由于恐嚇信系打印形成,沒有發(fā)現(xiàn)特殊線索。于是希望我們能對(duì)匿名信做進(jìn)一步分析,協(xié)助調(diào)查。我們對(duì)檢材進(jìn)行分析后發(fā)現(xiàn),信文中出現(xiàn)了較多的錯(cuò)別字,量化統(tǒng)計(jì)后發(fā)現(xiàn)這些錯(cuò)別字多為筆畫多的復(fù)雜字形,如“道德敗壞”寫成“道徝敗壞”,“世事繁雜”寫成“世事擎雜”等。我們對(duì)這些字進(jìn)行了反復(fù)的錄入實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明無論是拼音還是五筆均不可能出現(xiàn)上述錯(cuò)別字,只有手寫輸入法會(huì)造成這種識(shí)別錯(cuò)誤(下文將論述)。據(jù)此我們推斷匿名信制作者使用了手寫輸入法,同時(shí)結(jié)合信文內(nèi)容多涉及內(nèi)部事情以及多處言語表達(dá)錯(cuò)誤等情況,進(jìn)一步推斷匿名信作者應(yīng)該是一名文化水平不高的老年人。建議以此為線索,重點(diǎn)排查內(nèi)部文化水平不高但已退休的人員。不久嫌疑人聶某浮出水面,該嫌疑人年齡65歲,兩年前退休,因?qū)ν诵莺蟮拇鰡栴}不滿,于是想出了恐嚇領(lǐng)導(dǎo)的辦法以發(fā)泄情緒。

綜上所述,判定打印類匿名信所用的漢字輸入法,可以用來推斷匿名信制作者的文字錄入習(xí)慣以及年齡甚至文化水平,進(jìn)而為案件的偵查偵破工作起到縮小偵查范圍、提供偵查線索的作用。

二、各種漢字輸入法的判定

為什么根據(jù)言語特征就能夠推斷作者所用的漢字輸入法呢,原理又是怎樣的?這是因?yàn)榻裉斓碾娔X普遍使用拼音輸入法、五筆字型輸入法、手寫輸入法等。匿名信制作者在運(yùn)用這些輸入法輸入漢字的過程中,難免會(huì)造成一些言語錯(cuò)誤,如錯(cuò)別字、錯(cuò)誤詞語、標(biāo)點(diǎn)等。輸入法不同,造成的言語錯(cuò)誤類型也會(huì)有所不同,比如五筆輸入法造成形近別字,拼音輸入法容易造成音近別字等。這些言語錯(cuò)誤,可作為判定匿名信作者使用何種輸入法的基本根據(jù)。

(一)五筆字型輸入法的判定

五筆字型輸入法是一種非常高效的漢字輸入法,它將文字拆分為不同的字根,因此重碼率低,使用者較多。運(yùn)用五筆字形輸入法錄入漢字容易產(chǎn)生的錯(cuò)別字有三類:

一是形近別字。如“進(jìn)入”打成“進(jìn)人”,“休息”打成“體息”,“竅門”打成“竊門”等。這些字都是由于形體過于相近,錄入者一時(shí)不注意輸入識(shí)別碼或者選錯(cuò)詞條造成的。

二是偏旁部首相同的別字。如“信息”打成“停息”,“團(tuán)結(jié)”打成“圖結(jié)”,“營運(yùn)”打成“管運(yùn)”等。這類錯(cuò)別字的形體差別較大,但因偏旁部首相同,而且結(jié)構(gòu)相近,運(yùn)用五筆輸入法錄入時(shí)容易輸錯(cuò)字根從而造成錯(cuò)別字。

三是字根部件相似的別字。如“學(xué)生”打成“沉重”,這是因?yàn)椤皩W(xué)”與“沉”都有三點(diǎn)和“冖”的字根部件,只是位置不同。此外,“生”與“重”在字根部件上也有很大的相似性。運(yùn)用五筆輸入法錄入“學(xué)生”“沉重”這兩個(gè)詞語時(shí)輸入的字根都是“IPTG”,稍不注意就會(huì)造成錯(cuò)詞。

判定匿名信作者使用的輸入法是否為五筆輸入法,主要看信文中的錯(cuò)別字(或打錯(cuò)的詞語)是否屬于上述三類。尤其是第三類,價(jià)值非常高。此外,五筆輸入法打錯(cuò)的字或詞,很容易導(dǎo)致整個(gè)句子不通順,如“這件事我不想讓它變得熱搞(鬧)”“一把手大變樣,沉(學(xué))習(xí)作風(fēng)大變樣”“如(召)集上訪群眾”。因此,在檢驗(yàn)分析匿名信時(shí),凡是碰到這種情況,首先應(yīng)該考慮該字是否由五筆輸入法錄入,同時(shí)要注意結(jié)合五筆字根的特點(diǎn)予以辨別,不能當(dāng)成普通的錯(cuò)別字來看待。必要的時(shí)候,應(yīng)該在電腦上用五筆輸入法自己試驗(yàn)幾次,檢驗(yàn)一下錯(cuò)別字是不是因?yàn)樗c本字在字根上趨同造成的。

(二)拼音輸入法的判定

拼音輸入法是普及面最廣、種類最全的一種輸入法。使用拼音輸入法打字,容易產(chǎn)生的言語錯(cuò)誤主要有兩類:第一類是單個(gè)的同音別字或音近別字,如“不許報(bào)景(警),否則撕票”“感(趕)緊去辦”“只做弟(第)一次”;第二類是音同或音近的詞語,如“在這樣的北京(背景)下”“一把火把涼褲(糧庫)燒了”“這件事情不是敬茶(警察)能管得了的”,拼音輸入法中的整詞輸入功能很容易產(chǎn)生這類錯(cuò)詞現(xiàn)象。

從判定拼音輸入法的價(jià)值看,上述言語錯(cuò)誤中的第二類的使用價(jià)值相對(duì)更高。通常而言,信文中只要出現(xiàn)了一個(gè)音同或音近的詞語,基本上就可以判定該信文系拼音輸入法錄入而成。因?yàn)槠渌斎敕?如五筆、手寫、鄭碼)一般是不會(huì)產(chǎn)生音同或音近詞語的。

需要注意的是,拼音輸入法也是使用人口最多的一種漢字輸入法。我們?cè)?jīng)對(duì)37封打印匿名信的文字錯(cuò)誤類型做過統(tǒng)計(jì)分析,[2]在265個(gè)錯(cuò)別字中,多數(shù)錯(cuò)別字是由同音輸入造成。統(tǒng)計(jì)情況如下表:

從上表可以看出,音近別字是形近別字的7倍。這實(shí)際上反映出制作打印類匿名信的人多采用拼音輸入法。這種情況與當(dāng)前社會(huì)上普遍使用拼音輸入法的現(xiàn)狀完全相符。從言語識(shí)別的角度看,如果確定了匿名信的制作者使用的是拼音輸入法,這客觀上也反映出言語人接受過漢語拼音教育,因此對(duì)推斷言語人的文化水平甚至年齡都有參考作用。

(三)手寫輸入法的判定

手寫輸入法是近年來產(chǎn)生的一種文字輸入法,廣泛應(yīng)用于計(jì)算機(jī)和手機(jī)等設(shè)備。有些打印類匿名信制作者由于不懂五筆和拼音(從使用手寫輸入法的社會(huì)群體看,主要是年紀(jì)較大的及文化水平較低的群體),因此在制作匿名信時(shí)常常選擇手寫輸入法打字,手寫的工具主要是鼠標(biāo)或手寫筆。

手寫輸入法需要電腦進(jìn)行圖形識(shí)別,然后形成文字。[3]由于手寫體與印刷體存在較大的差異,這無形中提高了電腦識(shí)別的錯(cuò)誤率,因此運(yùn)用手寫輸入法錄入而成的文檔容易出現(xiàn)形近別字,如“看-著”“快-塊”“徘-排”。我們統(tǒng)計(jì)發(fā)現(xiàn),字形越復(fù)雜,手寫輸入法識(shí)別的錯(cuò)誤率就越高,比如“蕭-瀟”“鼓-豉”“襄-囊”“纂-篆”。除文字外,手寫輸入法打成的文檔常常出現(xiàn)標(biāo)點(diǎn)符號(hào)使用錯(cuò)誤,例如將“,”“、”識(shí)別成一類符號(hào)從而造成混用、誤用。甚至將標(biāo)點(diǎn)符號(hào)識(shí)別成英文字母或數(shù)字,如將句號(hào)“?!弊R(shí)別成“O”,將感嘆號(hào)“!”識(shí)別成“l(fā)”“1”“L”等。這些言語特征可作為判定言語人使用的輸入法是否為手寫輸入法的基本依據(jù)。

三、判定漢字輸入法需要注音的問題

(一)注重言語特征的數(shù)量

有些打印形成的匿名信,信文中可能只有一個(gè)形近別字或一個(gè)同音字,這是孤證現(xiàn)象,不足以判定匿名信作者使用的就是五筆輸入法或拼音輸入法。因?yàn)閱蝹€(gè)錯(cuò)別字的出現(xiàn)具有很大的偶然性,盡管不排除單個(gè)錯(cuò)別字具有判定輸入法的價(jià)值,但分析時(shí)應(yīng)該看文中的形近別字或同音字?jǐn)?shù)量是否較多,錯(cuò)別字出現(xiàn)的頻率是否較高。原則上來說,應(yīng)該在兩個(gè)以上方能作為判斷的依據(jù),而且不能是重復(fù)的錯(cuò)別字??傊挥凶⒅靥卣鞯臄?shù)量,才能保證推斷結(jié)果的質(zhì)量。

(二)注意甄別形近別字

如前所述,使用五筆字型輸入法或手寫輸入法打字都可能產(chǎn)生形近別字。實(shí)際上拼音輸入法打字偶爾也會(huì)出現(xiàn)形近別字,這是因?yàn)樵S多字不但字音相近而且形體也相近,如“請(qǐng)”“晴”“情”“青”。但拼音輸入法產(chǎn)生的形近別字與五筆字型輸入法、手寫輸入法產(chǎn)生的形近別字是有差別的:五筆字型輸入法產(chǎn)生的形近別字一般語音上沒聯(lián)系,只是形體上相似,如“體”“休”、“營”“管”、“秦”“奏”;手寫輸入法產(chǎn)生的形近別字多是筆畫多且結(jié)構(gòu)復(fù)雜的字(電腦識(shí)別復(fù)雜筆畫和結(jié)構(gòu)常常出現(xiàn)誤差);而拼音輸入法產(chǎn)生的形近別字不但形體相似而且語音也相似。因此要注意結(jié)合輸入法的基本特性甄別形近別字,不能一刀切。

(三)注意區(qū)別對(duì)待方音別字

匿名信中的有些錯(cuò)別字實(shí)際上屬于方音別字,這與輸入法不一定存在聯(lián)系。比如我們?cè)?jīng)檢驗(yàn)過的一封發(fā)生在東北地區(qū)的匿名信,其中有這樣幾句話“找領(lǐng)導(dǎo)辦事不好死”、“不只道還會(huì)不會(huì)燒”。句中的“不好死”應(yīng)該是“不好使”,“不只道”應(yīng)該是“不知道”,這與東北官話語音特征相符。許多匿名信都會(huì)出現(xiàn)這類方音別字,這是受言語人文化水平、方言背景等因素綜合制約的結(jié)果。一般而言,根據(jù)前后文語義關(guān)系就能判斷某個(gè)字是否屬于方音現(xiàn)象。因此,在判定言語人使用何種輸入法時(shí),不宜將這類方音別字納入考察的范疇。

(四)注意結(jié)合言語識(shí)別方法進(jìn)行綜合識(shí)別

對(duì)打印類匿名信進(jìn)行檢驗(yàn),我們認(rèn)為一個(gè)必不可少的內(nèi)容就是從言語識(shí)別的角度對(duì)言語人進(jìn)行人身分析,其具體內(nèi)容包括分析言語人的性別、年齡、文化水平、職業(yè)、地區(qū)籍貫等,這也是檢驗(yàn)?zāi)涿诺囊话闼悸贰4]在根據(jù)語言文字特征推斷匿名信制作者使用的輸入法時(shí),要注意同言語識(shí)別方法相結(jié)合,相互印證。例如低文化水平的人多使用手寫輸入法,反過來說,使用手寫輸入法的人多為文化水平相對(duì)較低的群體。如是,“文化水平低”與“使用手寫輸入法”可以起到相互印證結(jié)果的作用。

四、討論

本文所探討的判定匿名信漢字輸入法的方法和依據(jù),對(duì)判定某些涉案的QQ訊息和網(wǎng)絡(luò)帖子也有參考作用,因?yàn)樗鼈冊(cè)诤芏嗲闆r下都需通過電腦錄入,都會(huì)使用到漢字輸入法。當(dāng)然,也有一些涉案的QQ信息、短信、微信不一定是用電腦編輯文字,比如還可通過手機(jī)、平板等設(shè)備輸入,但在判定的方法和依據(jù)上仍有很大的相通性。因?yàn)椴徽撌鞘謾C(jī)還是平板電腦,都有拼音輸入法、筆畫輸入法、手寫輸入法,在使用這些輸入法編輯文字時(shí),難免會(huì)產(chǎn)生錯(cuò)別字,這些錯(cuò)別字不外乎音近別字、形近別字兩大類。因此,同樣可以借鑒本文提到的方法和依據(jù)來辨別言語人采用的是何種輸入法,從而為排查、鎖定嫌疑對(duì)象提供線索。

【參考文獻(xiàn)】

[1]李寧.漢字輸入法對(duì)漢字輸入技能水平的影響[J].心理研究,2010(5).

[2]歐陽國亮.論統(tǒng)計(jì)法在案件書面言語風(fēng)格鑒定中的運(yùn)用[J].政法學(xué)刊,2012(6).

[3]鄧俊.基于計(jì)算機(jī)視覺的手寫輸入法研究[D].鎮(zhèn)江:江蘇科技大學(xué),2010.

[4]岳俊發(fā).言語識(shí)別與鑒定[M].北京:中國人民公安大學(xué)出版社,2007.

(責(zé)任編輯:王戰(zhàn)軍)

2015年7月第23卷 第3期 山西警官高等??茖W(xué)校學(xué)報(bào)JournalofShanxiPoliceAcademy Jul.,2015 Vol.23 No.3

中圖分類號(hào):D918.92

文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1671-685X(2015)03-0074-03

收稿日期:2015-04-07

作者簡介:李永哲(1990-),男,山東淄博人,中國人民公安大學(xué)2013級(jí)碩士研究生,研究方向?yàn)閭刹閷W(xué)。

Judgment of Chinese Character Input Method Used in Printed Anonymous Letter

OU YANG Guo-liang1, HE Lin2,

(1.DepartmentofDocumentInspectionTechnique,ChinaCriminalPoliceUniversity,Shenyang110035,China;

2.YongxingCountyPublicSecurityBureauChenzhouHunan,Chenzhou423300,China)

Abstract:The exploration on verbal mistake types resulted from different input method and the following of rule provide foundation for judging the input method used in printed anonymous letter Verbal mistake types caused by spelling input method, five-stroke input method and hand-writing input method were analyzed and had been made classification statistics. The verbal mistake types caused by different input method are different. The Chinese character input method used by typist could be judged according to the type and features of wrong characters, which could help to narrow investigation scope.

Key words:document inspection; anonymous letter; input method; feature

【刑事偵查與技術(shù)】

猜你喜歡
匿名信輸入法特點(diǎn)
要命的輸入法
妙答
找回微軟拼音輸入法設(shè)置
輸入法順序聽我使喚
百度被訴侵犯商標(biāo)權(quán)和不正當(dāng)競爭
微信輔助對(duì)外漢語口語教學(xué)研究
從語用學(xué)角度看英語口語交際活動(dòng)的特點(diǎn)
匿名信
匿名信
妙答