国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電子作業(yè)反抄襲檢查技術(shù)研究

2013-03-05 09:53宋丹茹
電腦知識(shí)與技術(shù) 2012年36期

宋丹茹

摘要:作業(yè)電子化是高校教學(xué)改革的一種必然趨勢(shì),建立一種快速、準(zhǔn)確、高效的電子作業(yè)反抄襲檢查模型能夠在一定程度上遏制學(xué)生間電子作業(yè)相互拷貝,具有十分現(xiàn)實(shí)的意義。該文著重分析了文檔指紋技術(shù),并采用信息隱藏技術(shù)的檢查方法,對(duì)Hash文檔指紋鑒別算法進(jìn)行改進(jìn)設(shè)計(jì)。該方法提高了作業(yè)在反抄襲檢查中的文本內(nèi)容和格式的雙重檢查效率,有效的解決了高校作業(yè)電子化存在的實(shí)際問(wèn)題。

關(guān)鍵詞:電子作業(yè);抄襲檢查;文檔指紋;信息隱藏

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2012)36-8679-02

隨著計(jì)算機(jī)應(yīng)用的普及,高校正在逐步實(shí)現(xiàn)作業(yè)的電子化和網(wǎng)絡(luò)化。這種作業(yè)形式的改革有效減少了教育資源的浪費(fèi),減輕了教師的工作任務(wù),提高了學(xué)生獲得作業(yè)批閱結(jié)果的效率,教與學(xué)得到了互動(dòng)。應(yīng)該說(shuō)作業(yè)的電子化是高校教學(xué)改革的一種必然趨勢(shì),但隨之而來(lái)的是電子作業(yè)抄襲現(xiàn)象嚴(yán)重。學(xué)生抄襲作業(yè)時(shí),少則部分復(fù)制他人文檔,調(diào)整文檔順序,內(nèi)容稍做修改;多則大部分甚至全盤拷貝他人文檔。學(xué)生對(duì)于電子作業(yè)的抄襲輕松快捷又不易被識(shí)別,這就成為作業(yè)改革受到嚴(yán)重困擾的主要因素。

在電子作業(yè)的反抄襲檢查工作上,教師的手工操作既耗時(shí)又費(fèi)力,尤以高校學(xué)生人數(shù)眾多,涉及的教師面而變得局限性很大。那么,建立一種快速、準(zhǔn)確、高校的電子作業(yè)反抄襲檢查模型若能夠有效遏制了學(xué)生間電子作業(yè)相互拷貝,具有十分現(xiàn)實(shí)的意義。目的在于能夠極大地提高教學(xué)的質(zhì)量和效率,并有力的促進(jìn)高校的教育改革。在應(yīng)用領(lǐng)域抄襲檢測(cè)算法已成為當(dāng)前研究的熱點(diǎn)話題,尤其是在學(xué)術(shù)論文的剽竊比對(duì)上。而我們能夠在平時(shí)的教學(xué)工作中有效地抵制電子作業(yè)的抄襲現(xiàn)象,既能真實(shí)反映教學(xué)效果又能提高學(xué)生自主學(xué)習(xí)的意識(shí)和能力。這不僅是對(duì)于教學(xué)工作的促進(jìn)更是培養(yǎng)人教育人的有效途徑。

1 抄襲檢查技術(shù)

計(jì)算機(jī)技術(shù)的發(fā)展和網(wǎng)絡(luò)普遍應(yīng)用,在無(wú)意間方便了很多人進(jìn)行文章抄襲。其實(shí)電子作業(yè)抄襲現(xiàn)象是國(guó)內(nèi)外的大學(xué)廣泛存在的現(xiàn)象,為了有力遏制學(xué)生的這種不誠(chéng)信的行為,國(guó)外早在20世紀(jì)90年代就開始了相應(yīng)研究。由于西方語(yǔ)系的特點(diǎn)英語(yǔ)是以空格作為單詞間隔,因此英語(yǔ)的抄襲檢查方法是通過(guò)比較關(guān)鍵詞來(lái)判斷相似性的,效率很高。而中文與外文間存在著巨大的差異性, 強(qiáng)調(diào)詞法與句法,因此關(guān)鍵詞比對(duì)較不適用于中文。

目前中文的抄襲檢查方法主要有基于字符串的匹配、基于統(tǒng)計(jì)的中文分詞、文檔指紋、句子相似度等。

2 電子作業(yè)反抄襲檢查的實(shí)現(xiàn)

該文主要采用兩種方法以實(shí)現(xiàn)電子作業(yè)的反抄襲檢查:數(shù)字指紋技術(shù)和信息隱藏技術(shù)。首先吸取了文數(shù)字指紋技術(shù)的優(yōu)勢(shì)并對(duì)于指紋技術(shù)的算法(Hash函數(shù))做出改進(jìn)提出一種基于局部詞頻的指紋算法。其次很多高校特有應(yīng)用的實(shí)驗(yàn)實(shí)習(xí)電子作業(yè),此時(shí)內(nèi)容都較為相似,所以該文又增加了基于信息隱藏技術(shù)的作業(yè)反抄襲檢查方法,以對(duì)于這類電子作業(yè)進(jìn)行有效的比對(duì)。

2.1基于局部詞頻的指紋技術(shù)

文檔數(shù)字指紋技術(shù)是依據(jù)生成的待比較的文檔指紋,通過(guò)在樣本庫(kù)中做對(duì)比進(jìn)行抄襲檢測(cè)。當(dāng)相匹配指紋數(shù)目超過(guò)一定值時(shí),可認(rèn)定存在抄襲行為。為使其具有推廣力,一般會(huì)引入松弛因子以提高檢測(cè)的準(zhǔn)確性。指紋生成算法是文檔數(shù)字指紋技術(shù)的關(guān)鍵,一般利用 Hash 函數(shù)對(duì)文檔中的特征標(biāo)記進(jìn)行計(jì)算,獲得整數(shù)值。一般需要計(jì)算函數(shù)。

在高校的電子作業(yè)中很多都僅是對(duì)作業(yè)的句子的長(zhǎng)度或詞語(yǔ)的先后次序作了調(diào)整,內(nèi)容的變化是較小的,用這種方法就會(huì)過(guò)度精確,用于檢查電子作業(yè)效率很低。所以該文對(duì)這種算法做出一定改進(jìn),提出一種基于詞頻統(tǒng)計(jì)的指紋技術(shù)。局部詞頻統(tǒng)計(jì)技術(shù)借助于向量空間模型來(lái)實(shí)現(xiàn)。這種向量空間模型是由句子為單位構(gòu)成的,并對(duì)句子進(jìn)行關(guān)鍵詞提取,并對(duì)關(guān)鍵詞重新排序構(gòu)建,根據(jù)編碼與詞頻共同獲取句子的指紋。依據(jù)句子的指紋獲取文本相似度,具體的算法描述

2.2信息隱藏技術(shù)

在高校學(xué)生作業(yè)有一些是比較特殊的,例如在機(jī)房中完成的實(shí)驗(yàn)實(shí)習(xí)類報(bào)告,這類作業(yè)的特點(diǎn)是內(nèi)容大致是相同的。可以在作業(yè)的源頭采用一些基于信息隱藏的嵌入水印算法。在對(duì)作業(yè)進(jìn)行片段拷貝時(shí)就在源頭嵌入水印,能有效的防止拷貝抄襲的現(xiàn)象發(fā)生。這樣即使電子作業(yè)的內(nèi)容完全相同也能有效的檢查到。不能輕易被破壞。這類作業(yè)防抄襲檢查的水印嵌入既要求字符格式改變不易被擦覺(jué)也要兼顧有較大的信息嵌入量,不需太多的字符就能嵌入進(jìn)機(jī)房的機(jī)器號(hào)及上機(jī)完成作業(yè)的時(shí)間。

由于人眼的視細(xì)胞對(duì)顏色敏感度的理論指出人眼對(duì)綠色最敏感,其次是紅色,而對(duì)于藍(lán)色是最不敏感的。而計(jì)算機(jī)的顏色設(shè)置理論是數(shù)字化的,所以可以對(duì)于RGB()的值中低位的值做秘密信息嵌入。可以對(duì)R值和G值改變都改變最低的1位bit,而對(duì)B值最低的2位bit。這樣就對(duì)每個(gè)電子文檔的字符嵌入了4位bit的信息隱藏,并把這4位二進(jìn)制作為嵌入信息隱藏1Byte的高4位。同時(shí)也可以利用字符下劃線的B值最低2位bit,G值的最低1位bit,和R值的最低1位bit來(lái)隱藏4位信息。這4位bit作為嵌入信息隱藏1Byte的低4位。

在實(shí)際操作中程序所嵌入的信息包括程序讀取的機(jī)器號(hào)及上機(jī)時(shí)間與機(jī)房管理系統(tǒng)數(shù)據(jù)庫(kù)配合能準(zhǔn)確定位學(xué)生的學(xué)號(hào)、姓名、班級(jí)等。當(dāng)學(xué)生完成自己的電子作業(yè)過(guò)程中點(diǎn)擊保存、Word程序自動(dòng)保存、關(guān)閉Word文檔時(shí)都會(huì)觸發(fā)這一嵌入秘密信息的相關(guān)程序的運(yùn)行,可以在全文實(shí)現(xiàn)循環(huán)嵌入秘密信息的作用。該反抄襲程序是在打開作業(yè)文檔時(shí)自動(dòng)運(yùn)行,能自主識(shí)別學(xué)生作業(yè)中具有抄襲嫌疑的片段,協(xié)助教師對(duì)學(xué)生的作業(yè)給出客觀評(píng)價(jià),有效的對(duì)這類作業(yè)的抄襲起到屏蔽的作用。

3 結(jié)束語(yǔ)

在以往的反抄襲檢查中主要是通過(guò)文檔間內(nèi)容重疊程度或者相似程度來(lái)斷定的,相關(guān)的檢查技術(shù)也很多也較成熟。但往往面對(duì)的是海量數(shù)據(jù)或是長(zhǎng)文檔,并需要對(duì)文檔字符做精確檢查。而在教學(xué)過(guò)程中的電子作業(yè)無(wú)論在內(nèi)容、篇幅和數(shù)量方面都有很大差別。

該文的創(chuàng)新點(diǎn)是結(jié)合了基于局部詞頻的指紋技術(shù)和嵌入水印的信息隱藏技術(shù),提出了一處主要針對(duì)高校的作業(yè)特點(diǎn)的反抄襲檢查的模型。較為全面的考慮到了這類作業(yè)不同于學(xué)術(shù)剽竊的相關(guān)問(wèn)題,所建立的這種快速、準(zhǔn)確、高效的電子作業(yè)反抄襲檢查模型能夠在一定程度上遏制學(xué)生間電子作業(yè)相互拷貝,具有十分現(xiàn)實(shí)的意義。

參考文獻(xiàn):

[1] 蔣波.一種基于三重DES和RSA的綜合加密方案[J].微計(jì)算機(jī)信息,2007(18).

[2] 陳國(guó)良.并行算法實(shí)踐[M].北京:高等教育出版社,2004.

[3] 秦玉平,冷強(qiáng)奎,王秀坤,等. 基于局部詞頻指紋的論文抄襲檢測(cè)算法[J].計(jì)算機(jī)工程,2011(6).

[4] 付兵.基于信息隱藏技術(shù)的電子作業(yè)防抄襲研究[J].微計(jì)算機(jī)信息,2009(18).

[5] Glatt.Plagiarism screening program[EB/OL].[2008-04-18].http://www. plagiarism.com/screen.id.htm.

[6] Parsopoulos K E, Vrahatis M. N. On the Computation of All Global Minimizers Through Particle Swarm Optimization[J].IEEE Trans. on Evolutionary Computation,2004.

徐水县| 彭山县| 晋中市| 申扎县| 博罗县| 丹寨县| 横峰县| 吉木萨尔县| 安新县| 阳信县| 玉龙| 罗田县| 朝阳市| 正阳县| 潼南县| 西贡区| 和静县| 军事| 潞城市| 东方市| 浦北县| 毕节市| 民县| 中阳县| 达孜县| 临安市| 隆尧县| 甘谷县| 保靖县| 长汀县| 定西市| 韶山市| 泽普县| 福建省| 重庆市| 敖汉旗| 丹东市| 临泉县| 常山县| 河津市| 咸阳市|