梅慶玲+郭艷陽(yáng)
摘 ? ?要: 通過(guò)論文相似度檢測(cè)系統(tǒng)檢測(cè)畢業(yè)生的畢業(yè)論文在約束學(xué)生論文抄襲方面達(dá)到了較好的效果,但是不同的論文檢測(cè)系統(tǒng)的對(duì)比庫(kù)不同,對(duì)同一篇論文檢測(cè)的結(jié)果存在差異。這給高校選擇哪種論文檢測(cè)系統(tǒng)作為畢業(yè)生論文查重的標(biāo)準(zhǔn)帶來(lái)了困難。針對(duì)這一問(wèn)題,本文選取若干本屆畢業(yè)生的論文,比較這些論文在維普、大雅論文相似度檢測(cè)系統(tǒng)中檢測(cè)結(jié)果的差異性,并分析產(chǎn)生差異的原因。
關(guān)鍵詞: 畢業(yè)論文 ? ?相似度檢測(cè) ? ?論文檢測(cè)系統(tǒng)
畢業(yè)論文是對(duì)學(xué)生大學(xué)四年在校學(xué)習(xí)、實(shí)踐等專(zhuān)業(yè)知識(shí)學(xué)習(xí)的綜合考核。為了端正學(xué)生畢業(yè)論文的撰寫(xiě)態(tài)度,督促學(xué)生保質(zhì)保量地完成畢業(yè)論文,南京郵電大學(xué)通達(dá)學(xué)院圖書(shū)館(以下簡(jiǎn)稱(chēng)“我館”)開(kāi)通論文相似度檢測(cè)系統(tǒng)對(duì)2016級(jí)畢業(yè)生的論文進(jìn)行相似度檢測(cè)。我館開(kāi)通試用的是大雅論文相似度檢測(cè)系統(tǒng)(以下簡(jiǎn)稱(chēng)“大雅檢測(cè)系統(tǒng)”)和維普論文檢測(cè)系統(tǒng)(大學(xué)生版)(以下簡(jiǎn)稱(chēng)“維普檢測(cè)系統(tǒng)”)。筆者選取40篇畢業(yè)生的論文在維普、大雅論文相似度檢測(cè)系統(tǒng)中進(jìn)行檢測(cè),對(duì)檢測(cè)結(jié)果進(jìn)行了比較分析。
1.論文樣本選擇與比較方法
1.1論文樣本選擇
從參與論文相似度檢測(cè)的同學(xué)中選取40位同學(xué)的論文,其中20篇選取理工科方向的通信工程、計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、微電子工程、信息工程等專(zhuān)業(yè)學(xué)生的畢業(yè)論文,另外20篇選取文科方向的市場(chǎng)營(yíng)銷(xiāo)、物流管理、英語(yǔ)、電子商務(wù)等專(zhuān)業(yè)學(xué)生的畢業(yè)論文。
1.2比較方法
(1)先使用大雅檢測(cè)系統(tǒng)和維普檢測(cè)系統(tǒng)對(duì)選取的40篇畢業(yè)論文進(jìn)行檢測(cè),檢測(cè)結(jié)果按照理工科組和文科組分別記錄;
(2)理工科組和文科組分別記錄大雅檢測(cè)系統(tǒng)、維普檢測(cè)系統(tǒng)檢測(cè)的論文相似度及兩個(gè)檢測(cè)系統(tǒng)檢測(cè)結(jié)果差,結(jié)果差采用大雅檢測(cè)系統(tǒng)檢測(cè)結(jié)果減去維普檢測(cè)系統(tǒng)檢測(cè)結(jié)果;
(3)對(duì)每組的20條結(jié)果差進(jìn)行分析,分別以5條、10條、15條、20條數(shù)組統(tǒng)計(jì)結(jié)果差的平均值;
2.結(jié)果比較
分別對(duì)理工科、文科兩組的檢測(cè)結(jié)果差進(jìn)行比較。
2.1理工科組比較結(jié)果
2.1.1兩個(gè)檢測(cè)系統(tǒng)相似度檢測(cè)結(jié)果比較
通過(guò)大雅、維普檢測(cè)系統(tǒng)檢測(cè)理工科組20篇論文發(fā)現(xiàn),相同論文的檢測(cè)結(jié)果存在差異,使用大雅檢測(cè)結(jié)果減去維普檢測(cè)結(jié)果,相似比差異最高為-30.04%,最低為0.55%,具體結(jié)果如表1、圖1所示。
表1 ?理工科組大雅檢測(cè)系統(tǒng)與維普檢測(cè)系統(tǒng)結(jié)果差
圖1 ? ?理工科組兩個(gè)檢測(cè)系統(tǒng)相似度檢測(cè)結(jié)果比較
2.1.2兩個(gè)檢測(cè)系統(tǒng)相似度結(jié)果差分段比較
對(duì)20條結(jié)果差進(jìn)行分段求和,首先計(jì)算前五條結(jié)果差之和,然后分別計(jì)算前5組、前10組、15組、20組結(jié)果差之和,結(jié)果取絕對(duì)值,保留兩位小數(shù)。具體結(jié)果如表2、圖2所示。
表2 ? 理工科組兩個(gè)檢測(cè)系統(tǒng)相似度檢測(cè)結(jié)果分段誤差
圖2 ? ?理工科組兩個(gè)檢測(cè)系統(tǒng)檢測(cè)結(jié)果分段誤差
2.2文科科組比較結(jié)果
2.2.1兩檢測(cè)系統(tǒng)相似度檢測(cè)結(jié)果比較
通過(guò)大雅、維普檢測(cè)系統(tǒng)檢測(cè)文科組20篇論文發(fā)現(xiàn),相同論文的檢測(cè)結(jié)果存在差異,使用大雅檢測(cè)結(jié)果減去維普檢測(cè)結(jié)果,相似比差異最高為-53.07%,最低為1.68%,具體結(jié)果如表3、圖3所示。
表3 ? ?文科科組大雅檢測(cè)系統(tǒng)與維普檢測(cè)系統(tǒng)誤差率
圖3 ? ?文科組兩個(gè)檢測(cè)系統(tǒng)相似度檢測(cè)結(jié)果比較
2.1.2兩檢測(cè)系統(tǒng)相似度結(jié)果差分段比較
從圖3可以看出文科組論文在兩個(gè)檢測(cè)系統(tǒng)檢測(cè)的結(jié)果誤差較大,對(duì)文科組20條數(shù)據(jù)結(jié)果差分別按照5組、10組、15組、20組記錄進(jìn)行分段求和,不取絕對(duì)值,具體結(jié)果表4所示。
表4 ? ?文科組兩個(gè)檢測(cè)系統(tǒng)相似度檢測(cè)結(jié)果分段平均誤差
2.3結(jié)果分析討論
通過(guò)大雅和維普檢測(cè)系統(tǒng)對(duì)文理科兩組數(shù)據(jù)的比較,可以發(fā)現(xiàn)每一篇論文在不同的檢測(cè)系統(tǒng)的相似度比都有一定差異,只是差異高低不同而已。
2.3.1理工科組比較結(jié)果分析
從表1、圖1可以看出,兩個(gè)檢測(cè)系統(tǒng)結(jié)果差最高為-30.04%,最低為0.55%,同一篇文章大雅檢測(cè)相似度高于維普的9篇,反之維普檢測(cè)相似度高于大雅的11篇。從表2、圖2可以看出,分段求結(jié)果之和,隨著樣本數(shù)的增加,兩個(gè)檢測(cè)系統(tǒng)相似度差異逐漸縮小。說(shuō)明兩個(gè)檢測(cè)系統(tǒng)對(duì)不同論文的檢測(cè)都有相似比高于或低于另外一個(gè)檢測(cè)系統(tǒng)的情況,隨著檢測(cè)樣本數(shù)的增加,兩個(gè)檢測(cè)系統(tǒng)相似度高于或低于對(duì)方的情況趨于對(duì)等。
2.3.2文科組比較結(jié)果分析
從表3、圖3可以看出,文科組兩個(gè)檢測(cè)系統(tǒng)檢測(cè)結(jié)果差最高為-53.07%,最低為1.68%,同一篇文章大雅檢測(cè)相似度高于維普的4篇,反之維普檢測(cè)相似度高于大雅的16篇。在文科組維普檢測(cè)的相似比明顯高于大雅檢測(cè)系統(tǒng)。從表4可以看出,分段求結(jié)果差求和,結(jié)果沒(méi)有取絕對(duì)值,可以看出大雅檢測(cè)系統(tǒng)檢測(cè)的相似比都是低于維普檢測(cè)系統(tǒng)的,隨著樣本數(shù)的增加使得差異更明顯。
3.結(jié)果差異原因
為何兩個(gè)檢測(cè)系統(tǒng)對(duì)同一篇文章的檢測(cè)結(jié)果會(huì)存在這樣的差異呢?我們對(duì)兩個(gè)檢測(cè)系統(tǒng)及差異比較明顯的文章進(jìn)行了分析。
3.1檢測(cè)的資源種類(lèi)與數(shù)量不同
大雅檢測(cè)系統(tǒng)和維普檢測(cè)系統(tǒng)擁有各自的資源對(duì)比數(shù)據(jù)庫(kù),它們的資源對(duì)比數(shù)據(jù)涵蓋的資源種類(lèi)和數(shù)量是有差異的,兩個(gè)檢測(cè)系統(tǒng)資源涵蓋情況詳見(jiàn)表5。
表5 ? ?兩個(gè)檢測(cè)系統(tǒng)對(duì)比庫(kù)資源涵蓋范圍
從表5可以清晰看出大雅檢測(cè)系統(tǒng)和維普檢系統(tǒng)檢測(cè)論文相似度所對(duì)比的數(shù)據(jù)庫(kù)資源的種類(lèi)及數(shù)量。維普檢測(cè)系統(tǒng)在期刊、學(xué)位論文資源方面的數(shù)量是高于大雅檢測(cè)系統(tǒng)的,大雅檢測(cè)系統(tǒng)相比于維普檢測(cè)系統(tǒng)最明顯的優(yōu)勢(shì)是擁有中文圖書(shū)對(duì)比資源。
3.2論文參考的文獻(xiàn)類(lèi)型影響相似比
對(duì)文理科40篇畢業(yè)論文在大雅和維普兩檢測(cè)系統(tǒng)中進(jìn)行檢測(cè),結(jié)果從圖1、圖3可以看出同一篇論文在不同的檢測(cè)系統(tǒng)的相似比都是有或多或少的差異。在表1、表3中我們可以看到同一篇論文檢測(cè),理工科組大雅檢測(cè)的相似比低于維普檢測(cè)的結(jié)果達(dá)到30.04%,相似比高于維普檢測(cè)的結(jié)果為29.75%;文科組大雅檢測(cè)的相似比低于維普檢測(cè)的結(jié)果達(dá)到53.07%,相似比高于維普檢測(cè)的結(jié)果為26.76%;從最高差異來(lái)看,理科組兩個(gè)檢測(cè)系統(tǒng)的結(jié)果差比較接近,文科組大雅檢測(cè)的最高結(jié)果差明顯高于維普檢測(cè)系統(tǒng)。
筆者與論文在兩個(gè)系統(tǒng)檢測(cè)結(jié)果差異較大的學(xué)生就其所參考的文獻(xiàn)類(lèi)型做了簡(jiǎn)單的交流,從與學(xué)生的交流中獲知,在大雅檢測(cè)系統(tǒng)檢測(cè)相似比較高的學(xué)生多數(shù)是偏重參考一些電子圖書(shū)、雜志報(bào)紙等網(wǎng)絡(luò)資源,而在維普檢測(cè)系統(tǒng)檢測(cè)相似比較高的學(xué)生偏重于參考的是CNKI、維普期刊數(shù)據(jù)的期刊、學(xué)位論文等。
從表2、圖2可以得出隨著檢測(cè)樣本數(shù)的增加,理工科組大雅檢測(cè)系統(tǒng)和維普檢測(cè)系統(tǒng)兩者檢測(cè)的相似比結(jié)果差逐漸接近。而文科組隨著檢測(cè)樣本數(shù)的增加,結(jié)果差異更趨于明顯,維普檢測(cè)系統(tǒng)在文科組的檢測(cè)結(jié)果明顯高于大雅檢測(cè)系統(tǒng)。分析文科組的論文,我校文科專(zhuān)業(yè)主要有電子商務(wù)、市場(chǎng)營(yíng)銷(xiāo)、物流管理,學(xué)生的畢業(yè)論文多數(shù)是以實(shí)際的電子商務(wù)平臺(tái)或者營(yíng)銷(xiāo)案例為主,如淘寶、京東、小米手機(jī)營(yíng)銷(xiāo)等,這些方面的寫(xiě)作材料,學(xué)生需要參考一些最新數(shù)據(jù),一般以期刊論文、網(wǎng)絡(luò)資源為主。在文科組的相似度檢測(cè)對(duì)比中,擁有期刊數(shù)量較多的維普檢測(cè)系統(tǒng)的檢測(cè)結(jié)果明顯高于大雅檢測(cè)系統(tǒng)。
4.論文相似度檢測(cè)的困惑
不同的論文檢測(cè)數(shù)據(jù)庫(kù)涵蓋的資源對(duì)比庫(kù)都不同,一些數(shù)據(jù)庫(kù)平臺(tái)會(huì)與電子雜志社簽署獨(dú)家授權(quán)的期刊,獨(dú)家授權(quán)就是通過(guò)合法許可,授權(quán)給被授權(quán)方(合法的數(shù)字出版商)獨(dú)家使用,未經(jīng)期刊與被授權(quán)方同意,他人無(wú)權(quán)使用。這樣就造成國(guó)內(nèi)沒(méi)有一家相似度對(duì)比數(shù)據(jù)是全面的,不存在任何一家論文相似度檢測(cè)系統(tǒng)的檢測(cè)結(jié)果是最權(quán)威的。
目前國(guó)內(nèi)大多數(shù)的論文相似度檢測(cè)數(shù)據(jù)庫(kù)主要有期刊、學(xué)位論文等資源的相似度對(duì)比,而沒(méi)有圖書(shū)資源的對(duì)比。大雅相似度檢測(cè)數(shù)據(jù)庫(kù)就有相似圖書(shū)的檢測(cè),但是對(duì)于學(xué)術(shù)期刊的對(duì)比就不如維普、CNKI全面。那么我們?cè)谧鰧W(xué)術(shù)科研論文、學(xué)生畢業(yè)論文相似度檢測(cè)時(shí),到底需不需要重視與電子圖書(shū)的對(duì)比呢?論文相似度檢測(cè)系統(tǒng)的選擇標(biāo)準(zhǔn)是什么呢?
學(xué)生在畢業(yè)論文檢測(cè)過(guò)程中會(huì)根據(jù)學(xué)校選擇的相似度檢測(cè)系統(tǒng)調(diào)整自己的參考文獻(xiàn)類(lèi)型,學(xué)生可能會(huì)花很多心思了解該檢測(cè)系統(tǒng)的對(duì)比資源庫(kù)的特點(diǎn),想方設(shè)法降低自己論文在該檢測(cè)系統(tǒng)中的相似比,顯然僅通過(guò)某一個(gè)檢測(cè)系統(tǒng)檢測(cè)的相似比判斷是否抄襲是有局限的。
5.結(jié)語(yǔ)
在國(guó)內(nèi)論文相似度檢測(cè)系統(tǒng)眾多,又沒(méi)有統(tǒng)一標(biāo)準(zhǔn)對(duì)比數(shù)據(jù)庫(kù)的情況下,指定任何一個(gè)系統(tǒng)作為標(biāo)準(zhǔn)進(jìn)行論文相似檢測(cè)都無(wú)法真正做到公平公正。高校該選擇何種論文相似度檢測(cè)系統(tǒng)是需要根據(jù)實(shí)際綜合考慮的。理想狀態(tài)是政府科研管理部門(mén)能夠出面籌建資源對(duì)比庫(kù)涵蓋所有數(shù)字資源的相似度檢測(cè)系統(tǒng),統(tǒng)一論文相似度檢測(cè)標(biāo)準(zhǔn)。如果沒(méi)有統(tǒng)一的檢測(cè)數(shù)據(jù)庫(kù),就需要使用不同的檢測(cè)平臺(tái)進(jìn)行檢測(cè),并結(jié)合人工評(píng)價(jià)進(jìn)行綜合評(píng)判,從而才能更好地檢測(cè)畢業(yè)論文的質(zhì)量。
參考文獻(xiàn):
[1]吳均,江潤(rùn)林,張曉琴.利用學(xué)術(shù)不端檢測(cè)系統(tǒng)研究科技論文中存在的問(wèn)題[J].中國(guó)科技期刊研究,2010(05):636-639.
[2]電子雜志社有關(guān)負(fù)責(zé)人就學(xué)術(shù)期刊獨(dú)家授權(quán)相關(guān)問(wèn)題答記者問(wèn).http://www.cnki.net/gycnki/daobao/cnkidaobao33/daobao33_8.htm.
[3]羅瑞,唐璞,舒安琴,石蕓.兩種學(xué)術(shù)不端檢測(cè)系統(tǒng)對(duì)醫(yī)學(xué)論文檢測(cè)結(jié)果的差異性研究[J].天津科技,2014(12):71-73.
[4]趙冬梅.基于已發(fā)表論文的學(xué)術(shù)不端檢測(cè)系統(tǒng)的分析研究[J].河北科技圖苑,2015(06):50-53.
[5]陳燕,丁嵐.學(xué)術(shù)不端檢測(cè)系統(tǒng)缺陷分析[J].中國(guó)出版,2014(16):12-14.
[6]徐仲.兩種學(xué)術(shù)不端檢測(cè)系統(tǒng)的差異性及問(wèn)題討論[J].圖書(shū)館理論與實(shí)踐,2014(08):20-22.
本文相關(guān)研究獲得江蘇省現(xiàn)代教育技術(shù)研究2016年度立項(xiàng)課題(課題編號(hào)2016-R-46827)和揚(yáng)州市社科聯(lián)重點(diǎn)課題《一帶一路戰(zhàn)略下?lián)P州開(kāi)放型經(jīng)濟(jì)發(fā)展研究》資助。