□ 秋黎鳳 白 雪
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,“抄襲”已經(jīng)變得十分簡(jiǎn)單,只需要百度一下,輕擊鼠標(biāo),復(fù)制、粘貼就好,為編輯的審稿工作帶來(lái)很大不便,稍有不慎,就會(huì)有漏網(wǎng)之魚。有人戲稱,這對(duì)編輯的身心都是巨大的考驗(yàn)。毫無(wú)疑問(wèn),學(xué)術(shù)不端檢測(cè)系統(tǒng)的出現(xiàn),這給編輯工作節(jié)省了大量的時(shí)間,轉(zhuǎn)變了在浩瀚“網(wǎng)?!币躁P(guān)鍵詞搜索的盲目性,大大提高了工作效率,使稿件能盡快進(jìn)入下一個(gè)流程。
自中國(guó)知網(wǎng)學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)正式發(fā)布以來(lái),已迅速在6000多家教育、科研、出版及相關(guān)管理機(jī)構(gòu)中廣泛使用,在防治學(xué)術(shù)不端行為的工作中發(fā)揮了重要作用。繼而,萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)也推出了論文相似性檢測(cè)服務(wù),為編輯提供了更多的便利。
為了敘述方便,本文統(tǒng)稱此類系統(tǒng)為學(xué)術(shù)不端檢測(cè)系統(tǒng)。筆者使用該系統(tǒng)3年多來(lái),深切感到該系統(tǒng)簡(jiǎn)潔方便、操作性強(qiáng)的優(yōu)勢(shì),但也發(fā)現(xiàn)其使用中存在一定的盲區(qū),下面舉例簡(jiǎn)述。
筆者將因技術(shù)手段的局限而產(chǎn)生的盲區(qū)稱為技術(shù)盲區(qū),通過(guò)下面幾個(gè)實(shí)驗(yàn)說(shuō)明。
將3篇已在期刊上發(fā)表過(guò)的文章A、B、C,分別在甲檢測(cè)系統(tǒng)檢測(cè)相似度,結(jié)果為79.1%、86.2%,97.8%。若將此3篇文章分別轉(zhuǎn)為圖片格式,內(nèi)容不變,系統(tǒng)則顯示:“內(nèi)容過(guò)短,無(wú)法檢測(cè)”。
同樣,將此3篇文章在乙檢測(cè)系統(tǒng)檢測(cè),結(jié)果分別為81.5%、93.48%、84.38%。轉(zhuǎn)成圖片格式后,無(wú)法粘貼至檢測(cè)界面,故而無(wú)法檢測(cè)。
若將圖片后面粘貼同樣數(shù)量的文字,則可以檢測(cè),打開詳情報(bào)告,可以看出,在檢測(cè)區(qū)域,只顯示出文字,而不見圖片——甲、乙兩個(gè)檢測(cè)系統(tǒng)情況相同。
將A、B、C 3篇文章中的表格提取出來(lái),單另做一Word文件,分別在甲乙兩個(gè)系統(tǒng)檢測(cè),檢測(cè)結(jié)果均為0。
找3篇已經(jīng)優(yōu)先數(shù)字出版但是還未在期刊上刊發(fā)的文章D、E、F,在甲系統(tǒng)檢測(cè)結(jié)果分別為0、6.7%、0;在乙系統(tǒng)檢測(cè)結(jié)果分別為4%、4.55%、0。
(1)將如下一段話G粘貼在Word文件中,為了防止因文章過(guò)短而無(wú)法檢測(cè),將此段話復(fù)制3遍,進(jìn)行檢測(cè)。檢測(cè)結(jié)果:甲系統(tǒng)為89.7%,乙系統(tǒng)為87.5%。
隔距塊的作用原理是:上銷中上羅拉和下羅拉、長(zhǎng)短膠圈和彈性上銷組成了彈性鉗口,在這個(gè)作用過(guò)程中羅拉組成的固定鉗口和膠圈組成的彈性鉗口,前者主要是握持纖維,彈性鉗口主要是為輸出纖維。固定鉗口至鉗口前緣中心距33mm,距下羅拉中心距31mm,控制區(qū)要求強(qiáng)控制,輸出區(qū)要求穩(wěn)定保證快速纖維的變速運(yùn)動(dòng),隔距塊在其中調(diào)節(jié)隔距達(dá)到穩(wěn)定和順利抽出的作用。
(2)將此段話的前后順序調(diào)整如下(忽略句子的邏輯順序及句意),內(nèi)容不變,同樣復(fù)制3次,甲乙系統(tǒng)的檢測(cè)結(jié)果分別為40%、87.5%。
控制區(qū)要求強(qiáng)控制,輸出區(qū)要求穩(wěn)定保證快速纖維的變速運(yùn)動(dòng),隔距塊在其中調(diào)節(jié)隔距達(dá)到穩(wěn)定和順利抽出的作用。固定鉗口至鉗口前緣中心距33mm,距下羅拉中心距31mm。隔距塊的作用原理是:在這個(gè)作用過(guò)程中羅拉組成的固定鉗口和膠圈組成的彈性鉗口,上銷中上羅拉和下羅拉、長(zhǎng)短膠圈和彈性上銷組成了彈性鉗口,前者主要是握持纖維,彈性鉗口主要是為輸出纖維。
(3)將此段話的順序不變,分別將每句話的結(jié)構(gòu)略微調(diào)整,長(zhǎng)句變短句,短句變長(zhǎng)句,加連接詞、標(biāo)點(diǎn)符號(hào)等等,如下所示,檢測(cè)結(jié)果變化極大,甲乙兩系統(tǒng)均為0。
上銷中上羅拉分別與下羅拉、長(zhǎng)短膠圈及彈性上銷一起,組成了彈性鉗口,在此作用過(guò)程中,羅拉組成的固定鉗口主要是握持纖維,膠圈組成的彈性鉗口主要是為輸出纖維。固定鉗口距離鉗口前緣中心為33mm,與下羅拉中心距為31mm,控制區(qū)要求強(qiáng)控制,相反,輸出區(qū)要求穩(wěn)定,并需要保證快速纖維的變速運(yùn)動(dòng),隔距塊的作用,就是調(diào)節(jié)隔距、穩(wěn)定并順利地抽出——這就是隔距塊的作用原理。
以上各實(shí)驗(yàn),總結(jié)如表1。
表1:甲乙系統(tǒng)檢測(cè)不同形式文章結(jié)果對(duì)比
實(shí)驗(yàn)結(jié)果可以看出:
(1)檢測(cè)系統(tǒng)對(duì)圖片無(wú)法檢測(cè)。在實(shí)驗(yàn)一中,文字的相似度很高,但是一旦轉(zhuǎn)換為圖片,就檢測(cè)不出;粘貼部分文字后,僅能檢測(cè)文字部分的相似度。
(2)檢測(cè)系統(tǒng)對(duì)表格無(wú)法檢測(cè)。在實(shí)驗(yàn)二中,兩個(gè)系統(tǒng)對(duì)表格的檢測(cè)雖然不至于像圖片一樣無(wú)法識(shí)別,但是檢測(cè)結(jié)果卻為0。事實(shí)上,檢測(cè)表格是從已發(fā)表的文章中提取出來(lái)的,相似度應(yīng)該很高才對(duì)。
(3)檢測(cè)系統(tǒng)對(duì)已經(jīng)優(yōu)先數(shù)字出版但未在紙質(zhì)期刊發(fā)表的文章檢測(cè)結(jié)果不可信。猶記知網(wǎng)推出優(yōu)先數(shù)字出版時(shí)曾說(shuō)過(guò),在此優(yōu)先數(shù)字出版系統(tǒng)上發(fā)表的文章,為“正式發(fā)表”,最有說(shuō)服力的是,“評(píng)職稱時(shí)也是認(rèn)可的”(優(yōu)先數(shù)字出版培訓(xùn)時(shí),培訓(xùn)老師語(yǔ))。但是很顯然,檢測(cè)系統(tǒng)未將此類文章納入檢測(cè)范圍。
(4)調(diào)整句序、改變句子結(jié)構(gòu)對(duì)檢測(cè)結(jié)果均有影響,尤以后者為甚。實(shí)驗(yàn)四中,調(diào)整句序,檢測(cè)結(jié)果改變;改變句子結(jié)構(gòu),雖然句意完全沒(méi)有改變,但是檢測(cè)結(jié)果卻一下由接近90%變?yōu)?。
(5)不同檢測(cè)系統(tǒng)的檢測(cè)結(jié)果并不完全相同。如上所述,筆者在甲乙兩系統(tǒng)檢測(cè)的文章為同篇文章,然而檢測(cè)結(jié)果卻不完全相同,時(shí)高時(shí)低,相別最大的,是調(diào)整句序后的檢測(cè)結(jié)果,一為40%,一為87.5%,相差一倍多。
時(shí)間盲區(qū),即因?yàn)闀r(shí)間前后差異產(chǎn)生的“盲區(qū)”。
目前,各大數(shù)據(jù)庫(kù)收集期刊文章,基本的方法有兩種:一是等樣書出來(lái),郵寄至數(shù)據(jù)庫(kù)辦公地點(diǎn),由數(shù)據(jù)庫(kù)的工作人員用掃描等技術(shù)手段將期刊內(nèi)容放在庫(kù)中,顯示在互聯(lián)網(wǎng)上;二是雜志社的當(dāng)期刊物定版后,由雜志社的工作人員將本期期刊的電子版發(fā)給數(shù)據(jù)庫(kù)工作人員,再由他們經(jīng)過(guò)處理上傳。無(wú)論哪一種方法,在實(shí)際操作中總會(huì)有一段時(shí)間差,即滯后期,一般為2周到4周,甚至更長(zhǎng)。試想,一篇文章先發(fā)給甲雜志社,決定錄用后,再發(fā)給乙雜志社,而在乙社檢測(cè)該文時(shí),由于此文還未正式刊發(fā),未能進(jìn)入檢測(cè)系統(tǒng),所以檢測(cè)相似度必然很低。而實(shí)際上,如果推遲1~2個(gè)月再進(jìn)行檢測(cè),那么就會(huì)發(fā)現(xiàn)問(wèn)題,只是,這時(shí)再撤稿,已經(jīng)付出的勞動(dòng),又該由誰(shuí)來(lái)買單呢?
這通指那些檢測(cè)出來(lái)相似度很高,但實(shí)際上并未“抄襲”的情況,比如:(1)學(xué)位論文、會(huì)議論文集收錄文章的再次發(fā)表;(2)刊登在低級(jí)別刊物上的論文在高級(jí)別刊物上的再次發(fā)表;(3)基本原理、基本理論的直接引用;(4)由舊方法、舊理論得出的新結(jié)論、新觀點(diǎn);等等。
此中,前2種情況,筆者認(rèn)為,都不算真正意義上的公開發(fā)表,只能算作“內(nèi)部交流”,但數(shù)據(jù)庫(kù)在查重時(shí),也將其納入檢索范圍,所以相似度很高。后2種情況,直接引用基本原理和理論,查重時(shí)相似度必然很高,而建立在舊方法、舊理論的基礎(chǔ)上,得出的新觀點(diǎn)、新結(jié)論,相似度也不會(huì)低,有可能大部分都是一樣的,但恰是那一小部分是創(chuàng)新,并且是十分重要的,如果僅從系統(tǒng)得出的檢測(cè)結(jié)果來(lái)判別其為“抄襲之作”,也許就此錯(cuò)過(guò)一篇佳作。
學(xué)術(shù)不端檢測(cè)系統(tǒng)畢竟不是“人腦”,在提供方便的同時(shí)也會(huì)存在一些盲區(qū),所以,它只是提供一種數(shù)據(jù)參考,是一種輔助手段,并非“一錘定音”。真正給一篇文章下定論的還是編輯,這就要求編輯在檢測(cè)、審理來(lái)稿時(shí),一定要認(rèn)真負(fù)責(zé),仔細(xì)閱讀檢測(cè)報(bào)告,詳細(xì)比對(duì)標(biāo)紅的“疑似”區(qū)域,區(qū)別對(duì)待,盡量減少漏網(wǎng)之魚,更不能一眚掩德,埋沒(méi)佳作。
[1]李靖波,厲亞.學(xué)術(shù)不端:內(nèi)涵、類別、根源與治理[J].科技與出版,2011(8).
[2]趙國(guó)惠.學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的功能和作用[J].南寧職業(yè)技術(shù)學(xué)院學(xué)報(bào)報(bào),2011(2).
[3]宋雪飛,曲辰.充分利用稿件中的信息點(diǎn) 把好學(xué)術(shù)論文初審關(guān)[J].沈陽(yáng)航空學(xué)院學(xué)報(bào),2006(6).
[4]趙瑞.基于融合交叉技術(shù)的科技論文初審方法[J].編輯學(xué)報(bào),2009(2).
[5]譚華,崔潔.學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的使用建議[J].編輯學(xué)報(bào),2010(2).
[6]李新根,徐用吉.學(xué)術(shù)期刊編輯如何防范學(xué)術(shù)不端行為[J]. 科技與出版,2010(8).
[7]張旻浩,高國(guó)龍,錢俊龍.國(guó)內(nèi)外學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)平臺(tái)的比較研究[J].中國(guó)科技期刊研究,2011(4).
[8]陳玉峰,陸振挺.細(xì)紗機(jī)隔距塊應(yīng)用工藝實(shí)踐[J].紡織器材,2010(4).
[9]張宏,程建霞,王小唯,等.學(xué)術(shù)不端現(xiàn)象分析及期刊編輯應(yīng)對(duì)策略[J].編輯學(xué)報(bào),2010(1).
[10]張小強(qiáng),趙大良.學(xué)位論文再次發(fā)表的版權(quán)與學(xué)術(shù)不端問(wèn)題分析[J].編輯學(xué)報(bào),2011(5).