[摘要] 文字復(fù)制比檢測(cè)存在隨意設(shè)置文字復(fù)制的時(shí)間節(jié)點(diǎn),混淆文字的重復(fù)性與學(xué)術(shù)繼承性,忽視檢評(píng)制度性缺失的先天不足,夸大檢測(cè)系統(tǒng)文獻(xiàn)比對(duì)源的萬(wàn)能性,將人工理性讓渡于工具理性等誤區(qū),造成了許多誤檢誤判。為了提高檢測(cè)的科學(xué)性和公正性,必須樹(shù)立高度負(fù)責(zé)的精神,采取科學(xué)嚴(yán)謹(jǐn)?shù)姆椒◤浹a(bǔ)缺陷,克服弊端,推進(jìn)學(xué)術(shù)事業(yè)的健康發(fā)展。
[關(guān)鍵詞] 學(xué)術(shù)不端;文字復(fù)制比檢測(cè);誤區(qū);防范
[作者單位]丁明剛,安徽巢湖學(xué)院。
[基金項(xiàng)目]教育部人文社會(huì)科學(xué)研究專(zhuān)項(xiàng)任務(wù)資助項(xiàng)目(科研誠(chéng)信和學(xué)風(fēng)建設(shè))“以質(zhì)量為導(dǎo)向的科研評(píng)價(jià)方法研究”(項(xiàng)目批準(zhǔn)號(hào):13JDXF005)的階段性成果。
文字復(fù)制比檢測(cè)是學(xué)術(shù)不端檢測(cè)的主要指標(biāo)之一,在出版、科研、職稱(chēng)晉升、業(yè)績(jī)?cè)u(píng)定等領(lǐng)域有著廣泛的應(yīng)用,對(duì)規(guī)范學(xué)術(shù)行為、懲治學(xué)術(shù)腐敗、推動(dòng)學(xué)術(shù)進(jìn)步發(fā)揮著重要的作用。這種由檢測(cè)系統(tǒng)與人工判定相結(jié)合的學(xué)術(shù)評(píng)判行為,由于檢測(cè)系統(tǒng)的局限和人為的偏誤等缺陷,在文字復(fù)制時(shí)間節(jié)點(diǎn)的設(shè)置、文字重復(fù)性與學(xué)術(shù)繼承性的界定、檢評(píng)制度的貫徹落實(shí)、檢測(cè)系統(tǒng)文獻(xiàn)比對(duì)源的使用、人工理性與工具理性的博弈等方面存在一定的誤區(qū),因此其產(chǎn)生的負(fù)面效應(yīng)不容忽視。
一、文字復(fù)制比檢測(cè)的誤區(qū)
1.隨意設(shè)置文字復(fù)制的時(shí)間節(jié)點(diǎn)
學(xué)術(shù)成果的撰著發(fā)生于一定的時(shí)間維度內(nèi),其文字復(fù)制的時(shí)間與之契合,文字復(fù)制比檢測(cè)時(shí)必須合理確定文字復(fù)制的時(shí)間節(jié)點(diǎn)。現(xiàn)有檢測(cè)失誤中,對(duì)時(shí)間節(jié)點(diǎn)確定不當(dāng)是主要原因之一。部分檢測(cè)者隨意給出文字復(fù)制的時(shí)間節(jié)點(diǎn),使之在不經(jīng)意中成為被檢測(cè)學(xué)術(shù)成果文字復(fù)制的時(shí)間終點(diǎn),導(dǎo)致“部分文字復(fù)制由檢測(cè)者而產(chǎn)生或消除”的荒謬結(jié)果,使得“文字復(fù)制比” 高于或低于實(shí)際情況。
這種情況具體表現(xiàn)在以下幾個(gè)方面:其一,無(wú)視學(xué)術(shù)成果生成與發(fā)表的具體時(shí)間,完全以檢測(cè)時(shí)間點(diǎn)來(lái)確定文字復(fù)制的最后期限。這是學(xué)術(shù)不端檢測(cè)的極端現(xiàn)象,要么是對(duì)檢測(cè)規(guī)律的無(wú)知,要么是不負(fù)責(zé)任,其產(chǎn)生的檢測(cè)結(jié)果最為不公。2012年,某省高校職稱(chēng)評(píng)審中推行代表作文字復(fù)制比檢測(cè),由于誤以檢測(cè)時(shí)間點(diǎn)來(lái)確定文字復(fù)制的最后時(shí)間點(diǎn),結(jié)果導(dǎo)致被檢測(cè)論文與發(fā)表在其后的相關(guān)論文產(chǎn)生大量的文字重復(fù)現(xiàn)象。這其中不僅有大量引用或抄襲他人論文內(nèi)容的文章,也包括被檢測(cè)論文本身的自我重復(fù),這顯然違背了文章發(fā)表與被借鑒的時(shí)間邏輯。其二,未經(jīng)科學(xué)推理,大致確定文字復(fù)制的時(shí)間節(jié)點(diǎn)。根據(jù)文章發(fā)表的時(shí)間去確定文字復(fù)制的時(shí)間節(jié)點(diǎn),從而得出檢測(cè)文章的文字復(fù)制比。例如,某篇文章發(fā)表于某刊2010年第3期,7月初出版,檢測(cè)者就將檢測(cè)時(shí)間定到2010年7月某日。這種情況未考慮文章定稿、寄送、審稿、發(fā)表以及印制、發(fā)行等時(shí)間周期與文字復(fù)制的時(shí)間節(jié)點(diǎn)的時(shí)間差,造成了文字復(fù)制時(shí)間節(jié)點(diǎn)的延后和文字復(fù)制率的可能提高。其三,人為將文字復(fù)制的時(shí)間節(jié)點(diǎn)提前至文章生成前。這其實(shí)是文字復(fù)制檢測(cè)的另一種極端現(xiàn)象,目的在于將被檢測(cè)文章的部分重復(fù)文字予以掩蓋,以達(dá)到弄虛作假的目的。這在學(xué)術(shù)腐敗無(wú)孔不入的當(dāng)下并非少見(jiàn)。
2.混淆文字重復(fù)性與學(xué)術(shù)繼承性
學(xué)術(shù)研究是建立在已有成果基礎(chǔ)之上的,對(duì)已有知識(shí)、思想、學(xué)理、方法等的繼承是科研成果的典型特征之一。這表現(xiàn)在學(xué)術(shù)論文中,即其部分文字與已有文獻(xiàn)中文字有不同程度的重復(fù),在文字復(fù)制檢測(cè)中則為文字復(fù)制率。如果不對(duì)重復(fù)文字進(jìn)行人工取舍,那么,檢測(cè)系統(tǒng)就會(huì)將文章繼承性文字判為重復(fù)性文字,無(wú)論其為合理引證而形成的繼承性,還是其為抄襲剽竊而形成的重復(fù)性。這樣在實(shí)際檢測(cè)中通常就會(huì)造成繼承性與重復(fù)性的混淆,要么過(guò)分倚重文字復(fù)制量而將合理的重復(fù)誤判為抄襲剽竊等不端行為,要么將部分抄襲剽竊的文字判為合理的重復(fù)。于是,在有效的檢測(cè)時(shí)間范圍內(nèi),凡是檢測(cè)系統(tǒng)確定的文字重復(fù)即為文字復(fù)制,而文字復(fù)制又常被判為學(xué)術(shù)不端。事實(shí)上,即便是進(jìn)行了初步的人工取舍抑或“專(zhuān)家鑒定”,將檢測(cè)出來(lái)的文字復(fù)制現(xiàn)象籠統(tǒng)判為學(xué)術(shù)不端的情況也是非常普遍的。
3.無(wú)視檢測(cè)制度的先天性缺失
我國(guó)文字復(fù)制比檢測(cè)始于2008 年12 月中國(guó)學(xué)術(shù)期刊(光盤(pán)版)電子雜志社和同方知網(wǎng)公司推出的“學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)”。此前,盡管我國(guó)出臺(tái)過(guò)有相關(guān)的法規(guī)文件對(duì)學(xué)術(shù)行為進(jìn)行規(guī)范與懲治,但其主要基于宏觀層面,以主觀感悟和粗放評(píng)判為主,缺乏科學(xué)性和可操作性。學(xué)術(shù)不端檢測(cè)系統(tǒng)的推行,從技術(shù)層面將學(xué)術(shù)評(píng)判引入了微觀領(lǐng)域,大大提高了學(xué)術(shù)評(píng)判的可操作性、客觀性和公正性。從檢索的現(xiàn)狀與發(fā)展趨勢(shì)看,學(xué)術(shù)不端檢測(cè)已步入由粗淺檢測(cè)到不斷加深完善的發(fā)展階段。盡管如此,這種檢測(cè)的先天性制度缺陷已成歷史事實(shí),不可避免與忽視。從對(duì)已發(fā)表文章的檢測(cè)來(lái)看,可以以2009年為分界點(diǎn),此前發(fā)表的文章文字復(fù)制率明顯高于此后,而從這一年開(kāi)始,已發(fā)表文章的文字復(fù)制率總體上呈逐年下降的趨勢(shì),這種分化在一定程度上是學(xué)術(shù)不端檢測(cè)制度性約束的必然結(jié)果[1]。然而,在實(shí)際檢測(cè)中,我們經(jīng)常會(huì)發(fā)現(xiàn),2009年及以前發(fā)表的文章因文字復(fù)制率較高而受到制裁,作者的“鳴冤叫屈”不能不引起我們的反思。事實(shí)上,這很大程度上是學(xué)術(shù)不端檢測(cè)系統(tǒng)的制度性缺乏造成的,這種制度規(guī)范對(duì)學(xué)術(shù)生態(tài)的規(guī)制、重塑與再生有著無(wú)可替代的引導(dǎo)作用。客觀地說(shuō),因這種制度性缺乏而“產(chǎn)生”出的部分文字重復(fù)是合理的,應(yīng)該允許存在,而非簡(jiǎn)單粗暴地懲處了事。
4.夸大檢測(cè)系統(tǒng)比對(duì)源的萬(wàn)能性
學(xué)術(shù)不端檢測(cè)是將被檢測(cè)論文與檢測(cè)系統(tǒng)采用的文獻(xiàn)進(jìn)行比對(duì)取舍后得出結(jié)論。在檢測(cè)中,不僅各種檢測(cè)系統(tǒng)所采用的比對(duì)源不統(tǒng)一,就是同一檢測(cè)系統(tǒng)不同時(shí)期采用的比對(duì)源往往也不盡相同,因而,即便在檢測(cè)時(shí)間范圍完全一致的情況下,對(duì)同一篇論文檢測(cè)出的結(jié)果也會(huì)不一致。筆者在同一時(shí)段內(nèi)用中國(guó)知網(wǎng)檢測(cè)系統(tǒng)、某省學(xué)術(shù)鑒定信息管理系統(tǒng)、某社會(huì)機(jī)構(gòu)檢測(cè)系統(tǒng)等三種學(xué)術(shù)不端檢測(cè)系統(tǒng)對(duì)發(fā)表于2012年的某篇論文進(jìn)行了文字復(fù)制比檢測(cè),結(jié)果得出的文字復(fù)制率依次為24.8%、12.6%、7.2%。經(jīng)比較發(fā)現(xiàn),這三個(gè)檢測(cè)系統(tǒng)的比對(duì)源數(shù)據(jù)庫(kù)的種類(lèi)及其收錄文獻(xiàn)的數(shù)量存在較大的差異,直接導(dǎo)致了檢測(cè)結(jié)果的不同。
作者對(duì)文獻(xiàn)參考、引證的多樣性與復(fù)雜性,特別是在轉(zhuǎn)引、網(wǎng)絡(luò)引用、非公開(kāi)出版物引用等引證過(guò)程中的不規(guī)范行為,導(dǎo)致被引用或抄襲的文獻(xiàn)內(nèi)容無(wú)法核查,如果檢測(cè)比對(duì)源未收錄這些文獻(xiàn),則會(huì)出現(xiàn)檢測(cè)盲區(qū),造成學(xué)術(shù)不端的漏判。目前,國(guó)內(nèi)檢測(cè)系統(tǒng)的比對(duì)源中就沒(méi)有圖書(shū)、非英文外語(yǔ)語(yǔ)種文獻(xiàn),以及圖畫(huà)、書(shū)法等文獻(xiàn),對(duì)這些文獻(xiàn)的內(nèi)容進(jìn)行抄襲根本無(wú)從檢測(cè)。因此,只有作者引用或抄襲了檢測(cè)系統(tǒng)比對(duì)源中的文獻(xiàn),才能檢測(cè)出結(jié)果。而事實(shí)上,隨著作者引證或抄襲的日趨廣博性和復(fù)雜性,從理論上說(shuō),檢測(cè)系統(tǒng)比對(duì)源永遠(yuǎn)難以與被檢測(cè)論文所復(fù)制的文字完全匹配。這樣,對(duì)檢測(cè)比對(duì)源的完全信賴難免會(huì)導(dǎo)致檢測(cè)結(jié)果偏離客觀事實(shí),犯以偏概全的錯(cuò)誤。
5.對(duì)檢測(cè)系統(tǒng)的工具性盲從
在檢測(cè)時(shí)間恰當(dāng)、文獻(xiàn)比對(duì)源較為匹配的情況下,學(xué)術(shù)不端檢測(cè)系統(tǒng)對(duì)論文文字復(fù)制的檢準(zhǔn)率相對(duì)較高,這往往使得檢測(cè)機(jī)構(gòu)對(duì)檢測(cè)系統(tǒng)由信任、依賴變?yōu)槊??!八械奈淖謴?fù)制由機(jī)器和系統(tǒng)說(shuō)了算”成為部分檢測(cè)人員的習(xí)慣性思維和信條,工具理性代替了科學(xué)理性,由此導(dǎo)致檢測(cè)過(guò)程中許多合理引證被判為抄襲等學(xué)術(shù)不端行為,許多不端現(xiàn)象因系統(tǒng)無(wú)法檢測(cè)而蒙混過(guò)關(guān)。這種因檢測(cè)的不公而導(dǎo)致的學(xué)術(shù)不公情況屢屢發(fā)生[2],影響了學(xué)術(shù)事業(yè)的發(fā)展。
二、文字復(fù)制比檢測(cè)誤區(qū)的消弭
1.盡量以文章寄送時(shí)間來(lái)確定文字復(fù)制的時(shí)間節(jié)點(diǎn)
對(duì)文字復(fù)制時(shí)間節(jié)點(diǎn)的合理界定直接決定文字復(fù)制檢測(cè)的準(zhǔn)確度,這理應(yīng)由作者寄送論文的時(shí)間來(lái)確定。對(duì)于未發(fā)表和已發(fā)表論文的檢測(cè),具體時(shí)間可從以下幾方面確定:第一,對(duì)于未發(fā)表的文章,盡量以寄送時(shí)間點(diǎn)為檢測(cè)點(diǎn)。鑒于電子文稿傳輸?shù)乃矔r(shí)性,雜志社郵箱或編輯系統(tǒng)接受稿件的時(shí)間與作者投寄時(shí)間幾乎一致,此時(shí),該文的“文字復(fù)制”行為已經(jīng)停止,以此時(shí)間點(diǎn)作為該論文文字復(fù)制的最后時(shí)間最為準(zhǔn)確和科學(xué)。雜志社收到論文的電子稿時(shí),應(yīng)該以收件時(shí)間作為文字復(fù)制的最后時(shí)間,即便稿件暫不檢測(cè),也應(yīng)該在文首或文后為其標(biāo)注收稿時(shí)間。同時(shí),對(duì)于寄送的紙質(zhì)稿件,應(yīng)該以郵戳或快遞始發(fā)時(shí)間點(diǎn)作為作者論文文字復(fù)制的時(shí)間終點(diǎn)和文字復(fù)制檢測(cè)的時(shí)間節(jié)點(diǎn)。第二,對(duì)于已發(fā)表論文,如果標(biāo)注了“收稿日期”,電子投稿的可以該時(shí)間作為檢測(cè)時(shí)間點(diǎn),紙質(zhì)投稿的則應(yīng)考慮稿子郵寄或投遞的周期。寄送的周期大致可以確定為:電子投稿1日,快遞1~2日,平信2~7日,掛號(hào)一周左右,確切日期應(yīng)以具體寄送天數(shù)為準(zhǔn)。將收稿日期減去投寄周期,得到的日期就可以確定為可以接受文字復(fù)制檢測(cè)的日期。第三,如果已發(fā)表論文上沒(méi)有標(biāo)注“收稿日期”和“出版日期”,則應(yīng)從論文的寄送周期、審稿周期、發(fā)表刊期、出版時(shí)間等方面綜合考慮。論文的審稿周期一般以稿約規(guī)定的期限為準(zhǔn);發(fā)表刊期則要考慮到月刊、雙月刊、季刊等出刊周期;出版時(shí)間為編輯、定稿并制版的時(shí)間,必須核實(shí)確定??梢?jiàn),作者論文投稿日期遠(yuǎn)遠(yuǎn)早于“出版日期”,將這幾段時(shí)間累加,就可以用“出版日期”來(lái)確定論文的檢測(cè)時(shí)間:檢測(cè)日期=出版日期―(出版周期+審稿周期+寄送周期)。事實(shí)上,審稿周期、出版周期往往不是固定不變的,我們應(yīng)盡量核查準(zhǔn)確再予以確定。
2.對(duì)繼承性與重復(fù)性的合理區(qū)分與界定
文字復(fù)制包括合理引證、過(guò)度引用、抄襲(含自我抄襲)、剽竊、重復(fù)發(fā)表等多種情況。僅僅從檢測(cè)出的文字重復(fù)量就輕率地判定其為合理繼承或抄襲剽竊是不科學(xué)的。判定合理繼承,首先應(yīng)該看其文字是否屬于合理引證。判定合理引證,既有《著作權(quán)法》《文后參考文獻(xiàn)著錄規(guī)則》等法規(guī)和文件可作理論依據(jù),也有相關(guān)研究成果可資借鑒[3]??傮w而言,合理引證應(yīng)該是內(nèi)容必要、文字適量、標(biāo)識(shí)清晰的引用,這與抄襲剽竊有著本質(zhì)的區(qū)別。即使是在內(nèi)容必要的情況下,抄襲剽竊往往也是引用文字過(guò)量、未予以合理標(biāo)識(shí)的引用。因此,對(duì)檢測(cè)出的重復(fù)文字的繼承性與重復(fù)性的區(qū)別,首先要看其重復(fù)文字引用量是否適中,引用文字是否進(jìn)行了合理標(biāo)識(shí);同時(shí),更為重要的是要對(duì)那些“形式合理”的引用給予實(shí)質(zhì)性剖析,將那些偽引、作者或刊物沽名的自引與互引、無(wú)從查證的參引(含轉(zhuǎn)引和不確定引證源的引用)、錯(cuò)引等不合理引用判為學(xué)術(shù)不端。對(duì)重復(fù)文字的繼承性與重復(fù)性的評(píng)判,是學(xué)術(shù)不端檢測(cè)的核心、焦點(diǎn)與難點(diǎn),唯有標(biāo)本兼查,才能得出最為客觀的結(jié)論。
3.后檢測(cè)的制度性修復(fù)與標(biāo)準(zhǔn)確立
檢測(cè)制度是由檢測(cè)規(guī)則、檢測(cè)系統(tǒng)及其技術(shù)、檢測(cè)標(biāo)準(zhǔn)、檢測(cè)反饋及懲治等一系列要素構(gòu)成的。鑒于檢測(cè)制度2008年及其之前的缺失、2009年及其以后的日趨規(guī)范與嚴(yán)謹(jǐn)?shù)陌l(fā)展規(guī)律,在檢測(cè)中就應(yīng)該區(qū)別對(duì)待。2008年及以前發(fā)表的論文,檢測(cè)時(shí),除可以將文字重復(fù)過(guò)多(一般高于30%以上)的明顯抄襲的論文判定為學(xué)術(shù)不端外,其余論文的文字復(fù)制率一般可以允許在30%以內(nèi)。2009年及其以后發(fā)表的論文,其文字復(fù)制比總體上應(yīng)該是一個(gè)從高到低并停留在一個(gè)較低水平上的標(biāo)準(zhǔn),其數(shù)量值嚴(yán)格控制在20%以下。這其中對(duì)于文獻(xiàn)綜述類(lèi)等需要大量引證的文章,可以允許文字復(fù)制率略高于其他類(lèi)型的文章(在40%左右)。如此,我們?cè)跈z測(cè)中,不僅能夠從宏觀上總體把握和控制文章的文字復(fù)制率,而且能夠靈活地區(qū)別對(duì)待不同時(shí)期、不同類(lèi)型的文章,促進(jìn)學(xué)術(shù)生態(tài)的良性發(fā)展。
4.比對(duì)源的完善與彌補(bǔ)
檢測(cè)系統(tǒng)比對(duì)源收錄數(shù)據(jù)庫(kù)越全面、各種文獻(xiàn)收錄越完備,則檢測(cè)出的結(jié)果就越趨近實(shí)際,因此,檢測(cè)系統(tǒng)應(yīng)不斷增加和充實(shí)檢測(cè)比對(duì)源。例如,某省2013年在2012年使用的比對(duì)源數(shù)據(jù)庫(kù)基礎(chǔ)上,增加了“港澳臺(tái)學(xué)術(shù)文獻(xiàn)庫(kù)”“優(yōu)先出版文獻(xiàn)庫(kù)”“互聯(lián)網(wǎng)文檔資源”等文獻(xiàn),就使得檢測(cè)的比對(duì)精度有所提高。同時(shí),鑒于文字引證的復(fù)雜性,檢測(cè)時(shí)要求作者提供文章引證的詳細(xì)說(shuō)明和引證文獻(xiàn)的原件或復(fù)印件等證明材料,這樣就可以有效彌補(bǔ)部分文獻(xiàn)因“無(wú)從核查”而出現(xiàn)的無(wú)法比對(duì)的漏洞,讓抄襲剽竊等不端行為無(wú)處藏身。
5.科學(xué)理性的回歸
學(xué)術(shù)不端檢測(cè)的檢出率與檢準(zhǔn)率受多種因素的影響,其中主觀因素往往占據(jù)主要方面,包括系統(tǒng)在內(nèi)的客觀因素起著相對(duì)次要的作用,特別是在需要做出合理判定的情況下。因此,對(duì)檢測(cè)系統(tǒng)的盲從無(wú)疑是一種不負(fù)責(zé)任的行為,是對(duì)科學(xué)理性的漠視與逃避。實(shí)際上,作者撰寫(xiě)論文的文字復(fù)制現(xiàn)象非常復(fù)雜,在實(shí)際檢測(cè)中,檢測(cè)人員不僅需要對(duì)被檢測(cè)論文從時(shí)間、文獻(xiàn)類(lèi)型上予以設(shè)定,還要從內(nèi)容上對(duì)其進(jìn)行剖析[4],揭隱顯微,對(duì)真引、偽引、抄襲等予以準(zhǔn)確判定。只有將檢測(cè)中的工具理性與科學(xué)理性緊密結(jié)合,并以科學(xué)理性為主導(dǎo),才能對(duì)文字復(fù)制及其實(shí)質(zhì)做出科學(xué)的判定。
[1]張放. 學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)對(duì)《中國(guó)醫(yī)學(xué)影像技術(shù)》刊登論文檢測(cè)結(jié)果的分析[J]. 科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2011(26):125-127.
[2]劉認(rèn)軍.別讓“學(xué)術(shù)不端”成“學(xué)術(shù)不公”——學(xué)術(shù)不端檢測(cè)軟件使用淺談[J].出版廣角,2012(6):58-59.
[3]趙蔚. 學(xué)術(shù)不端檢測(cè)結(jié)果的修正標(biāo)準(zhǔn)初探——基于“文字復(fù)制比”與“文章抄襲率”的辨析[J]. 中國(guó)出版,2011(11下):20-23.
[4]孔艷,顏帥. 關(guān)于不端文獻(xiàn)檢測(cè)軟件的思考[J]. 中國(guó)出版,2010(11下):28-30.