程 翠 王 靜 胡 敏 藍 安 胡世蓮
學術(shù)不端文獻檢測系統(tǒng)檢測醫(yī)學學術(shù)論文存在的問題及對策
程 翠 王 靜 胡 敏 藍 安 胡世蓮
[摘 要]學術(shù)不端文獻檢測系統(tǒng)目前已被醫(yī)學期刊編輯部廣泛應用,在甄別抄襲、剽竊文章方面非常有效。但系統(tǒng)在檢測醫(yī)學學術(shù)論文時存在收錄論文的統(tǒng)計源不全、檢測技術(shù)需要改進方面的問題。同時,醫(yī)學學術(shù)論文的格式和內(nèi)容也容易引起檢測缺失。作為編輯,對檢測的結(jié)果不能簡單、機械地以重復率作為稿件取舍的標準,還需要擴大篩查的統(tǒng)計源、發(fā)揮編輯的主觀能動性、發(fā)揮審稿專家的作用等,多方面綜合判斷文章的價值。
[關(guān)鍵詞]學術(shù)不端;檢測系統(tǒng);缺陷;主觀能動性
[作 者] 程 翠,碩士,副編審,中國臨床保健雜志社編輯部副主任;王 靜,中國臨床保健雜志社編輯部副主任;胡 敏,中國臨床保健雜志社責任編輯;藍 安,中國臨床保健雜志社編輯部主任;胡世蓮,中國臨床保健雜志社總編輯、社長。
為凈化學術(shù)環(huán)境,防止學術(shù)論文抄襲、剽竊、一稿多投、重復發(fā)表等不端行為的發(fā)生,很多編輯部都運用了學術(shù)不端文獻檢測系統(tǒng)對來稿進行篩選、甄別。目前,國內(nèi)編輯部運用的多為中國知網(wǎng)、萬方數(shù)據(jù)、重慶維普三家大型數(shù)據(jù)庫推出的檢測系統(tǒng)。筆者從2014年開始在對來稿初審時應用學術(shù)不端文獻檢測系統(tǒng)。在實際應用中發(fā)現(xiàn),利用系統(tǒng)檢測學術(shù)不端,確實便捷高效,甄別出不少抄襲、剽竊的文章。但仔細分析系統(tǒng)檢測的結(jié)果,發(fā)現(xiàn)存在一些不合理的地方需要編輯修正。對檢測的結(jié)果不能簡單、機械地以重復率作為稿件取舍的標準,還需要發(fā)揮編輯的主觀能動性,應用自己的專業(yè)知識和職業(yè)敏感性對檢測結(jié)果進行分析,正確判斷。
(一)收錄論文的統(tǒng)計源不全
中國知網(wǎng)、萬方數(shù)據(jù)、重慶維普是國內(nèi)比較大型且廣泛應用的文獻數(shù)據(jù)庫。這三家分別與國內(nèi)眾多期刊有合作,但三家數(shù)據(jù)庫所收錄的期刊并不完全重合,這就造成了各家收錄論文存在差異性,而學術(shù)不端檢測的技術(shù)數(shù)據(jù)就來源于每篇論文,這就會導致學術(shù)不端檢測的結(jié)果差異。
中國知網(wǎng)、萬方數(shù)據(jù)和部分科技期刊編輯部簽訂了獨家合作協(xié)議,一旦某一編輯部簽訂了獨家合作協(xié)議,就意味著該編輯部刊出的所有文章只能在這一數(shù)據(jù)庫檢索到,勢必造成其他數(shù)據(jù)庫的統(tǒng)計源文獻缺失。這樣,當其他編輯部檢測文章的學術(shù)不端時,論文統(tǒng)計源勢必又縮小,導致查重準確率降低。目前,醫(yī)學期刊中此類現(xiàn)象尤為突出。中國醫(yī)學會是中國醫(yī)學科學技術(shù)工作者的群眾性學術(shù)團體,其2015年主辦的期刊達133本,是國內(nèi)外醫(yī)藥衛(wèi)生界數(shù)量最大的期刊群。這133本期刊多數(shù)居國內(nèi)專業(yè)學科期刊前列。這樣即使有作者抄襲了中華醫(yī)學會主辦的期刊文章,某一編輯部如果只在中國知網(wǎng)查重,就無法篩查出該文章的學術(shù)不端行為。
隨著社會信息化進程的加快,人們對信息服務的要求越來越高。各大數(shù)據(jù)庫陸續(xù)建成了優(yōu)先出版渠道。通過優(yōu)先出版渠道,編輯部可以將定稿的單篇或整期論文上傳到數(shù)據(jù)庫,這比常規(guī)的上傳形式快2個月左右[1]。這在一定程度上解決了紙樣出版的滯后問題,讓新的技術(shù)和方法能更快地傳播出去。但優(yōu)先出版容易出現(xiàn)時間差,造成某一時間點各數(shù)據(jù)庫的論文統(tǒng)計源出現(xiàn)差異。
(二)檢測技術(shù)需要改進
學術(shù)不端檢測需要計算機數(shù)據(jù)與漢語言分析相結(jié)合,段落有段落級的算法,句子有句子級的算法。而每家數(shù)據(jù)庫對于同一篇文章的處理采用技術(shù)存在差異。如對文章的字段識別、語義識別,每個數(shù)據(jù)庫有自己的算法和分析手段,這就造成對同一篇文章在相同數(shù)據(jù)源內(nèi)檢測的結(jié)果也會存在差異。同時,漢語言分析的工作量太大,需要不斷地積累和更新,這就從技術(shù)層面上影響了學術(shù)不端檢測的正確性。
有的作者與檢測系統(tǒng)玩起了文字游戲,通過對語句順序的調(diào)整、同義詞替換、語句表達方式的變動躲避系統(tǒng)的檢測。
如:高水平的血漿PAI-1是血管事件的重要危險因素,被認為是加速發(fā)生冠狀動脈硬化的標志物。
系統(tǒng)檢測為重復句。
改為:血漿PAI-1的高水平現(xiàn)象是引起血管事件發(fā)生非常危險的因素,對于冠狀動脈硬化,它是加速催化的標志物。
系統(tǒng)檢測不為重復句。
(一)投稿文章與學位論文相似度過高
有些作者將自己已提交的學位論文進行整理,以論文的形式在期刊中發(fā)表。而學術(shù)不端檢測系統(tǒng)的統(tǒng)計源往往包括學位論文數(shù)據(jù)庫。如中國知網(wǎng)的學術(shù)不端檢測系統(tǒng)就包括中國學術(shù)期刊網(wǎng)絡出版總庫,中國博士學位論文全文數(shù)據(jù)庫/中國優(yōu)秀碩士學位論文全文數(shù)據(jù)庫,中國重要會議論文全文數(shù)據(jù)庫,中國重要報紙全文數(shù)據(jù)庫。學術(shù)不端檢測系統(tǒng)進行機械化的檢測就會提供高重復率的結(jié)果。
(二)圖表和公式等非文字類不端檢測較弱
現(xiàn)在的數(shù)據(jù)庫學術(shù)不端檢測技術(shù)往往針對的是文字上的重復檢測。對文章中的圖表和公式等非文字類檢測效果不佳,這在一定上存在了技術(shù)漏洞。有的作者利用這一技術(shù)缺陷,大量抄襲他人的圖表和公式,已降低文章的整體重復率。
(三)醫(yī)學論文的結(jié)構(gòu)和表達易存在重復
醫(yī)學論文采用的是格式化的書寫形式,前言、資料與方法、結(jié)果、討論都是統(tǒng)一的格式,筆者對研究的描述往往詞句相似。
醫(yī)學研究的數(shù)據(jù)分析都需要介紹統(tǒng)計學處理方法,而大多數(shù)研究的統(tǒng)計學處理方法都是一樣的。系統(tǒng)機械地認為這是重復,文章的重復率自然就提高了。作為編輯,就需要根據(jù)具體內(nèi)容鑒別重復率的合理性。如:采用SPSS統(tǒng)計軟件分析數(shù)據(jù),計量資料以±s表示,組間比較采用t檢驗;計數(shù)資料組間比較采用χ2檢驗。P <0.05為差異有統(tǒng)計學意義。
醫(yī)學研究的結(jié)果許多都是為了臨床上應用,文章討論中經(jīng)常會出現(xiàn)諸如“此藥物治療效果較好,值得臨床上推廣”的語句。這一含義是很多作者都需要表達的,但語言的表達方式有限,系統(tǒng)根據(jù)文字表達判定為重復,無疑提高了全文的重復率。
醫(yī)學研究需要依據(jù)統(tǒng)一的標準和研究方法,這些內(nèi)容往往被很多研究者參考和引用。這就容易被檢測系統(tǒng)機械化判斷為重復文字,造成重復率高。
如:高血壓的診斷標準依據(jù)2010年《中國高血壓防治指南》,心力衰竭的診斷標準依據(jù)2014年《中國心力衰竭診斷和治療指南》[2]。
(四)綜述類文章重復率易高
綜述是指就某一時間內(nèi),作者針對某一專題,對大量原始研究論文中的數(shù)據(jù)、資料和主要觀點進行歸納整理、分析提煉而寫成的論文[3]。綜述類文章往往要大量應用原文章的語句。雖文章內(nèi)已標注為引用文字,但很多時候,學術(shù)不端檢測系統(tǒng)無法識別、準確劃分,仍將其歸入重復率計算內(nèi)容,造成綜述類文章重復率普遍較高。
(五)同一研究方向的文章重復率較高
同一方向的研究往往查詢的文獻相同、采用的技術(shù)和方法一致,就連在術(shù)語的應用和語言的表達上也容易造成重復。若幾篇文章的作者同為一個課題組,那么基礎(chǔ)的研究方法、實驗儀器、實驗材料都相同,而以上內(nèi)容都需要在醫(yī)學論文中用文字說明,這就難免發(fā)生出版時間居后的論文重復率較高,而論文不存在抄襲、剽竊的現(xiàn)象。還有,在醫(yī)學研究中,經(jīng)常出現(xiàn)同一作者在前期研究的基礎(chǔ)上繼續(xù)深入,后期文章中前言文字、研究方法、研究儀器、所用材料、統(tǒng)計學分析等很多文字說明與前期文章一致,甚至會引用前期文章中的數(shù)據(jù),如果按照系統(tǒng)的機械化檢測,文章的重復率肯定過高。
(一)整合論文的統(tǒng)計源
目前國內(nèi)尚沒有一家數(shù)據(jù)庫囊括所有的出版期刊內(nèi)容。這就形成每家數(shù)據(jù)庫的統(tǒng)計源都存在檢索漏洞。只有整合論文的統(tǒng)計源,使得統(tǒng)計源數(shù)據(jù)越龐大、越全面,抄襲的文章被發(fā)現(xiàn)的概率才越高。
(二)多個數(shù)據(jù)庫篩查
在沒有一個囊括所有期刊的統(tǒng)計源供篩查的情況下,為了提高抄襲文章被發(fā)現(xiàn)的概率,只有手工擴大統(tǒng)計源。在中國知網(wǎng)、萬方數(shù)據(jù)、維普資訊等大型數(shù)據(jù)庫一一篩查。同時還可以通過百度等搜索引擎進行篩查。
(三)收稿時和發(fā)表前均需檢測
論文的出版存在滯后性。有的作者急于拿到出版的期刊,同時將論文向多家期刊編輯部投稿,并按照各家編輯部的要求進行修改、交費。反復地利用學術(shù)不端檢測系統(tǒng)進行篩查,可以幫助編輯部發(fā)現(xiàn)這類問題,避免文章重復出版的發(fā)生。
在編輯工作中也容易出現(xiàn)這樣的情況。有的論文初審時重復率合格,但經(jīng)過修改、編輯,文章內(nèi)容有了較大幅度的改動,導致修改、編輯后的文章重復率過高。只有再次進行學術(shù)不端檢測,才能發(fā)現(xiàn)此類問題,保證期刊的出版質(zhì)量。
(四)發(fā)揮審稿專家的作用
編輯需要了解期刊所涉及的專業(yè)知識,但并不深入。尤其對專業(yè)學科內(nèi)的新技術(shù)、新發(fā)展,很少有編輯能做到及時掌握。這就需要發(fā)揮審稿專家的優(yōu)勢,利用他們在專業(yè)領(lǐng)域的信息量對文章進行判斷,通過審稿專家的主觀分析判斷文章的核心內(nèi)容是否存在抄襲[4]。
(五)正確對待學術(shù)不端文獻檢測系統(tǒng)檢測醫(yī)學學術(shù)論文
學術(shù)不端文獻檢測系統(tǒng)的檢測結(jié)果只能是編輯部篩查文章的一個參考,絕對不能僅憑系統(tǒng)
的重復比高低直接判斷文章是否通過初審。需要根據(jù)每一篇文章的具體檢測情況,結(jié)合醫(yī)學論文內(nèi)容的具體情況,得出檢測系統(tǒng)能有效幫助初審但不能取代初審結(jié)果的結(jié)論[5]。
編輯要發(fā)揮主觀能動性,仔細閱讀文章內(nèi)容,參考學術(shù)不端文獻檢測數(shù)據(jù),綜合判斷文章質(zhì)量。對于選題新穎、創(chuàng)新性強、有研究價值的文章,只要研究數(shù)據(jù)真實、觀點鮮明,即使文字重復比較高,也不要退稿??梢愿髡邷贤?,引導作者圍繞自己的研究結(jié)果進行闡述,改善文字表達能力,降低文字重復比。
這樣,既獲得了一篇好文章,也尊重了作者的勞動成果,和作者建立了良好的合作關(guān)系。同時,也提高了作者的寫作能力,有利于培養(yǎng)優(yōu)秀固定的作者群,為日后的優(yōu)秀稿源打下基礎(chǔ)[6]。
學術(shù)不端文獻檢測系統(tǒng)可以快捷、有效地甄別稿件的重復內(nèi)容,但系統(tǒng)在檢測醫(yī)學學術(shù)論文時存在收錄論文的統(tǒng)計源不全、檢測技術(shù)需要改進方面的問題。作為一名醫(yī)學期刊的編輯,對檢測的結(jié)果不能簡單、機械地以重復率作為稿件取舍的標準,要結(jié)合醫(yī)學論文的特點、發(fā)揮審稿專家的優(yōu)勢、分析論文的內(nèi)容,綜合評價、判斷文章的價值。
【參考文獻】
[1]羅瑞,唐璞,舒安琴,等.兩種學術(shù)不端檢測系統(tǒng)對醫(yī)學論文檢測結(jié)果的差異性研究[J].天津科技,2014(12):71-73.
[2]郭一潔,王海軍,陳宇翔,等.非瓣膜性心房顫動患者并發(fā)缺血性腦卒中的多因素分析[J].中國臨床保健雜志,2016(1):4-7.
[3]王春秀.服務于高校科研的圖書館競爭情報研究[J].科技情報開發(fā)與經(jīng)濟,2011(9):71-72.
[4]楊晨晨.運用學術(shù)不端文獻檢測系統(tǒng)檢測醫(yī)學論文存在的問題及對策[J].編輯學報,20146(1):42-44.
[5]學術(shù)不端檢測系統(tǒng)在醫(yī)學科技核心期刊初審稿件中應用價值研究[J].傳播與版權(quán),2014(3):48-49.
[6]阮愛萍,馬艷霞,王沁萍,等.學術(shù)不端文獻檢測系統(tǒng)在《山西醫(yī)科大學學報》應用中存在的問題及應對措施[J].山西醫(yī)科大學學報,2012(12):970-972.