論文撤稿數(shù)量的增長,既反映了現(xiàn)代科技的進步,也從側(cè)面反映了奔走在學(xué)術(shù)打假前線的“學(xué)術(shù)偵探”的存在。各種編輯軟件的誕生使得論文造假越來越容易,但另一方面,科技的進步也給“學(xué)術(shù)偵探”提供了更多的武器,使得“打假”更容易了。現(xiàn)如今,任何一家有聲譽的出版社或期刊,都會在錄用文章之前進行查重。
“圖片偵探”
前《細胞生物學(xué)雜志》副主編麥克·羅斯納是學(xué)術(shù)界響當當?shù)摹皥D片處理偵探”。
1997-2007年,羅斯納在美國《細胞生物學(xué)雜志》擔任副主編;2006-2013年,他在洛克菲勒大學(xué)出版社擔任執(zhí)行理事。2002年,他在《細胞生物學(xué)雜志》執(zhí)行了一項新政策:篩查接收到的論文中的所有圖片。這最終導(dǎo)致該雜志拒收大約1%已通過同行評議的論文。兩年后,美國研究誠信辦公室為雜志和出版社推出了篩查圖片的軟件。
羅斯納認為,圖片也是數(shù)據(jù),重要性和論文中的數(shù)字及任何其他支撐性數(shù)據(jù)相當。有鑒于此,他在2013年開辦了一間咨詢公司,為期刊、出版社和大學(xué)提供生物醫(yī)學(xué)方面的圖片處理業(yè)務(wù)。
斯坦福大學(xué)微生物學(xué)家伊麗莎白·比克也有“圖片偵探”之稱。
比克在荷蘭老牌名校烏得勒支大學(xué)獲得博士學(xué)位后,在斯坦福大學(xué)微生物學(xué)與免疫學(xué)系工作多年,2016年加入位于美國洛杉磯的腸道茵群檢查(uBiome)公司擔任科學(xué)編輯總監(jiān),該公司乃世界領(lǐng)先的微生物基因組學(xué)研究公司。
在斯坦福大學(xué)工作時,比克曾帶領(lǐng)團隊,花了數(shù)年時間審閱1995-2014年間來自40本不同科學(xué)期刊的20621篇已發(fā)表論文。2016年,比克和兩名微生物學(xué)雜志編輯一同公開了研究結(jié)果:其中782篇文章存在圖片處理不當問題,比例達3.8%。但發(fā)現(xiàn)了問題,并不意味著問題就能得到解決。比克將其研究成果告知了相關(guān)期刊,只有三分之一有回應(yīng)。
隨后,比克又領(lǐng)導(dǎo)一個團隊篩選了2009-2016年在《分子與細胞生物學(xué)》(MCB)雜志上發(fā)表的960篇論文,并在去年發(fā)布研究成果:59篇(6.1%)論文存在“不恰當?shù)膱D片重復(fù)使用”情況,包括同一圖片在同一期刊多次使用,同一篇文章的不同實驗中使用了相同圖片等。研究人員把這個情況通報給雜志社,最終有42篇論文更正了圖片,5篇被撤稿,另外12篇論文由于種種原因未采取任何措施。
研究還發(fā)現(xiàn),已發(fā)表論文如果被發(fā)現(xiàn)存在不恰當圖片使用問題,平均每篇得花6個小時解決;而如果在論文發(fā)表之前就提前介入,可能只需要30分鐘就夠了。
比克認為,許多不恰當圖片的使用問題并非學(xué)術(shù)不端,而是不小心犯錯。比克提出,更好的策略是在論文發(fā)表之前就揪出這些圖片問題,她希望這項研究能警醒期刊編輯和同行評議人員重視這一問題,建議期刊編輯在收到論文后就掃描一遍里面的圖片,這樣做要比發(fā)表后發(fā)現(xiàn)問題再來應(yīng)對各種麻煩節(jié)省時間。
“數(shù)據(jù)流氓”
35歲的詹姆斯·希瑟爾斯和57歲的尼克·布朗被譽為“數(shù)據(jù)警察”,他們卻自嘲為“數(shù)據(jù)流氓” ——無組織的散兵游勇。給論文“找茬”純屬業(yè)余愛好,他們沒有任何資金支持,也和任何官方機構(gòu)無關(guān)。
希瑟爾斯出生在澳大利亞,在悉尼大學(xué)獲得了碩士和博士學(xué)位,分別研究過經(jīng)濟學(xué)和生理學(xué),如今是美國波士頓東北大學(xué)計算行為科學(xué)的博士后。而布朗在英國長大,是劍橋大學(xué)工程學(xué)專業(yè)出身,當了多年的計算機網(wǎng)絡(luò)經(jīng)理,如今在荷蘭格羅寧根大學(xué)攻讀心理學(xué)博士學(xué)位。
希瑟爾斯和布朗并不認為自己是在“打假”或者揭發(fā)學(xué)術(shù)不端。數(shù)據(jù)上的小問題可能是一時疏忽導(dǎo)致的錯誤,也有可能是巨大問題的冰山一角,而他們只負責(zé)當說實話的“流氓”。布朗說:“我們只檢查數(shù)據(jù)的不一致,而把推測為什么的事情交給別人?!?/p>
這對搭檔靠希瑟爾斯編寫的簡單軟件,為揭發(fā)有問題論文開辟了全新的思路——這款縮寫為“精靈”的軟件能夠利用統(tǒng)計學(xué)原理,從論文發(fā)表的結(jié)果重建出原數(shù)據(jù)的可能面貌。
布朗估計,到目前為止,兩人聯(lián)合或各自獨立做的分析,已經(jīng)導(dǎo)致了幾十篇論文的修改以及十多篇論文的撤稿,其中包括康奈爾大學(xué)知名研究者布萊恩·萬辛克的5篇論文。
2012年,萬辛克在《吸引人的食物名字能增加小學(xué)生的蔬菜攝入》一文中提出,如果把某種十分討厭的蔬菜命名為“x射線眼胡蘿卜”,小孩子就會大吃特吃。希瑟爾斯用“精靈”重建可能的論文原數(shù)據(jù),結(jié)果發(fā)現(xiàn),要得到論文里的平均值和樣本量,實驗中至少要有一個孩子需要吃掉60根胡蘿卜,才能產(chǎn)生與實驗數(shù)據(jù)相匹配的結(jié)果!這數(shù)據(jù)明顯是有問題的。
隨后,兩人分析了萬辛克過去幾年發(fā)表的幾十篇論文,發(fā)現(xiàn)了大量“異?!?,比如有4篇關(guān)于吃比薩的論文(其中一篇的結(jié)論是“只要有女人在,男人會吃掉更多比薩”),里面有150多處數(shù)據(jù)不一致。兩人向萬辛克所在的院系以及負責(zé)學(xué)術(shù)規(guī)范的相關(guān)機構(gòu)發(fā)了電郵。逐漸地,郵件回復(fù)變成了“正在調(diào)查”這樣的口徑。
于是,兩人決定把疑問公開。2016年,布朗和幾名伙伴先發(fā)了一篇文章,名叫“數(shù)據(jù)燒心:想要消化康奈爾食品和品牌實驗室4篇比薩論文的企圖”,文中進行了詳細的數(shù)據(jù)分析;然后,希瑟爾斯在博客平臺Medium上發(fā)表多篇文章,提出了萬辛克研究的問題所在。
這吸引了大量關(guān)注,歐美主流媒體先后報道,有記者在調(diào)查后也對萬辛克的研究提出了質(zhì)疑。2017年,在重重壓力之下,萬辛克通過發(fā)言人誠懇道歉,并不得不對過去幾年發(fā)表的十幾篇文章進行修改,其中有5篇被撤稿。
如今,兩人在圈內(nèi)已經(jīng)擁有了一定的名聲,不少研究人員和科研機構(gòu)會將可疑論文發(fā)給他們進行調(diào)查。
希瑟爾斯相信,他和布朗的舉動代表的只是論文分析技術(shù)不斷發(fā)展的開始,待其改良并正式化后,人人都有望掌握。他希望,將來能設(shè)計出一種可升級的在線課程,來傳播這些方法。