国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

英文文獻(xiàn)在論文相似性檢測(cè)中的檢索技巧

2015-12-27 08:33:08
中國(guó)管理信息化 2015年13期
關(guān)鍵詞:相似性檢索英文

王 佳

(齊魯工業(yè)大學(xué) 圖書(shū)館參考咨詢部,濟(jì)南 250353)

學(xué)術(shù)不端是指在申請(qǐng)課題、實(shí)施研究報(bào)告結(jié)果的過(guò)程中,出現(xiàn)的捏造、篡改或抄襲行為。不端行為主要被限定在“偽造、篡改、抄襲”(Fabrication,F(xiàn)alsification,Plagiarism,簡(jiǎn)稱 FFP )三者中。隨著學(xué)術(shù)競(jìng)爭(zhēng)日漸激烈,學(xué)術(shù)界存在某些弄虛作假、行為不良或失范的風(fēng)氣。在職稱晉升、申請(qǐng)立項(xiàng)、畢業(yè)答辯等科研環(huán)節(jié)中,存在剽竊他人研究成果、稍加改動(dòng)甚至全盤(pán)照搬占為己有的行為,或者一稿多投以數(shù)量取勝為自身謀取利益等現(xiàn)象。目前在國(guó)內(nèi)學(xué)術(shù)界,這些違背科學(xué)精神和道德的現(xiàn)象廣泛存在于科研機(jī)構(gòu)、大專院校等各個(gè)層面,極大地?cái)牧藢W(xué)術(shù)風(fēng)氣,阻礙了學(xué)術(shù)進(jìn)步,給科學(xué)和教育事業(yè)帶來(lái)嚴(yán)重的負(fù)面影響。鑒于學(xué)術(shù)不端嚴(yán)重削弱了學(xué)術(shù)界的公平競(jìng)爭(zhēng),很多單位在職稱評(píng)聘、應(yīng)屆畢業(yè)生答辯資格取得、新文章發(fā)表等工作中,適時(shí)引入了相似性檢測(cè)這一硬性規(guī)定,針對(duì)著作、中外文期刊論文等科研成果進(jìn)行嚴(yán)格的相似性檢測(cè),規(guī)定了一定的相似比,相似性處于該相似比之內(nèi)的成果方可過(guò)關(guān),否則一票否決。

針對(duì)相似性檢測(cè),當(dāng)前國(guó)內(nèi)多家數(shù)據(jù)商均研發(fā)了學(xué)術(shù)不端檢測(cè)系統(tǒng),后臺(tái)比對(duì)數(shù)據(jù)庫(kù)資源豐富、涵蓋面廣,包括期刊全文數(shù)據(jù)庫(kù)、學(xué)位論文數(shù)據(jù)庫(kù)、會(huì)議論文數(shù)據(jù)庫(kù)、報(bào)紙全文數(shù)據(jù)庫(kù)、互聯(lián)網(wǎng)數(shù)據(jù)庫(kù)、港澳臺(tái)數(shù)據(jù)庫(kù)、優(yōu)先出版數(shù)據(jù)庫(kù)等;針對(duì)英文文獻(xiàn),也增加了相關(guān)的期刊、博碩、會(huì)議的英文比對(duì)數(shù)據(jù)庫(kù)。比對(duì)范圍廣泛全面,比對(duì)系統(tǒng)日趨完善。而且根據(jù)被檢測(cè)人自身文獻(xiàn)的發(fā)文狀況,還引入了個(gè)人比對(duì)庫(kù),使得檢測(cè)的嚴(yán)格性和人性化相結(jié)合,在一定程度上凈化了學(xué)術(shù)競(jìng)爭(zhēng)環(huán)境,促進(jìn)了學(xué)術(shù)競(jìng)爭(zhēng)公平、公正地發(fā)展。

隨著科研的飛速發(fā)展和更高要求,國(guó)內(nèi)科研人員越來(lái)越注重外文研發(fā),英文專著、學(xué)位論文、期刊論文的數(shù)量日漸增多。為了適應(yīng)這一現(xiàn)狀,學(xué)術(shù)不端檢測(cè)系統(tǒng)也相應(yīng)地整合了多個(gè)英文資源比對(duì)數(shù)據(jù)庫(kù),如中國(guó)知網(wǎng)國(guó)際文獻(xiàn)總庫(kù)、德國(guó)Springer全文期刊數(shù)據(jù)庫(kù)、英國(guó)Taylor&Francis期刊數(shù)據(jù)庫(kù)、荷蘭Elsevier數(shù)據(jù)庫(kù)等。比對(duì)的英文文獻(xiàn)類型包括期刊論文、會(huì)議論文、學(xué)位論文、圖書(shū)等。在相似性檢測(cè)過(guò)程中,英文文獻(xiàn)查重存在一些技巧,比如外刊檢索中優(yōu)先出版、出版周期、刊種確定、時(shí)間確定等。而且由于文獻(xiàn)內(nèi)容涉及各個(gè)學(xué)科,文獻(xiàn)原始格式、出版格式、呈現(xiàn)形式多種多樣,每一個(gè)環(huán)節(jié)的界定都直接影響著檢測(cè)結(jié)果,這就要求檢測(cè)人員在檢測(cè)過(guò)程中要充分用心,于不規(guī)律中探尋規(guī)律,嚴(yán)格采用統(tǒng)一標(biāo)準(zhǔn)對(duì)待各篇送檢文獻(xiàn),對(duì)申報(bào)者負(fù)責(zé)。

1 相似性檢測(cè)中的影響因素

1.1 英文文獻(xiàn)格式

英文文獻(xiàn)撰寫(xiě)者通常使LATEX等軟件編輯,自動(dòng)生成PDF格式,故申報(bào)者在申報(bào)系統(tǒng)中提交的的英文文獻(xiàn)多為PDF格式。①PDF格式的英文原文在正常未加密的情況下,檢測(cè)過(guò)程一般比較順利,可以正常生成檢測(cè)報(bào)告。但是有時(shí)PDF格式會(huì)出現(xiàn)加密的情況,一旦出現(xiàn)這種情況,原文文字信息無(wú)法復(fù)制,文章在相似性檢測(cè)系統(tǒng)中無(wú)法導(dǎo)入,或者導(dǎo)入之后生成亂碼報(bào)告等,這些情況一旦出現(xiàn),需要立即將原文章轉(zhuǎn)換格式。常用的格式轉(zhuǎn)換軟件有漢王PDFOCR、ABBYYFineReader等,格式轉(zhuǎn)換之后,通常情況下檢測(cè)過(guò)程會(huì)歸于正常;②有時(shí)相似性檢測(cè)系統(tǒng)后臺(tái)比對(duì)的外文數(shù)據(jù)庫(kù)會(huì)涉及版權(quán)問(wèn)題,文章允許比對(duì)但不提供無(wú)縫下載鏈接,所以當(dāng)原文無(wú)法在數(shù)據(jù)庫(kù)下載時(shí),有時(shí)會(huì)需要作者本人提供原文,這時(shí)可能會(huì)出現(xiàn)Word等非PDF格式的文章被提交上來(lái),檢測(cè)方法和過(guò)程與PDF格式的文章相同,但前提是作者本人提交的版本內(nèi)容必須與發(fā)表、收錄的內(nèi)容完全一致,這需要人事處、科研處等相關(guān)部門(mén)嚴(yán)格審核。另外,從數(shù)據(jù)庫(kù)下載的原文中,如果因排版等原因摻雜有其他文章內(nèi)容,須轉(zhuǎn)換為Word格式,剔除不相關(guān)內(nèi)容之后重新上傳檢測(cè);③某些學(xué)科領(lǐng)域如生化、數(shù)學(xué)、藝術(shù)等文章中,有時(shí)會(huì)出現(xiàn)大量統(tǒng)計(jì)圖表、設(shè)計(jì)圖、公式、分子結(jié)構(gòu)示意圖等,通常因格式轉(zhuǎn)換軟件技術(shù)限制而導(dǎo)致格式轉(zhuǎn)換效果欠佳,從而相似性檢測(cè)系統(tǒng)無(wú)法檢測(cè),而圖表、公式本身傳達(dá)一定的信息量又不宜刪除,故需要采取其他方式進(jìn)行相似性鑒定。

1.2 檢測(cè)時(shí)間點(diǎn)界定

相似性檢測(cè)的重要一環(huán)是檢測(cè)時(shí)間點(diǎn)的界定,即比對(duì)截止時(shí)間點(diǎn)。規(guī)定按收稿日期、期刊發(fā)行日期、會(huì)議日期等酌情選擇。原文如果是出版社正規(guī)單行本格式,一般會(huì)標(biāo)注收稿日期。英文文獻(xiàn)的收稿日期一般標(biāo)注格式為ReceivedTime、AcceptedTime等;會(huì)議文獻(xiàn)按照會(huì)議召開(kāi)日期,可檢索會(huì)議名稱確定會(huì)議時(shí)間;期刊文獻(xiàn)按照期刊發(fā)行日期,網(wǎng)絡(luò)優(yōu)先出版的文獻(xiàn)按照網(wǎng)上出版日期,標(biāo)注格式為AvailableonlineTime等。本著對(duì)申報(bào)者負(fù)責(zé)的精神,時(shí)間點(diǎn)盡量取前不取后,收稿日期和期刊發(fā)行日期如果同時(shí)檢索到,選擇收稿日期作為檢測(cè)時(shí)間點(diǎn)。檢測(cè)時(shí)間點(diǎn)的界定需要嚴(yán)格慎重,時(shí)間間隔會(huì)造成檢測(cè)結(jié)果存在很大差異。例如,某篇文章系統(tǒng)認(rèn)定的出版時(shí)間為2012年7月15日,總文字復(fù)制比為34%,超過(guò)了文字復(fù)制比須在30%以下的要求,但收稿日期為2011年11月4日,如果按該時(shí)間點(diǎn)檢測(cè),總文字復(fù)制比則為10.3%,符合要求。有的期刊發(fā)行日期不明確,則需要按照該刊出版周期、出版頻率來(lái)確定每期的出版時(shí)間,從而確定檢測(cè)時(shí)間點(diǎn)。例如,雙月刊為每?jī)蓚€(gè)月出版發(fā)行一次,如無(wú)具體的出版日期,則規(guī)定6期的出版日期為前一年12月31日以及該年2月28日、4月30日、6月30日、8月31日、10月31日;季刊為每季度出版發(fā)行一次,如無(wú)具體的出版日期,則規(guī)定四期的出版日期為前一年12月31日以及該年3月31日、6月30日、9月30日;此外還有半月刊、旬刊、周刊、不定期出版等多種情況,如無(wú)具體出版日期,則選擇各小周期的前一天或者按照出版頻率均攤時(shí)間來(lái)確定。

2 外文期刊檢索的方法及技巧

對(duì)于無(wú)收稿日期、非會(huì)議文獻(xiàn)的期刊文獻(xiàn),需要借助數(shù)據(jù)庫(kù)、網(wǎng)站等資源,確定該刊的出版周期、出版頻率等,從而確定具體某期的出版日期。常用的數(shù)據(jù)庫(kù)如EICompendex、Springer等,在數(shù)據(jù)庫(kù)收錄文獻(xiàn)的題錄信息里可檢索到英文期刊的完整刊名、國(guó)際標(biāo)準(zhǔn)刊號(hào)(ISSN)、數(shù)字對(duì)象唯一標(biāo)識(shí)符(DOI)、出版時(shí)間或年卷期號(hào)。利用刊名或刊號(hào)可檢索期刊的出版周期或頻率,常用的網(wǎng)站有中國(guó)報(bào)刊網(wǎng)、中科院國(guó)家科學(xué)圖書(shū)館、中國(guó)知網(wǎng)國(guó)際文獻(xiàn)總庫(kù)、中國(guó)圖書(shū)進(jìn)出口總公司期刊查詢等。如利用http://periodical.cnpeak.com /periodical.a(chǎn)spx 檢 索 英 文 期 刊 《Insurance:MathematicsandEconomics》,期數(shù)共6期,雙月刊。對(duì)于非常規(guī)周期出版的期刊,如《Philosophy&SocialCriticism》,期數(shù)共10期,通常按照一年的總天數(shù)均攤時(shí)間計(jì)算每期的出版時(shí)間。有些外刊每年出版的周期不同,如 《InternationalJournalofDatabase TheoryandApplication》,該刊2008-2013年每年出版的期數(shù)分別為1期、4期、4期、4期、4期、6期,遇到此類情況,須按照每年期數(shù)分別計(jì)算出版日期。此外,還可以利用數(shù)字對(duì)象唯一標(biāo)識(shí)符檢索, 如利用網(wǎng)站 http://dx.doi.org/檢索 DOI為 10.1007 /s00339-013-8018-3的文獻(xiàn),可以確定出版時(shí)間為2014年3月。有些期刊的ISSN號(hào)分為印刷版和電子版兩種,印刷版為pISSN,電子版為eISSN, 兩 者 內(nèi) 容 一 樣 。 例 如 《JournalofConvergence InformationTechnology》,ISSN 為 1975-9321 (Print),2233-9299(Online)。

3 國(guó)際會(huì)議文獻(xiàn)的檢索技巧

在英文文獻(xiàn)相似性檢測(cè)中,EICompendex等收錄國(guó)際會(huì)議文獻(xiàn)的數(shù)據(jù)庫(kù)均可用來(lái)檢索會(huì)議文獻(xiàn)信息。根據(jù)國(guó)際會(huì)議名稱,可檢索該會(huì)議的詳細(xì)題錄信息,確定會(huì)議日期。另外,還可以利用google等學(xué)術(shù)搜索引擎,輸入會(huì)議名稱或縮寫(xiě),檢索會(huì)議日期。EI收錄文獻(xiàn)可直接在題錄信息中查看會(huì)議日期,如EITRT 2013,會(huì)議日期為2013年 10月 25日~10月27日;CCDC2014,會(huì)議日期為2014年5月31日~6月2日。通常選取會(huì)議召開(kāi)的前一天作為檢測(cè)時(shí)間點(diǎn)。會(huì)議論文集的出版時(shí)間有時(shí)在會(huì)議召開(kāi)的時(shí)間之前,有時(shí)在會(huì)議之后,按照“選前不選后”的原則,選擇靠前的日期作為檢測(cè)時(shí)間點(diǎn)。

4 外文著作相似性檢測(cè)

外文著作相似性檢測(cè)是針對(duì)書(shū)名、作者位次、ISBN、CIP查真,利用中國(guó)人民共和國(guó)新聞出版總署、國(guó)家圖書(shū)館等網(wǎng)站查詢CIP數(shù)據(jù)及ISBN的真實(shí)性,同時(shí)核對(duì)作者位次。有時(shí)作者位次不是第一位,或者與其他人合著,則網(wǎng)站無(wú)法顯示具體信息,須作者提供著作原件或掃描件予以鑒定。

5 文字復(fù)制比分析

相似性檢測(cè)結(jié)果中,如果被檢測(cè)文獻(xiàn)與申報(bào)者本人的學(xué)位論文或者會(huì)議論文有相似片段,則剔除申報(bào)者本人學(xué)位論文和會(huì)議論文相似部分,不計(jì)算重合率。以某篇檢測(cè)文獻(xiàn)為例,如圖1所示,該文獻(xiàn)總文字復(fù)制比為50.3%,但是去除本人學(xué)位論文會(huì)議論文之后,文字復(fù)制比為3.9%,符合要求。

但是,因數(shù)據(jù)庫(kù)收錄時(shí)著錄內(nèi)容、著錄人員等因素影響,某些文獻(xiàn)著錄信息缺失,導(dǎo)致系統(tǒng)無(wú)法自動(dòng)對(duì)應(yīng)到某位作者名下予以剔除,因此會(huì)導(dǎo)致文字復(fù)制比較高。解決方法,一是手動(dòng)計(jì)算相似片段字?jǐn)?shù)與原文字?jǐn)?shù)的比例,從總文字復(fù)制比中減去;二是向數(shù)據(jù)商或更高權(quán)限賬戶提交申請(qǐng),從數(shù)據(jù)庫(kù)中直接剔除本人該篇學(xué)位論文或會(huì)議論文,重新檢測(cè)。

圖1 檢測(cè)結(jié)果

6 結(jié)語(yǔ)

外文文獻(xiàn)因其原文格式、發(fā)表收錄以及外刊出版等多種原因,表現(xiàn)出復(fù)雜性、多樣性的特點(diǎn),要求檢測(cè)人員具備較高的專業(yè)素質(zhì)和外語(yǔ)水平。在相似性檢測(cè)過(guò)程中除了常規(guī)流程操作,更應(yīng)具體情況具體分析,在公平、公正的前提下,采取靈活化、人性化的檢測(cè)方法和技巧,保證檢索信息無(wú)誤、查全查準(zhǔn),檢測(cè)結(jié)果真實(shí)、準(zhǔn)確。

猜你喜歡
相似性檢索英文
一類上三角算子矩陣的相似性與酉相似性
淺析當(dāng)代中西方繪畫(huà)的相似性
2019年第4-6期便捷檢索目錄
英文摘要
英文摘要
英文摘要
英文摘要
低滲透黏土中氯離子彌散作用離心模擬相似性
專利檢索中“語(yǔ)義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
V4國(guó)家經(jīng)濟(jì)的相似性與差異性
南昌市| 星座| 辽中县| 霍山县| 长岭县| 建昌县| 靖边县| 吉水县| 津南区| 固始县| 门头沟区| 新余市| 黄梅县| 江口县| 津南区| 游戏| 苗栗县| 温州市| 隆回县| 项城市| 勐海县| 安顺市| 广州市| 新密市| 安徽省| 芮城县| 罗城| 罗山县| 彭水| 登封市| 健康| 景德镇市| 兴隆县| 阳春市| 北安市| 石门县| 永宁县| 牙克石市| 博白县| 酒泉市| 永仁县|