国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

審校軟件輔助中文科技期刊術語審讀工作機制探究

2023-10-08 01:35:36喬遠波宋培彥劉金婷
中國科技期刊研究 2023年9期
關鍵詞:方正黑馬編校

■王 琪 喬遠波 張 寧 宋培彥 劉金婷 郭 劍

1)全國科學技術名詞審定委員會,北京市東城區(qū)東黃城根北街16號 1007172)科學出版社,北京市東城區(qū)東黃城根北街16號 1007173)天津師范大學,天津市西青區(qū)賓水西道393號 3003874)中國音像與數(shù)字出版協(xié)會,北京市海淀區(qū)蓮花苑5號 100036

中文科技期刊術語規(guī)范是期刊質量管理的重要內(nèi)容。2020年5月,國家新聞出版署《報紙期刊質量管理規(guī)定》明確提到,科技術語不規(guī)范計差錯。然而,如何科學高效地檢索和界定術語差錯是期刊管理需要解決的難題。關于這一領域的研究主要分為兩種:(1)調(diào)查和研究科技期刊術語問題,或涉及醫(yī)學及相關領域[1],或基于工作實例進行總結[2],這些研究很好地歸納和分析了術語差錯,具有重要的參考價值,但未涉及術語差錯的發(fā)現(xiàn)和判定機制,且研究領域覆蓋面不夠廣泛;(2)總結黑馬校對軟件使用經(jīng)驗[3-4]及方正校對軟件使用經(jīng)驗[5],有利于更好地使用校對軟件,但主要立足于通用語言,且缺乏定量統(tǒng)計和分析。此外,筆者對18種中文科技期刊術語問題進行人工調(diào)查與分析[6]后發(fā)現(xiàn),審讀效率和公平性問題亟待解決。目前,審校相關軟件主要有黑馬、方正、騰博、秘塔寫作貓、百分點等。就出版領域來說,黑馬和方正使用最為普遍。審讀工作智能化是術語審讀工作的發(fā)展趨勢,如何借助審校軟件發(fā)現(xiàn)術語差錯,哪種軟件在科技期刊術語審讀方面使用便捷、效果更好,都是值得研究的問題。

研究審校軟件輔助中文科技期刊術語審讀工作機制具有重要意義。首先,本研究嘗試以機器審讀為主、人工核查為輔的方式獲取審讀結果,以節(jié)省人工查找術語差錯的時間,提升工作效率。其次,本研究有利于提升審讀工作的公平性和客觀性。以機器審讀結果為主,排除了人為因素的影響,在一定程度上使審讀結果更客觀。再次,本研究比對3種審校軟件審讀10種科技期刊的數(shù)據(jù)樣本,有利于比對不同審校軟件在術語審校方面的效果。最后,本研究有利于優(yōu)化術語審讀工作方案。在嘗試多種軟件審讀的基礎上,本研究有利于最大限度發(fā)揮機器審讀的優(yōu)勢,更新機器審讀和人工審讀相結合的協(xié)作模式。

1 研究內(nèi)容及方法

研究主要包括以下步驟:(1)期刊選擇。為了使覆蓋面廣泛,在經(jīng)過初步測試,確保審讀結果有效的前提下,選定2021年材料科學綜合類、天文學類、核科學技術類、建筑科學與技術類、地質學類、化學類、古生物學類、礦山工程技術類、人類學類、自然科學綜合類期刊各1種,共10種期刊的全文作為機器審讀樣本。(2)軟件選擇??疾炝撕隈R、方正、術語通、秘塔寫作貓、騰博、百分點6種審校軟件,黑馬和方正是出版社最為常用的兩種審校軟件。術語通以全國科技名詞委術語庫為基礎,但術語庫中缺乏非規(guī)范詞庫,嚴重影響了審校軟件的有效性。騰博、秘塔寫作貓、百分點的市場占有率相對較低,騰博在期刊領域有一定使用率,秘塔貓、百分點主要適用于通用語言領域。最終選定了黑馬、方正、騰博3種審校軟件。方正可根據(jù)文本所屬的學科領域作調(diào)整,審校結果更為精準。(3)整理期刊數(shù)據(jù),提交機器審讀。調(diào)整期刊數(shù)據(jù)為審校軟件可讀取狀態(tài),提交至審校系統(tǒng),保存和整理審讀結果。(4)組織術語人工審核,對機器審讀結果實行三審,整理最終專家認定的錯誤術語數(shù)據(jù)和類型。選擇3種期刊進行人工審讀并提出已認定數(shù)據(jù)之外的錯誤術語用例。(5)整理各種數(shù)據(jù)表,分析人工審讀補充的術語數(shù)據(jù)的特點,結合過去術語審讀工作情況及相關數(shù)據(jù),探討術語審讀工作機制。

研究采用以下方法:(1)回顧性調(diào)查方法,調(diào)查2021年10種科技期刊的術語相關差錯情況;(2)機器審讀和人工審讀相結合的方法,在最大限度利用審校軟件提高效率的同時,彌補機器審讀的不足;(3)定量和定性分析相結合的方法。分別統(tǒng)計不同軟件檢出的各類差錯數(shù)量、僅某種軟件檢出的某種類別的差錯數(shù)量、兩個或多個軟件共同檢出的某種類別的差錯數(shù)量;評測和比對審校軟件在輔助中文科技期刊術語審讀方面的效果,遴選適用于術語審讀的高效軟件;根據(jù)人工補充的術語差錯數(shù)據(jù),分析機器審讀有待改進之處。

2 數(shù)據(jù)統(tǒng)計與分析

2.1 基于審讀工作量的統(tǒng)計和分析

為了對純?nèi)斯徸x和審校軟件輔助人工審讀做量化比較,粗略統(tǒng)計二者需要閱讀的文本量。為了簡化計算,期刊按1500字/頁計文本量,審校軟件輔助人工審讀按20字/處(含上下文)計文本量,統(tǒng)計結果見表1。據(jù)統(tǒng)計,單純?nèi)斯徸x量約為1085.55萬字,黑馬輔助人工審讀量約為328.82萬字,約為人工審讀量的30.0%;方正輔助人工審讀量約為72.07萬字,約為人工審讀量的6.6%;騰博輔助人工審讀量約為19.28萬字,約為人工審讀量的1.8%。3種軟件累計審讀量約為人工審讀量的38.4%。

表1 人工審讀量、黑馬/方正/騰博輔助人工審讀量統(tǒng)計表

2.2 基于不同軟件的審校數(shù)據(jù)統(tǒng)計與分析

統(tǒng)計黑馬、方正、騰博軟件提示的差錯數(shù)據(jù)(檢出量)、專家核定后的差錯數(shù)據(jù)(核定量)及檢出率(核定量占檢出量的百分比),如表2所示。統(tǒng)計3種審校軟件審讀10種期刊的數(shù)據(jù)發(fā)現(xiàn),就檢出量來看,黑馬為164408個,方正為36039個,騰博為9632個。黑馬冗余信息最多;方正已剔除冗余信息,審讀報告文本相對簡潔;騰博審校結果為Excel文件,剔除冗余信息操作十分方便,也可視為已剔除冗余信息。就核定量來看,黑馬為527個,方正為550個,騰博為148個。就檢出率來說,黑馬為0.3%,方正為1.5%,騰博為1.5%。方正和騰博的檢出率優(yōu)于黑馬,黑馬檢出的冗余信息較多,增加了人工審核的負擔。綜合來看,方正檢測效果最優(yōu)。

表2 黑馬/方正/騰博檢出量、核定量、檢出率比對表

2.3 基于不同差錯類型的審校數(shù)據(jù)統(tǒng)計和分析

統(tǒng)計差錯類型和數(shù)量,對于擴大科技期刊審讀覆蓋面、全面推進機器輔助科技期刊審讀具有重要意義。根據(jù)不同差錯的特點,將差錯分為術語使用規(guī)范問題、編校規(guī)范問題、專有名詞差錯3個大類,各大類又分若干小類?;诓煌脑~庫或者不同的算法,黑馬、方正、騰博檢出的數(shù)據(jù)存在差異——既有數(shù)量差異,也有類別差異。統(tǒng)計結果如表3所示。

表3 黑馬/方正/騰博檢出差錯數(shù)據(jù)表

統(tǒng)計不同差錯類型審校數(shù)據(jù)發(fā)現(xiàn):(1)術語使用規(guī)范問題方面,黑馬檢出量最多,總計255個;方正檢出量其次,總計208個;騰博檢出量最少,總計81個。就術語使用規(guī)范問題的各個類別來說,術語形音義相近而造成的差錯數(shù)量最多,其次是術語使用不當。就應改為正稱的非規(guī)范名稱來說,黑馬的檢測效果明顯優(yōu)于方正和騰博;就檢測術語表述不一致、術語使用不當、術語形音義相近而誤相關差錯來說,黑馬、方正明顯優(yōu)于騰博。(2)編校規(guī)范問題方面,方正檢出量最多,總計309個;黑馬檢出量其次,總計251個;騰博檢出量最少,總計59個。就編校規(guī)范問題的各個類別來說,語法錯誤或筆誤造成的差錯數(shù)量最多,其次是術語形音義相近而誤。在檢測各類別編校規(guī)范問題方面,如繁體須轉簡體、未使用書面用語、語法錯誤或筆誤、術語形音義相近而誤等,黑馬和方正都明顯優(yōu)于騰博。(3)專有名詞差錯方面,方正檢出量最多,總計33個;黑馬檢出量其次,總計21個;騰博檢出量最少,總計8個。就專有名詞差錯的各個類別來說,地名差錯數(shù)量最多;就人名、機構名來說,方正的檢測效果明顯優(yōu)于黑馬和騰博;就地名、國名來說,黑馬、方正的檢測效果明顯優(yōu)于騰博。

總體說來,術語機器審讀結果以術語使用規(guī)范問題和編校規(guī)范問題為主,術語形音義相近而誤、語法錯誤或筆誤是最常見的差錯。從審讀結果來看,黑馬和方正優(yōu)于騰博。

2.4 基于差錯數(shù)據(jù)的個性審校數(shù)據(jù)統(tǒng)計和分析

統(tǒng)計某審校軟件檢出而其他軟件未檢出的差錯數(shù)量,有利于了解各審校軟件的優(yōu)勢和獨特性,見表4。

表4 基于差錯數(shù)據(jù)的個性審校數(shù)據(jù)統(tǒng)計表

統(tǒng)計各審校軟件檢出且核定的個性化數(shù)據(jù)發(fā)現(xiàn):(1)術語使用規(guī)范問題方面,僅黑馬檢出量(方正、騰博未檢出)最多,總計92個;僅方正檢出量(黑馬、騰博未檢出)其次,總計52個;僅騰博檢出量(黑馬、方正未檢出)最少,總計34個。就術語使用規(guī)范問題的各個類別來說,僅黑馬檢出的差錯主要涉及術語形音義相近而誤、術語使用不當、非規(guī)范名稱應改為正稱方面;僅方正檢出的差錯主要涉及術語使用不當、術語形音義相近而誤方面;僅騰博檢出的差錯主要涉及術語形音義相近而誤。(2)編校規(guī)范問題方面,僅方正檢出量(黑馬、騰博未檢出)最多,總計148個;僅黑馬檢出量(方正、騰博未檢出)其次,總計98個;僅騰博檢出量(黑馬、方正未檢出)最少,總計15個。就編校規(guī)范問題的各個類別來說,僅黑馬檢出的差錯主要涉及語法錯誤或筆誤,僅方正檢出的差錯也主要涉及語法錯誤或筆誤,僅騰博檢出的差錯數(shù)量極少。(3)專有名詞差錯方面,僅方正檢出量(黑馬、騰博未檢出)最多,總計17個;僅黑馬檢出量(方正、騰博未檢出)其次,總計5個;僅騰博檢出量(黑馬、方正未檢出)最少,總計3個。

就個性化審校數(shù)據(jù)的總體情況來看,在術語使用規(guī)范問題方面,僅黑馬檢出的差錯數(shù)量高于方正和騰博檢出的同類差錯數(shù)量,黑馬在檢測術語使用規(guī)范問題方面表現(xiàn)最優(yōu),其次是方正、騰博;在編校規(guī)范問題和專有名詞差錯方面,僅方正檢出的差錯數(shù)量高于黑馬和騰博檢出的同類差錯數(shù)量,方正在檢測編校規(guī)范問題和專有名詞差錯方面表現(xiàn)最優(yōu),其次是黑馬、騰博。

2.5 基于差錯數(shù)據(jù)的共性審校數(shù)據(jù)統(tǒng)計和分析

統(tǒng)計不同審校軟件共同檢出的差錯數(shù)量,有利于了解不同審校軟件的共性,如表5所示。

表5 基于差錯數(shù)據(jù)的共性審校數(shù)據(jù)統(tǒng)計表

統(tǒng)計各審校軟件檢出且核定的共性數(shù)據(jù)發(fā)現(xiàn):(1)術語使用規(guī)范問題中,黑馬、方正同時檢出的差錯數(shù)量為153個,黑馬、騰博同時檢出的差錯數(shù)量為44個,方正、騰博同時檢出的差錯數(shù)量為37個,黑馬、方正、騰博同時檢出的差錯數(shù)量為34個,黑馬、方正檢出差錯的一致性最高。就術語使用規(guī)范問題的各個類別來說,術語形音義相近而誤的數(shù)量最多。(2)編校規(guī)范問題中,黑馬、方正同時檢出的差錯數(shù)量為150個,黑馬、騰博同時檢出的差錯數(shù)量為33個,方正、騰博同時檢出的差錯數(shù)量為41個,黑馬、方正、騰博同時檢出的差錯數(shù)量為30個,黑馬、方正檢出差錯的一致性最高。就編校規(guī)范問題的各個類別來說,語法錯誤或筆誤的數(shù)量最多。(3)專有名詞差錯中,黑馬、方正同時檢出的差錯數(shù)量為14個,黑馬、騰博同時檢出的差錯數(shù)量為3個,方正、騰博同時檢出的差錯數(shù)量為3個,黑馬、方正、騰博同時檢出的差錯數(shù)量為1個,黑馬、方正檢出差錯的一致性最高。就專有名詞差錯的各個類別來說,地名差錯的數(shù)量最多。

總體說來,無論是在術語使用規(guī)范問題方面,還是在編校規(guī)范問題、專有名詞差錯方面,黑馬、方正在差錯檢測結果方面更一致。騰博的檢測數(shù)據(jù)與黑馬、方正的一致性較低。

2.6 基于人工審讀補充數(shù)據(jù)的統(tǒng)計和分析

為了了解機器審讀存在的疏漏,為機器審讀提供改進方向,人工查檢了3種軟件均未提示的差錯,涉及核科學技術、化學、地質學的3種期刊,舉例說明如表6所示。人工補充數(shù)據(jù)包括術語使用規(guī)范問題和編校規(guī)范問題:術語使用規(guī)范問題主要涉及術語使用不當、術語形音義相近而誤、譯音用字有誤等問題;編校規(guī)范問題主要涉及語法錯誤或筆誤等問題。可以推測,審校軟件在以上方面還有較大提升空間。

表6 3種期刊人工審讀補充數(shù)據(jù)舉例

3 啟示和建議對策

測試3種審校軟件在術語審讀方面的效果后發(fā)現(xiàn):(1)審校軟件能有效減少工作量和保證工作質量,在提升術語審讀效率方面具備優(yōu)勢。審校軟件能提示可疑術語,大大降低了純?nèi)斯ぶ鹱种鹁鋵徸x的工作量;審讀結果相對客觀,對專家的依賴性較低;自始至終保持相對一致的審讀質量,有利于比對不同期刊的術語規(guī)范程度;對于同一類型差錯的檢索更為徹底,有利于窮盡檢索同一性質的術語差錯。(2)審校軟件效果不一。就黑馬、方正、騰博3種軟件而言,方正和騰博在減少工作量方面效果更為突出;方正的檢出率與騰博基本持平,但明顯高于黑馬;方正與黑馬的檢出量明顯高于騰博。綜合來看,方正可成為輔助期刊術語審讀工作的首選軟件。(3)審校軟件在檢測若干類型差錯方面具備一定優(yōu)勢。審校軟件均對術語形音義相近而導致的差錯、語法錯誤或筆誤等有較高的檢出率;但就不同差錯類型來說,黑馬在識別術語使用規(guī)范問題方面比其他兩種軟件更具優(yōu)勢,方正在識別術語編校規(guī)范問題方面比其他兩種軟件更具優(yōu)勢。(4)審校軟件須與人工相結合,人工審核不可或缺。黑馬和方正檢出差錯與人工核定差錯的重合率均在60%左右,在審讀時間允許的情況下,黑馬可以成為方正的有益補充;此外,通過人工補充核查也能發(fā)現(xiàn)部分差錯,填補方正的缺漏。

從審校軟件輔助期刊審讀工作機制來說,可做如下考慮:

(1)應充分利用審校軟件輔助術語審讀。首先需要關注對期刊電子版的搜集整理,使之按一定次序排列,且文件大小控制在合理范圍內(nèi);其次需要充分利用機器審讀,記錄審校軟件檢測狀態(tài),標注軟件審校數(shù)據(jù);最后還需要根據(jù)原文人工審核機器審讀結果,歸并系統(tǒng)性錯誤。

(2)可根據(jù)檢測目的選擇不同的審讀工作方案。如果致力于盡可能地查出所有差錯,可考慮“多種審校軟件+人工復核+補充查錯”方案;如果致力于比對不同期刊差錯率概況,可考慮“一種審校軟件+人工復核”方案。

(3)可借鑒相關審讀平臺工作經(jīng)驗[7],建設術語審讀平臺,高效管理術語審讀工作,使管理員、審讀專家、期刊編輯部各司其職,使審讀流程系統(tǒng)化、審讀進度可視化、審讀數(shù)據(jù)格式化、審讀管理科學化。審讀工作均在線上開展有利于審讀工作的科學管理,也有利于審讀組掌握審讀專家進度、規(guī)范化格式化審讀數(shù)據(jù)。術語審讀涉及不同的期刊、專家、整理人員,在擴大審讀規(guī)模時,制定規(guī)范的審讀流程、建立可視化的術語審讀工作平臺是十分必要的。

4 結語

期刊術語審讀工作是一項實踐性很強的工作,沒有現(xiàn)成的經(jīng)驗可以借鑒。需要培養(yǎng)專業(yè)化的術語審讀工作隊伍,深入研究,加大宣傳力度,以審讀為手段,提升期刊術語規(guī)范化水平,提升辦刊質量。從最近幾年的術語審讀工作來看,科技期刊中的術語問題普遍存在。建立常態(tài)、高效的術語審讀工作機制,提升期刊術語規(guī)范意識,逐步減少差錯,提升科技期刊規(guī)范化水平是十分必要的。

本研究旨在探索審校軟件輔助人工審讀的工作機制,以10種科技期刊在2021年內(nèi)刊出的所有文章為調(diào)查對象,統(tǒng)計和分析術語相關差錯類型、對比不同軟件審校結果,發(fā)現(xiàn)充分利用審校軟件是提升審讀效率、擴大術語審讀規(guī)模的重要保障。

需要說明的是,本研究在軟件和期刊選擇、差錯分類等方面還存在一些不足。就軟件和期刊來說,僅考察了3種軟件和10種期刊,研究對象有待拓展。就差錯分類來說,主要沿襲過去的分類方法,將差錯分為術語使用規(guī)范問題、編校規(guī)范問題、專有名詞差錯3個大類,各大類又分為若干小類。實際上,該分類還有待深入。不少差錯現(xiàn)象與差錯原因密切相關,而本研究只對差錯原因進行合理的推測,所以一些差錯的歸類并不是唯一的。目前尚無更為科學合理的分類方法,留待將來做進一步優(yōu)化。

猜你喜歡
方正黑馬編校
“黑馬”誕生記
學生天地(2020年12期)2020-08-25 09:16:40
淺析射陽大米的由來
關于鋼鐵廠車間動力自動化設備管理應統(tǒng)籌管理的思考
把編校質量的弦繃得更緊
傳媒評論(2018年10期)2019-01-17 01:33:34
Finite-time Synchronization of Memristor-based Neural Networks with Discontinuous Activations
方正
剛加入“黑馬+云孵化”的Udesk融到300萬美元
黑馬會
黑馬會
Microwave Photonics for Modern Radar Systems*
方山县| 古丈县| 藁城市| 莫力| 电白县| 霍林郭勒市| 克什克腾旗| 临安市| 皋兰县| 图们市| 新和县| 松江区| 油尖旺区| 进贤县| 高安市| 南江县| 襄垣县| 丰镇市| 大安市| 桑植县| 光泽县| 江源县| 高台县| 泸定县| 平顶山市| 桦甸市| 梧州市| 运城市| 宁远县| 柳林县| 澄江县| 鸡东县| 黄冈市| 特克斯县| 库伦旗| 枞阳县| 广饶县| 将乐县| 石景山区| 于田县| 资源县|