周 麗,曾蘊林,張耀元,蘇 暢
(重慶市衛(wèi)生信息中心 重慶401120)
隨著人工智能技術(shù)的飛速發(fā)展,出版業(yè)格局將被重構(gòu),科技期刊也成為人工智能直接影響的重要領(lǐng)域??萍计诳l(fā)展規(guī)劃中添加了“人工智能”這一催化劑,作為新時代的科技期刊編輯無疑應(yīng)逐步學(xué)會將人工智能技術(shù)運用到期刊編輯模式中,積極建立科技期刊智能化投稿系統(tǒng),加快實現(xiàn)人工智能編輯和傳統(tǒng)編輯的協(xié)同工作模式[1-4]。在編輯工作中常見的一些科技期刊非智能化投稿系統(tǒng),很難快速檢索并提取稿件信息,如果想高效地提取稿件中某一特定內(nèi)容,可采用正則表達式測試工具實現(xiàn)稿件內(nèi)容自動提取,同時還可利用PDF稿件自動分割器來分割整期PDF稿件成單篇PDF文章,或者在Word稿件中自動調(diào)用預(yù)先整理好的專業(yè)數(shù)據(jù)單位Excel,這樣可以做到及時編輯校對,提高編輯工作效率。下面筆者介紹幾種應(yīng)用于編輯工作中簡易的計算機微軟件工具,期望能優(yōu)化期刊編輯的工作模式,實現(xiàn)編輯模式的革新與發(fā)展,提升新時代期刊業(yè)的核心競爭力[5-6]。
正則表達式(regular expression)是一種文本模式,包括普通字符(例如a~z之間的字母)和特殊字符(稱為“元字符”)。正則表達式使用單個字符串來描述、匹配一系列符號某個句法規(guī)則串。正則表達式雖然代碼書寫繁瑣,但它功能強大,如果將其運用在期刊稿件投稿系統(tǒng)中會使編輯工作變得高效、快捷。編輯可以將它和投稿系統(tǒng)做相應(yīng)銜接,實現(xiàn)對稿件中要素的提取。例如作者在期刊官網(wǎng)投稿系統(tǒng)中上傳稿件時,需要提交稿件中摘要的四要素信息(目的、方法、結(jié)果、結(jié)論),很多期刊官網(wǎng)都還是采用傳統(tǒng)的編輯模式,讓作者手動填寫稿件基本信息,其實我們可利用計算機微工具正則表達式來實現(xiàn)自動提取四要素信息功能。編輯可以通過網(wǎng)絡(luò)免費下載RegEx Tester.exe軟件應(yīng)用,它幾乎支持所有編程語言,因此功能很強大,且無論什么計算機語言如JAVA、C語言等都可以自動識別。只需將稿件內(nèi)容粘貼到Test Text中,然后在Regular Expression按照四要素的規(guī)則填入該工具中即可,如圖1所示。提取稿件中的摘要信息的正則表達式為:^【摘要】(s)*目的(?<目的>.*(.|。)?)方法(?<方法>.*(.|。)?)結(jié)果(?<結(jié)果>.*(.|。)?)結(jié)論(?<結(jié)論>.*(.|。)?)$,可以將編寫好的內(nèi)容輸入到對話框中,然后勾選選項。這樣Test Results中就會自動篩選出目的、方法、結(jié)果、結(jié)論。另外為了避免正則表達式測試工具中的BUG,可以將稿件Word內(nèi)容先粘貼在TXT文檔中,取消稿件Word的格式,然后進行四要素的提取。這樣可以準確提取稿件的數(shù)據(jù)源,解放了手動復(fù)制粘貼的機械重復(fù)勞動。
圖1 提取摘要規(guī)則Fig.1 Extract abstract rules
科技期刊稿件通常都是采用北大方正排版系統(tǒng)轉(zhuǎn)換成PDF稿件,作者、讀者等可以采用Adobe Reader 閱讀器打開PDF文件,如果想將一整期的PDF稿件分割成單篇PDF文件或者反之單篇文章合并成整期PDF文件,不用通過手動一一提取另存頁面的手動方式進行分割(合并),可以在網(wǎng)絡(luò)上免費下載Ap PDF Split/Merge微軟件進行分割(合并),只需將提取的頁碼寫入該微軟件的分割(合并)區(qū)域設(shè)置中,并設(shè)定分割(合并)目標文件夾的路徑,即可自動生成各個PDF文件,而且該軟件還能進行PDF文件名的編輯和設(shè)定。通過這種小的軟件工具即可實現(xiàn)一分鐘的分割和合并功能,這種編輯模式極大提升了編輯的工作效率及有效時間的利用率[7-9]。
作為專業(yè)期刊如檢驗醫(yī)學(xué)類期刊的編輯,在編輯Word稿件時,遇到作者在Word中書寫的不常用檢驗數(shù)據(jù)單位,需要查閱相關(guān)的文獻或者工具書進行核對,這樣就會大大增加編輯校對時間成本。針對這種情況,編輯可以整理出平時檢驗不常用的數(shù)據(jù)單位的Excel文檔,然后在稿件Word編輯時,調(diào)用Excel或做相反操作,只需用create object函數(shù)創(chuàng)建相應(yīng)的對象,或者用workbooks open(路徑)來打開相應(yīng)的文件,這樣就可以在編輯Word稿件中調(diào)用Excel檢驗數(shù)據(jù)單位信息,達到及時校對數(shù)據(jù)單位的目的,較傳統(tǒng)的編輯校對模式更加快速和準確。
隨著人工智能時代的到來和計算機信息網(wǎng)絡(luò)微軟件工具的優(yōu)化,傳統(tǒng)期刊編輯模式也已悄然發(fā)生了變化,許多紙質(zhì)科技期刊編輯工作已經(jīng)從機械重復(fù)勞動中得到解放,轉(zhuǎn)向人工智能化的編輯模式,科技期刊編輯要不斷思考如何借助計算機軟件工具來提升工作效率[10]??傊谶@個新的智能化的時代,科技期刊面向未來需轉(zhuǎn)型升級,編輯工作模式也必須適時地做出轉(zhuǎn)變來提升科技期刊的整體競爭力。