周 麗,曾蘊(yùn)林,蘇 暢
?
智能化編輯加工系統(tǒng)的應(yīng)用——以《國(guó)際檢驗(yàn)醫(yī)學(xué)雜志》為例
周 麗,曾蘊(yùn)林,蘇 暢
(重慶市衛(wèi)生信息中心,重慶 401120)
隨著網(wǎng)絡(luò)及互聯(lián)網(wǎng)技術(shù)的發(fā)展和普及,越來(lái)越多的期刊和編輯部開(kāi)始使用稿件采編系統(tǒng),傳統(tǒng)的稿件采集形式已成為制約期刊發(fā)展的關(guān)鍵問(wèn)題,辦公自動(dòng)化、網(wǎng)絡(luò)化的實(shí)踐應(yīng)用被期刊社或編輯部所認(rèn)可和接受。借助計(jì)算機(jī)VB(Visual Basic)代碼和宏程序,實(shí)現(xiàn)期刊收稿、組稿、審稿、編輯加工到發(fā)排全過(guò)程的計(jì)算機(jī)系統(tǒng)軟件智能化,可提高編輯的工作效率,擴(kuò)大期刊的影響力。編輯部或期刊社采編系統(tǒng)在實(shí)現(xiàn)過(guò)程管理的基礎(chǔ)上,應(yīng)更加關(guān)注如何在編輯加工過(guò)程中利用智能化計(jì)算機(jī)系統(tǒng)來(lái)提升稿件采集、編審質(zhì)量,而這一部分功能的開(kāi)發(fā)很大程度上依賴于計(jì)算機(jī)數(shù)據(jù)庫(kù)的電子信息資源技術(shù)。因此,計(jì)算機(jī)智能化編輯加工系統(tǒng)的開(kāi)發(fā)已經(jīng)成為科技期刊采編系統(tǒng)的發(fā)展趨勢(shì),也是科技期刊編輯出版的發(fā)展潮流。
智能化;Excel;Word;Visual Basic;宏程序;編輯加工;數(shù)據(jù)庫(kù)
近年來(lái),很多出版部門、期刊社或編輯部為進(jìn)一步完善稿件管理流程,提高工作效率,均使用智能化稿件采編系統(tǒng)來(lái)投審、維護(hù)稿件,同時(shí)稿件采編系統(tǒng)是編輯、作者、讀者、編委間溝通平臺(tái),也是編輯們對(duì)外交流渠道。該系統(tǒng)使編輯進(jìn)行稿件的三審及校對(duì)加工流程更加合理化、程序化[1-2]。
期刊稿件主流智能化采編系統(tǒng)可實(shí)現(xiàn)從作者來(lái)稿到審稿環(huán)節(jié)的全流程管理,相較于傳統(tǒng)收稿和審稿環(huán)節(jié)而言,應(yīng)用優(yōu)勢(shì)明顯。例如,利用網(wǎng)絡(luò)采編系統(tǒng)后,作者通過(guò)在線投稿、網(wǎng)絡(luò)審稿,可有效避免稿件郵寄丟失情況的發(fā)生;另外作者通過(guò)采編系統(tǒng)進(jìn)行投稿時(shí)依據(jù)系統(tǒng)提示填寫(xiě)投稿必要信息,采編系統(tǒng)會(huì)自動(dòng)記錄并存入系統(tǒng)資源庫(kù),同時(shí)使來(lái)稿量和編輯加工量的統(tǒng)計(jì)變得方便快捷,省去了人工登記的時(shí)間,化整為零,提高工作效率。另外,期刊稿件也可通過(guò)該系統(tǒng)實(shí)現(xiàn)全文發(fā)布,提高期刊文章的閱覽量及刊物的影響力。目前,針對(duì)主流智能化采編系統(tǒng)所提供的投稿服務(wù),都是需要作者手動(dòng)復(fù)制粘貼輸入稿件所有必要信息,對(duì)于大部分醫(yī)學(xué)期刊Word稿件,采編系統(tǒng)沒(méi)有自動(dòng)集成作者投稿中有效信息的功能,例如作者、單位、摘要等稿件信息的自動(dòng)提取,有些大牌期刊的采編系統(tǒng)雖涵蓋自動(dòng)提取作者有效信息功能,但如果作者書(shū)寫(xiě)稿件格式不規(guī)范,例如稿件題目過(guò)長(zhǎng),采編系統(tǒng)就會(huì)出現(xiàn)稿件有效信息的漏提或錯(cuò)提的BUG。鑒于此項(xiàng)投稿工作機(jī)械、繁瑣且耗時(shí),占用了大量的時(shí)間成本,而且稿件采編系統(tǒng)中對(duì)于提升論文編輯質(zhì)量方面的服務(wù)則相對(duì)較少,如期刊不常用數(shù)據(jù)單位信息的數(shù)據(jù)庫(kù)也未建立等一系列未解決問(wèn)題,如果能在現(xiàn)有的采編系統(tǒng)中整合作者稿件有效信息的自動(dòng)提取功能,將極大提高稿件收集率,縮短投稿時(shí)間。因此,筆者以所在單位下屬編輯部《國(guó)際檢驗(yàn)醫(yī)學(xué)雜志》為例,介紹一種巧用微軟公司開(kāi)發(fā)的包含協(xié)助開(kāi)發(fā)環(huán)境的事件驅(qū)動(dòng)編程語(yǔ)言VB(Visual Basic)代碼或宏程序提取元數(shù)據(jù)進(jìn)行整合匯總,并建立適合該醫(yī)學(xué)期刊編輯部的不常見(jiàn)指標(biāo)單位數(shù)據(jù)庫(kù)的編輯方式,將采編系統(tǒng)中編輯加工流程與計(jì)算機(jī)軟件程序做到無(wú)縫銜接[3-5]。采用這種智能化編輯加工系統(tǒng)功能不僅對(duì)文章數(shù)據(jù)單位的準(zhǔn)確性進(jìn)行了校對(duì),而且提高了期刊學(xué)術(shù)質(zhì)量及編輯的工作效率,減少了人工編校錯(cuò)誤及機(jī)械重復(fù)勞動(dòng)時(shí)間,實(shí)現(xiàn)了從投稿系統(tǒng)元數(shù)據(jù)提取、稿件內(nèi)容信息整合到醫(yī)學(xué)期刊單位數(shù)據(jù)庫(kù)的建立等智能化運(yùn)用,同時(shí)也實(shí)現(xiàn)行業(yè)期刊編輯思維重新定位和轉(zhuǎn)型升級(jí)。
作者將Word稿件投稿到《國(guó)際檢驗(yàn)醫(yī)學(xué)雜志》時(shí),對(duì)于稿件信息例如題目、作者單位、中英文摘要、關(guān)鍵詞等都需要一一手動(dòng)輸入投稿系統(tǒng)中,這樣增加了投稿時(shí)間,降低了投稿效率。筆者查閱常用的幾款文獻(xiàn)管理軟件Citavi、Mendely、Endnote、Refworks,它們均有免費(fèi)提取稿件信息的功能,但鑒于軟件付費(fèi)版價(jià)格昂貴,很多期刊編輯工作者都會(huì)使用它們免費(fèi)版。有研究者發(fā)現(xiàn),該免費(fèi)版系統(tǒng)軟件會(huì)出現(xiàn)30%的錯(cuò)誤率[2],例如將其稿件自動(dòng)上傳到Mendely、Endnote軟件系統(tǒng)免費(fèi)版或大牌期刊自帶投稿自動(dòng)抓取稿件Word信息系統(tǒng)中,若作者投稿格式不規(guī)范,稿件的第一行非題目?jī)?nèi)容且題目行數(shù)超過(guò)3行以上,就會(huì)出現(xiàn)跳行,采集的數(shù)據(jù)不匹配,而且某些系統(tǒng)軟件會(huì)出現(xiàn)BUG即無(wú)法顯示或題目顯示不全。筆者通過(guò)查看該免費(fèi)版系統(tǒng)軟件的代碼時(shí)發(fā)現(xiàn)題目的行數(shù)一般固定為2行以內(nèi),如果出現(xiàn)副標(biāo)題或者題目字體較大且超過(guò)3行時(shí),該系統(tǒng)軟件就會(huì)出現(xiàn)BUG,因此可以采用Excel中的VB代碼或宏程序來(lái)實(shí)現(xiàn)該系統(tǒng)軟件技術(shù)受限的問(wèn)題。
怎樣才能更加有效地提取作者的題目信息呢,這是當(dāng)前需要解決的首要關(guān)鍵問(wèn)題。筆者經(jīng)過(guò)多層次的計(jì)算機(jī)代碼微程序測(cè)試發(fā)現(xiàn),Word稿件的題目無(wú)論書(shū)寫(xiě)多少行,即使中間出現(xiàn)空格,但最終都以“回車鍵”結(jié)束,而且題目行數(shù)若超過(guò)2行以上,可讓系統(tǒng)繼續(xù)自動(dòng)搜索第3行及以上的題目?jī)?nèi)容。因此我們可以采用計(jì)算機(jī)系統(tǒng)Excel自帶的VB代碼采集稿件的有效信息,筆者先打開(kāi)Excel系統(tǒng)點(diǎn)擊查看代碼調(diào)用VB代碼書(shū)寫(xiě)器界面(見(jiàn)圖1),書(shū)寫(xiě)VB代碼邏輯為根據(jù)題目的第一個(gè)字加上最后的回車鍵來(lái)定位稿件中的題目信息。筆者經(jīng)過(guò)測(cè)試的VB代碼如下:
Sub SELECTION()
Dim S As String, T1, T2, i As Long, mypath As String
S = Dir(ThisDocument.Path & "*.doc*")
Do While S <> ""
If S <> ThisDocument.Name
Then
Set T1 = Documents.Open(ThisDocument.Path & "" & S)
i = 0
Do While i <= 3 '第2頁(yè)已經(jīng)超出標(biāo)題行,這里選2
i = i + 1
S = T1.Paragraphs(i).Range
If Len(S) > 2 Then ThisDocument.Content.InsertAfter S
Loop
T1.Close
End If
S = Dir
Loop
ThisDocument.Save
End Sub
另外,其他的稿件信息由于有特殊的符號(hào)和詞語(yǔ),例如《國(guó)檢檢驗(yàn)醫(yī)學(xué)雜志》作者單位信息都是帶有括號(hào)的形式,中英文摘要、關(guān)鍵詞都以特定詞語(yǔ)如“摘要”或“ABSTRACT”、關(guān)鍵詞或KEY WORDS開(kāi)頭,最后以該段最終的句號(hào)結(jié)束。該信息的VB代碼撰寫(xiě)的邏輯為將變量設(shè)置成這些特定詞到最后的句號(hào),然后進(jìn)行代碼F5執(zhí)行。其他期刊社或編輯部可根據(jù)多樣本量Word稿件格式進(jìn)行匯總和整理,制定固定的投稿Word格式,然后根據(jù)此稿件格式來(lái)編寫(xiě)或錄制VB代碼及宏程序?qū)崿F(xiàn)稿件Word信息的自動(dòng)提取,縮短作者投稿的時(shí)間成本,提高投稿的成功率。
圖1 VB代碼書(shū)寫(xiě)器調(diào)用
圖2 VB代碼調(diào)動(dòng)Excel表格
筆者所在編輯部為了提高引用率在Word稿件的頁(yè)尾處添加了本文引用格式,基于上述自動(dòng)抓取稿件信息代碼,將其優(yōu)化后可提取Word格式文章的關(guān)鍵詞,自動(dòng)在排版文件的頁(yè)尾處生成元數(shù)據(jù),例如“張三,李四,趙五,等.XXXXXX[J].國(guó)際檢驗(yàn)醫(yī)學(xué)雜志,2018,39(1):1-2”。重慶大多數(shù)的期刊都是Word稿件進(jìn)行編校,可以利用計(jì)算機(jī)相關(guān)軟件及編程進(jìn)行書(shū)寫(xiě)VB代碼來(lái)提取Word稿件中重要的元數(shù)據(jù)“作者名字” “頁(yè)碼” “題目”這些字符,然后利用VB代碼自動(dòng)生成本文的引用格式,由于《國(guó)際檢驗(yàn)醫(yī)學(xué)雜志》在科技論文在線和本刊官網(wǎng)上發(fā)布的論文全部免費(fèi)下載,這樣可方便其他作者引用,提高本刊他引率。另外還有一種關(guān)鍵詞的簡(jiǎn)單查找功能服務(wù),例如重慶某些期刊采用八爪魚(yú)或書(shū)寫(xiě)代碼等搜索工具進(jìn)行期刊元數(shù)據(jù)提取,編輯們可根據(jù)需求自行需要選取合適的方式進(jìn)行元數(shù)據(jù)采集。
根據(jù)上文的初步代碼進(jìn)行測(cè)試及優(yōu)化,替換新的所需關(guān)鍵詞進(jìn)行查找和寫(xiě)入引用格式的模板中,同時(shí)參考西南片區(qū)其他期刊編輯代碼,進(jìn)行改寫(xiě),實(shí)現(xiàn)Word稿件的二次功能開(kāi)發(fā)。
Dim arr1 As String
Dim ii,kk As Integer
Set App1 = CreateObject( " EXCEL. Application" )
Set Book1 = App1. Workbooks. Open( " d: symbol. xls" )
Set sheet1 = Book1. Worksheets( " 醫(yī)學(xué)期刊的關(guān)鍵詞" )
App1. Visible = False
Do While sheet1. Cells( ii,1) <> " "
arr1 = sheet1. Cells( ii,2)
If ( arr1 = mytext) Then
‘在數(shù)據(jù)庫(kù)中找到相應(yīng)的關(guān)鍵詞
kk = kk + 1
arr11( j) = sheet1. Cells( ii,1)
j = j + 1
End If
ii = ii + 1
Set App1 = Nothing
ii = 1
Selection. Comments. Add Range: = Selection. Range
Selection. TypeText Text: = mytext +
path = " d: equation”+ arr11(1)
‘顯示出相應(yīng)的關(guān)鍵詞
ActiveWindow. Panes(2) .
Close
《國(guó)際檢驗(yàn)醫(yī)學(xué)雜志》由于內(nèi)容涵蓋醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)相關(guān)內(nèi)容,編輯們?cè)趯徃寤蚋寮庉嫾庸ぶ袝?huì)遇到不熟悉的檢驗(yàn)實(shí)驗(yàn)論文中常用的基因、蛋白、生化指標(biāo)的數(shù)據(jù)單位,需要請(qǐng)教檢驗(yàn)實(shí)驗(yàn)相關(guān)專家或翻閱文獻(xiàn)書(shū)籍進(jìn)行核實(shí)。若編輯們?nèi)翰呷毫χ谱鞒鼍庉嫴皇煜さ珯z驗(yàn)實(shí)驗(yàn)員常用的單位數(shù)據(jù)庫(kù)——Excel表格形式(SHEET1)這樣就會(huì)節(jié)約大量的時(shí)間成本,在以后的稿件Word編輯加工時(shí),遇見(jiàn)不熟悉的數(shù)據(jù)單位時(shí)可利用Word稿件中VB代碼及宏程序調(diào)動(dòng)該數(shù)據(jù)庫(kù)SHEET1來(lái)對(duì)其稿件中檢驗(yàn)實(shí)驗(yàn)數(shù)據(jù)單位進(jìn)行查詢和驗(yàn)證。對(duì)于其他期刊社或編輯部也可以根據(jù)自己的需要進(jìn)行匯總并制作適合本單位使用的數(shù)據(jù)庫(kù)SHEET1,這樣在稿件編輯加工時(shí)就可調(diào)動(dòng)該數(shù)據(jù)庫(kù)SHEET1,有助于科技期刊學(xué)術(shù)質(zhì)量的提高。
調(diào)動(dòng)數(shù)據(jù)庫(kù)SHEET1可采用傳統(tǒng)的Word自帶功能,在“插入”里面選擇“對(duì)象”,再選擇“Microsoft Excel”即可或者通過(guò)以下簡(jiǎn)單VB代碼調(diào)動(dòng)Excel的SHEET1,該VB代碼僅通過(guò)Word VB代碼打開(kāi)Excel小程序,調(diào)用之后的Excel界面如圖2所示,代碼如下。
sub Test()
dim myWorkBook as Excel.WorkBook
set myWorkBook = ActiveWorkBook
msgbox myWorkBook.application.cells(1,1)
end sub
鑒于《國(guó)際檢驗(yàn)醫(yī)學(xué)雜志》每期發(fā)送的清樣稿均為PDF格式,因此需要手動(dòng)剪切大量的PDF作者清樣稿,而且由于給作者群發(fā)清樣稿件的內(nèi)容是相同的模板,如果該流程全部采用一一手動(dòng)剪切PDF清樣稿然后在群發(fā)作者郵箱耗時(shí)耗力。因此,筆者對(duì)智能化編輯加工系統(tǒng)軟件VB代碼及宏程序進(jìn)行了多次測(cè)試與撰寫(xiě),做了大量研究調(diào)查并提出利用Excel宏程序調(diào)用Outlook系統(tǒng)群發(fā)清樣PDF附件的軟件小程序,實(shí)現(xiàn)作者清樣稿件自動(dòng)剪切和清樣稿件的群發(fā)功能[6-8]。其他醫(yī)學(xué)期刊社利用的MAILplus.RAR進(jìn)行群發(fā)稿件等新模式都可打破傳統(tǒng)的手動(dòng)輸入模式,采用小程序軟件系統(tǒng)提高編輯們的時(shí)間成本。
本文詳細(xì)分析和總結(jié)了目前期刊社或編輯部在內(nèi)容資源深度加工的程度、內(nèi)容資源表現(xiàn)形式、信息延伸的范圍、個(gè)性化定制、內(nèi)容資源承載載體等方面的編輯加工特點(diǎn),旨在找到適合國(guó)內(nèi)醫(yī)學(xué)期刊編輯加工新途徑。分析表明,目前國(guó)內(nèi)采編系統(tǒng)還有些尚未解決的技術(shù)問(wèn)題:信息糾錯(cuò)能力較差、數(shù)據(jù)庫(kù)只采集常用數(shù)據(jù)單位信息、不能自動(dòng)提取作者投稿有效信息[9]。此外,目前國(guó)內(nèi)大部分科技期刊采編系統(tǒng)對(duì)傳統(tǒng)出版的內(nèi)容資源缺乏整合和深度加工,無(wú)法把它們開(kāi)發(fā)成可以再利用的產(chǎn)品有針對(duì)性地供醫(yī)學(xué)期刊編輯使用,難以滿足人工智能時(shí)代下對(duì)編輯的新要求?!袄肊xcel的宏程序及VB代碼對(duì)Word投稿稿件二次功能的開(kāi)發(fā)”角度對(duì)元數(shù)據(jù)進(jìn)行搜索、內(nèi)容進(jìn)行重新組裝,采用根據(jù)醫(yī)學(xué)期刊個(gè)性化定制不常見(jiàn)指標(biāo)單位數(shù)據(jù)庫(kù)及醫(yī)學(xué)類期刊關(guān)鍵信息的提取等編輯加工新模式,針對(duì)主流采編系統(tǒng)開(kāi)發(fā)實(shí)用型編輯加工小程序是目前亟待解決的問(wèn)題[7,10]。
[1] 黃莘,漆蓉,稅紅,等.稿件采編系統(tǒng)的操作分析[J].編輯學(xué)報(bào),2008,20(2):153-154.
[2] 張曉麗,武文.稿件采編系統(tǒng)在期刊聯(lián)合編輯部的應(yīng)用實(shí)踐與探索[J].編輯學(xué)報(bào),2012,24(3):272-273.
[3] 劉鐵英,黃春燕,熊光欣,等.基于WORD VBA的作者單位名稱快速修訂方法[J].編輯學(xué)報(bào),2013,25(1): 76-78.
[4] 陳庭木,徐大勇,秦德榮,等.偏相關(guān)與通徑分析的EXCEL VBA 程序設(shè)計(jì)[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2007(3):101- 103.
[5] 喻革武.EXCEL中VBA編程語(yǔ)言的命令介紹及編程[J].電腦學(xué)習(xí),2001(4):30-31.
[6] 周麗.分割PDF文件的幾種常用方式[J].新聞研究導(dǎo)刊,2015(12):353-354.
[7] 高飛,李彥春,尹世堂,等.大學(xué)學(xué)報(bào)稿件管理系統(tǒng)流程分析與軟件開(kāi)發(fā)[J].中國(guó)科技期刊研究,2010(5): 518-521.
[8] 周麗.outlook系統(tǒng)在編務(wù)工作中應(yīng)用探析[J].出版與印刷,2014(2):15-17.
[9] 劉巖,劉鵬.應(yīng)用VB和Access數(shù)據(jù)庫(kù)設(shè)計(jì)開(kāi)發(fā)學(xué)報(bào)稿件管理系統(tǒng)[J].中國(guó)科技期刊研究,2010(3):339- 342.
[10] 梁建雋.VBA 編程與函數(shù)應(yīng)用的比較[J].蘭州交通大學(xué)學(xué)報(bào),2012,31(6):94-96.
蘇 暢,E-mail: 2442103004@qq.com