李新安
摘 要 論文初審是現(xiàn)行期刊的初審、外審、終審的“三審制”中重要的環(huán)節(jié)。而稿件登記和匯總又是初審入口關(guān),在分析稿件登記和匯總目前存在工作量大、容易出錯(cuò)等問(wèn)題后, 設(shè)計(jì)了稿件登記智能化流程,采用Python軟件設(shè)計(jì)了代碼。在實(shí)踐中運(yùn)行成功,保證了準(zhǔn)確性,提高了工作效率。
關(guān)鍵詞 期刊;稿件登記;編程
引言
期刊的論文撰寫和發(fā)表是為了交流、傳播信息,目的是要同行認(rèn)可并利用,通過(guò)符合標(biāo)準(zhǔn)和規(guī)范的編排使讀者能順利地閱讀、迅速而方便地了解和利用論文的內(nèi)容[1]。為此論文的作者和編者都應(yīng)按照科技期刊的要求,遵循規(guī)定的格式,科技論文的基本要素包括:文章題名、作者署名、作者單位、摘要、關(guān)鍵詞、引言、正文、結(jié)論、參考文獻(xiàn)等。但編輯部經(jīng)常收到的論文缺部分要素,有的論文沒(méi)有參考文獻(xiàn),有的文章甚至沒(méi)有作者姓名和作者單位,給編輯部稿件登記和初審帶來(lái)不便[2-4]。同時(shí)為了統(tǒng)計(jì)和以后工作的快捷,稿件的登記常采用Excel表格,目前大多數(shù)文章是Word文檔。編輯部收到的稿件放入一個(gè)文件夾,有的期刊一周能收到好多文章,登記文章時(shí),逐步打開(kāi)Word文檔,把題目、作者、單位等復(fù)制和粘貼到Excel表格中,工作量大,也容易出錯(cuò)。筆者在某編輯部實(shí)習(xí)期間,發(fā)現(xiàn)采用編程和爬蟲技術(shù),可以把收稿文件夾中的Word文檔論文的要素提取出來(lái),自動(dòng)生成到Excel表格中,大大提高效率和準(zhǔn)確性,為編輯部的辦公智能化提高發(fā)揮了一定作用。
1稿件登記智能化流程設(shè)計(jì)
根據(jù)以上采用Visio設(shè)計(jì)的工作流程如圖1所示。
2采用Python編程
具體的編程代碼如下:
from win32com import client as wc
import os
from docx import Document
import pandas as pd
def doc_to_docx(dirpath,path):
file = dirpath + ‘\\ + path
word = wc.Dispatch(‘word.Application)
doc = word.Documents.Open(file)
doc.SaveAs(file.replace(‘.doc,.docx), 12)? # 12表示docx格式
doc.Close()
word.Quit()
os.remove(file)
return file.replace(‘.doc,.docx)
def get_data(dirpath):
for root, dirs, files in os.walk(dirpath):
result_list = []
for i in files:
try:
result_dict = {}
text = []
if i.endswith(‘.doc):
file_name = doc_to_docx(dirpath,i)
document = Document(file_name)? # 打開(kāi)文件demo.docx
for paragraph in document.paragraphs:
c = paragraph.text.replace(‘ ‘,)
if c != ‘:
text.append(c) # 打印各段落內(nèi)容文本
elif i.endswith(‘.docx):
document = Document(dirpath V ‘\\ + i)? # 打開(kāi)文件demo.docx
for paragraph in document.paragraphs:
c = paragraph.text.replace(‘ ‘,)
if c != ‘:
text.append(c)
result_dict[‘稿件名稱] = text[0]
result_dict[‘作者] = text[1]
result_dict[‘作者單位] = text[2].replace(‘(‘,).replace(‘),)
num = 0
for i in range(len(text)):
if ‘寄刊 in text[i]:
result_dict[‘參考文獻(xiàn)數(shù)量] = text[i-1].split(‘])[0].replace(‘[‘,)
result_dict[‘手機(jī)號(hào)碼] = text[-1].split(‘:)[1]
result_list.append(result_dict)
except Exception as e:
print(e)
with open(‘err.txt,w) as f:
f.write(i)
pd.DataFrame(result_list).to_excel(‘收稿件登記簿.xls)
print(‘程序結(jié)束)
if __name__ == ‘__main__:
dirpath = input(‘請(qǐng)輸入存放word文件的絕對(duì)路徑\n)
# print(dirpath)
get_data(dirpath)
運(yùn)行后生成的Excel表如圖2。
收稿件登記簿生成的是Excel格式,便于用于以后本期刊的統(tǒng)計(jì)分析,比如作者單位統(tǒng)計(jì),可以看出那些單位投稿的文章數(shù)量多,高校的文章和科研院所文章投稿數(shù)量對(duì)比,及參考文獻(xiàn)數(shù)量匯總及平均引文數(shù)量統(tǒng)計(jì)等等,以此Excel文檔為基礎(chǔ),還可以擴(kuò)展應(yīng)用到稿酬計(jì)算和給作者寄刊匯總的方面,大大節(jié)省編輯的錄入時(shí)間,提高了工作效率。
3結(jié)束語(yǔ)
在期刊現(xiàn)行的初審、外審、終審的“三審制”中,初審是控制稿件質(zhì)量的入口,是把握刊發(fā)論文學(xué)術(shù)質(zhì)量的第一道防線,而稿件登記是編輯部論文初審環(huán)節(jié)中重要的一環(huán)。針對(duì)這個(gè)環(huán)節(jié),設(shè)計(jì)稿件登記智能化流程 ,并用Python軟件編程,自動(dòng)生成的Excel文檔,便于匯總、統(tǒng)計(jì)、分析,提高了編輯部工作效率。
圖2? 自動(dòng)生成的Excel表格界面
參考文獻(xiàn)
[1] 陳浩元.科技書刊標(biāo)準(zhǔn)化18講[M]北京:北京師范大學(xué)出版社, 1998:101.
[2]張建合.學(xué)術(shù)期刊編輯初審探微[J].編輯學(xué)報(bào),2003,15(1):23-26.
[3] 居自強(qiáng).科技期刊編輯應(yīng)做好文稿的初審工作[J].編輯學(xué)報(bào),2005, 17(1):58-59.
[4] 沈玲.高校學(xué)報(bào)編輯初審探微[J].吉林省經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào),2010,24(6):81-84.