国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

滿文檔案圖像智能處理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

2022-05-25 09:20:32劉柯言黨佳偉鄭蕊蕊賀建軍
關(guān)鍵詞:滿文版面圖像處理

劉柯言,黨佳偉,鄭蕊蕊,周 瑜,賀建軍

(大連民族大學(xué) 信息與通信工程學(xué)院 ,遼寧 大連 116605)

清代中央和地方各級(jí)機(jī)關(guān)處理政務(wù)過(guò)程中形成了大量的滿文古籍檔案,雖然由于戰(zhàn)亂、災(zāi)害等原因沒(méi)有完全保存下來(lái),現(xiàn)存數(shù)量仍然十分巨大,具有重要的歷史、文化研究?jī)r(jià)值和參考憑證作用[1]。目前,中國(guó)第一歷史檔案館所藏的明清檔案總數(shù)達(dá)1 000多萬(wàn)件(冊(cè)),其中明代檔案3 000余件(冊(cè)),僅占館藏檔案的萬(wàn)分之三;而館藏滿文檔案至少有160萬(wàn)件 (冊(cè)),約占館藏檔案的1/6。除中國(guó)第一歷史檔案館之外,遼寧省檔案館也有數(shù)以萬(wàn)計(jì)的滿文檔冊(cè),且不乏珍本善本[2]。

由于滿文古籍檔案種類繁多而且通常退化較嚴(yán)重,因此對(duì)滿文古籍檔案進(jìn)行數(shù)字化處理和有效開(kāi)發(fā)利用,需要對(duì)滿文古籍檔案進(jìn)行掃描、識(shí)別和翻譯。滿文識(shí)別是滿文檔案圖像處理中的重要環(huán)節(jié)之一,近年來(lái)也有許多針對(duì)性的研究。人們?cè)缙趯?duì)于滿文識(shí)別算法的研究是基于基元(字母)切分的,例如文獻(xiàn)[3-4],他們研究了基于模糊串匹配策略的滿文識(shí)別算法,但是這些算法步驟繁瑣,而且滿文檔案的字體和樣式不同,照明、方向、噪音和可變背景色不一致,導(dǎo)致基元的切分與識(shí)別精度上稍有欠缺。文獻(xiàn)[5]建立了一種基于小波神經(jīng)網(wǎng)絡(luò)的基元識(shí)別算法,文獻(xiàn)[6-7]通過(guò)加入后處理機(jī)制來(lái)提升識(shí)別的準(zhǔn)確度。之后,文獻(xiàn)[8-9]分別研究了基于多特征集成的識(shí)別算法和基于多分類器融合的識(shí)別算法。隨著近年來(lái)深度學(xué)習(xí)的興起,人們嘗試從其它角度來(lái)進(jìn)行研究,尤其是整詞的滿文識(shí)別算法,例如文獻(xiàn)[10]建立的基于有向無(wú)環(huán)圖支持向量機(jī)識(shí)別算法以及文獻(xiàn)[11-12]提出了空間金字塔池化深度卷積神經(jīng)網(wǎng)絡(luò)識(shí)別算法。

現(xiàn)有的滿文檔案圖像處理相關(guān)系統(tǒng)十分稀缺,只有中國(guó)第一歷史檔案館與漢王科技股份有限公司合作開(kāi)發(fā)的“滿文檔案圖像識(shí)別軟件系統(tǒng)”[13]。該系統(tǒng)包括滿文檔案圖像識(shí)別軟件,能夠?qū)M文檔案的圖像信息通過(guò)識(shí)別技術(shù)轉(zhuǎn)換成可編輯檢索的文本信息,界面可顯示滿文檔案原圖、滿文轉(zhuǎn)寫(xiě)字母。但是該軟件沒(méi)有公開(kāi),普通群眾無(wú)法使用,而且該軟件必須下載安裝后才可以使用,既占用計(jì)算機(jī)系統(tǒng)空間又缺少便利性,功能相對(duì)單一。

實(shí)際使用中不僅需要識(shí)別和翻譯,還需要對(duì)其進(jìn)行二值化、超分辨率重構(gòu)、版面分析、印章去除等處理。這些數(shù)字化處理方式已經(jīng)有了對(duì)應(yīng)的處理算法,而且取得了不錯(cuò)的成果,但是這些算法沒(méi)有形成應(yīng)用系統(tǒng),只有具備計(jì)算機(jī)編程基礎(chǔ)的人才可能使用,普通的滿文工作者通常不具備這方面的能力,無(wú)法給他們提供直接幫助。而且這些算法都是只專注于單一功能,不能統(tǒng)一協(xié)調(diào)工作,沒(méi)有辦法滿足復(fù)雜的應(yīng)用場(chǎng)景。因此本文主要目的是設(shè)計(jì)并實(shí)現(xiàn)一套滿文檔案圖像智能處理系統(tǒng),采用前后端分離架構(gòu)設(shè)計(jì),前端使用Vue框架構(gòu)建單頁(yè)面應(yīng)用,后端采用微服務(wù)架構(gòu)接入現(xiàn)有的滿文檔案圖像處理算法實(shí)現(xiàn),并且進(jìn)行整合,最終達(dá)到可以線上使用該系統(tǒng)對(duì)滿文檔案圖像進(jìn)行復(fù)雜處理的目的,實(shí)現(xiàn)在線滿文檔案圖像翻譯、滿文檔案圖像預(yù)處理、滿文檔案圖像識(shí)別、滿文檔案圖像版面分割等主要功能。

1 系統(tǒng)架構(gòu)設(shè)計(jì)

實(shí)現(xiàn)滿文檔案圖像智能處理系統(tǒng),需要接入滿文檔案圖像處理的相關(guān)算法,現(xiàn)有的滿文檔案圖像處理算法包括滿文檔案圖像單詞識(shí)別、二值化處理、版面分析、印章去除、文本行分割、超分辨率重構(gòu)[14-18]。這些算法可以支持本系統(tǒng)的功能實(shí)現(xiàn),但是這些算法基于不同的Python版本和不同的機(jī)器學(xué)習(xí)框架,傳統(tǒng)的單體應(yīng)用無(wú)法滿足本系統(tǒng)的需求,因此采用微服務(wù)的架構(gòu)設(shè)計(jì)如圖1所示。整個(gè)系統(tǒng)采用前后端分離的架構(gòu)設(shè)計(jì),分為前端、后端微服務(wù)和數(shù)據(jù)庫(kù)三個(gè)部分。其中后端微服務(wù)部分包括系統(tǒng)業(yè)務(wù)服務(wù)、服務(wù)注冊(cè)與發(fā)現(xiàn)中心和滿文檔案圖像處理服務(wù)。

圖1 技術(shù)架構(gòu)圖

本系統(tǒng)的工作流程是:當(dāng)前端向系統(tǒng)業(yè)務(wù)服務(wù)發(fā)送HTTP請(qǐng)求后,系統(tǒng)業(yè)務(wù)服務(wù)根據(jù)請(qǐng)求的接口處理業(yè)務(wù)邏輯,連接數(shù)據(jù)庫(kù),如果接收到的是需要進(jìn)行滿文檔案圖像處理的請(qǐng)求,那么系統(tǒng)業(yè)務(wù)服務(wù)通過(guò)圖像處理微服務(wù)的名稱即可調(diào)用對(duì)應(yīng)的滿文檔案圖像處理微服務(wù),最后將處理結(jié)果返回給前端界面,供用戶查看。其中基于SpringBoot框架的系統(tǒng)業(yè)務(wù)服務(wù)是整個(gè)系統(tǒng)的重要環(huán)節(jié),處理關(guān)鍵業(yè)務(wù)邏輯,起到樞紐的作用。所以本系統(tǒng)主要設(shè)計(jì)并實(shí)現(xiàn)了以下五個(gè)方面內(nèi)容。

1.1 基于SpringBoot的系統(tǒng)業(yè)務(wù)服務(wù)設(shè)計(jì)

此服務(wù)是系統(tǒng)的關(guān)鍵,連接著前端,數(shù)據(jù)庫(kù),還有圖像處理服務(wù)。前端通過(guò)發(fā)送HTTP請(qǐng)求到本服務(wù),根據(jù)接口的不同,進(jìn)行相應(yīng)的業(yè)務(wù)處理,或操作數(shù)據(jù)庫(kù),或連接圖像處理服務(wù),拿到圖像處理服務(wù)的處理結(jié)果后返回給前端,就完成了一次完整的通信。此服務(wù)采用SpringBoot框架[19]進(jìn)行開(kāi)發(fā)。

Spring框架功能十分強(qiáng)大,在Java開(kāi)發(fā)的領(lǐng)域占有很大的市場(chǎng)份額,但是就算是一個(gè)很簡(jiǎn)單的項(xiàng)目,也需要經(jīng)過(guò)復(fù)雜的配置才能實(shí)現(xiàn)。因此就有了SpringBoot框架,它的特點(diǎn)就是能夠自動(dòng)配置,只要存在相應(yīng)的jar包,Spring就會(huì)進(jìn)行自動(dòng)配置。如果默認(rèn)配置不能滿足系統(tǒng)需求,則可以通過(guò)替換掉自動(dòng)配置類,實(shí)現(xiàn)自定義配置。除此而外,SpringBoot還集成了嵌入式的Web服務(wù)器,系統(tǒng)監(jiān)控等部分常用的功能,能夠快速構(gòu)建企業(yè)級(jí)應(yīng)用程序,而且SpringBoot和SpringCloud框架由同一公司開(kāi)發(fā),具有相似的開(kāi)發(fā)流程,配合使用可以提高開(kāi)發(fā)速度,實(shí)現(xiàn)快速搭建微服務(wù)架構(gòu),滿足本系統(tǒng)要求。

該服務(wù)采用Spring MVC的設(shè)計(jì)模式,因?yàn)楸鞠到y(tǒng)采用前后端分離的開(kāi)發(fā)模式,所以此部分不處理任何界面相關(guān)內(nèi)容,只負(fù)責(zé)處理web前端發(fā)來(lái)的請(qǐng)求,并且返回前端需要的數(shù)據(jù)內(nèi)容。如果需要對(duì)圖像進(jìn)行處理,那么系統(tǒng)業(yè)務(wù)服務(wù)就會(huì)向滿文檔案圖像處理服務(wù)發(fā)送HTTP請(qǐng)求,得到處理結(jié)果后,再返回給前端用于顯示。該服務(wù)采用常用的分層設(shè)計(jì),共分為Dao層、Service層、Controller層三個(gè)層級(jí)。

Dao層即數(shù)據(jù)持久層,也被稱為Mapper層。它的作用是訪問(wèn)數(shù)據(jù)庫(kù),向數(shù)據(jù)庫(kù)發(fā)送SQL語(yǔ)句,完成增刪改查任務(wù)。

Service層即業(yè)務(wù)邏輯層,其作用是完成功能設(shè)計(jì),Service層調(diào)用Dao層接口,接受Dao層返回的數(shù)據(jù),完成項(xiàng)目的基本功能設(shè)計(jì)?;蛘呦驁D像處理服務(wù)發(fā)送請(qǐng)求,并且接收處理結(jié)果。

Controller層即控制層,功能為請(qǐng)求和響應(yīng)控制,是前后臺(tái)交接部分,接受前端請(qǐng)求,調(diào)用Service層,接收Service層返回的數(shù)據(jù),最后返回和前端約定的數(shù)據(jù)到前端。

1.2 基于Flask框架的滿文檔案圖像處理服務(wù)設(shè)計(jì)

現(xiàn)有的滿文檔案圖像處理算法主要有兩種實(shí)現(xiàn)方式:一是利用Python開(kāi)發(fā)語(yǔ)言,通過(guò)Tensorflow機(jī)器學(xué)習(xí)框架實(shí)現(xiàn),并且依賴的Python版本和Tensorflow版本存在不同;二是利用Matlab實(shí)現(xiàn)。所以接入這些算法面臨的難點(diǎn)是如何統(tǒng)一封裝,形成可以調(diào)用的接口。Python語(yǔ)言號(hào)稱膠水語(yǔ)言,能夠通過(guò)特定的依賴包調(diào)用Matlab算法,這樣利用Python可以將所有算法進(jìn)行整合。滿文檔案圖像處理服務(wù)只需要提供接口,不做其他處理,因此需要借助輕量級(jí)Flask框架實(shí)現(xiàn)。Flask框架是一個(gè)使用Python編寫(xiě)的Web應(yīng)用程序框架,該框架的特點(diǎn)是輕量級(jí)、可拓展性強(qiáng)[20]。在此基礎(chǔ)上,根據(jù)Python版本和算法依賴包的版本區(qū)別,創(chuàng)建多個(gè)基于Flask框架的圖像處理微服務(wù),將所有滿文檔案圖像處理算法進(jìn)行單獨(dú)封裝,形成接口供系統(tǒng)業(yè)務(wù)服務(wù)進(jìn)行調(diào)用。解決了算法語(yǔ)言多樣,版本多樣的難點(diǎn),具有靈活性高,安全性強(qiáng)的特點(diǎn)。

1.3 基于SpringCloud框架的服務(wù)注冊(cè)與發(fā)現(xiàn)中心設(shè)計(jì)

建立基于SpringCloud框架的微服務(wù)系統(tǒng),整合基于Flask的滿文檔案圖像處理算法服務(wù)和基于SpringBoot的系統(tǒng)業(yè)務(wù)服務(wù)。系統(tǒng)業(yè)務(wù)服務(wù)需要調(diào)用滿文檔案圖像處理算法接口,但是直接調(diào)用圖像處理算法接口存在諸多問(wèn)題,比如需要指定請(qǐng)求地址或是無(wú)法準(zhǔn)確定位錯(cuò)誤信息等。所以需要一個(gè)整體的框架來(lái)解決服務(wù)治理,統(tǒng)籌管理所有的服務(wù)。SpringCloud是一個(gè)從全局出發(fā)的微服務(wù)整理治理框架,它將所有注冊(cè)到其中的單體微服務(wù)進(jìn)行統(tǒng)一管理,為各個(gè)微服務(wù)之間提供集成服務(wù),其中包括配置管理、服務(wù)發(fā)現(xiàn)、斷路器、路由等??梢杂肧pringBoot的開(kāi)發(fā)風(fēng)格做到一鍵啟動(dòng)和部署。并且SpringCloud的微服務(wù)核心組件Eureka可以支持Python。所以本文使用SpringCloud微服務(wù)框架,可以將基于SpringBoot的系統(tǒng)業(yè)務(wù)服務(wù)和基于Flask的圖像處理算法服務(wù)整合到微服務(wù)架構(gòu)中,實(shí)現(xiàn)算法調(diào)用。

1.4 基于Vue框架的前端系統(tǒng)設(shè)計(jì)

建立基于Vue的前端系統(tǒng),實(shí)現(xiàn)系統(tǒng)的頁(yè)面展示和邏輯處理。傳統(tǒng)的Web開(kāi)發(fā)往往和后端服務(wù)系統(tǒng)集成在一個(gè)工程目錄中,依賴于后端工程才能開(kāi)發(fā)調(diào)試。這就導(dǎo)致開(kāi)發(fā)過(guò)程必須同步進(jìn)行,影響開(kāi)發(fā)效率?;赩ue的前端系統(tǒng)可以單獨(dú)啟動(dòng),通過(guò)和后端服務(wù)約定通信格式,即可單獨(dú)開(kāi)發(fā),通過(guò)HTTP協(xié)議和后端進(jìn)行通信。而且具有開(kāi)發(fā)效率高,打包部署便利等優(yōu)點(diǎn)[21]。

1.5 基于MySQL的數(shù)據(jù)庫(kù)設(shè)計(jì)

數(shù)據(jù)庫(kù)是系統(tǒng)開(kāi)發(fā)的重要環(huán)節(jié),其中保存著大量的用戶數(shù)據(jù),包括用戶信息,歷史記錄等。MySQL作為一款開(kāi)源軟件,可以免費(fèi)使用和修改,支持SQL查詢語(yǔ)言,加上其快速的處理速度使它在世界范圍內(nèi)都深受喜愛(ài)。本文使用MySQL關(guān)系型數(shù)據(jù)庫(kù)存儲(chǔ)系統(tǒng)數(shù)據(jù),并且設(shè)計(jì)了符合系統(tǒng)要求的數(shù)據(jù)庫(kù)表。

本系統(tǒng)數(shù)據(jù)庫(kù)設(shè)計(jì)了user、mw _func、mw_image_processing_history、mw_resource、mw_dict、mw_mw等六個(gè)數(shù)據(jù)表,其中用戶表用于保存用戶的基本信息,包括編號(hào)、登錄賬號(hào)、密碼、用戶姓名、角色身份等。圖像處理功能表主要包括功能名稱、功能描述、啟用狀態(tài)等信息,該表用于保存圖像處理功能的基本信息。歷史記錄表主要包括用戶ID、處理時(shí)長(zhǎng)、處理結(jié)果、輸入數(shù)據(jù)、輸出數(shù)據(jù)等,該表用于保存用戶操作的歷史記錄信息。文件資源表主要包括原始名稱、新名稱、保存路徑、創(chuàng)建時(shí)間等,該表用于保存用戶上傳的圖片、PDF文件、ZIP壓縮包等資源信息以及在系統(tǒng)中的存儲(chǔ)位置。滿文翻譯表主要包括滿文拉丁字母轉(zhuǎn)寫(xiě)、中文釋義、備注等,用于滿文翻譯。滿文單詞表主要包括滿文文字,其中id字段和mw_dict表中的id對(duì)應(yīng),該表用于查詢滿文單詞。

2 系統(tǒng)功能設(shè)計(jì)

本系統(tǒng)主要功能主要包含四大模塊如圖2。檔案預(yù)處理模塊、檔案版面分析模塊、檔案識(shí)別模塊、單詞翻譯模塊。

圖2 功能架構(gòu)設(shè)計(jì)

2.1 檔案預(yù)處理

檔案預(yù)處理模塊包括二值化、超分辨率重構(gòu)和印章去除功能。

二值化:二值化就是將用戶輸入的滿文檔案圖像上像素點(diǎn)的灰度值設(shè)置為0或255,從而使整個(gè)圖像呈現(xiàn)出明顯的黑白效果的過(guò)程。能夠清楚的區(qū)分滿文檔案圖像中的文字和背景,提高清晰度,也有利于提高其他算法的準(zhǔn)確度。

超分辨率重構(gòu):超分辨率重構(gòu)可以提高用戶輸入的滿文檔案圖像的分辨率,通過(guò)特定的算法計(jì)算,將低分辨率的圖像轉(zhuǎn)化成一幅高分辨率的圖像過(guò)程就是超分辨率重構(gòu)。通過(guò)超分辨率重構(gòu)能夠提高圖片的像素質(zhì)量,提高圖片清晰度,便于用戶的查看。

印章去除:印章去除是通過(guò)算法將圖片中的印章部分去掉,從而得到新的圖像的過(guò)程。通過(guò)印章去除能夠去掉滿文檔案圖像中無(wú)用信息,便于用戶的查看,也有利于降低印章對(duì)滿文檔案圖像的影響,提高其他算法的準(zhǔn)確度。

2.2 檔案版面分析

檔案版面分析模塊包括文本行分割和版面分割功能。

文本行分割:每張滿文檔案圖像通常都包含大量的文本信息,整篇幅的文本信息無(wú)法進(jìn)行細(xì)化的識(shí)別和處理,因此有必要將整篇的滿文檔案圖像切分成 單獨(dú)的滿文圖像進(jìn)行處理。在此基礎(chǔ)上便于實(shí)現(xiàn)滿文的識(shí)別與翻譯。文本行分割滿文檔案圖像,能夠?qū)⒁?guī)范的滿文檔案圖像以字符為單位,切分成一個(gè)個(gè)單獨(dú)的滿文單詞圖像,便于之后進(jìn)行復(fù)雜的滿文圖像處理。

版面分割:版面分割就是對(duì)滿文檔案版面中不同區(qū)域的類別進(jìn)行檢測(cè)和分割。滿文檔案圖像的版面分割能夠標(biāo)記和提取文檔圖像中的主要和次要信息,例如正文、標(biāo)題和頁(yè)碼等,對(duì)于用戶查看和滿文檔案識(shí)別具有重要意義。

2.3 檔案識(shí)別

檔案識(shí)別模塊包括單詞識(shí)別和檔案識(shí)別功能。

單詞識(shí)別:每張滿文檔案圖像通常都由許多滿文單詞構(gòu)成,要實(shí)現(xiàn)滿文檔案圖像的識(shí)別,首先要滿足單詞圖像的識(shí)別,通過(guò)對(duì)單詞圖像的識(shí)別,得到該單詞的拉丁字母轉(zhuǎn)寫(xiě)。

檔案識(shí)別:每張滿文檔案圖像通常都包含大量滿文單詞,識(shí)別單詞圖像在此種情況下效率并不高效,因此需要識(shí)別滿文檔案圖像,此功能的實(shí)現(xiàn)借助于文本行分割算法,將滿文檔案分割成多個(gè)單詞圖像,在此基礎(chǔ)上進(jìn)行單詞識(shí)別,最終得到文檔中所有滿文單詞的拉丁轉(zhuǎn)寫(xiě),提高識(shí)別效率。

2.4 單詞翻譯

單詞翻譯模塊包括單詞圖像翻譯和單詞轉(zhuǎn)寫(xiě)翻譯功能。

單詞轉(zhuǎn)寫(xiě)翻譯:滿文單詞可以遵循指定的標(biāo)準(zhǔn)轉(zhuǎn)化成拉丁字母轉(zhuǎn)寫(xiě),本系統(tǒng)的轉(zhuǎn)寫(xiě)規(guī)則依據(jù)《新滿漢大辭典》,并將轉(zhuǎn)寫(xiě)字母和中文翻譯保存在數(shù)據(jù)庫(kù)。此功能根據(jù)用戶輸入的拉丁轉(zhuǎn)寫(xiě)字母來(lái)查詢數(shù)據(jù)庫(kù),即可獲得該轉(zhuǎn)寫(xiě)字母的滿文單詞和中文翻譯。

單詞圖像翻譯:用戶輸入一張滿文單詞圖像,根據(jù)單詞識(shí)別算法,可以獲得該單詞的拉丁字母轉(zhuǎn)寫(xiě),再通過(guò)查詢數(shù)據(jù)庫(kù)中保存的轉(zhuǎn)寫(xiě)、滿文單詞和中文翻譯的對(duì)應(yīng)關(guān)系,即可實(shí)現(xiàn)滿文單詞的翻譯。

3 關(guān)鍵算法

滿文檔案圖像處理功能依賴相關(guān)算法,下面對(duì)本文使用到的關(guān)鍵算法進(jìn)行簡(jiǎn)要介紹。

3.1 二值化算法

本文使用到的滿文檔案圖像二值化算法是源于霍小娜提出的“滿文歷史文檔圖像二值化方法研究”[14]。該論文提出了一種基于U型卷積神經(jīng)網(wǎng)絡(luò)的滿文歷史文檔圖像二值化方法。該方法采用分塊同態(tài)濾波操作對(duì)圖像進(jìn)行預(yù)處理,然后再通過(guò)U型卷積神經(jīng)網(wǎng)絡(luò)對(duì)滿文歷史文檔圖像進(jìn)行前景和背景分割,可以得到性能良好的二值化圖像。

3.2 超分辨率重構(gòu)算法

本文使用到的滿文檔案圖像超分辨率重構(gòu)算法是源于畢加晶的“滿文數(shù)據(jù)生成方法研究”論文[15]。此論文建立了一種基于SRGAN的滿文圖像超分辨率重建模型,與SRCNN方法、最近鄰插值法以及雙三次插值法等重建方法相比,此方法可以取得更好的視覺(jué)效果。

3.3 印章去除算法

本文使用到的滿文檔案圖像印章去除算法是源于盧海濤的“基于深度學(xué)習(xí)技術(shù)的滿文檔案圖像印章檢測(cè)與去除方法”論文[16]。該論文提出“基于深度生成對(duì)抗網(wǎng)絡(luò)的滿文檔案圖像印章去除方法”,該模型由生成器與判別器組成,在生成器的設(shè)計(jì)中使用具有U-Net結(jié)構(gòu)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合的方式,在判別器中構(gòu)建了一個(gè)全卷積神經(jīng)網(wǎng)絡(luò)的PatchGan網(wǎng)絡(luò),并且結(jié)合印章去除的任務(wù)設(shè)計(jì)了一個(gè)適合印章去除的損失函數(shù),在新的損失函數(shù)中加大對(duì)印章區(qū)域的懲罰,讓印章去除模型能集中注意力去除印章區(qū)域,也盡量減少非印章區(qū)域的文檔部分細(xì)節(jié)的損失。

3.4 文本行分割算法

本文使用到的滿文檔案圖像文本行分割算法是源于張晶提出的“基于縫隙裁剪的滿文單詞分割和提取方法研究”[17]。該文提出了一種基于縫隙剪裁的滿文檔案圖像單詞分割和提取方法。首先,通過(guò)投影輪廓匹配策略初步涂抹并確定文本列數(shù)目;然后,在相鄰文本列間自底向上地進(jìn)行動(dòng)態(tài)規(guī)劃,尋找最小能量線,并通過(guò)中線區(qū)域約束得到不損壞滿文文字部件的最佳分割線;最后,依據(jù)分割線提取獨(dú)立滿文文本列進(jìn)而提取滿文單詞。

3.5 版面分割算法

本文使用到的滿文檔案圖像版面分割算法來(lái)自陳璇的“基于深度學(xué)習(xí)的滿文檔案版面分析方法研究”論文[18]。該論文提出了基于Mask R-CNN的滿文檔案版面分析方法MDLA_Mask R-CNN(Manchu Document Layout Analysis based on Mask R-CNN),在該模型中,首先將滿文檔案圖像送入到特征提取網(wǎng)絡(luò)中進(jìn)行特征提取,生成特征圖;然后將生成的特征圖輸入到RPN網(wǎng)絡(luò)中生成區(qū)域建議框并完成第一次區(qū)域建議框的修訂;再把區(qū)域建議框和由特征提取生成的最高維特征圖傳入到RoI Align層,RoI Align層提取出區(qū)域建議框?qū)?yīng)的特征并將其轉(zhuǎn)化為固定值;通過(guò)全連接層完成類別預(yù)測(cè)和邊框回歸,經(jīng)過(guò)FCN全卷積神經(jīng)網(wǎng)絡(luò)對(duì)感興趣區(qū)域的像素進(jìn)行分類并得到mask預(yù)測(cè);最終實(shí)現(xiàn)滿文檔案圖像的實(shí)例分割,從而完成滿文檔案版面分析任務(wù)。

3.6 單詞識(shí)別算法

本文單詞識(shí)別算法是基于ATTENTION機(jī)制的滿文單詞圖像識(shí)別方法,該模型網(wǎng)絡(luò)有兩個(gè)部分:編碼層與解碼層。

編碼層方面包括卷積層,循環(huán)編碼層。其中卷積層使用了ResNet殘差網(wǎng)絡(luò)進(jìn)行特征提取,通過(guò)多個(gè)殘差單元與卷積核對(duì)滿文圖像進(jìn)行多層次的特征提取,而后再通過(guò)全連接操作對(duì)特征進(jìn)行序列疊加,最終得到特征序列。而循環(huán)編碼層使用了雙向LSTM循環(huán)神經(jīng)網(wǎng)絡(luò),對(duì)比單向LSTM循環(huán)神經(jīng)網(wǎng)絡(luò),能夠從正向與逆向?qū)μ卣餍蛄羞M(jìn)行運(yùn)算,從而加強(qiáng)了圖像文字信息的依賴性。

解碼層方面,使用了ATTENTION機(jī)制與LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)合的方法進(jìn)行文字的解碼輸出工作。整個(gè)解碼工作分為三個(gè)步驟:首先,利用LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)隱藏狀態(tài)與上層的BiLSTM雙向循環(huán)神經(jīng)網(wǎng)絡(luò)所提取的特征序列進(jìn)行相關(guān)性計(jì)算,再通過(guò)歸一化的方式對(duì)不同的特征序列進(jìn)行不同的權(quán)重分配。而后,特征序列通過(guò)與權(quán)重進(jìn)行加權(quán)和計(jì)算產(chǎn)生所需關(guān)鍵特征信息。最后,通過(guò)循環(huán)產(chǎn)生的關(guān)鍵特征信息結(jié)合LSTM網(wǎng)絡(luò),對(duì)文字圖像進(jìn)行序列識(shí)別。

3.7 滿文單詞轉(zhuǎn)寫(xiě)拉丁字母標(biāo)準(zhǔn)

滿文單詞識(shí)別需要依據(jù)相應(yīng)的標(biāo)準(zhǔn),將滿文字母轉(zhuǎn)寫(xiě)成拉丁字母。滿文共有35個(gè)字母,其中包括6個(gè)元音字母,19個(gè)輔音字母以及10個(gè)特定字母,滿文字母分為單寫(xiě),字首,字中和字尾四種形式,其中相同字母連接不同元音時(shí)寫(xiě)法也會(huì)不同。隨著現(xiàn)代語(yǔ)言學(xué)研究方法和現(xiàn)代計(jì)算機(jī)技術(shù)在滿文研究中的應(yīng)用,使用拉丁字母轉(zhuǎn)寫(xiě)已然成為滿文研究和教學(xué)中最基本的方法,因此,本文將構(gòu)建滿文字母表的字符轉(zhuǎn)寫(xiě)成拉丁字母表的字符,在構(gòu)建滿文文字符號(hào)系統(tǒng)轉(zhuǎn)換為拉丁文符號(hào)系統(tǒng)的時(shí)候,首先考慮的是得出拉丁字母表的字符同滿文字母表字符的一一對(duì)應(yīng)關(guān)系。目前通用的有穆林多夫轉(zhuǎn)寫(xiě)字符,太清轉(zhuǎn)寫(xiě)字符,本文采用的是《新滿漢大詞典》轉(zhuǎn)寫(xiě)字符,見(jiàn)表1。本詞典的轉(zhuǎn)寫(xiě)字符有兩個(gè)特點(diǎn),一是注意轉(zhuǎn)寫(xiě)字符內(nèi)部的系統(tǒng)性,二是盡可能不用附加符號(hào)而用雙字母,只有在以h起頭的音節(jié)前面出現(xiàn)s的情況下,要在s和h中間加上一個(gè)隔音符號(hào)(’)。

表1 滿文單詞轉(zhuǎn)寫(xiě)拉丁字母方案

4 系統(tǒng)實(shí)現(xiàn)

在本系統(tǒng)采用B/S架構(gòu),在開(kāi)發(fā)過(guò)程中,前端開(kāi)發(fā)采用了Vue框架,引入了UI框架Ant-Design-Vue,引入Echarts顯示圖表,引入基于Promise的HTTP客戶端Axios。后端采用微服務(wù)架構(gòu),包括基于SpringBoot框架的系統(tǒng)業(yè)務(wù)服務(wù),基于SpringCloud的服務(wù)注冊(cè)與發(fā)現(xiàn)中心,基于Flask 的圖像處理服務(wù)。后端服務(wù)間依賴Eureka組件互相聯(lián)系,確保服務(wù)間調(diào)用。數(shù)據(jù)庫(kù)使用關(guān)系型數(shù)據(jù)庫(kù)MySql,根據(jù)系統(tǒng)需要設(shè)計(jì)出對(duì)應(yīng)的數(shù)據(jù)表。最終系統(tǒng)實(shí)現(xiàn)效果如圖3。

a) 系統(tǒng)主頁(yè)

5 結(jié) 語(yǔ)

本文通過(guò)調(diào)研發(fā)現(xiàn),目前市面上的滿文處理系統(tǒng)缺少二值化處理、印章去除、版面分析等功能,為了實(shí)現(xiàn)這些功能,調(diào)研了現(xiàn)在已經(jīng)實(shí)現(xiàn)的滿文檔案圖像處理算法,這些算法能夠?qū)M文檔案圖像進(jìn)行相應(yīng)的處理,因此設(shè)計(jì)并實(shí)現(xiàn)滿文檔案圖像智能處理系統(tǒng),本系統(tǒng)實(shí)現(xiàn)了滿文檔案預(yù)處理、版面分析、檔案識(shí)別和單詞翻譯等功能模塊,模塊間可以相互配合使用,可解決復(fù)雜的滿文檔案圖像處理問(wèn)題。系統(tǒng)采用前后端分離的架構(gòu)設(shè)計(jì),前端采用Vue框架構(gòu)建單頁(yè)面應(yīng)用,后端部分采用微服務(wù)的架構(gòu)設(shè)計(jì),解決跨語(yǔ)言調(diào)用、依賴包版本沖突和算法更新問(wèn)題。本系統(tǒng)的實(shí)現(xiàn),不僅有利于提升滿文檔案數(shù)字化、智能化處理的工作效率,推動(dòng)滿文檔案更廣泛地利用,而且也可為其它少數(shù)民族古籍檔案處理系統(tǒng)的設(shè)計(jì)和開(kāi)發(fā)提供經(jīng)驗(yàn)和參考。

猜你喜歡
滿文版面圖像處理
機(jī)器學(xué)習(xí)在圖像處理中的應(yīng)用
電子制作(2018年18期)2018-11-14 01:48:20
模糊圖像處理,刑事偵查利器
圖像處理技術(shù)的實(shí)戰(zhàn)應(yīng)用
版面擷英
好版面要有獨(dú)到的創(chuàng)新技巧
新聞傳播(2016年3期)2016-07-12 12:55:35
滿文檔案所見(jiàn)厄魯特源流
版面“三評(píng)”看得失
新聞前哨(2015年2期)2015-03-11 19:29:25
三田渡漢文滿文蒙古文碑文對(duì)比研究
Photo Shop通道在圖像處理中的應(yīng)用
河南科技(2014年1期)2014-02-27 14:04:06
新版面 新視角
臺(tái)聲(2014年9期)2014-02-13 08:11:56
孝昌县| 交城县| 宝兴县| 拜城县| 石景山区| 鄂州市| 德惠市| 南华县| 河西区| 闽清县| 丹巴县| 任丘市| 奈曼旗| 洛阳市| 博白县| 民乐县| 汾西县| 克山县| 云梦县| 邳州市| 宿州市| 永修县| 麻城市| 吉首市| 孟津县| 定襄县| 额敏县| 湘西| 西畴县| 铜鼓县| 桃园市| 灌南县| 康马县| 宁乡县| 岑巩县| 霍州市| 新建县| 新余市| 会昌县| 襄汾县| 南宫市|