国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

區(qū)塊鏈和人工智能技術在銀行電子檔案管理中的應用研究

2021-03-02 17:37:01熊志正
檔案管理 2021年1期
關鍵詞:會計檔案電子檔案區(qū)塊鏈

熊志正

摘? 要:本文給出了利用這些新興技術解決銀行檔案管理的現(xiàn)實問題的方法:采用區(qū)塊鏈技術,保障了電子檔案的安全可信性;采用智能OCR技術和知識圖譜技術,實現(xiàn)了高級檢索功能并充分挖掘了檔案內(nèi)蘊藏的價值,為客戶營銷和可疑用戶分析提供了幫助和支撐。

關鍵詞:會計檔案;電子檔案;可信度;區(qū)塊鏈;人工智能

Abstract: This paper exploits these emerging technologies to handle problems faced in bank electronic Archives management. Block chain guarantees the safety and confidence of the electronic Archives. Combining AI-OCR and knowledge graph will provide advanced retrieval function and fully mine the internal value of these Archives.

Keywords: Accounting Archives; Electronic Archives; Confidence level; Block chain; Artificial intelligence.

本文側(cè)重研究銀行進行電子檔案管理的方法以及面臨的挑戰(zhàn)和對策。

1 銀行電子檔案管理功能框架

電子檔案管理功能框架包括檔案分類、實物檔案管理、電子檔案管理、系統(tǒng)管理四大部分。其中,實物檔案管理包括庫房管理、檔案入庫、檔案出庫、檔案借閱、檔案鑒定、檔案銷毀等功能。電子檔案管理部分包括電子檔案采集、檔案檢索、檔案調(diào)閱、電子文件存儲、電子檔案內(nèi)容提取、檔案數(shù)據(jù)挖掘和知識圖譜分析、電子檔案信息安全可信管理等功能。

本文所述的電子檔案系統(tǒng)所存儲的電子文件包括業(yè)務歸檔時的實物憑證電子影像,也包括業(yè)務辦理過程中的業(yè)務相關電子文件。相比常見電子檔案管理功能,該功能架構增加了安全可信管理、檔案內(nèi)容提取、檔案數(shù)據(jù)挖掘和知識圖譜分析功能,以解決前述的檔案可信度低及檔案利用率低的問題;將在下面的章節(jié)中做詳細闡述。

2 利用區(qū)塊鏈構建可信電子檔案

2.1 區(qū)塊鏈與檔案管理

傳統(tǒng)的真實性認證方法采取基于非對稱密碼學的技術,通過公鑰基礎設施(Public Key Infrastructure,PKI)的方式對文檔的數(shù)字簽名等信息加以認證。[1]這種操作離不開可信賴的第三方機構,即認證中心(Certificate Authority,CA)的支持。認證中心是一個高度集中化的管理機構,它通過對申請者進行全面驗證之后為其提供數(shù)字證書,從而將其納入中心的認證范圍。多年以來,PKI/CA的解決方案已發(fā)展得較為成熟,也為檔案的真實可信提供了一定的保障,然而其過度依賴于第三方機構,并且缺乏統(tǒng)一性標準等問題尚需解決。

在電子檔案管理方面,區(qū)塊鏈得到了一定的關注和研究,[2][3]區(qū)塊鏈技術中固有的可溯源、難以篡改等特性,使得其中的文件本身具有很高的安全保證和可信任度,不用再依賴于外部的認證機構,也無需考慮認證標準的具體細節(jié)。另外,區(qū)塊鏈可以將多份文檔的真實性進行關聯(lián),對任何一個的修改都會影響到其后續(xù)的文檔,使得篡改難度大大增加。

2.2 區(qū)塊鏈技術平臺

目前區(qū)塊鏈企業(yè)級應用主流平臺朝著聯(lián)盟鏈的方向發(fā)展,支持智能合約和多種共識算法。國內(nèi)對區(qū)塊鏈技術平臺的研究尚處于起步階段,已有平臺大多集中在金融行業(yè)領域。

區(qū)塊鏈技術本身也存在一些應用挑戰(zhàn)。其一,數(shù)據(jù)冗余問題。在利用去中心化特性的場景中,區(qū)塊鏈技術提高了數(shù)據(jù)的并發(fā)查詢訪問效率,但存在數(shù)據(jù)冗余的問題,需要根據(jù)具體應用進行冗余調(diào)整。其二,共識效率不高。在利用不易篡改特性的場景中,區(qū)塊鏈技術可以在去中心化的基礎上提升數(shù)據(jù)安全級別,但存在共識過程計算量大引起的效率不高等問題,需要尋求安全和效率的最佳折中點。

2.3 基于區(qū)塊鏈的銀行檔案數(shù)據(jù)處理、查詢與檢索

在區(qū)塊鏈數(shù)據(jù)處理方面。當前區(qū)塊鏈平臺的吞吐量TPS(Transactions Per Second,每秒事務數(shù))偏低,基于工作量證明(PoW)機制的比特幣為7TPS,以太坊為30TPS,基于實用拜占庭容錯(PBFT)算法的Hyperledger Fabric為2000TPS。

事務確認時間方面。不同的區(qū)塊鏈平臺存在較大差異。Fabric事務確認時間短,適合銀行電子檔案管理企業(yè)級應用?;趨^(qū)塊鏈的檔案管理系統(tǒng)可提供智能合約和IPFS(Interplanetary File System)接口,區(qū)塊鏈存儲電子檔案的摘要信息,實現(xiàn)檔案的存證,并增強數(shù)據(jù)保護,IPFS文件系統(tǒng)存有電子檔案的原始信息,并通過分布式哈希表保障數(shù)據(jù)安全性。[4]

在區(qū)塊鏈數(shù)據(jù)查詢、檢索技術方面。銀行電子檔案管理等區(qū)塊鏈應用中,需查詢的關鍵字包括區(qū)塊的哈希值、數(shù)據(jù)哈希值和應用相關關鍵詞,使用倒排索引、大數(shù)據(jù)等技術可提高數(shù)據(jù)查詢效率,縮短查詢結(jié)果響應時間。[5]基于批注的方法進行數(shù)據(jù)溯源,通過構建三元組,其中s表示數(shù)據(jù)項源,d表示目標數(shù)據(jù),i表示中間數(shù)據(jù),通過三元組傳遞,支持數(shù)據(jù)溯源。[6]

在區(qū)塊鏈數(shù)據(jù)驗證技術方面。銀行電子檔案管理等金融行業(yè)的應用場景中,鏈上記錄數(shù)據(jù)的時候,需校驗其合規(guī)性、正確性。驗證是否有正確的數(shù)字簽名,能否使用所輸入的數(shù)字資產(chǎn),是不是資產(chǎn)的擁有者在參與事務等。通過對每筆事務輸出進行數(shù)字簽名,在輸出該筆數(shù)字資產(chǎn)時,需要提交相應的簽名信息。

應建立可信賴的銀行電子檔案存儲庫,綜合應用區(qū)塊鏈、可恢復性證明和開放檔案信息系統(tǒng)等新技術,實現(xiàn)銀行電子檔案記錄保存、記錄存儲、數(shù)據(jù)管理、訪問記錄、傳播存證、遷移存據(jù)和數(shù)據(jù)溯源等應用。

2.4 基于區(qū)塊鏈技術的銀行檔案管理系統(tǒng)

銀行檔案的使用具有一定的范圍,一般不會對社會廣泛公開,因此公有鏈的使用場景較少;對于僅限于銀行內(nèi)部的檔案管理,可以采用私有鏈技術;而對于需要與外部企業(yè)或機構交流與共享的檔案,則一般以聯(lián)盟鏈為主。

在數(shù)據(jù)管理的方式上,雖然區(qū)塊鏈本身就是一個分布式的存儲賬本,可以將電子檔案數(shù)據(jù)都放在鏈上進行保存,但采取這種方式往往效率不高,對于鏈上的運行速度和區(qū)塊容量都有著較大的挑戰(zhàn)。另外,這種做法使得區(qū)塊鏈與原有的檔案管理系統(tǒng)沖突較大,對業(yè)務和技術架構需要做大量改動,而且難以保證穩(wěn)定性和日常運維。

因此,可行做法是采用區(qū)塊鏈和其它存儲技術融合的方式,對于檔案的元數(shù)據(jù)、文件摘要、關鍵性記錄、數(shù)字簽名、Hash值等重要信息上鏈,而基礎數(shù)據(jù)和輔助數(shù)據(jù)則通過與區(qū)塊鏈相關聯(lián)的鏈下服務來完成。

基于區(qū)塊鏈的銀行檔案管理系統(tǒng),對電子檔案生成摘要,并將其存儲于區(qū)塊鏈分布式賬本中,通過檢索其GUID、數(shù)據(jù)哈希值、元數(shù)據(jù)、時間戳等信息,比對其生成的摘要信息與鏈上存儲的摘要信息是否一致,驗證其一致完整性和原始出處。

將原始數(shù)據(jù)哈希值存儲在區(qū)塊鏈上,對原始數(shù)據(jù)的任何改變,都會導致其哈希值的變化,因此在與其鏈上哈希值比較時,就能發(fā)現(xiàn)其與原始記錄的不一致,判別其新記錄文件與原始檔案相異,實現(xiàn)對電子記錄真實性、完整性、可靠性的識別。

利用智能合約對上鏈的電子檔案數(shù)據(jù)進行合規(guī)性驗證,只有通過驗證的數(shù)據(jù)才能存儲到區(qū)塊鏈上。在電子檔案查詢、檢索環(huán)節(jié),利用智能合約做出檔案一致性判斷。基于去中心化分布式平臺的電子檔案管理,提升了電子檔案的系統(tǒng)安全性、完整性和智能化。

在生成電子文件時,同步生成電子文件的摘要信息,將這些摘要信息加上電子文件的元數(shù)據(jù)上鏈到區(qū)塊鏈系統(tǒng)中。如果電子文件被篡改、偽造,那么其對應的文件摘要信息就會發(fā)生變化,與區(qū)塊鏈系統(tǒng)中保存的原始文件摘要信息就不一致,從而能被識別出來。由于區(qū)塊鏈中的數(shù)據(jù)是不可篡改的,從而保證了電子檔案系統(tǒng)中數(shù)據(jù)的高度安全、高度可信性。

3 利用人工智能技術構建智慧電子檔案

3.1 新一代智能OCR技術提升檔案數(shù)據(jù)提取能力

電子檔案的另一大特點就在于可以利用先進的技術和算法對其內(nèi)容進行提取和分析,以便于檢索和利用,基于圖像識別的OCR技術就是其中一個代表。

以中國銀行憑證影像綜合應用系統(tǒng)中的OCR識別為例,利用基于人工智能技術的OCR引擎實現(xiàn)了各類常見憑證內(nèi)容的識別,例如身份證的識別率達到99%以上,銀行卡、存單、駕駛證、行駛證等票據(jù)的識別率均在95%以上,為信息的進一步利用提供了良好的基礎。

3.2 機器學習和知識圖譜提升檔案數(shù)據(jù)再利用能力

構建基于檔案的知識圖譜能有效進行檔案知識推理,是實現(xiàn)檔案智能檢索的關鍵技術和主要路徑之一。基于編研人員的檔案利用,通過對檔案信息資源的深入挖掘,實現(xiàn)對檔案信息資源的智能檢索,提高了檔案檢索的查全率和查準率;同時基于數(shù)據(jù)挖掘技術,支持對檢索結(jié)果中的知識圖譜展示以及檔案信息的自動聚類,為利用者提供了便捷、高效的檔案利用服務。

4 結(jié)論與展望

銀行的電子檔案越來越多,然而電子檔案的可信度卻難以保障,特別是《會計檔案管理辦法》允許單位在滿足一定條件時只保存電子文件而不需要對應的實物檔案,就更需要采用科學的管理機制和技術手段來保障電子檔案的可信度。本文采用區(qū)塊鏈技術,特別是文件摘要和元數(shù)據(jù)上鏈的辦法,提供了一條解決之道。此外,利用人工智能圖像識別技術將沉睡的檔案里面的內(nèi)容提取出來,再借助知識圖譜等技術手段,挖掘檔案和檔案之間的關系,為客戶營銷和可疑用戶分析提供了支撐。

參考文獻:

[1]謝宗曉,甄杰.公鑰基礎設施(PKI)國家標準解析[J].中國質(zhì)量與標準導報,2018(012):? 18-21.

[2]劉越男,張一鋒,吳云鵬,等.區(qū)塊鏈技術與文件檔案管理:技術和管理的雙向思考[J].檔案學通訊,2020(01):? 4-12.

[3]李春艷,喬超.區(qū)塊鏈技術在大型企業(yè)集團電子文件管理中的應用——以中國石化為例[J].檔案學通訊,2020(01):? 13-20.

[4]譚海波,Haibo T ,周桐,et al.基于區(qū)塊鏈的檔案數(shù)據(jù)保護與共享方法[J].軟件學報,2019,Vol.30Issue(09):? 2620-2635.

[5]蔡維德,郁蓮,王榮,等.基于區(qū)塊鏈的應用系統(tǒng)開發(fā)方法研究[J].軟件學報,2017,28(06):? 1474-1487.

[6]錢衛(wèi)寧,邵奇峰,朱燕超,等.區(qū)塊鏈與可信數(shù)據(jù)管理:問題與方法[J].軟件學報,2018,29(01):? 150-159.

(作者單位:中國人民大學信息資源管理學院? 來稿日期:2020-09-27)

猜你喜歡
會計檔案電子檔案區(qū)塊鏈
電子檔案管理存在的問題及對策
區(qū)塊鏈技術的應用價值分析
商情(2016年40期)2016-11-28 11:24:12
淺談電子檔案管理在大學檔案管理中的應用
會計檔案電子化管理的風險與防范分析
新時期電子檔案在檔案管理中的應用
“區(qū)塊鏈”的茍且、詩和遠方
基于區(qū)塊鏈技術的數(shù)字貨幣與傳統(tǒng)貨幣辨析
大數(shù)據(jù)時代基于財務共享模式的電子會計檔案管理
高職院校會計檔案信息化管理思路探析
醫(yī)院人事檔案電子化管理淺析
科技視界(2016年20期)2016-09-29 13:19:44
游戏| 西丰县| 滨海县| 咸阳市| 雅江县| 靖西县| 循化| 凭祥市| 高雄市| 教育| 德江县| 荆州市| 怀化市| 曲沃县| 曲松县| 建湖县| 广河县| 龙江县| 织金县| 乐亭县| 微山县| 南澳县| 荥经县| 温宿县| 界首市| 瑞昌市| 吉安市| 枞阳县| 万载县| 邢台市| 金昌市| 宁德市| 太保市| 子洲县| 五家渠市| 垦利县| 江都市| 定南县| 江陵县| 莒南县| 沧源|