国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

可視化分析技術(shù)在審計中的應(yīng)用構(gòu)想

2021-07-30 05:43邱靈峰
中國管理信息化 2021年12期
關(guān)鍵詞:模型庫結(jié)構(gòu)化數(shù)據(jù)中心

肖 茂,邱靈峰

(1.中國人民解放軍陸軍勤務(wù)學(xué)院,重慶 401331;2.重慶市梁平區(qū)審計局,重慶 405200)

0 引言

隨著信息技術(shù)的飛速發(fā)展,各行業(yè)都在新技術(shù)的推動下積極推進自身數(shù)字化、智能化轉(zhuǎn)型,產(chǎn)生的數(shù)據(jù)量越來越大。面對海量電子數(shù)據(jù),傳統(tǒng)的驗證型審計方式并不能滿足審計工作擴大審計廣度、審計深度的發(fā)展需求,審計工作需要向探索型、發(fā)掘型審計方式轉(zhuǎn)變,而可視化分析技術(shù)不失為一種可行途徑[1]??梢暬治黾夹g(shù)能夠以其直觀的展現(xiàn)方式幫助審計人員交互分析大量數(shù)據(jù),通過采用不同的可視化分析技術(shù)來揭示數(shù)據(jù)的分布、趨勢或相關(guān)性,審計人員可以更快地從復(fù)雜數(shù)據(jù)中發(fā)現(xiàn)疑點線索[2]??梢暬治黾夹g(shù)作為一種新的審計數(shù)據(jù)分析技術(shù),研究其在審計領(lǐng)域的應(yīng)用,對審計人員在大數(shù)據(jù)時代工作的開展有重要意義。

1 可視化分析技術(shù)的概念

從可視化分析技術(shù)的本質(zhì)屬性來看,審計領(lǐng)域應(yīng)用可視化分析的主要目標是幫助審計人員獲得更好的見解,得出更好的結(jié)論并最終產(chǎn)生假設(shè)。在對可視化分析技術(shù)本質(zhì)屬性理解的基礎(chǔ)上,可視化分析技術(shù)的概念可以做如下概括。一是指信息技術(shù)層面,支持分析過程的人機交互方式與技術(shù)。可視化分析主要指依托一定的工具(分析平臺、軟件或者編程語言)來實現(xiàn)對電子數(shù)據(jù)的可視化分析。二是指經(jīng)驗或知識層面,有效融合計算機的計算能力和人的認知能力,基于實務(wù)工作的總結(jié)提煉而出的分析方法、模型、技巧[3]。

2 審計領(lǐng)域應(yīng)用可視化分析技術(shù)的需求分析

隨著信息技術(shù)在各行各業(yè)的推廣應(yīng)用,年度審計工作中需要采集的數(shù)據(jù)也越來越多,根據(jù)數(shù)據(jù)采集的類型,可以將數(shù)據(jù)分為兩類,即結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)。

2.1 結(jié)構(gòu)化數(shù)據(jù)審計對可視化分析技術(shù)的需求

結(jié)構(gòu)化數(shù)據(jù)即行數(shù)據(jù),以固定格式存儲在數(shù)據(jù)庫里。它通常包括彈性分布式數(shù)據(jù)集和表格數(shù)據(jù)。隨著審計監(jiān)督的廣度和深度越來越大,采集的數(shù)據(jù)越來越多,傳統(tǒng)的審計方法手段不足以應(yīng)對審計深度發(fā)展的要求,審計數(shù)據(jù)分析的信息化手段必然要得到補充和加強。對此,可視化分析技術(shù)不失為一種解決方案,通過以能夠吸引人類認知和視覺能力的方式呈現(xiàn)信息,可以減少處理和分析大數(shù)據(jù)相關(guān)的信息過載的影響。此外,通過利用數(shù)據(jù)可視化的解釋性和探索性,審計人員可以在探索過程中獲得更好的見解,并在解釋過程中實現(xiàn)更有效的信息傳達。

2.2 非結(jié)構(gòu)化數(shù)據(jù)審計對可視化分析技術(shù)的需求

非結(jié)構(gòu)化數(shù)據(jù)是指信息沒有以一個可用的預(yù)設(shè)數(shù)據(jù)模型或沒有以一個預(yù)設(shè)好的定義方式來排列。內(nèi)容上包括所有格式的辦公文檔、各類報表、圖文、圖像以及音視頻信息等。

隨著審計領(lǐng)域工作的不斷拓展深入,尤其是在政府審計領(lǐng)域中的經(jīng)濟責任審計工作中,審計內(nèi)容覆蓋了領(lǐng)導(dǎo)干部任職期間履行經(jīng)濟管理責任的眾多情況,需要查閱大量文檔、文本或者紙面記錄,這些都是非結(jié)構(gòu)化的數(shù)據(jù)。傳統(tǒng)的審計查閱方式主要是通過大量閱讀來發(fā)現(xiàn)問題線索或者依據(jù)此來評價領(lǐng)導(dǎo)干部依法履職盡責的情況,主觀性強。但隨著被監(jiān)督者的法紀意識不斷增強,審計評價在這方面的說服力略顯不足。通過引入可視化分析技術(shù),運用其中的文本可視化分析方法,可以在這一方面有所突破。通過將這些文件記錄進行可視化分析,可以直觀地展示領(lǐng)導(dǎo)干部研究經(jīng)濟工作的重點內(nèi)容和頻率等情況。

3 可視化分析技術(shù)在審計中的應(yīng)用目標

可視化分析技術(shù)在審計中的應(yīng)用目標可以分為兩類,一類是信息技術(shù)層面的目標,主要是實現(xiàn)分析工具平臺化和分析過程智能化;另一類是知識或思維層面的目標,主要是實現(xiàn)分析方法模型化。

3.1 分析工具平臺化

分析工具平臺化,即可視化分析技術(shù)在審計中應(yīng)用的遠景目標,其要求構(gòu)建起審計可視化分析平臺,使可視化分析技術(shù)集成到軟件內(nèi)作為一個單獨模塊嵌入該平臺。考慮到審計實際的發(fā)展,該平臺的開發(fā)應(yīng)綜合考慮聯(lián)網(wǎng)(因特網(wǎng)或?qū)>W(wǎng))和單機(物理隔離或小范圍局域網(wǎng))應(yīng)用兩種環(huán)境。聯(lián)網(wǎng)應(yīng)用是在審計數(shù)據(jù)中心建立的基礎(chǔ)上,以審計數(shù)據(jù)中心的數(shù)據(jù)為數(shù)據(jù)源,審計人員可以依托網(wǎng)絡(luò)開展在線的數(shù)據(jù)可視化分析。單機應(yīng)用主要是考慮到部分被審計單位信息化支持程度不高,在保持平臺主體功能設(shè)計不變的情況下,將該平臺搭建在單個服務(wù)器上,便于審計人員在現(xiàn)場審計過程中運用可視化分析技術(shù)開展審計工作。

3.2 分析過程智能化

進一步應(yīng)用可視化分析技術(shù)的目標是實現(xiàn)分析過程智能化,也就是將機器學(xué)習(xí)中的異常檢測技術(shù)應(yīng)用于聯(lián)網(wǎng)環(huán)境下的審計可視化分析平臺中,實現(xiàn)可視化分析過程的智能化。異常檢測技術(shù)是一種用來發(fā)現(xiàn)欺詐情況,也就是識別某一用戶/群體行為不符合預(yù)期模式的技術(shù),在審計中可以結(jié)合可視化分析技術(shù)運用的場景主要有兩種。一種是審計人員通過采集某一類項目或者某一類業(yè)務(wù)的數(shù)據(jù),利用可視化分析技術(shù)來發(fā)現(xiàn)數(shù)據(jù)的特征,如相關(guān)數(shù)據(jù)的走勢情況,之后通過構(gòu)建相關(guān)異常檢測模型來發(fā)現(xiàn)疑點;另一種是在特征尚未發(fā)現(xiàn)的情況下,通過利用高斯分布來構(gòu)建異常檢測算法,再利用可視化分析技術(shù)來觀察需檢測數(shù)據(jù)在帶入異常檢測算法后的離群情況,從而判斷是否屬于異常數(shù)據(jù)。

3.3 分析方法模型化

分析方法模型化,就是將成熟的可視化分析技術(shù)應(yīng)用方法用數(shù)據(jù)公式或圖形等形式顯示出來??梢暬治瞿P褪峭ㄟ^R、Python 等編程語言或者審計可視化分析平臺對成熟的可視化分析思路所進行的固化,可視化分析模型庫是來自不同審計事項可視化分析模型的集合。建立可視化分析模型庫與可視化分析作為探索性分析的本質(zhì)并不沖突,模型庫的作用是將審計人員成熟的審計經(jīng)驗、審計方法通過信息技術(shù)固定下來,以便在今后的審計項目中直接調(diào)用,節(jié)省審計項目用時,便于快速發(fā)現(xiàn)審計疑點線索,其本質(zhì)仍是對數(shù)據(jù)的一種探索性分析(因為分析的結(jié)果是不確定的),只是建立在前人探索經(jīng)驗的基礎(chǔ)上。模型庫必須是可擴展且保持動態(tài)更新的,因為隨著審計人員對數(shù)據(jù)的了解,隨著審計整體數(shù)據(jù)分析能力的提升,勢必會涌現(xiàn)出更多的分析模型。

4 可視化分析技術(shù)在審計中的應(yīng)用原則

可視化分析技術(shù)在審計中的應(yīng)用原則主要是安全性、靈活性、可交互性、可擴展性[4]。

4.1 安全性

安全性應(yīng)用原則主要出于對數(shù)據(jù)分析平臺應(yīng)用系統(tǒng)性風險的考慮。隨著審計技術(shù)方法體系的不斷更新,對數(shù)據(jù)的采集要求越來越高,數(shù)據(jù)采集量也不斷增加,數(shù)據(jù)分析過程中的安全影響因素也日益增加,主要體現(xiàn)在3 個方面:一是數(shù)據(jù)訪問的安全性;二是電子數(shù)據(jù)存儲的安全性;三是數(shù)據(jù)管理的安全性。

4.2 靈活性

靈活性應(yīng)用原則主要出于數(shù)據(jù)采集的考慮,主要體現(xiàn)在兩個方面。一是數(shù)據(jù)采集方式的靈活性,數(shù)據(jù)分析平臺需要在聯(lián)網(wǎng)和單機兩種環(huán)境中使用,需要考慮聯(lián)網(wǎng)采集和人工采集兩種方式的需要;二是數(shù)據(jù)接口的靈活性,各種信息系統(tǒng)產(chǎn)生的數(shù)據(jù)其數(shù)據(jù)結(jié)構(gòu)不一,數(shù)據(jù)分析平臺需要根據(jù)不同的數(shù)據(jù)結(jié)構(gòu),采取不同的數(shù)據(jù)采集接口,確保采集數(shù)據(jù)歸檔后的標準化,同時從聯(lián)網(wǎng)審計的角度考慮,數(shù)據(jù)接口的靈活性也是數(shù)據(jù)采集自動化的基礎(chǔ)之一。

4.3 可交互性

可交互性主要出于可視化分析其探索性分析的本質(zhì),它需要交互式的可視化界面來輔助審計人員對復(fù)雜、大量的數(shù)據(jù)進行探索性分析和推理,主要體現(xiàn)在兩個方面:一是需要通過交互性探索來發(fā)現(xiàn)某一類業(yè)務(wù)的數(shù)據(jù)特征;二是需要通過交互性探索來從數(shù)據(jù)中發(fā)現(xiàn)異常值。這也是可視化分析技術(shù)能夠成功應(yīng)用的必然要求。

4.4 可擴展性

可擴展性主要是從數(shù)據(jù)分析平臺建設(shè)的長久性出發(fā)考慮,其主要體現(xiàn)在3個方面。一是審計思路和模型的擴展。在可視化分析應(yīng)用的目標中,有一個重要的部分就是可視化分析模型庫,審計人員在將其應(yīng)用于實踐時,可以根據(jù)具體情況提出優(yōu)化完善的建議,同時,對于未來審計工作中總結(jié)出來的成熟可推廣的可視化分析思路和可視化分析模型,需要及時添加到可視化分析模型庫中。二是數(shù)據(jù)采集接口的擴展。在確保數(shù)據(jù)采集標準統(tǒng)一的前提下,要兼顧考慮各行業(yè)信息系統(tǒng)逐步發(fā)展的實際,數(shù)據(jù)采集接口要能夠適應(yīng)未來審計需求,在最初建立時就要考慮為未來的數(shù)據(jù)采集留有空間。三是審計數(shù)據(jù)中心的物理擴展。隨著采集數(shù)據(jù)的不斷增加和可視化分析模型庫的不斷擴充,今后審計人員面對的將是海量數(shù)據(jù)和大型算法模型庫,為保證平臺運行的穩(wěn)定性和效率,在建設(shè)過程中勢必要留有更新及擴展的余地。

5 可視化分析技術(shù)在審計中應(yīng)用的框架設(shè)計

基于上文提及的可視化分析技術(shù)在審計中應(yīng)用的目標和原則,對可視化分析技術(shù)在審計中應(yīng)用的框架做初步探討。

5.1 應(yīng)用的主體框架

可視化分析技術(shù)在審計中的應(yīng)用主要體現(xiàn)在審計可視化分析平臺的構(gòu)建方面。審計可視化分析平臺架構(gòu)按照數(shù)據(jù)采集與存儲、數(shù)據(jù)處理和數(shù)據(jù)分析的思路來設(shè)計,主要包含3 個層面:一是發(fā)揮數(shù)據(jù)支撐層作用的審計數(shù)據(jù)中心,二是發(fā)揮數(shù)據(jù)管理層作用的分布式搜索引擎,三是發(fā)揮技術(shù)應(yīng)用層作用的可視化分析軟件[5]。同時,數(shù)據(jù)安全和標準規(guī)范體系作為必須遵守的要求貫穿其中。具體結(jié)構(gòu)如圖1所示。

圖1 審計可視化分析平臺

5.2 審計可視化分析平臺的具體功能

5.2.1 審計數(shù)據(jù)中心的功能

數(shù)據(jù)中心主要進行數(shù)據(jù)的采集與存儲,采集到的數(shù)據(jù)需要基于ETL(即Extract、Transform、Load)工具進行標準化處理后存入相應(yīng)類型數(shù)據(jù)庫中。數(shù)據(jù)采集的來源主要有兩類。一是從各行業(yè)業(yè)務(wù)系統(tǒng)中導(dǎo)出的數(shù)據(jù),基本上都是結(jié)構(gòu)化數(shù)據(jù);二是從線下收集的各類辦公文檔、圖件、各類報表、音頻等資料。數(shù)據(jù)存儲主要依托兩類數(shù)據(jù)庫,一類是關(guān)系型數(shù)據(jù)庫,是指采用了關(guān)系模型來組織數(shù)據(jù)的數(shù)據(jù)庫,主要代表有SQL Sever、Oracle、Mysql 等,主要用來存儲經(jīng)過ETL 工具處理后的結(jié)構(gòu)化數(shù)據(jù);另一類是Nosql 非關(guān)系型數(shù)據(jù)庫,基于鍵值對來存儲,結(jié)構(gòu)不固定,主要代表有MongoDB、CouchDB 和Redis等,主要用來儲存經(jīng)過處理后的非結(jié)構(gòu)化數(shù)據(jù)。

5.2.2 分布式搜索引擎的功能

搜索引擎采用分布式架構(gòu),既可以部署在數(shù)據(jù)中心,供數(shù)據(jù)中心數(shù)據(jù)分析團隊使用,也可以部署在移動端,通過個人電腦調(diào)用數(shù)據(jù)中心的數(shù)據(jù)。分布式搜索引擎應(yīng)該具有兩個功能:一是全類型數(shù)據(jù)搜索功能,也就是不僅要能夠搜索結(jié)構(gòu)化數(shù)據(jù),也要能夠建立算法實行非結(jié)構(gòu)化數(shù)據(jù)的搜索;二是主題數(shù)據(jù)聚合功能,也就是建立審計業(yè)務(wù)所需的主題數(shù)據(jù)庫或索引,在通過搜索功能從數(shù)據(jù)中心調(diào)出所需要的數(shù)據(jù)庫后,利用數(shù)據(jù)聚合功能,建成可供可視化分析使用的主題數(shù)據(jù)庫,建成的主題數(shù)據(jù)庫一般存儲在移動端,以確保源頭數(shù)據(jù)不可更改,下一步可視化分析則可以直接調(diào)用該主題數(shù)據(jù)庫。

5.2.3 可視化分析軟件的功能

可視化分析軟件主要由可視化分析模型庫、機器學(xué)習(xí)模塊、可視化交互分析界面組成。

可視化分析模型庫可以分為集成可視化分析儀表盤和單個可視化分析模型。集成可視化分析儀表盤是指根據(jù)審計事項的不同,將某一事項下使用可視化分析技術(shù)模型固化下來,通過設(shè)計優(yōu)化相關(guān)鏈路,以實現(xiàn)單類審計事項所涵蓋業(yè)務(wù)的動態(tài)實時可視化分析。單個可視化分析模型,主要是在個人客戶端調(diào)用,方便審計現(xiàn)場作業(yè),減輕現(xiàn)場作業(yè)工作量。

機器學(xué)習(xí)模塊,目前設(shè)想主要是通過使用經(jīng)過處理的正向數(shù)據(jù)來發(fā)現(xiàn)某些單位或某些事項的共同特征,并據(jù)此建立優(yōu)化異常檢測算法模型,通過與集成可視化分析儀表盤的結(jié)合使用,可以在數(shù)據(jù)中心實現(xiàn)異常數(shù)據(jù)的實時監(jiān)測發(fā)現(xiàn)。

可視化交互分析界面提供一個操作環(huán)境,數(shù)據(jù)分析人員通過篩選器對分析界面的橫縱坐標分別定義不同的對象,再輔以相對應(yīng)的可視化圖形庫,通過調(diào)用這些相對應(yīng)的圖形來觀察數(shù)據(jù)的趨勢和發(fā)現(xiàn)離群值。在進行交互分析時,不同結(jié)構(gòu)的數(shù)據(jù)需要使用不同的可視化分析技術(shù)。可供使用的結(jié)構(gòu)化數(shù)據(jù)可視化分析技術(shù)比較多,有折線圖、熱力圖、散點圖、餅圖等;可供使用的非結(jié)構(gòu)化數(shù)據(jù)可視化分析技術(shù)比較少,目前應(yīng)用的領(lǐng)域主要集中在文本類數(shù)據(jù)的分析上,主要使用的是標簽云技術(shù)。

同時需要指出的是,數(shù)據(jù)安全和標準規(guī)范體系需要貫穿整個平臺。為了保證數(shù)據(jù)分析安全,必須建立相應(yīng)的安全規(guī)范,對數(shù)據(jù)的調(diào)用、數(shù)據(jù)的存儲、處理權(quán)限、訪問權(quán)限等做出體系化設(shè)計;對于數(shù)據(jù)采集標準,可供參考的有2019 年審計署通過國際標準化組織發(fā)布的“審計數(shù)據(jù)采集”國際標準。

6 結(jié)語

當前,可視化分析技術(shù)在審計中的應(yīng)用還處于初步探索階段,在審計實務(wù)中應(yīng)用還不多,主要是受制于審計人員自身素質(zhì)和信息技術(shù)發(fā)展的影響。為使可視化分析技術(shù)在審計中的應(yīng)用能夠平滑展開,可以首先在審計人員比較熟悉的Excel 軟件中推廣使用數(shù)據(jù)透視圖功能進行可視化分析,之后逐步推廣到使用R 語言、Python 等編程工具進行可視化分析,待審計人員信息化素質(zhì)以及信息技術(shù)發(fā)展到一定階段后,審計可視化分析平臺的應(yīng)用會是大數(shù)據(jù)環(huán)境下審計數(shù)據(jù)分析領(lǐng)域不可或缺的工具。

猜你喜歡
模型庫結(jié)構(gòu)化數(shù)據(jù)中心
酒泉云計算大數(shù)據(jù)中心
促進知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
民航綠色云數(shù)據(jù)中心PUE控制
基于模型庫系統(tǒng)的金融體系流動性風險預(yù)警機制研究
基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
基于云計算的交通運輸數(shù)據(jù)中心實現(xiàn)與應(yīng)用
基于模型庫的現(xiàn)代成本會計計量系統(tǒng)研究
Overlay Network技術(shù)在云計算數(shù)據(jù)中心中的應(yīng)用
基于軟信息的結(jié)構(gòu)化轉(zhuǎn)換
景宁| 崇州市| 桓仁| 杭锦旗| 依安县| 平凉市| 陆河县| 嵊泗县| 内丘县| 多伦县| 湖南省| 延吉市| 雅江县| 武安市| 惠安县| 鄄城县| 龙胜| 吉安市| 湖北省| 兴山县| 秭归县| 修文县| 皮山县| 称多县| 类乌齐县| 民乐县| 宁夏| 石嘴山市| 鄱阳县| 涡阳县| 襄汾县| 西吉县| 政和县| 康定县| 泽普县| 象山县| 武宣县| 拉孜县| 白朗县| 赫章县| 互助|