国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)分析挖掘技術(shù)在審計中的運用

2020-11-06 06:01:02廖智瑋袁靜
市場觀察 2020年9期

廖智瑋 袁靜

摘? 要:隨著信息化水平的不斷提高,被審計單位的數(shù)據(jù)呈現(xiàn)出海量化趨勢的特征,數(shù)據(jù)分析方法和分析工具也層出不窮,能夠直接運用到審計實踐的方法和工具同樣比較多。熟悉各種工具的優(yōu)缺點和適用范圍,有利于審計人員在不同審計環(huán)境下選擇合適的方法和工具進(jìn)行審計工作,同時可以輔助審計人員在海量數(shù)據(jù)中發(fā)現(xiàn)疑點,為數(shù)據(jù)式審計提供重要途徑。

關(guān)鍵詞:數(shù)據(jù)審計;數(shù)據(jù)分析挖掘;方法工具

隨著信息化水平的不斷提高,被審計單位數(shù)據(jù)海量化的趨勢越來越凸顯。運用大數(shù)據(jù)分析技術(shù),探索被審計單位數(shù)據(jù)海量化形勢下適當(dāng)?shù)膶徲嫹椒ê蛻?yīng)用技巧,是當(dāng)前審計工作領(lǐng)域面臨的重要挑戰(zhàn)。數(shù)據(jù)分析作為一種新的計算機(jī)審計方法,熟悉并掌握數(shù)據(jù)分析技術(shù),能夠輔助審計人員在海量數(shù)據(jù)中發(fā)現(xiàn)疑點,可為數(shù)據(jù)式審計提供重要途徑。

常用的數(shù)據(jù)分析挖掘方法

數(shù)據(jù)分析挖掘方法有很多種,如聚類分析、關(guān)聯(lián)分析、序列模式等,下面將逐一介紹。

1.聚類分析,或稱分類分析、數(shù)值分類,指將集合按照類似原則把具體對象分組為多個類的過程。如在對物資采購業(yè)務(wù)進(jìn)行審計時,為檢查采購業(yè)務(wù)各環(huán)節(jié)的內(nèi)部控制執(zhí)行情況,可以用聚類分析方法將被審計單位的所有采購業(yè)務(wù),并按相似特征進(jìn)行分析,而不需要逐一鑒別采購業(yè)務(wù),以此達(dá)到減少重復(fù)工作的同時提高審計工作效率的目的。

2.關(guān)聯(lián)分析,或稱關(guān)聯(lián)挖掘,指在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)。如在對某產(chǎn)品成本核算進(jìn)行審計時,面對海量的人、材、工、費等眾多數(shù)據(jù),可采用該方法分析發(fā)現(xiàn)產(chǎn)品生產(chǎn)數(shù)據(jù)之間的關(guān)聯(lián)性,并結(jié)合存貨盤庫、出入庫記錄等數(shù)據(jù)信息,推斷出產(chǎn)品成本是否合理。

3.序列模式,指挖掘相對時間或出現(xiàn)頻率高的方法。如在對某單位經(jīng)費管理進(jìn)行審計時,可利用序列模式挖掘出被審計單位經(jīng)費賬目數(shù)據(jù)中,一些經(jīng)常以某種規(guī)律出現(xiàn)的事件序列模式,通過分析這些頻繁發(fā)生的時間序列模式,可幫助審計人員發(fā)現(xiàn)其中的異?,F(xiàn)象。

常用的數(shù)據(jù)分析挖掘工具

當(dāng)前可用的數(shù)據(jù)分析挖掘工具比較多,常見的有K- Miner、Excel、SQL Server、IBM SPSS 等。

1.Excel軟件工具。Excel是審計人員最為熟悉和接受程度較高的軟件,以其簡單性、易操作性在計算機(jī)審計工作中已經(jīng)得到了廣泛應(yīng)用。除了基本的統(tǒng)計分析,借助Microsoft公司為 Excel2007以后版本提供的外接程序Dmaddin.msi,還可以進(jìn)行數(shù)據(jù)分析挖掘。

2.SQL Server分析服務(wù)。Microsoft SQL Server分析服務(wù)是與數(shù)據(jù)庫SQL Server 服務(wù)并列的服務(wù),其整合了后臺數(shù)據(jù)庫服務(wù)和前臺商業(yè)應(yīng)用程序,充分發(fā)揮了數(shù)據(jù)庫服務(wù)器對關(guān)系數(shù)據(jù)的管理能力和分析服務(wù)對數(shù)據(jù)分析挖掘結(jié)構(gòu)的管理能力。審計人員可以通過導(dǎo)入、導(dǎo)出數(shù)據(jù)工具以及查詢分析器,進(jìn)行對數(shù)據(jù)的清洗、轉(zhuǎn)換和抽取等步驟。

3.IBM SPSS軟件工具及SPSSAU。SPSS是IBM公司推出的“統(tǒng)計產(chǎn)品與服務(wù)解決方案”軟件,也是目前運用比較廣泛的一款工具。另外,北京青絲科技有限公司開發(fā)了網(wǎng)頁版數(shù)據(jù)科學(xué)算法平臺工具——SPSSAU[[[]北京青絲科技有限公司.幫助手冊[DB/OL].https://spssau.com/front/spssau/index.html.]],該平臺工具包含了IBM SPSS軟件的大部分功能,但其操作更加簡單、分析更加智能,只需導(dǎo)入數(shù)據(jù),即可實現(xiàn)“傻瓜式”操作,對于沒有SPSS軟件運用基礎(chǔ)的審計人員而言是一種更好的替代工具。

4.神通K- Miner。該軟件是神舟通用數(shù)據(jù)技術(shù)有限公司的商務(wù)智能數(shù)據(jù)分析挖掘工具,以數(shù)據(jù)挖掘標(biāo)準(zhǔn)CRISP-DM為基礎(chǔ),可對數(shù)據(jù)分析挖掘過程進(jìn)行擴(kuò)展和增強,使得審計人員能夠建立和實施以模型生命周期管理為核心的審計數(shù)據(jù)分析挖掘項目。

5.Python程序設(shè)計語言。Python是一種面向?qū)ο蟮膭討B(tài)類型計算機(jī)程序設(shè)計語言,因其數(shù)據(jù)處理速度快、功能強大且簡單易學(xué),在數(shù)據(jù)分析與處理中被廣泛應(yīng)用。Python擁有IPython、NumPy、SciPy、pandas、Matplot-lib、scikit-learn和Spyder 等功能齊全、接口統(tǒng)一的數(shù)據(jù)庫,能為數(shù)據(jù)分析工作提供極大地便利。

數(shù)據(jù)分析挖掘的基本步驟

數(shù)據(jù)分析挖掘的基本步驟包括:數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、選擇方法工具、建立模型、評估模型及運用。

1.收集原始審計數(shù)據(jù)。收集原始審計數(shù)據(jù)的前提是要明確審計目標(biāo)以及審計的重點內(nèi)容,在此基礎(chǔ)上采集內(nèi)部數(shù)據(jù)和外部數(shù)據(jù),常用方法包括數(shù)據(jù)接口采集、直接復(fù)制以及通過備份文件恢復(fù)等。內(nèi)部數(shù)據(jù)指被審計單位信息系統(tǒng)中的電子數(shù)據(jù),如財務(wù)系統(tǒng)數(shù)據(jù)、業(yè)務(wù)流程數(shù)據(jù)等。外部數(shù)據(jù)指與被審計單位業(yè)務(wù)相關(guān)的其他數(shù)據(jù),如銀行流水、企業(yè)信息、政府指導(dǎo)價等。

2.數(shù)據(jù)預(yù)處理。由于收集到的原始數(shù)據(jù)中既可能包含有價值的審計數(shù)據(jù)信息,還可能包含噪聲信息,因此要對原始審計數(shù)據(jù)進(jìn)行預(yù)處理。通過對審計數(shù)據(jù)進(jìn)行清理、集成、變換和歸約等處理,可以大大提高數(shù)據(jù)質(zhì)量,提高審計分析的挖掘效率。

3.選擇分析方法工具。在對數(shù)據(jù)進(jìn)行預(yù)處理后,審計人員應(yīng)該根據(jù)獲取的數(shù)據(jù),結(jié)合需要審計的業(yè)務(wù)類型,選擇適當(dāng)?shù)姆治龇椒ê凸ぞ?。比如,需要對某個單位的車輛維修費用進(jìn)行審計,在收集到車輛數(shù)量、維修開支明細(xì)、車輛保險等數(shù)據(jù)后,初步判斷可以采取數(shù)據(jù)分挖掘中的關(guān)聯(lián)分析法,然后再選擇較為簡單的Excel進(jìn)行分析,或者利用SQL Server直接實現(xiàn)導(dǎo)入數(shù)據(jù)、分析數(shù)據(jù)、輸出結(jié)果的“一條龍”操作。

4.建立分析挖掘模型。該步驟是數(shù)據(jù)挖掘的核心,由于建立模型并不是一蹴而就能完成的,需要模型設(shè)計人員和審計人員不斷嘗試各種分析挖掘技術(shù)方法,總結(jié)出其中的規(guī)律,從而選擇合適且安全的模型。

5.模型評估及運用。可以采用與現(xiàn)在使用的數(shù)據(jù)非常相似的歷史數(shù)據(jù),或?qū)?shù)據(jù)分成訓(xùn)練集和測試集兩組,第一組用來訓(xùn)練或評估模型,即用于建立模型,之后使用第二組數(shù)據(jù)來測試模型,即測試集用于驗證模型。當(dāng)訓(xùn)練和測試周期完成之后,再利用一部分真實數(shù)據(jù)進(jìn)行檢驗,主要檢查模型得出的數(shù)據(jù)誤差率是否在可接受的范圍內(nèi)。如果數(shù)據(jù)誤差率超過可接受范圍,則需要重新評估分析方法、工具、已建立的模型和數(shù)據(jù)源等,直到數(shù)據(jù)誤差率達(dá)到可接受范圍之內(nèi)。

桃源县| 五大连池市| 济源市| 济南市| 恩平市| 石城县| 新邵县| 龙南县| 朝阳区| 江山市| 上栗县| 长汀县| 布尔津县| 余干县| 营口市| 开江县| 诸城市| 北票市| 沭阳县| 康定县| 泾阳县| 友谊县| 兴业县| 麟游县| 霍城县| 石景山区| 铁岭县| 灵台县| 新闻| 仁怀市| 临桂县| 海盐县| 西和县| 阿拉善左旗| 新闻| 上饶市| 琼结县| 芜湖县| 汨罗市| 蕉岭县| 革吉县|