国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

深度學習模型應用:面向審計業(yè)務全流程的整合性框架

2023-05-30 06:10:17吳勇陸藝朱衛(wèi)東張超
財會月刊·上半月 2023年1期
關鍵詞:機器學習數據倉庫深度學習

吳勇 陸藝 朱衛(wèi)東 張超

【摘要】深度學習不僅擁有對半結構化和非結構化數據強大的信息識別能力, 還能基于海量數據進行高效精準的預測分析和判斷支持, 這將極大地拓展審計證據范圍, 改善審計決策機制, 有助于提升審計效率和審計質量。 本文基于深度學習模型的信息識別功能和判斷支持功能, 將深度學習的智能分析與審計師的經驗修正有效融合, 不斷擴充、更新、迭代審計數據倉庫, 面向審計業(yè)務全流程, 構建深度學習模型應用于審計業(yè)務不同階段的集成性、整合性框架, 以便更好地指導和推動深度學習模型和方法的審計應用。

【關鍵詞】深度學習;機器學習;審計業(yè)務全流程;數據倉庫

【中圖分類號】 C93;F239? ? ?【文獻標識碼】A? ? ? 【文章編號】1004-0994(2023)01-0108-9

一、 引言

科技強審是21世紀以來審計發(fā)展最顯著的特征之一。大數據時代, 傳統(tǒng)審計取證模式、 審計流程和審計技術方法需要做出適應性變革。深度學習作為人工智能領域的前沿性技術, 通過建立分層的人工神經網絡(又稱為深度神經網絡), 試圖模擬人腦中的生物神經元網絡, 利用高效的學習模型自動從海量數據中提取數據特征, 從而識別潛在的數據模式, 洞悉規(guī)律, 推動做出數據驅動下的管理決策(Ting,2019)。隨著互聯(lián)網、 移動通訊、 5G技術的興起以及計算機處理速度和數據存儲能力的提升, 深度學習已被廣泛應用于計算機視覺、 語音識別、 自然語言處理和其他數據分析等領域。深度學習方法能夠將特定過程的結果與相關數據擬合, 有效辨識出海量數據背后的模式特征和規(guī)律認知, 以便發(fā)現異常、 預測趨勢, 將對舞弊偵測、 審計風險評估以及審計決策判斷產生重要影響, 這種數據驅動的決策也會引發(fā)會計和審計領域的研究范式實現由演繹推理向歸納分析的轉變。

然而, 目前深度學習在審計領域的應用仍處于起步階段, 究其原因主要有以下兩個方面: 一是審計工作的復雜性。高質量的審計決策有賴于審計計劃、 審計實施和審計報告的有效協(xié)同, 如果缺乏一個系統(tǒng)性、 全局性的框架來系統(tǒng)謀劃和協(xié)調不同審計階段的系統(tǒng)設計, 新的數據分析技術就很難應用于審計實踐并取得成效。二是技術的復雜性。深度學習所建立的深度神經網絡是由復雜的算法所驅動, 過程的可理解性和結果的可解釋性較差。審計師和監(jiān)管機構難以了解深度神經網絡內部的輸入是如何相互作用并產生最終的輸出結果, 深度學習的內部運作對其而言更像是一個“黑箱”, 這嚴重制約了相關主體應用深度學習方法的動機和意愿。

為此, 本文在明晰深度學習相關概念內涵的基礎上, 剖析深度學習模型的工作原理, 針對深度學習是基于數據驅動的特點, 以設計、 開發(fā)和更新審計數據倉庫為切入點, 面向審計業(yè)務全過程將深度學習的機器智能和審計師的知識與經驗有效融合, 從而構建深度學習模型審計應用的集成性、 整合性理論框架, 以便更好地指導和推動深度學習模型和方法在審計方面的應用。

二、 文獻綜述

深度學習具有強大的多結構類型數據分析處理能力, 不僅可以分析傳統(tǒng)的結構化財務數據, 還可以分析半結構化或非結構化的數據, 如社交媒體信息、 電子郵件、 新聞報道、 電話和視頻, 通過機器自動提取的數據特征作為補充證據, 可以豐富審計師對客戶業(yè)務和行業(yè)的理解, 幫助審計師更好地評估客戶的審計風險, 提升審計效率和質量。深度學習算法不再主要依靠重復性抽樣技術, 而是可以審查公司的整體數據, 審計師能夠以更加全域和科學的視角來組織實施更有針對性的測試, 及時辨識公司各類異常情況和存在的風險。而且, 深度學習算法從海量數據以及不同項目中習得的知識和規(guī)律, 推廣應用于具有類似特征的其他項目, 有助于提升知識共享應用的效率。審計師可以從更寬廣的數據覆蓋面、 更詳細的數據分析和更深入的決策洞察中獲益。

深度學習已廣泛應用于審計領域的多項任務中, 如審查源文件、 分析業(yè)務交易和事項、 評估風險等。學者們還探討了利用深度學習來預測欺詐風險、 破產風險、 重大錯報風險、 識別異常情況以及公司未來的業(yè)績表現等。深度學習的文本理解、 語音識別、 視覺識別和結構化數據分析能力, 為提升審計證據的信息識別能力和審計決策判斷能力提供了重要幫助。一方面, 深度學習提升了審計證據的信息識別能力。因為深度學習能夠從半結構化數據(如文本數據)或非結構化數據(如圖像、 音頻和視頻)中識別、 提取有價值、 有洞見的信息, 極大地拓展了審計證據的信息來源, 而且不同來源證據之間的相互佐證也能有效提升審計證據質量。另一方面, 深度學習強大的信息識別功能為復雜審計決策提供了數據基礎, 當數據量大且輸入變量眾多時, 深度學習所具有的高效精準預測性能的優(yōu)勢將進一步突顯, 能夠提供準確度更高的分類和預測結果, 從而為復雜審計判斷提供有效的決策支持。因此, 從算法和技術的視角出發(fā), 基于深度學習的方法能夠豐富審計證據, 改善審計決策機制, 有助于提升審計效率和審計質量。

三、 概念界定與關系辨析

(一)人工智能、 機器學習與深度學習

在探討深度學習的審計應用之前, 有必要明晰人工智能、 機器學習和深度學習的概念內涵以及這些概念之間的關系。

人工智能是研究如何使用計算機的軟硬件來模擬人類某些智能行為的基本理論、 方法和技術。智能行為包括觀察和感知周圍環(huán)境的能力、 從語音或文本中提取信息的能力、 從獲得的信息中學習以及利用這些信息做出決策的能力等。人工智能作為一種自適應、 自學習系統(tǒng), 可以通過計算機程序來模仿人類的判斷和認知技能, 感知外部的環(huán)境變化, 能夠從數據中自主學習和自我進化, 以便做出決策、 預測或采取最佳的適應性行動。例如, 谷歌地圖可以綜合考慮事故、 施工和天氣情況等, 給出最優(yōu)的交通路線選擇, 從而減少通行時間。人工智能領域的研究主要包括機器學習、 自然語言處理、 計算機視覺、 認知計算等。

機器學習這一概念于1959年被創(chuàng)造性地提出, 其被界定為“一個研究領域, 它賦予計算機不需要明確編程就能學習的能力”。Mitchell(2006)則為機器學習提供了一個被廣泛參考的定義: “機器學習領域關注的問題是如何構建隨著知識和經驗的積累而能夠自動改進的計算機程序”。兩類觀點都堅持機器學習的目的是使計算機自動(而不是由人類明確編程)使用算法從歷史數據中學習模式和趨勢, 通過不斷迭代改進其學習性能(通常以預測精度來衡量), 并應用所學到的數據模式或趨勢來進行相應的預測。例如, 銀行利用機器學習算法來分析大量的歷史數據, 從而建立信用風險預測模型。人工智能可以被認為是自主機器智能的廣泛目標, 那么在這一意義上, 機器學習是實現人工智能的具體科學方法(Hinton和Salakhutdinov,2006)。

人工神經網絡是未來人工智能和機器學習的重要組成部分, 由相互連接的人工神經元層組成, 以大腦的結構和功能為模型, 通過節(jié)點連接數據, 系統(tǒng)可以被設置為簡單或多層神經網絡。深度學習是一種先進的機器學習技術, 將機器的計算能力與神經網絡中的連接模式相結合, 通過構建分層的人工神經網絡, 從原始數據中抽象數據特征、 提取模式和規(guī)律以理解復雜的關系, 并歸納習得知識。深度學習的蓬勃發(fā)展主要歸因于對圖像處理能力的提升、 計算機硬件成本的下降以及機器學習算法效能的進步。

(二)深度學習與傳統(tǒng)機器學習的區(qū)別

傳統(tǒng)的機器學習算法如邏輯回歸和樸素貝葉斯在很大程度上依賴于領域專家事先給定的數據特征, 而不是自主學習挖掘獲取的特征。這些算法往往需要具有領域專業(yè)知識的專家來人工識別預選的數據特征。運用此類傳統(tǒng)機器學習算法做預測時面臨的一個重要問題是, 一些尚未被人類專家預先識別的數據特征在模型學習過程中將不會被考慮到。相比之下, 深度神經網絡接收更多維度的原始輸入, 并通過模型訓練自動學習特征。分層結構中的多個隱藏層使得深度神經網絡能夠自動識別更多的數據特征, 而無需人工干預。這一事實的重要意義在于, 當有大量的數據或任務較復雜時, 機器學習基于海量數據挖掘以及復雜任務關聯(lián)而識別出的數據特征, 可能比人類專家基于知識和經驗所總結出的數據特征更全面、 更客觀。

(三)深度學習的工作原理

深度神經網絡是由輸入層、 若干隱藏層和輸出層組成, 其中輸入層接收初始數據, 輸出層給出最終的數據標簽(即確定的類別, 例如舞弊或不舞弊、 狗或貓等), 輸入層和輸出層之間的層則被稱為隱藏層。組成一個層的神經元與前(后)層的許多其他神經元相連, 以接收(發(fā)送)數據。神經元之間的每個連接最初都被分配一個隨機的數值權重, 這個權重決定了輸入值的重要性, 隨著學習程序對數據重要特征了解的加深, 權重需要不斷優(yōu)化調整。下一層的神經元對輸入數據的加權組合執(zhí)行復雜的非線性轉換, 并將結果傳遞至后續(xù)層, 通過這種方式, 數據從一層流向另一層。與傳統(tǒng)的“淺層”神經網絡只有一個或兩個隱藏層不同, 深度神經網絡有幾十個隱藏層。憑借其大量的神經元, 深度神經網絡比傳統(tǒng)神經網絡具有更大的代表性, 能夠挖掘識別出數據背后隱藏的多個特征, 可以有效地用于大數據分析。

為了訓練深度神經網絡, 每次向系統(tǒng)輸入新的數據實例時, 都要將預測值與訓練數據的實際觀察值進行比較, 并計算出所產生的誤差。然后, 對模型的超參數(如權重)進行微調以減少這些誤差。經過幾千甚至幾百萬次的優(yōu)化調整, 可以識別出隱藏在數據背后越來越多的抽象特征, 實現最小誤差, 訓練好的模型也就可以用來分析未來的數據。例如, 利用深度神經網絡來進行人臉識別的過程中, 大量的人臉圖片作為訓練集, 輸入層識別最基本的特征是像素。隱藏層可以識別更抽象的特征, 如由像素組成的邊緣、 部位(如眼睛、 鼻子和嘴巴)以及物體模型。每一個提取的數據特征都是建立在前一層的較簡單的特征之上的, 而輸出層最終識別出人臉。

四、 深度學習的應用領域與審計功能應用

深度學習適合于分析理解文本、 圖像和視頻等半結構化或非結構化類型的數據, 以實現某些重復性任務的自動化。軟件(如開源數據分析工具軟件R語言、 開源機器學習平臺H2O等)和硬件(圖形處理單元GPU和云計算等)的發(fā)展, 使得之前需要審計師手動完成的審計任務現在可以由機器和程序自動完成。Sun和Vasarhelyi(2017)從文本分析、 語音識別、 圖像(視頻解析)和判斷支持等方面, 提供了深度學習應用于審計實踐的實例。相對于傳統(tǒng)的機器學習技術, 深度學習在機器學習的文本理解、 語音識別、 視覺識別和結構化數據分析等方面具有優(yōu)勢, 可以很好地應用于新一代信息技術環(huán)境下的審計實踐。

(一)深度學習的典型應用領域

1. 文本理解。公司公開披露的財務報告、 公告以及證券監(jiān)管機構的問詢函等均含有大量的文本信息, 如何有效地挖掘分析這些文本數據中所包含的決策有用的信息顯得尤為重要。文本挖掘方法包括文本結構分析(如詞袋模型、 詞性標注、 命名實體識別等), 文本內容分析(如主題模型、 情感分析、 觀點挖掘等)和智能語義理解(詞嵌入模型、 語義類比和因果推理等)。傳統(tǒng)的文本挖掘方法采用詞袋模型, 通過辨識文本文件中每個類別(如反映積極和消極情緒的情緒特征)的單詞比例計數來從文本中提取特征, 依賴于完備、 完整的詞表預定義字典, 而這需要具有豐富先驗知識的人類工程師付出較大的時間精力, 這種方法難以有效地分析冗長的文本文檔, 而且未考慮到文本內容中的語義、 結構、 順序、 附近詞語的上下文以及其他附加信息等。而基于深度學習的文本理解具有自動從原始輸入數據中識別抽象數據特征的能力, 通過構建一個“淺層”神經網絡, 將文本文檔轉換為一組稱為“詞嵌入”的向量, 這些向量在數字上代表了文檔中每個詞的上下文, 然后根據向量的數學相似性, 將具有相似含義的單詞歸為一組, 再利用深度神經網絡接收這些嵌入作為輸入信號, 通過多個隱藏層提取更高級的數據特征, 最后根據訓練數據集的預定義概念(如主題、 實體、 關系、 情感)進行分類, 以此實現文本文檔的機器閱讀和智能理解。

當前, 諸多研究對比分析了深度學習和其他文本挖掘技術, 為深度學習應用于審計文本分析提供了指導 。在審計工作中, 有大量的合同文本、 租賃契約、 協(xié)議書和其他文本文件需要審查, 深度學習的文本理解能力可以幫助審計師從中自動審查和提取關鍵信息。例如, 審計師可以使用深度學習來分析公司財務報告中管理層討論與分析(MD&A)的內容, 以提取管理層對其公司前期業(yè)績、 當前財務狀況和未來盈利預測的信息, 有助于審計師高效地了解公司的運營狀況。此外, 通過對比管理層預測與分析師預測以及公司目前的實際業(yè)績, 審計師可以了解管理層的保守程度。此外, 深度學習還可以從MD&A的文本敘述中識別并衡量管理層的情緒, 幫助審計師預測財務報表舞弊風險等。

2. 語音識別。由深度學習驅動的語音識別已廣泛應用于社會生產和生活的多個領域。智能語音交互設備可以理解各種方言, 并以接近人類的精度消除背景噪音的干擾。亞馬遜的Echo Dot, 可以與人類對話并執(zhí)行播放音樂、 制訂待辦事項清單和提供實時天氣信息等任務。谷歌提供了一個云語音應用編程接口, 利用強大的深度神經網絡允許用戶將語音從聲波轉化為文本, 輸入計算機系統(tǒng)。百度的Deep Voice, 則可以將書面文本轉換成各種語言和聲音。利用IBM Watson提供的深度學習工具, 可識別財務報告電話會議和MD&A的情緒特征, 為預測企業(yè)內部控制缺陷和財務報告誤報提供了額外的信息。

在審計方面, 深度學習的語音識別功能可以幫助解決審計過程中可能面臨的音頻數據分析。如可以用來分析公司財務報告電話會議, 通過提取管理層和其他參與者討論的主題、 關鍵詞、 實體和關系, 識別出說話者的情緒和情感, 協(xié)助審計師洞察出電話會議中的欺騙性討論。此外, 還可以用于審計過程中對公司管理人員的訪談, 通過關注交互過程中的泛泛而談、 是否使用第一人稱代詞或受訪人員的聲音變化等, 辨識出帶有欺詐性的語言線索, 從而為審計師偵測管理層舞弊、 識別內部控制缺陷等提供補充性證據。

3. 視覺識別。視覺識別技術允許機器標記人臉、 識別物體以及圖片或視頻中的內容和場景。在搜索和理解圖像、 繪圖、 醫(yī)學診斷和汽車自動駕駛等方面, 深度學習大大提升了最先進的視覺識別系統(tǒng)的性能。Sutton等(2016)將深度學習應用于審計師與客戶人員的訪談過程, 探討面部識別和語氣檢測等深度學習系統(tǒng)在欺詐監(jiān)測中的潛在用途。

深度學習通過自動檢查掃描文件的圖像如支票、 收據、 銀行對賬單和應收賬款確認書等來識別選定的項目, 從而提升了審計實質性測試的效率和效果。例如, 在檢查支票的掃描圖像時, 可以識別付款金額、 收款人、 路由器號碼和銀行背書。除了靜止圖像的識別, 經過訓練的深度神經網絡還可以檢查視頻片段中的每一個場景, 識別動態(tài)視頻中的行為, 如辨識個人面容、 連續(xù)動作、 GPS位置信息、 物體數量和質量信息, 以及印在物體標簽上的數字或文字等信息。在內部控制測試時, 審計師可以使用深度學習的視覺識別系統(tǒng)來檢查經過員工清點或庫存的網絡攝像頭記錄, 以便做出進一步的措施。在對管理層和員工訪談的過程中, 利用深度學習系統(tǒng)可以通過洞察員工的身體語言和面部表情來檢測潛在的欺騙行為。

4. 結構化數據分析。盡管深度學習在半結構化和非結構化數據分析領域取得了顯著的成效, 但少有研究探究其在處理結構化數據尤其是不平衡數據方面的強大潛力。對于現實生活中的數據分析, 數據不平衡性是一個常見但又極具挑戰(zhàn)性的問題, 例如, 在數以萬計的財務報告中, 欺詐性報表可能僅有數百份; 在所有信用卡持有者中, 未能按時還款的可能只占極少數。在成本敏感的學習情境下, 包含多個隱藏層的深度神經網絡能夠顯著提高面向不平衡數據的總體預測準確性。深度神經網絡的復雜性也有利于對高度變化的任務進行有效預測。在信用卡違約檢測方面, 相比于邏輯回歸、 樸素貝葉斯、 傳統(tǒng)的人工神經網絡和決策樹等模型, 深度學習表現出更好的整體預測性能。

(二)深度學習的審計功能應用

深度學習在文本理解、 語音識別、 視覺識別等領域的優(yōu)勢, 形成了其對半結構化和非結構化數據強大的信息識別能力, 極大地豐富和拓展了審計證據的時空范圍。與此同時, 深度學習還擁有對海量數據高效精準的預測分析能力, 這將為復雜審計決策提供良好的判斷支持。

1. 信息識別功能?;谇笆龅奈谋纠斫狻?語音識別和視覺識別能力, 深度學習可以作為半結構化和非結構化數據的信息識別者, 幫助審計師綜合洞察文本、 圖像、 音頻和視頻等多個來源的關鍵信息, 拓展了審計證據的范圍和數量, 提升了審計證據之間的相互印證性及審計證據的洞察力。EMM“三角證據”認為, 企業(yè)經營狀況(EBS)、 管理層經營陳述(MBR)、 管理信息媒介(MII)三者之間是互為條件、 互為制約、 相互佐證的關系, 三者之間的印證關系(見圖1)可以支持甚至放大每一種證據的可信性和有用性, 增加審計證據的證明力和說服力, 從而提升審計質量。

現有審計過程對于以財務數據為基礎的企業(yè)經營狀況關注較多, 但對于管理層經營陳述以及管理信息媒介所提供的審計證據關注較少, 而深度學習對于半結構化和非結構化數據強大的信息識別能力, 為三種證據之間的交叉驗證提供了重要基礎。例如, 對于管理層經營陳述信息的可靠性, 可以利用深度學習工具, 挖掘分析MD&A部分的情緒特征, 洞察管理層電話會議、 訪談記錄視頻中的管理層可能的舞弊性行為特征, 有助于審計師高效地洞悉管理層的舞弊情況以及公司真實的運營狀況。對于管理信息媒介的文本型數據, 審計師可以利用深度學習的文本理解能力, 將新聞報道和社交媒體評論等文本型數據自動轉化為機器可讀的定量數據, 更深入地解讀新聞媒介和社交媒體中與被審計單位相關的主題、 關系、 情感, 為從外部信息媒介視角分析企業(yè)經營狀況提供補充證據。對于企業(yè)經營狀況, 除了依據傳統(tǒng)結構化的財務數據, 還可以利用深度學習的文本理解和圖像、 視頻和音頻識別, 深度解讀與企業(yè)生產經營相關的各類合同文本信息, 利用物聯(lián)網設備以及企業(yè)生產經營過程中的各種視頻監(jiān)控錄像, 持續(xù)獲取企業(yè)生產運營過程中的各類信息, 以便更加客觀、 準確地理解企業(yè)的生產經營狀況。例如, 為了驗證銷售收入的真實性, 可以建立涵蓋采購合同的文本分析、 產品銷售出庫的視頻監(jiān)控信息、 產品銷售物料配送的物聯(lián)網信息等, 通過系統(tǒng)整合上述信息, 提供更加詳實有效的審計證據。

2. 決策支持功能。審計過程涉及復雜的專業(yè)判斷, 特別是在確定重要性水平、 評估審計風險、 溝通關鍵審計事項和確定審計意見類型時, 要求審計師必須從不同的角度綜合考慮大量的證據來做出最終的決定。

一方面, 基于信息識別功能, 機器學習允許整合文本數據、 音頻、 視頻、 圖像等多種類數據, 并通過數據可視化技術較大地提升了審計師對被審計對象經營業(yè)務的理解。例如, 零售商停車場的可視化數據可以為判定銷售收入的真實性提供輔助。

另一方面, 深度學習基于海量數據強大的預測分析功能, 尤其是當數據量大、 輸入變量多時, 深度學習的預測性能優(yōu)于經典的機器學習方法, 能夠為復雜的審計判斷提供很好的決策支持。例如, 如果能夠通過高效的數據預處理方法, 將由自然語言、 視覺信息組成的大數據清洗為合理干凈的數據集, 并具有較高的計算能力, 那么機器學習算法就可以通過訓練數據識別模式更好地理解數據, 以便提取關鍵信息, 且能最小化人為干預對結果偏見的影響, 提高預測精度和預測能力, 有助于審計師獲得對被審計對象更好的洞察和理解, 從而有助于相關審計決策判斷。對于財務報告錯報的預測, 輸入的數據特征可以包括之前理論研究成果中證實影響財務報告錯報的相關影響因素、 審計師基于經驗判斷認為重要的影響因素以及管理層電話會議、 MD&A文本分析的情感和情緒得分等。

值得注意的是, 不同于深度學習的信息識別功能主要處理半結構化或非結構化數據, 深度學習的決策判斷支持功能可以分析結構化數據, 特別是處理不平衡的結構化數據。一些算法能夠有效地處理不平衡的結構化數據(如生成對抗網絡),而在財務危機預警、 舞弊風險識別、 審計意見預測等審計決策判斷中常常涉及不平衡數據處理問題。

基于深度學習的審計應用能力如圖2所示。

五、 面向審計業(yè)務全流程的深度學習模型審計應用的整合性框架

(一)深度學習模型應用于審計業(yè)務全流程的基本框架

深度學習模型是基于數據驅動的, 為了形成面向審計全過程不同階段各種審計任務的模型訓練和測試數據, 需要由審計師利用標記的財務和非財務數據來設計和開發(fā)審計數據倉庫。特別是要利用深度學習的信息識別功能, 從會計師事務所留存的審計檔案、 前任審計師的永久檔案和審計工作文檔以及大數據時代能反映被審計單位生產經營和財務狀況的視頻、 音頻、 圖像和文本等多種資料中提取機器可讀的數據特征, 并將其轉換為定量變量。基于深度學習信息識別功能所構建的審計數據倉庫涵蓋了半結構化和非結構化數據, 能夠從更多維度刻畫公司的潛在特征, 極大地拓展了審計證據的時空范圍, 為復雜的審計決策提供輔助支持。

審計師需要根據不同審計階段的具體審計目標來確定深度學習模型的預測目標, 每個模型只服務于一個審計目標。服務于不同審計目標的深度學習模型, 從數據倉庫中選擇相應的數據源輸入, 使用迭代方法從分析數據中進行自動化和持續(xù)化的學習, 當訓練學習的數據足夠多時, 通過反饋行動不斷修正學習結果, 可以洞察出隱藏在數據背后的模式特征和規(guī)律, 并根據識別出的穩(wěn)健模式對新輸入數據進行預測。在做出最終決定之前, 審計師基于自身的知識經驗和專業(yè)判斷, 對模型預測結果進行調整和優(yōu)化, 以便決定最終的結果, 并指導審計師采取最終行動, 所有結果會更新至數據倉庫中。通過這種方式, 審計師將獲得包含輸入和輸出(標簽)的新數據集, 并持續(xù)不斷地將其反饋至深度學習模型中, 通過調整模型參數來不斷減少預測誤差, 提升模型的整體有效性。與此同時, 伴隨著數據倉庫持續(xù)更新數據集, 前一審計階段更新的數據倉庫可以傳遞至后續(xù)審計階段, 在最終的審計完成階段, 由最后一個深度神經網絡輸出關于重大錯報風險的最終判斷。如此可以將審計全流程的所有相關數據積累起來, 添加到數據倉庫中, 以便在未來使用。數據倉庫使用得越多, 收集并添加到倉庫的數據越多, 深度學習模型的預測性能也就越好。

(二)面向審計業(yè)務全流程的深度學習模型集成應用

現代風險導向審計的整體流程分為審計計劃、 風險評估、 風險應對和審計報告四個階段, 圖3顯示了審計全流程四個不同階段間的協(xié)同關系,詳細說明了每個階段深度學習的應用。審計過程從基于歷史數據的初始審計數據倉庫開始。在審計計劃階段, 隨著審計師不斷獲得反映公司情況的新數據, 審計數據倉庫被持續(xù)更新, 并從更新的數據倉庫中選擇數據特征來訓練深度學習模型, 訓練好的模型可以應用于新輸入的數據并產生預測結果, 審計師基于知識和經驗判斷來決定是否對模型預測結果進行調整和優(yōu)化, 并將最終結果更新至數據倉庫, 同時傳遞至后續(xù)的風險評估階段。類似地, 此階段采集被審計單位及其環(huán)境的最新數據, 識別可能存在重大錯報風險、 舞弊風險、 信息系統(tǒng)安全風險的事項和情況并更新數據倉庫, 從數據倉庫中選擇數據特征來訓練深度學習模型, 以執(zhí)行不同的風險評估審計程序。最終的審計結果會進一步更新數據倉庫, 并將其傳遞到后續(xù)的風險應對階段和審計完成階段。類似的過程持續(xù)運行, 最后一個階段完成后, 更新后的審計數據倉庫將被保存和傳遞, 并作為下一年度審計的新起點。表1系統(tǒng)描述了不同審計階段的數據源、 數據特征及其輸出標簽。

1. 審計計劃階段。最初的審計數據倉庫在審計計劃之前就已經存在。審計計劃階段需要獲取新的數據: 文本數據包括企業(yè)披露的信息、 新聞媒體和社會媒體中披露的信息, 揭示了公司在財務業(yè)績、 商業(yè)運作和戰(zhàn)略、 管理層誠信、 產品或服務質量、 客戶滿意度等方面的業(yè)務情況和行業(yè)環(huán)境、 音頻數據通常包括電話會議、 股東會議、 電話和訪談錄音等、 視頻和圖像數據包括在實地的倉庫、 商店、 辦公室或工廠拍攝的視頻、 圖像等文件。具體的如表1所示。

在這一階段, 審計師在了解客戶行業(yè)背景和業(yè)務經營情況的基礎上, 決定與客戶的契約關系。一旦審計師考慮接受新客戶或者保留老客戶, 就可以根據新的數據源收集新的數據輸入, 并添加到初始數據倉庫。如果數據是半結構化(如文本)的或非結構化(如語音、 圖像和視頻)的, 則可利用深度學習的信息識別功能來提取關鍵特征, 并將其轉換為機器可讀的格式。深度神經網絡的開發(fā)是為了執(zhí)行各項審計任務, 審計計劃階段包括識別戰(zhàn)略風險與經營風險、 固有風險和控制風險、 確定可接受的審計風險和重要性水平等。對于每項任務, 深度神經網絡的開發(fā)是通過使用初始數據倉庫的歷史數據來訓練和驗證模型, 并使用新的輸入數據來進行預測。例如, 為了評估戰(zhàn)略風險, 可以開發(fā)一個深度神經網絡來洞察重要的財經媒體、 券商和機構投資者等對公司重要戰(zhàn)略性投資帶來收入增長的見解。上述過程中, 每個深度神經網絡的輸出僅僅是對各項審計任務(目標)的建議結果, 包括關于是否接受或拒絕客戶的決定、 可接受審計風險和重要性水平等?;谶@些建議結果, 審計師憑借自身的知識、 經驗做出相應調整并給出最終決定, 實際結果將被記錄下來, 以便在下一階段更新數據倉庫。

2. 風險評估階段。審計模式經歷了“賬項基礎審計—制度基礎審計—風險導向審計”的演變。現代風險導向審計的實施以風險評估為切入點, 對審計風險的識別、 評估和應對貫穿于審計全過程, 以便將審計風險降低至可接受的低水平。風險評估過程中, 審計師應當首先了解被審計單位及其環(huán)境, 詢問被審計單位管理層和內部相關人員?;趯舅幮袠I(yè)狀況與外部環(huán)境、 公司目標、 戰(zhàn)略及相關經營風險、 公司性質、 公司會計政策選擇等的了解, 審計師將收集新的半結構化和非結構化數據加入數據倉庫。其中: 文本數據包括公司所處行業(yè)的市場競爭與技術發(fā)展、 公司應遵循的法律法規(guī)和政策監(jiān)管等相關文件、 公司內部控制手冊、 內部控制評價過程文件、 內部控制執(zhí)行過程相關記錄; 音頻數據包括對于公司行業(yè)發(fā)展、 戰(zhàn)略目標及其經營狀況, 對管理層和工作人員進行詢問的錄音等; 視頻和圖像數據包括捕捉業(yè)務流程的視頻和圖像剪輯, 如庫存檢查和盤點活動的錄像; 結構化數據包括反映公司所處行業(yè)競爭狀況、 公司戰(zhàn)略發(fā)展狀況以及衡量內部控制有效性等的定量指標, 如行業(yè)競爭度、 公司戰(zhàn)略目標、 內部控制缺陷數等。

可以利用深度學習的方法獲取上述多源異構的數據: 根據信息識別功能, 通過對管理層和執(zhí)行人員的訪談, 從受訪者的肢體語言和聲音變化等來洞察潛在的管理層誠信情況; 根據決策判斷功能, 從受訪者回答的內容中識別出潛在的數據特征, 并預測出可能的欺詐行為。數據倉庫輸出的標簽包含審計師對重大錯報風險的評估、 內部控制基本情況的了解、 舞弊導致的重大錯報風險等。

在審計風險識別過程中, 一旦獲得新的數據并擴充至審計數據倉庫, 就可以建立深度神經網絡模型來執(zhí)行重大錯報風險的識別、 評估與再評估以及后續(xù)行動等各項審計任務。對于重大錯報風險評估, 審計師將機器學習模型預測的重大錯報風險視為建議結果, 結合自身的知識和經驗判斷給出風險水平的最終結果, 該結果將被用于調整神經網絡模型并更新數據倉庫。同樣地, 了解內部控制情況可建立一個深度神經網絡, 即先構建一個深度神經網絡模型, 檢查所有商業(yè)文件的批準簽名、 印章等情況, 同時建立另一個深度神經網絡模型, 審查各個部門確認設備的視頻記錄, 兩者相互印證來驗證公司內部控制的基本情況, 并將結果納入數據倉庫。隨后, 審計師應用深度神經網絡, 根據更新的數據對重大錯報風險進行重新評估, 重新評估的模型預測結果供審計師作為決策參考并最終確定重大錯報風險水平, 更新至數據倉庫。最后, 以更新后的數據倉庫為基礎, 利用深度學習技術構建模型來預測后續(xù)額外的控制測試和實質性程序。

3. 風險應對階段。大數據環(huán)境對控制測試和實質性測試產生深刻影響。在控制測試方面, 信息系統(tǒng)作為生產數據的“工廠”, 為提高被審單位數據的真實性和可靠性, 信息系統(tǒng)審計成為不可或缺的重要組成部分, 控制測試甚至有可能會被信息系統(tǒng)審計所取代。在實質性測試方面, 數據分析技術的快速發(fā)展促使審計數據分析能力大幅提升, 驅使著抽樣審計向全樣本數據審計轉變, 而且, 基于深度學習強大的信息識別功能, 文本、 圖片、 音頻、 視頻等新型審計證據不斷融入, 傳統(tǒng)的基于結構化財務數據的審計轉向面向全域大數據的審計。如利用掃描和光學字符識別(OCR)技術來審核半結構化的合同文本, 估計與預測公司營業(yè)收入; 利用海量全域大數據分析, 開展全樣本審計; 利用智能合同和持續(xù)性監(jiān)控技術, 實現合同執(zhí)行監(jiān)督和過程偏差自動監(jiān)控; 利用GPS衛(wèi)星定位技術監(jiān)控停車場數據或跟蹤商品物流等數據,估計被審單位的銷售收入; 利用物聯(lián)網和傳感器技術, 記錄物聯(lián)網設備使用情況, 驗證被審單位數據的真實性、 可靠性?;谏疃葘W習模型構建的審計數據倉庫包含了審計實質性程序所需的全面證據, 包括文本文件(應收賬款余額的客戶函證、 采購訂單、 銷售發(fā)票、 運輸文件、 董事會會議記錄和電子郵件、 內部控制自我評估報告、 內部控制缺陷披露)、 音頻文件(電話會議、 董事會會議、 對管理人員和內部其他人員的詢問等)、 視頻文件(庫存盤點和固定資產檢查)和圖像文件(支票、 收據、 銀行對賬單以及生產運營過程的監(jiān)控圖像)。此外, 還有結構化數據, ERP系統(tǒng)中各類日記賬、 明細賬、 總賬等的會計記錄、 試算表和其他文件。輸出(標簽)包括內部控制測試和實質性程序的建議、 實質性測試結果、 審計證據充分性和適當性的評估結果以及審計師后續(xù)行動的建議等。

通過深度學習的信息識別和判斷支持功能, 一些實質性測試可以自動進行。如要求供應商書面確認截至資產負債表日的應付賬款的細節(jié), 審查確認函作為應付賬款負債證據, 以確保負債總額與客戶的會計記錄相符; 還可通過無人機拍攝客戶存貨情況來評估存貨資產的狀況。實質性測試階段還有一項重要任務就是評估審計證據的充分性和適當性。基于審計數據倉庫中的海量歷史數據所訓練出來的深度神經網絡, 能夠幫助審計師確定當前審計證據對特定審計目標是否充分, 并提供是否要獲得更多的證據、 收集哪些類型的證據以及是否進行額外的實質性測試以獲得新證據等后續(xù)建議。審計師據此采取實際行動用來調整優(yōu)化神經網絡, 相關結果也會再次更新至數據倉庫, 所有工作最終都可以通過深度學習實現自動化。

4. 審計完成階段。審計的最后階段是完成審計和報告結果。該階段的初始數據倉庫輸入的數據源包括律師函、 代理函、 資產負債表日期后發(fā)布的內部聲明, 或與管理層就未記錄的或有事項進行訪談的視頻和音頻記錄, 輸出的標簽是公司是否存在重大錯報。

在這一階段, 可以利用深度學習技術自動執(zhí)行一些額外的審計程序, 為審計提供新的證據。如為了實現財務報告的列報和披露是否充分的審計目標, 可以訓練深度神經網絡來審查債務合同, 以確定應收賬款是否被抵押, 評估與債務的發(fā)生和權利相關的管理層認定; 可以用其來閱讀財務報表附注, 以確定資產的分類是否正確; 可以用其審查資產負債表日期之后編制的內部報表, 以提供資產負債表日后事項的審計證據; 可以提取律師函中的重要信息, 以獲取有關或有負債的證據。至此, 審計數據倉庫保存了整個審計過程中除最終審計意見之外的所有數據, 并構建最終的深度神經網絡模型來預測重大錯報風險, 審計師對重大錯報風險水平做出最終決定, 將模型預測值和審計師最終確定的重大錯報風險進行對比測試, 實現預測模型的自我學習和自我優(yōu)化, 相關學習的輸出結果反饋更新至數據倉庫。最終, 審計師將根據最后確定的重大錯報風險獨立發(fā)表審計意見, 出具審計報告。

六、 研究結論與啟示

深度學習在文本理解、 語音識別、 視覺識別等領域的優(yōu)勢使其具有對半結構化和非結構化數據的信息識別能力, 拓展了審計證據的時空范圍。同時, 其對海量數據強大的預測分析能力也使其能夠為復雜審計決策提供良好的判斷支持。這兩大能力極大地拓展了審計證據的范圍, 改善了審計決策機制, 有助于提升審計效率和審計質量。文章基于深度學習模型的信息識別功能和判斷支持功能, 將深度學習的智能分析與審計師的經驗修正有效融合, 不斷擴充、 更新、 迭代審計數據倉庫, 為基于數據驅動的深度神經網絡提供更好的預測性能。面向審計業(yè)務全流程, 構建深度學習模型應用于審計業(yè)務不同階段的集成性、 整合性框架, 以便更好地指導和推動深度學習模型在審計方面的實際應用。為了進一步推動在不同審計階段、 不同審計目標下深度學習模型的審計應用, 本文認為下列問題值得進一步探索:

一是如何及時、 高效地收集全面完整的內外部全域審計大數據, 并建立深度學習模型所需的數據倉庫。深度學習模型是基于數據驅動的, 為了提升模型訓練效果, 需要在傳統(tǒng)審計文件的基礎上, 通過深度學習的文本理解、 語音識別和視覺識別等技術, 吸納更多的源自射頻識別傳感器、 視頻和音頻文件等的非結構化數據, 確保審計數據倉庫的完整性, 并在會計師事務所內部建立高效且兼顧成本效益的信息共享機制, 關注數據安全和隱私保護。

二是如何破解缺少標簽化數據的應用瓶頸。深度學習模型訓練是由大量帶有標簽的數據集推動的, 現實情境下很難使所有的數據都有預定義的特征來標記。例如, 為了構建一個深度學習模型, 識別電話會議中管理者語言的情感特征, 需要審計師或專業(yè)領域人員花費大量的時間精力來辨識管理者陳述的語氣特征, 并標識出相應的情感分類標簽。此時, 如何利用有限的帶有標簽的審計數據, 來訓練高性能的深度學習模型顯得尤為重要。無監(jiān)督、 半監(jiān)督和一次性學習技術能夠用大量的無標簽數據來補充少量的標簽數據, 從而為破解深度學習模型應用缺少標簽化數據這一難題提供了解決思路和技術方案。

三是如何制定指導新興技術審計應用的標準。大數據、 云計算、 人工智能等新一代信息技術驅動下的數字化轉型, 使得審計過程越來越多地使用深度學習和其他數據分析技術, 這將改變審計證據的數量和類型、 審計程序和方法以及專業(yè)判斷的性質和依據, 要求相關準則制定機構必須重新考慮審計標準, 以便能科學指導和有效應用這些技術。早在2016年國際審計與鑒證準則理事會(IAASB)的數據分析工作組就已經起草了新的國際審計準則, 并向相關方征求意見。

四是如何拓展審計師的知識和能力結構以適應數字化轉型。盡管新技術為審計師提供了大量有用的數據, 但也帶來了巨大的應用挑戰(zhàn), 改變了審計團隊的知識結構和互動方式, 需要審計師掌握數據分析的相關知識和技能, 在海量數據中“去偽存真、 去粗取精”, 以洞察海量數據背后隱藏的特征和規(guī)律。雖然審計師不必成為數據科學家或機器學習專家, 但需要掌握統(tǒng)計學、 機器學習、 數據分析和編程方面的基礎知識和技能, 以便能夠與機器學習和人工智能領域的專業(yè)人士進行有效的溝通交流和分工合作, 為深度學習模型審計應用的優(yōu)化提供專業(yè)建議和知識支持。

【 主 要 參 考 文 獻 】

Hinton G. E., Salakhutdinov R.. Reducing the dimensionality of data with neural networks[J]. Science,2006(31):3504 ~ 3507.

Mitchell T. M.. The discipline of machine learning [M].Pittsburgh,PA:Carnegie Mellon University,2006.

Sun T., M. A. Vasarhelyi. Deep learning and the future of auditing:How an evolving technology could transform analysis and improve judgment[ J].The CPA Journal,2017(6):24 ~ 29.

Ting(Sophia) Sun. Applying deep learning to Audit Procedures:An illustrative framework[ J]. Accounting Horizons,2019(3):89 ~ 109.

【基金項目】財政部全國會計重點課題“基于大數據的多維度價值創(chuàng)造報告與決策體系”(項目編號:2020ASC009)

【作者單位】1.合肥工業(yè)大學管理學院,合肥 230009;2.合肥工業(yè)大學經濟學院,合肥 230601

猜你喜歡
機器學習數據倉庫深度學習
基于數據倉庫的住房城鄉(xiāng)建設信息系統(tǒng)整合研究
分布式存儲系統(tǒng)在液晶面板制造數據倉庫中的設計
電子制作(2016年15期)2017-01-15 13:39:15
MOOC與翻轉課堂融合的深度學習場域建構
基于機器學習的圖像特征提取技術在圖像版權保護中的應用
大數據技術在反恐怖主義中的應用展望
探析電力系統(tǒng)調度中數據倉庫技術的應用
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
基于深度卷積網絡的人臉年齡分析算法與實現
軟件工程(2016年8期)2016-10-25 15:47:34
丘北县| 泗水县| 即墨市| 迁西县| 德令哈市| 福海县| 崇信县| 罗甸县| 临澧县| 张家口市| 远安县| 镇安县| 晋中市| 长垣县| 云龙县| 青海省| 新巴尔虎右旗| 简阳市| 汨罗市| 建阳市| 泌阳县| 萍乡市| 家居| 封开县| 淮滨县| 新沂市| 宣汉县| 大余县| 堆龙德庆县| 定结县| 淮北市| 绿春县| 西乌珠穆沁旗| 合川市| 如东县| 西畴县| 抚顺县| 江永县| 乐昌市| 上思县| 阳东县|