| 吳花平 黃尹薇 劉自豪
2022年4月,《中共中央、國(guó)務(wù)院關(guān)于加快建設(shè)全國(guó)統(tǒng)一大市場(chǎng)的意見》公布,提出打造統(tǒng)一的要素和資源市場(chǎng),包括健全城鄉(xiāng)統(tǒng)一的土地和勞動(dòng)力市場(chǎng)、加快發(fā)展統(tǒng)一的資本市場(chǎng)、加快培育統(tǒng)一的技術(shù)和數(shù)據(jù)市場(chǎng)、建設(shè)全國(guó)統(tǒng)一的能源市場(chǎng)以及培育發(fā)展全國(guó)統(tǒng)一的生態(tài)環(huán)境市場(chǎng)。其中,能源市場(chǎng)和生態(tài)環(huán)境市場(chǎng)均與“雙碳”目標(biāo)緊密相關(guān)。低碳轉(zhuǎn)型是現(xiàn)階段我國(guó)經(jīng)濟(jì)社會(huì)發(fā)展、轉(zhuǎn)型的必經(jīng)之路,不同于發(fā)達(dá)國(guó)家的低碳轉(zhuǎn)型路徑,我國(guó)的低碳轉(zhuǎn)型需要在實(shí)現(xiàn)節(jié)能減排的過程中,滿足不斷擴(kuò)張的能源需求。然而,在“雙碳”目標(biāo)的驅(qū)動(dòng)下,仍存在部分企業(yè)對(duì)碳排放數(shù)據(jù)進(jìn)行修改甚至偽造的舞弊行為,進(jìn)而打破碳市場(chǎng)規(guī)則、擾亂碳市場(chǎng)正常秩序,嚴(yán)重危害碳市場(chǎng)健康運(yùn)行,阻礙“雙碳”目標(biāo)的順利實(shí)現(xiàn)。
碳排放審計(jì)又稱碳審計(jì),它不是簡(jiǎn)單的財(cái)務(wù)審計(jì)、合規(guī)審計(jì),而是一種應(yīng)對(duì)碳減排工作的多元且復(fù)雜的審計(jì),是環(huán)境審計(jì)的子項(xiàng),也是環(huán)境審計(jì)工作新的指向。作為一種為改善生態(tài)環(huán)境而控制碳排放量的管理工具,碳排放審計(jì)為我國(guó)低碳經(jīng)濟(jì)的發(fā)展提供了一套切實(shí)可行的監(jiān)督約束機(jī)制。隨著碳排放審計(jì)理論與實(shí)踐的發(fā)展,以英國(guó)為代表的部分發(fā)達(dá)國(guó)家早已實(shí)施了碳排放審計(jì),例如,在2009年,英國(guó)環(huán)境審計(jì)委員會(huì)(EAC)針對(duì)碳的收集與儲(chǔ)存、碳交易市場(chǎng)、碳收支等諸多低碳問題提出了進(jìn)行全面審計(jì)的工作報(bào)告,成為全面碳審計(jì)的應(yīng)用典范;同年,作為碳審計(jì)實(shí)踐較早的國(guó)家之一,美國(guó)國(guó)家審計(jì)署也發(fā)布報(bào)告指出對(duì)汽車、房產(chǎn)和生活方式進(jìn)行審計(jì),抓住了碳審計(jì)重點(diǎn),進(jìn)而增強(qiáng)了人民的低碳意識(shí)。然而,在大數(shù)據(jù)時(shí)代下,傳統(tǒng)的數(shù)據(jù)采集、處理和分析應(yīng)用方法,已難以適應(yīng)海量的碳排放審計(jì)數(shù)據(jù)環(huán)境,若碳排放審計(jì)人員繼續(xù)按照傳統(tǒng)審計(jì)方法進(jìn)行碳排放審計(jì),不僅無法充分挖掘?qū)徲?jì)數(shù)據(jù)的潛在價(jià)值,而且使得審計(jì)風(fēng)險(xiǎn)大大增加,甚至導(dǎo)致審計(jì)失敗。因此,如何在海量的多源、多維、異構(gòu)審計(jì)數(shù)據(jù)中,充分利用審計(jì)數(shù)據(jù)的大集中、大綜合、大關(guān)聯(lián)的特征,促進(jìn)審計(jì)人員形成用數(shù)據(jù)說話、用數(shù)據(jù)決策的大數(shù)據(jù)審計(jì)思維,實(shí)現(xiàn)碳排放審計(jì)疑點(diǎn)的精準(zhǔn)定位,加強(qiáng)審計(jì)力度、優(yōu)化審計(jì)方法、提高審計(jì)效率,已成為碳排放審計(jì)面臨的迫切要求和全新挑戰(zhàn)。
基于此,部分學(xué)者提出,通過在審計(jì)工作中引入大數(shù)據(jù)技術(shù),例如機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等方法輔助審計(jì)活動(dòng)的開展,從而提升審計(jì)效率。機(jī)器學(xué)習(xí)是一個(gè)多學(xué)科交叉研究領(lǐng)域,包括計(jì)算機(jī)學(xué)科、概率統(tǒng)計(jì)學(xué)科等,其利用計(jì)算機(jī)對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行學(xué)習(xí)并產(chǎn)生反映數(shù)據(jù)關(guān)聯(lián)的模型從而輔助判斷與決策。機(jī)器學(xué)習(xí)按照對(duì)不同數(shù)據(jù)的處理方式,一般可分為監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)以及強(qiáng)化學(xué)習(xí)。作為無監(jiān)督學(xué)習(xí)的一種,K-Means聚類算法通過迭代求解,能夠在無任何先驗(yàn)知識(shí)的情況下發(fā)掘數(shù)據(jù)的相似性,進(jìn)而實(shí)現(xiàn)數(shù)據(jù)分組的目的。因此,基于K-Means聚類算法的思想簡(jiǎn)單、聚類效果優(yōu)、可解釋性強(qiáng)等優(yōu)點(diǎn),受到了學(xué)者的廣泛關(guān)注。楊蘊(yùn)毅等運(yùn)用迭代式聚類的方法,以上市公司財(cái)務(wù)數(shù)據(jù)為樣本,利用證監(jiān)會(huì)等機(jī)構(gòu)的非結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)了審計(jì)疑點(diǎn)的迅速挖掘。Wang Xuren等針對(duì)用戶異常數(shù)據(jù)庫行為,采用K-Means 聚類方法對(duì)其進(jìn)行分組,大幅度提高了數(shù)據(jù)庫泄露風(fēng)險(xiǎn)的檢測(cè)效率與精確性。由此可見,K-Means聚類方法有助于應(yīng)對(duì)大數(shù)據(jù)中的異常問題,并且對(duì)審計(jì)疑點(diǎn)的迅速發(fā)現(xiàn)與確認(rèn)有著獨(dú)特的天然技術(shù)優(yōu)勢(shì)。
本文在對(duì)已有文獻(xiàn)的整理和分析的基礎(chǔ)上,說明了K-Means聚類算法在審計(jì)工作中能夠具有獨(dú)特優(yōu)勢(shì),為“機(jī)器學(xué)習(xí)+碳排放審計(jì)”的研究提供了相應(yīng)理論依據(jù)?;诖耍疚膹漠?dāng)前傳統(tǒng)碳排放審計(jì)中存在的問題出發(fā),創(chuàng)造性地將機(jī)器學(xué)習(xí)中的K-Means聚類算法與碳排放審計(jì)相結(jié)合,構(gòu)建了碳排放審計(jì)預(yù)警框架,在降低審計(jì)成本的同時(shí),兼顧了審計(jì)效率,最后以H企業(yè)碳排放審計(jì)預(yù)警為例進(jìn)行仿真,表明基于機(jī)器學(xué)習(xí)K-Means聚類算法的碳排放審計(jì)預(yù)警系統(tǒng)的可行性,進(jìn)一步推動(dòng)了碳排放審計(jì)的發(fā)展。
K-Means算法是當(dāng)前最為流行的聚類算法模型之一,主要通過逐步迭代優(yōu)化聚類結(jié)果,同時(shí)不斷地將目標(biāo)數(shù)據(jù)集重新分配到每個(gè)聚類中,從而被廣泛應(yīng)用于數(shù)據(jù)處理、圖像識(shí)別、市場(chǎng)分析和風(fēng)險(xiǎn)評(píng)估等研究領(lǐng)域。其主要步驟如下:
步驟(1):隨機(jī)地從N個(gè)樣本數(shù)據(jù)中選擇K個(gè)對(duì)象,其中每個(gè)對(duì)象均代表一個(gè)簇的初始均值或質(zhì)心;
步驟(2):對(duì)剩余的對(duì)象,根據(jù)其到每個(gè)簇均值的歐氏距離,將其分配到距離最近的簇中;
步驟(3):使用每個(gè)聚類中的樣本均值作為新的質(zhì)心。
接下來,依次重復(fù)步驟(2)和(3)直到簇的均值不再發(fā)生變化,聚類中心不再改變。
其中,兩個(gè)n維向量x=(x1,…,xn)和y=(y1,…,yn)之間的歐氏距離d(x,y)定義如下:
K-Means聚類算法評(píng)價(jià)準(zhǔn)則之一是誤差平方和準(zhǔn)則,誤差平方和簡(jiǎn)稱為SSE,其定義如下:
其中,k為簇的個(gè)數(shù),Ci為第i簇,p為某個(gè)簇中任意一點(diǎn),mi為簇Ci的均值。SSE值越小,說明數(shù)據(jù)點(diǎn)越接近質(zhì)心,聚類效果則越好;反之,若SSE越大,聚類效果則越差,多個(gè)聚類被視為一個(gè)聚類的可能性就越大。因此,在聚類過程中需要將誤差平方和較大的聚類再次進(jìn)行劃分。
碳排放審計(jì)的實(shí)施表明環(huán)境保護(hù)不能局限于先污染后治理的方式,而是需要通過對(duì)各重點(diǎn)行業(yè),特別是工業(yè)、火電以及鋼鐵等行業(yè)的企業(yè)環(huán)境污染進(jìn)行監(jiān)督制約和預(yù)防,從而驗(yàn)證被審計(jì)單位在履行碳排放社會(huì)責(zé)任方面是否存在舞弊行為。傳統(tǒng)的碳排放審計(jì)流程主要包括三個(gè)階段:準(zhǔn)備階段、實(shí)施階段和報(bào)告階段,具體如圖1所示。
圖1 碳排放審計(jì)流程
基于對(duì)流程的總體分析,總結(jié)出目前碳排放審計(jì)主要存在三個(gè)方面的不足:首先,在計(jì)劃準(zhǔn)備階段,審計(jì)人員需通過收集、評(píng)審碳排放相關(guān)資料,制定碳排放審計(jì)計(jì)劃,但由于碳排放審計(jì)與環(huán)境學(xué)、能源學(xué)等化工知識(shí)緊密相關(guān),從而對(duì)審計(jì)人員的專業(yè)技能和綜合素質(zhì)提出了更高的要求。在碳排放審計(jì)工作下,審計(jì)人員不僅要對(duì)碳排放相關(guān)資金進(jìn)行審計(jì),還需了解碳排放數(shù)據(jù)中蘊(yùn)含的審計(jì)信息,掌握碳排放審計(jì)技術(shù),深刻把握碳排放政策,對(duì)傳統(tǒng)審計(jì)人員提出了巨大挑戰(zhàn)。其次,在審計(jì)執(zhí)行階段,審計(jì)人員實(shí)施對(duì)碳排放審計(jì)評(píng)估,需對(duì)碳排放源、碳排放設(shè)備進(jìn)行審計(jì)抽樣,然而,當(dāng)前審計(jì)數(shù)據(jù)往往具有數(shù)據(jù)容量大、數(shù)據(jù)類型多等特征,如果仍采用傳統(tǒng)方法進(jìn)行抽樣,則需要從整體中抽取大量的樣本,造成人力、物力、財(cái)力的耗費(fèi),往往無法充分挖掘出有價(jià)值的審計(jì)疑點(diǎn)。因此,為提高審計(jì)效率,基于大數(shù)據(jù)技術(shù)的數(shù)據(jù)采集方法必不可少。通過運(yùn)用大數(shù)據(jù)技術(shù)方法減輕工作量、大數(shù)據(jù)智能算法發(fā)現(xiàn)異常,并針對(duì)異常點(diǎn)再進(jìn)行審計(jì)分析,能夠有效避免數(shù)據(jù)量大導(dǎo)致審計(jì)工作復(fù)雜繁瑣等問題。最后,在審計(jì)報(bào)告階段,由于碳排放信息未得到充分披露,碳排放報(bào)告數(shù)據(jù)缺乏精準(zhǔn)性,從而使得碳排放審計(jì)相關(guān)信息不具備完整性,難以進(jìn)行量化記錄,故而使得碳排放審計(jì)在一定程度上蘊(yùn)含巨大的風(fēng)險(xiǎn)。
預(yù)警系統(tǒng)是運(yùn)用科學(xué)的手段,在預(yù)測(cè)與評(píng)價(jià)的基礎(chǔ)上,根據(jù)預(yù)警目標(biāo)設(shè)立預(yù)警指標(biāo),并在問題的萌芽階段,合理預(yù)估未來發(fā)展?fàn)顩r、度量未來風(fēng)險(xiǎn)程度的一整套運(yùn)行程序,其中包括設(shè)定預(yù)警目標(biāo)、設(shè)計(jì)預(yù)警指標(biāo)、確定預(yù)警閾值、數(shù)據(jù)處理、產(chǎn)生預(yù)警信號(hào)和反饋預(yù)警效果等。為充分發(fā)揮審計(jì)的事前預(yù)防功能,預(yù)警系統(tǒng)通過對(duì)企業(yè)業(yè)務(wù)活動(dòng)中產(chǎn)生的數(shù)據(jù)信息特性進(jìn)行分析,預(yù)測(cè)是否存在審計(jì)風(fēng)險(xiǎn),輸出審計(jì)預(yù)警,對(duì)審計(jì)風(fēng)險(xiǎn)達(dá)到監(jiān)控和規(guī)避的作用,進(jìn)而實(shí)現(xiàn)防范風(fēng)險(xiǎn)的效果,這種將風(fēng)險(xiǎn)抑制住的方法將成為審計(jì)模式發(fā)展的一個(gè)新方向,所以構(gòu)建一套行之有效的審計(jì)預(yù)警系統(tǒng)至關(guān)重要。目前,在智能審計(jì)下,作為碳排放審計(jì)的被審計(jì)單位,碳排放數(shù)據(jù)信息龐大,監(jiān)測(cè)碳排放量的手段復(fù)雜,如果僅靠傳統(tǒng)的審計(jì)預(yù)警模型已不能輔助審計(jì)人員進(jìn)行高效的碳排放審計(jì),也不能反映出對(duì)碳排放實(shí)時(shí)狀況的監(jiān)測(cè),缺乏對(duì)風(fēng)險(xiǎn)的監(jiān)控和預(yù)警。因此,為了更加有效的解決大數(shù)據(jù)背景下的這一系列問題,下文將基于K-Means聚類算法對(duì)碳排放審計(jì)預(yù)警進(jìn)行探究。
1.預(yù)警流程設(shè)計(jì)?;贙-Means聚類算法對(duì)碳排放審計(jì)預(yù)警流程進(jìn)行設(shè)計(jì),具體如圖2所示,第一步,獲取數(shù)據(jù)。獲取被審計(jì)單位內(nèi)部相關(guān)數(shù)據(jù),該數(shù)據(jù)不僅包括與碳排放相關(guān)的數(shù)據(jù),還應(yīng)涵蓋相關(guān)財(cái)務(wù)數(shù)據(jù),再將數(shù)據(jù)進(jìn)行My SQL或者數(shù)據(jù)挖掘等大數(shù)據(jù)智能采集分析技術(shù)處理,然后將數(shù)據(jù)儲(chǔ)存在數(shù)據(jù)庫中以便提??;第二步,數(shù)據(jù)處理。數(shù)據(jù)值缺失是數(shù)據(jù)分析中的常見問題之一,在大量的審計(jì)資料中難免會(huì)遇到信息被遺漏的問題,故上述原始數(shù)據(jù)記錄中極有可能存在空行、空值等情況,出現(xiàn)的缺失值會(huì)使后續(xù)運(yùn)行算法模型陷入混亂,從而導(dǎo)致輸出結(jié)果不可靠,因此,數(shù)據(jù)清理和數(shù)據(jù)轉(zhuǎn)換必不可少,最常見的處理方法則是Z-score正規(guī)化方法;第三步,聚類分析。為了將具有相似“特征”的數(shù)據(jù)劃分在同一個(gè)類別中,K-Means聚類算法通過迭代將所有數(shù)據(jù)進(jìn)行分類,直至聚類中心不再發(fā)生變化,分類結(jié)果不再調(diào)整,則算法結(jié)束。但在正式聚類分析前,尋找一個(gè)適當(dāng)?shù)腒值是獲取最佳聚類效果的關(guān)鍵,常見的K值選取方法是手肘法,這是一種利用SSE值和K值的關(guān)系圖確認(rèn)最優(yōu)K值的方法。當(dāng)K值小于真實(shí)簇?cái)?shù)時(shí),由于每個(gè)簇之間的聚集度將隨著K值的增加而增加,因此SSE值會(huì)大幅度降低,關(guān)系圖將呈現(xiàn)出比較陡峭的連線;當(dāng)K值達(dá)到真實(shí)聚類數(shù)時(shí),隨著K值的增大,SSE值的變化幅度將會(huì)減小,關(guān)系圖呈現(xiàn)出比較平穩(wěn)的連線。因此,SSE值和K值的關(guān)系圖是一個(gè)手肘的形狀,其中拐點(diǎn)處的K值則是樣本集的實(shí)際聚類數(shù),也是最佳聚類數(shù);第四步,異常點(diǎn)檢測(cè)。在完成K-Means聚類分析后,在對(duì)每個(gè)簇誤差平方和大小的比較基礎(chǔ)上,進(jìn)一步選取誤差平方和較大的簇并計(jì)算簇內(nèi)各點(diǎn)距質(zhì)心的距離,判斷是否出現(xiàn)嚴(yán)重偏離質(zhì)心的點(diǎn),從而區(qū)分出正常數(shù)據(jù)與異常數(shù)據(jù);第五步,風(fēng)險(xiǎn)預(yù)警。將異常數(shù)據(jù)作為審計(jì)疑點(diǎn),進(jìn)行風(fēng)險(xiǎn)信號(hào)傳遞,審計(jì)人員針對(duì)審計(jì)疑點(diǎn)根據(jù)企業(yè)歷史數(shù)據(jù)以及企業(yè)的相關(guān)真實(shí)情況進(jìn)行合理判斷,若證實(shí)該審計(jì)疑點(diǎn)的確存在相關(guān)審計(jì)風(fēng)險(xiǎn),應(yīng)即刻做出風(fēng)險(xiǎn)預(yù)警,反之,不需風(fēng)險(xiǎn)預(yù)警。
2.預(yù)警指標(biāo)設(shè)計(jì)。為確保預(yù)警達(dá)到良好的效果,預(yù)警指標(biāo)應(yīng)遵循重要性和可得性,選取更具有代表性的指標(biāo)才能提升預(yù)警的準(zhǔn)確性。在對(duì)碳排放結(jié)果進(jìn)行檢驗(yàn)、評(píng)價(jià)被審計(jì)對(duì)象碳排放水平時(shí),可使用的碳排放水平指標(biāo)包括:二氧化碳排放總量、碳排放強(qiáng)度、單位GDP能耗、人均碳排放量,并且Piecyk(2009)也認(rèn)為碳排放審計(jì)的主要步驟包括確定審計(jì)目標(biāo)和路線、選擇計(jì)算方法、確定審計(jì)邊界、選擇排放因素、數(shù)據(jù)收集、碳排放計(jì)算和信息披露,由此可以說明碳排放量在碳排放審計(jì)過程中具有極大的影響,故將碳排放審計(jì)預(yù)警的其中一個(gè)指標(biāo)設(shè)置為碳排放量。碳排放強(qiáng)度是由碳排放量與國(guó)民生產(chǎn)總值GDP的比值構(gòu)成,其中產(chǎn)業(yè)結(jié)構(gòu)變動(dòng)作為碳排放量的影響因素之一,對(duì)碳排放強(qiáng)度起著根本性影響,這是由于各產(chǎn)業(yè)對(duì)能源的需求量不同,能源需求量大的企業(yè),若其在國(guó)民經(jīng)濟(jì)中占有較大的比重并且增長(zhǎng)率較高,那么能源消耗和碳排放量也會(huì)隨之增加。對(duì)此為了滿足企業(yè)內(nèi)部預(yù)警系統(tǒng)的適應(yīng)性,需對(duì)碳排放強(qiáng)度進(jìn)行改進(jìn),使其能夠成為企業(yè)所適用的指標(biāo),即變?yōu)槠髽I(yè)碳排放量與企業(yè)營(yíng)業(yè)收入的比值,進(jìn)而將其設(shè)置為第二個(gè)指標(biāo)。
3.預(yù)警閾值確定。根據(jù)K-Means聚類典型的劃分思想,其算法的作用是將相似的數(shù)據(jù)聚成一簇,利用數(shù)據(jù)相似性對(duì)數(shù)據(jù)進(jìn)行分類,并且該算法適用于誤差平方和準(zhǔn)則,誤差平方和越小,聚類后的簇內(nèi)部也會(huì)更加緊湊。其公式SSE在本文第二部分已有提及,但由于該公式描述的是整體誤差平方和,即每一個(gè)簇的誤差平方和之和,若僅算其中某一個(gè)簇的誤差平方和,那么公式可改為:
此時(shí),SSEi表示第i個(gè)簇的誤差平方和。若通過上述公式計(jì)算出的誤差平方和越大,則表明簇內(nèi)某些樣本點(diǎn)距質(zhì)心的距離較遠(yuǎn),即該點(diǎn)為異常點(diǎn)的可能性越大。因此如果某一個(gè)簇的誤差平方和占總體誤差平方和比重較大,那么該簇中存在異常點(diǎn)的可能性就越大?;诖?,對(duì)于該占比的大小需要有一個(gè)界定值,此處將其設(shè)為λ1,即預(yù)警閾值為λ1,若則將該簇劃分為異常簇,進(jìn)而進(jìn)行風(fēng)險(xiǎn)信號(hào)傳遞,再針對(duì)該異常簇內(nèi)部的樣本點(diǎn)進(jìn)行距離分析,若樣本點(diǎn)到質(zhì)心的距離大于簇均值的限定倍數(shù),則表示該點(diǎn)距質(zhì)心較遠(yuǎn),并且偏離簇內(nèi)大部分點(diǎn),從而基本確認(rèn)該點(diǎn)為異常點(diǎn),故此處將限定倍數(shù)設(shè)置為另一個(gè)預(yù)警閾值λ2,該不等式可以表示為:
其中,mi指第i簇的質(zhì)心。在K-Means聚類的基礎(chǔ)上,超過閾值的碳排放數(shù)據(jù)指標(biāo)將被定義為異常點(diǎn),并且觸發(fā)審計(jì)風(fēng)險(xiǎn)預(yù)警。因此,在閾值被確定后,要通過實(shí)時(shí)對(duì)比分析,實(shí)現(xiàn)閾值與實(shí)際預(yù)警區(qū)間的不斷吻合,并通過分析二者之間的差異,確定差異產(chǎn)生的原因,進(jìn)而最大程度上實(shí)現(xiàn)預(yù)警閾值的合理化,為現(xiàn)代企業(yè)碳排放審計(jì)工作增添新動(dòng)能。
H企業(yè)作為我國(guó)特大型鋼鐵聯(lián)合企業(yè),擁有全球鋼鐵行業(yè)覆蓋面積最大、控制產(chǎn)線最多、集成度最高的煉鐵智控中心。在國(guó)家高度重視推動(dòng)“雙碳”目標(biāo)的同時(shí),H企業(yè)堅(jiān)定不移地堅(jiān)持綠色發(fā)展戰(zhàn)略,加快企業(yè)低碳轉(zhuǎn)型,促進(jìn)企業(yè)與環(huán)境共同發(fā)展。此外,H企業(yè)主動(dòng)迎合數(shù)字化時(shí)代的發(fā)展,在技術(shù)創(chuàng)新方面也有突出的貢獻(xiàn),力爭(zhēng)走一條“體制機(jī)制新、經(jīng)營(yíng)績(jī)效好”的特色發(fā)展道路,為K-Means聚類算法與碳排放審計(jì)工作相結(jié)合打下了技術(shù)基礎(chǔ)。鑒于企業(yè)二氧化碳排放詳細(xì)數(shù)據(jù)難以獲取,并且依據(jù)聯(lián)合國(guó)氣象組織發(fā)布的《2006年國(guó)家溫室氣體清單指南》提出鋼鐵行業(yè)CO2排放系數(shù)表,如表1所示,其中鋼鐵生產(chǎn)的CO2排放系數(shù)為1.46噸CO2/噸鋼,因此本文基于CSMAR數(shù)據(jù)庫,以我國(guó)重點(diǎn)H鋼鐵企業(yè)2008年--2018年間的鋼鐵生產(chǎn)量為例,將其鋼鐵生產(chǎn)量間接轉(zhuǎn)換為H企業(yè)的碳排放量。
表1 鋼鐵行(企)業(yè)CO2排放系數(shù)(強(qiáng)度)
為了使預(yù)警模型的數(shù)據(jù)更加精確,首先將轉(zhuǎn)換后的企業(yè)季度碳排放量以及計(jì)算出的企業(yè)碳排放強(qiáng)度原始數(shù)據(jù)集使用Z-score標(biāo)準(zhǔn)化方法進(jìn)行數(shù)據(jù)預(yù)處理。具體預(yù)處理步驟如下:
步驟(1):將H鋼鐵企業(yè)鋼鐵生產(chǎn)量通過CO2排放系數(shù)1.46,計(jì)算出企業(yè)碳排放量,但由于在CSMAR數(shù)據(jù)庫上企業(yè)披露營(yíng)業(yè)收入的最小時(shí)間單位為季度,則為方便碳排放強(qiáng)度指標(biāo)的計(jì)算,此處將月度碳排放數(shù)據(jù)轉(zhuǎn)換為季度碳排放數(shù)據(jù),得出第一個(gè)指標(biāo);第二個(gè)指標(biāo)為碳排放強(qiáng)度,此處使用上文中已改進(jìn)的企業(yè)碳排放強(qiáng)度,即季度碳排放量與季度營(yíng)業(yè)收入的比值。最后刪除一些冗余特征,并將缺失數(shù)據(jù)用該年平均值替代;
步驟(2):由于各項(xiàng)數(shù)字指標(biāo)之間數(shù)量級(jí)相差較大,為了消除變量間的量綱關(guān)系,得到更加精確的模型,將對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。標(biāo)準(zhǔn)化的公式如下所示:
圖4 K-Means聚類算法效果
其中x表示原始數(shù)據(jù),mean表示數(shù)據(jù)的均值,σ表示數(shù)據(jù)的標(biāo)準(zhǔn)差。下述表2與表3顯示的是數(shù)據(jù)處理前的部分?jǐn)?shù)據(jù)與數(shù)據(jù)處理后的部分?jǐn)?shù)據(jù)。
表2 H企業(yè)碳排放量與碳排放強(qiáng)度前十位數(shù)據(jù)截取(處理前)
表3 H企業(yè)碳排放量與碳排放強(qiáng)度前十位數(shù)據(jù)截?。ㄌ幚砗螅?/p>
經(jīng)過以上數(shù)據(jù)預(yù)處理后,按照上文碳排放審計(jì)預(yù)警流程圖中聚類分析的相關(guān)步驟,將得到的兩個(gè)指標(biāo)數(shù)據(jù)集進(jìn)行K-Means聚類分析。利用手肘法,經(jīng)分析對(duì)比發(fā)現(xiàn),將數(shù)據(jù)集劃分為3類時(shí),聚類效果較好,然后通過質(zhì)心的多次迭代,直到質(zhì)心收斂為止,最終聚類結(jié)束。迭代過程圖及聚類效果圖如圖3、4所示,其中聚類效果圖中不同的顏色代表不同的簇,每個(gè)簇內(nèi)紅點(diǎn)表示該簇的質(zhì)心。
圖3 K-Means聚類算法迭代圖部分截取
通過觀察聚類圖,并計(jì)算SSEi與SSE的比值,比較比值與設(shè)置的閾值λ1的大小關(guān)系,若比值大于λ1,則將該簇定義為異常簇,再通過計(jì)算異常簇內(nèi)各點(diǎn)到異常簇質(zhì)心的距離,比較距離與簇均值限定倍數(shù)λ2的大小,若結(jié)果顯示大于λ2,則該點(diǎn)為異常點(diǎn)的概率較大,可將其作為審計(jì)疑點(diǎn)。值得注意的是,異常點(diǎn)也不一定全是審計(jì)存在問題的點(diǎn),如該案例中(-2.5,-1)、(0,4),挖掘出異常點(diǎn)的結(jié)果只是為審計(jì)提供一種導(dǎo)向,需要審計(jì)人員根據(jù)該企業(yè)實(shí)際情況進(jìn)行分析排查,結(jié)合企業(yè)歷史數(shù)據(jù),判斷是否存在特殊情況,若沒有特殊情況的出現(xiàn)并且實(shí)際情況也不能對(duì)該點(diǎn)的異常進(jìn)行有效說明,則進(jìn)行風(fēng)險(xiǎn)預(yù)警,即碳排放異??赡苄暂^大。
1.加強(qiáng)數(shù)據(jù)管理,提升碳排放數(shù)據(jù)安全性。隨著我國(guó)數(shù)字化轉(zhuǎn)型進(jìn)程不斷深入,審計(jì)數(shù)據(jù)的獲取已經(jīng)從傳統(tǒng)的獲取方式轉(zhuǎn)變?yōu)橥ㄟ^大數(shù)據(jù)技術(shù)實(shí)時(shí)獲取,深度挖掘?qū)徲?jì)數(shù)據(jù)的內(nèi)在價(jià)值,探明深層次的審計(jì)線索,幫助審計(jì)人員對(duì)企業(yè)經(jīng)營(yíng)活動(dòng)的真實(shí)性和合法性做出更加客觀、獨(dú)立的評(píng)價(jià),并及時(shí)發(fā)現(xiàn)企業(yè)運(yùn)行中的問題。在碳排放審計(jì)預(yù)警的實(shí)施過程中,對(duì)預(yù)警實(shí)施后輸出的預(yù)警結(jié)果會(huì)產(chǎn)生較大影響的是聚類過程中K值的選取以及預(yù)警閾值的確定,而對(duì)于這兩個(gè)因素是否可靠,則要取決于數(shù)據(jù)的真實(shí)性與全面性。在前文已經(jīng)提到,審計(jì)預(yù)警系統(tǒng)的數(shù)據(jù)是根據(jù)相關(guān)數(shù)據(jù)挖掘等智能分析方法提取的,然后再進(jìn)入待測(cè)審計(jì)數(shù)據(jù)庫中,基于此,被審計(jì)單位數(shù)字化水平的提高是必要的,在數(shù)據(jù)提取后,要保障碳排放數(shù)據(jù)的質(zhì)量與安全,確保其不被篡改或盜竊,因此為了充分保障數(shù)據(jù)安全性,企業(yè)需要對(duì)數(shù)據(jù)進(jìn)行加密處理,如若操作人員要使用碳排放相關(guān)數(shù)據(jù),則僅能進(jìn)行查看,不能對(duì)任何數(shù)據(jù)進(jìn)行修改。
2.加強(qiáng)審計(jì)人員主導(dǎo)性,提高審計(jì)人員專業(yè)能力。當(dāng)前審計(jì)與大數(shù)據(jù)技術(shù)的融合已經(jīng)成為趨勢(shì),審計(jì)人員應(yīng)當(dāng)加大對(duì)新技術(shù)的學(xué)習(xí),并將合適的技術(shù)運(yùn)用于審計(jì)工作中,以適應(yīng)社會(huì)的發(fā)展。在國(guó)內(nèi)碳交易市場(chǎng)基礎(chǔ)設(shè)施還未完善的背景下,碳排放審計(jì)要求的多學(xué)科復(fù)合人才缺乏,碳排放審計(jì)人才培養(yǎng)屬于新技術(shù)、新技能、新工藝的全國(guó)緊缺人才培訓(xùn)項(xiàng)目的其中一項(xiàng)?;诖?,首先在以低碳經(jīng)濟(jì)發(fā)展為主導(dǎo)的社會(huì)中,審計(jì)人員必須要向復(fù)合型人才進(jìn)行轉(zhuǎn)變。鼓勵(lì)審計(jì)人員與其他學(xué)科人才進(jìn)行合作、交流,尤其是經(jīng)濟(jì)學(xué)、環(huán)境學(xué)以及社會(huì)學(xué)等學(xué)科,同時(shí)也積極鼓勵(lì)其他領(lǐng)域相關(guān)人才向碳排放審計(jì)領(lǐng)域發(fā)展,為今后碳排放審計(jì)注入新鮮血液。其次,還需加大對(duì)碳排放審計(jì)人員的培訓(xùn),提倡讓政府批準(zhǔn)的具有相應(yīng)資質(zhì)的機(jī)構(gòu)能夠?qū)μ寂欧艑徲?jì)人員進(jìn)行碳排放審計(jì)培訓(xùn),如有必要也可派送至國(guó)外進(jìn)行前沿理論知識(shí)的學(xué)習(xí)。另外,積極引導(dǎo)碳排放審計(jì)人員參加實(shí)踐研究,在實(shí)務(wù)中總結(jié)經(jīng)驗(yàn),能夠更好地增強(qiáng)碳排放審計(jì)實(shí)操技能。在審計(jì)預(yù)警過程中,雖然相關(guān)數(shù)據(jù)是通過大數(shù)據(jù)平臺(tái)智能分析方法提取,但是審計(jì)人員作為審計(jì)的主導(dǎo),若僅依靠大數(shù)據(jù)方法,而缺乏主導(dǎo)性,則很可能導(dǎo)致數(shù)據(jù)的不準(zhǔn)確,從而預(yù)警結(jié)果也會(huì)相應(yīng)受到影響。審計(jì)預(yù)警模型只能起輔助的功能,而審計(jì)人員作為實(shí)際操作的主導(dǎo),為確保審計(jì)預(yù)警模型更好地利用,應(yīng)該提高自身信息化專業(yè)能力,并且需對(duì)審計(jì)預(yù)警中各個(gè)步驟,包括數(shù)據(jù)智能分析達(dá)到熟練操作的水平,才能夠更加了解企業(yè)狀況,并對(duì)預(yù)警模型進(jìn)行相應(yīng)的優(yōu)化。
中國(guó)注冊(cè)會(huì)計(jì)師2022年12期