国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

審計(jì)預(yù)警體系研究

2020-06-15 11:12王宏巍李仁昊
會(huì)計(jì)之友 2020年10期
關(guān)鍵詞:聚類算法用戶畫(huà)像風(fēng)險(xiǎn)預(yù)警

王宏巍 李仁昊

【摘 要】 針對(duì)當(dāng)前地市級(jí)供電公司配電網(wǎng)工程中物資管理缺乏有效監(jiān)督的情況,基于用戶畫(huà)像理論,結(jié)合C均值聚類算法、3σ原則、變異系數(shù)法、Critic權(quán)重確認(rèn)法等數(shù)學(xué)方法,使用SQL、Eclipse等信息化工具,通過(guò)構(gòu)建輪廓畫(huà)像、描繪局部畫(huà)像、雕琢細(xì)節(jié)畫(huà)像三步還原典型工程的物資畫(huà)像,并計(jì)算畫(huà)像風(fēng)險(xiǎn)系數(shù),以此實(shí)現(xiàn)在建工程的物資持續(xù)審計(jì)。通過(guò)“數(shù)學(xué)工具+信息化手段”可以促進(jìn)內(nèi)部審計(jì)由被動(dòng)到主動(dòng)、由抽樣到全量、由事后到事中的轉(zhuǎn)變,實(shí)現(xiàn)技術(shù)方法創(chuàng)新推動(dòng)內(nèi)部審計(jì)高質(zhì)量發(fā)展。

【關(guān)鍵詞】 物資異常領(lǐng)用; 用戶畫(huà)像; 聚類算法; 持續(xù)審計(jì); 風(fēng)險(xiǎn)預(yù)警

【中圖分類號(hào)】 F239.45 ?【文獻(xiàn)標(biāo)識(shí)碼】 A ?【文章編號(hào)】 1004-5937(2020)10-0128-08

一、引言

所謂農(nóng)配網(wǎng)工程,是指在20kV及以下電網(wǎng)上實(shí)施的線路或設(shè)備新建、改造、修理工程。近年來(lái),為滿足人民日益增長(zhǎng)的美好生活需要,國(guó)家電網(wǎng)公司每年投入大量資金實(shí)施電網(wǎng)建設(shè),其中農(nóng)配網(wǎng)工程投資一直是一大重頭。尤其在地市級(jí)供電公司的電網(wǎng)建設(shè)中,農(nóng)配網(wǎng)工程投資的高比重表現(xiàn)得尤為明顯。以某地市級(jí)供電公司(以下簡(jiǎn)稱某公司)2015—2018年電網(wǎng)建設(shè)投資狀況(具體見(jiàn)表1)為例分析可知,近4年間農(nóng)配網(wǎng)工程投資占公司整體投資的比例均在50%以上,年均占比高達(dá)約71%,由此可窺農(nóng)配網(wǎng)工程投資大、占比高的特點(diǎn)。這凸顯了加強(qiáng)農(nóng)配網(wǎng)工程資金使用、物資費(fèi)用等管控的重要性與緊迫性。

確保工程資金合規(guī)合法使用,并合理確定和有效控制工程造價(jià)是供電公司內(nèi)審部門肩負(fù)的重要職責(zé)。一直以來(lái),對(duì)農(nóng)配網(wǎng)工程甲供物資費(fèi)用的監(jiān)控不僅是內(nèi)部審計(jì)的重點(diǎn),更是難點(diǎn)所在。具體表現(xiàn)有三:一是審計(jì)手段相對(duì)滯后,對(duì)于工程項(xiàng)目尤其是成本項(xiàng)目是否按照甲供物資的審計(jì)結(jié)果進(jìn)行退料,缺乏機(jī)制上的有效管控;二是工程點(diǎn)多面廣,年度涉及的物資條目往往多達(dá)數(shù)十萬(wàn)條,現(xiàn)場(chǎng)審計(jì)人員對(duì)甲供物資的審核尤其是零星鐵附件等無(wú)法做到逐條全覆蓋;三是工程物資異常領(lǐng)用風(fēng)險(xiǎn)較高,部分建設(shè)單位盲目追求資金預(yù)算完成率等指標(biāo),通過(guò)項(xiàng)目中領(lǐng)用無(wú)關(guān)物資提高預(yù)算完成率的情況甚為普遍。由此,對(duì)農(nóng)配網(wǎng)工程甲供物資進(jìn)行有效、全面管控已成為基層供電公司內(nèi)審部門乃至全公司迫切需要解決的重要問(wèn)題,而管控的核心則是杜絕各類工程未使用的物資有意或無(wú)意地截留在施工單位手中。

在此背景下,某公司審計(jì)部數(shù)字化審計(jì)團(tuán)隊(duì)基于用戶畫(huà)像理論[ 1 ],以SQLServer、Eclipse為載體,通過(guò)3σ原則、C均值聚類算法、變異系數(shù)法以及Critic權(quán)重確認(rèn)法等數(shù)學(xué)算法,描繪出典型農(nóng)配網(wǎng)工程的物資畫(huà)像,摸索建立了農(nóng)配網(wǎng)工程物資異常領(lǐng)用風(fēng)險(xiǎn)審計(jì)預(yù)警體系,通過(guò)前移審計(jì)關(guān)口,實(shí)現(xiàn)了內(nèi)部審計(jì)由主觀到客觀、由抽樣到全體、由事后到事中的轉(zhuǎn)變,是技術(shù)方法創(chuàng)新推動(dòng)內(nèi)部審計(jì)高質(zhì)量發(fā)展的良好實(shí)踐。本文旨在對(duì)某公司已有實(shí)踐與創(chuàng)新加以理論提煉與經(jīng)驗(yàn)總結(jié),以期架構(gòu)可資借鑒的農(nóng)配網(wǎng)工程物資異常領(lǐng)用風(fēng)險(xiǎn)審計(jì)預(yù)警體系,有效緩解當(dāng)前農(nóng)配網(wǎng)甲供物資難以管控到位的現(xiàn)實(shí)困境。

二、審計(jì)預(yù)警體系構(gòu)建的理論依據(jù)

(一)持續(xù)改善理論

信息化技術(shù)的日益普及與提高,深刻影響了經(jīng)濟(jì)與管理乃至審計(jì)領(lǐng)域。隨著信息與人類行為實(shí)時(shí)互動(dòng)的實(shí)現(xiàn),經(jīng)濟(jì)管理與審計(jì)對(duì)客觀對(duì)象動(dòng)態(tài)觀測(cè)和改進(jìn)的目標(biāo)有了實(shí)現(xiàn)的可能。西方管理實(shí)踐中形成了管理職能與經(jīng)營(yíng)活動(dòng)良性互動(dòng)不斷改善的局面,對(duì)此實(shí)務(wù)發(fā)展理性總結(jié)形成持續(xù)改善理論。與此相適應(yīng),審計(jì)也推進(jìn)到了連續(xù)審計(jì)階段,傳統(tǒng)的滯后性審計(jì)拓展成嵌入經(jīng)濟(jì)活動(dòng)中的實(shí)時(shí)審計(jì),審計(jì)職能因此得以鞏固與拓展,對(duì)實(shí)際經(jīng)濟(jì)與管理的保障及促進(jìn)作用更為直接而有效。在實(shí)時(shí)審計(jì)背景下,自然產(chǎn)生了審計(jì)預(yù)警功能,即對(duì)即將發(fā)生的經(jīng)濟(jì)與管理基于以往審計(jì)掌握的信息,做出過(guò)程與結(jié)果方面的預(yù)判,從而在實(shí)際審計(jì)工作中對(duì)經(jīng)濟(jì)與管理發(fā)表審計(jì)意見(jiàn),提供分析判斷依據(jù)。由此決定了審計(jì)預(yù)警,對(duì)于現(xiàn)代審計(jì)尤其是本來(lái)就與經(jīng)濟(jì)管理系統(tǒng)融為一體的內(nèi)部審計(jì)而言,是適應(yīng)信息化全新技術(shù)環(huán)境帶來(lái)挑戰(zhàn)的積極應(yīng)對(duì)之舉。但目前審計(jì)理論對(duì)這方面缺乏制度層面的系統(tǒng)研究,相應(yīng)的做法也處于零打碎敲狀況。正是基于此,某公司圍繞審計(jì)預(yù)警制度建設(shè),以工程物資審計(jì)工作為抓手,嘗試?yán)眯畔⒒冗M(jìn)技術(shù)進(jìn)行審計(jì)預(yù)警,從而有效提高內(nèi)部審計(jì)工作的質(zhì)量與水平,其間形成了一些經(jīng)驗(yàn)性做法與感受。本文對(duì)此做出理論總結(jié),以期為中國(guó)企業(yè)內(nèi)部審計(jì)做好審計(jì)預(yù)警工作提供有益的參考。

(二)用戶畫(huà)像理論

“畫(huà)像”技術(shù)最早應(yīng)用于刑事偵查破案,其原理是根據(jù)目擊者的敘述,將犯罪嫌疑人的外貌特征描繪、復(fù)原。近年來(lái),互聯(lián)網(wǎng)企業(yè)利用“畫(huà)像”技術(shù)把數(shù)據(jù)轉(zhuǎn)化為商業(yè)價(jià)值,通過(guò)用戶網(wǎng)絡(luò)數(shù)據(jù)行為,還原用戶的消費(fèi)特征、消費(fèi)喜好和消費(fèi)需求的“畫(huà)像”,針對(duì)特定畫(huà)像的用戶進(jìn)行產(chǎn)品推銷,從而形成了“用戶畫(huà)像理論”。該理論的運(yùn)作邏輯可表述為:基于“全樣本定量分析”,到“個(gè)體特征定性描述”,再“對(duì)新樣本進(jìn)行畫(huà)像描繪”,具體見(jiàn)圖1所示。用戶畫(huà)像又稱用戶角色,作為一種勾畫(huà)目標(biāo)用戶、聯(lián)系用戶訴求與設(shè)計(jì)方向的有效工具,在各領(lǐng)域得到了廣泛應(yīng)用。在實(shí)際操作過(guò)程中,往往會(huì)以最為淺顯和貼近生活的話語(yǔ)將用戶的屬性、行為與期待聯(lián)結(jié)起來(lái),進(jìn)而形成對(duì)用戶加以畫(huà)像描述的標(biāo)簽。

“用戶畫(huà)像理論”同樣適用于內(nèi)部審計(jì)工作。隨著國(guó)家電網(wǎng)信息化、數(shù)字化業(yè)務(wù)系統(tǒng)的不斷構(gòu)建,生產(chǎn)、營(yíng)銷、管理等信息系統(tǒng)不斷完善,審計(jì)關(guān)注的財(cái)務(wù)、營(yíng)銷、業(yè)務(wù)數(shù)據(jù)已經(jīng)完全信息化。綜合利用相關(guān)系統(tǒng),搭建系統(tǒng)數(shù)據(jù)關(guān)聯(lián),從海量數(shù)據(jù)中識(shí)別出用于描述審計(jì)對(duì)象的“標(biāo)簽”,對(duì)審計(jì)對(duì)象進(jìn)行形象化展示,可幫助審計(jì)人員更加客觀、科學(xué)地進(jìn)行審計(jì)分析和評(píng)價(jià),大大提升審計(jì)人員的工作效率;同時(shí),使審計(jì)工作重心從查錯(cuò)糾弊向提供咨詢等增值型服務(wù)轉(zhuǎn)變,助力內(nèi)部審計(jì)價(jià)值提升。

(三)聚類分析(Clustering)

聚類分析主要研究樣品或指標(biāo)分類問(wèn)題,不僅是一種統(tǒng)計(jì)分析方法,也是數(shù)據(jù)挖掘的一個(gè)重要算法[ 2 ]。用戶畫(huà)像理論的核算就是聚類算法。聚類分析基于“物以類聚,人以群分”的理論思想,起源于分類學(xué)。在古老的分類學(xué)中,人們主要依靠經(jīng)驗(yàn)和專業(yè)知識(shí)來(lái)實(shí)現(xiàn)分類。隨著信息化水平日益提高,人們對(duì)分類的精確度要求越來(lái)越高,僅僅依靠經(jīng)驗(yàn)和專業(yè)知識(shí)已經(jīng)難以確切地進(jìn)行分類,把數(shù)學(xué)工具和分類學(xué)進(jìn)行融合成為必然選擇,由此形成了數(shù)值分類交叉學(xué)科。此后又將多元分析的技術(shù)引入到數(shù)值分類學(xué),形成了聚類分析或聚類算法。

聚類算法的主要做法是按照特定標(biāo)準(zhǔn)——可理解為按照“用戶畫(huà)像的標(biāo)簽”,把海量數(shù)據(jù)聚合成不同的類,使同一類內(nèi)數(shù)據(jù)特征的相似性盡可能大,亦即把相似的對(duì)象分到同一組。聚類算法種類很多,有系統(tǒng)聚類法、有序樣品聚類法、動(dòng)態(tài)聚類法、模糊聚類法、圖論聚類法、聚類預(yù)報(bào)法等。本文主要采用模糊C均值聚類算法(即FCM算法)開(kāi)展研究。該算法是一種基于目標(biāo)函數(shù)的模糊聚類算法,其聚類核心是根據(jù)每個(gè)數(shù)據(jù)點(diǎn)對(duì)聚類中心的隸屬度來(lái)實(shí)現(xiàn)無(wú)監(jiān)督的模糊聚類[ 3 ]。該算法的目標(biāo)函數(shù)(即FCM目標(biāo)函數(shù))及其約束條件如公式(1)、(2):

(四)Critic權(quán)重確認(rèn)法

Critic權(quán)重確認(rèn)法又稱Critic賦值法,是依據(jù)指標(biāo)客觀性進(jìn)行權(quán)重分配的方法。指標(biāo)客觀權(quán)數(shù)的確定依據(jù)有二:一是對(duì)比強(qiáng)度,以標(biāo)準(zhǔn)差的形式來(lái)表現(xiàn)同一指標(biāo)各個(gè)評(píng)價(jià)方案取值差距的大小,即標(biāo)準(zhǔn)差的大小表明了在同一指標(biāo)內(nèi)各方案取值差距的大小,標(biāo)準(zhǔn)差越大各方案取值差距越大;二是沖突性,即評(píng)價(jià)指標(biāo)間的沖突性,是指標(biāo)間相關(guān)性的互補(bǔ)概念,如兩個(gè)指標(biāo)之間具有較強(qiáng)的正相關(guān),則兩個(gè)指標(biāo)之間的沖突性較低[ 4 ]。第j個(gè)指標(biāo)與其他指標(biāo)沖突性的量化指標(biāo)為n i=1(1-rij),其中rij表示指標(biāo)i和指標(biāo)j的相關(guān)系數(shù)。

在Critic權(quán)重確認(rèn)法下,各個(gè)指標(biāo)的客觀權(quán)重確定就是以對(duì)比強(qiáng)度和沖突性來(lái)綜合衡量的。設(shè)Cj表示第j個(gè)評(píng)價(jià)指標(biāo)所包含的信息量,則Cj的計(jì)算公式為:Cj=σjn i=1(1-rij)(其中n為同一指標(biāo)的評(píng)價(jià)數(shù)量,σj為第j個(gè)評(píng)價(jià)指標(biāo)的標(biāo)準(zhǔn)差)。一般而言,Cj越大,第j個(gè)評(píng)價(jià)指標(biāo)所包含的信息量越大,其相對(duì)重要性也越大。設(shè)Wj為第j個(gè)指標(biāo)的客觀權(quán)重,則Wj的計(jì)算公式為:

其中m為所有指標(biāo)的數(shù)量。

三、審計(jì)預(yù)警體系構(gòu)建的邏輯框架

某公司針對(duì)農(nóng)配網(wǎng)工程物資異常領(lǐng)用風(fēng)險(xiǎn),綜合運(yùn)用用戶畫(huà)像理論以模糊C均值聚類算法、Critic權(quán)重確認(rèn)法等,按照如下邏輯搭建了審計(jì)預(yù)警體系框架:(1)利用底層數(shù)據(jù)即近年農(nóng)配網(wǎng)工程的全樣本數(shù)據(jù),開(kāi)展數(shù)據(jù)清洗,實(shí)施用戶畫(huà)像,包括輪廓畫(huà)像、局部畫(huà)像和細(xì)節(jié)畫(huà)像。(2)構(gòu)建用戶畫(huà)像,即綜合運(yùn)用模糊C均值聚類算法、變異系數(shù)法、3σ原則,計(jì)算并確定包括物資費(fèi)用占總投資費(fèi)用的比例、出現(xiàn)頻次極少的異常物資占項(xiàng)目中物資的比例、同類型項(xiàng)目不同物資的配比關(guān)系等指標(biāo)在內(nèi)的不同維度的數(shù)據(jù),逐步雕琢出發(fā)生異常領(lǐng)用的物資的模型。(3)構(gòu)建異常預(yù)警,即通過(guò)Critic權(quán)重確認(rèn)法,計(jì)算不同維度畫(huà)像的權(quán)重系數(shù),得出預(yù)警模型的準(zhǔn)確描述。(4)在此基礎(chǔ)上,開(kāi)展實(shí)時(shí)監(jiān)控,包括進(jìn)一步掃描在建工程的實(shí)時(shí)基礎(chǔ)數(shù)據(jù),實(shí)現(xiàn)對(duì)在建工程的疑點(diǎn)篩查,同時(shí)將結(jié)果進(jìn)行反饋,進(jìn)一步修正畫(huà)像,提高準(zhǔn)確性。某公司構(gòu)建農(nóng)配網(wǎng)工程物資異常領(lǐng)用風(fēng)險(xiǎn)審計(jì)預(yù)警體系的邏輯框架,具體如圖2所示。

四、審計(jì)預(yù)警體系的系統(tǒng)搭建

按照?qǐng)D2所示的邏輯框架,某公司依次運(yùn)用如下步驟系統(tǒng)搭建了農(nóng)配網(wǎng)工程物資異常領(lǐng)用風(fēng)險(xiǎn)審計(jì)預(yù)警體系框架。需說(shuō)明的是,樣本數(shù)據(jù)畫(huà)像勾勒的前提是充分且必要的基礎(chǔ)數(shù)據(jù),為方便描述,這里所用例證為配電變壓器類項(xiàng)目,樣本時(shí)間跨度為2015—2018年。

(一)基礎(chǔ)數(shù)據(jù)歸集及數(shù)據(jù)清洗

首先從項(xiàng)目ERP系統(tǒng)中導(dǎo)出2015—2018年公司實(shí)施的所有配網(wǎng)工程,將其中配電變壓器類工程篩選出來(lái)。再根據(jù)系統(tǒng)唯一的“項(xiàng)目定義號(hào)”即wps碼,在物資系統(tǒng)導(dǎo)出項(xiàng)目出庫(kù)物資清單。同時(shí),在審計(jì)系統(tǒng)或財(cái)務(wù)系統(tǒng)導(dǎo)出項(xiàng)目的總成本、服務(wù)費(fèi)成本(含施工、設(shè)計(jì)、監(jiān)理等)、物資成本等項(xiàng)目成本信息。經(jīng)過(guò)清洗,共篩選出配電變壓器項(xiàng)目9 551個(gè),項(xiàng)目總投資共計(jì)8.62億元,其中物資費(fèi)用5.42億元,涉及物資條目28.42萬(wàn)條。

(二)構(gòu)建畫(huà)像

例證中所用的配電變壓器類項(xiàng)目物資畫(huà)像由輪廓畫(huà)像、局部畫(huà)像和細(xì)節(jié)畫(huà)像三部分組成,三部分在邏輯上不是包含關(guān)系,而是不同維度的畫(huà)像構(gòu)建。通過(guò)對(duì)將三類畫(huà)像定性為“可疑”的標(biāo)簽進(jìn)行權(quán)重計(jì)算,定性項(xiàng)目畫(huà)像整體風(fēng)險(xiǎn)等級(jí)。

1.構(gòu)建輪廓畫(huà)像

輪廓畫(huà)像是指較為粗糙的用戶畫(huà)像,即不能精確定位到異常項(xiàng)目,僅在大體輪廓上為定位異常項(xiàng)目提供“可疑”標(biāo)簽,后續(xù)需要其他畫(huà)像一并驗(yàn)證的用戶畫(huà)像。農(nóng)配網(wǎng)工程中同類型的項(xiàng)目,其使用物資的種類數(shù)量、實(shí)施的方法工藝等應(yīng)該大體一致。例證中所用的配電變壓器類項(xiàng)目的物資狀況為:新安裝或更換一臺(tái)配電變壓器,安裝此變壓器的相關(guān)配件,并實(shí)施相應(yīng)的調(diào)試,使之具備送電投運(yùn)的功能。由此可見(jiàn),物資種類相對(duì)單一,安裝工作也相對(duì)一致,故該類項(xiàng)目的物資費(fèi)和施工費(fèi)應(yīng)呈現(xiàn)出相似的比例。依據(jù)這一邏輯,生成輪廓畫(huà)像的第一個(gè)標(biāo)簽,稱之為“異常比例”。

物資費(fèi)占總投資的比例數(shù)據(jù)應(yīng)當(dāng)呈現(xiàn)正態(tài)分布或近似正態(tài)分布。根據(jù)正態(tài)分布的3σ原則,不在橫軸區(qū)間(?滋-3σ,?滋+3σ)內(nèi)的數(shù)據(jù),可以貼為可疑標(biāo)簽。如前所述,該項(xiàng)目總數(shù)為9 551個(gè),總投資共計(jì)8.62億元,總物資金額占總投資金額比例為66.61%。據(jù)此,可描繪所有項(xiàng)目占比的正態(tài)分布曲線和直方圖,具體見(jiàn)圖3所示。

該正態(tài)分布的期望值?滋為66.61%,標(biāo)準(zhǔn)值σ為0.152463,所以(?滋-3σ,?滋+3σ)區(qū)間為20.8711%~100%,即物資費(fèi)占總投資比例小于20.87%的項(xiàng)目為異常項(xiàng)目,需貼上可疑標(biāo)簽。經(jīng)篩選共有138個(gè)項(xiàng)目。

2.描繪局部畫(huà)像

局部畫(huà)像是比輪廓畫(huà)像更精致一些的畫(huà)像,但不是輪廓畫(huà)像的精細(xì)化,而是由不同維度數(shù)據(jù)進(jìn)行的精致描繪。如前所述,類型相同的項(xiàng)目,其建設(shè)施工工藝、各類費(fèi)用占比應(yīng)呈一定類似比例。梳理9 551個(gè)配變項(xiàng)目涉及的28.42萬(wàn)條物資領(lǐng)用條目,僅涉及324個(gè)物料編碼,即只領(lǐng)用了324種物資,說(shuō)明同類型項(xiàng)目使用的物資類型也大致一致。本文針對(duì)例證中所用配電變壓器類項(xiàng)目,描繪其局部畫(huà)像的邏輯是:如果項(xiàng)目單位通過(guò)此類項(xiàng)目虛領(lǐng)物資,達(dá)到清倉(cāng)利庫(kù)目的,那么虛領(lǐng)物資的類型不由項(xiàng)目實(shí)際需要何種類型的物資決定,而是由倉(cāng)庫(kù)現(xiàn)在庫(kù)存了什么物資來(lái)決定,而庫(kù)存物資的類型不一定是項(xiàng)目常用物資。反言之,若項(xiàng)目中出現(xiàn)一定比例的非常用物資,則有可能存在虛領(lǐng)物資的嫌疑。

(1)確定異常物料編碼庫(kù)。異常物料編碼庫(kù)的建立包括兩個(gè)步驟:第一步,從實(shí)際工程建設(shè)的角度,將出現(xiàn)頻率極低的物料編碼定義為異常物料編碼。由于“頻率極低”無(wú)法定量描述,僅能根據(jù)經(jīng)驗(yàn)值進(jìn)行判斷,則需要第二步對(duì)結(jié)果進(jìn)行修正。第二步,將異常物料編碼與國(guó)網(wǎng)公司頒布的配網(wǎng)工程典型設(shè)計(jì)中的物料編號(hào)進(jìn)行對(duì)比,不在典型設(shè)計(jì)中的異常物料編碼將納入異常物料編碼庫(kù)。

將28.42萬(wàn)條物資領(lǐng)用條目導(dǎo)入SQLServer數(shù)據(jù)庫(kù),計(jì)算每條物資在多少項(xiàng)目中出現(xiàn)過(guò)。具體SQL語(yǔ)句如下:

--計(jì)算一項(xiàng)物料在整個(gè)領(lǐng)用物資項(xiàng)目的占比 物料出現(xiàn)的頻次/項(xiàng)目總數(shù)

with a as (select 項(xiàng)目定義,物料編碼,sum(實(shí)發(fā)數(shù)量) as 物資數(shù)量 from[2015-2018年變壓器項(xiàng)目導(dǎo)出清單]group by 物料編碼,項(xiàng)目定義)

b as (select 物料描述,物料編碼,sum(金額)as 金額 from[2015-2018年變壓器項(xiàng)目導(dǎo)出清單] group by 物料編碼,物料描述)

select a.物料編碼,count(a.項(xiàng)目定義) as 頻次, cast(round(convert(decimal,(count(a.項(xiàng)目定義)))/(select count(distinct(項(xiàng)目定義)) as 項(xiàng)目數(shù) from ?a where a.物資數(shù)量!=0)*100,4) as varchar) +'%' as 百分比,b.物料描述,b.金額

from a left join b on a.物料編碼=b.物料編碼

where a.物資數(shù)量!=0 group by a.物料編碼,b.物料描述,b.金額

根據(jù)篩查結(jié)果,暫定義出現(xiàn)頻次小于2.45%①的物資為異常物資,共涉及156個(gè)項(xiàng)目編碼,涉及金額3 230.5萬(wàn)元。為提高該閾值精度,將這156個(gè)項(xiàng)目編碼與國(guó)網(wǎng)公司頒布的配網(wǎng)工程典型設(shè)計(jì)中的材料清冊(cè)進(jìn)行對(duì)比,確定其中的137條物資為異常物資,形成異常物料編碼庫(kù)。

(2)數(shù)據(jù)篩選及清洗。將異常物料編碼庫(kù)導(dǎo)入SQLServer數(shù)據(jù)庫(kù),結(jié)合前期導(dǎo)入數(shù)據(jù)庫(kù)的項(xiàng)目數(shù)據(jù)、物資領(lǐng)用數(shù)據(jù),形成兩個(gè)維度的物資異常領(lǐng)用表現(xiàn):一是物資異常領(lǐng)用條目數(shù)占本項(xiàng)目條目數(shù)的比例,二是物資異常領(lǐng)用金額占本項(xiàng)目物資總金額的比例。具體SQL語(yǔ)句如下:

select a.項(xiàng)目定義,cast(round(b.異常物資數(shù)量/a.物資數(shù)量*100,4) as varchar) +'%' as 異常物料數(shù)量占比,cast(round(b.異常金額/a.金額*100,4) as varchar) +'%' as 異常物資金額占比 from

(select 項(xiàng)目定義,sum(實(shí)發(fā)數(shù)量) as 物資數(shù)量,sum(金額) as 金額 from[2015-2018年變壓器項(xiàng)目導(dǎo)出清單]group by 項(xiàng)目定義) as a inner join

(select 項(xiàng)目定義,sum(實(shí)發(fā)數(shù)量) as 異常物資數(shù)量,sum(金額) as 異常金額 from[2015-2018年變壓器項(xiàng)目導(dǎo)出清單]where 物料編碼 in(select 物料編碼 from [ntsj].[dbo].[異常物料編碼庫(kù)]) group by 項(xiàng)目定義) as b

on a.項(xiàng)目定義=b.項(xiàng)目定義

(3)模糊C均值聚類分析。FCM算法的一般步驟為:第一步,確定分類數(shù),指數(shù)m的值,確定迭代次數(shù)(這是結(jié)束的條件,可以根據(jù)需求確定,可以多種);第二步,初始化一個(gè)隸屬度U(必須滿足公式(2),總和為1);第三步,根據(jù)U計(jì)算聚類中心C;第四步,計(jì)算目標(biāo)函數(shù)J;第五步,根據(jù)C返回去計(jì)算U,回到步驟三,一直循環(huán)直到結(jié)束[ 5 ]。

本文主要借助Python語(yǔ)言編程來(lái)實(shí)現(xiàn)上述C均值模糊聚類算法公式(3)。為了可視化方便,生成一個(gè)二維數(shù)據(jù)在坐標(biāo)軸上顯示,具體如圖4所示。在圖4中,橫軸代表異常物料占比情況,縱軸代表異常物料金額占比情況?;诰垲悓?shí)驗(yàn)?zāi)康模瑢?shù)據(jù)分為異常物資和正常物資兩大類。通過(guò)參數(shù)實(shí)驗(yàn)的調(diào)整,設(shè)定分類數(shù)n_clusters為3。通過(guò)對(duì)9 951個(gè)項(xiàng)目中存在異常物料的3 874個(gè)項(xiàng)目進(jìn)行聚類實(shí)驗(yàn),得到聚類結(jié)果。

分析聚類實(shí)驗(yàn)結(jié)果,可以發(fā)現(xiàn)這些項(xiàng)目分成了三類:紅色類項(xiàng)目(數(shù)量3 356),綠色類項(xiàng)目(數(shù)量314),藍(lán)色類項(xiàng)目(數(shù)量204)②。據(jù)此可以認(rèn)為,藍(lán)色和綠色類項(xiàng)目遠(yuǎn)離數(shù)量群存在異常。結(jié)合圖4中橫縱坐標(biāo)可知,一個(gè)項(xiàng)目異常物料數(shù)量占項(xiàng)目總物料比大于28.5%,或異常物資金額占項(xiàng)目總額比大于32.2%,均可大概率認(rèn)為其存在異常。按照這一邏輯,本文共發(fā)現(xiàn)518個(gè)項(xiàng)目存在異常。

3.雕琢細(xì)節(jié)畫(huà)像

因局部畫(huà)像仍不能精準(zhǔn)描繪出異常領(lǐng)料的完整邏輯特征,故本文進(jìn)一步借助不同類型領(lǐng)用物資之間的比值關(guān)系,對(duì)配電變壓器類項(xiàng)目雕琢細(xì)節(jié)畫(huà)像。理論上,同類型項(xiàng)目使用的不同類型物資之間應(yīng)呈一定的比例關(guān)系,比如一臺(tái)變壓器配置一臺(tái)JP柜、一根電桿配置50米的導(dǎo)線等。這里運(yùn)用變異系數(shù)法,通過(guò)計(jì)算數(shù)據(jù)之間的相關(guān)關(guān)系查找不同類型物資配比關(guān)系,構(gòu)建異常邏輯矩陣。

猜你喜歡
聚類算法用戶畫(huà)像風(fēng)險(xiǎn)預(yù)警
K—Means聚類算法在MapReduce框架下的實(shí)現(xiàn)
以運(yùn)營(yíng)動(dòng)態(tài)為載體,推動(dòng)地市運(yùn)監(jiān)工作實(shí)用開(kāi)展
基于K?均值與AGNES聚類算法的校園網(wǎng)行為分析系統(tǒng)研究
移動(dòng)用戶畫(huà)像構(gòu)建研究
高校財(cái)務(wù)風(fēng)險(xiǎn)預(yù)警指標(biāo)的建立與應(yīng)用研究
基于微博的大數(shù)據(jù)用戶畫(huà)像與精準(zhǔn)營(yíng)銷
行政事業(yè)單位的內(nèi)部控制問(wèn)題以及解決策略思考
移動(dòng)互聯(lián)網(wǎng)下手機(jī)用戶使用行為特征的研究
基于改進(jìn)的K_means算法在圖像分割中的應(yīng)用
大規(guī)模風(fēng)電場(chǎng)集中接入對(duì)電力系統(tǒng)小干擾穩(wěn)定的影響分析
轮台县| 乌拉特后旗| 和静县| 五家渠市| 玉溪市| 余庆县| 松溪县| 秦皇岛市| 措勤县| 苏尼特左旗| 桂东县| 紫云| 奉贤区| 老河口市| 渭南市| 渭源县| 石河子市| 东至县| 凤台县| 揭东县| 那坡县| 安溪县| 东阿县| 界首市| 松原市| 西城区| 若尔盖县| 大英县| 闽侯县| 班玛县| 县级市| 新郑市| 乐东| 余姚市| 纳雍县| 石景山区| 扬州市| 习水县| 武山县| 香港 | 吉首市|