吳琛華
[摘 要]當(dāng)前,招標(biāo)形式多樣,招標(biāo)風(fēng)險(xiǎn)存在于各個環(huán)節(jié)。為有效防范招標(biāo)風(fēng)險(xiǎn),企業(yè)需要提前識別各個階段的風(fēng)險(xiǎn)因素,并采取有效的審計(jì)手段支持招標(biāo)項(xiàng)目的開展。本文重點(diǎn)研究了企業(yè)審計(jì)大數(shù)據(jù)可視化建模分析系統(tǒng),采用微服務(wù)容器化技術(shù)和大數(shù)據(jù)分析技術(shù),通過將手寫SQL才能進(jìn)行的數(shù)據(jù)分析任務(wù)遷移到簡單的可視化配置中,使得幾乎沒有任何開發(fā)經(jīng)驗(yàn)的業(yè)務(wù)人員也能快速地進(jìn)行審計(jì)風(fēng)險(xiǎn)分析。這種基于技術(shù)創(chuàng)新的方法為提高審計(jì)效率、確保招標(biāo)項(xiàng)目順利開展提供了有力支持。
[關(guān)鍵詞]審計(jì);招標(biāo);大數(shù)據(jù);可視化建模;系統(tǒng);設(shè)計(jì);實(shí)現(xiàn);風(fēng)險(xiǎn)管理
doi:10.3969/j.issn.1673-0194.2023.13.013
[中圖分類號]F239;TP311 [文獻(xiàn)標(biāo)識碼]A [文章編號]1673-0194(2023)13-0046-05
0? ? ?引 言
如今,我國招投標(biāo)形式呈現(xiàn)多樣化、標(biāo)準(zhǔn)化、國際化的趨勢,招投標(biāo)風(fēng)險(xiǎn)管理一直備受關(guān)注。由于招投標(biāo)風(fēng)險(xiǎn)是客觀存在的,有一定的必然性和可變性。例如在招投標(biāo)的計(jì)劃階段、立項(xiàng)階段、發(fā)標(biāo)階段、投標(biāo)階段、開標(biāo)階段、評標(biāo)階段、定標(biāo)階段、合同階段等,存在著各式各樣的法律風(fēng)險(xiǎn)、人員風(fēng)險(xiǎn)、經(jīng)濟(jì)風(fēng)險(xiǎn)與合同風(fēng)險(xiǎn),這些風(fēng)險(xiǎn)隨著招標(biāo)項(xiàng)目的進(jìn)行而呈現(xiàn)不同的特性。企業(yè)需要提前識別各個階段的風(fēng)險(xiǎn)因子,然后采取行之有效的審計(jì)手段,如此才能確保招投標(biāo)項(xiàng)目的順利進(jìn)行。本文旨在利用大量的招投標(biāo)數(shù)據(jù)構(gòu)建風(fēng)險(xiǎn)模型,以提高風(fēng)險(xiǎn)識別的準(zhǔn)確度。我們實(shí)現(xiàn)了一套企業(yè)審計(jì)大數(shù)據(jù)可視化建模分析系統(tǒng),該系統(tǒng)結(jié)合招投標(biāo)行業(yè)的專業(yè)知識,充分挖掘數(shù)據(jù)價(jià)值,提升審計(jì)人員的工作效率,實(shí)現(xiàn)招投標(biāo)全流程的智能化分析。
1? ? ?研究現(xiàn)狀
傳統(tǒng)的招投標(biāo)風(fēng)險(xiǎn)分析主要依賴審計(jì)人員的自身經(jīng)驗(yàn)或者他人提供的情報(bào)線索,對某個招標(biāo)項(xiàng)目或者某個招標(biāo)單位進(jìn)行調(diào)查取證,缺乏風(fēng)險(xiǎn)審計(jì)的完整性、無法固化風(fēng)險(xiǎn)模型。目前大多數(shù)的招投標(biāo)風(fēng)險(xiǎn)管理是基于某個階段或者某個時間點(diǎn)進(jìn)行風(fēng)險(xiǎn)管控,而將招投標(biāo)理論應(yīng)用到全量歷史數(shù)據(jù)和項(xiàng)目全過程的研究卻不多。當(dāng)招投標(biāo)系統(tǒng)不斷更新迭代且數(shù)據(jù)量不斷膨脹時,現(xiàn)有的工具無法適應(yīng)系統(tǒng)變化而導(dǎo)致的數(shù)據(jù)結(jié)構(gòu)的變更。另一方面,在不同的招標(biāo)項(xiàng)目、不同的環(huán)境、不同的階段,招投標(biāo)風(fēng)險(xiǎn)因子并不是一成不變的。
為了應(yīng)對上述動態(tài)且定制化的建模需求,本文基于領(lǐng)域知識的建模分析能力和可移植、可擴(kuò)展的技術(shù),旨在促進(jìn)審計(jì)行業(yè)從傳統(tǒng)的人工風(fēng)險(xiǎn)識別向數(shù)字化和智能化的方向轉(zhuǎn)變,以實(shí)現(xiàn)企業(yè)資源的優(yōu)化配置。
2? ? ?系統(tǒng)架構(gòu)設(shè)計(jì)
下面我們將詳細(xì)闡述本系統(tǒng)的架構(gòu)設(shè)計(jì)及實(shí)現(xiàn),圖1展示了企業(yè)審計(jì)大數(shù)據(jù)可視化建模分析系統(tǒng)的總體架構(gòu)設(shè)計(jì),該架構(gòu)分為三大功能:基礎(chǔ)組件體系、數(shù)據(jù)體系、安全體系。為了處理海量的數(shù)據(jù),本架構(gòu)設(shè)計(jì)之初便考慮了高擴(kuò)展性、高可用性。將執(zhí)行功能剝離為智能調(diào)度,基于動態(tài)負(fù)載均衡算法避免造成任務(wù)堆積、服務(wù)崩潰。安全體系是為了確保系統(tǒng)安全、數(shù)據(jù)安全不可或缺的一部分。
在對本系統(tǒng)的架構(gòu)有了初步的了解后,我們將重點(diǎn)介紹可視化建模中的幾個關(guān)鍵步驟,即數(shù)據(jù)接入、數(shù)據(jù)探索、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)標(biāo)準(zhǔn)化、交互界面設(shè)計(jì)、業(yè)務(wù)算子,他們是本系統(tǒng)的核心功能。
2.1? ?數(shù)據(jù)接入
數(shù)據(jù)接入,獲取數(shù)據(jù)是數(shù)據(jù)建模的基礎(chǔ)。不同的行業(yè)有著形式多樣的數(shù)據(jù)源,只有探查出數(shù)據(jù)源的存儲位置、結(jié)構(gòu)信息、業(yè)務(wù)用途等信息,才能進(jìn)行數(shù)據(jù)接入。通過對源數(shù)據(jù)進(jìn)行全方位的探查來認(rèn)識數(shù)據(jù),根據(jù)探查的結(jié)果定義源數(shù)據(jù)到目標(biāo)系統(tǒng)的讀取策略,采用畫板的形式動態(tài)讀取路徑。根據(jù)探查和讀取定義的結(jié)果,對各種異構(gòu)數(shù)據(jù)進(jìn)行必要的解壓、解密、字符集轉(zhuǎn)換等操作,實(shí)現(xiàn)從源系統(tǒng)讀取數(shù)據(jù)或接受讀取源系統(tǒng)推送的數(shù)據(jù)并檢查數(shù)據(jù)是否與數(shù)據(jù)定義一致,不一致則停止接入。對于RDBMS關(guān)系型數(shù)據(jù)庫數(shù)據(jù)源,利用通用接口DatabaseMetaData獲取數(shù)據(jù)庫的元數(shù)據(jù)信息;對于Kafka等消息隊(duì)列數(shù)據(jù)源,通過Consumer客戶端獲取隊(duì)列的元數(shù)據(jù)信息;對于Http接口數(shù)據(jù)源,通過Http請求Response獲取元數(shù)據(jù)信息。通過構(gòu)造不同的數(shù)據(jù)源探查插件,動態(tài)高效地支撐大數(shù)據(jù)智能化的數(shù)據(jù)探查。
2.2? ?數(shù)據(jù)探索
由于原始數(shù)據(jù)是雜亂無章的,針對數(shù)據(jù)進(jìn)行可視化的探索變得尤為重要。探索性的數(shù)據(jù)分析,側(cè)重于原始數(shù)據(jù)本身的展示,因此與數(shù)據(jù)可視化具有相當(dāng)緊密的聯(lián)系,并且圖形展示更直觀且有利于發(fā)現(xiàn)有價(jià)值的信息。信息時代之下,數(shù)據(jù)爆發(fā)式增長,使得數(shù)據(jù)分析與可視化的需求不斷增長。通過圖形化的方式呈現(xiàn)數(shù)據(jù),數(shù)據(jù)可視化可以幫助人們更快地理解數(shù)據(jù)中的模式、趨勢、異常,從而提升數(shù)據(jù)分析的效率、把握數(shù)據(jù)的價(jià)值和內(nèi)涵[1]。簡而言之,描述趨勢使用折線圖,描述數(shù)量使用柱狀圖(且必須從 0 開始),描述關(guān)系使用散點(diǎn)圖,描述比例使用餅狀圖。
2.3? ?數(shù)據(jù)質(zhì)量管理
數(shù)據(jù)質(zhì)量是數(shù)據(jù)分析結(jié)論有效性和準(zhǔn)確性的基礎(chǔ)也是最重要的前提和保障。然而數(shù)據(jù)卻是把雙刃劍,它能帶來巨大價(jià)值的同時也是各行業(yè)領(lǐng)域最大的風(fēng)險(xiǎn)來源。
數(shù)據(jù)質(zhì)量問題包括:①數(shù)據(jù)的完整性和準(zhǔn)確性。數(shù)據(jù)明顯缺失、空值和缺失值、關(guān)鍵字段或信息的缺失、多表字段統(tǒng)計(jì)值不一致。②數(shù)據(jù)的唯一性。不同來源的數(shù)據(jù)出現(xiàn)重復(fù)的情況、主鍵字段存在重復(fù)的情況。③數(shù)據(jù)的權(quán)威性。同一個指標(biāo)出現(xiàn)多個來源的數(shù)據(jù)且數(shù)值不一樣。④數(shù)據(jù)的合法性。獲取的數(shù)據(jù)與常識不同、字段長度不滿足預(yù)期、字段的值不滿足正則校驗(yàn)(手機(jī)號、郵箱、時間、稅號等)、字段的值不在枚舉值的范圍內(nèi)。⑤數(shù)據(jù)一致性。所發(fā)生的數(shù)據(jù)格式或單位不一致。⑥數(shù)據(jù)的及時性。數(shù)據(jù)在預(yù)期時間內(nèi)沒有處理完成。
數(shù)據(jù)質(zhì)量分析方法:①業(yè)務(wù)知識判斷數(shù)據(jù)是否在合理范圍;②總記錄數(shù);③0值數(shù)/0值占比;④唯一值的數(shù)量;⑤空值數(shù)/空值占比;⑥最小值、最大值、平均值、方差、中位數(shù)及各分位數(shù)(箱線圖)、偏度、峰度、眾數(shù);⑦基本數(shù)據(jù)類型;⑧最小、最大和平均長度;⑨異常值分析;⑩數(shù)值的精度和范圍;頻次與直方圖分析;數(shù)據(jù)分布是否對稱、是否符合正態(tài)分布;3σ原則;重復(fù)記錄的數(shù)量/占比。
2.4? ?數(shù)據(jù)標(biāo)準(zhǔn)化
數(shù)據(jù)標(biāo)準(zhǔn)管理主要目的在于規(guī)范產(chǎn)業(yè)數(shù)據(jù)的標(biāo)準(zhǔn),如果待治理的產(chǎn)業(yè)數(shù)據(jù)之間屬性信息一致,但定義與描述各不相同,那么將難以保障產(chǎn)業(yè)數(shù)據(jù)治理的準(zhǔn)確性[2]。為了使用統(tǒng)一的規(guī)范來約束企業(yè)內(nèi)外部的數(shù)據(jù),數(shù)據(jù)標(biāo)準(zhǔn)用以描述企業(yè)的數(shù)據(jù)含義與業(yè)務(wù)規(guī)則。實(shí)現(xiàn)企業(yè)管理數(shù)據(jù)的規(guī)范性、完整性、共享性、有效性,為數(shù)據(jù)資產(chǎn)的管理提供參考依據(jù)。
標(biāo)準(zhǔn)元素:也稱數(shù)據(jù)源,是數(shù)據(jù)標(biāo)準(zhǔn)的最小粒度,由一組屬性規(guī)定其標(biāo)識、名稱、定義、類型、長度、允許值、質(zhì)量規(guī)則的數(shù)據(jù)單元。一般定義需要參考國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)、企業(yè)標(biāo)準(zhǔn),并經(jīng)審核才能進(jìn)行使用。
標(biāo)準(zhǔn)數(shù)據(jù)集:由一系列標(biāo)準(zhǔn)元素共同組成的集合。用以描述不同業(yè)務(wù)的業(yè)務(wù)規(guī)則、邏輯。
數(shù)據(jù)對標(biāo):通過自動對標(biāo)或人工對標(biāo),將數(shù)據(jù)接入的外部數(shù)據(jù)集映射到標(biāo)準(zhǔn)數(shù)據(jù)集。
數(shù)據(jù)接入的數(shù)據(jù)格式是五花八門的,必須要經(jīng)過標(biāo)準(zhǔn)化處理才能形成平臺的標(biāo)準(zhǔn)數(shù)據(jù)。
2.5? ?交互界面設(shè)計(jì)
對于傳統(tǒng)的大數(shù)據(jù)建模方式,一般是基于SQL引擎進(jìn)行SQL腳本的開發(fā)。
本系統(tǒng)用戶可實(shí)現(xiàn)全程可視化操作,通過簡單的拖拉拽即可完成數(shù)據(jù)模型的搭建。交互界面主要包括模型的創(chuàng)建過程,定義模型的規(guī)則、風(fēng)險(xiǎn)主體、運(yùn)行周期等信息?;诮换ソ缑?,用戶只需要知道基礎(chǔ)的模型定義過程,即可一站式地完成數(shù)據(jù)模型創(chuàng)建、模型分析、模型運(yùn)行、模型上線,屏蔽了底層的模型解析、模型數(shù)據(jù)流。
首先對接標(biāo)準(zhǔn)化之后的數(shù)據(jù)集,對各個標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行關(guān)聯(lián)映射。關(guān)聯(lián)方式包括LEFT JOIN、RIGHT JOIN、INNER JOIN、FULL JOIN、SEMI JOIN。關(guān)聯(lián)
的字段通過拖拉拽的方式進(jìn)行左右關(guān)聯(lián)。
模型的具體配置包括風(fēng)險(xiǎn)等級的定義、條件的定義、分類的選擇、指標(biāo)的確定、規(guī)則的設(shè)置。通過左側(cè)的標(biāo)準(zhǔn)元素和右側(cè)的各類算子控件進(jìn)行各種自由組合以構(gòu)建模型的業(yè)務(wù)邏輯。模型運(yùn)行時將根據(jù)模型配置解析為一串工作流,方便對每一步模型運(yùn)行進(jìn)行調(diào)試。對于無法使用簡單的拖拉拽方式配置的數(shù)據(jù)模型,平臺提供了自定義SQL建模的方式。
預(yù)警配置支持對不同的風(fēng)險(xiǎn)主體設(shè)置自定義的預(yù)警推送。包括風(fēng)險(xiǎn)主體的選擇、積分方式的定義、風(fēng)險(xiǎn)管理組的分配。
調(diào)度配置支持模型按規(guī)則運(yùn)行,支持次、年、月、
日、周、小時方式運(yùn)行。包括調(diào)度名稱、預(yù)警選擇、調(diào)度狀態(tài)、調(diào)度周期。解決在大規(guī)模數(shù)據(jù)和大量工作流程下,對資源高效、合理利用的問題。
模型配置完成之后,可以通過測試、抽樣來最終確認(rèn)配置的正確與否。
2.6? ?業(yè)務(wù)算子
企業(yè)大數(shù)據(jù)可視化建模分析系統(tǒng)提供了豐富的算子資源供用戶使用。根據(jù)用戶建模的習(xí)慣以及建模的常用流程,提供了九類算子,包括統(tǒng)計(jì)算子、字符算子、算術(shù)算子、基礎(chǔ)算子、日期算子、條件算子、邏輯算子、AI算子、文件算子,并支持動態(tài)增加算子類型。不同類型的算子可滿足各種模型在任意階段對數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)挖掘的需求。類別可以按需進(jìn)行自定義,自定義分類需要提供類別字段及訓(xùn)練數(shù)據(jù)集。
3? ? ?系統(tǒng)實(shí)現(xiàn)與效果評價(jià)
按照本文提出的設(shè)計(jì)方案,我們進(jìn)行了編碼實(shí)現(xiàn)。在開發(fā)運(yùn)維一體化(DevOps)平臺的基礎(chǔ)上,搭建起K8S微服務(wù)環(huán)境、Hadoop大數(shù)據(jù)環(huán)境和知識圖譜構(gòu)建環(huán)境,實(shí)現(xiàn)了快速構(gòu)建和部署定制化的大數(shù)據(jù)處理分析微服務(wù)組件。這使得我們形成了一個可擴(kuò)展、可移植的應(yīng)用框架,適用于多系統(tǒng)、多平臺環(huán)境下進(jìn)行可視化建模分析。
在微服務(wù)架構(gòu)下,我們按照最佳實(shí)踐原則,以適當(dāng)?shù)牧Χ葘ο到y(tǒng)功能進(jìn)行拆分,形成一系列可復(fù)用的可視化建模分析微服務(wù)組件庫。這些組件庫包括以下幾種組件,如基礎(chǔ)服務(wù)模塊,包括身份認(rèn)證、權(quán)限管理、系統(tǒng)日志、用戶中心、多語言、日志審計(jì)等功能;數(shù)據(jù)接入模塊,包括數(shù)據(jù)源管理,數(shù)據(jù)文件,數(shù)據(jù)集市,任務(wù)配置,調(diào)度執(zhí)行,資源中心;數(shù)據(jù)標(biāo)準(zhǔn)模塊,包括元素標(biāo)準(zhǔn)、字典標(biāo)準(zhǔn)、數(shù)據(jù)集標(biāo)準(zhǔn);數(shù)據(jù)建模模塊,包括模型列表、預(yù)警列表、調(diào)度列表、風(fēng)險(xiǎn)管理組;預(yù)警分析模塊,包括風(fēng)險(xiǎn)預(yù)警統(tǒng)計(jì)、風(fēng)險(xiǎn)庫匯總、處置列表展示,主要分為風(fēng)險(xiǎn)地圖、風(fēng)險(xiǎn)庫、處置列表。
該系統(tǒng)數(shù)據(jù)模型基于Hadoop的數(shù)據(jù)倉庫工具Hive,方便用來查詢和分析大規(guī)模的分布式數(shù)據(jù)。通過可視化界面,初步建立了抽象的流程模型,底層經(jīng)過進(jìn)一步的算子解析、優(yōu)化和精簡得到可執(zhí)行的DAG業(yè)務(wù)鏈。然后,我們提取出業(yè)務(wù)鏈與數(shù)據(jù)鏈中的關(guān)鍵屬性,自動構(gòu)建出HSQL語句,而無須編寫復(fù) 雜的MapReduce代碼。最后驅(qū)動程序?qū)tage發(fā)送到集群中執(zhí)行,任務(wù)調(diào)度器負(fù)責(zé)資源協(xié)調(diào)并處理依賴關(guān)系,最終形成基于某類風(fēng)險(xiǎn)主體的全面數(shù)據(jù)。
下面我們根據(jù)數(shù)據(jù)建模的目標(biāo),選擇合適的分析方法或算法。
3.1? ?實(shí)驗(yàn)1——數(shù)據(jù)離散度建模
在招投標(biāo)過程中,專家評標(biāo)分析階段可能會產(chǎn)生投標(biāo)企業(yè)與評標(biāo)專家串通投標(biāo)的行為。通過利益輸送,評標(biāo)專家對投標(biāo)企業(yè)的評分遠(yuǎn)遠(yuǎn)高于標(biāo)段內(nèi)的評標(biāo)平均分??梢酝ㄟ^專家傾向性和專家打分偏差度進(jìn)行建模分析,對超過一定傾向性比例和偏差度的投標(biāo)企業(yè)預(yù)警。
在招投標(biāo)過程中,投標(biāo)報(bào)價(jià)階段投標(biāo)企業(yè)會串通其他投標(biāo)企業(yè)以高價(jià)或者低價(jià)投標(biāo),使標(biāo)段內(nèi)的所有投標(biāo)企業(yè)的投標(biāo)均價(jià)與自身的投標(biāo)報(bào)價(jià)相近,以此來提高中標(biāo)概率。通過對投標(biāo)報(bào)價(jià)數(shù)據(jù)離散度建模分析,對報(bào)價(jià)超過一定偏離度的投標(biāo)企業(yè)進(jìn)行預(yù)警。
3.2? ?實(shí)驗(yàn)2——異常行為建模
投標(biāo)企業(yè)中標(biāo)率偏高或偏低都屬于異常行為。通過分析單個投標(biāo)企業(yè)所有投標(biāo)記錄和所有中標(biāo)記錄,得出投標(biāo)企業(yè)的中標(biāo)率。中標(biāo)率偏低可能存在陪標(biāo)的風(fēng)險(xiǎn),中標(biāo)率偏高可能存在串標(biāo)的風(fēng)險(xiǎn)。對接招投標(biāo)公開數(shù)據(jù),如果發(fā)現(xiàn)中標(biāo)率偏低的單位在投標(biāo)單位注冊地中標(biāo)率偏高,則有很大的概率說明這些投標(biāo)企業(yè)存在借殼投標(biāo)的行為。
3.3? ?實(shí)驗(yàn)3——技術(shù)指標(biāo)雷同建模
通過提取投標(biāo)企業(yè)電子標(biāo)書的電子信息。例如電子文件創(chuàng)建用戶、文件創(chuàng)建/修改時間戳、電子文件制作機(jī)器碼、電子文件創(chuàng)建標(biāo)識碼。對同一標(biāo)段下電子標(biāo)書的隱藏信息進(jìn)行分析比對,找出異常數(shù)據(jù)。
3.4? ?實(shí)驗(yàn)4——供應(yīng)商同源建模
關(guān)系圖譜是在大量數(shù)據(jù)集合中,按照一定的規(guī)則或規(guī)律,通過特定的算法對數(shù)據(jù)進(jìn)行分析,從而發(fā)現(xiàn)不同事物中蘊(yùn)含的關(guān)系,并將事物進(jìn)行關(guān)聯(lián),最終形成的數(shù)據(jù)網(wǎng)絡(luò)[3]。借助關(guān)系圖譜對招投標(biāo)數(shù)據(jù)進(jìn)行建模分析及可視化展示,從不同的維度,挖掘出隱含在不同數(shù)據(jù)中的關(guān)聯(lián)關(guān)系。我們要構(gòu)建的關(guān)系圖譜包含的企業(yè)名稱、地址等信息通常不是精確的值。比如:北京市西直門外大街112號和北京市西城區(qū)西直門外大街112號,如果將這兩個地址映射為兩個實(shí)體的話,這兩個實(shí)體是沒有任何關(guān)聯(lián)關(guān)系的。為了消除實(shí)體歧義,就需要對歧義實(shí)體進(jìn)行相似度計(jì)算,利用TF-IDF算法進(jìn)行處理。
投標(biāo)企業(yè)法人、投標(biāo)企業(yè)負(fù)責(zé)人、投標(biāo)企業(yè)負(fù)責(zé)人聯(lián)系電話、投標(biāo)企業(yè)注冊地址、投標(biāo)企業(yè)統(tǒng)一社會信用代碼等一般歸屬于某家投標(biāo)企業(yè),如果出現(xiàn)在不同的投標(biāo)企業(yè)中,很大程度上反映出企業(yè)之間的關(guān)聯(lián)密切,同時結(jié)合企業(yè)歷史投標(biāo)記錄,分析投標(biāo)企業(yè)在不同項(xiàng)目或者不同標(biāo)段下的投標(biāo)信息,挖掘出兩兩企業(yè)的潛在聯(lián)系,即投標(biāo)企業(yè)存在同源關(guān)系或者說存在圍串標(biāo)風(fēng)險(xiǎn)。
綜合以上的實(shí)驗(yàn)來看,該企業(yè)審計(jì)大數(shù)據(jù)可視化建模分析系統(tǒng)憑借其多元需求場景考慮、強(qiáng)大的功能以及易用性,足以滿足大多數(shù)場景下的建模需求。
4? ? ?結(jié)束語
本文基于大數(shù)據(jù)技術(shù),設(shè)計(jì)并實(shí)現(xiàn)了一套企業(yè)審計(jì)大數(shù)據(jù)可視化建模分析系統(tǒng),包括了數(shù)據(jù)接入、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)值質(zhì)量檢查、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)建模、數(shù)據(jù)可視化等模塊。自該系統(tǒng)上線以來,已成功建設(shè)了上百個模型,節(jié)省了大量的開發(fā)人力成本。同時,業(yè)務(wù)專家直接參與算法和指標(biāo)定義,使得模型的開發(fā)迭代周期大大縮短。該系統(tǒng)有效解決了招投標(biāo)過程中各類違規(guī)風(fēng)險(xiǎn)的識別問題,大大節(jié)省了審計(jì)人員的時間成本。系統(tǒng)采用多維的數(shù)據(jù)處理與分析技術(shù),構(gòu)建了全方位的審計(jì)防護(hù),確保招投標(biāo)項(xiàng)目工作順利執(zhí)行。未來我們將聚焦于優(yōu)化系統(tǒng)的可擴(kuò)展性、易用性,擴(kuò)展跨行業(yè)應(yīng)用,提升建模效率,實(shí)現(xiàn)更廣泛、更高效、更安全的應(yīng)用,從而成為數(shù)據(jù)建模和可視化數(shù)據(jù)分析的首選工具。
主要參考文獻(xiàn)
[1]藍(lán)星宇,王嘉喆.數(shù)據(jù)可視化設(shè)計(jì)的類型學(xué)實(shí)踐[J].美術(shù)大觀,2022(3):149-152.
[2]安平.數(shù)據(jù)中臺視角下產(chǎn)業(yè)數(shù)據(jù)治理系統(tǒng)的設(shè)計(jì)研究[J].網(wǎng)格安全和信息化,2023(6):94-96.
[3]張寒爍,楊冬菊.基于關(guān)系圖譜的科技數(shù)據(jù)分析算法[J].計(jì)算機(jī)科學(xué),2021,48(3):174-179.