蘇峻青
摘 要 本文針對(duì)當(dāng)前公共權(quán)力運(yùn)行中出現(xiàn)的各類職業(yè)腐敗風(fēng)險(xiǎn)問題,結(jié)合預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)系統(tǒng)建設(shè)工程研究,將數(shù)據(jù)挖掘技術(shù)引入職業(yè)腐敗風(fēng)險(xiǎn)防控系統(tǒng)建設(shè)中,探討運(yùn)用更為科學(xué)管用的數(shù)據(jù)挖掘算法,編織一個(gè)監(jiān)督權(quán)力濫用的“電籠子”,篩選、抽取公共權(quán)力腐敗風(fēng)險(xiǎn)的預(yù)警信息,強(qiáng)化苗頭性問題監(jiān)管,從源頭上防范職業(yè)腐敗風(fēng)險(xiǎn)問題發(fā)生。
關(guān)鍵詞 數(shù)據(jù)挖掘 預(yù)防職業(yè)腐敗 科技手段 信息平臺(tái)
中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A
0 引言
在云計(jì)算和信息時(shí)代,“大數(shù)據(jù)”對(duì)于公共管理顯得日益重要。有效的公共管理和權(quán)力監(jiān)督,越來(lái)越依賴于公共部門對(duì)來(lái)自外部世界各類信息數(shù)據(jù)可靠的、高質(zhì)量的解讀。在預(yù)防公共職業(yè)權(quán)力腐敗方面,如何充公運(yùn)用GB或TB數(shù)量級(jí)龐大、海量的公共權(quán)力運(yùn)行信息數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)對(duì)公共管理腐敗風(fēng)險(xiǎn)的實(shí)時(shí)監(jiān)測(cè)、預(yù)警糾錯(cuò)、動(dòng)態(tài)跟蹤,從源頭上預(yù)防腐敗風(fēng)險(xiǎn)發(fā)生,已經(jīng)成為紀(jì)檢監(jiān)察機(jī)關(guān)研究和關(guān)注的重要課題。
1 基于數(shù)據(jù)挖掘技術(shù)的預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)系統(tǒng)的構(gòu)建
預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)系統(tǒng),就是將公共權(quán)力運(yùn)行和監(jiān)督數(shù)據(jù)全部集中統(tǒng)一起來(lái),形成公共權(quán)力運(yùn)行與監(jiān)督數(shù)據(jù)倉(cāng)庫(kù),運(yùn)用數(shù)據(jù)挖掘技術(shù),建立綜合分析和預(yù)警功能模塊,對(duì)權(quán)力運(yùn)行實(shí)行網(wǎng)絡(luò)化監(jiān)督監(jiān)察,保證公共權(quán)力公開、公平、公正地行使。
1.1 預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)數(shù)據(jù)的準(zhǔn)備
數(shù)據(jù)選擇。預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)系統(tǒng)是基于公共權(quán)力基礎(chǔ)數(shù)據(jù)庫(kù)和輿論監(jiān)督數(shù)據(jù)庫(kù)挖掘的預(yù)警平臺(tái)。其中,公共權(quán)力基礎(chǔ)數(shù)據(jù)庫(kù)主要是面向電子政務(wù)的大型公共權(quán)力運(yùn)行數(shù)據(jù)庫(kù)及相關(guān)文件,具體包括行政審批、行政執(zhí)法、行政征收、公共資源交易、公共資金管理、行政確認(rèn)、行政裁決、三重一大事項(xiàng)決策與運(yùn)行、基層農(nóng)村“三資”管理等數(shù)據(jù)庫(kù),涵蓋各類公共權(quán)力事項(xiàng)、流程、時(shí)限、結(jié)果等權(quán)力運(yùn)行要素信息;輿論監(jiān)督基礎(chǔ)數(shù)據(jù)主要指與互聯(lián)網(wǎng)交互的投訴舉報(bào)和輿情監(jiān)督數(shù)據(jù)庫(kù),具體包括效能投訴、行風(fēng)投訴、信訪舉報(bào)以及網(wǎng)站論壇、博客、新聞評(píng)論、社交網(wǎng)絡(luò)等基于Web的分散的網(wǎng)絡(luò)輿情數(shù)據(jù)庫(kù)。在上述兩類基礎(chǔ)數(shù)據(jù)庫(kù)中,有的屬于關(guān)系型數(shù)據(jù)庫(kù),有的是面向?qū)ο蟮臄?shù)據(jù)庫(kù),還有的是Web數(shù)據(jù)或TEXT文本數(shù)據(jù)源、多媒體數(shù)據(jù)庫(kù)、空間數(shù)據(jù)庫(kù)、時(shí)態(tài)數(shù)據(jù)庫(kù)等。根據(jù)預(yù)防腐敗風(fēng)險(xiǎn)知識(shí)發(fā)現(xiàn)的實(shí)際需要,可以選擇以上各類基礎(chǔ)數(shù)據(jù)庫(kù)的一種或幾種,作為備選源數(shù)據(jù)庫(kù)。
圖 1 云計(jì)算模式下的預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)平臺(tái)數(shù)據(jù)挖掘過程示意圖
數(shù)據(jù)清洗、抽取、轉(zhuǎn)換。在弄清公共權(quán)力源數(shù)據(jù)的信息及其結(jié)構(gòu)的基礎(chǔ)上,通過清洗,去除或修補(bǔ)公共權(quán)力運(yùn)行源數(shù)據(jù)中那些不完整、不一致或含有噪音的數(shù)據(jù)。然后界定所選取的公共權(quán)力數(shù)據(jù)源及數(shù)據(jù)抽取規(guī)則及新抽取數(shù)據(jù)的數(shù)據(jù)庫(kù)結(jié)構(gòu),建立抽取數(shù)據(jù)庫(kù)與公共權(quán)力基礎(chǔ)數(shù)據(jù)庫(kù)之間的轉(zhuǎn)換和裝載機(jī)制,以便讓系統(tǒng)能夠自動(dòng)、實(shí)時(shí)、準(zhǔn)確地從每個(gè)公共權(quán)力數(shù)據(jù)源中抽取紀(jì)檢監(jiān)察機(jī)關(guān)所需的風(fēng)險(xiǎn)數(shù)據(jù)。這些被抽取的風(fēng)險(xiǎn)數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)轉(zhuǎn)換規(guī)則等信息應(yīng)當(dāng)作為元數(shù)據(jù)(Metadata)被封裝、存儲(chǔ)起來(lái),以便將來(lái)根據(jù)挖掘需求及時(shí)作出調(diào)整。在數(shù)據(jù)抽取過程中,應(yīng)當(dāng)全面掌握公共權(quán)力數(shù)據(jù)源的詳細(xì)結(jié)構(gòu)及特點(diǎn),任何小的疏忽都可能導(dǎo)致職業(yè)腐敗風(fēng)險(xiǎn)數(shù)據(jù)抽取的失敗。由于各類基礎(chǔ)數(shù)據(jù)庫(kù)一般來(lái)自不同公共權(quán)力運(yùn)行部門,這些數(shù)據(jù)庫(kù)往往具有異質(zhì)異構(gòu)的特征,而數(shù)據(jù)庫(kù)基礎(chǔ)信息的完備性直接影響預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)系統(tǒng)平臺(tái)的建設(shè)質(zhì)量和應(yīng)用效果。因此,需要按照統(tǒng)一確定的基礎(chǔ)數(shù)據(jù)庫(kù)標(biāo)準(zhǔn),將各部門的異構(gòu)異質(zhì)數(shù)據(jù)庫(kù)轉(zhuǎn)換為符合統(tǒng)一標(biāo)準(zhǔn)要求的數(shù)據(jù),最后集成到待挖掘的目標(biāo)數(shù)據(jù)庫(kù)中。
1.2 預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)數(shù)據(jù)的挖掘
結(jié)合預(yù)防腐敗風(fēng)險(xiǎn)系統(tǒng)建設(shè),根據(jù)數(shù)據(jù)類型、特點(diǎn),選取特定的挖掘模型與算法,運(yùn)用數(shù)據(jù)挖掘SaaS云服務(wù)部件,對(duì)清洗、抽取和轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行挖掘,對(duì)規(guī)格化的目標(biāo)數(shù)據(jù)集進(jìn)行知識(shí)提煉,分析出腐敗風(fēng)險(xiǎn)發(fā)生的趨勢(shì)、規(guī)律、特點(diǎn)、關(guān)鍵部位、關(guān)鍵點(diǎn)行業(yè),以量化或圖線等形式生成數(shù)據(jù)結(jié)果,形成紀(jì)檢監(jiān)察人員關(guān)心關(guān)注的風(fēng)險(xiǎn)數(shù)據(jù)集,用于實(shí)現(xiàn)不同抽象層次、適應(yīng)于不同維度的風(fēng)險(xiǎn)數(shù)據(jù)分析和輔助決策;對(duì)系統(tǒng)預(yù)警風(fēng)險(xiǎn)或違規(guī)問題,按照相應(yīng)的工作程序進(jìn)行查處。具體地講,預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)系統(tǒng)通過數(shù)據(jù)挖掘算法,一是對(duì)各類公共權(quán)力基礎(chǔ)數(shù)據(jù)庫(kù)進(jìn)行關(guān)聯(lián)分析、聚類分析、分類、預(yù)測(cè)和偏差分析,及時(shí)識(shí)別各級(jí)公共組織行使公共權(quán)力、管理公共事務(wù)的行為是否正確、及時(shí)、公開、公平、公正,發(fā)現(xiàn)依法浪費(fèi)或權(quán)力濫用問題;二是發(fā)揮預(yù)測(cè)分析功能,找出職業(yè)腐敗風(fēng)險(xiǎn)的重點(diǎn)領(lǐng)域和關(guān)鍵環(huán)節(jié)并加強(qiáng)監(jiān)督,幫助公務(wù)人員及時(shí)規(guī)避錯(cuò)誤;三是匯總反饋公眾對(duì)公共管理和服務(wù)的新訴求,引導(dǎo)和督促公共管理領(lǐng)域加強(qiáng)嚴(yán)格自律,更加有效地履行公共服務(wù)職能,從而構(gòu)建起預(yù)防職務(wù)風(fēng)險(xiǎn)的前期預(yù)警機(jī)制,使反腐倡廉工作從事后監(jiān)督向風(fēng)險(xiǎn)防控等事前、事中監(jiān)督轉(zhuǎn)變。在預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)平臺(tái)建設(shè)中,主要應(yīng)用到以下數(shù)據(jù)挖掘算法。
(1)關(guān)聯(lián)規(guī)則(Association Analysis)。通過簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)等方法,找出預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)數(shù)據(jù)庫(kù)中不同數(shù)據(jù)變量之間關(guān)聯(lián)的規(guī)律性,即一種腐敗行為與另一種腐敗行為發(fā)生的支持依賴關(guān)系,建立腐敗風(fēng)險(xiǎn)數(shù)據(jù)的頻繁項(xiàng)集。例如行政審批環(huán)節(jié)過多、服務(wù)質(zhì)量差與行政審批效率低之間的關(guān)聯(lián)關(guān)系;不依法使用規(guī)范票據(jù)罰款收費(fèi)與私設(shè)“小金庫(kù)”之間的關(guān)聯(lián)關(guān)系;不認(rèn)真落實(shí)民主集中制度與“三重一大”事項(xiàng)管理混亂之間的關(guān)聯(lián)關(guān)系等。通過對(duì)這些關(guān)聯(lián)關(guān)系進(jìn)行分析,幫助有針對(duì)性查找分析影響腐敗風(fēng)險(xiǎn)的關(guān)鍵因素。
(2)分類分析(Classification Analysis)。包括決策樹方法、神經(jīng)網(wǎng)絡(luò)方法等算法。其中,決策樹方法適用于對(duì)數(shù)據(jù)分類進(jìn)行分析和預(yù)測(cè)的領(lǐng)域,比如若將所有部門工作人員發(fā)生的腐敗問題作為一個(gè)整體來(lái)考慮,按照違規(guī)問題情節(jié)輕重進(jìn)行分類,可將其分為嚴(yán)重型、較重型、一般型、較輕型、苗頭型等多種類型的違規(guī)行為。針對(duì)不同類型的違規(guī)行為,紀(jì)檢監(jiān)察機(jī)關(guān)可采取相應(yīng)的防范或懲戒措施。神經(jīng)網(wǎng)絡(luò)法適用于識(shí)別哪些部門屬于重點(diǎn)防控部門、哪些權(quán)力屬于重點(diǎn)防范的權(quán)力,例如運(yùn)用自組織特征映射網(wǎng)絡(luò)(Self-organizing feature Map,SOM),通過輸入某部門的公共權(quán)力運(yùn)行種類、權(quán)力數(shù)量、行使頻度、公開透明數(shù)量、電子監(jiān)察發(fā)現(xiàn)的違規(guī)問題數(shù)量、被投訴舉報(bào)的信訪數(shù)量等信息,系統(tǒng)根據(jù)事先確定的各個(gè)參數(shù)重要性的權(quán)重(Wi),最終計(jì)算并輸出該部門發(fā)生腐敗風(fēng)險(xiǎn)的機(jī)率,從而通過該機(jī)率和相關(guān)標(biāo)準(zhǔn),判斷該部門應(yīng)當(dāng)屬于嚴(yán)密監(jiān)察部門或重點(diǎn)監(jiān)察部門,還是一般監(jiān)控部門,從而幫助紀(jì)檢監(jiān)察機(jī)關(guān)根據(jù)不同情況采取相應(yīng)措施對(duì)其加以防范。
(3)聚類分析(Clustering Analysis)。根據(jù)監(jiān)察監(jiān)督數(shù)據(jù)的相似性,從公共權(quán)力、行業(yè)部門、監(jiān)察類型等不同維度,對(duì)監(jiān)察監(jiān)督數(shù)據(jù)進(jìn)行歸納,聚合為若干未知類別,幫助紀(jì)檢監(jiān)察機(jī)關(guān)揭示隱含在監(jiān)察監(jiān)督數(shù)據(jù)背后的風(fēng)險(xiǎn)分布模式、發(fā)展變化規(guī)律及其相互關(guān)系,從而發(fā)現(xiàn)腐敗風(fēng)險(xiǎn)集中的部門、風(fēng)險(xiǎn)集中的環(huán)節(jié)、風(fēng)險(xiǎn)集中的問題,增強(qiáng)預(yù)防腐敗的針對(duì)性。例如,在行政處罰電子監(jiān)察系統(tǒng)建設(shè)中,通過對(duì)工作流程監(jiān)察事項(xiàng)的聚類分析發(fā)現(xiàn),“調(diào)查取證”、“作出處罰決定”階段辦事效率太低是造成辦案“時(shí)限超期”的重點(diǎn)因素,那么,就應(yīng)當(dāng)在這些階段加強(qiáng)對(duì)執(zhí)法人員的提醒,防止執(zhí)法人員在這些環(huán)節(jié)上發(fā)生效率低下、吃拿卡要報(bào)等風(fēng)險(xiǎn)問題。
(4)“預(yù)測(cè)”。運(yùn)用該算法,可以在對(duì)已發(fā)生的腐敗問題歷史數(shù)據(jù)進(jìn)行分析的基礎(chǔ)上,找出腐敗行為的變化規(guī)律,據(jù)此對(duì)權(quán)力運(yùn)行及腐敗風(fēng)險(xiǎn)突出問題及未來(lái)發(fā)展態(tài)勢(shì)進(jìn)行研判,為紀(jì)檢監(jiān)察機(jī)關(guān)從源頭上預(yù)防腐敗蔓延提供決策依據(jù)。在預(yù)防腐敗風(fēng)險(xiǎn)系統(tǒng)建設(shè)中,可采用灰色—馬爾科夫模型算法,對(duì)過去幾年或十幾年發(fā)生的信訪舉報(bào)、網(wǎng)絡(luò)輿情、電子監(jiān)察異常等腐敗風(fēng)險(xiǎn)數(shù)據(jù)進(jìn)行分析,對(duì)未來(lái)一段時(shí)間內(nèi)某領(lǐng)域、某部門或某項(xiàng)公共權(quán)力發(fā)生腐敗風(fēng)險(xiǎn)的趨勢(shì)進(jìn)行預(yù)測(cè),使紀(jì)檢監(jiān)察機(jī)關(guān)更有針對(duì)性地明確監(jiān)管重點(diǎn),防患于未然。
(5)“偏差分析”。就是充分運(yùn)行計(jì)算機(jī)高速、高效的特點(diǎn),通過記錄搜索等技術(shù),從大量的公共權(quán)力基礎(chǔ)數(shù)據(jù)庫(kù)中,對(duì)照正常運(yùn)行的規(guī)則進(jìn)行“偏差”監(jiān)測(cè)和分析,找出各項(xiàng)權(quán)力存在的異常、異動(dòng)、違規(guī)情況的“偏差點(diǎn)”和“獨(dú)立點(diǎn)”,為查處腐敗風(fēng)險(xiǎn)問題提供案源線索。目前,在已建的行政審批、行政處罰、公共資金、公共資源交易電子監(jiān)察系統(tǒng)中,多數(shù)都采用了這種算法,發(fā)現(xiàn)了諸多電子監(jiān)察預(yù)警信息,為促進(jìn)行政權(quán)力規(guī)范運(yùn)行發(fā)揮了重要作用。
1.3 預(yù)防職業(yè)腐敗風(fēng)險(xiǎn)模型的評(píng)估
為了提高預(yù)防腐敗風(fēng)險(xiǎn)系統(tǒng)的針對(duì)性和實(shí)效性,需要對(duì)數(shù)據(jù)挖掘工作進(jìn)行反復(fù)測(cè)試,通過實(shí)驗(yàn)和訓(xùn)練得到濃縮的知識(shí),對(duì)風(fēng)險(xiǎn)預(yù)防模式特別是數(shù)據(jù)挖掘模式進(jìn)行評(píng)估,驗(yàn)證知識(shí)模型的有效性,為預(yù)防腐敗系統(tǒng)平臺(tái)提供科學(xué)準(zhǔn)確的模型,形成標(biāo)準(zhǔn)的模型庫(kù),作為電子政務(wù)“云”資源池中的SaaS服務(wù)部件,為各級(jí)各紀(jì)檢監(jiān)察機(jī)關(guān)采集監(jiān)察數(shù)據(jù)時(shí)予以調(diào)用或重用。