鄭崇明
(深圳大學 城市治理研究院,廣東 深圳 518060)
黨的十八大以來,中國廉政建設呈現出前所未有的反腐敗高壓態(tài)勢。據統計,2013年至2019年9月,全國紀檢監(jiān)察機關共立案263.5萬件,給予黨紀政紀處分245.7萬人。(1)根據中紀委網站公布數據整理。2015年2月27日,習近平總書記在中央全面深化改革領導小組第十次會議上,首次提出讓人民群眾有更多獲得感的重大戰(zhàn)略思想;[1]2016年1月12日,在十八屆中央紀委六次全會上,習近平總書記提出了“讓正風反腐給老百姓帶來更多獲得感”的黨風廉政建設和反腐敗新理念;[2]2019年1月,習近平總書記在十九屆中央紀委三次全會上指出,要“著力處置群眾身邊的腐敗問題”[3]。習近平總書記的上述理念反映的是政府反腐敗與社會公眾評價之間的關系。換言之,社會公眾是政府廉政建設工作的評估主體,其評價結果的高低直接反映了社會公眾的反腐敗獲得感水平。從這個意義上講,反腐敗績效如何由社會公眾來準確評價就成為研究的重要議題。
由社會公眾評價反腐敗績效屬于反腐敗績效評價方式中的主觀評價方法范疇。在廉政研究的諸多文獻中,對政府反腐敗績效的主觀評價出現了“腐敗感知”“腐敗容忍度”“反腐敗效能感”等三種不同的概念和研究方向。最初,腐敗感知主要以專家和企業(yè)人士為研究主體,調查其對政府過去一年的腐敗程度認知水平,比如透明國際的CPI指數。此后,陸續(xù)出現了基于某些國家和地區(qū)的腐敗感知研究(Belousova, Goel, Korhonen, 2016[4];ábelková, Hanousek, 2004[5]; León, Araa, de León, 2013[6]; Melgar, Rossi, 2009)[7],重點在于識別影響因素,提高公眾廉潔感知水平;腐敗容忍度則集中體現為社會公眾或公職人員對政府腐敗現象和程度的容忍程度或接納程度(公婷, 王世茹, 2012),[8]它反映的是歷史長期累積和文化差異對個體腐敗認知方面的影響;而反腐敗效能感則是社會公眾期望政府的反腐敗努力能夠減少他們對腐敗問題的擔憂并且使得社會更加清廉(Li, Gong, Xiao, 2016)。[9]
不難發(fā)現,上述三種主觀評價方法各自側重反腐敗績效的一個方面,僅能表明公眾不同程度的腐敗感知、腐敗容忍度和社會公眾對政府反腐敗努力期望的差異,難以揭示黨的十八大以來,社會公眾對政府反腐敗工作的具體認知狀況和討論內容,即社會公眾對黨的十八大以來政府廉政建設討論了什么具體內容?涉及到哪些主題?哪類主題占比較高以及可能的影響因素是什么?
為回答上述問題,我們使用網絡爬蟲和自動文本分析技術,從新浪微博上獲取了所有有關2012年12月至2017年6月政府廉政建設的數據并加以分析。通過對該數據集進行詞云和結構主題模型分析,揭示網民對政府反腐敗績效的主觀評價內容和認知差異,從全新的維度對話反腐敗績效評價。
對上述問題的研究可以彌補僅靠單一指標衡量反腐敗工作的不足,真正做到中國政府的反腐敗工作由人民群眾自己評價。從公眾參與廉政建設的角度出發(fā),通過大數據的分析方法,獲取社會公眾反腐敗認知的海量數據,可以準確識別和判斷社會公眾對中國廉政建設的期望和所關注的重點議題,從反腐敗工作的獲得感出發(fā),切實調整政府廉政建設的時間注意力分配。
如何評價反腐敗工作是擺在理論和實務工作者面前的重要議題。已有文獻主要運用主觀和客觀兩種方法評價政府的反腐敗效果(過勇, 宋偉, 2016)。[10]一般來說,反腐敗工作的評價與腐敗規(guī)模的大小共生共存。換言之,對腐敗程度的測量是反腐敗工作評價的間接方式,而反腐敗工作的落腳點也在于衡量一個地區(qū)政府腐敗規(guī)模是否實質性地降低,是否贏取了社會公眾對政府反腐敗工作的認可。
腐敗感知是與反腐敗結果評價最為相關且發(fā)展時間較長的概念。然而,已有文獻表明,完全依靠腐敗感知并不能有效評估政府的反腐敗工作。最為相關的是學者們采用量化研究的方法,系統檢驗政府反腐敗力度與公眾清廉感知之間的關系,發(fā)現兩者之間存在著較大的不確定性。有研究指出,沒有經驗證據表明兩者之間存在著顯著的相關關系(倪星, 孫宗鋒, 2015),[11]即在縣區(qū)層面,似乎反腐敗力度的大小并不影響公眾的腐敗感知水平;然而,也有研究表明兩者之間存在著顯著的負相關關系(孫宗鋒, 楊麗天晴, 2016),[12]即在短期內,反腐敗力度加大會曝光大量腐敗信息,刷新民眾對腐敗認知的底線,反而不利于社會公眾的政府清廉感知水平的提高。此外,有相當一部分學者系統檢驗了腐敗感知的影響因素,發(fā)現宏觀層面的制度和文化差異與微觀個體層面的因素共同導致了腐敗感知的差異。具體來說,宏觀層面的制度包括法律法規(guī)(La Porta, Lopez-de-Silanes, Shleifer, Vishny, 1999)[13]、政治民主(Brunetti, Kisunko, Weder, 1998;[14]Diamond, Plattner, 1996[15])、經濟發(fā)展(李輝, 唐敏, 2015)[16]等。文化層面的影響因素有宗教信仰(Persily, Lammie, 2004)[17]、腐敗容忍度(倪星, 2017;[18]肖漢宇, 公婷, 2016[19])等;微觀個體層面包括官方媒體的使用和小道消息(Zhu, Lu, Shi, 2013)[20]、腐敗經歷(Rose, Mishler, 2010)[21]等??梢姡瘮「兄@一概念受到諸多因素的影響,并且與政府反腐敗力度之間的關系呈現出復雜的圖景。單純的腐敗感知并不能準確地顯示出腐敗減少與否,也不能完全反映反腐敗績效的高低。
由于腐敗感知受到諸多因素影響,容易產生偏誤。因此,一些學者主張應當考察反腐敗滿意度,提出用反腐敗效能感來反映當前社會公眾對政府反腐敗效果的主觀評價(Lili,2016)。[22]政府反腐敗效能感越強意味著社會公眾感覺到政府反腐敗政策的執(zhí)行更加有效。研究發(fā)現,個體的收入不公平感顯著影響社會公眾的反腐敗效能感差異。類似地,國家統計局也開展了相關調查,主要調查受訪者對國家反腐敗工作的滿意度評價水平。2015年民意調查顯示,91.5%的群眾對黨風廉政建設和反腐敗工作成效表示滿意,比2012年提高16.5個百分點;90.7%的群眾對遏制腐敗現象表示有信心,比2012年提高11.4個百分點;90.6%的群眾認為當前違紀違法案件高發(fā)勢頭得到遏制,比2012年提高5.2個百分點,均創(chuàng)新高。[23]
除此之外,學者們重點關注腐敗研究的文化維度,并體現為對腐敗容忍度差異的研究。已有研究指出,腐敗容忍度意味著公眾對腐敗現象的“包容”程度,顯示了人們對公職人員違規(guī)行為的接受限度(公婷, 王世茹, 2012)。[8]換言之,腐敗容忍度是反腐敗制度建設的重要社會土壤,當腐敗容忍度較低時,民眾的反腐敗決心和參與的意愿都會較高,有利于形成全社會的腐敗零容忍態(tài)度。同時,腐敗容忍度還會顯著影響公眾對政府腐敗程度的認知差異(倪星, 孫宗鋒, 2015)。[11]當腐敗容忍度較高時,人們會對小規(guī)模的政府腐敗采取默許和想當然的態(tài)度,因而不利于政府清廉水平的提升。
然而,無論是反腐敗效能感、腐敗容忍度還是反腐敗滿意度的調查,均反映的是社會公眾對廉政建設評估的一個維度,無法了解公眾對政府廉政建設討論了什么具體內容、涉及哪些主題、哪些主題占比較高以及可能的影響因素。
與理論探討同時開展的是各地區(qū)反腐敗績效評價的實踐探索。1999年,韓國首爾市政府開發(fā)了一套“反腐敗指數”(2)該指數包含反腐敗認知指數和反腐敗努力指數。,用來評估市政府各行政單位的廉潔程度;臺灣地區(qū)“法務部”開展了“臺灣地區(qū)公眾對政府廉政主觀指標與廉政政策評價”的調查(余致力, 2011);[24]香港廉政公署通過問卷調查方式,廣泛收集不同社會群體的反腐敗認知態(tài)度,推動香港廉政建設和反腐敗工作。[25]
山東省淄博市出臺了建立廉政指標體系的意見,共13項腐敗控制指數和12項公眾感知指數,廉政指標體系的建立,改變了過去對反腐倡廉建設評價客觀性不足、說服力不強的狀況,成為加強各部門黨風廉政建設工作指導、推進全市反腐倡廉建設的有力抓手;[26]安徽省紀委(2002)構建了“安徽省反腐倡廉工作綜合評價系統”[27],該評價系統分為目標測度系統和民意調查系統;河南省紀委提出了以工作作風、依法行政、廉潔從政、廉政效能四個維度為一級指標的評價指標體系;廣州市“廉潔廣州”建設領導小組構建了以廉潔清明政治、廉潔誠信市場、廉潔文化、廉潔公平社會、廉潔城區(qū)建設五個維度為一級指標的評價指標體系。這些指標體系的構建對于提高反腐工作的科學性起到了重要推動作用,體現了各地方政府廉政建設的特色,實現了指標設計的本土化,具有重要的現實意義。
但這些指標體系將腐敗與反腐敗、主觀與客觀指標混合到一起,使得評估結果混雜無序,更無法準確解讀結果所反映的具體方向。雖然有學者(過勇, 2017)[28]主張反腐敗績效評估體系的設計不應局限在采用簡單的腐敗感知來評價中國社會的反腐敗成效,而應從腐敗程度、反腐敗強度和腐敗風險三個角度入手,但是將多種指標融合到一起的風險可能使反腐敗效果的可解讀性更弱。
由于腐敗感知會降低人們對政府的信任度(Kim, 2010),[29]影響政權合法性(Seligson, 2002),[30]因此政府反腐敗績效的評價顯得至關重要。事實上,自黨的十八大以來,政府反腐敗工作確實得到了社會各界的廣泛關注,尤其是負責廉政建設的各級紀委監(jiān)察部門。
由上述文獻分析可知,反腐敗績效的主觀評價結果反映了公眾、專家、媒體等各方主體對政府廉政建設的觀點和看法。相比客觀的統計數據,如官員違紀違法案例數、反腐敗機構的廉政教育次數、制度建設和監(jiān)督保障機制等,主觀評估的結果更能體現社會公眾對政府廉政建設的關切水平,尤其是在黨的十八大以來的反腐背景下更為凸顯。另外,社會公眾對政府高壓反腐帶來的非預期的后果,即官員腐敗信息在較短期內呈現出爆炸式的曝光如何評價同樣值得關注。已有研究表明,單一指標衡量反腐敗績效會在短期內產生與預期結論相反的結果(孫宗鋒, 楊麗天晴, 2016)。[12]如果將分析內容轉變?yōu)樯鐣妼Ψ锤瘮≌J知的分析,改變過去的指數化模式,則可能實現由社會公眾來評價反腐敗績效的目標。然而,已有研究在這方面的關注卻并不多見。Zhu等使用5家網站數據(3)騰訊、搜狐、新浪、鳳凰和財新網。研究網民對反腐敗運動的情感態(tài)度認知,并發(fā)現9大評論的分類(Zhu, Huang, Zhang, 2017)。[31]這對我們在反腐敗領域使用大數據方法研究社會公眾的反腐敗情感差異具有啟發(fā)性。
為解決上述問題,我們采用基于Python語言的網絡爬蟲技術和基于R語言的結構主體模型(STM,Structural Topic Model)。前者在網頁數據的獲取上存在著比較優(yōu)勢,后者在自動文本分析上略勝一籌。我們通過設計編程語言,從新浪微博上爬取了網民對2012年12月至2017年6月這一時間段所有有關政府反腐敗方面的討論帖子。
據統計,截至2017年6月,中國網民規(guī)模達7.51億,互聯網普及率為54.3%;手機網民規(guī)模達7.24億,移動互聯網已滲透到人們生活的方方面面。(4)資料來源:中國互聯網信息中心發(fā)布的《中國互聯網發(fā)展狀況統計報告》。眾所周知,新浪微博是中國社會最大的社交網絡平臺,該平臺在2012年便擁有注冊用戶超過5億。2017年6月的月活躍用戶數(MAUs)為3.61億,較上年同期增長28%,其中92%為移動端用戶。2017年6月的日均活躍用戶數(DAUs)為1.59億,較上年同期增長26%。盡管有研究指出,新浪微博存在著刪帖的現象(King, Pan, Roberts, 2014),[32]但它仍是最能反應當前網民討論社會熱點問題的重要平臺。事實上,新浪微博的數據挖掘和分析在眾多研究中均有所體現(Tong, Zuo, 2014)。[33]本文的基本前提假設是新浪微博的數據可以反映黨的十八大以來網民對政府廉政建設的認知狀況和討論話題的差異。
在這一前提下,我們使用目前大數據算法常用的自動文本分析技術,開展網民對政府反腐敗認知差異的研究。從本質上看,圖像是模糊的非結構化數據,而文字則屬于一種半結構化的數據類型,即我們所知的語言。語言之中包含了有關其自身的信息。新浪微博用戶發(fā)表的有關政府反腐敗方面的帖子在很大程度上反映了當前網民的認知態(tài)度和情感取向。而主題模型則是在眾多文檔中提取主要內容的重要方法,其常用的算法為詞袋法(Bag of Words),即它認為一篇文檔是由一組詞構成的一個集合,詞與詞之間沒有順序以及先后的關系。一篇文檔可以包含多個主題,文檔中每一個詞都由其中的一個主題生成。在此基礎上,相關主題模型和結構主題模型等眾多模型得以產生。結構主題模型允許用戶整合元數據(Metadata)進入到主題建模中去,其主要目的是允許研究者發(fā)現主題并估計主題和文檔之間的關系。
為此,本文在微博上按照關鍵詞搜尋的辦法,進行相關主題搜索,形成本文要分析的數據集。同時,通過結構主題模型,迅速識別所有微博帖子關于反腐敗討論的內容。具體而言,網民討論反腐敗包含哪些主題、各自占比多少、受哪些因素影響,等等。一般而言,我們主張主題占比會在人口統計學變量如性別上存在顯著差異。此外,微博用戶因為其關注者的多寡會對網絡輿論走向產生不同影響。換言之,用戶關注者多,說明其輿論影響力大,也即經常出現在媒體面前的“大V”。因此,文章試圖檢驗用戶影響力的大小與不同主題占比之間的關系。
已有關于腐敗問題的實證研究主要基于問卷調查和典型案例的方法。問卷調查雖然具有代表性和可推性,但數據的收集和處理不夠靈活,并且在實際的操作過程中極易存在抽樣偏誤的問題;而個案訪談雖然可以對典型案例進行深度挖掘,但是難以實現因果推斷。相反,大數據方法自其產生之初便標榜能獲取要分析的海量數據和多樣化的變量(Diebold, 2012;[34]維克托·邁爾-舍恩伯格,肯尼思·庫克耶, 2013[35]),因而成為本文分析方法的首選。我們分別以“十八大反腐敗”“打老虎拍蒼蠅”“習近平反腐”“廉政”“中央反腐”“基層反腐敗”為關鍵詞進行搜索,爬取了2012年12月至2017年6月所有新浪微博討論內容,形成了一個包含7 836個微博原創(chuàng)發(fā)帖的數據集。
由于本文的數據均為文本格式,意味著傳統的統計模型難以滿足本研究需求。隨著自然語言處理技術的進步和文本分析方法的成熟,對海量數據實現自動文本分析已經成為可能。結構主題模型的出現極大地方便了眾多研究者開展文本分析(Roberts, Stewart, Tingley, 2014[36]; Roberts, Stewart, Tingley, 2014[34])。結構主題模型能夠對海量文本進行自動文本主題識別和主題影響因素分析,為詳細闡釋網民對反腐敗的認知和評價狀態(tài)提供了技術支持。
通過R語言的自動文本分析程序包,我們首先對7 836條微博進行基本整理,然后用segmentCN包對所有文本進行分詞,并采用常用漢字停用詞表,去掉一些沒有意義的字詞,如“那么”“但是”“此外”等。在對分詞后的文本進行去掉數字和字母以及一些網址等信息后,最終形成本文要分析的語料庫。為了直觀展示所有微博帖子可能的反腐敗評論的內容,我們繪制了詞云圖,如圖1所示。
圖1 7 836條微博對2013年以來反腐敗工作的討論內容
2012年12月中央出臺八項規(guī)定以來,中紀委堅持“老虎”“蒼蠅”一起打的反腐敗方針,形成了空前的反腐敗高壓態(tài)勢;2015年十八屆中紀委五次全會明確指出,要繼續(xù)保持反腐敗高壓態(tài)勢不放松、堅決遏制腐敗蔓延勢頭;[38]2016年中紀委六次全會要求全面從嚴治黨、加強黨內監(jiān)督,[2]同年6月通過了《中國共產黨問責條例》;2019年1月11日,習近平總書記在十九屆中央紀律檢查委員會第三次全體會議上發(fā)表講話指出,要深化運用監(jiān)督執(zhí)紀“四種形態(tài)”,奪取反腐敗斗爭壓倒性勝利,著力懲治群眾身邊的腐敗問題,完善黨和國家監(jiān)督體系等,以問責倒逼責任落實,推動管黨治黨走向嚴緊硬。[3]研究發(fā)現,黨的十八大以來,網民對腐敗和反腐敗工作進行了熱烈的討論,并且在眾多的詞匯中,討論廉政建設時用到的高頻詞匯一般包括“廉政”“腐敗”“黨風廉政建設”“干部”“清風”和“教育”等。其中,也包含“貪官”“違紀”“中央”“紀委”“打老虎”等內容。這說明網民對政府反腐敗工作的討論與中紀委和各省紀委近些年的反腐敗工作重點具有高度的契合性。然而,上述內容雖然可以讓讀者總體上把握過去三年微博用戶所發(fā)有關反腐敗帖子的主要內容,但卻并不能展示所有帖子討論的主題、各自占比以及可能的影響因素。
近幾年興起的結構主題模型(Structural Topic Model,簡稱STM),不僅可以識別海量文本中的主題,也可以發(fā)現影響主題占比和主題內容的因素。所謂主題占比(Topic Prevalence)是指各主題在所有文本中所占比重,占比越高,代表主題被討論的可能性越高,而主題內容(Topic Content)是指某一主題之下,有哪些關鍵詞語作為支撐。
如圖2所示,經過結構主題建模分析,在20個主題中,“中國-官場-大地震”占比最高,約為所有主題的10%。這意味著自黨的十八大以來,微博用戶對中國反腐敗發(fā)表最多的評論是“官場大地震”,表明網民對政府反腐敗的力度和決心之大表示震驚,同時也彰顯了中國共產黨以零容忍度的態(tài)度面對各種形式的腐敗,堅決懲治腐敗行為、遏制腐敗現象的決心和行動。此外,對中國的反腐敗,網民還討論了縣級官員廉政問題、廉潔教育問題、黨風廉政建設制度推進問題、反腐敗責任落實與監(jiān)督問題、腐敗案件與犯罪問題、聚焦人民群眾反腐敗問題、基層廉政建設的問題、中央巡視黨紀維護問題、社區(qū)廉潔活動建設問題、紀檢監(jiān)察機關廉政建設問題、中央巡視組“打老虎”問題等。
上述議題的討論表明,網民對廉政建設保持了較高的熱情和參與積極性。2003年聯合國大會通過了《聯合國反腐敗公約》(下文簡稱“反腐公約”),為各國反腐敗提供了國際標準原則和政策目標。聯合國反腐公約在吸收各區(qū)域性反腐公約的基礎上,進一步強調了社會參與反腐敗的重要性,敦促各國推動社會參與,把社會參與作為預防腐敗機制的重要環(huán)節(jié),并作為一項國家應盡的義務(王雪梅, 2009)。[39]
圖2 各主題占比注:topic代表主題。
另外,在數據爬取時,我們不僅獲取了網民微博討論的內容,還獲取了網民的性別和微博賬戶的影響力(5)影響力用該微博用戶的關注者數量多少來衡量。關注的數量越多,代表其影響力越大。等信息。結構主題模型的優(yōu)勢在于,其可以提供協變量對各主題占比影響的分析。為檢驗各主題占比是否受到性別的影響,我們把主題占比作為因變量,性別作自變量進行了分析,分析結果如圖3所示。
與女性相比,發(fā)現主題1、主題9和主題18的占比,男性要分別顯著高0.025、0.1和0.02左右。而與女性相比,主題7、8、10、11、12、13和15的占比,男性顯著低。
為進一步探究主題占比可能的影響因素,我們同時以性別和微博影響力作為解釋變量,微博主題占比為因變量,建立統計回歸模型,分析結果如表1所示。
表1所示的主題占比影響因素模型表明,性別和微博影響力兩個變量顯著影響反腐敗主題占比。
圖3 主題占比男女之間差異注:0.00左側代表女性,0.00右側代表男性。
表1 主題占比影響因素分析
注:***0.001,**0.01,*0.05。
具體而言,與女性相比,男性在主題2和9上占比顯著較高,而在主題7、8、10、11、12、13、15和18上占比顯著較低。在主題1、3、4、5、6、16、17、19和20上,男女之間并無顯著差異。
在主題1、3、4、5、6、8、11、13、14、16、17和18上,隨著微博影響力越來越大,主題占比也顯著增加;相反,在主題2、7、9、10、12、15和20上,隨著微博影響力的逐漸增大,主題占比顯著提升。
主題內容不僅反映了網民對政府反腐敗的認識,還體現了網民對政府反腐敗的注意力分配。按照主題占比前4位的標準顯示主題內容,結果如圖4所示。
圖4 主題內容(占比前4)注:左上為主題9,右上為主題18,左下為主題1,右下為主題11。
不難發(fā)現,主題9的主題占比最高。這表明主題9除了說明了“中國官場-大地震”以外,還有“習大大-中紀委巡視組-打老虎-反腐風暴”等內容,直接表明了反腐敗力度之大前所未有,反腐敗決心之不動搖,前所未有;主體18為“廉政文化”主題,其內容更多的包含了“黨風廉政建設-社會主義-人人-心聲”等;主題1為“廉政教育”,具體包含“廉潔-家庭-提醒”等內容;而主題11則是廉政建設部署工作,具體體現為“書記-召開-貫徹-會議-精神”等內容。
此外,由于男女差異,可能對主題內容產生一定影響。因此,以主題6為例,我們做了進一步的分析,具體如圖5所示。
圖5 男女主題6內容對比注:f代表女性,m代表男性,topic為主題。
圖5表明,在主題6上,男女之間的詞語使用上存在明顯差異。左側紅色字體為女性常用詞,分別為“黨委-班子-機構-職能”等詞匯,而右側藍色字體則為男性常用詞匯,包含了“黨風廉政建設-紀委-責任-落實”等內容。
此外,我們還分析了不同主題間的詞匯差異,如圖6所示,發(fā)現主題12更多使用了“腐敗-案件-犯罪-問題”等詞匯,而主題14則更多使用了“黨風廉政建設-政治-制度-執(zhí)紀問責”等詞匯。
圖6 主題12和主題14內容對比
本文以2012年12月至2017年6月所有新浪微博涉及到的反腐敗方面的帖子作為分析對象,采用自動文本分析和結構主題模型方法識別出20個主題。研究發(fā)現,當前網民對反腐敗工作保持了較高的參與熱情,網民討論的主題與黨的十八大以來的廉政建設工作具有較高的一致性,各主題的占比受到微博用戶的性別和微博影響力的顯著影響,從而拓展了社會反腐的研究深度。
從委托代理的角度來看,腐敗源于代理人對委托人公權力的濫用。沿著這一思路,形成了國家中心主義和社會中心主義兩種反腐敗模式,其中社會中心主義的反腐敗模式強調營造良好的社會氛圍,杜絕腐敗滋生的土壤。由此人們開始圍繞社會反腐敗進行了深入的研究,為社會反腐敗的知識增長積累了豐富的文獻,因而具有重要的理論和現實意義。然而,社會反腐敗研究的不足也非常明顯,即通過腐敗感知、反腐敗效能感知、腐敗容忍度等難以更加深入地評價政府反腐敗績效。正是在這個意義上,本文聚焦社會公眾度對政府反腐敗工作的具體認識狀況和討論內容,使得社會公眾度對政府反腐敗內容的評價更加具體,從而豐富了社會中心主義的反腐敗內容。
此外,把大數據運用到反腐敗研究領域也是對研究方法的一種創(chuàng)新。通過數據爬取、數據處理、自動文本分析、結構主題建模等方法,實現了對海量數據的降維處理,通過網絡爬蟲獲取大數據的方法克服了傳統依靠調查數據進行分析的弊端,即主觀調查本身具有滯后性和偏誤性,因而能夠更加全方位地反映網民對反腐敗認知的全貌。在公共管理實踐領域,也為政府反腐敗績效的主觀評價提供了一種新思路,表現為對數據的分析擺脫過去僅依靠數值型數值的局限,可以采用半結構化的數據-海量文本-進行政府績效的評估。