李佳源
政績考核的內在悖論
毛澤東說,在路線確定之后,最重要的因素就是干部。這個判斷強調國家治理的關鍵在于吏治。在諸多管理工具中,吏治的關鍵則在于形成一套有效的干部激勵機制,以幫助公職人員成長為出類拔萃之輩的干部。在目前的制度安排下,這種激勵更多表現在通過構建量化指標來對官員的工作業(yè)績進行測量,并且將測量的結果和官員的選拔任用結合起來。借助量化指標可以對官員的業(yè)績和能力進行精確的區(qū)分。盡管如此,這種制度設計也導致了一系列的問題,其中最為突出的問題就是績效考核中存在集體數據作假等博弈行為:被考核者采取不正當甚至是違法的手段對數據進行調整,即出現社會學家所說的目標替代的問題。在這種情況下,績效考核從一種手段被異化為目的本身。
近年來,公共部門中量化考核及其引發(fā)的負面效應已經成為公共管理和組織社會學研究的重要主題,這些研究使得我們得以窺見博弈這個近乎黑箱的組織現象。牛津大學萬靈學院的胡德(Christopher Hood)教授的一系列研究都揭示了量化考核的悖論:當一項績效考核對被考核者的獎懲過大的時候,那么它扭曲被考核者的激勵結構和誘發(fā)博弈行為的可能性更大。在他與合作者貝文(Bevan and Hood, 2006)對英格蘭公共衛(wèi)生領域的量化指標的研究中,他們發(fā)現對醫(yī)療救護響應時間的硬性考核規(guī)定導致了醫(yī)護人員對數據進行違規(guī)修正的行為。例如,為了達到不超過4個小時救助等候時間的目標,一些病人被要求在救護車中等待,直到醫(yī)院確定他們能在規(guī)定時間內開展救助才允許這些病人進入醫(yī)院。威斯康辛--麥迪遜大學的海因里奇通過實證研究發(fā)現,在就業(yè)培訓中,根據參與人員完成訓練后的就業(yè)狀況來決定管理者的績效工作的分配,確實誘發(fā)了項目管理者的策略性行為。例如,項目的管理方將一些就業(yè)前景不好的培訓申請者(如低學歷和少數族裔等)排除在項目外,以此來達到“提升”項目效果的目的。
基于中國情境的許多實證研究也證實了類似的悖論。香港城市大學的陳漢宣教授和高潔博士的一系列有關中國地方政府績效評估的研究,都發(fā)現量化考核誘發(fā)了不同程度的數據造假行為(Chan and Gao, 2012)。斯坦福大學的周雪光老師及其合作者對中國官僚機構運作的近距離觀察,也提供了與此相關的豐富證據(周雪光,2008)。高潔博士(Gao, 2015)在新近的一篇論文中,將中國地方政府的目標責任制中存在的博弈行為區(qū)分為良性博弈和惡性博弈,兩者的區(qū)別在于,“博弈”是否導致了報告的績效和真實績效之間的差異。良性博弈主要包括棘輪效應和門檻效應,主要是指被考核者為了避免下一輪考核中更重的任務,將指標的完成水平限制在考核方確定的目標水平之下,或避免以較大幅度地超過上級確定的目標值。這類博弈行為以往并沒有得到足夠的關注,但近年來開始見諸文獻。例如,一些研究人員發(fā)現,為了應對逐年上升的考核任務,基層派出所會把超額完成的犯罪打擊任務,按照一定的比例“交易”給完成情況不理想的派出所,以此來達到一種“雙贏”的局面:超額完成的派出所可以避免來年更重的考核壓力,而未完成任務的單位則可以通過考核。這類博弈行為出現的直接誘因是目前績效指標的制定方式:下一年考核目標值的確定,是基于該指標今年的完成情況來制定,因此被考核者為了減輕考核壓力,他們會避免在考核指標上完成得太過理想。
相比較而言,惡性博弈指的是被考核方由于種種原因無法完成考核任務,而通過直接的數據造假來影響考核的結果。在一些情況下,惡性博弈會直接損害民眾的利益。例如,一些地方為了完成節(jié)能減排的任務,對所在轄區(qū)的企業(yè)和居民進行拉閘限電,嚴重影響了企業(yè)生產和民眾生活。再如,為了遏制耕地銳減的勢頭,各級政府已經建立了耕地保護目標責任制。為了平衡耕地保護和經濟發(fā)展之間的矛盾,耕地保護的基本原則之一是耕地總量動態(tài)平衡,允許地方在占用耕地的同時補充數量和質量相當的耕地。但是一些調查發(fā)現,“占優(yōu)補劣”的情況較為普遍:非農建設用地占用的大都是良田沃土,而補充的耕地主要是土壤肥力差、生產能力不足及灌溉條件較差的耕地。表面上看,耕地的絕對數量沒有減少,但是耕地的綜合生產能力被嚴重削弱。從長遠來看,“占優(yōu)補劣”的問題影響的是國家的糧食安全。這些例子都說明,惡性博弈行為在一定程度上是通過犧牲民眾和社會的利益來完成考核任務的。
此外,這些行為的隱秘性和敏感性也使得我們無法準確估計各類博弈行為的普遍程度。但是從部分基層公職人員對考核數據真實性的質疑(Xiao and Womack, 2014),到大家經常聽到的一些順口溜,例如,“村騙鄉(xiāng),鄉(xiāng)騙縣,一直騙到國務院”,我們不難窺探數據“注水”的問題事實上十分嚴重。
博弈行為對官員選拔機制的扭曲
這些博弈行為的危害是多方面的。博弈行為首先對政府的科學決策構成威脅。大數據時代的公共管理愈加強調數據驅動。盡管政府決策的數據來源是多方面,但是自身的統(tǒng)計體系是其中重要的因素。因此,博弈行為的發(fā)生首先損害了數據的真實性和可靠性,“注水”的數據導致決策者對實際情況的誤判。例如,近年來,一些地方政府片面追求經濟數據的華麗,進而對數據進行人為的修正。如果這種行為具有普遍性,那么決策層可能會對宏觀經濟環(huán)境形成錯誤的認識。類似地,在犯罪打擊領域,目前一種頗為流行的主張是,警力跟著警情走:警力資源的配置必須根據地方的治安狀況來制定。如果基層派出所對反映他們績效的治安績效進行干擾或調整,那么數據結果將嚴重影響上級公安部門對治安形勢的判斷,進而誤導警力資源的科學配置。
其次,博弈行為損害了政府組織內部的信任,增加了治理的成本和難度。政府績效評估從本質上說是一種激勵工具,但是由于博弈行為的發(fā)生,上級在考核的時候不得不加大了許多資金和技術投入用于減少博弈的空間。例如,在環(huán)保領域,環(huán)保部借助了污水排放在線監(jiān)控來避免基層數據作假。盡管這些投入的效果如何有待評估,但是從這些例子不難看出,博弈風險明顯提高了上級政府的治理成本和難度。
此外,博弈行為的發(fā)生扭曲了官員選拔機制。從理想的層面理解,官員的選拔和任用無非是讓“能者上,平者讓,庸者下”。如果數據造假非常普遍,甚至存在社會學家所說的“上下級共謀”對績效結果進行非法干擾,那么績效評估作為一把選賢任能的尺子將會失靈,在考核的“錦標賽”中勝出的將是那些善于對數據進行調整的官員,而那些實事求是的官員將受到淘汰。顯然,放任這個問題存在,將嚴重污染中國官場的政治生態(tài)。
但是,一個更進一步的問題是,為什么會出現考核作假?特別是考核技術日益改進的背景下,為什么博弈行為仍然普遍存在?對官員在考核中的作假行為,目前的解釋,仍然局限于委托--代理理論。這個框架的基本出發(fā)點,是將政府組織間的上下級關系視為委托者和代理者的關系,委托人和代理人之間的目標不一致,以及雙方的信息不對稱導致了博弈行為的出現。許多研究都是從這個視角來分析這個問題的。
但筆者認為,盡管委托--代理視角具有一定的解釋力,但是要理解這些行為的發(fā)生,就必須關注誘發(fā)博弈動機和行為的制度邏輯。制度邏輯視角可以為博弈行為的發(fā)生以及這些不正當行為的頑固性提供一種新的解釋。這個理論流派的主要觀點是,社會是由不同的制度邏輯構成的,這些制度邏輯為個體的行為提出了相互矛盾的要求。盡管制度邏輯是在社會的宏觀層面運作的,它們塑造了行動者的認同(“我是誰”)、目標(“我追求什么”)和手段(“我要如何實現目標”)。另一方面,制度邏輯視角也認為,個體依據制度邏輯行動會強化制度邏輯本身,這也是為什么制度化的行為一旦形成就會表現出很強的穩(wěn)定性。總之,這個理論流派強調制度邏輯和行為之間存在的相互影響的關系:即制度邏輯塑造了個體的行為,而個體的行為反過來會強化制度邏輯。
新官僚精英機制的出路
在當前的制度安排下,量化考核更容易誘發(fā)國家科層(state-bureaucratic)的官僚化邏輯。在這個邏輯占主導的制度體系下,官員的合法性取決于他們對上級制定的各種指令的回應和執(zhí)行,因此他們必須將注意力聚焦于上級下達的指令。近年來,橫向排名機制、末位淘汰和一票否決等考核技術的應用,使得被考核者對上級制定的各種指標更加敏感,前者的注意力被鎖定在了自上而下分配的量化指標上。在一些極端的情形下,被考核者不得不采用博弈行為來確保自己在考核中的優(yōu)勢。博弈行為的發(fā)生,事實上就是國家科層邏輯影響官員動機和行為的體現,而遵循國家科層邏輯的行動策略,反過來又固化了這一官僚化邏輯在制度環(huán)境中的主導地位。
從制度邏輯的角度出發(fā),減少博弈行為的關鍵,在于如何從技術上和制度上緩解國家科層邏輯對官員行為的控制。筆者認為可以從以下幾個方面入手:首先,必須完善測量體系的設計,尤其是確定績效目標的合理性。目前指標任務的制定存在“只升不降”的趨勢,而且為了所謂的“打出多余量”,一些考核者慣用橫向排名機制,這便意味著單純完成上級下達的任務是遠遠不夠的,被考核者必須獲得“相對績效”的優(yōu)勢。在考核的高壓下,自上而下的層層加碼和自下而上的層層注水成為常態(tài)。事實上,不少經驗研究已表明,目標任務的難度和博弈的發(fā)生之間存在一定的關聯性(Bohte and Meier, 2000)。因此,如何提升目標和指標制定的合理性,是降低博弈風險的當務之急。
環(huán)保指標考核即是地方官員治理中經常誘發(fā)博弈行為的一項
目標的合理性,還意味著在制定考核指標和目標的過程中必須兼顧地方發(fā)展程度和發(fā)展定位的差異,避免搞“一刀切”。廣東省貫徹和落實科學發(fā)展觀考核體系的設計就是一個很好的例子。自2008年以來,該考核體系將全省分為四類地區(qū),分別是都市發(fā)展區(qū)(廣州、深圳)、重點發(fā)展區(qū)(粵西、粵北、粵東)、優(yōu)先發(fā)展區(qū)(廣、深以外的珠三角城市)和生態(tài)發(fā)展區(qū)(河源、梅州等)。四類地區(qū)的指標和權重設計,都是根據地區(qū)的發(fā)展戰(zhàn)略來確定。通過差異化和個性化考核可以顧及地方發(fā)展的特色,實現績效考核的公平性和結果的可比性。相反的,目標設定上的“一刀切”非常容易誘發(fā)博弈行為。高潔博士 (Gao, 2015)在其論文中就講述了這樣一個例子。在陜西省某縣,按照績效考核的要求,每個地方必須完成一定數量的農村富余勞動力轉移,但是對于一些鄉(xiāng)鎮(zhèn),由于當地有著較為發(fā)達的果樹種植產業(yè),農民通過種植業(yè)就可以獲得高于外務工的收入,因此下達富余勞動力轉移的硬指標是不合理的。為了應對這些指標,鄉(xiāng)鎮(zhèn)政府不得不捏造數據。從這些例子可以看出,績效目標不合理是誘發(fā)績效考核博弈的主要原因之一。
其次,要改善績效數據的采集手段。博弈行為在很大程度上是被考核方對自由裁量權的濫用,破解這個問題的相應辦法,就是提高績效數據采集的獨立性。例如,在耕地保護領域,衛(wèi)星航拍技術的運用對地方政府的耕地保護形成了很大的壓力。在衛(wèi)星遙感技術的協助下,國土部門將一個地區(qū)同一地域的兩個不同時間點的衛(wèi)片進行對比,就可以直觀地判斷所拍攝地域土地利用的變更情況。這項技術的應用,明顯減少了考核的主觀性和被考核方博弈的空間。應該強調的是,這些手段和技術的應用雖然不可能完全杜絕博弈行為,但可以減少績效數據采集過程中對被考核方的依賴。當然,績效考核的設計也需要考慮到成本的問題,在經濟條件允許的情況下,可以嘗試應用技術化的手段提升績效數據采集的獨立性。
另外一個相應的方法是借助其他數據對績效數據的真實性進行校驗。 Rawski (2001)的研究,就是通過比較GDP的增長和能源消耗之間的反差來對中國GDP數據的真實性提出質疑。作者的邏輯是,GDP的增長必須建立在能源消耗的基礎上,能耗下降但GDP仍然快速增長只有兩種解釋,一種是單位GDP能耗劇烈下降,但是這顯然不符合中國的實際。另外一種可能的解釋就是數據作假。事實上,考核的競爭壓力下如何擠出績效數據的水分,也是決策層的重要關切。例如,李克強總理在擔任遼寧省委書記的時候告訴來訪的美國駐華大使,他更喜歡通過耗電量、鐵路貨運量和貸款發(fā)放量來評估當時遼寧省的經濟狀況。英國著名的政經雜志《經濟學人》受到這個方法啟發(fā)將這三項經濟指標進行綜合,設計出了“克強”指數。這些例子說明,如果一個關鍵業(yè)績指標非常容易受到操縱,一個相應的方法就是采用多個相關指標進行共同的測量和校驗。
指標考核的設置應因地制宜,切忌“一刀切”
第三,要盡可能擴大績效評估指標體系的涵蓋面。績效評估研究的一個比較一致的觀點是,對于被考核者而言,理性的策略就是測量什么就重視什么。因此,在指標設計上要避免過于簡單化。組織的注意力是一種稀缺的資源,為了避免出現選擇性關注,政府績效指標的設計必須包括關鍵業(yè)績指標(Key Performance Indicators)。此外,指標之間必須具有一定的邏輯關系,即涵蓋投入、產出、過程和結果。和西方公共管理改革的趨勢一樣,許多地方政府在實施績效評估過程中都存在一種結果至上的傾向,對完成績效目標的投入和過程重視不夠。事實上,在評價官員的實績中,考核的設計者不僅僅要重視結果,還要考慮過程,即完成目標的手段的合理性和正當性(王漢生、王一鴿 ,2009)。
在指標的篩選過程中還需要注意一個問題,就是考核指標是否適合用于評價政府部門的業(yè)績。如果考核的內容受到被考核者努力以外的因素影響,那么這些指標不宜作為有效的信號來評價官員的業(yè)績。例如,目前許多地方政府開始使用公眾主觀感知指標(例如滿意度和幸福感等)對政府機構的業(yè)績進行測量,但是影響這些主觀感知的因素除了公共服務的質量外,還包括了許多被考核者無法直接影響的因素。例如,幸福感的許多研究表明,人格甚至是受訪者填答問卷時候的心情,都可能會影響他們報告的幸福感的高低 (Schwarz and Strack 1999)。如果考核的設計者過于強調這些“民意指標”,那么可能誘發(fā)被考核者的抵觸甚至是博弈行為??傊谥笜梭w系的設計上必須考慮權責一致。
最后,除了在技術上和方法上對考核進行改良外,筆者認為,政府績效考核應該在政治問責和組織學習中尋求平衡點。哈佛大學肯尼迪政府學院的羅伯特·貝恩教授認為,公共部門的績效考核應該包括評價、控制、預算、激勵、學習和提升等功能(Behn, 2003)。但在實踐中,我們觀察到,目前對政績考核的應用,過于強調績效評估的控制和問責功能,而忽視了這項工具的其他作用。筆者認為,改進政府績效考核的方向是,弱化績效評估的問責取向,減少被考核者對考核的抵觸,并且強化績效評估在推動組織學習和創(chuàng)新中的作用。實現績效考核的功能轉變,可以促使對這項工具的應用回歸理性。
總之,不同于目前主流媒體將考核博弈行為的發(fā)生歸結于涉事官員的自利動機和道德缺陷,筆者的主要觀點是,必須重視誘發(fā)博弈行為的制度性根源。績效考核的制度設計非常容易誘發(fā)國家科層官僚化的制度邏輯,這個邏輯將被考核者的注意力局限在各種自上而下制定的量化指標上。而在國家科層邏輯占主導性的制度環(huán)境中,包括數據造假在內的各種博弈行為,對于被考核者來說就是一種“理性”的行為。對于博弈行為的出現,我們必須從制度上尋找原因和對策。沒有這一點,如何尋找新官僚精英將成為無本之木。
受到中國幾千年來“學而優(yōu)則仕”的觀念影響,公務員至今仍然是一個非常具有吸引力的職業(yè)選擇。競爭激烈的公務員考試選拔,無疑能夠確保進入這個隊伍的大部分人都是有潛力成為獨當一面的政務精英。公共部門這個“雇主”需要幫助這些年輕的公務員更快更好地成長,讓公共管理成為他們施展抱負的地方,將他們的個人成長和組織發(fā)展統(tǒng)一起來。但是,目前的量化考核在這一點上起到了反作用,不合理的績效考核機制迫使不少公職人員疲于應對各種自上而下的考核指標,甚至導致他們對自己工作的意義和價值產生了懷疑。從這個意義上說,尋找新的官僚精英,關鍵在于如何通過完善績效管理等激勵機制最大限度釋放公職人員的潛能和公共服務動機。這或許可以為鄭永年先生提出的“出類拔萃之輩去了哪里”一問提供一些初步的回答。