李碩 周董
[摘 要] 2013年以來,全新的《事業(yè)單位會(huì)計(jì)制度》和《高等學(xué)校會(huì)計(jì)制度》相繼出臺(tái),高校經(jīng)濟(jì)運(yùn)行體制在新制度指導(dǎo)下,開始由粗放式管理模式逐步轉(zhuǎn)變?yōu)榫?xì)化、透明化的管理模式,產(chǎn)生了對(duì)高校辦學(xué)成本進(jìn)行分析的要求。在高校預(yù)算編制過程中,如何從上年度預(yù)算執(zhí)行情況中獲得對(duì)新一年預(yù)算編制工作有指導(dǎo)意義的,有利于高校管理層決策的知識(shí),成為當(dāng)前高校預(yù)算管理研究的一個(gè)方向。將近年來興起的數(shù)據(jù)挖掘技術(shù)應(yīng)用于高校的預(yù)算管理工作中,是一個(gè)不錯(cuò)的選擇。本文對(duì)高校預(yù)算工作現(xiàn)狀和數(shù)據(jù)挖掘技術(shù)在預(yù)算編制中的應(yīng)用進(jìn)行探討。
[關(guān)鍵詞] 高校預(yù)算;數(shù)據(jù)挖掘;財(cái)務(wù)管理;DM;KDD
[中圖分類號(hào)] F232;G475 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2014)19- 0034- 03
1 高校預(yù)算管理現(xiàn)狀
作為高校運(yùn)作的經(jīng)濟(jì)命脈和神經(jīng)中樞,我國高校預(yù)算管理的改革正在逐步深化,高校預(yù)算管理工作由最初的“資源配置”功能逐步轉(zhuǎn)化為“資源配置”與“目標(biāo)控制”并重[1]?!百Y源配置”是實(shí)施預(yù)算管理的原始動(dòng)力,而“目標(biāo)控制”則是預(yù)算管理優(yōu)良再循環(huán)的重要基礎(chǔ)。目前,隨著高校體制改革的推進(jìn),高校預(yù)算管理工作中的“目標(biāo)控制(管理)”功能已經(jīng)愈發(fā)得到高校管理層的重視,但是在實(shí)際的預(yù)算編制中,高?;旧线€是采用基數(shù)―增長的預(yù)算編制方法[2]。這種方法簡便易行,但實(shí)質(zhì)上是預(yù)算編制人員在默認(rèn)上年預(yù)算合理的基礎(chǔ)上根據(jù)上年財(cái)務(wù)收支工作中累積的經(jīng)驗(yàn)和本年概略的發(fā)展目標(biāo)制訂一個(gè)粗糙方案,是一種缺乏科學(xué)性、公開性、公平性的非量化的預(yù)算編制方法。究其原因,是現(xiàn)有的預(yù)算執(zhí)行體系缺乏一種有效的、可靠的輔助決策機(jī)制,難以產(chǎn)生科學(xué)可信的可供管理層和預(yù)算編制人員參考的預(yù)算執(zhí)行分析報(bào)告,預(yù)算編制工作的質(zhì)量只能依賴于本級(jí)預(yù)算編制人員和下級(jí)預(yù)算單位相關(guān)人員的工作經(jīng)驗(yàn)和職業(yè)道德,對(duì)于高校決策者來說,這樣的預(yù)算管理機(jī)制是模糊的,不規(guī)范的,難以掌控的,不利于高校形成健康的運(yùn)行體制,也不利于高校制訂長遠(yuǎn)的發(fā)展規(guī)劃。只有通過信息化手段,運(yùn)用某些特定的方法,從高校預(yù)算執(zhí)行過程中形成的海量數(shù)據(jù)里,提取和精煉高置信度的關(guān)聯(lián)數(shù)據(jù),對(duì)預(yù)算編制工作進(jìn)行強(qiáng)有力的支撐,才能形成科學(xué)合理的高可靠性的預(yù)算編制方案。
目前,我國高校預(yù)算管理和會(huì)計(jì)核算的職能并沒有分離,同屬于財(cái)務(wù)部門。高校財(cái)務(wù)部門普遍應(yīng)用的商業(yè)化財(cái)會(huì)電算化系統(tǒng)是基于高校一般會(huì)計(jì)核算需求設(shè)計(jì)開發(fā)的,在《事業(yè)單位會(huì)計(jì)制度》和《高等學(xué)校會(huì)計(jì)制度》的框架內(nèi),財(cái)會(huì)電算化系統(tǒng)圍繞會(huì)計(jì)核算的基本職能來運(yùn)作,在提供管理決策支持方面的功能是微弱的,同時(shí)由于會(huì)計(jì)電算化數(shù)據(jù)相對(duì)單一、孤立,豐度低,在記錄高校經(jīng)濟(jì)活動(dòng)的過程中偏重于合法性,無法全面準(zhǔn)確地從成本效益的角度反映高校包括教學(xué)、科研、行政、后勤各類機(jī)構(gòu)的運(yùn)作特征,進(jìn)而導(dǎo)致無法提供有效的信息來滿足決策層的管理需要。那么,應(yīng)用數(shù)據(jù)挖掘技術(shù),對(duì)與高校經(jīng)濟(jì)活動(dòng)相關(guān)聯(lián)的數(shù)據(jù)進(jìn)行科學(xué)的分析、處理和展現(xiàn),是目前比較可行的方案。
2 數(shù)據(jù)挖掘技術(shù)介紹
近年來,信息技術(shù)在生產(chǎn)生活中的應(yīng)用呈指數(shù)級(jí)增長,各行各業(yè)在實(shí)際工作中積累了巨量的應(yīng)用數(shù)據(jù),這些數(shù)據(jù)中蘊(yùn)含了許多有價(jià)值的規(guī)律和知識(shí),被稱為“知識(shí)金礦”。由于缺乏強(qiáng)有力的數(shù)據(jù)分析工具,這些寶貴的知識(shí)財(cái)富只能混雜在大量的冗余數(shù)據(jù)中,慢慢地流失自己的價(jià)值。數(shù)據(jù)挖掘(Data Mining,DM),也被稱為知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)技術(shù),就是從大量的、異構(gòu)的、模糊的、有噪聲的應(yīng)用數(shù)據(jù)中發(fā)現(xiàn)并提取浸沒在其中的有價(jià)值的、可靠的知識(shí)信息和模式的數(shù)據(jù)處理過程。數(shù)據(jù)挖掘技術(shù)是涉及多學(xué)科的技術(shù)集成,包括數(shù)據(jù)倉庫技術(shù)、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、高性能計(jì)算、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)可視化、信息檢索、圖像與信號(hào)處理以及空間或時(shí)間數(shù)據(jù)分析[3]。
數(shù)據(jù)挖掘的過程由數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模式評(píng)估、知識(shí)展現(xiàn)這4個(gè)可以互相迭代的步驟來完成,其中數(shù)據(jù)預(yù)處理步驟包括對(duì)數(shù)據(jù)的清洗、集成、選擇、轉(zhuǎn)換等操作,模式評(píng)估質(zhì)量則依賴于支持度、置信度等客觀度量的選擇和制定,知識(shí)展現(xiàn)過程就是使用可視化技術(shù)向用戶提供易于理解的知識(shí)發(fā)現(xiàn)結(jié)果。
3 數(shù)據(jù)挖掘技術(shù)在高校預(yù)算管理中的應(yīng)用
基于數(shù)據(jù)挖掘技術(shù)對(duì)規(guī)律和知識(shí)發(fā)現(xiàn)的強(qiáng)大能力,將數(shù)據(jù)挖掘技術(shù)和高校的財(cái)務(wù)預(yù)算編制工作結(jié)合起來,不僅有利于使財(cái)務(wù)人員從繁雜的財(cái)務(wù)數(shù)據(jù)中解脫出來,減少財(cái)務(wù)工作人員在高校運(yùn)作和科研方面知識(shí)的短板對(duì)預(yù)算編制工作的負(fù)面影響,同時(shí)也給高校管理層提供了清晰、可靠的決策參考?;跀?shù)據(jù)挖掘技術(shù)的預(yù)算3.1 預(yù)算數(shù)據(jù)預(yù)處理
高校在預(yù)算編制過程中涉及的數(shù)據(jù)種類繁多,在目前高校管理系統(tǒng)暫未進(jìn)行有效整合的現(xiàn)實(shí)環(huán)境下,各部門基本按照歸口上級(jí)部門的要求,應(yīng)用縱向體系下安排的MIS系統(tǒng)或者各分屬行業(yè)應(yīng)用自己符合行業(yè)標(biāo)準(zhǔn)的通用管理系統(tǒng),包括教務(wù)管理系統(tǒng)、人事管理系統(tǒng)、財(cái)務(wù)管理系統(tǒng)、科研管理系統(tǒng)、國有資產(chǎn)管理系統(tǒng)、后勤集團(tuán)下屬各行業(yè)管理系統(tǒng)等。這些MIS系統(tǒng)使用各種數(shù)據(jù)庫管理系統(tǒng)(DBMS)來進(jìn)行業(yè)務(wù)支撐,包括ACCESS,MS SQL Server,Oracle,InterBase等,有些數(shù)據(jù)甚至只是一些表格文檔、Web頁面、平面文件(Flat File)等,這些數(shù)據(jù)只要和高校預(yù)算編制工作有關(guān),就需要通過數(shù)據(jù)預(yù)處理的流程載入預(yù)算編制的數(shù)據(jù)倉庫中。
對(duì)于能夠支持某種標(biāo)準(zhǔn)數(shù)據(jù)接口規(guī)范(比如ODBC)的DBMS,我們只需要在數(shù)據(jù)預(yù)處理工具(Extraction-Transformation-Loading,ETL)中指定源數(shù)據(jù)類型就可以了,一些符合數(shù)據(jù)格式描述的平面文件,也可以通過安裝平面文件提取插件(Flat-File Extraction Plug-in,F(xiàn)EP)來輔助完成,一些缺乏數(shù)據(jù)形式但是具有數(shù)據(jù)意義的平面文件,則需要進(jìn)行人工處理,至少符合ETL標(biāo)準(zhǔn)后通過ETL工具載入預(yù)算數(shù)據(jù)倉庫。
當(dāng)然,在各類預(yù)算相關(guān)數(shù)據(jù)載入預(yù)算倉庫之前,應(yīng)通過ETL提供的數(shù)據(jù)清洗工具對(duì)數(shù)據(jù)進(jìn)行清理,如果不能滿足本校預(yù)算編制規(guī)則,則可以通過一些易于二次開發(fā)的工具,比如Potters Wheel編寫定制的數(shù)據(jù)清理程序。數(shù)據(jù)清理的過程主要包括缺失值處理和降噪處理。處理缺失值的方法一般采用回歸、決策樹、或者貝葉斯推理的方法來生成一個(gè)最可能的值來填充(需注意空值和缺失值的區(qū)別)。降噪處理主要通過分箱、回歸、聚類等方法去除噪聲數(shù)據(jù),通過這兩步處理后,待處理數(shù)據(jù)將變得完整和平滑。
將“光滑”的數(shù)據(jù)載入預(yù)算數(shù)據(jù)倉庫后,可以根據(jù)預(yù)算編制的約束條件對(duì)數(shù)據(jù)進(jìn)行集成、變換、規(guī)約、分層等處理。
在數(shù)據(jù)集成的過程中需要注意到實(shí)體識(shí)別(比如,不同MIS系統(tǒng)中關(guān)于教工編號(hào)的表達(dá))和冗余(比如兩個(gè)字段,一個(gè)是月基本工資,一個(gè)是年基本工資,這兩個(gè)數(shù)據(jù)中的一個(gè)即為冗余數(shù)據(jù))問題。
數(shù)據(jù)規(guī)約操作可以以極為微小損傷的方式高度壓縮數(shù)據(jù)量,在大大提高數(shù)據(jù)挖掘效率的同時(shí)產(chǎn)生相同(或幾乎相同)的分析結(jié)果。主要方法有數(shù)據(jù)立方體聚集、屬性子集選擇、維度規(guī)約、數(shù)值規(guī)約、離散化和概念分層產(chǎn)生等,譬如,一些預(yù)算項(xiàng)目編制時(shí)需要參考上年度整年的支出情況,有些預(yù)算項(xiàng)目編制時(shí)需要根據(jù)高校特征(暑假開學(xué)、寒假開學(xué)、招生季、撥款規(guī)律)等,這些預(yù)算編制時(shí)無需逐月參考上年數(shù)據(jù),可以使用數(shù)據(jù)立方體聚集的方法壓縮數(shù)據(jù),有些屬性,比如教工電話號(hào)碼等,對(duì)預(yù)算編制無意義,可以使用屬性子集選擇的方法過濾數(shù)據(jù),如果某些數(shù)據(jù)經(jīng)過編碼重構(gòu)之后對(duì)信息表達(dá)無損的,可以使用維度規(guī)約的方法(數(shù)學(xué)方法)等。
通過數(shù)據(jù)預(yù)處理,將預(yù)算編制需要的相關(guān)數(shù)據(jù)轉(zhuǎn)換成適合挖掘的數(shù)據(jù)形式后,我們就可以開始從這些數(shù)據(jù)礦藏中挖掘“知識(shí)金礦”了。
3.2 預(yù)算數(shù)據(jù)挖掘
高校預(yù)算編制的過程中需要涉及具有多種特性的支出、收入項(xiàng)目,需要根據(jù)這些項(xiàng)目的特征選擇合適的數(shù)據(jù)挖掘方法,主要的數(shù)據(jù)挖掘方法及其在預(yù)算編制中的應(yīng)用如下。
3.2.1 分類分析
分類分析的方法就是按照預(yù)算項(xiàng)目的特征設(shè)定分類模式,按照分類模式將待分析數(shù)據(jù)劃分為不同的種類,在給定這些數(shù)據(jù)分類標(biāo)示符之后,按照類別僅進(jìn)行分析和匯總,從中提取出有價(jià)值的規(guī)律和知識(shí)。
這種方法在預(yù)算編制決策中可以應(yīng)用于不同辦學(xué)層次收入分析,不同層次人才的科研經(jīng)費(fèi)獲取能力分析,不同專業(yè)招生能力分析,不同類別科研項(xiàng)目經(jīng)費(fèi)支出分析等。
3.2.2 回歸分析
回歸分析的方法反映了某一事務(wù)的屬性值在時(shí)間維度上的變化特征,形成一個(gè)變量或?qū)傩蚤g的函數(shù)關(guān)系,主要研究的是隨著時(shí)間變化的趨勢(shì),研究這個(gè)趨勢(shì)可以對(duì)未來屬性值的變化進(jìn)行預(yù)測,以及發(fā)現(xiàn)時(shí)間維度上這些數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。
這種方法在預(yù)算編制決策中可以應(yīng)用于專業(yè)設(shè)置趨勢(shì)分析(對(duì)于專業(yè)設(shè)置相對(duì)靈活的職業(yè)教育類高校的預(yù)算編制工作尤其重要),能源耗用分析等。
3.2.3 聚類分析
聚類分析的方法是將一組數(shù)據(jù)對(duì)象分成類(簇,Cluster)的過程,使得同一個(gè)簇中的數(shù)據(jù)具有極高的相似性,而不同的簇之間的數(shù)據(jù)對(duì)象具有高度的相異性。適用于事先沒有已知的類別劃分,需要在分析過程中形成相似數(shù)據(jù)聚合并得到簇的數(shù)量和特征。
這種方法在預(yù)算編制決策中可以應(yīng)用于某些項(xiàng)目核算的科目支出賬的分析,比如差旅費(fèi)支出特征,專利費(fèi)支出特征,項(xiàng)目往來賬分析等,從中獲取不同的項(xiàng)目在科目支出方面可能的規(guī)律。
3.2.4 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則的分析方法是分析數(shù)據(jù)項(xiàng)之間存在的關(guān)系的方法,即分析某一事務(wù)中數(shù)據(jù)項(xiàng)的出現(xiàn)或者變化與另一事務(wù)中某一數(shù)據(jù)項(xiàng)的出現(xiàn)或者變化是否具有內(nèi)在聯(lián)系的方法。應(yīng)用這種方法常常能夠找到看似無關(guān)的數(shù)據(jù)之間潛在的有趣的關(guān)聯(lián)關(guān)系。
這種方法在預(yù)算編制決策中可以通過對(duì)收入和支出數(shù)據(jù)之間關(guān)系的分析,找到其中內(nèi)在的規(guī)律,比如可以試著分析科研經(jīng)費(fèi)收入的變化和業(yè)務(wù)招待支出之間在科研經(jīng)費(fèi)預(yù)算流程中是否有某種關(guān)聯(lián),就業(yè)經(jīng)費(fèi)支出和學(xué)費(fèi)收入之間在一般收支預(yù)算執(zhí)行過程中是否有內(nèi)在的聯(lián)系等。
3.2.5 變化和偏差分析
變化和偏差分析方法用于分析分類中的反常實(shí)例和模式的例外,通過分析實(shí)際結(jié)果與預(yù)測之間的偏差找到潛在有趣的規(guī)律,常常用于風(fēng)險(xiǎn)分析。
這種方法在預(yù)算編制決策中用于對(duì)高校上年度預(yù)算執(zhí)行情況中發(fā)生的規(guī)則外情形進(jìn)行分析,比如偶發(fā)的大型支出,比如限制或禁止點(diǎn)招之后對(duì)學(xué)校收入的影響等。
3.3 數(shù)據(jù)挖掘結(jié)果的模式評(píng)估
在選擇以上5種方法對(duì)合適的數(shù)據(jù)進(jìn)行第一次挖掘之后,我們要對(duì)挖掘出來的知識(shí)進(jìn)行評(píng)估,評(píng)價(jià)其對(duì)預(yù)算編制工作是否有用。評(píng)價(jià)基于4條標(biāo)準(zhǔn),即是否易于理解,是否能在另一組相似數(shù)據(jù)上再現(xiàn),是否具有潛在價(jià)值,是否是全新的知識(shí)。在模式評(píng)估中存在一些模式興趣度的客觀度量,包括支持度和置信度兩種評(píng)價(jià)方法,定義為:
support(A=>B)=P(A∪B)
confidence(A=>B)=P(A|B)
其中支持度(support)的意義即在事務(wù)中A項(xiàng)和B項(xiàng)同時(shí)出現(xiàn)的概率,信任度(confidence)即在事務(wù)中出現(xiàn)事務(wù)B的同時(shí),也出現(xiàn)事務(wù)A的概率。
使用支持度和信任度對(duì)模式進(jìn)行評(píng)估后還要根據(jù)需要人工對(duì)挖掘成果進(jìn)行主觀評(píng)價(jià),根據(jù)模式評(píng)估結(jié)果對(duì)數(shù)據(jù)挖掘的有效性進(jìn)行改善,對(duì)數(shù)據(jù)進(jìn)行重新挖掘或者改用其他方法進(jìn)行挖掘。 4 預(yù)算數(shù)據(jù)的數(shù)據(jù)挖掘舉例
使用分類分析中的決策樹算法對(duì)高校不同專業(yè)的招生能力進(jìn)行分析,有利于高校適時(shí)靈活地進(jìn)行專業(yè)調(diào)整,提高招生指標(biāo)的完成度,獲取更多的財(cái)政撥付資金。
決策樹算法是通過構(gòu)造決策樹來發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)含的規(guī)則,一般分兩步來進(jìn)行:第一步,根據(jù)已知領(lǐng)域知識(shí)構(gòu)造決策樹,第二步,根據(jù)模式評(píng)估效果對(duì)決策樹進(jìn)行修剪。經(jīng)過這兩步的操作,產(chǎn)生新穎的知識(shí)。
專業(yè)設(shè)置決策樹生成步驟如下:
(1)按已知的招生不足和招生足對(duì)數(shù)據(jù)進(jìn)行初始分裂
(2)按已知的學(xué)科分類比如社會(huì)科學(xué)類和自然科學(xué)類專業(yè)進(jìn)行第二次分裂。
(3)再按專業(yè)細(xì)分分別對(duì)社會(huì)科學(xué)類和自然科學(xué)類專業(yè)進(jìn)行再次分裂。
(4)生成決策樹。
(5)根據(jù)模式評(píng)估對(duì)分類方法進(jìn)行改進(jìn)或者對(duì)決策樹進(jìn)行修剪,根據(jù)需要從步驟1重新開始。
生成決策樹的例子如圖3 所示。
圖3表明,職業(yè)教育型高校專業(yè)設(shè)置應(yīng)以實(shí)用和就業(yè)為導(dǎo)向,減少純理論性專業(yè)的設(shè)置,提高招生效率,在財(cái)政資金撥付以招生人數(shù)為基準(zhǔn)的情況下,只有這樣才能獲得充足的預(yù)算收入,具體的量化指標(biāo)依賴于對(duì)數(shù)據(jù)的挖掘,需根據(jù)興趣度對(duì)決策樹進(jìn)行判斷和修正。
5 結(jié) 語
隨著新的《事業(yè)單位會(huì)計(jì)制度》和《高等學(xué)校會(huì)計(jì)制度》的出臺(tái),全面預(yù)算和績效預(yù)算成為高校預(yù)算改革的目標(biāo),科學(xué)應(yīng)用數(shù)據(jù)挖掘的方法,對(duì)高校運(yùn)作過程中產(chǎn)生的海量數(shù)據(jù)進(jìn)行多角度、多維度的分析,形成清晰明確的管理決策信息,有利于高校在預(yù)算編制工作中做到兼顧公平與效率,使預(yù)算更好地服務(wù)于高校長遠(yuǎn)規(guī)劃,為高校的科學(xué)發(fā)展提供堅(jiān)實(shí)可靠的數(shù)據(jù)基礎(chǔ)。
主要參考文獻(xiàn)
[1]陸媛.高校預(yù)算績效評(píng)價(jià)的理論研究及績效指標(biāo)體系設(shè)計(jì)[J]. 技術(shù)經(jīng)濟(jì)與管理研究, 2006(1).
[2]張寬. 我國高校預(yù)算管理體系研究[D].湘潭:湘潭大學(xué), 2010.
[3][加]Han J, Kamber M. 數(shù)據(jù)挖掘概念與技術(shù)[M]. 第2版.北京:機(jī)械工業(yè)出版社,2007.