楊勝衛(wèi) 趙璐瑤 孟慧蕓
摘要:在經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中,因其涉及的數(shù)據(jù)量巨大,數(shù)據(jù)統(tǒng)計(jì)工作較為繁瑣,因此一直以來(lái)人們通常采用相關(guān)計(jì)算機(jī)軟件完成經(jīng)濟(jì)統(tǒng)計(jì)工作。為了能夠進(jìn)一步提高經(jīng)濟(jì)統(tǒng)計(jì)結(jié)果的精準(zhǔn)性與統(tǒng)計(jì)效率,本文將從數(shù)據(jù)挖掘的角度出發(fā),在闡明數(shù)據(jù)挖掘技術(shù)基本內(nèi)涵的基礎(chǔ)上,著重圍繞經(jīng)濟(jì)統(tǒng)計(jì)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用進(jìn)行簡(jiǎn)要分析研究。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù) 經(jīng)濟(jì)統(tǒng)計(jì) 信息數(shù)據(jù)
引言:在以往經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中,采用傳統(tǒng)的數(shù)據(jù)處理方式,往往會(huì)因數(shù)據(jù)量較為龐大,而出現(xiàn)數(shù)據(jù)篩選誤差即在統(tǒng)計(jì)分析中篩選出虛假數(shù)據(jù),故而使得最終的經(jīng)濟(jì)統(tǒng)計(jì)結(jié)果缺乏較高的精準(zhǔn)性,數(shù)據(jù)質(zhì)量無(wú)法得到有效保障。因此需要在經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中,靈活使用數(shù)據(jù)挖掘技術(shù),通過(guò)充分發(fā)揮其應(yīng)有效用,以更好地完成經(jīng)濟(jì)統(tǒng)計(jì)工作。
一、數(shù)據(jù)挖掘技術(shù)的簡(jiǎn)要概述
數(shù)據(jù)挖掘技術(shù)簡(jiǎn)單來(lái)說(shuō)指的就是一種可以從海量信息數(shù)據(jù)中,快速、精準(zhǔn)鎖定所需有用信息數(shù)據(jù)的技術(shù)。在未進(jìn)行數(shù)據(jù)挖掘之前,雖然信息數(shù)據(jù)量較為龐大,但其中有許多信息數(shù)據(jù)并不完整,甚至存在諸多錯(cuò)誤信息數(shù)據(jù),而通過(guò)使用數(shù)據(jù)挖掘技術(shù),則可以將其中新穎的、有價(jià)值的信息數(shù)據(jù)準(zhǔn)確提取出來(lái),通過(guò)對(duì)此類精心篩選出的信息數(shù)據(jù)進(jìn)行深度處理,從而為信息統(tǒng)計(jì)工作提供真實(shí)可靠的數(shù)據(jù)支持。
在經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中運(yùn)用數(shù)據(jù)挖掘技術(shù),可以幫助統(tǒng)計(jì)人員快速?gòu)谋姸辔醇庸さ慕?jīng)濟(jì)數(shù)據(jù)中,篩選出有價(jià)值的統(tǒng)計(jì)數(shù)據(jù),并對(duì)其進(jìn)行深入處理與再加工,為相關(guān)工作人員分析經(jīng)濟(jì)形勢(shì)、判斷經(jīng)濟(jì)走向、制定經(jīng)濟(jì)決策決議等提供重要數(shù)據(jù)參考。此外,由于數(shù)據(jù)挖掘技術(shù)并不只是一種簡(jiǎn)單的數(shù)據(jù)分析工具,其可以深入結(jié)合信息使用者的實(shí)際需求,特別是在我國(guó)經(jīng)濟(jì)不斷發(fā)展下,經(jīng)濟(jì)數(shù)據(jù)信息量驟增,其對(duì)于經(jīng)濟(jì)統(tǒng)計(jì)的要求也越來(lái)越高。因此將數(shù)據(jù)挖掘技術(shù)運(yùn)用在經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中,能夠有效保障信息評(píng)估的可靠性,實(shí)現(xiàn)數(shù)據(jù)處理成效的進(jìn)一步優(yōu)化。在運(yùn)用數(shù)據(jù)挖掘技術(shù)完成對(duì)經(jīng)濟(jì)數(shù)據(jù)的深入挖掘與分析處理下,建立起相應(yīng)的數(shù)據(jù)庫(kù),可以在更好地融合各種數(shù)據(jù)信息的基礎(chǔ)上,為經(jīng)濟(jì)管理活動(dòng)需求提供高質(zhì)量服務(wù),從根本上避免出現(xiàn)重復(fù)性的統(tǒng)計(jì)工作,以有效減輕統(tǒng)計(jì)人員的工作負(fù)荷。
二、經(jīng)濟(jì)統(tǒng)計(jì)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用分析
(一)數(shù)據(jù)預(yù)處理。在將數(shù)據(jù)挖掘技術(shù)運(yùn)用在經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中時(shí),首先需要對(duì)現(xiàn)有的經(jīng)濟(jì)數(shù)據(jù)進(jìn)行預(yù)處理,這主要是由于在經(jīng)濟(jì)統(tǒng)計(jì)中搜集得到的各種經(jīng)濟(jì)數(shù)據(jù),屬于初始數(shù)據(jù),其中混雜著部分錯(cuò)誤和虛假數(shù)據(jù),以及不完整數(shù)據(jù)。對(duì)經(jīng)濟(jì)數(shù)據(jù)進(jìn)行預(yù)處理,其根本目的在于快速篩出存在于經(jīng)濟(jì)數(shù)據(jù)集當(dāng)中,與經(jīng)濟(jì)統(tǒng)計(jì)工作無(wú)關(guān)的信息數(shù)據(jù),只精準(zhǔn)提取出經(jīng)濟(jì)統(tǒng)計(jì)分析所需的重要數(shù)據(jù)。例如在某地區(qū)的經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中,在對(duì)該地區(qū)歷年企業(yè)上報(bào)的基礎(chǔ)經(jīng)濟(jì)數(shù)據(jù)進(jìn)行集中整理后,可以采用均值法進(jìn)行經(jīng)濟(jì)數(shù)據(jù)的預(yù)處理。即企業(yè)上報(bào)的基礎(chǔ)經(jīng)濟(jì)數(shù)據(jù)中如果有數(shù)據(jù)點(diǎn)屬于空值或是噪聲數(shù)據(jù),則通過(guò)對(duì)存在的噪聲數(shù)據(jù)、空值進(jìn)行均值處理,使用數(shù)據(jù)庫(kù)當(dāng)中該屬性全部已知屬性均值進(jìn)行空缺添補(bǔ),可以有效保障后續(xù)經(jīng)濟(jì)基礎(chǔ)數(shù)據(jù)挖掘以及統(tǒng)計(jì)分析工作的順利進(jìn)行,并由此獲得具有高精準(zhǔn)性的經(jīng)濟(jì)統(tǒng)計(jì)分析數(shù)據(jù)。
(二)建立決策樹。在完成經(jīng)濟(jì)數(shù)據(jù)的預(yù)處理之后,需要建立相應(yīng)的決策樹。具體來(lái)說(shuō),在經(jīng)濟(jì)統(tǒng)計(jì)中運(yùn)用數(shù)據(jù)挖掘技術(shù),建立決策樹時(shí),工作人員首先需要利用訓(xùn)練集完成決策樹的初步建立,而后借助專門的決策樹算法對(duì)建立起的決策樹進(jìn)行簡(jiǎn)化。此時(shí)所建立的模型即為數(shù)據(jù)輸出分析模型,隨后經(jīng)濟(jì)統(tǒng)計(jì)工作人員需要對(duì)建立起的決策樹進(jìn)行充分利用,對(duì)相關(guān)經(jīng)濟(jì)數(shù)據(jù)進(jìn)行準(zhǔn)確分類與深入分析。按照從決策樹根本開始逐漸延伸至決策樹各枝干部分的順序,直至數(shù)據(jù)與既定條件相符合后才可終止分割。值得注意的是,如果同時(shí)進(jìn)行兩個(gè)分割,且分割點(diǎn)上的數(shù)據(jù)完全相同,此時(shí)將會(huì)自動(dòng)終止分割,即順利完成決策。如果數(shù)據(jù)本身無(wú)分類屬性,但可以繼續(xù)分割輸入的經(jīng)濟(jì)數(shù)據(jù),則此時(shí)需要停止分割。在經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中,可以根據(jù)該地區(qū)歷年企業(yè)上報(bào)的數(shù)據(jù),構(gòu)建起與各企業(yè)相對(duì)應(yīng)的序列模式,通過(guò)利用數(shù)據(jù)挖掘技術(shù)對(duì)企業(yè)預(yù)測(cè)值進(jìn)行計(jì)算,將企業(yè)預(yù)測(cè)值與企業(yè)歷年上報(bào)的實(shí)際經(jīng)濟(jì)數(shù)據(jù)進(jìn)行對(duì)比,由此獲得差別率。此后統(tǒng)計(jì)人員可以對(duì)獲得的差別率進(jìn)行一次分類,如按照差別率的占比大小,依次將其分成A、B、c三類,其中A類差別率在20%以上,B類數(shù)據(jù)中差別率在10%至20%之間,c類數(shù)據(jù)中的差別率則不足10%。
(三)進(jìn)一步調(diào)查。在使用數(shù)據(jù)挖掘技術(shù)進(jìn)行某地區(qū)經(jīng)濟(jì)統(tǒng)計(jì)時(shí),經(jīng)濟(jì)統(tǒng)計(jì)人員在立足本地區(qū)企業(yè)歷年上報(bào)數(shù)據(jù)的基礎(chǔ)上,通過(guò)充分結(jié)合企業(yè)規(guī)模變化率以及是否有重大經(jīng)營(yíng)事件曾經(jīng)發(fā)生于企業(yè)內(nèi)部,判斷此時(shí)是否需要繼續(xù)進(jìn)行先一步調(diào)查分析。具體來(lái)說(shuō),如果根據(jù)數(shù)據(jù)挖掘結(jié)果顯示,企業(yè)規(guī)模變化差異率較大,但并未超過(guò)合理范圍,則無(wú)需進(jìn)行下一步調(diào)查從而獲取更加可靠的有效經(jīng)濟(jì)信息。如果企業(yè)規(guī)模變化差異率超過(guò)規(guī)定值,或是企業(yè)規(guī)模變化差異率極小,且企業(yè)確實(shí)曾經(jīng)發(fā)生過(guò)重大經(jīng)營(yíng)事件,此時(shí)需要經(jīng)濟(jì)統(tǒng)計(jì)人員展開下一步調(diào)查分析,從而更加深入地了解企業(yè)及本地區(qū)存在的經(jīng)濟(jì)問(wèn)題,以便可以制定出更加具有針對(duì)性和有效性的經(jīng)濟(jì)決策決議,在確保經(jīng)濟(jì)統(tǒng)計(jì)結(jié)果的完整性與可靠性的同時(shí),對(duì)企業(yè)規(guī)模變化差異率進(jìn)行合理調(diào)整,達(dá)到幫助企業(yè)提高自身核心競(jìng)爭(zhēng)力,擴(kuò)大經(jīng)濟(jì)效益規(guī)模,最終實(shí)現(xiàn)推動(dòng)本地區(qū)經(jīng)濟(jì)長(zhǎng)效發(fā)展的目的。
結(jié)束語(yǔ):綜上所述,在經(jīng)濟(jì)統(tǒng)計(jì)中運(yùn)用數(shù)據(jù)挖掘技術(shù),不僅有助于實(shí)現(xiàn)經(jīng)濟(jì)數(shù)據(jù)資源的有效擴(kuò)展,同時(shí)也可以為判斷經(jīng)濟(jì)局勢(shì)與經(jīng)濟(jì)發(fā)展走向等提供真實(shí)可靠的數(shù)據(jù)支持。因此在實(shí)際運(yùn)用數(shù)據(jù)挖掘技術(shù)進(jìn)行經(jīng)濟(jì)統(tǒng)計(jì)分析的過(guò)程中,相關(guān)工作人員需要有意識(shí)地對(duì)獲取的經(jīng)濟(jì)數(shù)據(jù)進(jìn)行預(yù)處理,并建立起相應(yīng)的決策樹,在完成經(jīng)濟(jì)數(shù)據(jù)科學(xué)分類并確定具體調(diào)查對(duì)象的基礎(chǔ)上,對(duì)挖掘提取出的有價(jià)值的經(jīng)濟(jì)數(shù)據(jù)進(jìn)行深入統(tǒng)計(jì)分析,從而更好地為經(jīng)濟(jì)管理活動(dòng)提供所需服務(wù)。