馬長青
摘 要:近些年來經(jīng)濟(jì)發(fā)展速度快,工作量也大幅度增加。工作中面臨的統(tǒng)計數(shù)據(jù)更是有很大的數(shù)量。因此經(jīng)濟(jì)統(tǒng)計工作便成為了十分重要的工作內(nèi)容。要做好經(jīng)濟(jì)統(tǒng)計工作,就需要正確的認(rèn)識到這個工作的重要性。同時還要深刻的認(rèn)識數(shù)據(jù)挖掘技術(shù),并且了解數(shù)據(jù)挖掘技術(shù)的特點。然后才可以將經(jīng)濟(jì)挖掘技術(shù)更好地應(yīng)用在經(jīng)濟(jì)統(tǒng)計中。本文分析了技術(shù)挖掘技術(shù)的內(nèi)涵和特點,然后探討了數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);經(jīng)濟(jì)統(tǒng)計;集成化處理
在經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)庫中有著數(shù)量很大的數(shù)據(jù)。而大部分?jǐn)?shù)據(jù)是通過數(shù)理統(tǒng)計知識來對其進(jìn)行利用。這樣的方法導(dǎo)致的是形式上的單一和深度上的淺薄。所做的工作僅僅是對目前已有資料的保存和整理。在數(shù)據(jù)挖掘技術(shù)的經(jīng)濟(jì)統(tǒng)計過程中如果只是靠這樣的傳統(tǒng)的經(jīng)濟(jì)統(tǒng)計方法來工作是難以對這類數(shù)據(jù)進(jìn)行準(zhǔn)確的分析。因此要將數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中更加廣泛的應(yīng)用。通過數(shù)據(jù)挖掘技術(shù)可以使經(jīng)濟(jì)統(tǒng)計所得的數(shù)據(jù)變得更加有廣度和有深度。對數(shù)據(jù)的分析也可以更加的準(zhǔn)確。從而使得數(shù)據(jù)的質(zhì)量得到提高。獲取的信息也更加的準(zhǔn)確和廣泛。
一、數(shù)據(jù)挖掘技術(shù)的含義
數(shù)據(jù)挖掘技術(shù)是一門具有多個學(xué)科交叉特征的技術(shù)。其內(nèi)容不僅僅包括數(shù)據(jù)統(tǒng)計和數(shù)據(jù)庫,而且還包括機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等。在統(tǒng)計行業(yè)中應(yīng)用的范圍很廣。數(shù)據(jù)挖掘技術(shù)是將大量的數(shù)據(jù)進(jìn)行分析和整理,從中找到具有價值的信息。然后再對其進(jìn)行分析。將大量并且復(fù)雜的信息進(jìn)行整理,使其變的規(guī)范和有價值。數(shù)據(jù)挖掘技術(shù)能夠讓經(jīng)濟(jì)統(tǒng)計從業(yè)人員和數(shù)據(jù)的使用者在獲取數(shù)據(jù)信息時更加的便利。數(shù)據(jù)挖掘技術(shù)對大量的原始數(shù)據(jù)進(jìn)行不同程度的加工,讓這些數(shù)據(jù)變?yōu)橛袃r值的數(shù)據(jù),去除了原始數(shù)據(jù)的模糊性、隨機(jī)性、不完全性等缺點。
二、據(jù)挖掘技術(shù)的特點
數(shù)據(jù)挖掘技術(shù)可以處理大量原始數(shù)據(jù),使其變得更加有價值。數(shù)據(jù)挖掘技術(shù)具有以下幾個特點。
(一)數(shù)據(jù)挖掘技術(shù)可以從容的面對大量增長的經(jīng)濟(jì)統(tǒng)計數(shù)據(jù)。數(shù)據(jù)統(tǒng)挖掘技術(shù)可以不斷地擴(kuò)大自身的數(shù)據(jù)庫。從而使搜索需求達(dá)到滿足。還可以不斷提高在搜索過程中查找數(shù)據(jù)的準(zhǔn)確性。可以使使用者更加快速的找到所需要的數(shù)據(jù)。
(二)數(shù)據(jù)挖掘技術(shù)可以對使用者輸入的關(guān)鍵詞進(jìn)行聯(lián)想搜索。對不確定搜索內(nèi)容的使用者有了更加便利的搜索方法。并且可以將使用者所輸入的內(nèi)容查找出的信息進(jìn)行有序的排列。
(三)數(shù)據(jù)挖掘技術(shù)可以在數(shù)據(jù)庫的大量信息中找到數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)。然后聯(lián)系起其他各方面的數(shù)據(jù),從而進(jìn)行預(yù)測未來的經(jīng)濟(jì)發(fā)展方向。
(四)數(shù)據(jù)挖掘技術(shù)可以處理的數(shù)據(jù)非常巨大。面對大量的數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)也可以從容的對其進(jìn)行處理。
三、數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)不僅可以從大量的原始數(shù)據(jù)中準(zhǔn)確的找到具有代表性并且真實的數(shù)據(jù),還可以對這些數(shù)據(jù)進(jìn)行合理、有效的處理,使其變得有價值。數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的運(yùn)用越來越廣泛。并且自身的技術(shù)也在不斷完善。數(shù)據(jù)挖掘技術(shù)的主要應(yīng)用方式有以下幾種。
(一)集成化處理應(yīng)用
數(shù)據(jù)集成的含義是對大量不同的數(shù)據(jù)進(jìn)行整理。使其由復(fù)雜、雜亂變的規(guī)范和具有整體性。經(jīng)濟(jì)在不斷發(fā)展,信息的來源也變得更加廣泛,由此收集到的數(shù)據(jù)也越來越多,內(nèi)容也越來越復(fù)雜。從而導(dǎo)致的是數(shù)據(jù)集成變得更加困難。而且數(shù)據(jù)的來源也具有多種途徑,不僅僅是官方的統(tǒng)計,還有其他的來源,這就使得所收集到的數(shù)據(jù)具有多種模式。將大量的原始數(shù)據(jù)進(jìn)行處理時期,使其變的精簡和有效。讓數(shù)據(jù)庫的大小保持在較小的水平。才可以讓數(shù)據(jù)使用者和相關(guān)單位在使用數(shù)據(jù)時更加方便。
(二)預(yù)處理方法
對經(jīng)濟(jì)數(shù)據(jù)進(jìn)行預(yù)處理是經(jīng)濟(jì)統(tǒng)計過程中較為基礎(chǔ)的一種方法。數(shù)據(jù)挖掘技術(shù)是在基礎(chǔ)信息的前提下對數(shù)據(jù)進(jìn)行整理和分析。而無法替代經(jīng)濟(jì)數(shù)據(jù)收集系統(tǒng)的功能。因此經(jīng)濟(jì)數(shù)據(jù)收集系統(tǒng)收集到的數(shù)據(jù)要進(jìn)行預(yù)處理才可以讓數(shù)據(jù)挖掘系統(tǒng)在此前提和基礎(chǔ)下進(jìn)行工作。預(yù)處理的內(nèi)容包括將數(shù)據(jù)中偏差較大、不準(zhǔn)確、不真實的數(shù)據(jù)進(jìn)行去除。處理這些數(shù)據(jù)的方法叫作數(shù)據(jù)清理。數(shù)據(jù)清理也包括多種方法,例如:預(yù)測法、平滑法、均值法等。均值法是現(xiàn)代分析技術(shù)中的一種應(yīng)用形式。均值法的應(yīng)用范圍是當(dāng)原始數(shù)據(jù)有一個數(shù)據(jù)為空值或者是數(shù)據(jù)是噪聲數(shù)據(jù)時。利用均值法對其進(jìn)行處理。具體的方法是將數(shù)據(jù)庫中已知的屬性填入原始數(shù)據(jù)的空缺中。然后使數(shù)據(jù)挖掘系統(tǒng)在分析時具有完整的數(shù)據(jù),從而提高數(shù)據(jù)的準(zhǔn)確度。
(三)決策樹方式應(yīng)用
數(shù)據(jù)挖掘技術(shù)對原始數(shù)據(jù)進(jìn)行分析整理后輸出便于使用者利用的數(shù)據(jù)信息。這些輸出數(shù)據(jù)的有效形式可以由決策樹的方式進(jìn)行表現(xiàn)。首先決策樹將輸出的數(shù)據(jù)信息進(jìn)行整理分類,然后再以樹狀圖的方式進(jìn)行表達(dá)。決策樹方式可以構(gòu)建出明確的體系,將數(shù)據(jù)進(jìn)行分類和排序,并準(zhǔn)確地挑選出使用者所需信息。當(dāng)決策樹中的數(shù)據(jù)進(jìn)行多次分類,達(dá)到最終目的使標(biāo)志的決策樹的數(shù)據(jù)分布完成。當(dāng)然決策樹整個完成后,要對決策樹進(jìn)行再一次修整。主要內(nèi)容是去掉不相關(guān)的數(shù)據(jù),使整個決策樹變得更加統(tǒng)一。
(四)轉(zhuǎn)換方法應(yīng)用
使用某種方法使數(shù)據(jù)變?yōu)闈M足數(shù)據(jù)挖掘進(jìn)行的形式,這個過程指的是數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)轉(zhuǎn)換要將數(shù)據(jù)變得更加規(guī)范,同時還要將數(shù)據(jù)泛化,即將高層次的數(shù)據(jù)信息替代低層次的數(shù)據(jù)信息。除此之外,還要對數(shù)據(jù)進(jìn)行連續(xù)進(jìn)行處理。由于連續(xù)性處理的方法比較困難。所以可以采用概念分層,即將數(shù)據(jù)進(jìn)行劃分,然后將某些數(shù)據(jù)用代號來表示從而達(dá)到減少數(shù)據(jù)收集的量。
結(jié)語
將經(jīng)濟(jì)挖掘技術(shù)更好地應(yīng)用在經(jīng)濟(jì)統(tǒng)計中,要做好經(jīng)濟(jì)統(tǒng)計工作,正確的認(rèn)識到這個工作的重要性,同時還要深刻的認(rèn)識數(shù)據(jù)挖掘技術(shù)并且了解數(shù)據(jù)挖掘技術(shù)的特點。通過數(shù)據(jù)挖掘技術(shù)使數(shù)據(jù)的質(zhì)量得到提高,獲取的信息也更加的準(zhǔn)確和廣泛。
參考文獻(xiàn):
[1] 辛金國,柯? 芳,李紹君,et al.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用探索[J].統(tǒng)計與決策,2009(9):24-27.
[2] 楊梅冰,梁思思.關(guān)于數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計中的應(yīng)用[J].時代金融,2015(24):173-175.