楊軍平 王娟
摘要:經(jīng)濟(jì)社會(huì)的發(fā)展離不開經(jīng)濟(jì)研究與管理工作,數(shù)據(jù)可以準(zhǔn)確反映整個(gè)社會(huì)的經(jīng)濟(jì)運(yùn)行情況,因此,經(jīng)濟(jì)數(shù)據(jù)必須具備真實(shí)性、可信性和時(shí)效性,能夠?yàn)槲覈慕?jīng)濟(jì)發(fā)展提供信息保障。數(shù)據(jù)挖掘技術(shù)正是為了統(tǒng)計(jì)經(jīng)濟(jì)統(tǒng)計(jì)工作更好的開展而出現(xiàn)的。本文首先從統(tǒng)計(jì)數(shù)據(jù)挖掘與經(jīng)濟(jì)研究的關(guān)系及其應(yīng)用與發(fā)展兩個(gè)方面簡要分析,接著就這一新技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)工作中的重要意義和應(yīng)用范圍進(jìn)行了探討,以供相關(guān)人士參考和交流。
關(guān)鍵詞:數(shù)據(jù)挖掘;經(jīng)濟(jì)研究與管理;統(tǒng)計(jì)數(shù)據(jù)
分類號(hào):F273.4
引言:
準(zhǔn)確的提取數(shù)據(jù)信息,提高經(jīng)濟(jì)工作效率是統(tǒng)計(jì)數(shù)據(jù)挖掘重要的研究課題,數(shù)據(jù)挖掘技術(shù)的最大優(yōu)勢(shì)就是能夠從大量的數(shù)據(jù)中發(fā)現(xiàn)有用的信息并利用多種算法和分析軟件對(duì)數(shù)據(jù)進(jìn)行分析和處理,從而解決經(jīng)濟(jì)管理中的實(shí)際問題,數(shù)據(jù)挖掘和經(jīng)濟(jì)統(tǒng)計(jì)調(diào)查工作的結(jié)合對(duì)于促進(jìn)經(jīng)濟(jì)研究與管理工作的發(fā)展具有非常重要的作用。
一、淺析統(tǒng)計(jì)數(shù)據(jù)挖掘在經(jīng)濟(jì)研究與管理中的作用
1.什么是數(shù)據(jù)挖掘?
數(shù)據(jù)挖掘(Data Mining)是采用數(shù)學(xué)的、統(tǒng)計(jì)的、人工智能和神經(jīng)網(wǎng)絡(luò)等領(lǐng)域的科學(xué)方法,如記憶推理、聚類分析、關(guān)聯(lián)分析、決策樹、神經(jīng)網(wǎng)絡(luò)、基因算法等技術(shù),從大量數(shù)據(jù)中挖掘出隱含的、先前未知的、對(duì)決策有潛在價(jià)值的關(guān)系、模式和趨勢(shì),并用這些知識(shí)和規(guī)則建立用于決策支持的模型,提供預(yù)測(cè)性決策支持的方法、工具和過程。當(dāng)然除了以上所列出的還有時(shí)間序列分析等一些其他的功能,數(shù)據(jù)挖掘的各項(xiàng)功能不是獨(dú)立存在的,它們?cè)跀?shù)據(jù)挖掘中互相聯(lián)系,發(fā)揮作用。
2.統(tǒng)計(jì)數(shù)據(jù)挖掘與經(jīng)濟(jì)研究和管理之間的關(guān)系
數(shù)據(jù)挖掘技術(shù)簡單來說指的就是一種可以從海量信息數(shù)據(jù)中,快速、精準(zhǔn)鎖定所需有用信息數(shù)據(jù)的技術(shù)。在未進(jìn)行數(shù)據(jù)挖掘之前,雖然信息數(shù)據(jù)量較為龐大,但其中有許多信息數(shù)據(jù)并不完整,甚至存在諸多錯(cuò)誤信息數(shù)據(jù),而通過使用數(shù)據(jù)挖掘技術(shù),則可以將其中新穎的、有價(jià)值的信息數(shù)據(jù)準(zhǔn)確提取出來,通過對(duì)此類精心篩選出的信息數(shù)據(jù)進(jìn)行深度處理,從而為經(jīng)濟(jì)研究和管理工作提供真實(shí)可靠的數(shù)據(jù)支持。在經(jīng)濟(jì)研究與管理的過程中運(yùn)用數(shù)據(jù)挖掘技術(shù),可以幫助統(tǒng)計(jì)人員快速從眾多未加工的經(jīng)濟(jì)數(shù)據(jù)中篩選出有價(jià)值的統(tǒng)計(jì)數(shù)據(jù),并對(duì)其進(jìn)行深入處理與再加工,為相關(guān)工作人員分析經(jīng)濟(jì)形勢(shì)、判斷經(jīng)濟(jì)走向、制定經(jīng)濟(jì)決策決議等提供重要數(shù)據(jù)參考[1]。此外,由于數(shù)據(jù)挖掘技術(shù)并不只是一種簡單的數(shù)據(jù)分析工具,其可以深入結(jié)合信息使用者的實(shí)際需求,特別是在我國經(jīng)濟(jì)不斷發(fā)展下,經(jīng)濟(jì)數(shù)據(jù)信息量驟增,其對(duì)于經(jīng)濟(jì)統(tǒng)計(jì)技術(shù)的要求也越來越高,將數(shù)據(jù)挖掘技術(shù)運(yùn)用在經(jīng)濟(jì)統(tǒng)計(jì)當(dāng)中,能夠有效保障信息評(píng)估的可靠性,實(shí)現(xiàn)數(shù)據(jù)處理成效的進(jìn)一步優(yōu)化。在運(yùn)用數(shù)據(jù)挖掘技術(shù)完成對(duì)經(jīng)濟(jì)數(shù)據(jù)的深入挖掘與分析處理下,建立起相應(yīng)的數(shù)據(jù)庫,可以在更好地融合各種數(shù)據(jù)信息的基礎(chǔ)上,為經(jīng)濟(jì)管理活動(dòng)需求提供高質(zhì)量服務(wù),有效減輕統(tǒng)計(jì)人員的工作負(fù)荷。
二、統(tǒng)計(jì)數(shù)據(jù)挖掘在經(jīng)濟(jì)研究與管理中的應(yīng)用與發(fā)展
1.數(shù)據(jù)挖掘在經(jīng)濟(jì)研究與管理中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)研究與管理中的應(yīng)用可以大致的分為兩個(gè)方向,分別為描述方向和預(yù)測(cè)方向。描述方向主要包括聚類和描述變量或數(shù)據(jù)間相關(guān)關(guān)系的各種算法,聚類是將相關(guān)關(guān)系較大的變量或個(gè)體聚為一類,預(yù)測(cè)方向主要包括分類和回歸,分類的主要工作是“貼標(biāo)簽”,具體算法有決策樹、人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、SVM、樸素貝葉斯模型等?;貧w不同于分類的是分類是對(duì)離散型數(shù)據(jù)做預(yù)測(cè)而回歸是對(duì)連續(xù)型數(shù)據(jù)做預(yù)測(cè),回歸模型包括線性回歸、多項(xiàng)式回歸、Lasso回歸、嶺回歸等。聚類在經(jīng)濟(jì)研究與管理中最為常見,為了提高調(diào)查精度,在抽樣調(diào)查中可以先將調(diào)查對(duì)象聚類,再從不同類中分別抽取樣本,抽樣調(diào)查中的分層抽樣和整群抽樣都可能用到聚類方法。降維方法也廣泛的應(yīng)用于經(jīng)濟(jì)研究與管理中,由于統(tǒng)計(jì)調(diào)查進(jìn)行一次需要花費(fèi)大量的人力和物力,所以在統(tǒng)計(jì)調(diào)查中指標(biāo)一般較多且詳細(xì)復(fù)雜,這就需要數(shù)據(jù)挖掘中的降維技術(shù)將相關(guān)性大的變量合并在一起,從而使數(shù)據(jù)分析更為簡便清晰,主要的降維方法有主成分法、因子分析法等。現(xiàn)階段降維算法與評(píng)價(jià)算法相結(jié)合已應(yīng)用于經(jīng)濟(jì)評(píng)價(jià)中,正是由于對(duì)數(shù)據(jù)的大量收集、數(shù)據(jù)算法的產(chǎn)生、經(jīng)濟(jì)數(shù)據(jù)庫的出現(xiàn)、先進(jìn)的計(jì)算機(jī)技術(shù)、對(duì)數(shù)據(jù)進(jìn)行精深統(tǒng)計(jì)方法計(jì)算的能力、數(shù)據(jù)訪問速度的提升等一系列東西的出現(xiàn),使得數(shù)據(jù)挖掘技術(shù)的作用越來越廣泛[2]。由于經(jīng)濟(jì)研究與管理中中數(shù)據(jù)的實(shí)用性和準(zhǔn)確性的需要,數(shù)據(jù)挖掘技術(shù)也開始慢慢在經(jīng)濟(jì)研究與管理中中大展身手。
(1)統(tǒng)計(jì)分析法
經(jīng)濟(jì)數(shù)據(jù)庫字段項(xiàng)之間存在兩種關(guān)系,相關(guān)關(guān)系和函數(shù)關(guān)系。就是對(duì)于數(shù)據(jù)庫中的信息利用統(tǒng)計(jì)學(xué)原理來進(jìn)行分析。
(2)決策樹
決策樹一般用于預(yù)測(cè)模型,通過對(duì)大量復(fù)雜無順序的數(shù)據(jù)有目的分類,找到有價(jià)值的信息。同時(shí),正是因?yàn)槊枋龊唵危诸愃俣瓤?,特別適合運(yùn)用于經(jīng)濟(jì)運(yùn)行過程中出現(xiàn)的大規(guī)模數(shù)據(jù)的處理。
(3)遺傳算法
它是一種根據(jù)生物遺傳機(jī)理和自然選擇的隨機(jī)搜索算法,其主要思路是依據(jù)特定的社會(huì)問題,然后在指定對(duì)象中去采集相關(guān)信息,最后通過對(duì)信息中隱含部分的歸整、分析,進(jìn)而得到結(jié)果。經(jīng)濟(jì)問題不是固定不變的,相反它是一個(gè)不斷發(fā)展變化的問題,內(nèi)部的聯(lián)系千絲萬縷,改變其中一項(xiàng)其他的也會(huì)相應(yīng)改變。按照遺傳算法的步驟,從源頭開始,我們就一步步向下探索,去提取信息數(shù)據(jù),對(duì)整體進(jìn)行分析[3],這樣就能把經(jīng)濟(jì)問題目標(biāo)化、具體化、直接化,使得在研究問題時(shí)可以更加直觀,把隱性的表現(xiàn)出來,使得經(jīng)濟(jì)研究與管理中工作更加直白、簡單。
(4)粗集理論法
這是一種探究不確定知識(shí)、不精確的數(shù)學(xué)的工具,它通過上下集比較而出來結(jié)果。它易于操作,算法簡單;簡化輸入信息的表達(dá)空間;不需要給出額外信息,特別適合分析那些不確定的經(jīng)濟(jì)因素。同時(shí)正是因?yàn)榇旨碚摲ǖ倪@種原則,才能使得其與制定經(jīng)濟(jì)決策的需求更加接近。
(5)神經(jīng)網(wǎng)絡(luò)法
神經(jīng)網(wǎng)絡(luò)法是一種高強(qiáng)度模擬人腦加工信息過程的智能現(xiàn)代信息技術(shù)。它和人的神經(jīng)運(yùn)動(dòng)過程一樣,首先進(jìn)行數(shù)據(jù)的輸入,然后進(jìn)行精準(zhǔn)的分析,最后輸出。在經(jīng)濟(jì)研究與管理中過程中得到了實(shí)際的應(yīng)用。神經(jīng)網(wǎng)絡(luò)法為我們提供了一種準(zhǔn)確的、完整的處理經(jīng)濟(jì)研究與管理中的過程,使得經(jīng)濟(jì)運(yùn)行模式和人在處理信息的過程很相像,一樣實(shí)用化、形象化、具體化。使經(jīng)濟(jì)過程中各個(gè)部分之間能取得更好的聯(lián)系,從而獲得對(duì)經(jīng)濟(jì)研究與管理中問題的處理辦法。
2.數(shù)據(jù)挖掘在經(jīng)濟(jì)研究與管理中的發(fā)展
(1)能為經(jīng)濟(jì)研究與管理中提供有效的服務(wù)
數(shù)據(jù)挖掘技術(shù)雖然經(jīng)歷的時(shí)間不是很長,然而,它的研究與應(yīng)用水平已達(dá)到了一種相對(duì)穩(wěn)定的狀態(tài)。隨著科學(xué)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)在各國也普遍受到關(guān)注,特別是在經(jīng)濟(jì)研究與管理中領(lǐng)域。數(shù)據(jù)挖掘技術(shù)能夠這樣的的迅速發(fā)展,在很大程度上也是依賴于它對(duì)經(jīng)濟(jì)研究與管理中的有效服務(wù)。
(2)能夠?yàn)榻?jīng)濟(jì)研究與管理中的不同需要提供不同的服務(wù)
目前,最常見的數(shù)據(jù)挖掘工具主要有綜合工具、通用型工具、和面向特定應(yīng)用的工具。綜合工具,不僅能夠?yàn)樘幱谏虡I(yè)中的經(jīng)濟(jì)體提供有效的管理報(bào)告,并且還能夠?qū)ζ胀ń?jīng)濟(jì)結(jié)構(gòu)中的數(shù)據(jù)信息經(jīng)行深入挖掘。通用型工具在市場(chǎng)上占最大比例,其也是在應(yīng)用方面最為成熟的挖掘工具。面向特定應(yīng)用工具,從字面來理解,這種工具就是針對(duì)特定領(lǐng)域來提供服務(wù)的,具有很強(qiáng)的特定性和針對(duì)性,它能夠有針對(duì)性的對(duì)經(jīng)濟(jì)管理中需要的數(shù)據(jù)進(jìn)行挖掘和分析。
(3)建立宏觀經(jīng)濟(jì)數(shù)據(jù)庫,為數(shù)據(jù)挖掘的應(yīng)用提供了良好的電子平臺(tái)
在目前,全國范圍內(nèi)的大部分經(jīng)濟(jì)研究與管理部門主要使用的還是應(yīng)用統(tǒng)計(jì)系統(tǒng)。大部分經(jīng)濟(jì)研究與管理中的數(shù)據(jù)信息都處于一種不相聚分散的狀態(tài),并沒有形成一套有效的管理系統(tǒng)。經(jīng)濟(jì)研究與管理過程中一旦出現(xiàn)問題,容易導(dǎo)致經(jīng)濟(jì)數(shù)據(jù)的有效性與準(zhǔn)確性受到影響[4]。經(jīng)濟(jì)研究與管理部門可以利用數(shù)據(jù)挖掘基礎(chǔ)建立其相關(guān)的經(jīng)濟(jì)數(shù)據(jù)庫,當(dāng)建立了宏觀經(jīng)濟(jì)數(shù)據(jù)庫以后,以上問題就可以尋找到有效的解決辦法。宏觀經(jīng)濟(jì)數(shù)據(jù)庫與數(shù)據(jù)挖掘技術(shù)的合理運(yùn)用,保證經(jīng)濟(jì)研究與管理部門挖掘到的信息的準(zhǔn)確性和真實(shí),這不僅滿足了現(xiàn)實(shí)中經(jīng)濟(jì)發(fā)展的需要,同時(shí)也為經(jīng)濟(jì)決策的制定提供了準(zhǔn)確、重要的依據(jù)。
三、結(jié)束語
數(shù)據(jù)挖掘技術(shù)在現(xiàn)代經(jīng)濟(jì)研究與管理中占有重要的地位,它是未來統(tǒng)計(jì)工作的一種重要技術(shù),數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)對(duì)數(shù)據(jù)進(jìn)行更深層次的分析和處理,且能有效的提升數(shù)據(jù)分析的質(zhì)量,以幫助決策者做出更好、更正確的決策。及時(shí)更新傳統(tǒng)的經(jīng)濟(jì)統(tǒng)計(jì)方法,擴(kuò)大數(shù)據(jù)挖掘技術(shù)的使用范圍,對(duì)提高統(tǒng)計(jì)的效率,減少統(tǒng)計(jì)時(shí)的成本支出具有重要意義。
參考文獻(xiàn):
[1]劉淑英. 淺談數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用[J]. 經(jīng)濟(jì)研究導(dǎo)刊, 2017, 000(035):176-177.
[2]趙艦波. 數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)中的應(yīng)用探索[J]. 經(jīng)濟(jì)研究導(dǎo)刊, 2018, No.362(12):193-194.
[3]徐婧婧. 基于數(shù)據(jù)挖掘技術(shù)的經(jīng)濟(jì)統(tǒng)計(jì)研究[J]. 中國鄉(xiāng)鎮(zhèn)企業(yè)會(huì)計(jì), 2019(03):298-299.
[3]邢靜. 數(shù)據(jù)挖掘技術(shù)在經(jīng)濟(jì)統(tǒng)計(jì)調(diào)查中的應(yīng)用研究[J]. 現(xiàn)代經(jīng)濟(jì)信息, 2019, 000(010):132.
北斗(青島)導(dǎo)航位置服務(wù)有限公司? 山東省青島市? 266109
楊軍平,男,1987.02,本科,健康電子
王娟,女,1988.02.06,大學(xué)本科,學(xué)士學(xué)位,軟件開發(fā)