鄭迎宵
【摘要】數(shù)據(jù)挖掘技術(shù)在企業(yè)發(fā)展中越來越受到重視,但企業(yè)生產(chǎn)數(shù)據(jù)都具有復(fù)雜數(shù)據(jù)的特征,常規(guī)的數(shù)據(jù)分析不能深入挖掘出生產(chǎn)規(guī)律,因此需要先進(jìn)的數(shù)據(jù)挖掘工具。本文結(jié)合IOS智能優(yōu)化系統(tǒng)軟件分析了數(shù)據(jù)挖掘技術(shù),為數(shù)據(jù)挖掘技術(shù)進(jìn)一步在企業(yè)生產(chǎn)中應(yīng)用做探索性研究。
【關(guān)鍵詞】數(shù)據(jù)挖掘? IOS智能優(yōu)化系統(tǒng)? 研究
隨著計算機(jī)技術(shù)和數(shù)據(jù)挖掘技術(shù)的快速發(fā)展,數(shù)據(jù)挖掘技術(shù)為處理、分析企業(yè)數(shù)據(jù)提供了科學(xué)高效的解決手段。利用現(xiàn)有的歷史數(shù)據(jù)對企業(yè)生產(chǎn)建設(shè)進(jìn)行合理規(guī)劃,為提高企業(yè)經(jīng)濟(jì)效益提供信息技術(shù)上的保證。
一、數(shù)據(jù)挖掘技術(shù)及方法
數(shù)據(jù)挖掘(Data Mining)技術(shù)是從大量的、不完全的、有噪聲的、隨機(jī)的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的,人們事先不知道的、但又有潛在價值的規(guī)律和知識的過程。數(shù)據(jù)挖掘是一門新興的交叉學(xué)科,匯集了數(shù)理統(tǒng)計、機(jī)器學(xué)習(xí)、模式識別、人工智能和數(shù)據(jù)庫等學(xué)科的內(nèi)容。經(jīng)歷二十多年的發(fā)展,結(jié)合統(tǒng)計學(xué)、數(shù)據(jù)庫、機(jī)器學(xué)習(xí)等技術(shù),數(shù)據(jù)挖掘已經(jīng)成為一個自成體。
數(shù)據(jù)挖掘技術(shù)必須通過多種計算方法加以實現(xiàn),目前主要有統(tǒng)計回歸(Regression)、人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network)、支持向量機(jī) (Support Vector Machine) 、模式識別(Pattern recognition)等。其中模式識別方法包括模式識別的具體算法更是豐富,一般而言,有:主成分分析(PCA)、白化變換(LMAP)、最優(yōu)判別平面方法(ODP)、相似分析法(SIMCA)、聚類分析方法、線性及非線性映照、線性及非線性逆映照等等。
二、數(shù)據(jù)挖掘工具
微軟成立了相應(yīng)的研究中心進(jìn)行這方面的工作。META Group曾做出這樣的評論,“全球重要的企業(yè)、組織會發(fā)現(xiàn),到21世紀(jì)數(shù)據(jù)挖掘技術(shù)將是他們商業(yè)成功與否的至關(guān)重要的影響因素”。兩大統(tǒng)計軟件公司SAS和SPSS也推出了各自的數(shù)據(jù)挖掘工具Enterprise Miner和Clementine。
目前,第4代的產(chǎn)品目前較少。由上海恒陽數(shù)據(jù)技術(shù)有限公司和上海大學(xué)計算機(jī)化學(xué)研究室聯(lián)合開發(fā)的IOS智能優(yōu)化系統(tǒng)軟件是國內(nèi)具有自主知識產(chǎn)權(quán)的數(shù)據(jù)挖掘軟件之一,是第4代產(chǎn)品中先進(jìn)的、功能全面的數(shù)據(jù)挖掘軟件。
三、IOS智能優(yōu)化系統(tǒng)軟件
(一)IOS智能優(yōu)化系統(tǒng)數(shù)據(jù)處理流程
處理企業(yè)生產(chǎn)中的復(fù)雜數(shù)據(jù),需要清晰的數(shù)據(jù)處理流程。IOS智能優(yōu)化系統(tǒng)軟件在據(jù)挖掘技術(shù)過程中有其特定的數(shù)據(jù)處理流程,如圖1所示。
(二)IOS智能優(yōu)化系統(tǒng)軟件數(shù)據(jù)挖掘算法
不同的數(shù)據(jù)應(yīng)該用不同的數(shù)據(jù)挖掘方法進(jìn)行分析,才有可能挖掘出有價值的規(guī)律。IOS智能優(yōu)化系統(tǒng)軟件不僅提供了常規(guī)的數(shù)據(jù)挖掘方法,如PCA,F(xiàn)isher,PLS、ANN、SVM,而且在長期的實踐中開發(fā)了一些獨特的、新穎的數(shù)據(jù)挖掘方法,如獨有的模式識別最佳投影識別方法、獨有的超多面體模式識別建模方法、獨有的逐級投影模式識別建模方法、獨有的模式識別最佳投影回歸方法、多種數(shù)據(jù)挖掘相結(jié)合的方法。IOS智能優(yōu)化系統(tǒng)軟件的多種數(shù)據(jù)挖掘可全面的、深入的對復(fù)雜的數(shù)據(jù)進(jìn)行定量、定性分析。
四、結(jié)語
數(shù)據(jù)挖掘在采油工程中的應(yīng)用有其自身的優(yōu)勢,必須將專業(yè)知識和挖掘人員的專業(yè)知識結(jié)合,收集大量的數(shù)據(jù),反復(fù)實踐,才能形成一個真正實用的系統(tǒng)。數(shù)據(jù)挖掘技術(shù)對企業(yè)未來的發(fā)展,必將起到輔助實際工作的決策作用。
參考文獻(xiàn):
[1]孟慶民.數(shù)據(jù)挖掘技術(shù)在氣田壓裂效果評價中的應(yīng)用[J].中國石油大學(xué)學(xué)報(自然科學(xué)版),2018,32(5):165-169.
[2]龐劍鋒,卜東波,白碩.基于向量空間模型的文本自動分類系統(tǒng)的研究與實現(xiàn)[J].計算機(jī)應(yīng)用研究,2016,18 (9):23-26.