張 豪
(上海大學(xué)通信與信息工程學(xué)院,上海 200000)
數(shù)據(jù)挖掘在我國(guó)的發(fā)展已經(jīng)有了幾十年的發(fā)展,但是與國(guó)外的發(fā)達(dá)國(guó)家相比較來(lái)看,我國(guó)的信息化無(wú)論是發(fā)展水平還是發(fā)展速度都要遠(yuǎn)遠(yuǎn)落后。但是,伴隨著我國(guó)社會(huì)經(jīng)濟(jì)的快速發(fā)展,我國(guó)的信息化的水平也開(kāi)始奮起直追,尤其是在很多企業(yè)的管理部門得到了非常充分的利用。在這樣的情況下,數(shù)據(jù)挖掘就成為了關(guān)鍵。通過(guò)對(duì)于信息化的數(shù)據(jù)進(jìn)行深度整合與再利用,不僅能夠保證我國(guó)的企業(yè)管理更加的簡(jiǎn)單高效,而且也能夠進(jìn)一步增強(qiáng)企業(yè)各個(gè)方面的發(fā)展,從而促進(jìn)更高的經(jīng)濟(jì)效益和社會(huì)效益。
由于統(tǒng)計(jì)在我國(guó)的發(fā)展時(shí)間較短,我國(guó)目前對(duì)于數(shù)據(jù)挖掘的認(rèn)識(shí)程度還不夠完善。針對(duì)這一問(wèn)題,必須要加強(qiáng)對(duì)于數(shù)據(jù)挖掘,尤其是在大數(shù)據(jù)信息平臺(tái)環(huán)境下,信息數(shù)據(jù)的處理更加復(fù)雜,對(duì)于信息數(shù)據(jù)的把握也直接影響了企業(yè)的發(fā)展前景。在數(shù)據(jù)挖掘的過(guò)程中,一定要注意信息化水平的提升,增強(qiáng)的地位,促進(jìn)能夠更加提高對(duì)于數(shù)據(jù)的整合與管理,從而幫助管理層提供科學(xué)的決策方案[1]。另外,企業(yè)管理者必須要增強(qiáng)對(duì)于數(shù)據(jù)采納,明確信息數(shù)據(jù)處理的精細(xì)化和深度化,這樣才能夠改善信息質(zhì)量,促進(jìn)企業(yè)內(nèi)部控制制度的有效提升。通過(guò)對(duì)于科學(xué)的審計(jì)方法才能夠增強(qiáng)企業(yè)的經(jīng)濟(jì)發(fā)展,提高企業(yè)整體的工作運(yùn)行效率,減少不必要的資金投入,更好的促進(jìn)企業(yè)又好又快的發(fā)展。
聚類作為數(shù)據(jù)挖掘中主要的方法包括很多種方式,例如分割方法、分層次方法、基于密度方法,基于網(wǎng)格方法。不同的聚類方法都有不同的適用情況,在遇到數(shù)據(jù)挖掘過(guò)程中,特殊的問(wèn)題要特殊分析。一些聚類方法適用于一維數(shù)據(jù)類型,在針對(duì)數(shù)據(jù)深入挖掘的過(guò)程中,一定要掌握聚類方法的適用情況,明確數(shù)據(jù)挖掘的目標(biāo),選擇最合適的聚類方法。由于聚類方法涉及到數(shù)據(jù)之間的距離計(jì)算,通常采用DTW方法和歐式距離算法,不同的算法都有不同的特點(diǎn),同樣也應(yīng)該針對(duì)數(shù)據(jù)類型進(jìn)行恰當(dāng)?shù)倪x擇,一般來(lái)說(shuō)DTW方法計(jì)算非常復(fù)雜。而歐式距離算法效果更好,但歐式距離算法,對(duì)于數(shù)據(jù)描述,遠(yuǎn)不如DTW方法,在分析數(shù)據(jù)類型時(shí),一定要選擇適當(dāng)?shù)木垲愅诰蚍椒?。在選擇聚類方法時(shí),首先明確數(shù)據(jù)類型是一維的還是多維的。針對(duì)不同的數(shù)據(jù)類型,選擇不同的分割方法。在確定方法之后判斷聚類描述情況,對(duì)于描述要求較高,則應(yīng)該采用DTW方法,如果要求效率較高,則應(yīng)該采用歐式距離算法。每一個(gè)方法都有精度之間的差距,效率也會(huì)存在較大區(qū)別,一定要針對(duì)性的進(jìn)行選擇。避免在計(jì)算數(shù)據(jù)的過(guò)程中發(fā)現(xiàn)方法不合適,更改方計(jì)算方法,這樣很容易影響數(shù)據(jù)挖掘的準(zhǔn)確度。在數(shù)據(jù)聚類完成之后。應(yīng)該要針對(duì)算法進(jìn)行優(yōu)化通過(guò)。實(shí)際情況來(lái)選擇計(jì)算精度或者計(jì)算效率。聚類方法能夠根據(jù)不同的指標(biāo)進(jìn)行分析,通過(guò)不同的影響因素進(jìn)行綜合性的考慮。利用SPSS樣本之類的方法,能夠快速的將指標(biāo)因素進(jìn)行歸類,并且通過(guò)計(jì)算結(jié)果還可以總結(jié)各類指標(biāo)的特色。從目前來(lái)看,聚類分析不僅可以用于樣本之類,而且還可以用于變量聚類,例如不同的指標(biāo)就是變量,通過(guò)對(duì)于指標(biāo)的考慮。以及簡(jiǎn)單的提取。能夠快速深入的將所有的變量指標(biāo)進(jìn)行綜合,避免了數(shù)據(jù)信息的丟失。
信息化是現(xiàn)代企業(yè)在不斷發(fā)展的過(guò)程中必須發(fā)展的新技術(shù),對(duì)于數(shù)據(jù)挖掘不僅能夠促進(jìn)企業(yè)經(jīng)濟(jì)效益的提高,而且也能夠在很大程度上減少企業(yè)不必要的投資,規(guī)避風(fēng)險(xiǎn)。但是目前我國(guó)數(shù)據(jù)挖掘還存在很多方面的問(wèn)題,尤其是信息化方面的數(shù)據(jù)挖掘還不夠完善。隨著社會(huì)經(jīng)濟(jì)的快速發(fā)展,企業(yè)與消費(fèi)者之間的關(guān)系也發(fā)生了微妙的轉(zhuǎn)變。在過(guò)去企業(yè)能夠選擇消費(fèi)者,而現(xiàn)在是消費(fèi)者選擇企業(yè)。企業(yè)為了能夠快速的促進(jìn)產(chǎn)品營(yíng)銷的效率,必須針對(duì)用戶需求進(jìn)行深入的分析。通過(guò)聚類方法能夠針對(duì)客戶不同的消費(fèi)特點(diǎn)和消費(fèi)需求進(jìn)行計(jì)算保證對(duì)客戶細(xì)分的效果。通過(guò)聚類計(jì)算能夠針對(duì)客戶的屬性進(jìn)行統(tǒng)計(jì),而且還可以結(jié)合人工智能技術(shù),進(jìn)行深入分析,例如客戶的購(gòu)買動(dòng)機(jī)通常由需求、認(rèn)知、學(xué)習(xí)等因素的影響以及文化社會(huì),家庭、群體等外部因素共同決定。如果針對(duì)不同的用戶需求進(jìn)行劃分,可以將外內(nèi)部因素作為分析變量。然后采用恰當(dāng)?shù)膭×曳绞竭M(jìn)行計(jì)算,能夠保證將數(shù)據(jù)結(jié)果相近的用戶群體進(jìn)行歸類。此外,用戶滿意度能夠直接影響用戶重復(fù)購(gòu)買的機(jī)會(huì)。聚類方法能夠針對(duì)客戶的差異性,進(jìn)行全新的分類,不同的差異變量,作為參考指標(biāo),包括產(chǎn)品利益,客戶相互作用,選擇障礙,議價(jià)能力等方面,通過(guò)將這些分析變量得到有效歸類,能夠?yàn)槠髽I(yè)的營(yíng)銷方案制定積極參考。
本文通過(guò)對(duì)于數(shù)據(jù)挖掘進(jìn)行的分析,以及聚類方法進(jìn)行全面的研究,通過(guò)不同情況選擇不同的聚類方法,能夠有效促進(jìn)數(shù)據(jù)挖掘的效果和水平。并且針對(duì)性的提出解決對(duì)策,通過(guò)數(shù)據(jù)挖掘的聚類計(jì)算方法在企業(yè)營(yíng)銷中進(jìn)行應(yīng)用,為企業(yè)快速的尋找目標(biāo)用戶群體提供了重要的參考標(biāo)準(zhǔn),幫助企業(yè)制定準(zhǔn)確的營(yíng)銷方案,從而更好的幫助我國(guó)企業(yè)的發(fā)展水平。
[1] 陳子健,朱曉亮.基于教育數(shù)據(jù)挖掘的在線學(xué)習(xí)者學(xué)業(yè)成績(jī)預(yù)測(cè)建模研究[J].中國(guó)電化教育,2017(12):75-81+89.