任海燕
摘 要 云計(jì)算在當(dāng)前的計(jì)算機(jī)技術(shù)發(fā)展中是熱度很高的話題,對(duì)于它的具體定義描述,到目前還沒(méi)有一個(gè)較為權(quán)威統(tǒng)一的標(biāo)準(zhǔn)。從它的結(jié)構(gòu)構(gòu)成來(lái)講,它是一種新興的共享基礎(chǔ)架構(gòu)和方法,它的開(kāi)展基礎(chǔ)是公開(kāi)的標(biāo)準(zhǔn)和服務(wù),圍繞互聯(lián)網(wǎng)為中心來(lái)提供相關(guān)服務(wù),它在當(dāng)前社會(huì)的大多數(shù)領(lǐng)域都有了廣泛的應(yīng)用和體現(xiàn),涉及到諸多的領(lǐng)域,需要在具體應(yīng)用時(shí)進(jìn)行綜合全面的把握,基于此,本文就在分析云計(jì)算開(kāi)放環(huán)境和系統(tǒng)的關(guān)鍵研發(fā)基礎(chǔ)上,對(duì)云計(jì)算模式下的數(shù)據(jù)挖掘平臺(tái)原型建立進(jìn)行了分析,闡述了平臺(tái)在實(shí)際應(yīng)用中的擴(kuò)展性和通用性,可以給相關(guān)領(lǐng)域的研究學(xué)者提供參考作用。
【關(guān)鍵詞】云計(jì)算 數(shù)據(jù)挖掘 應(yīng)用 有效性
隨著社會(huì)發(fā)展的不斷進(jìn)步,對(duì)于數(shù)據(jù)挖掘系統(tǒng)的建立和研發(fā)工作也取得了一定的成效,雖然國(guó)內(nèi)外研究學(xué)者已經(jīng)研發(fā)出了多種形式的數(shù)據(jù)挖掘系統(tǒng),但是都或多或少的存在著一些缺陷和不足,像價(jià)格成本高、復(fù)雜繁瑣等。在新形勢(shì)下,隨著云計(jì)算模式的出現(xiàn),它為大量數(shù)據(jù)的分析提供了一種快捷低價(jià)的應(yīng)對(duì)方案,使數(shù)據(jù)挖掘平臺(tái)的建立有了可行性的趨勢(shì),云計(jì)算從實(shí)質(zhì)上來(lái)說(shuō),它是一種在計(jì)算機(jī)網(wǎng)絡(luò)結(jié)構(gòu)下的超級(jí)計(jì)算模式,具有存儲(chǔ)能力強(qiáng)、計(jì)算能力可彈性明顯等的特點(diǎn),可以有效的實(shí)現(xiàn)大量數(shù)據(jù)挖掘的工作。
1 云計(jì)算的綜述
云計(jì)算的實(shí)質(zhì)是一種計(jì)算服務(wù),它是由計(jì)算資源和軟件以及其他各種信息資源共同構(gòu)成的,它可以在網(wǎng)絡(luò)技術(shù)的支持下,脫離空間的限制,使用計(jì)算機(jī)或者是其他相關(guān)設(shè)備等來(lái)進(jìn)行終端的訪問(wèn)。云計(jì)算中的“云”是一個(gè)并行和分布式的系統(tǒng),它的構(gòu)成是由互相牽連的虛擬計(jì)算機(jī)實(shí)現(xiàn)的,可以實(shí)現(xiàn)被動(dòng)的部署,最后作為一個(gè)或多個(gè)統(tǒng)一計(jì)算資源來(lái)體現(xiàn),它的服務(wù)形式是基于服務(wù)運(yùn)營(yíng)商和用戶兩者之間進(jìn)行協(xié)商的服務(wù)等級(jí)協(xié)議,并在這個(gè)協(xié)議下提供服務(wù)。此外,從另一層面來(lái)說(shuō),它還是一個(gè)彈性空間很大的資源執(zhí)行環(huán)境,關(guān)系到諸多的利益方,并對(duì)其提供可以進(jìn)行計(jì)量的服務(wù),筆者所講的云屬于是基礎(chǔ)平臺(tái),可以以多種形式在不同的資源上進(jìn)行執(zhí)行。
2 數(shù)據(jù)挖掘技術(shù)
當(dāng)前形勢(shì)下數(shù)據(jù)挖掘技術(shù)已經(jīng)得到了實(shí)際應(yīng)用,主要涉及到關(guān)聯(lián)規(guī)則、分類、聚類以及預(yù)測(cè)和序列模式。
2.1 關(guān)聯(lián)規(guī)則
它分為兩個(gè)類型,一是Apriori算法;二是頻繁模式增長(zhǎng)算法。那么任何一種模式的發(fā)現(xiàn)都是在同一個(gè)交易數(shù)據(jù)庫(kù)中的特定項(xiàng)目和其他項(xiàng)目之間的關(guān)系基礎(chǔ)上。
2.2 分類
它是一種利用數(shù)學(xué)方法來(lái)完成的技術(shù),包括線性規(guī)劃、神經(jīng)網(wǎng)絡(luò)等。在進(jìn)行分類的過(guò)程中在軟件作用下可以掌握數(shù)據(jù)項(xiàng)分組的方法。
2.3 聚類
聚類技術(shù)也對(duì)類和類中的對(duì)象進(jìn)行了闡述,在這種技術(shù)下,相同類型的數(shù)據(jù)可以規(guī)劃到一起,并有明確的標(biāo)注,便于查找應(yīng)用。
2.4 預(yù)測(cè)
預(yù)測(cè)主要用于發(fā)現(xiàn)自變量之間及其和因變量之間的關(guān)系,那么實(shí)際案例中,可以把銷售額作為自變量,利潤(rùn)為因變量,進(jìn)而預(yù)測(cè)到未來(lái)的銷售利潤(rùn)。
2.5 序列模式
它是一種在事件發(fā)生的時(shí)間順序上相關(guān)的數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)的模式主要用于各種不同數(shù)據(jù)之間關(guān)系的深層化分析研究。例如2010年,Kawuu W.Lin等所提出的多任務(wù)頻繁模式挖掘的策略。
3 云計(jì)算環(huán)境下的數(shù)據(jù)挖掘優(yōu)勢(shì)分析
在云計(jì)算環(huán)境下來(lái)進(jìn)行數(shù)據(jù)的挖掘工作,這在當(dāng)前形勢(shì)發(fā)展下是具有重要作用的,這與云計(jì)算環(huán)境的特性是由很大關(guān)系的,那么在云計(jì)算環(huán)境下來(lái)分析數(shù)據(jù)挖掘工作的優(yōu)勢(shì)就可以從下三方面來(lái)闡述:
(1)一般來(lái)說(shuō),數(shù)據(jù)挖掘是大量的,規(guī)模較大,需要從大量的數(shù)據(jù)中挖掘出理解的知識(shí),這在互聯(lián)網(wǎng)數(shù)據(jù)不斷增長(zhǎng)的形勢(shì)下,對(duì)于其的挖掘任務(wù)遠(yuǎn)遠(yuǎn)超出了搜索任務(wù),有很大的復(fù)雜性,這就導(dǎo)致了在進(jìn)行挖掘的過(guò)程中,要具備良好的開(kāi)發(fā)環(huán)境和應(yīng)用環(huán)境,那么這種挖掘要求就需要充分的應(yīng)用到云計(jì)算環(huán)境。
(2)在云計(jì)算環(huán)境下,可以順利的實(shí)現(xiàn)低成本分布式并行計(jì)算環(huán)境,基于此,就可以大大降低企業(yè)的數(shù)據(jù)處理成本,而且也擺脫了對(duì)高性能機(jī)器的依賴性。
(3)在云計(jì)算環(huán)境下,進(jìn)行數(shù)據(jù)開(kāi)挖活動(dòng)時(shí)十分的便利,對(duì)底層有屏蔽作用。而且在并行化條件下,云計(jì)算還可以在原有設(shè)備的利用基礎(chǔ)上進(jìn)一步的提高對(duì)大規(guī)模數(shù)據(jù)的處理能力和速度,這樣不僅確保了容錯(cuò)性,而且還起到了增加結(jié)點(diǎn)的作用。
4 云計(jì)算環(huán)境下數(shù)據(jù)挖掘平臺(tái)的分析
4.1 賬戶管理子系統(tǒng)
賬戶管理的子系統(tǒng)一般是針對(duì)于管理用戶對(duì)與平臺(tái)相關(guān)的服務(wù)狀況,進(jìn)行的一個(gè)賬戶收支明細(xì)的詳細(xì)記載,這個(gè)系統(tǒng)是平臺(tái)的基礎(chǔ)所在。從它的構(gòu)成結(jié)構(gòu)來(lái)看,它主要涉及到四個(gè)方面的功能,即支出的明細(xì)、收入的明細(xì)、賬戶余額以及歷史記錄。這四個(gè)方面是相互作用,相互聯(lián)系的,其中每一部分的作用是有區(qū)別的,支出明細(xì)主要是對(duì)用戶所使用的平臺(tái)中的付費(fèi)服務(wù)和設(shè)施的明細(xì)賬目進(jìn)行詳細(xì)合理的記錄;收入的明細(xì)主要涉及到它的兩項(xiàng)主要來(lái)源,一是用戶在這個(gè)系統(tǒng)下提供平臺(tái)的數(shù)據(jù)資源,二是以挖掘算法子系統(tǒng)提供給平臺(tái)的先進(jìn)算法的報(bào)酬明細(xì);而賬戶的余額主要是支出和收入之間的差額;最后的歷史記錄是指對(duì)用戶登錄平臺(tái)之后的所有操作行為進(jìn)行記載,這樣可以給后期的撤銷操作提供條件。
4.2 數(shù)據(jù)管理的子系統(tǒng)
這個(gè)系統(tǒng)是針對(duì)于用戶的數(shù)據(jù)資源管理來(lái)說(shuō)的,涉及到用戶自己的數(shù)據(jù)、采購(gòu)的數(shù)據(jù)以及賣出的數(shù)據(jù)。這個(gè)子系統(tǒng)是在云計(jì)算的DaaS服務(wù)模式基礎(chǔ)上出現(xiàn)的,對(duì)于用戶來(lái)說(shuō),可以在這個(gè)系統(tǒng)的作用下,通過(guò)平臺(tái)來(lái)獲得自己所需要的數(shù)據(jù)資源,并且也可以把自己所擁有數(shù)據(jù)提供給平臺(tái),需要注意的是,這個(gè)提供是有償性的。它的功能作用主要包含三個(gè)方面,我的數(shù)據(jù)、采購(gòu)數(shù)據(jù)、賣出數(shù)據(jù)。這三個(gè)數(shù)據(jù)各有各自的優(yōu)勢(shì),我的數(shù)據(jù),它較為清晰的表示了用戶存放在平臺(tái)上的全部數(shù)據(jù)名城;采購(gòu)數(shù)據(jù),它從平臺(tái)采購(gòu)數(shù)據(jù),然后在系統(tǒng)的作用下對(duì)這些數(shù)據(jù)所進(jìn)行存放的數(shù)據(jù)庫(kù)名城按照列表的形式顯示給用戶;賣出數(shù)據(jù),它是用戶所賣出的平臺(tái)數(shù)據(jù)的詳細(xì)記錄列表進(jìn)行的顯示。
4.3 挖掘算法管理子系統(tǒng)
這種系統(tǒng)主要是針對(duì)于管理數(shù)據(jù)挖掘子系統(tǒng)所需要的算法和模型來(lái)說(shuō)的,并且還可以協(xié)助完成數(shù)據(jù)挖掘子系統(tǒng)中的自定義功能的算法獲取作用。從這種系統(tǒng)的結(jié)構(gòu)構(gòu)成來(lái)說(shuō),它包含有系統(tǒng)算法、算法歷史記錄以及自定義算法等的基本功能。這個(gè)功能之間是相互聯(lián)系的作用,各有各自的特點(diǎn),系統(tǒng)算法,它可以較為清晰明確的列出平臺(tái)所擁有的挖掘算法和相關(guān)的介紹等;對(duì)于算法記錄來(lái)說(shuō),它可以對(duì)用戶所使用的全部算法進(jìn)行合理的記錄;自定義算法主要是指用戶根據(jù)自身需求所創(chuàng)作出的算法,也可以是經(jīng)過(guò)改進(jìn)創(chuàng)新的算法。
4.4 服務(wù)器群
服務(wù)群的存在主要是對(duì)用戶提供高效的平臺(tái)訪問(wèn)、數(shù)據(jù)操作等的一系列服務(wù)。這種服務(wù)群所采用的虛擬技術(shù)以及具體的分布式技術(shù)會(huì)把平臺(tái)所擁有的本地或者是異地服務(wù)器資源進(jìn)行高效的利用,進(jìn)而提供高質(zhì)量的服務(wù)。在這個(gè)平臺(tái)的作用下,它可以把服務(wù)器直接的租用給客戶,也可以是客戶把自己所具有的閑置服務(wù)器已虛擬化等的技術(shù)來(lái)租用給平臺(tái),這樣可以確保資源的高效配置,通常情況下,這個(gè)服務(wù)器群涉及到數(shù)據(jù)庫(kù)服務(wù)器、數(shù)據(jù)挖掘服務(wù)器以及賬戶管理服務(wù)器等方面。
5 總結(jié)
現(xiàn)代科學(xué)技術(shù)的發(fā)展,使得云計(jì)算得到了顯著的普及和應(yīng)用。云計(jì)算自身具有獨(dú)特的優(yōu)勢(shì)特點(diǎn),它在大量數(shù)據(jù)挖掘方面具有明顯的優(yōu)勢(shì),而且隨著它的應(yīng)用領(lǐng)域不斷延伸,人們?cè)诩哟髮?duì)其應(yīng)用的同時(shí),也給云計(jì)算環(huán)境下的數(shù)據(jù)開(kāi)挖提供了很大的便利,而且國(guó)家也加大了這方面的政策支持力度,又為云計(jì)算環(huán)境下的數(shù)據(jù)開(kāi)挖實(shí)效性注入新的活力。
參考文獻(xiàn)
[1]石杰.云計(jì)算環(huán)境下的數(shù)據(jù)挖掘應(yīng)用[J].微型機(jī)與應(yīng)用,2015,34(05):13-15.
[2]黃章樹(shù),劉晴晴.基于云計(jì)算服務(wù)模式的數(shù)據(jù)挖掘應(yīng)用平臺(tái)的構(gòu)建[J].電信科學(xué),2012,(01):53-57.
[3]鄧?yán)倮伲诤?基于云計(jì)算的數(shù)據(jù)挖掘研究及展望[J].計(jì)算機(jī)與現(xiàn)代化,2012,(05):93-95.
[4]周晏,桑書(shū)娟.淺談基于云計(jì)算的數(shù)據(jù)挖掘技術(shù)[J].電腦知識(shí)與技術(shù),2010,6(34):9681-9683.
[5]蔡興旺,段夢(mèng)博.云計(jì)算及其在數(shù)據(jù)挖掘上的應(yīng)用研究[J].電腦知識(shí)與技術(shù),2010,6(22):6272-6274.
[6]肖云鵬,劉宴兵.云計(jì)算關(guān)鍵技術(shù)與應(yīng)用展望[J].數(shù)字通信,2010,(03):29-31+36.
作者單位
湖南勞動(dòng)人事職業(yè)學(xué)院 湖南省長(zhǎng)沙市 410126