邵華1 王愛菊2
1.河南應(yīng)用技術(shù)職業(yè)學(xué)院 2.鄭州工程技術(shù)學(xué)院
?
大數(shù)據(jù)下的空間數(shù)據(jù)挖掘分析
邵華1王愛菊2
1.河南應(yīng)用技術(shù)職業(yè)學(xué)院 2.鄭州工程技術(shù)學(xué)院
科學(xué)技術(shù)不斷發(fā)展,網(wǎng)絡(luò)信息化已經(jīng)成為現(xiàn)實(shí)。數(shù)據(jù)收集逐漸進(jìn)入到人們的日常生活,大數(shù)據(jù)下的空間數(shù)據(jù)挖掘成為重要的研究內(nèi)容。利用先進(jìn)技術(shù)來研究空間數(shù)據(jù),可以為人們的生活提供更多保障。本文在分析大數(shù)據(jù)下空間數(shù)據(jù)的特點(diǎn)基礎(chǔ)上,介紹了空間數(shù)據(jù)挖掘的分析方法,探討了數(shù)據(jù)挖掘存在的問題。
大數(shù)據(jù) 空間數(shù)據(jù) 挖掘利用
對(duì)信息挖掘利用可以決定市場行為是否有效,也就決定了在市場中的存活能力。信息就是機(jī)遇,能否把握機(jī)遇要看大數(shù)據(jù)下的空間數(shù)據(jù)挖掘分析。從無限的信息中發(fā)現(xiàn)有用的信息,合理利用大數(shù)據(jù),可以取得巨大的成功。大數(shù)據(jù)的內(nèi)容繁多,空間數(shù)據(jù)占據(jù)巨大部分??臻g數(shù)據(jù)的挖掘分析能力決定了大數(shù)據(jù)的發(fā)展未來和發(fā)展方向。
1 大數(shù)據(jù)下空間數(shù)據(jù)的特點(diǎn)
1.1數(shù)據(jù)集成
數(shù)據(jù)處理能力的提高與數(shù)據(jù)的集成密不可分。將分散、零散的數(shù)據(jù)進(jìn)行綜合分析是數(shù)據(jù)集成的關(guān)鍵??臻g數(shù)據(jù)從原有的數(shù)據(jù)庫中抽取,經(jīng)過分析綜合形成空間數(shù)據(jù)庫??臻g數(shù)據(jù)要想被充分利用,要消除數(shù)據(jù)的不一致,要經(jīng)過統(tǒng)一和綜合,形成可被綜合計(jì)算的數(shù)據(jù)??臻g數(shù)據(jù)庫建設(shè)是數(shù)據(jù)集成的基礎(chǔ)。
1.2數(shù)據(jù)持久
在數(shù)據(jù)查詢模式下,對(duì)空間數(shù)據(jù)的利用是為其他方面做決策的。不管是經(jīng)濟(jì)還是其他的發(fā)展都需要有數(shù)據(jù)支撐,空間數(shù)據(jù)就可以起到這樣的作用??臻g數(shù)據(jù)庫的數(shù)據(jù)不是單獨(dú)的,是不同時(shí)間的空間數(shù)據(jù)綜合,是當(dāng)前時(shí)期的數(shù)據(jù)內(nèi)容。把數(shù)據(jù)庫中的部分?jǐn)?shù)據(jù)進(jìn)行綜合、重組后導(dǎo)入到空間數(shù)據(jù)庫進(jìn)行聯(lián)機(jī)處理就形成了空間數(shù)據(jù)倉庫。像儲(chǔ)存?zhèn)}庫一樣,空間數(shù)據(jù)庫也存在滿倉的情況,數(shù)據(jù)過多將導(dǎo)致前期數(shù)據(jù)清除。
2.1空間分析法
廣義上的GIS技術(shù)是地理信息系統(tǒng)的簡稱。GIS可以輸入、查詢、分析,可以對(duì)空間數(shù)據(jù)進(jìn)行成圖和分析。分析有簡單的數(shù)據(jù)對(duì)比,也有建模分析得到新穎的數(shù)據(jù)??臻g數(shù)據(jù)的充分利用,要能夠生成有用的新信息,也就是信息挖掘??臻g分析可以發(fā)現(xiàn)彼此間空間上的關(guān)聯(lián),為合適的處理方式提供決策。
2.2統(tǒng)計(jì)分析法
從浩如煙海的數(shù)據(jù)中歸納總結(jié)就需要要用到統(tǒng)計(jì)分析的方法。對(duì)地理空間的探索,對(duì)空間數(shù)據(jù)的挖掘讓人們尋求更加準(zhǔn)確精密的計(jì)算方法??臻g數(shù)據(jù)含有物體的特性和各種空間現(xiàn)象,此時(shí)空間數(shù)據(jù)的位置可以用高清晰的圖像來展示。單純的數(shù)據(jù)在集合圖形展示后可以更加直觀,但統(tǒng)計(jì)方法在字符型數(shù)據(jù)上處理能力十分有限。要想把空間數(shù)據(jù)和更加直觀的示意圖聯(lián)系起來要不斷加深對(duì)統(tǒng)計(jì)分析的研究。
2.3遺傳算法
生物的遺傳要符合遺傳規(guī)律,應(yīng)用遺傳算法可以處理對(duì)生物進(jìn)化過程的模擬計(jì)算。在進(jìn)行模擬計(jì)算的同時(shí),自動(dòng)獲取生物的相關(guān)知識(shí)、地理分布,利用已知可以更加快速求出最優(yōu)解,結(jié)果的精確性也更高。把遺傳算符應(yīng)用到空間數(shù)據(jù)的挖掘上,能預(yù)測空間數(shù)據(jù)的變化,根據(jù)預(yù)測在空間數(shù)據(jù)可能出現(xiàn)的變化位置自動(dòng)搜索,得到更加有效、準(zhǔn)確的數(shù)據(jù)。
2.4可視化分析
人類大腦有強(qiáng)大的想象能力,可以對(duì)抽象的數(shù)據(jù)進(jìn)行圖像化的處理。人的這種具體化思維或者形象思維形成人類巨大的創(chuàng)造性思維。不局限于已有的抽象數(shù)據(jù),還要根據(jù)實(shí)際需要?jiǎng)?chuàng)造未有的事物。人腦的空間分析能力遠(yuǎn)超計(jì)算機(jī),這為空間數(shù)據(jù)的可視化提供借鑒。借助于可視化分析,人們可以了解數(shù)據(jù)之間的相互關(guān)系,可以預(yù)測發(fā)展的趨勢(shì)。將大量的數(shù)據(jù)以可視化技術(shù)呈現(xiàn)可以激發(fā)創(chuàng)造思維。從大量的數(shù)據(jù)中,將相關(guān)現(xiàn)象、數(shù)據(jù)、結(jié)構(gòu)以數(shù)據(jù)規(guī)律的形式展現(xiàn),可以觀測到事物的未知一面。
3.1多樣性
數(shù)據(jù)的存儲(chǔ)類型有限,一般是二進(jìn)制存儲(chǔ)。但空間數(shù)據(jù)的數(shù)據(jù)類型很多,像空間特性、聯(lián)系特性??臻g數(shù)據(jù)的緊密性、聯(lián)系的不集中性,對(duì)空間數(shù)據(jù)的挖掘造成了困難。面對(duì)多種多樣的數(shù)據(jù),要有不同的分析方法。
3.2變化性
整個(gè)宇宙不斷運(yùn)動(dòng),空間數(shù)據(jù)也不斷變化。這種變化影響了現(xiàn)有數(shù)據(jù)的處理,也就是舊數(shù)據(jù)處理中新數(shù)據(jù)不斷產(chǎn)生。對(duì)數(shù)據(jù)的選取利用就顯得非常重要了,既要在數(shù)據(jù)的選取上多下功夫,又要結(jié)合新數(shù)據(jù),使數(shù)據(jù)分析更加準(zhǔn)確及時(shí)。
3.3智能化
人們對(duì)空間的探索不斷加深,獲取的空間數(shù)據(jù)越來越多,空間數(shù)據(jù)挖掘不斷成熟。伴隨探索,空間數(shù)據(jù)庫數(shù)據(jù)不斷變化,對(duì)數(shù)據(jù)庫的存儲(chǔ)和提取有了更高的要求。受技術(shù)水平限制,空間數(shù)據(jù)智能化處理和存儲(chǔ)的程度偏低,造成了應(yīng)用的困難,對(duì)空間數(shù)據(jù)的挖掘程度也不夠深入。
綜上所述,經(jīng)濟(jì)發(fā)展推動(dòng)科學(xué)進(jìn)步,技術(shù)也更加先進(jìn)。大數(shù)據(jù)時(shí)代到來,空間數(shù)據(jù)挖掘逐漸深入,引導(dǎo)人們探索更有效的處理數(shù)據(jù)。對(duì)空間數(shù)據(jù)的挖掘有利于經(jīng)濟(jì)發(fā)展,有利于為人們政策的決定提供更好的信息支撐。在今后的發(fā)展方向上,空間數(shù)據(jù)挖掘要不斷創(chuàng)新。利用先進(jìn)的技術(shù)水平,可以不斷完善現(xiàn)在的數(shù)據(jù)技術(shù)。探索數(shù)據(jù)分析理論和方法,可以為經(jīng)濟(jì)發(fā)展提供科學(xué)依據(jù)。
[1]馬健.一種新的空間數(shù)據(jù)挖掘系統(tǒng)的分析與研究[J].安康學(xué)院學(xué)報(bào),2014(02)
[2]廖美紅.基于空間數(shù)據(jù)挖掘的煤礦安全監(jiān)測系統(tǒng)[J].制造業(yè)自動(dòng)化,2012(24)
[3]郭學(xué)軍.基于空間數(shù)據(jù)挖掘器的空間數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)[J].煤炭技術(shù),2011(05)