□ 韓祚鵬 □范占永(黔南州水利水電勘測設(shè)計(jì)研究院)
數(shù)據(jù)挖掘由很多成分組合而成,而空間數(shù)據(jù)挖掘的技術(shù)只是這個(gè)家庭當(dāng)中的一個(gè)成員,空間數(shù)據(jù)的挖掘?qū)嶋H上以空間數(shù)據(jù)庫作為主要的支柱,在進(jìn)行多種技術(shù)的結(jié)合。在海量的數(shù)據(jù)空間當(dāng)中進(jìn)行知識的挖掘與篩選,對選擇的知識通過專業(yè)的手段進(jìn)行空間關(guān)系或者是別的意識的提取,并能夠分析出其內(nèi)在的信息,包括數(shù)據(jù)以外的真實(shí)世界、其與外界的具體聯(lián)系以及以后的發(fā)展方向等等,從而能夠更加方便的進(jìn)行技術(shù)的決策以及經(jīng)營的決策。
由于GIS以及遙感技術(shù)的廣泛運(yùn)用,能夠在空間數(shù)據(jù)當(dāng)中獲取的知識主要包括以下幾個(gè)方面的內(nèi)容:
普遍的集合知識,實(shí)際上就是人們普遍認(rèn)知的知識,包括該目標(biāo)的具體數(shù)量、目標(biāo)的大小、目標(biāo)的具體形狀以及目標(biāo)的主要特征等方面的內(nèi)容,舉個(gè)簡單的例子:點(diǎn)狀的目標(biāo)的具體位置,這個(gè)目標(biāo)的大小、其長度的具體值、其周長的值、面積的大小、幾何的中心等等,都能夠通過計(jì)算或者是總結(jié)出GIS當(dāng)中空間目標(biāo)的具體的幾何特點(diǎn),還包含了其特征量的最大數(shù)值、最小數(shù)值、平均值、以及特征量的特征圖都能夠得出。
空間的分布規(guī)律實(shí)際上指的的就是具體的目標(biāo)在地里范圍之內(nèi)的如垂直的方向、水平方向包括垂直方向與水平方向的分布的概率等等。垂直分布也就是空間的目標(biāo)順著空間目標(biāo)的調(diào)和的狀況。
空間關(guān)聯(lián),顧名思義,指的就是空間目標(biāo)相互之間的聯(lián)系,例如臨近關(guān)系、共同生長的關(guān)系、相互包含的關(guān)系等等,例如:道路與河流是相互連接的,而不同的國家之間就是臨近的關(guān)系。
空間分類的規(guī)則指的就是按照目標(biāo)的具體空間情況或者是非空間的特點(diǎn)對各自的類型劃分的一個(gè)原則,這種規(guī)則能夠用在GIS的空間概括以及空間組合當(dāng)中。
空間特點(diǎn)的規(guī)則指的就是某一類的或者多類別的空間的目標(biāo)的結(jié)合特征與屬性之間的特征,同時(shí)也是對他們的共性的總價(jià),在空間特征當(dāng)中,通常的幾何知識空間特征當(dāng)中的組成本部分,之所以將其分離出來,是因?yàn)槠渚哂蟹浅jP(guān)鍵的作用,尤其是在遙感影像當(dāng)中的作用更為關(guān)鍵。
空間的區(qū)分規(guī)則特征也是比較容易理解的,指的就是在兩種或者兩種以上的目標(biāo)的幾何屬性之間的特征,需要注意的是,空間的區(qū)分規(guī)則只是對一個(gè)目標(biāo)的描述,其與空間分類的規(guī)則還是具有一定的區(qū)別的,分類的規(guī)則對于目標(biāo)的劃分更加準(zhǔn)確,精度也屬于比較高的,為了保證分類的準(zhǔn)確程度,通常都是在比較低的層次進(jìn)行分類的處理,但是區(qū)分規(guī)則的不同在于它是對已經(jīng)了解對象的比較,通常情況下,是在比較高的層次上進(jìn)行的描述。
空間演化的規(guī)則實(shí)際上就是空間的變化的規(guī)律,主要包括了空間的幾何過濾、屬性特征的規(guī)律,其變化的規(guī)律是會隨著時(shí)間的變化而發(fā)生改變的。
空間數(shù)據(jù)挖掘就是對于隱含的信息的提取,以及其空間的聯(lián)系等等,最終了解出其具有一定作用的特征以及模式、方式以及技能。常用的空間數(shù)據(jù)挖掘方法主要有:
基于概率論的方法實(shí)際上就是一種利用與計(jì)算出非確定性的特征的概率來獲取空間信息的方法,在此過程當(dāng)中所了解到的信息大多數(shù)情況下都被表達(dá)成為在特定情況下的某一種具體的假設(shè)為真實(shí)條件的概率,通過對于誤差矩陣的分析來進(jìn)行遙感的區(qū)分的時(shí)候,能夠利用這樣的條件的概率當(dāng)做是背景的知識。
空間的分析方法是一種綜合的分析方法,其中主要包含了數(shù)據(jù)的分析與處理、緩沖區(qū)域的分析、距離的分析、地形的分析與總結(jié)等等分析相互結(jié)合的一種分析的方法,這種方法能夠更加便捷而又準(zhǔn)確的發(fā)現(xiàn)目標(biāo)在空間范圍內(nèi)的鏈接的情況,還能夠得出目標(biāo)之間的最短距離,或是最優(yōu)知識。
統(tǒng)計(jì)的分析方式指的就是借助于空間對象的特有信息或者是非確定性的信息,進(jìn)行的一系列的統(tǒng)計(jì)與分析,然后對分析結(jié)果進(jìn)行合理的評估,并能夠?qū)崿F(xiàn)空間測試的功能。
歸納的學(xué)習(xí)方式,顧名思義,指的就是在特定的指示狀況下,對于數(shù)據(jù)的總結(jié)以及分析的一種方式,在空間的數(shù)據(jù)庫當(dāng)中通過搜索與挖掘的方式,了解到常用的規(guī)則以及模式的方式,在實(shí)際的歸納當(dāng)中,包含多種多樣的算數(shù)方法,例如:決策數(shù)的計(jì)算方式以及基于屬性特征的歸納方式等等。
指的就是根據(jù)物體的基本特征如形狀、大小、體積等等,然后對該物體進(jìn)行的聚類或者分析,進(jìn)而能夠歸納出數(shù)據(jù)集的空間分布的狀況以及模式的具體方式等等,目前,較為常用的聚類方式主要包括K-mean,K-medoids以及集合關(guān)系的親近聯(lián)系以及公共特性的基本算術(shù)方式等等。
指的就是利用較多的神經(jīng)元組合而成的網(wǎng)路系統(tǒng),最終能夠滿足獨(dú)自使用的非線性的動(dòng)態(tài)系統(tǒng),并能夠滿足具備一定的分布存儲的能力以及事物的聯(lián)系的能力,并能夠?qū)崿F(xiàn)較大規(guī)模的處理、獨(dú)立學(xué)習(xí)、獨(dú)自組織等等方面能力的一種方式,在空間數(shù)據(jù)挖掘當(dāng)中能夠用來實(shí)現(xiàn)分裂以及聚類的相關(guān)信息的以及特點(diǎn)的挖掘處理。
遺傳算法實(shí)際上并不是一種真實(shí)的算術(shù)方法,其指的就是某種模擬的生物進(jìn)化階段的算術(shù)方式,能夠?qū)崿F(xiàn)問題的空間數(shù)據(jù)的搜索,并能在整個(gè)的搜索階段實(shí)現(xiàn)空間信息的自動(dòng)獲取以及數(shù)據(jù)整理的功能,還能夠在搜索的過程進(jìn)行適當(dāng)?shù)目刂?,并對存在的問題進(jìn)行優(yōu)化處理等等,因此,在空間數(shù)據(jù)的挖掘過程當(dāng)中發(fā)現(xiàn)的諸多困擾,都能夠借助于遺傳的算法來解決,例如:空間數(shù)據(jù)挖掘比較難處理的分類的問題、聚類的問題、預(yù)測的問題等等都能夠得到很好的解決。
盡管在數(shù)據(jù)挖掘方面取得了一定的成就,但是還是有一些值得思考與解決的地方,下面就我國數(shù)據(jù)挖掘技術(shù)的主要問題進(jìn)行了列舉說明。
由于空間數(shù)據(jù)具有復(fù)雜程度高,數(shù)據(jù)信息量大的特點(diǎn),使得計(jì)算的發(fā)放更加繁瑣,也給搜索帶來一定的阻力,怎樣有效地進(jìn)行不重要信息的去除,同時(shí)獲取到有效地信息,使得問題發(fā)生的可能性不斷較低,這一系列的問題都給數(shù)據(jù)挖掘造成了巨大的挑戰(zhàn)。
由于數(shù)據(jù)挖掘的局限性,使得數(shù)據(jù)的挖掘在應(yīng)用方面遇到了很大的難題,尤其表現(xiàn)為程序方面的時(shí)序關(guān)系,這也就導(dǎo)致了靜態(tài)的數(shù)據(jù)存儲在極大影響了數(shù)據(jù)挖掘的使用,由于圖層的計(jì)算模式的卻別,不一樣的尺度空間的割裂,使得空間數(shù)據(jù)挖掘的設(shè)置階段面臨著重要挑戰(zhàn),空間實(shí)體所依賴的信息比較復(fù)雜,不僅包括了標(biāo)識碼,還包含了其他的一系列的信息,這就造成了一維的聯(lián)系方式損失了非常多的聯(lián)系資源,使得多維與隱含的內(nèi)在關(guān)系缺乏真實(shí)性,也就給計(jì)算造成了一定的難度,使得工作的效率無法提高。
在空間數(shù)據(jù)的挖掘技術(shù)方面,尤其關(guān)鍵的分析與運(yùn)用方向主要包括:在網(wǎng)絡(luò)環(huán)境當(dāng)中的數(shù)據(jù)挖掘方式、非確定性狀況下數(shù)據(jù)挖掘的方式、分布狀況下的數(shù)據(jù)挖掘方式等等。
空間數(shù)據(jù)的挖掘技術(shù)還有許多需要不斷深入的地方,通過本文的敘述,不難了解到,在未來數(shù)據(jù)挖掘技術(shù)將逐漸邁向智能化、網(wǎng)絡(luò)化的發(fā)展方向,空間數(shù)據(jù)挖掘的分析方法和應(yīng)用結(jié)果,為全球變化和區(qū)域可持續(xù)發(fā)展提供有力的分析工具,將會更好的服務(wù)社會。
[1]李德仁,史文中,等.論空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2001,26(6).
[2]周海燕,王家耀,等.空間數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J].測繪通報(bào),2002(2).
[3]毛克彪.空間數(shù)據(jù)挖掘技術(shù)方法及應(yīng)用[J].遙感技術(shù)與應(yīng)用,2002,17(4).