宗 琴,劉艷霞,陳明建,秦萬英
(1. 重慶建筑工程職業(yè)學(xué)院,重慶 400000;2. 武漢市測(cè)繪研究院,湖北 武漢 430072)
在地理空間數(shù)據(jù)呈幾何級(jí)數(shù)增長中,出現(xiàn)了較為突出的兩個(gè)問題。一是對(duì)于地理空間數(shù)據(jù)的存儲(chǔ)管理而言,各行業(yè)部門在開展國家空間數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)工作時(shí),由于對(duì)地理空間數(shù)據(jù)的應(yīng)用要求不同,導(dǎo)致在數(shù)據(jù)結(jié)構(gòu)、數(shù)學(xué)基礎(chǔ)、空間尺度、空間參考、語義以及幾何位置等方面存在不一致;二是盡管國家投入了一定經(jīng)費(fèi)加強(qiáng)建設(shè)數(shù)據(jù)共享機(jī)制;但仍出現(xiàn)了地理空間數(shù)據(jù)生產(chǎn)隨機(jī)性大、數(shù)據(jù)更新和共享管理機(jī)制不健全等問題。因此,如何對(duì)海量、多源、異構(gòu)的地理空間數(shù)據(jù)進(jìn)行管理、分析和更新成為當(dāng)下相關(guān)科研機(jī)構(gòu)、管理部門著重研究的課題[1-14]。
1)矢量信息的“圖”特征,是指描述地理空間實(shí)體的輪廓線條表征出的形態(tài)、大小、面積、輪廓、結(jié)構(gòu)等,相比遙感信息的“圖”特征,矢量信息的“圖”特征更適應(yīng)多尺度表達(dá),因?yàn)槠洳粫?huì)隨著尺度變化而失真。目前自動(dòng)綜合技術(shù)對(duì)多尺度空間數(shù)據(jù)表達(dá)的限制使得矢量信息無法實(shí)現(xiàn)連續(xù)化表示,但“圖特征”可以實(shí)現(xiàn)以其抽象、簡潔、形象的符號(hào)離散化地表示地理信息。
2)矢量信息的“譜”特征,是指矢量數(shù)據(jù)表征出的類別、方向、關(guān)系、規(guī)律、變化等,相比遙感信息的“譜”特征,矢量信息雖沒有光譜維信息,但其隨尺度變化表現(xiàn)出的譜系更易量化?!皥D特征”實(shí)現(xiàn)了離散化表示地理信息,“譜特征”則完成了連續(xù)化表示,以運(yùn)動(dòng)、系列的譜系定量表示地理信息。
綜上所述,矢量數(shù)據(jù)和遙感影像作為空間數(shù)據(jù)的組成部分,也具備了“圖”和“譜”的綜合信息,兼有“圖形”與“譜相”的雙重特性。矢量數(shù)據(jù)圖譜合一的特性是多尺度表達(dá)的結(jié)果,反映了地理空間實(shí)體的地理屬性,譜寫了地理空間實(shí)體在空間分布、時(shí)間推移、尺度變化上的表現(xiàn),是進(jìn)行地理信息認(rèn)知的起點(diǎn)和立足點(diǎn)[2,15-16]。
矢量信息圖譜的目標(biāo)對(duì)象是地理空間實(shí)體,如同知識(shí)圖譜本質(zhì)上揭示實(shí)體之間關(guān)系一樣,矢量信息圖譜本質(zhì)上具有目標(biāo)的動(dòng)態(tài)性、目標(biāo)的相似性、關(guān)系的細(xì)粒度分析等3 個(gè)方面的特性,基于這3 個(gè)方面的特性,矢量信息圖譜揭示著地理空間實(shí)體的關(guān)系,得以實(shí)現(xiàn)從理論上認(rèn)知矢量數(shù)據(jù)的多尺度表達(dá)。
1)目標(biāo)的動(dòng)態(tài)性:指矢量信息圖譜自動(dòng)識(shí)別出同類事物,即某地理空間實(shí)體形態(tài)發(fā)生變化后,自動(dòng)識(shí)別出它變化后的形態(tài)信息。
2)目標(biāo)的相似性:指目標(biāo)對(duì)象在不同尺度上的綜合相似性。地理空間實(shí)體表達(dá)為計(jì)算機(jī)世界的空間數(shù)據(jù)后,連續(xù)尺度表達(dá)下的“圖”特征和“譜”特征存在局部差異,但綜合來看是相似的,這也驗(yàn)證了朱阿興[17]等提出的地理相似性是地理學(xué)的第三定律。
3)關(guān)系的細(xì)粒度分析:地理空間實(shí)體因?yàn)閷?shí)體類型不同表現(xiàn)出多樣化,實(shí)體之間的關(guān)系也可能存在細(xì)粒度的不同,即要素級(jí)、目標(biāo)級(jí)和幾何特征級(jí)等不同層次的粒度,要素級(jí)的粒度最粗,幾何特征級(jí)的粒度最精細(xì),矢量信息圖譜可以呈現(xiàn)出精細(xì)的實(shí)體關(guān)系。
矢量數(shù)據(jù)多尺度表達(dá)由地理信息自動(dòng)綜合技術(shù)實(shí)現(xiàn),但目前自動(dòng)化綜合技術(shù)還處于理論研究階段,真正的全智能化全自動(dòng)化綜合技術(shù)實(shí)時(shí)提取任意尺度表達(dá)的數(shù)據(jù)尚處于發(fā)展研究階段。如若完成矢量數(shù)據(jù)多尺度表達(dá)圖譜認(rèn)知理論和計(jì)算方法論,多尺度空間數(shù)據(jù)庫相關(guān)問題必將邁上新的臺(tái)階。下文將從“由圖抽譜”、“圖舊譜新”和“相譜相成”3 個(gè)階段對(duì)認(rèn)知理論進(jìn)行論述。
矢量數(shù)據(jù)的圖形特征因?qū)嶓w對(duì)象的維度不同而有不同的描述方法。對(duì)于點(diǎn)實(shí)體而言,描述點(diǎn)實(shí)體的空間數(shù)據(jù)僅僅是單一的坐標(biāo),無法構(gòu)成圖形,常常將其升維為面群進(jìn)行描述;對(duì)于線實(shí)體而言,描述線實(shí)體的空間數(shù)據(jù)是一系列坐標(biāo)串,往往把首尾起止點(diǎn)連接形成封閉的面實(shí)體進(jìn)行描述。基于這樣的升維思想,矢量數(shù)據(jù)的圖形特征更多的是面實(shí)體的幾何特征。常見的特征包括面積、周長、內(nèi)角、Feret直徑、面積周長比率等。大部分學(xué)者專研于這些特征的描述方法,較有成效的包括形狀中心點(diǎn)位置法、凸包法、包圍盒法、重心射線法、重疊面積法、離散幾何矩法、方位編碼法和相對(duì)參數(shù)法等。這些描述方法更多地服務(wù)于實(shí)體之間的匹配,以實(shí)現(xiàn)數(shù)據(jù)更新、變化檢測(cè)、數(shù)據(jù)融合等方面的應(yīng)用,而挖掘圖形特征中描述矢量數(shù)據(jù)發(fā)展規(guī)律的譜特征則是由圖抽譜的智能化目的。
3.1.1 面實(shí)體圖特征
面狀實(shí)體的輪廓可以看作一系列輪廓點(diǎn)沿著指定的方向(順時(shí)針或者逆時(shí)針)首尾相連形成的。已知某面狀實(shí)體A的形狀輪廓表示構(gòu)成輪廓的輪廓點(diǎn),n表示輪廓點(diǎn)的數(shù)量,每個(gè)輪廓點(diǎn)P'(i)的坐標(biāo)為如圖1所示。
圖1 面狀矢量數(shù)據(jù)輪廓點(diǎn)提取
有了輪廓點(diǎn)的概念,相鄰2個(gè)輪廓點(diǎn)則構(gòu)成輪廓線段,輪廓線段再由有序的點(diǎn)相連成面實(shí)體形狀輪廓。已知n個(gè)輪廓點(diǎn)P'(i)(i∈[1,n]) 組成的面實(shí)體形狀輪廓S',以每對(duì)相鄰的2個(gè)輪廓點(diǎn)P'(i)與P'(i+1) 構(gòu)成一個(gè)輪廓段l'(i),則此時(shí)的形狀輪廓可表示為S'={l'(i)|i∈[1 ,n] },l'(i)表示第i個(gè)輪廓段,n表示輪廓段的數(shù)量。
構(gòu)成一個(gè)面實(shí)體形狀輪廓的輪廓點(diǎn)數(shù)量往往比較多,因此利用等間隔采樣的方法采樣輪廓點(diǎn)從而簡化計(jì)算過程,得到采樣后的輪廓點(diǎn)集合S={P(i)|i∈[1 ,m] },P(i)為重采樣后的輪廓點(diǎn);m為重采樣后的輪廓點(diǎn)數(shù)量。圖2 表示重采樣后的面狀實(shí)體,可見適當(dāng)?shù)牟蓸宇l率能夠在減少輪廓點(diǎn)數(shù)量的同時(shí)保留形狀細(xì)節(jié),所以形狀輪廓可以表示為S={l(i)|i∈[1 ,m] },l(i)為由重采樣后的輪廓點(diǎn)構(gòu)成的輪廓段(圖2)。
圖2 重采樣后的面狀矢量數(shù)據(jù)
按照參考文獻(xiàn)[18]針對(duì)柵格數(shù)據(jù)模型的提取策略,提取面實(shí)體的圖特征,提出如表1 所示的圖特征要素。本文將輪廓距離定義為從形狀輪廓段的起點(diǎn)沿著輪廓,到另一端點(diǎn)所經(jīng)過的輪廓長度為輪廓段的輪廓距離。輪廓段lk(i)兩端點(diǎn)P(i)和p(i+ak)的輪廓距離codk(i):從起點(diǎn)P(i)到終點(diǎn)p(i+ak)沿著輪廓經(jīng)過的所有輪廓點(diǎn),每對(duì)相鄰接輪廓點(diǎn)的歐氏距離之為:
表1 面實(shí)體圖特征要素
式中,p(j)∈C(i);C(i)為輪廓段lk(i)從起點(diǎn)P(i)到終點(diǎn)p(i+ak)構(gòu)成輪廓路徑的輪廓點(diǎn)集合。
3.1.2 面實(shí)體譜特征抽取
由面實(shí)體的圖特征抽取面實(shí)體的譜特征,組成參數(shù)包括3.1.1 中的歐氏距離、輪廓距離、輪廓距離之和與形狀內(nèi)距離。抽取的譜特征包括歸一化形狀內(nèi)距離、形狀內(nèi)距離變化率、歸一化形狀內(nèi)距離與輪廓距離的比值、歸一化歐氏距離與形狀內(nèi)距離的比值、歸一化歐氏式距離與輪廓距離的比值(如表2)。
表2 面狀實(shí)體譜特征
抽取如表2所示的面實(shí)體譜特征,即:
式中,k表示當(dāng)前尺度層序數(shù);K為尺度的總層數(shù);這里選擇6個(gè)尺度及K=6
3.1.3 面實(shí)體譜特征尺度化
采樣后的面實(shí)體有m個(gè)輪廓點(diǎn),輪廓段lk(i)表示從起點(diǎn)p(i) 按逆時(shí)針方向以間隔ak個(gè)輪廓點(diǎn)的p(i+ak)為終點(diǎn)構(gòu)成的輪廓段,其中:
式中,k為當(dāng)前尺度層序數(shù),以6 個(gè)尺度為例,那么采樣后的輪廓點(diǎn)p(i)為起點(diǎn)構(gòu)成的多尺度輪廓段分別為以輪廓點(diǎn)為終點(diǎn)構(gòu)成的輪廓段。從公式(12)中可以看出,當(dāng)K=6 時(shí),表示最小尺度輪廓段,此時(shí)lk(i)最短,包含的形狀輪廓最小,體現(xiàn)了實(shí)體的局部特征;當(dāng)K=1 時(shí),表示最大尺度輪廓段,此時(shí)lk(i)最長,即第一層尺度時(shí)表示輪廓段最長,包含了面實(shí)體的半全局特征。
這樣,對(duì)于采樣后的實(shí)體,每個(gè)輪廓點(diǎn)在每個(gè)尺度上都有5類特征參數(shù),即每個(gè)輪廓點(diǎn)p(i)都有5×K個(gè)特征參數(shù),分別代表了以p(i)輪廓點(diǎn)為起點(diǎn)的面實(shí)體的局部細(xì)節(jié)與全局整體特征。
矢量數(shù)據(jù)多尺度表達(dá),常規(guī)的表達(dá)思維是根據(jù)不同的應(yīng)用存儲(chǔ)靜態(tài)的不同尺度的數(shù)據(jù)版本,或者存儲(chǔ)精細(xì)的數(shù)據(jù)版本再根據(jù)應(yīng)用進(jìn)行動(dòng)態(tài)綜合,尚未實(shí)現(xiàn)真正意義上的全自動(dòng)表達(dá)。實(shí)際上構(gòu)成矢量數(shù)據(jù)的主要空間實(shí)體面實(shí)體,其形態(tài)的變化規(guī)律如果組建圖譜,那么多尺度表達(dá)便可開辟新的路徑。
面實(shí)體在當(dāng)前尺度下的圖特征本身是靜態(tài)化的屬性,而當(dāng)前尺度下的譜特征可以動(dòng)態(tài)化,從而預(yù)測(cè)下一個(gè)尺度的圖特征(這一構(gòu)建思想在早期的研究中已有說明)。設(shè)當(dāng)前尺度為N,面實(shí)體A、B、C分別為尺度N,N-1,N+1 下的面實(shí)體,其輪廓點(diǎn)為pi和qj與rk,兩實(shí)體之間的距離函數(shù)定義為d(pi,qj)和d(pi,rk),即:
其中:
為了推算尺度N+1 下的面實(shí)體C 的輪廓點(diǎn)特征,以面實(shí)體A 輪廓點(diǎn)的特征序列為行向量,以面實(shí)體B輪廓點(diǎn)的特征序列為列向量,利用前面定義的距離函數(shù)構(gòu)成距離矩陣。
通過計(jì)算尺度N和尺度N-1 下的距離矩陣,以及尺度N-1和尺度N-2 下的距離矩陣,發(fā)現(xiàn)距離矩陣變化規(guī)律,從而推算尺度N和尺度N+1 下的距離矩陣,由此反演尺度N+1 下的C 實(shí)體的輪廓點(diǎn)及其圖特征。
在大數(shù)據(jù)時(shí)代,地理信息的飛速增長使得現(xiàn)勢(shì)數(shù)據(jù)呈現(xiàn)堆積的狀態(tài),隨之出現(xiàn)的數(shù)據(jù)融合、聯(lián)動(dòng)更新、變化檢測(cè)方面的問題限制了矢量數(shù)據(jù)的及時(shí)應(yīng)用。本文對(duì)矢量數(shù)據(jù)多尺度表達(dá)圖譜理論進(jìn)行了論述,從根源上剖析地理空間實(shí)體認(rèn)知規(guī)律,為大數(shù)據(jù)背景下的地理信息研究提供相應(yīng)的參考。