黃 魏 許 偉 汪善勤 袁雅萍 望陳運(yùn)
(華中農(nóng)業(yè)大學(xué)資源與環(huán)境學(xué)院,武漢 430070)
數(shù)字土壤制圖以土壤發(fā)生學(xué)理論和土壤—環(huán)境模型為基礎(chǔ),其核心是土壤空間差異與環(huán)境要素之間存在著協(xié)同關(guān)系[1],依據(jù)這種關(guān)系可以對(duì)土壤空間變化進(jìn)行推測(cè)與制圖。目前,已有大量學(xué)者對(duì)知識(shí)的獲取方法展開了研究,主要包括三大類:依賴土壤普查專家知識(shí)的土壤專家方法[2];基于決策樹、神經(jīng)網(wǎng)絡(luò)等算法的空間數(shù)據(jù)挖掘方法[3-4];利用模糊數(shù)學(xué)從傳統(tǒng)土壤圖中獲取知識(shí)的方法[5-6],但是這些方法均存在一定的局限性[7-8]。
土壤作為一個(gè)自然連續(xù)體,它的連續(xù)性不僅表現(xiàn)在屬性的漸變上,同時(shí)也表現(xiàn)于地理空間分布上[9-10]。因此,土壤實(shí)體表現(xiàn)出對(duì)不同土壤類型的多重相似性,在知識(shí)獲取過程中的不確定性會(huì)影響土壤推理制圖的準(zhǔn)確性[11]。朱阿興[12]提出在數(shù)字土壤制圖過程中,獲取土壤與環(huán)境關(guān)系知識(shí)時(shí)會(huì)產(chǎn)生兩種不確定性:忽略不確定性和夸大不確定性,用于描述土壤類別劃分的可信程度。
本研究利用不確定性模型實(shí)現(xiàn)知識(shí)的重新獲取,將基于模糊推理生成的土壤圖與不確定性圖進(jìn)行融合,在可信度高的區(qū)域重新采集樣點(diǎn),挖掘不確定性圖所蘊(yùn)含的土壤分布規(guī)律,探索最優(yōu)土壤—環(huán)境關(guān)系知識(shí)組合。研究目的是利用原始推理圖、不確定性模型等資源,有效地獲取最佳土壤—環(huán)境關(guān)系知識(shí)組合,以提高土壤推理制圖精度。
圖1 研究區(qū)示意圖Fig. 1 Location map of the study area
研究區(qū)(圖1)位于湖北省黃岡市紅安縣境內(nèi)(114°26′~114°33′N,31°23′~31°30′E),該區(qū)地處湖北省東北部大別山南麓,鄂豫兩省交界處。屬于亞熱帶季風(fēng)氣候,年平均氣溫為15.7℃,較為溫潤(rùn),夏季較為炎熱。全區(qū)均為半山半丘陵地區(qū),地勢(shì)北高南低。成土母質(zhì)主要包括片麻巖、石灰?guī)r、近代河流沖積物、泥質(zhì)巖、基性巖和石英片巖。土壤可分為四個(gè)土類,七個(gè)亞類,可細(xì)分為26種土屬。研究中用到的數(shù)據(jù)包括:從10 m分辨率的等高線(來源于湖北省測(cè)繪局)提取的各類環(huán)境因子,包括高程、坡度、坡向、曲率、地形濕度指數(shù)等;利用決策樹模型從傳統(tǒng)土壤圖獲取的土壤—環(huán)境關(guān)系組合,以及通過其關(guān)系組合推理生成的各類型土壤隸屬度圖(具體研究數(shù)據(jù)和方法可參考文獻(xiàn)[9] )。
在土壤—環(huán)境推理模型(Soil-Land Inference Model,SoLIM)中采用相似度模型來表達(dá)土壤在空間上的變化[1],其基本理論是某點(diǎn)土壤與多種土壤類型之間存在著不同程度的相似性,以隸屬度來表示某點(diǎn)土壤與土壤類型k的相似度。將相似度向量中最大的隸屬度值所代表的土壤類型作為該點(diǎn)的土壤類型,即土壤圖硬化過程[13-14]。在硬化的過程中,每個(gè)像元被賦予了唯一的土壤類型,但是該像元也存在著與其他土壤類型之間的相似性,因此,產(chǎn)生了忽略不確定性和夸大不確定性。
在相似度模型的基礎(chǔ)上,對(duì)分類誤差進(jìn)行全面定義,從而可以精確詳細(xì)地描寫分類結(jié)果中不確定性在空間上的變化[15],即忽略不確定性和夸大不確定性[16-17]。忽略不確定性跟某點(diǎn)土壤與所有土壤類型的相似性有關(guān),像元點(diǎn)的土壤與各類型土壤的隸屬程度越接近,即相似度向量中的隸屬度越平均(分散),忽略不確定性就越大。忽略不確定性可通過熵來計(jì)算[17],具體公式如下:
式中,Uij為忽略不確定性,范圍從0至1,為點(diǎn)(i,j)對(duì)土壤類型k的隸屬度,N為研究區(qū)內(nèi)的土壤類型數(shù)。
夸大不確定性即某點(diǎn)被確定為某土壤類型的夸大程度,與像元所屬類型的隸屬度呈反比。該點(diǎn)在所屬類型的隸屬度越高,夸大程度就越低。計(jì)算公式[17]可簡(jiǎn)單表達(dá)為
式中,F(xiàn)ij為夸大不確定性,為點(diǎn)(i,j)對(duì)土壤類型g的隸屬度。
圖2 方法流程圖Fig. 2 Flow chart of the method
土壤—環(huán)境推理模型(Soil-Land Inference Model,)是一種成功應(yīng)用于土壤制圖的自動(dòng)推理模型,它將土壤—環(huán)境關(guān)系知識(shí)與環(huán)境數(shù)據(jù)結(jié)合,得到每類土壤對(duì)應(yīng)的隸屬度分布圖[18]。通過硬化,即將每一像元所有土壤類型隸屬度中的最大值所代表的土壤類型作為該像元的土壤類型[13],可得到研究區(qū)土壤類型柵格圖。利用SoLIM可得到土壤類型的夸大和忽略不確定性分布圖。
依據(jù)不確定性分布圖在可信度高的位置重新采集樣點(diǎn),對(duì)樣點(diǎn)進(jìn)行數(shù)據(jù)挖掘,獲取環(huán)境因子組合,建立其與土壤類型的對(duì)應(yīng)關(guān)系,結(jié)合原始規(guī)則方法的總體流程如圖2所示。
基于SoLIM5.0平臺(tái),將利用決策樹模型生成的各類型土壤隸屬度圖進(jìn)行硬化。相似度向量硬化時(shí)會(huì)產(chǎn)生不確定性圖,夸大不確定性(左)和忽略不確定性(右)的分布如圖3所示,反映了土壤分類時(shí)各個(gè)像元的不確定性程度。圖中顏色越亮的區(qū)域表示該像元推理的不確定性越高;反之,顏色越暗表示不確定性越低。在夸大不確定性分布圖中,除去河流及周邊支流部位,其余區(qū)域夸大不確定性值均很低,表明這個(gè)區(qū)域中土壤推理結(jié)果與實(shí)際類型基本符合。
將硬化后的土壤類型柵格圖與不確定性圖進(jìn)行融合,便于直觀地了解土壤分類的準(zhǔn)確度。圖4中左右分別為土壤類型柵格圖與夸大不確定性和忽略不確定性的融合圖,圖中顏色越白的區(qū)域不確定性越高,顏色越純,表示該顏色代表的土壤類型的可信度越高。例如圖4中,A區(qū)域的土壤屬于林地棕色石灰土的可信度高,而B區(qū)域附近的土壤屬于林地沙泥土的可信度相對(duì)較低。進(jìn)一步研究表明,不確定性值較大的區(qū)域多分布在兩種土壤類型的過渡區(qū),而不確定性值小的區(qū)域基本存在于土壤斑塊的內(nèi)部,這主要是因?yàn)檫^渡區(qū)的土壤與周邊各類土壤均有一定的相似度,因此將該區(qū)域的土壤劃分到任何一類土壤均會(huì)產(chǎn)生較大的忽略不確定性。由于夸大不確定性值較低,且分布范圍較小,本文將基于忽略不確定進(jìn)行研究。
圖3 不確定性分布圖Fig. 3 Distribution of uncertainty
圖4 土壤類型與不確定性融合圖Fig.4 Fusion graph of soil type and uncertainty
本研究目的是降低成圖過程中人為因素導(dǎo)致的知識(shí)誤差,以挖掘可靠的土壤—環(huán)境關(guān)系知識(shí)。SoLIM模型可以生成土壤類型分布圖和不確定性分布圖,并可對(duì)兩類圖進(jìn)行融合。融合圖中顏色越白的地區(qū)不確定性越高;而顏色越純,則該顏色所代表的土壤類型的可信度就越高[1]。根據(jù)土壤類型與忽略不確定性的融合圖,選取不確定性較低(可信度較高)的部位作為代表性的區(qū)域進(jìn)行重采樣。采樣遵循獨(dú)立性原則,采樣點(diǎn)必須覆蓋不同海拔、不同坡向上的坡頂、坡中、坡底等典型景觀位置,具體采樣點(diǎn)分布如圖5,合計(jì)樣點(diǎn)數(shù)980個(gè)。
提取各樣點(diǎn)對(duì)應(yīng)的環(huán)境因子值,包括母質(zhì)類型、高程、曲率、坡度、坡向、地形濕度指數(shù)。以母質(zhì)為依據(jù),將研究區(qū)內(nèi)的土壤樣點(diǎn)分為6大類,分析確定每大類下的環(huán)境因子重要性,按照重要性排序依次對(duì)土壤樣點(diǎn)進(jìn)行分類,直到確定出唯一的土壤類型。根據(jù)研究區(qū)對(duì)應(yīng)的原始土壤圖和土壤志等已有資料,參考前期的決策樹規(guī)則,對(duì)新提取知識(shí)進(jìn)行優(yōu)化。優(yōu)化的具體流程如下:一方面依據(jù)原來的規(guī)則,合并細(xì)小的規(guī)則;另一方面對(duì)規(guī)則進(jìn)行整理,在整理時(shí)要依據(jù)研究區(qū)現(xiàn)有資料和實(shí)地考察情況,了解規(guī)則與所對(duì)應(yīng)的實(shí)際地表描述是否統(tǒng)一。如林地沙泥土,在母質(zhì)為片麻巖的前提下,高程和曲率為主要的影響環(huán)境因子,而這類土壤基本存在于高程屬于80~121 m且曲率小于-0.0013或高程大于121 m的區(qū)域,由此獲得新的規(guī)則。
圖5 樣點(diǎn)分布圖Fig. 5 Distribution of sampling point
表1 局部規(guī)則對(duì)比Table 1 Comparison of local rules
與原始規(guī)則相比,優(yōu)化后的規(guī)則在環(huán)境因子的選取與組合上有了較大變化,特別是林地沙泥土,沙泥田,淺潮沙田等幾類土壤。以沙泥土,林地沙泥土,沙泥田三類分布面積較大的土壤類型為例,對(duì)其推理規(guī)則進(jìn)行對(duì)比(表1)。原始規(guī)則中利用母質(zhì)、高程、坡度、坡向和地形濕度指數(shù)為推理因子,優(yōu)化后的規(guī)則則是利用母質(zhì)、高程、曲率和地形濕度指數(shù)為推理因子。發(fā)現(xiàn)這三類土壤可通過這四個(gè)環(huán)境要素不同條件下的組合加以明顯區(qū)分,其均由片麻巖發(fā)育而來,沙泥土基本分布在坡脊部位,表面地形呈凸向變化,濕度較小,林地沙泥土分布在坡頂或坡上崗頂以下,局部表面地形呈凹向變化,沙泥田則主要分布在坡肩及以下部位,地形變化較為平緩,濕度較大。結(jié)合實(shí)際地形地貌,坡脊位置由于風(fēng)蝕,雨蝕等影響,大量土壤顆粒和水分在重力作用下往地勢(shì)較低的坡肩及平緩地帶流動(dòng)并堆積,形成較濕潤(rùn)的土壤環(huán)境。淺潮沙田由近代河流沖積物發(fā)育而來,高程較低,主要分布在坡腳部位,局部表面地形呈凹向變化,用曲率替換了原始規(guī)則中的坡向,說明優(yōu)化后的土壤環(huán)境關(guān)系更能反映土壤—環(huán)境特征。
采用優(yōu)化后的規(guī)則對(duì)土壤類型的空間分布進(jìn)行推測(cè),結(jié)果如圖6所示,其中左邊為原始規(guī)則推理圖,右邊為規(guī)則優(yōu)化后的推理圖。對(duì)比規(guī)則優(yōu)化前后的土壤類型圖,可以發(fā)現(xiàn)整體上呈現(xiàn)出一致性趨勢(shì),潮沙田、林地棕色石灰土、林地沙泥土以及沙泥土分布范圍基本一致,潮沙田由近代河流沖積物發(fā)育而來,主要分布在河流兩岸以及西部地區(qū);林地棕色石灰土分布于北部丘陵地區(qū),林地沙泥土在整個(gè)研究區(qū)域內(nèi)均有分布,并與沙泥土相互夾雜,這是由于兩種土壤類型的成土環(huán)境相似,因此這兩種土壤往往相伴而生。局部細(xì)節(jié)中,相比于原始規(guī)則推理的土壤圖,沙泥田與沙泥土在優(yōu)化后的土壤圖中圖斑明顯增多,空間細(xì)節(jié)更加豐富,且地處低山丘陵區(qū)河流沖積平原,精細(xì)程度與河流的分布規(guī)律一致,由此可見土壤類型的空間分布與景觀特征相吻合,這也進(jìn)一步驗(yàn)證了土壤類型空間分布的準(zhǔn)確性。
利用野外實(shí)地采集的獨(dú)立驗(yàn)證點(diǎn)對(duì)原始推理圖和優(yōu)化后的推理圖進(jìn)行精度評(píng)估,用于精度檢驗(yàn)的野外實(shí)地樣點(diǎn)共253個(gè),分別采用橫截面采樣(28個(gè))、主觀采樣(109個(gè))和均勻采樣(116個(gè))這三種采樣方式,通過土壤專家實(shí)地辨別的方法獲取各樣點(diǎn)的土壤類型。對(duì)比優(yōu)化前后推理圖,優(yōu)化后的推理圖正確分類的樣點(diǎn)個(gè)數(shù)為219個(gè),總體精度為86.9%,高于原始規(guī)則的推理圖(73%);而Kappa系數(shù)為0.842,高于0.8,表示一致性程度為顯著,能較好地反映研究區(qū)的土壤分布情況。
利用SoLIM軟件建立混淆矩陣,以生產(chǎn)精度和用戶精度為指標(biāo)驗(yàn)證優(yōu)化后的土壤圖精度。優(yōu)化后推理圖與原始推理圖的生產(chǎn)精度和用戶精度統(tǒng)計(jì)結(jié)果如表2所示,除細(xì)沙泥土外,研究區(qū)內(nèi)其他土壤類型的生產(chǎn)精度和用戶精度均有一定程度的提高。其中,細(xì)沙泥田、林地沙泥土、沙泥田、淺潮沙田這四類土壤的生產(chǎn)精度和用戶精度均有明顯提高,這是由于林地沙泥土分布在陡峭山體或山坡位置,海拔相對(duì)較高,與地形變化呈現(xiàn)協(xié)同一致趨勢(shì);細(xì)沙泥田、沙泥田、淺潮沙田這三類土壤主要分布于河谷平原以及溝谷地帶,地形最為平坦,海拔較低,濕度較小,隨著研究區(qū)基本單元精度的提高(10m分辨率),更易展現(xiàn)空間細(xì)節(jié)。沙泥土、林地棕色石灰土、潮沙田等土壤精度也有所提升,這主要?dú)w因于原始成圖過程中被合并忽略的圖斑被還原。優(yōu)化后的推理圖總分類精度高于原始推理圖約13%,預(yù)測(cè)精度有明顯提高。
圖6 土壤類型柵格圖(a為原始規(guī)則推理圖,b為規(guī)則優(yōu)化后的推理圖)Fig. 6 Soil type grid maps(a is the map inferred by original rules,and b is the map inferred by optimized rules)
表2 優(yōu)化后推理圖與原始推理圖的各土壤類型生產(chǎn)精度和用戶精度比較Table 2 Comparison between the original and updated soil maps in accuracy of soil types for production and for users(%)
本研究中提出的土壤—環(huán)境知識(shí)獲取方法雖然取得了較好效果,但仍存在一些問題需要深入探討。在構(gòu)建GIS數(shù)據(jù)庫(kù)時(shí),采用的環(huán)境因子只包括了成土母質(zhì)及高程、坡度等6個(gè)因子,缺乏對(duì)地貌數(shù)據(jù)(徑流系數(shù))、植被等更多環(huán)境因子的篩選。而能夠反映土壤與環(huán)境之間關(guān)系的環(huán)境因子有很多,對(duì)于小區(qū)域尺度下,土地利用方式也會(huì)對(duì)土壤類型的判別與推理產(chǎn)生影響。因此,科學(xué)篩選環(huán)境因子,并應(yīng)用到推理制圖中,使得提取的土壤—環(huán)境關(guān)系知識(shí)更加準(zhǔn)確,這將作為后期的研究重點(diǎn)之一。在知識(shí)獲取過程中,樣點(diǎn)采集的數(shù)量相比于用決策樹進(jìn)行挖掘數(shù)據(jù)時(shí)所需要的樣點(diǎn)明顯減少了很多,但是否還可以再減少樣點(diǎn)數(shù)而達(dá)到同樣的效果,降低研究過程中的工作量。此外,用于精度驗(yàn)證的樣點(diǎn)均通過野外實(shí)地調(diào)查所得,這些樣點(diǎn)受到研究者可達(dá)性的限制,因此樣點(diǎn)的數(shù)量和分布可能會(huì)對(duì)精度產(chǎn)生一定影響,是否可以利用高精度高分辨率的遙感影像圖來驗(yàn)證推理土壤圖的精度,使結(jié)論更具客觀性、科學(xué)性。同時(shí),今后將進(jìn)一步通過實(shí)例驗(yàn)證該方法在其他研究區(qū)的適用性。
本研究提出了一種基于不確定模型的土壤—環(huán)境關(guān)系知識(shí)獲取方法,將不確定性圖與土壤類型圖進(jìn)行融合,然后在可信度高的地方進(jìn)行重采樣,進(jìn)一步挖掘可靠的土壤—環(huán)境關(guān)系知識(shí),采用SoLIM進(jìn)行制圖并利用野外獨(dú)立驗(yàn)證點(diǎn)進(jìn)行評(píng)價(jià)。結(jié)果表明:優(yōu)化后的土壤圖展示了更加詳盡的空間分布信息,一些在原始成圖過程中被合并忽略的圖斑被還原,同時(shí)本文所提方法的推理制圖結(jié)果更符合研究區(qū)土壤分布的特征;此外,應(yīng)用該方法推理制圖,其精度高于已有土壤圖精度約13%。因此,本研究提出的基于不確定性模型的土壤—環(huán)境關(guān)系知識(shí)獲取方法,可為土壤普查和制圖等相關(guān)研究提供理論依據(jù)和方法。
[1] 朱阿興,李寶林,裴韜,等. 精細(xì)數(shù)字土壤普查模型與方法. 北京:科學(xué)出版社,2008:21—26 Zhu A X,Li B L,Pei T,et al. Model and method of fine digital soil survey(In Chinese). Beijing:Science Press,2008:21—26
[2] Zhu A X. A personal construct-based knowledge acquisition process for natural resource mapping.International Journal of Geographical Information Science,1999,13(2):119—141
[3] Moran C J,Bui E N. Spatial data mining for enhanced soil map modeling. International Journal of Geographical Information Science,2002,16:533—549
[4] Chang P C,F(xiàn)an C Y,Dzan W Y. A CBR-based fuzzy decision tree approach for database classification.Expert Systems with Applications,2010,37(1):214—225
[5] 楊琳,朱阿興,秦承志,等. 基于典型點(diǎn)的目的性采樣設(shè)計(jì)方法及其在土壤制圖中的應(yīng)用. 地理科學(xué)進(jìn)展,2010,29(3):279—286 Yang L,Zhu A X,Qin C Z,et al. A purposive sampling design method based on typical points and its application in soil mapping(In Chinese). Progress in Geography,2010,29(3):279—286
[6] 楊琳,Sherif F,Sheldon H,等. 基于土壤—環(huán)境關(guān)系的更新傳統(tǒng)土壤圖研究. 土壤學(xué)報(bào),2010,47(6):1039—1049 Yang L,Sherif F,Sheldon H,et al. Updating conventional soil maps using knowledge on soil environment relationships extracted from the maps(In Chinese). Acta Pedologica Sinica,2010,47(6):1039—1049
[7] Shi X,Zhu A X,Burt J E,et al. A case-based reasoning approach to fuzzy soil mapping. Soil Science Society of America Journal,2004,68(3):885—894
[8] 楊琳,朱阿興,李寶林,等. 應(yīng)用模糊c-均值聚類獲取土壤制圖所需土壤-環(huán)境關(guān)系知識(shí)的方法研究. 土壤學(xué)報(bào),2007,44(5):784—791 Yang L,Zhu A X,Li B L,et al. Extraction of knowledge about soil-environment relationship for soil mapping using fuzzy c-means(FCM)clustering(In Chinese). Acta Pedologica Sinica,2007,44(5):784—791
[9] 黃魏,羅云,汪善勤,等. 基于傳統(tǒng)土壤圖的土壤-環(huán)境關(guān)系提取與預(yù)測(cè)制圖研究. 土壤學(xué)報(bào),2016,53(1):72—75 Huang W,Luo Y,Wang S Q,et al. Acquisition of soil-environment relationships based on conventional soil map and predictive mapping(In Chinese). Acta Pedologica Sinica,2016,53(1):72—75
[10] 黃魏,韓宗偉,羅云,等. 基于地形單元的土壤有機(jī)質(zhì)空間變異研究. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(4):161—167 Huang W,Han Z W,Luo Y,et al. Spatial distribution of soil organic matter based on topographic unit(In Chinese). Transactions of the Chinese Society for Agricultural Machinery,2015,46(4):161—167
[11] 盧巖君,秦承志,邱維理,等. 基于少量典型樣點(diǎn)土壤屬性空間分布推測(cè)模型中的土壤屬性參數(shù)敏感性分析.地理科學(xué),2011,31(12):1549—1554 Lu Y J,Qin C Z,Qiu W L,et al. Sensitivity analysis of soil property parameter in typical-sample-based prediction model of digital soil mapping(In Chinese).Scientia Geographica Sinica,2011,31(12):1549—1554
[12] Zhu A X. Measuring uncertainty in class assignment for natural resource maps under fuzzy logic.Photogrammetric Engineering and Remote Sensing,1997,63(10):1195—1202
[13] 朱阿興,李寶林,楊琳,等. 基于GIS、模糊邏輯和專家知識(shí)的土壤制圖及其在中國(guó)應(yīng)用前景. 土壤學(xué)報(bào),2005,42(5):844—851 Zhu A X,Li B L,Yang L,et al. Predictive soil mapping based on a GIS,expert knowledge,and fuzzy logic framework and its application prospects in China(In Chinese). Acta Pedologica Sinica,2005,42(5):844—851
[14] Zhu A X. A similarity model for representing soil spatial information. Geoderma,1997,77(2):217—242
[15] Burt J E,Harrower M. Depicting fuzzy soil class uncertainty using perception-based color models.Proceedings of the Eleventh International Fuzzy Systems Association World Congress,2005:2
[16] Fisher P,Comber A,Wadsworth R. Approaches to uncertainty in spatial data. Fundamentals of Spatial Data Quality,2006(2):43—59
[17] Qi F,Zhu A X. Comparing three methods for modeling the uncertainty in knowledge discovery from areaclass soil maps. Computers & Geosciences,2011,37(9):1425—1436
[18] Zhu A X,Hudson B,Burt J,et al. Soil mapping using GIS,expert knowledge,and fuzzy logic. Soil Science Society of America Journal,2001,65(5):1463—1472