楊曉霞,徐 婷,李少達(dá),3,楊容浩,3,丁雨淋,曹振宇
1.成都理工大學(xué)地球科學(xué)學(xué)院,四川成都610059;2.四川省應(yīng)急測繪與防災(zāi)減災(zāi)工程技術(shù)研究中心,四川成都610041;3.成都理工大學(xué)地學(xué)空間信息技術(shù)國土資源部重點(diǎn)實(shí)驗(yàn)室,四川 成都610059;4.高速鐵路運(yùn)營安全空間信息技術(shù)國家地方聯(lián)合工程實(shí)驗(yàn)室,四川 成都611756;5.西南交通大學(xué)地球科學(xué)與環(huán)境工程學(xué)院,四川 成都611756
隨著對(duì)地觀測技術(shù)的發(fā)展,遙感數(shù)據(jù)呈現(xiàn)出明顯的“大數(shù)據(jù)”特征:遙感數(shù)據(jù)日益多元化,不同成像方式、不同波段和分辨率的數(shù)據(jù)并存;遙感影像數(shù)據(jù)量顯著增加,呈指數(shù)級(jí)增長;數(shù)據(jù)獲取的速度加快,更新周期縮短,時(shí)效性越來越強(qiáng)[1]。然而,在資源和用戶不斷增加的同時(shí),也出現(xiàn)了“信息過載”和“搜索迷失”問題[2]。現(xiàn)有的遙感信息共享平臺(tái)大多提供搜索界面,由用戶輸入關(guān)注區(qū)域、產(chǎn)品類型、需求時(shí)間等條件,返回滿足要求的遙感數(shù)據(jù)搜索結(jié)果,再由用戶瀏覽下載所需數(shù)據(jù)。這樣的數(shù)據(jù)服務(wù)方式存在被動(dòng)性、同一性缺點(diǎn),既不能主動(dòng)推薦數(shù)據(jù),也難以提供個(gè)性化的搜索結(jié)果。隨著空間信息應(yīng)用的深入,“為最需要的人、在最適宜的時(shí)間和地點(diǎn)、提供最適宜的服務(wù)”的智能化服務(wù)方式成為日益迫切的需求[3]。只有當(dāng)用戶的興趣、偏好和訪問模式等用戶信息可以很好地被系統(tǒng)“理解”時(shí),才可能滿足多樣化、跨領(lǐng)域的遙感信息需求,實(shí)現(xiàn)從“人找信息”發(fā)展到“信息找人”的智能階段,這將大大降低用戶使用遙感信息解決實(shí)際問題的難度,提高遙感信息資源的利用率。
智能服務(wù)的一般過程可以概括為:收集與用戶相關(guān)的數(shù)據(jù);根據(jù)收集到的數(shù)據(jù)推斷出用戶的興趣;對(duì)滿足用戶興趣的信息進(jìn)行主動(dòng)推薦。當(dāng)前淘寶、Amazon等電子商務(wù)網(wǎng)站會(huì)根據(jù)以往的購物和瀏覽記錄提供相應(yīng)的產(chǎn)品推薦列表,即對(duì)用戶行為進(jìn)行分析后對(duì)用戶的興趣偏好進(jìn)行建模,繼而將其可能感興趣的商品資源推薦過去。從推薦方法上分,可以分為基于網(wǎng)絡(luò)的推薦方法與基于內(nèi)容的推薦方法[2,4-6]?;诰W(wǎng)絡(luò)的推薦方法核心思想是首先利用用戶的歷史信息計(jì)算用戶之間的相似性,然后利用與目標(biāo)用戶相似性較高的鄰居對(duì)其他產(chǎn)品的評(píng)價(jià)來預(yù)測目標(biāo)用戶對(duì)特定產(chǎn)品的喜好程度,系統(tǒng)根據(jù)這一喜好程度對(duì)目標(biāo)用戶進(jìn)行推薦。在產(chǎn)品數(shù)量相對(duì)穩(wěn)定的系統(tǒng)中,基于網(wǎng)絡(luò)的推薦方法是很有效的,例如Amazon的書籍推薦系統(tǒng)[7]。但是對(duì)于遙感信息這類每天數(shù)據(jù)量都在急劇增加的系統(tǒng),這種方法是不適用的?;趦?nèi)容的推薦系統(tǒng),是通過歷史數(shù)據(jù)獲取用戶興趣,然后比較用戶興趣與待分發(fā)產(chǎn)品的相似度,并直接向用戶推薦與其興趣最相似的產(chǎn)品,其核心在于獲取產(chǎn)品內(nèi)容與用戶興趣特征的關(guān)聯(lián)規(guī)則。但是,在面對(duì)多源、多時(shí)相與多分辨率遙感信息時(shí)不可避免地受到用戶興趣特征獲取的約束,自動(dòng)提取遙感信息的內(nèi)容特征具有技術(shù)上的困難,使得相關(guān)應(yīng)用受到了很大限制。近年來,空間信息服務(wù)的智能化成為網(wǎng)絡(luò)化信息服務(wù)的前沿焦點(diǎn)[8-12]。文獻(xiàn)[11]采用區(qū)間數(shù)表達(dá)具有區(qū)間覆蓋特征的經(jīng)度、緯度、時(shí)間、波譜等屬性的用戶檢索特征,較好地解決了用戶興趣在遙感信息各屬性上特征分布的表達(dá)問題,但仍存在空間范圍定位不夠準(zhǔn)確、效用度估計(jì)存在偏差等不足。文獻(xiàn)[12]在文獻(xiàn)[11]的基礎(chǔ)上擴(kuò)展,引入權(quán)值衰減函數(shù)和用戶信息反饋等動(dòng)態(tài)化因素,使模型能夠隨著時(shí)間推移進(jìn)行修正。
本文針對(duì)遙感信息核心元數(shù)據(jù)的區(qū)間覆蓋特性,引入?yún)^(qū)間數(shù)學(xué)的方法建立用戶模型,描述用戶興趣在遙感信息核心元數(shù)據(jù)上的分布特征。實(shí)例分析表明,本文方法能夠自動(dòng)獲取用戶興趣并進(jìn)行遙感信息的主動(dòng)推薦。
用戶建模是發(fā)現(xiàn)并獲取與用戶需求、興趣相關(guān)的知識(shí)的過程,其結(jié)果是產(chǎn)生一個(gè)表示用戶特有背景知識(shí)或需求、興趣的用戶模型[4]。用戶模型是智能服務(wù)的主要知識(shí)源,其捕捉用戶真實(shí)偏好的能力在很大程度上決定了推薦的成功與否。
向量空間模型是目前較流行的用戶模型表示方法。該方法將用戶模型表示成一個(gè)n維特征向量,向量的每一維由一個(gè)關(guān)鍵詞及其權(quán)重組成,表示了用戶是否對(duì)某個(gè)概念感興趣以及感興趣的程度[13-14]。本文以遙感信息的元數(shù)據(jù)作為用戶模型的元素項(xiàng),考慮到遙感信息的部分核心元數(shù)據(jù)(例如空間范圍、波譜范圍等)具有覆蓋特征,不宜通過一個(gè)數(shù)值,而需要通過一個(gè)范圍來描述,因此引入?yún)^(qū)間數(shù)學(xué)的方法加以描述。在文獻(xiàn)[12]四元組模型的基礎(chǔ)上加以改進(jìn),模型結(jié)構(gòu)如式(1)所示
式中,X={x1,x2,…,xi,…,xn},元素項(xiàng)xi為遙感信息元數(shù)據(jù)項(xiàng);W={w1,w2,…,wi,…,wn},wi為xi的權(quán)值;R={r1,r2,…,rn},ri=〈rmini,rmaxi,rstepi〉,描述xi的分布范圍和步長;V={v1,v2,…,vn},vi為反映用戶興趣在xi的分布特征向量或者矩陣。遙感信息用戶建模流程如圖1所示。
遙感信息用戶興趣隱藏于檢索記錄中,檢索頻率越高的元素項(xiàng)對(duì)于用戶興趣的貢獻(xiàn)就越大,反之則越小。本文用權(quán)重wi來描述不同元素項(xiàng)xi之間的相對(duì)重要性,反映不同元素項(xiàng)對(duì)用戶興趣的貢獻(xiàn)。確定權(quán)重的方法有兩類:主觀賦權(quán)法和客觀賦權(quán)法。熵權(quán)法是一種客觀賦權(quán)法,按照信息論基本原理,如果指標(biāo)的信息熵越小,則該指標(biāo)所提供的信息量越大[15]。本文在權(quán)重的確定中引入了信息熵概念,將用戶對(duì)不同元素項(xiàng)的檢索次數(shù)作為信息熵指標(biāo),直接根據(jù)指標(biāo)原始信息通過統(tǒng)計(jì)的方法獲得權(quán)重。
根據(jù)檢索歷史,將用戶在過去一段時(shí)間內(nèi)的檢索記錄分為q組,每一組包含若干條檢索記錄。分別統(tǒng)計(jì)每一組內(nèi)對(duì)元素項(xiàng)xi的檢索次數(shù),并且用一個(gè)矩陣(tij)n×q記錄。計(jì)算權(quán)重的步驟如下:
(1)數(shù)據(jù)標(biāo)準(zhǔn)化處理
式中,sij為用戶第j組檢索記錄中對(duì)元素項(xiàng)xi檢索次數(shù)的標(biāo)準(zhǔn)化值;tij表示第j組檢索記錄中對(duì)元素項(xiàng)xi的檢索次數(shù);min(tik)和 max(tik)分別為q組檢索記錄中元素項(xiàng)xi被檢索次數(shù)的最小值和最大值。
(2)計(jì)算各個(gè)元素項(xiàng)xi的信息熵Hi
(3)由信息熵Hi計(jì)算各元素項(xiàng)的權(quán)重wi
本文選擇空間范圍、時(shí)間范圍、波譜范圍和空間分辨率范圍4個(gè)核心元數(shù)據(jù)作為用戶模型的元素項(xiàng),依次對(duì)應(yīng)x1、x2、x3、x4??紤]到不同元素項(xiàng)xi具有各自的區(qū)間覆蓋特性,其分布范圍與步長R的表示方法也不同,具體分3種情況處理:
(1)對(duì)于時(shí)間范圍x2、波譜范圍x3與空間分辨率范圍x4,用戶常采用范圍來表達(dá)檢索需求,因此可用一維區(qū)間數(shù)Aij=[a-ij,a+ij]來記錄用戶的第j個(gè)檢索記錄在元素項(xiàng)xi上的檢索樣本值,a-ij、a+ij分別為檢索樣本值A(chǔ)ij的下限和上限,其中,i=2,3,4,j=1,2,…,p,p為檢索記錄的個(gè)數(shù)。令I(lǐng)i表示包含所有p個(gè)檢索樣本值的最小區(qū)間
取步長rstepi將區(qū)間Ii均勻分割成大小相等的子區(qū)間,當(dāng)rstepi取最大值時(shí),則稱步長rstepi將Ii劃分hi個(gè)一維區(qū)間單元Iik
式(8)滿足以下兩個(gè)條件:
(2)對(duì)于具有二維覆蓋特性的元素項(xiàng)空間范圍x1,用戶的p個(gè)檢索樣本值可用二維區(qū)間數(shù)來表示,即,j=1,2,…,p。其中分別為第j個(gè)樣本經(jīng)度范圍的下限和上限分別為第j個(gè)樣本緯度范圍的下限和上限。令D表示包含所有p個(gè)檢索樣本值的最小二維區(qū)間,則
式中,Dx表示包含所有p個(gè)檢索樣本經(jīng)度范圍的最小區(qū)間;和分別為Dx的下限和上限;Dy表示包含所有p個(gè)檢索樣本緯度范圍的最小區(qū)間;和分別為Dy的下限和上限
式中,k=1,2,…,hx(hx為沿經(jīng)度方向分割Dx得到的單元個(gè)數(shù));l=1,2,…,hy(hy為沿緯度方向分割Dy得到的單元個(gè)數(shù))。
(3)對(duì)于搜索條件不具備區(qū)間形式的元素項(xiàng),為了統(tǒng)一描述,可用上下限相等的一維區(qū)間數(shù)(退化為普通實(shí)數(shù))來記錄檢索樣本值的范圍,其分布范圍和步長的確定與波譜范圍等一維區(qū)間元素項(xiàng)一致。
對(duì)于同一元素項(xiàng)而言,那些被檢索頻率高的區(qū)間也比頻率低的區(qū)間凝聚了更多的用戶興趣,例如相比只檢索過一兩次的地區(qū),用戶反復(fù)檢索的地區(qū)必然是用戶更感興趣的地區(qū)。
在文本檢索領(lǐng)域中,常采用TF-IDF技術(shù)根據(jù)關(guān)鍵詞-頻率來表達(dá)關(guān)鍵字在文檔檢索中的重要程度,詞頻越高,重要性就越大,反之則越低。借鑒這一思想,步長劃分得到的區(qū)間單元在用戶檢索樣本中出現(xiàn)的頻率也能反映用戶的興趣,出現(xiàn)頻率越高的區(qū)間單元,凝聚的用戶興趣也就越高,反之則越小。因此,遙感信息用戶模型利用分布范圍和步長R及其分布特征向量V來描述用戶興趣在不同區(qū)間上的分布特征。即對(duì)區(qū)間單元的出現(xiàn)頻率進(jìn)行線性變換,將這種出現(xiàn)頻率映射到合理的取值范圍,使得分布特征值對(duì)不同區(qū)間單元的重要程度具有較好的區(qū)分能力[11]。
(1)對(duì)于采用一維區(qū)間數(shù)表示的元素項(xiàng)時(shí)間范圍x2、波譜范圍x3和空間分辨率范圍x4,元素項(xiàng)xi(i=2,3,4)各區(qū)間單元Iik(k=1,2,…,hi)的分布特征值vik的計(jì)算方法如式(12)所示
式中,fik表示元素項(xiàng)xi的第k個(gè)區(qū)間單元Iik在p個(gè)檢索記錄中的出現(xiàn)頻率,計(jì)算方法如式(13)所示
式中,Aij為第j個(gè)檢索記錄元素項(xiàng)xi的樣本值;Iik為第k個(gè)區(qū)間單元;IA(·)為示性函數(shù);當(dāng)Aij∩Iik非空時(shí)為1,空集時(shí)為0。
區(qū)間單元Iik對(duì)應(yīng)的分布特征值vik越大,意味著Iik在用戶檢索記錄中出現(xiàn)越頻繁,本文定義一維分布特征函數(shù)v(x)描述分布特征值隨區(qū)間的分布
(2)對(duì)于采用二維區(qū)間數(shù)表示的元素項(xiàng)空間范圍x1,二維區(qū)間單元Dkl的分布特征值vkl的計(jì)算方法見式(15)
式中,A1j為第j個(gè)檢索記錄的空間范圍樣本值;Dkl為第k個(gè)經(jīng)度區(qū)間單元和第l個(gè)緯度區(qū)間單元共同確定的二維區(qū)間單元;ID(·)為示性函數(shù);當(dāng)A1j∩Dkl非空時(shí)為1,空集時(shí)為0。
本文定義分布特征函數(shù)vD(x,y)描述分布特征值隨二維區(qū)間的分布,如式(17)所示
式中,fkl表示二維區(qū)間單元Dkl在p個(gè)檢索記錄中的出現(xiàn)概率,計(jì)算方法如式(16)所示
根據(jù)用戶興趣進(jìn)行遙感信息的個(gè)性化、主動(dòng)推薦,是實(shí)現(xiàn)智能服務(wù)的核心。本文提出了用戶模型驅(qū)動(dòng)的遙感信息主動(dòng)推薦方法,首先從用戶模型獲取滿足用戶興趣的理想解;接著,構(gòu)造了多屬性決策矩陣將待分發(fā)遙感信息的主動(dòng)推薦問題轉(zhuǎn)化為多屬性決策問題;然后,設(shè)計(jì)了關(guān)聯(lián)函數(shù)定量計(jì)算待分發(fā)信息在各個(gè)元素項(xiàng)上對(duì)理想解的滿足程度;最后,計(jì)算各待分發(fā)信息的效用度,從而實(shí)現(xiàn)了基于用戶興趣的遙感信息主動(dòng)推薦。用戶模型驅(qū)動(dòng)的主動(dòng)推薦方法流程圖如圖2所示。
圖2 遙感信息推薦流程圖Fig.2 Remote sensing information recommendation flowchart
所謂理想解是指設(shè)想的最優(yōu)解(方案)[16]?;谏鲜鲇脩裟P?,在n個(gè)元素項(xiàng)上都具有最大分布特征值的區(qū)間單元所組成的集合構(gòu)成理想解A*
如果將待分發(fā)的遙感信息集B={B1,B2,…,Bm}作為備選方案集,將Bj的各元素項(xiàng)X={x1,x2,x3,x4}作為決策屬性集,Bij為第j 個(gè)待分發(fā)遙感信息在元素項(xiàng)xi的值,矩陣(Bij)n×m表示備選方案集B關(guān)于決策屬性集X的決策矩陣,則遙感信息的主動(dòng)推薦問題可以轉(zhuǎn)化為多屬性決策問題,即從備選方案集中選擇滿意解(滿足用戶興趣的遙感信息集)的過程。
在可拓學(xué)中,采用關(guān)聯(lián)函數(shù)來刻畫論域中的元素具有某種性質(zhì)的程度[17],本文定義關(guān)聯(lián)函數(shù)來評(píng)價(jià)待分發(fā)遙感信息在各元素項(xiàng)xi上對(duì)用戶興趣的滿足程度。常用的相似度衡量標(biāo)準(zhǔn)有距離和夾角余弦[6],文獻(xiàn)[11—12]均采用距離標(biāo)準(zhǔn),但是這兩類標(biāo)準(zhǔn)更適合于衡量點(diǎn)之間的相似度??臻g范圍和波譜范圍等屬性本身具有覆蓋特性,因此衡量其是否滿足用戶興趣的標(biāo)準(zhǔn)在于是否包含或者重疊了感興趣的范圍,而不是距離上的接近。本文針對(duì)覆蓋特性,分析了元素項(xiàng)xi的理想解與待分發(fā)信息Bj的區(qū)間范圍Bij之間的拓?fù)潢P(guān)系,設(shè)計(jì)了關(guān)聯(lián)函數(shù)。
3.3.1 波譜范圍元素項(xiàng)的關(guān)聯(lián)函數(shù)
對(duì)于一維區(qū)間,待分發(fā)信息Bj波譜范圍所在區(qū)間B3j與理想解之間存在6種拓?fù)潢P(guān)系:相離、疊加、相等、相接、包含于和包含。對(duì)B3j進(jìn)行線性變換,目的是將B3j的中心平移至所在區(qū)間的中心,如式(19)所示
表1 變換前后一維區(qū)間拓?fù)潢P(guān)系的變化Tab.1 The change of topological relationship after transformation
設(shè)計(jì)波譜范圍的關(guān)聯(lián)函數(shù)如式(20)所示
式中,z3j代表B3j與的關(guān)聯(lián)度,Interest()、Interest(B3j)、Interest)分別為的興趣度、B3j的興趣度和的興趣度。對(duì)于一維區(qū)間[a,b],凝聚在[a,b]上的興趣度是對(duì)分布在區(qū)間[a,b]上的分布特征函數(shù)v(x)作定積分,如式(21)所示
3.3.2 空間范圍元素項(xiàng)的關(guān)聯(lián)函數(shù)
傳統(tǒng)的可拓學(xué)是建立在一個(gè)維度上,而由經(jīng)緯度描述的空間范圍存在于二維空間,其復(fù)雜性呈指數(shù)增長。將空間范圍理想解所在的二維區(qū)間稱為A*1,第j個(gè)待分發(fā)信息空間范圍所在的二維區(qū)間稱為B1j,參考九交模型[18],則A*1與B1j之間的拓?fù)潢P(guān)系共存在36種不同的情形,見表2。
表2 與B 1j在二維區(qū)間上的拓?fù)潢P(guān)系(變換前)Tab.2 The topological relationship between and B1 j(before transformation)
表2 與B 1j在二維區(qū)間上的拓?fù)潢P(guān)系(變換前)Tab.2 The topological relationship between and B1 j(before transformation)
經(jīng)度緯度相離 疊加 相等 相接 包含于 包含相離 相離 相離 相離 相離 相離 相離疊加 相離 疊加 疊加 相接 疊加 疊加相等 相離 疊加 相等 相接 被覆蓋 覆蓋相接 相離 相接 相接 相接 相接 相接包含于 相離 疊加 被覆蓋 相接 包含于 疊加包含 相離 疊加 覆蓋 相接 疊加 包含
對(duì)二維區(qū)間B1j進(jìn)行線性變換,目的是將B1j的中心平移至的中心,如式(22)所示
表3 與在二維區(qū)間上的拓?fù)潢P(guān)系(變換后)Tab.3 The topological relationship between and(after transformation)
表3 與在二維區(qū)間上的拓?fù)潢P(guān)系(變換后)Tab.3 The topological relationship between and(after transformation)
經(jīng)度緯度相離 疊加 相等 相接 包含于 包含相離 N/A N/A N/A N/A N/A N/A疊加 N/A N/A N/A N/A N/A N/A相等 N/A N/A 相等 N/A 被覆蓋 覆蓋相接 N/A N/A N/A N/A N/A N/A包含于 N/A N/A 被覆蓋 N/A 包含于 疊加包含 N/A N/A 覆蓋 N/A 疊加 包含
根據(jù)變換前后B1j、與的拓?fù)潢P(guān)系,設(shè)計(jì)關(guān)聯(lián)函數(shù)如式(23)所示
式中,z1j代表B1j與的關(guān)聯(lián)度;Interest()、Interest(B1j)、Interest)分別為、B1j和的興趣度。
對(duì)于二維區(qū)間〈[a,b],[c,d]〉,凝聚在〈[a,b],[c,d]〉上的興趣度是對(duì)分布在〈[a,b],[c,d]〉上的分布特征函數(shù)作定積分,如式(24)所示
3.3.3 時(shí)間范圍與空間分辨率元素項(xiàng)的關(guān)聯(lián)函數(shù)
與波譜范圍類似,用戶在對(duì)時(shí)間和空間分辨率進(jìn)行檢索時(shí),常采用區(qū)間數(shù)來表達(dá)需求范圍。但是由于遙感成像幾乎是瞬時(shí)完成的,因此待分發(fā)信息的時(shí)間元素項(xiàng)更適合作為一個(gè)點(diǎn)來處理??臻g分辨率亦是如此。對(duì)于這兩類元素項(xiàng),其理想解與待分發(fā)信息只存在兩種關(guān)系,即包含和相離。在相離的情況下,與理想解的距離越小,則對(duì)用戶興趣的滿足程度越大。因此這兩類元素項(xiàng)的關(guān)聯(lián)函數(shù)不同于上述情況,如式(25)所示
式中,zij代表Bij與理想解的關(guān)聯(lián)度;bij同時(shí)為Bij的下限和上限(此時(shí)區(qū)間退化為一個(gè)實(shí)數(shù));vB為Bij所落入?yún)^(qū)間單元的分布特征值。
從決策理論的角度來看,效用度指備選方案與理想解的相對(duì)貼近程度,效用度越大則該方案越接近理想解,越能滿足用戶的興趣[19-20]。因此,可以通過計(jì)算效用度來定量評(píng)價(jià)待分發(fā)信息對(duì)用戶興趣的滿足程度,備選方案Bj的效用度uj即為各個(gè)元素項(xiàng)關(guān)聯(lián)度zij的加權(quán)和,計(jì)算方法如式(26)所示
式中,zij為Bij與理想解的關(guān)聯(lián)度;wi為元素項(xiàng)xi的權(quán)重。
為了便于對(duì)比分析,本文選擇文獻(xiàn)[11—12]中的檢索記錄生成用戶模型,包含5項(xiàng)元數(shù)據(jù)項(xiàng):經(jīng)度范圍、緯度范圍、時(shí)間范圍、波譜范圍和空間分辨率范圍,檢索總次數(shù)15次。收集到的檢索記錄樣本值如下。
(1)地理經(jīng)度范圍(東經(jīng),單位為度):{[100.00,110.00],[101.00,108.00],[101.00,106.00],[101.00,104.00],[102.00,104.00],[102.50,104.00],[101.50,104.00],[102.00,104.00],[102.50,104.00],[101.50,104.00],[101.00,104.00]}
(2)地理緯度范圍(北緯,單位為度):{[28.00,34.00],[28.00,33.00],[29.00,32.00],[29.00,32.00],[30.00,32.00],[30.50,32.00],[30.00,32.00],[31.00,32.00],[31.00,32.00],[31.00,32.00],[31.00,32.00]}
(3)時(shí)間范圍(格式:年年年年月月日日):{[20080410,20080514],[20080510,20080515],[20080509,20080514],[20080509,20080513],[20080510,20080513],[20080507,20080520],[20080510,20080519],[20080508,20080520],[20080501,20080601],[20080510,20080610]}
(4)波譜范圍(單位μm):{[0.40,14.50],[0.45,0.90],[0.50,0.80],[0.50,0.80],[0.40,0.90],[0.40,14.50],[0.40,0.90]}
(5)空間分辨率范圍(單位 m):{[0.1,30.0],[0.1,10.0],[10.0,10.0],[0.1,3.0],[1.0,2.5],[0.1,30.0],[0.1,10.0],[30.0,500.0],[0.1,30.0]}
經(jīng)緯度范圍的最小二維區(qū)間D=〈[100.00,110.00],[28.00,34.00]〉,經(jīng)度方向取最大步長=0.50,則沿經(jīng)度方向均勻分割為20個(gè)區(qū)間單元,緯度方向取最大步長=0.50,則沿緯度方向均勻分割為12個(gè)區(qū)間單元。現(xiàn)將經(jīng)緯度綜合考慮,則共劃分240個(gè)二維區(qū)間單元,其特征值分布如圖3所示。時(shí)間范圍元素項(xiàng)x2的最小區(qū)間I2=[20080410,20080610],取最大步長=1,則I2均勻分割為61個(gè)區(qū)間單元,其分布特征值如圖4所示。波譜范圍元素項(xiàng)x3的最小區(qū)間I3=[0.40,14.50],取最大步長=0.05,則I3均勻分割為282個(gè)區(qū)間單元,其分布特征值如圖5所示??臻g分辨率范圍元素項(xiàng)x4的最小區(qū)間I4=[0.1,500.0],取最大步長=0.10,則I4均勻分割為4999個(gè)區(qū)間單元,其分布特征值如圖6所示。
圖3 空間范圍的用戶興趣特征分布Fig.3 User interest feature distribution of spatial range
圖4 時(shí)間范圍的用戶興趣特征分布Fig.4 User interest feature distribution of time range
圖5 波譜范圍的用戶興趣特征分布User interest feature distribution of spectral range
圖6 空間分辨率范圍的用戶興趣特征分布Fig.6 User interest feature distribution of resolutionrange
取各元素項(xiàng)上具有最大的分布特征值的區(qū)間單元構(gòu)成的集合,得到理想解A*={〈[102.5,104.5],[31.0,32.5]〉,[20080510,20080514],[0.5,0.85],[1,3]}
模擬生成近一段時(shí)間用戶對(duì)各元素項(xiàng)的檢索次數(shù)如表4所示,然后根據(jù)2.1節(jié)的熵權(quán)法得到用戶模型各元素項(xiàng)的權(quán)值,將該結(jié)果與文獻(xiàn)[11,12]中的元素項(xiàng)權(quán)值對(duì)比如表5所示。
表4 各元素項(xiàng)的檢索次數(shù)Tab.4 The retrieval times of each element
表5 用戶模型各元素項(xiàng)的權(quán)值Tab.5 The weight of each element of user profile
選擇文獻(xiàn)[11,12]中方案1—方案7的試驗(yàn)數(shù)據(jù)作為備選方案集,{x1,x2,x3,x4}作為決策屬性集,建立決策矩陣如式(27)所示。
利用3.3定義的關(guān)聯(lián)函數(shù)計(jì)算各元素項(xiàng)的關(guān)聯(lián)度及各備選方案的效用度如表6所示。
表6 本文各備選方案效用度與各元素項(xiàng)的關(guān)聯(lián)度Tab.6 Correlation degree and utility degree of alternative schemes
決策方案的排序?yàn)椋悍桨?>方案5>方案4>方案2>方案3>方案6>方案7。若設(shè)置閾值為0.5,則滿足用戶興趣的待分發(fā)數(shù)據(jù)集為{方案1,方案2,方案3,方案4,方案5}。對(duì)比發(fā)現(xiàn),本文所得的7個(gè)方案的效用度排序與文獻(xiàn)[11—12]的結(jié)果大體一致,但相較于其他兩種模型,本模型中各方案的效用度均存在不同程度的變化,原因主要有以下幾點(diǎn):①本文利用熵權(quán)法根據(jù)用戶近期的檢索行為數(shù)據(jù)求解元素項(xiàng)的權(quán)值,權(quán)值會(huì)隨時(shí)間推移發(fā)生變化,提高了用戶模型的時(shí)效性;②相較于其他兩種模型,空間范圍的權(quán)重有所增加,這是由于本文將經(jīng)度和緯度綜合起來作為一個(gè)整體考慮,文獻(xiàn)[11—12]將經(jīng)度和緯度作為兩個(gè)獨(dú)立的元素項(xiàng)會(huì)降低效用度的計(jì)算結(jié)果的準(zhǔn)確性,比如某些在二維空間上根本不相交的空間范圍,其在經(jīng)度或緯度上的分量卻可能是相交或相等的,相比而言,本方法更符合遙感信息在空間上的二維覆蓋特征;③本文將關(guān)聯(lián)度引入模型的構(gòu)建中,從一維和二維空間上分析了不同元素項(xiàng)的覆蓋區(qū)間與理想解之間的拓?fù)潢P(guān)系,其反映各方案優(yōu)劣程度的準(zhǔn)確性更高。
遙感信息多源、多時(shí)相、多分辨率的特點(diǎn)使得用戶興趣特征的獲取與描述存在困難,目前仍然欠缺主動(dòng)、個(gè)性化、準(zhǔn)確的遙感信息服務(wù)方法。建立用戶模型是發(fā)現(xiàn)和獲取與用戶興趣相關(guān)的知識(shí)的過程,是實(shí)現(xiàn)智能服務(wù)的基礎(chǔ)。本文在現(xiàn)有遙感信息用戶模型的基礎(chǔ)上加以改進(jìn),根據(jù)用戶近期的檢索歷史記錄采用熵權(quán)法確定權(quán)重,提高了模型的時(shí)效性。本文提出了用戶模型驅(qū)動(dòng)的遙感信息主動(dòng)推薦方法,通過構(gòu)建決策矩陣將主動(dòng)推薦問題轉(zhuǎn)化為多屬性決策問題;引入了關(guān)聯(lián)度、興趣度和效用度等概念用于描述待分發(fā)信息對(duì)用戶興趣的滿足程度;通過分析待分發(fā)信息與理想解覆蓋區(qū)間之間的拓?fù)潢P(guān)系,探索性地建立了關(guān)聯(lián)函數(shù)定量計(jì)算關(guān)聯(lián)度。試驗(yàn)表明,本文方法能夠從用戶的檢索記錄中獲取用戶的興趣特征,提高了遙感信息智能服務(wù)的準(zhǔn)確度。
本文只針對(duì)4項(xiàng)核心元數(shù)據(jù)進(jìn)行了分析,今后將繼續(xù)根據(jù)其他元數(shù)據(jù)(如傳感器、軌道號(hào)、產(chǎn)品級(jí)別、數(shù)據(jù)質(zhì)量等)研究用戶興趣的建模和評(píng)價(jià)方法。此外,關(guān)聯(lián)函數(shù)還有待于進(jìn)一步優(yōu)化。以空間分辨率為例,由于低分辨率的影像可由高分辨率影像重采樣而來,因此分辨率高于理想解的遙感信息的關(guān)聯(lián)度應(yīng)大于分辨率低于理想解的遙感信息的關(guān)聯(lián)度。這就要求在設(shè)計(jì)關(guān)聯(lián)函數(shù)時(shí),除了考慮區(qū)間覆蓋的拓?fù)潢P(guān)系外,還應(yīng)該與實(shí)際應(yīng)用相關(guān)聯(lián),才能不斷提升遙感信息服務(wù)的智能化水平。
[1] LI Deren,ZHANG Liangpei,XIA Guisong.Automatic A-nalysis and Mining of Remote Sensing Big Data[J].Acta Geodaetica et Cartographica Sinica,2014,43(12):1211-1216.(李德仁,張良培,夏桂松.遙感大數(shù)據(jù)自動(dòng)分析與數(shù)據(jù)挖掘[J].測繪學(xué)報(bào),2014,43(12):1211-1216.)
[2] XU Hailing,WU Xiao,LI Xiaodong,et al.Comparison Study of Internet Recommendation System[J].Journal of Software,2009,20(2):350-362.(許海玲,吳瀟,李曉東,等.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009,20(2):350-362.)
[3] LIU Lin,LI Deren,LI Wanwu,et al.Thoughts on Smarter Planet from the View of Geomatics[J].Geomatics and Information Science of Wuhan University,2012,37(10):1248-1251.(柳林,李德仁,李萬武,等.從地球空間信息學(xué)的角度對(duì)智慧地球的若干思考[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2012,37(10):1248-1251.)
[4] WU Lihua,LIU Lu.User Profiling for Personalized Recommending Systems:A Review[J].Journal of the China Society for Scientific and Technical Information,2006,25(1):55-62.(吳麗花,劉魯.個(gè)性化推薦系統(tǒng)用戶建模技術(shù)綜述[J].情報(bào)學(xué)報(bào),2006,25(1):55-62.)
[5] ZENG Chun,XING Chunxiao,ZHOU Lizhu.A Survey of Personalization Technology[J].Journal of Software,2002,13(10):1952-1961.(曾春,邢春曉,周立柱.個(gè)性化服務(wù)技術(shù)綜述[J].軟件學(xué)報(bào),2002,13(10):1952-1961.)
[6] LIU Jianguo,ZHOU Tao,WANG Binghong.Progress of the Personalized Recommendation Systems[J].Progress of Nature and Science,2009,19(1):1-15.(劉建國,周濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展[J].自然科學(xué)進(jìn)展,2009,19(1):1-15.)
[7] LINDEN G,SMITH B,YORK J.Amazon.com Recommendations:Item-to-item Collaborative Filtering[J].IEEE Internet Computing,2003,7(1):76-80.
[8] WANG Zegen,H UA Yixin.Research on Technology of Active Spatial Information Service[J].Acta Geodaetica et Cartographica Sinica,2006,35(4):379-384,389.(王澤根,華一新.主動(dòng)空間信息服務(wù)技術(shù)研究[J].測繪學(xué)報(bào),2006,35(4):379-384,389.)
[9] MOU Naixia,LIU Wenbao,ZHANG Lingxian,et al.Personalized Recommendations on Spatial Information Services[J].Science of Surveying and Mapping,2011,36(3):104-106.(牟乃夏,劉文寶,張靈先,等.空間信息服務(wù)的個(gè)性化問題[J].測繪科學(xué),2011,36(3):104-106.)
[10] XIA Yu,ZH U Xinyan.Intelligent Spatial Information Delivery Decision-making by Using Interval Analysis[J].Geomatics and Information Science of Wuhan University,2013,38(9):1103-1107.(夏宇,朱欣焰.利用區(qū)間分析的空間信息智能分發(fā)決策[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2013,38(9):1103-1107.)
[11] XIA Yu.The User Profile Model for Intelligent Delivery of Spatial Information[D].Wuhan:Wuhan University,2009.(夏宇.面向空間信息智能分發(fā)的用戶偏好模型研究[D].武漢:武漢大學(xué),2009.)
[12] LI Xinguang,F(xiàn)AN Minghu,DU Wu.Research on Dynamic User Profile Model for Intelligent Distribution of Spatial Information[J].Acta Geodaetica et Cartographica Sinica,2011,40(5):646-654.(李新廣,范明虎,杜武.面向空間信息智能分發(fā)的動(dòng)態(tài)化用戶偏好模型研究[J].測繪學(xué)報(bào),2011,40(5):646-654.)
[13] HAWALAH A,F(xiàn)ASLI M.Utilizing Contextual Ontological User Profiles for Personalized Recommendations[J].Expert Systems with Applications,2014,41(10):4777-4797.
[14] H AWALA H A,F(xiàn)ASLI M.Dynamic User Profiles for Web Personalisation[J].Expert Systems with Applications,2015,42(5):2547-2569.
[15] COVER T M,THOMAS J A.Elements of Information Theory[M].New York:Wiley-Interscience,2006.
[16] GIOVE S.Interval TOPSIS for Multicriteria Decision Making[C]∥ MARINARO M,TAGLIAFERRI R.Proceedings of the 13th Italian Workshop on Neural Nets-Revised Papers.Lecture Notes in Computer Science.Berlin:Springer,2002:56-63.
[17] CAI Wen.Extension Theory and Its Application[J].Chinese Science Bulletin,1999,44(17):1538-1548.(蔡文.可拓論及其應(yīng)用[J].科學(xué)通報(bào),1999,44(7):673-681.)
[18] EGENHOFER M J.Deriving the Composition of Binary Topological Relations[J].Journal of Visual Languages and Computing,1994,5(2):133-149.
[19] YOONK P.System Selection by Multiple Attribute Decision Making[D].Manhattan:Kansas State University,1980.
[20] TZENG G H,HUANG J J.Multiple Attributes Decision Making:Methods and Applications[M].Boca Raton:CRC Press,2011.