国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)下的空間數(shù)據(jù)挖掘思考

2021-11-10 08:59:53鄧奇夏冰
科學(xué)與生活 2021年21期
關(guān)鍵詞:空間數(shù)據(jù)大數(shù)據(jù)

鄧奇 夏冰

摘要:大數(shù)據(jù)作為一門新興的學(xué)科,有著廣泛的應(yīng)用,空間數(shù)據(jù)作為大數(shù)據(jù)的重要構(gòu)成部分,對現(xiàn)實世界眾多領(lǐng)域都有著重大的意義。但是空間數(shù)據(jù)由于其自身數(shù)量龐大、復(fù)雜、價值度低、且大量冗余的特性具有難以分析研究的特性,本文對目前大數(shù)據(jù)下空間數(shù)據(jù)的作用、研究方式如大數(shù)據(jù)的基本研究方法、空間數(shù)據(jù)的研究指導(dǎo)思想和空間數(shù)據(jù)的具體研究方式做了敘述和分析,對其發(fā)展的方向做了預(yù)測。

關(guān)鍵詞:大數(shù)據(jù);空間數(shù)據(jù);挖掘思考

前言:由于互聯(lián)網(wǎng)的普及,大數(shù)據(jù)學(xué)科孕育而生,并且獲得了飛速的發(fā)展??臻g數(shù)據(jù)由于對現(xiàn)實世界的緊密影響,探索大數(shù)據(jù)下的空間數(shù)據(jù)具有十分重要的價值,因此,本文將對目前空間數(shù)據(jù)挖掘時碰見的問題、意義進行分析研究,為大數(shù)據(jù)下的空間數(shù)據(jù)挖掘思考提供理論依據(jù)和發(fā)展指導(dǎo)。

1大數(shù)據(jù)的空間數(shù)據(jù)

1.1大數(shù)據(jù)和空間數(shù)據(jù)的概念

隨著信息的不斷產(chǎn)生,以及網(wǎng)絡(luò)對數(shù)據(jù)的加持和管理,大數(shù)據(jù)已經(jīng)融入到生活的各個方面,由于大數(shù)據(jù)具有大量、多樣、高速、低密度、真實性的特點,處理大數(shù)據(jù)成為了目前一個研究難點,而大數(shù)據(jù)的處理結(jié)果將直接影響到企業(yè)、社會、國家的宏觀決策指定。而空間數(shù)據(jù)是大數(shù)據(jù)的一大組成部分,空間數(shù)據(jù)是現(xiàn)實數(shù)據(jù)在虛擬世界的影射,是現(xiàn)實世界的鏡像??臻g數(shù)據(jù)的數(shù)據(jù)值與現(xiàn)實世界一一對應(yīng),其關(guān)聯(lián)性巨大,關(guān)系復(fù)雜,數(shù)據(jù)量大且會隨著時間的變化而變化。

1.2空間數(shù)據(jù)的特點

空間數(shù)據(jù)的增長很快,但是重復(fù)數(shù)據(jù)較多,數(shù)據(jù)冗余形成了空間數(shù)據(jù)垃圾較多的特點。由于現(xiàn)在互聯(lián)網(wǎng)的復(fù)制性,同樣的數(shù)據(jù)在不同的信息儲存中重復(fù)出現(xiàn)帶來了許多空間數(shù)據(jù)垃圾,且由于空間是變化的,而空間數(shù)據(jù)是空間的影射,因此伴隨著空間的不斷變化,空間數(shù)據(jù)的數(shù)量時時刻刻都在增加著,而過去的空間數(shù)據(jù)不會憑空消失,因此形成了空間數(shù)據(jù)的迭代和堆疊。處理現(xiàn)有的空間數(shù)據(jù)需要利用科學(xué)的手段,常規(guī)的處理辦法已經(jīng)遠遠不夠應(yīng)對空間數(shù)據(jù)的激增??臻g數(shù)據(jù)是對現(xiàn)實世界的建模,由于觀測渠道的單一性,空間數(shù)據(jù)的準(zhǔn)確率的平均值達不到95%,而誤差是絕對存在的,系統(tǒng)誤差、隨機誤差的影響又拉低了空間數(shù)據(jù)的準(zhǔn)確率,形成了空間數(shù)據(jù)污染嚴重的現(xiàn)象。而上述的兩種現(xiàn)象造成了空間數(shù)據(jù)難以被現(xiàn)有的處理方式分析利用,形成了利用難的問題。面對大量的垃圾信息,有價值的信息往往會被淹沒,難以利用。

1.3空間數(shù)據(jù)的作用

空間數(shù)據(jù)可以對現(xiàn)實世界進行全面地反映,大數(shù)據(jù)下空間數(shù)據(jù)的出現(xiàn),可以為人們更好地認識現(xiàn)實世界提供幫助,對空間的全局和關(guān)聯(lián)性提供有價值的參考?,F(xiàn)在,大量的空間數(shù)據(jù)被采集分析,人們因此建立了現(xiàn)實世界在虛擬世界的鏡像??梢詫μ鞖狻⒆匀粸?zāi)害進行預(yù)測和警示,對國家國防事業(yè)提供保障,對人民的衣食住行提供幫助,對地質(zhì)勘探提供理論支持,在航空領(lǐng)域、旅游業(yè)、運輸業(yè)、國防事業(yè)的發(fā)展提供了積極作用,展現(xiàn)了重大的現(xiàn)實意義。

2空間數(shù)據(jù)的挖掘方法

2.1大數(shù)據(jù)處理方式在空間數(shù)據(jù)上的應(yīng)用

大數(shù)據(jù)的技術(shù)包含五個層面,分別是采集、儲存、處理、表達和質(zhì)量評估。在對空間數(shù)據(jù)的挖掘上,同樣要通過這五個方式進行發(fā)掘,先利用現(xiàn)有設(shè)備對空間數(shù)據(jù)進行科學(xué)、真實、細微的采集,采集過程中要細心,避免隨機誤差對大數(shù)據(jù)采集造成的影響,條件允許的話可以多次采集求取均值,對采集結(jié)果進行信任性分析,完成上述步驟后利用大數(shù)據(jù)儲存技術(shù)進行保存。要建立大數(shù)據(jù)儲存平臺,利用數(shù)據(jù)庫的軟件基礎(chǔ)和實體儲存單元對空間數(shù)據(jù)進行儲存。保證大數(shù)據(jù)的擴展性、可靠性、方便讀寫性。利用大數(shù)據(jù)分析處理和表達的功能對空間數(shù)據(jù)進行歸納,對各項指標(biāo)進行客觀地表達和分析。而大數(shù)據(jù)質(zhì)量評估可以避免空間數(shù)據(jù)的測量失誤導(dǎo)致的誤差風(fēng)險,提供真實性保障。

2.2現(xiàn)實中對空間的認知升級

目前,人們對于空間的研究是建立在人們對于空間的認知上的,是空間數(shù)據(jù)挖掘的根本,現(xiàn)有的認知尺度遠遠不夠?qū)臻g進行全面而深刻的挖掘,因此對現(xiàn)在空間的認知升級同樣對空間數(shù)據(jù)的挖掘具有重大意義。而且空間數(shù)據(jù)和空間的認識是相輔相成的,做好空間數(shù)據(jù)同樣對空間的認知提升有著推動作用。

2.3利用AI輔助對空間數(shù)據(jù)的挖掘

目前AI人工智能方面取得了重要的突破和進展,通過AI對于空間數(shù)據(jù)的分析和研究,可以避免人為因素造成的影響。目前,利用人工智能對于大數(shù)據(jù)的挖掘是一個有著長遠未來的趨勢,只要空間一直處于變化的狀態(tài),空間數(shù)據(jù)的產(chǎn)生就不會停止,效率低下的處理方式不能及時準(zhǔn)確地利用空間數(shù)據(jù)對決策進行指導(dǎo),人工智能的快速化很好地解決了這一難點,對空間數(shù)據(jù)的應(yīng)用具有重要的現(xiàn)實意義。

2.4空間數(shù)據(jù)挖掘的常用方法及輔助決策模型

空間數(shù)據(jù)挖掘的常用方法有:統(tǒng)計法,聚類方法,關(guān)聯(lián)規(guī)則發(fā)掘方法,Rough集方法,神經(jīng)網(wǎng)絡(luò)方法,云理論,證據(jù)理論,模糊集理論,遺傳算法等算法。除此以外還有聚類檢測,決策樹方法等。以下對于一些常見輔助決策模型做一簡述:

2.4.1空間關(guān)聯(lián)規(guī)則挖掘方法 (Spatial Association Rule Mining Approach)

挖掘關(guān)聯(lián)規(guī)則首先由Agrawal等提出,主要是從超級市場銷售事務(wù)數(shù)據(jù)庫中發(fā)現(xiàn)顧客購買多種商品時的搭配規(guī)律。最著名的關(guān)聯(lián)規(guī)則挖掘算法是Agrawal提出的Apriori算法,其主要思路是統(tǒng)計多種商品在一次購買中共同出現(xiàn)的頻數(shù),然后將出現(xiàn)頻數(shù)多的搭配轉(zhuǎn)換為關(guān)聯(lián)規(guī)則。Apriori算法是常用的用于挖掘出數(shù)據(jù)關(guān)聯(lián)規(guī)則的算法,它用來找出數(shù)據(jù)值中頻繁出現(xiàn)的數(shù)據(jù)集合,找出這些集合的模式有助于我們做一些決策。

2.4.2聚類方法 (Clustering Approach)和分類方法 (Classification Approach)

聚類是按一定的距離或相似性系數(shù)將數(shù)據(jù)分成一系列相互區(qū)分的組,根據(jù)定義可以把其分為四類:基于層次的聚類方法;分區(qū)聚類算法;基于密度的聚類算法;網(wǎng)格的聚類算法。常用的經(jīng)典聚類方法有K-mean,K-medoids,ISODATA等。

分類就是假定數(shù)據(jù)庫中的每個對象(在關(guān)系數(shù)據(jù)庫中對象是元組)屬于一個預(yù)先給定的類,從而將數(shù)據(jù)庫中的數(shù)據(jù)分配到給定的類中,簡單的講就是f:D→L,其中f的域D是屬性數(shù)據(jù)的空間,L是標(biāo)號的集合。

分類和聚類都是對目標(biāo)進行空間劃分,劃分的標(biāo)準(zhǔn)是類內(nèi)差別最小而類間差別最大。分類和聚類的區(qū)別在于分類事先知道類別數(shù)和各類的典型特征,而聚類則事先不知道。

3空間數(shù)據(jù)挖掘的應(yīng)用思考

空間數(shù)據(jù)挖掘有其獨特的空間定位屬性和擴展性,通過空間數(shù)據(jù)位置的關(guān)聯(lián)結(jié)構(gòu)進行分析,學(xué)習(xí)數(shù)據(jù)見不可見的空間位置邏輯關(guān)系,從而提供一定的預(yù)測分析??梢栽诒姸囝I(lǐng)域發(fā)揮重要作用,常見的方向可以用于精確定位系統(tǒng)、可視化后勤保障模型構(gòu)建、無人機空間立體運輸路徑選擇等輔助決策系統(tǒng)上,能夠較好的挖掘數(shù)據(jù)間不可見、不常見的關(guān)聯(lián)因素,從而結(jié)合空間定位做出隱性關(guān)聯(lián)分析,得到較好的分析挖掘結(jié)果。

結(jié)束語

大數(shù)據(jù)的發(fā)展進程將會更快,空間數(shù)據(jù)的發(fā)展和研究將越來越重要,大數(shù)據(jù)的空間數(shù)據(jù)挖掘也必定會成為輔助決策有效的分析手段,因此本文通過對大數(shù)據(jù)下的空間數(shù)據(jù)進行研究分析,對其概念、作用、研究方式、應(yīng)用方向等做了歸納和解析,對大數(shù)據(jù)下的空間數(shù)據(jù)研究以及在輔助決策等方面的應(yīng)用提供了思路。

參考資料

[1]孟小峰, 慈祥. 大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J]. 計算機研究與發(fā)展, 2013, 50(001):146-169.

[2]吳立新, 余接情, 楊宜舟,等. 基于地球系統(tǒng)空間格網(wǎng)的全球大數(shù)據(jù)空間關(guān)聯(lián)與共享服務(wù)[J]. 測繪科學(xué)技術(shù)學(xué)報, 2013(04):409-415.

[3]秦蕭, 甄峰, 熊麗芳, et al. 大數(shù)據(jù)時代城市時空間行為研究方法[J]. 地理科學(xué)進展, 2013, 032(009):1352-1361.

猜你喜歡
空間數(shù)據(jù)大數(shù)據(jù)
云GIS環(huán)境下分布式空間數(shù)據(jù)集成技術(shù)研究
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
元數(shù)據(jù)驅(qū)動的多中心空間數(shù)據(jù)同步方法研究
基于文件系統(tǒng)的分布式海量空間數(shù)據(jù)高效存儲與組織研究
嵌入式環(huán)境下地理空間數(shù)據(jù)組織技術(shù)研究
客戶端空間數(shù)據(jù)緩存策略
多源空間數(shù)據(jù)同名實體幾何匹配方法研究
舒城县| 秀山| 黄陵县| 得荣县| 阳西县| 施秉县| 错那县| 湛江市| 全椒县| 四平市| 克什克腾旗| 东方市| 五常市| 安阳市| 枞阳县| 广河县| 白城市| 开化县| 潢川县| 佛冈县| 上思县| 攀枝花市| 许昌县| 固阳县| 龙井市| 奉贤区| 库尔勒市| 日喀则市| 永胜县| 进贤县| 乡城县| 杭锦后旗| 句容市| 三亚市| 承德县| 郸城县| 永平县| 和林格尔县| 阳信县| 金门县| 尉氏县|