董玉霞,蘇榮聰
(泉州信息工程學(xué)院 軟件學(xué)院,福建 泉州 352000)
隨著云媒體和多媒體信息技術(shù)的發(fā)展,在云計(jì)算平臺(tái)中構(gòu)建可視化空間數(shù)據(jù)庫,結(jié)合大數(shù)據(jù)融合和特征分布式調(diào)度,實(shí)現(xiàn)可視化空間數(shù)據(jù)庫的優(yōu)化存儲(chǔ)和傳輸,從而提高大數(shù)據(jù)信息管理能力.因此,可視化空間數(shù)據(jù)庫被廣泛應(yīng)用于數(shù)據(jù)庫管理和大數(shù)據(jù)融合集成,研究可視化空間數(shù)據(jù)庫異構(gòu)智能化查詢技術(shù),通過空間分布式融合和特征聚類分析,構(gòu)建可視化空間數(shù)據(jù)庫的智能查詢的模型,提高數(shù)據(jù)融合和特征檢測能力,相關(guān)的可視化空間數(shù)據(jù)庫查詢方法研究在數(shù)據(jù)存儲(chǔ)和管理中具有重要意義[1].
研究可視化空間數(shù)據(jù)庫智能查詢系統(tǒng)設(shè)計(jì)是建立在對(duì)數(shù)據(jù)的特征重構(gòu)和數(shù)據(jù)挖掘的基礎(chǔ)上,結(jié)合對(duì)可視化空間數(shù)據(jù)庫的差異性特征聚類分析結(jié)果,通過模糊度擴(kuò)展分析,實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫智能查詢.當(dāng)前,對(duì)可視化空間數(shù)據(jù)庫智能查詢的方法主要有主成分特征分析的數(shù)據(jù)查詢方法、基于相似度特征融合的數(shù)據(jù)查詢方法及基于資源信息融合共享的數(shù)據(jù)查詢方法等[2-4],建立可視化空間數(shù)據(jù)庫智能查詢的相似度特征分布函數(shù),采用空間數(shù)據(jù)云計(jì)算技術(shù),實(shí)現(xiàn)可視化空間數(shù)據(jù)庫智能查詢.但是,上述方法進(jìn)行可視化空間數(shù)據(jù)庫智能查詢的錯(cuò)誤率較高,導(dǎo)致查準(zhǔn)率較低.
針對(duì)上述問題,設(shè)計(jì)基于Python語言的可視化空間數(shù)據(jù)庫智能查詢算法及系統(tǒng).構(gòu)建可視化空間數(shù)據(jù)庫的異構(gòu)存儲(chǔ)結(jié)構(gòu)模型,實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫的差異性數(shù)據(jù)聚類,根據(jù)數(shù)據(jù)的異構(gòu)聚類結(jié)果,結(jié)合隨機(jī)自適應(yīng)調(diào)度和子空間壓縮方法,實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫的智能查詢,提高可視化空間數(shù)據(jù)庫查詢數(shù)據(jù)的特征聚類性.最后進(jìn)行仿真測試分析,展示了本文方法在提高可視化空間數(shù)據(jù)庫智能查詢能力方面的優(yōu)越性能.
為了實(shí)現(xiàn)基于Python語言的可視化空間數(shù)據(jù)庫智能查詢系統(tǒng)優(yōu)化設(shè)計(jì),基于Python語言交叉編譯和仿真分析,構(gòu)建可視化空間數(shù)據(jù)庫智能查詢算法,采用嵌入式的交叉編譯算法[5],進(jìn)行可視化空間數(shù)據(jù)庫存儲(chǔ)的異構(gòu)查詢系統(tǒng)設(shè)計(jì).構(gòu)建可視化空間數(shù)據(jù)庫的異構(gòu)存儲(chǔ)結(jié)構(gòu)模型,如圖1所示.
圖1 可視化空間數(shù)據(jù)庫的異構(gòu)存儲(chǔ)結(jié)構(gòu)模型
假設(shè)R為可視化空間數(shù)據(jù)庫的布隆過濾參數(shù)分布集,用四元組(Ei,Ej,d,t)的可視化空間數(shù)據(jù)庫存儲(chǔ)的有向圖分布模型,通過泛化性擴(kuò)展查詢方法[7],得到可視化空間數(shù)據(jù)庫的特征分類屬性A={A1,A2,…,Am}.采用圖2所示的決策樹模型進(jìn)行可視化空間數(shù)據(jù)庫查詢的特征分解.
圖2 可視化空間數(shù)據(jù)庫查詢的特征分解決策樹
在圖2中,結(jié)合異構(gòu)融合和關(guān)聯(lián)規(guī)則檢測,在粗糙集模式下,得到可視化空間數(shù)據(jù)庫查詢的隱藏層加權(quán)特征分量
(1)
采用分布式大數(shù)據(jù)信息融合和特征重組技術(shù)實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫的異構(gòu)融合設(shè)計(jì),挖掘可視化空間數(shù)據(jù)庫的關(guān)聯(lián)規(guī)則和空間譜分布集[9];通過融合度聚類分析,進(jìn)行可視化空間數(shù)據(jù)庫的異構(gòu)樣本特征分解,得到可視化空間數(shù)據(jù)庫查詢優(yōu)化指標(biāo)(RT1,RT2);可視化空間數(shù)據(jù)庫的異構(gòu)樣本(u,v)∈E,采用五元組O=(C,I,P,Hc,R)表示可視化空間數(shù)據(jù)庫查詢的輸出容量.其中,C為數(shù)據(jù)查詢的負(fù)載量,I是可視化空間數(shù)據(jù)庫存儲(chǔ)結(jié)構(gòu)信息特征量.將數(shù)據(jù)集加載到 Spark SQL,得到數(shù)據(jù)異構(gòu)查詢的特征分布流
(2)
式中,p為對(duì)應(yīng)項(xiàng)集列中項(xiàng)集所在的事務(wù)集,n(t)為泛化性擴(kuò)展查詢的特征干擾項(xiàng),si(t)為可視化空間數(shù)據(jù)庫存儲(chǔ)的離散特征量,a(θi)為每次支持度都要訪問一次數(shù)據(jù)的多普勒窗口長度.此時(shí)通過匹配檢測自適應(yīng)尋優(yōu),得到可視化空間數(shù)據(jù)庫查詢輸出的有限域
(3)
(4)
(5)
式中,Mh為可視化空間數(shù)據(jù)庫差異性分布負(fù)載量.在產(chǎn)生一組聚類屬性特征V后,采用關(guān)聯(lián)規(guī)則挖掘和融合聚類,得到可視化空間數(shù)據(jù)庫差異性查詢的量化特征分布集[11].
挖掘可視化空間數(shù)據(jù)庫的關(guān)聯(lián)規(guī)則特征分布集,采用模糊度檢測和K均值聚類方法,實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫的差異性數(shù)據(jù)聚類.根據(jù)數(shù)據(jù)的異構(gòu)聚類結(jié)果[12],可視化空間數(shù)據(jù)庫的差異性數(shù)據(jù)聚類的窗口系數(shù)W給定時(shí),得到數(shù)據(jù)查詢輸出的聯(lián)合概率密度函數(shù)
(6)
(7)
采用隨機(jī)森林算法進(jìn)行可視化空間數(shù)據(jù)庫的主題詞信息融合[13],可視化空間數(shù)據(jù)庫的模式分析向量α=pπ/2.求解皮爾遜相關(guān)系數(shù):
L=(c+mk)+E(a)+Xk.
(8)
(9)
根據(jù)上述分析,實(shí)現(xiàn)可視化空間數(shù)據(jù)查詢輸出聚類處理[14].
(10)
式中,gj為特征向量相關(guān)程度參數(shù),實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫查詢的屬性分析,分類模型為w(b).通過融合聚簇特征分析方法,以離散程度較差的特征向量作為測試集,得到可視化空間數(shù)據(jù)庫查詢的傳輸信道容量,記為
yj(d)=an+x(k-1),…,x(k-M)+D.
(11)
式中,an表示可視化空間數(shù)據(jù)庫查詢的交叉融合特征分布集.在空間近鄰樣本中,通過模糊隸屬度特征檢測,得到可視化空間數(shù)據(jù)庫當(dāng)前特征子空間中的距離,為x(k-1),…,x(k-M).數(shù)據(jù)查詢的融合奇異值分布為
Ψ(h)=ωk+(p(i)+p(x))+yj(d).
(12)
式中,ωk滿足n個(gè)穩(wěn)定特征解,p(i)、p(x)為隨機(jī)自適應(yīng)調(diào)度和子空間壓縮方法參數(shù),實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫的智能查詢.把s(t)→s(t)、s(t)→s(f) 代入可視化空間數(shù)據(jù)庫的查詢離散分布序列,得到訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)融合輸出
wh(g)=n+m(x,y)+Ψ(h).
(13)
當(dāng)前特征子空間中信息查詢的時(shí)間分布滿足n∈[n1,n2].采用代價(jià)函數(shù)m(x,y)作為可視化空間數(shù)據(jù)庫查詢的差異性調(diào)節(jié)系數(shù),得到抽取特征子集
(14)
式中,iz為可視化空間數(shù)據(jù)庫的查詢特征參數(shù),a(s)、a(e)為異構(gòu)存儲(chǔ)優(yōu)化設(shè)計(jì)和特征聚類分析參數(shù).從而實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫的智能查詢,提高可視化空間數(shù)據(jù)庫查詢數(shù)據(jù)的特征聚類性.算法的實(shí)現(xiàn)流程如圖3所示.
圖3 算法的實(shí)現(xiàn)流程
為了驗(yàn)證本文方法在實(shí)現(xiàn)可視化空間數(shù)據(jù)庫智能查詢的應(yīng)用性能,進(jìn)行仿真測試分析.實(shí)驗(yàn)采用Python語言編程設(shè)計(jì),將可視化空間數(shù)據(jù)庫的數(shù)據(jù)查詢網(wǎng)格劃分為12個(gè)網(wǎng)格,每個(gè)分塊區(qū)域的數(shù)據(jù)片大小為24 kb,可視化空間數(shù)據(jù)庫的數(shù)據(jù)分布大小為1 024,可視化空間數(shù)據(jù)庫特征采樣的時(shí)間延遲τ=5 ms,數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù).根據(jù)上述參數(shù)設(shè)定,進(jìn)行可視化空間數(shù)據(jù)庫查詢,得到樣本數(shù)據(jù)分布,如圖4所示.
圖4 可視化空間數(shù)據(jù)庫的樣本數(shù)據(jù)分布
以圖4 的數(shù)據(jù)為測試對(duì)象,實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫查詢數(shù)據(jù)融合聚類分析,得到的聚類結(jié)果如圖5所示.
圖5 可視化空間數(shù)據(jù)庫查詢聚類結(jié)果
分析圖5,得知本文方法進(jìn)行可視化空間數(shù)據(jù)庫查詢的特征聚類性較好,測試不同方法進(jìn)行可視化空間數(shù)據(jù)庫智能查詢的錯(cuò)誤率,得到的對(duì)比結(jié)果如圖6所示.
圖6 數(shù)據(jù)查詢錯(cuò)誤率測試
分析圖6,得知本文方法進(jìn)行可視化空間數(shù)據(jù)庫查詢的錯(cuò)誤率在0.10以內(nèi),錯(cuò)誤率較低,查全率和查準(zhǔn)率較高,提高了數(shù)據(jù)的可靠性查詢能力.
1)為了提高可視化空間數(shù)據(jù)庫智能查詢能力,設(shè)計(jì)基于Python語言的可視化空間數(shù)據(jù)庫智能查詢系統(tǒng).
2)采用分布式大數(shù)據(jù)信息融合和特征重組技術(shù)實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫的異構(gòu)融合設(shè)計(jì),挖掘可視化空間數(shù)據(jù)庫的關(guān)聯(lián)規(guī)則和空間譜分布集,采用關(guān)聯(lián)規(guī)則挖掘和融合聚類,得到可視化空間數(shù)據(jù)庫差異性查詢的量化特征分布集.根據(jù)數(shù)據(jù)的異構(gòu)聚類結(jié)果,結(jié)合隨機(jī)自適應(yīng)調(diào)度和子空間壓縮方法,實(shí)現(xiàn)對(duì)可視化空間數(shù)據(jù)庫的融合解析特征分析.
3)分析得知,采用本文方法進(jìn)行可視化空間數(shù)據(jù)庫查詢的錯(cuò)誤率在0.10以內(nèi),錯(cuò)誤率較低,提高了數(shù)據(jù)的查準(zhǔn)率.