卜燦燦
(山東英才學院 山東 濟南 250104)
目前,要提升物聯(lián)網(wǎng)區(qū)塊鏈的數(shù)據(jù)挖掘水平,關鍵在于對數(shù)據(jù)進行聚類處理,而區(qū)塊鏈數(shù)據(jù)挖掘的基礎在于數(shù)據(jù)信息識別與特征提取,選擇模糊信息識別技術開發(fā)區(qū)塊鏈數(shù)據(jù),并與物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)特性相結合,創(chuàng)建區(qū)塊鏈數(shù)據(jù)信息分析模型,借助資源優(yōu)化調(diào)度與信息融合,實現(xiàn)區(qū)塊鏈數(shù)據(jù)聚類分析[1]。 對物聯(lián)網(wǎng)區(qū)塊鏈進行數(shù)據(jù)挖掘,是以數(shù)據(jù)的特性抽取和信息辨識為依據(jù),運用模糊信息辨識技術,設計物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的存鏈結構,并與其大數(shù)據(jù)的特性分布相結合,進行異質重組,實現(xiàn)對大數(shù)據(jù)的聚類分析。
現(xiàn)階段對物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)進行聚類的方法,包括K-Means 聚類法、網(wǎng)格區(qū)域聚類方法、粒子群聚類方法等。本文提出深度學習下的區(qū)塊鏈數(shù)據(jù)分片峰值聚類算法,首先分析區(qū)塊鏈數(shù)據(jù)結構特征,其次實施區(qū)塊鏈數(shù)據(jù)特征提取,與分片峰值聚類方法相結合,實現(xiàn)數(shù)據(jù)聚類優(yōu)化,最后展開仿真測試,并獲得有效性結論。
數(shù)據(jù)和事務都不會被第三方所掌控,這就是分布式賬本。 最早被Nakamoto 介紹為比特幣(Bitcoin,BTC)的一個重要組成部分,而在此之后,又有許多新的區(qū)塊鏈被應用到了各個領域。 但是,區(qū)塊鏈具有一定的共性,具體表現(xiàn)為:(1)復制賬本:將區(qū)域內(nèi)的各節(jié)點交易記錄保存在一個獨立的區(qū)域內(nèi),并將最近一次事件封裝為一個區(qū)域,使得各區(qū)域內(nèi)事件都可進行分配和拷貝。 (2)點對點網(wǎng)絡結構:各結點共用一個公用賬冊,沒有因特網(wǎng)的中心式管理參與方。 換句話說,所有的結點都是經(jīng)由一個點到點的網(wǎng)絡聯(lián)結的,并經(jīng)由這個網(wǎng)絡來將交易與區(qū)塊進行同步。(3)密碼學:在一個數(shù)據(jù)塊被接入到另一個數(shù)據(jù)塊上之前,整個數(shù)據(jù)塊上的數(shù)據(jù)必須是一致性。 其中,工作證明、利益證明以及拜占庭等是最為典型的一致性算法。 (4)加密:加密技術是區(qū)塊鏈網(wǎng)絡安全的基礎。 在區(qū)塊鏈的環(huán)境下,一個事務的完整性應該包含數(shù)字簽名以及私有數(shù)據(jù)結構(例如,梅克爾樹等)。 采用不對稱加密技術可以實現(xiàn)數(shù)據(jù)的隱私保護。 區(qū)塊鏈把不同的數(shù)據(jù)塊以一定的時間序列相互聯(lián)系起來,形成一種鏈狀的組織形式,每一個模塊都有各自的頭部和主體。
在這些區(qū)域中,區(qū)域頭等部分包含大部分確認信息,如版本號、時間戳、區(qū)域頭等。 模塊是對電網(wǎng)物聯(lián)網(wǎng)內(nèi)部和外部的信息進行收集和處理。 以區(qū)塊鏈為基礎,通過與其他節(jié)點之間的間接相互作用,可以避免在相互作用過程中受到網(wǎng)絡攻擊時密鑰泄露,保證數(shù)據(jù)的安全。 另外,這些信息僅由數(shù)字簽字組成,大大減少在區(qū)塊鏈中的數(shù)據(jù)傳送,從而可以縮短建立區(qū)塊鏈所需時間,確保資料的時效性。
現(xiàn)階段,物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類分析法包括K-Means聚類法、粒子群聚類法以及網(wǎng)格區(qū)域聚類法等,創(chuàng)建物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的特征提取與大數(shù)據(jù)分析模型,借助特征分布式檢測方法,實現(xiàn)物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類。
通過有向圖模型對物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)結構模型進行構建,選用統(tǒng)計分析法,獲得區(qū)塊鏈數(shù)據(jù)異構存儲模型,對其模糊聚類特征分布集進行計算,從而獲得融合度函數(shù)式
(1):
對區(qū)塊鏈數(shù)據(jù)集差異分布特征進行分析,獲得各插值點如式(2)所示:
式(2)中,dm+1(m)表示第m 點的區(qū)塊鏈數(shù)據(jù)預測值,dm+1(m)表示第m 點所采集區(qū)塊鏈數(shù)據(jù)特征量,依照區(qū)塊鏈數(shù)據(jù)特征,通過模糊C 均值聚類提取結果,并展開信息處理,假設全局變量,創(chuàng)建區(qū)塊鏈數(shù)據(jù)挖掘分割系數(shù)[2],即式(3)所示:
式(3)中Mi表示區(qū)塊鏈數(shù)據(jù)挖掘平均數(shù),Lm表示區(qū)塊鏈數(shù)據(jù)挖掘下界,fm表示區(qū)塊鏈數(shù)據(jù)均值,fless表示不同維度下的區(qū)塊鏈數(shù)據(jù)統(tǒng)計特征最小值[3]。
基于大數(shù)據(jù)背景,建立節(jié)點分布模型,并聚類優(yōu)化設計區(qū)塊鏈數(shù)據(jù)的分片峰值。 假設區(qū)塊鏈數(shù)據(jù)聚類節(jié)點屬性集是X={x1,x1,…,xn} ,設計聚類節(jié)點圖模型,通過語義本體模型構造處理區(qū)塊鏈數(shù)據(jù),借助自相關特征匹配,研究相似區(qū)塊鏈數(shù)據(jù)貼近度φ1,如式(4)所示:
假設(s1,a1),(s2,a2),…,(sn,an)是區(qū)塊鏈數(shù)據(jù)聚類的一組分布集,創(chuàng)建區(qū)塊鏈數(shù)據(jù)聚類模型,并統(tǒng)計分析數(shù)據(jù)聚類,實現(xiàn)自適應調(diào)度。 基于模糊語義融合聚類展開區(qū)塊鏈數(shù)據(jù)加權分析,從而獲得模糊加權分布向量,考慮到等價語義映射,展開物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)的融合分析。 創(chuàng)建物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)統(tǒng)計特征量,借助映射函數(shù)M 表示,M:C*C→r 對物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)相似度信息進行描述,采用空間聚類分析分布式調(diào)度區(qū)塊鏈數(shù)據(jù),創(chuàng)建本體模型,以展開區(qū)塊鏈數(shù)據(jù)特征聚類處理與語義相似度融合。
通過有向圖模型,對區(qū)塊鏈數(shù)據(jù)聚類節(jié)點結構模型進行構建,并在區(qū)塊鏈數(shù)據(jù)庫提取資源信息特征,假設{(s1,a1),(s2,a2),…,(sn,an)} 為區(qū)塊鏈數(shù)據(jù)語義特征分量,通過異構有向圖分析設計區(qū)塊鏈數(shù)據(jù)存儲結構,與特征空間重組相結合,實現(xiàn)區(qū)塊鏈數(shù)據(jù)結構的充足,以獲得優(yōu)化加權系數(shù)[4],即:w =((w1,a′1), (w2,a′2),…,(wn,a′n)T),wj∈[0,1] 。 通過統(tǒng)計分析實現(xiàn)區(qū)塊鏈數(shù)據(jù)聚類檢測,以獲得關聯(lián)性本體結構模型如式(5)所示:
轉化區(qū)塊鏈數(shù)據(jù)聚類特征問題為二元語義決策問題,其模糊特征匹配評估指標集Ek∈E(k =1,2,…,t),選擇主體詞匹配,對X 相似度函數(shù)進行分析,獲得區(qū)塊鏈數(shù)據(jù)隸屬度函數(shù)如式(6)所示:
選擇決策樹模型實現(xiàn)區(qū)塊鏈數(shù)據(jù)特征重構,遞歸圖模型內(nèi),選擇相空間重構法,進行模糊特征信息采樣,以獲得區(qū)塊鏈數(shù)據(jù)信息加群權重向量,其特征分布矩陣為式(8)所示:
式(8)中,c 表示區(qū)塊鏈數(shù)據(jù)聚類搜索步數(shù),μik表示區(qū)塊鏈數(shù)據(jù)關聯(lián)決策系數(shù)[5]。
基于以上分析,實現(xiàn)區(qū)塊鏈數(shù)據(jù)優(yōu)化調(diào)度與特征分析,獲得區(qū)塊鏈數(shù)據(jù)聚類中心。 通過分塊特征演化,檢測區(qū)塊鏈數(shù)據(jù)關聯(lián)特征,從而獲得模糊檢測向量,如式(9)所示,再與模糊相關性融合法相結合,展開區(qū)塊鏈分片峰值聚類分析。
通過模糊C 類均值聚類展開區(qū)塊鏈數(shù)據(jù)網(wǎng)格分片屬性分類與峰值聚類識別,通過深度學習法實現(xiàn)數(shù)據(jù)聚類的分片峰值融合與聚類分析,從而獲得區(qū)塊鏈數(shù)據(jù)在線聚類準則[6],即式(10):
區(qū)塊鏈數(shù)據(jù)聚類節(jié)點的深度學習加權系數(shù)是We =(wj(e),0)。 通過修正各聚類自適應加權學習系數(shù)vi,即可獲得聚類有效性評估矩陣R =(rij,aij)m×n與指標權重W=((w1,β1),(w2,β2),…,(wn,βn)) 。 綜上所述,創(chuàng)建區(qū)塊鏈數(shù)據(jù)聚類的深度學習模型,對區(qū)塊鏈數(shù)據(jù)模糊特征分布集進行構建,以獲得區(qū)塊鏈數(shù)據(jù)約束規(guī)劃模型見式(11)、(12):
根據(jù)式(11)、(12),可以獲得物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)鏈最優(yōu)評價集是L1,L2,…,Ln 與物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)優(yōu)化聚類模型為式(13)所示:
式(13)中,cosinij→x(dij,dxv)表示物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)融合聚類特征集,基于以上分析,滿足區(qū)塊鏈數(shù)據(jù)優(yōu)化聚類目標。
區(qū)塊鏈數(shù)據(jù)聚類分析中,為對語義相關性融合性方法應用性能進行驗證,展開實驗測試分析,通過Matlab7 與C++混合編程展開區(qū)塊鏈數(shù)據(jù)算法處理,基于Hadoop 云平臺對區(qū)塊鏈數(shù)據(jù)庫結構模型進行構建,區(qū)塊鏈數(shù)據(jù)初始樣本規(guī)模是1200,數(shù)據(jù)采樣集相似度是0.68,自適應學習迭代步數(shù)為30,設定以上仿真參數(shù),展開區(qū)塊鏈數(shù)據(jù)峰值聚類分析,從而獲得如圖1 所示的區(qū)塊鏈數(shù)據(jù)分布[7]。
圖1 數(shù)據(jù)時域波形
將圖1 數(shù)據(jù)作為研究對象,通過語義相關性融合法提取區(qū)塊鏈數(shù)據(jù)特征與自適應調(diào)度,再對區(qū)塊鏈數(shù)據(jù)特征量展開模糊聚類處理,進而進行分片峰值聚類分析,可獲得如圖2 所示的聚類結果。
圖2 數(shù)據(jù)分片峰值聚類
通過分析圖2 可以發(fā)現(xiàn),選擇該方法展開區(qū)塊鏈數(shù)據(jù)聚類分析,具有良好的峰值融合度,測試誤分率比較低,而且收斂性也比較強,表1 為誤分率比較結果,從結果可以看出,深度學習下的區(qū)塊鏈數(shù)據(jù)聚類具有較低誤分率。通過結果分析發(fā)現(xiàn),該方法展開區(qū)塊鏈數(shù)據(jù)聚類具有較低誤分率,使數(shù)據(jù)聚類收斂控制能力大幅度提升。
表1 誤分率比較
本文通過模糊信息識別技術開發(fā)區(qū)塊鏈數(shù)據(jù)存鏈結構,提出深度學習下的區(qū)塊鏈數(shù)據(jù)特征重構,通過深度學習法實現(xiàn)數(shù)據(jù)聚類分片峰值聚類與融合。 物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)遞歸圖模型內(nèi),選擇相空間重構方式,采集物聯(lián)網(wǎng)區(qū)塊鏈數(shù)據(jù)聚類模糊特征信息,通過深度學習法對數(shù)據(jù)聚類實施分片峰值融合與聚類分析,從而達到分片峰值聚類目的。 結果顯示,該方法展開區(qū)塊鏈數(shù)據(jù)峰值聚類具有良好收斂性,數(shù)據(jù)聚類精度高,而且誤分率也比較低。