張創(chuàng)基
摘 要:為了提高社交網(wǎng)絡(luò)用戶行為分析和情景模式預(yù)測能力,優(yōu)化社交網(wǎng)絡(luò)建設(shè),結(jié)合數(shù)據(jù)挖掘和行為分析方法進行社交網(wǎng)絡(luò)的用戶特征分析和用戶情景模式的優(yōu)化挖掘,發(fā)現(xiàn)社交網(wǎng)絡(luò)用戶行為特征。提出一種基于模糊分區(qū)聚類的社交網(wǎng)絡(luò)用戶情景模式預(yù)測方法,構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型,采用Parallel Sets變元軸排序方法進行社交網(wǎng)絡(luò)用戶情景模式存儲結(jié)構(gòu)分區(qū)調(diào)度,結(jié)合分段特征提取方法進行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)數(shù)據(jù)挖掘,采用自適應(yīng)尋優(yōu)方法求取社交網(wǎng)絡(luò)用戶的情景模式的分布信息,利用模糊分區(qū)聚類方法發(fā)現(xiàn)用戶情景模式數(shù)據(jù)集中的隱含模式,根據(jù)數(shù)據(jù)模糊分區(qū)聚類和挖掘結(jié)果,實現(xiàn)社交網(wǎng)絡(luò)用戶情景模式的自適應(yīng)預(yù)測。仿真結(jié)果表明,采用該方法進行社交網(wǎng)絡(luò)用戶情景模式預(yù)測的準(zhǔn)確性較高,提高了對社交網(wǎng)絡(luò)用戶情景模式特征配準(zhǔn)的精度,算法處理的實時性較好。
關(guān)鍵詞: 數(shù)據(jù)聚類;社交網(wǎng)絡(luò);用戶情景模式;特征提取
文章編號: 2095-2163(2019)03-0176-04 中圖分類號: TP393 文獻(xiàn)標(biāo)志碼: A
0 引 言
隨著Web2.0快速的發(fā)展,社交網(wǎng)絡(luò)得到快速發(fā)展,社交網(wǎng)絡(luò)逐漸變成人們情感交流、關(guān)系維護和信息溝通的主要平臺和方式。社交網(wǎng)絡(luò)為用戶建立在線社交關(guān)系,通過互動交流實現(xiàn)對具有共同特征愛好的用戶聚類處理,在不同的情景模式下構(gòu)建社交網(wǎng)絡(luò)模塊,提高信息資源的自適應(yīng)分配和調(diào)度能力。在社交網(wǎng)絡(luò)平臺中,需要對用戶的情景模式進行自動預(yù)測,結(jié)合大數(shù)據(jù)分析方法,進行用戶的行為特征分析和用戶的關(guān)系分析,根據(jù)用戶的社交搜索和偏好,實現(xiàn)情景模式預(yù)測和調(diào)度,提高社交網(wǎng)絡(luò)的服務(wù)功能,結(jié)合數(shù)據(jù)挖掘和行為分析方法進行社交網(wǎng)絡(luò)的用戶特征分析和情景模式預(yù)測,發(fā)現(xiàn)社交網(wǎng)絡(luò)用戶的規(guī)律性[1]。研究社交網(wǎng)絡(luò)用戶情景模式預(yù)測方法在社交網(wǎng)絡(luò)的構(gòu)建和行為特征分析中具有重要意義。
當(dāng)前,常見的聚類方法有K-means算法、模糊C均值算法和層次分割聚類挖掘方法[2-3]。模糊C均值聚類方法在進行社交網(wǎng)絡(luò)用戶情景模式數(shù)據(jù)挖掘的聚類處理中容易陷入局部最優(yōu)解,而層次分割聚類方法進行大數(shù)據(jù)關(guān)聯(lián)挖掘受到分割閾值的影響[4],導(dǎo)致對初始的聚類中心具有較大的敏感性,針對上述問題,本文提出一種基于模糊分區(qū)聚類的社交網(wǎng)絡(luò)用戶情景模式預(yù)測方法,構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型,采用分段特征提取方法進行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)特征提取,采用模糊C均值聚類方法進行數(shù)據(jù)挖掘,實現(xiàn)社交網(wǎng)絡(luò)用戶情景模式預(yù)測。最后通過仿真實驗進行性能測試,展示本文方法在提高用戶情景模式預(yù)測準(zhǔn)確性方面的優(yōu)越性能。
1.1 社交網(wǎng)絡(luò)用戶情景模式拓?fù)浣Y(jié)構(gòu)模型
社交網(wǎng)絡(luò)信息資源傳輸系統(tǒng)設(shè)計中,用矩陣C表示社交網(wǎng)絡(luò)的用戶拓?fù)浣Y(jié)構(gòu),其中,C是N×N的二維矩陣。N為在網(wǎng)絡(luò)中的節(jié)點個數(shù)。對于用戶節(jié)點i,假設(shè)N1i為第一個相鄰節(jié)點,得到社交網(wǎng)絡(luò)用戶情景模式分布的多元鄰節(jié)點為:
將數(shù)據(jù)用戶節(jié)點α(i, j)輸入數(shù)據(jù)到鏈路層中,得到關(guān)鍵路徑節(jié)點采集的社交網(wǎng)絡(luò)用戶情景模式時間序列為xn,期望響應(yīng)為dn,由此構(gòu)建社交網(wǎng)絡(luò)的用戶情景模式分布軌跡拓?fù)浣Y(jié)構(gòu)圖如圖1所示。
1.2 用戶情景模式跟蹤的特征提取
在構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型的基礎(chǔ)上,進行用戶情景模式的特征提取,采用分段特征提取方法進行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)特征提取[6],用戶情景模式傳輸樹中任意一個非根節(jié)點的情景模式社交網(wǎng)絡(luò)用戶情景模式預(yù)測的步進值為:
社交網(wǎng)絡(luò)用戶情景模式預(yù)測的QoS控制加權(quán)自適應(yīng)學(xué)習(xí)系數(shù)表示為:
其中,CW0min為社交網(wǎng)絡(luò)用戶情景模式拓?fù)浣Y(jié)構(gòu)傳輸樹中最底層根節(jié)點的預(yù)測初始化值;而CWlimin為第li步的社交網(wǎng)絡(luò)用戶情景模式拓?fù)淇刂浦担谇榫澳J筋A(yù)測過程中,每一步之間加權(quán)控制構(gòu)成是相同的,假設(shè)混合云環(huán)境下社交網(wǎng)絡(luò)用戶情景模式簇頭節(jié)點上的信息導(dǎo)碼表達(dá)為:
設(shè)U是一個用精確數(shù)值表示的定量論域,C是U上的定性概念,采用無向圖模型結(jié)構(gòu)表示原始感知的社交網(wǎng)絡(luò)用戶情景模式,對社交網(wǎng)絡(luò)用戶情景模式進行自適應(yīng)調(diào)度中,融合模型由一個參數(shù)未知多重假設(shè)檢驗問題構(gòu)成[7],采用Parallel Sets變元軸排序方法進行社交網(wǎng)絡(luò)用戶情景模式存儲結(jié)構(gòu)分區(qū)調(diào)度,調(diào)度模型為:
其中,K表示加權(quán)調(diào)節(jié)系數(shù),根據(jù)社交網(wǎng)絡(luò)中用戶層和層之間的平均子節(jié)點數(shù)目,進行特征提取和分布式的網(wǎng)絡(luò)組網(wǎng)設(shè)計[8],此時社交網(wǎng)絡(luò)用戶情景模式多源節(jié)點中形成新的映射,可得:
根據(jù)社交網(wǎng)絡(luò)用戶情景模式的分區(qū)信息熵的信息流特征,進行特征分解,定義特征值的受限條件關(guān)聯(lián)規(guī)則挖掘量為:
其中,該過程的k階累積量ckx(τ1,τ2,…,τk-1),提取任務(wù)信息流的特征尺度,在社交網(wǎng)絡(luò)用戶情景模式分區(qū)自適應(yīng)調(diào)度的受限條件下,提取關(guān)聯(lián)規(guī)則特征量,為社交網(wǎng)絡(luò)的用戶情景模式跟蹤提供數(shù)據(jù)輸入基礎(chǔ)。
2 預(yù)測算法優(yōu)化
2.1 社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)數(shù)據(jù)挖掘
在構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型和特征提取的基礎(chǔ)上,進行用戶情景模式預(yù)測算法的改進設(shè)計,本文提出一種基于模糊分區(qū)聚類的社交網(wǎng)絡(luò)用戶情景模式預(yù)測方法,采用分段特征提取方法進行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)數(shù)據(jù)挖掘,根據(jù)用戶情景模式特征取小取大后的比值描述社交網(wǎng)絡(luò)用戶情景模式的相似程度,得到社交網(wǎng)絡(luò)用戶情景模式的互信息特征的熵函數(shù)可以表示為:
采用自適應(yīng)尋優(yōu)對Hi(x)求取社交網(wǎng)絡(luò)用戶的情景模式的分布信息最大值max(Hi(x)),由此得到社交網(wǎng)絡(luò)用戶情景模式的熵融合特征提取最優(yōu)化的約束條件為:
2.2 模糊聚類及用戶情景模式預(yù)測實現(xiàn)
結(jié)合模糊分區(qū)聚類方法發(fā)現(xiàn)數(shù)據(jù)集中的隱含模式,得到用戶情景模式挖掘的異步遞進加權(quán)系數(shù)為:
因此,得社交用戶情景模式預(yù)測的模糊分區(qū)聚類中心調(diào)整系數(shù)為:
綜上分析,利用模糊分區(qū)聚類方法發(fā)現(xiàn)用戶情景模式數(shù)據(jù)集中的隱含模式,根據(jù)數(shù)據(jù)模糊分區(qū)聚類和挖掘結(jié)果,實現(xiàn)社交網(wǎng)絡(luò)用戶情景模式的自適應(yīng)預(yù)測。
3 仿真實驗與結(jié)果分析
為了測試本文方法在實現(xiàn)社交網(wǎng)絡(luò)用戶情景模式預(yù)測中的性能,進行仿真實驗 實驗的軟件環(huán)境為Matlab 7,社交網(wǎng)絡(luò)的用戶節(jié)點數(shù)為100,分區(qū)的大小為1 000M, 用戶的分布層數(shù)為12,嵌入維數(shù)為3,關(guān)聯(lián)系數(shù)0.23,對用戶軌跡位置采樣的離散采樣率為fs=10*f0 Hz=10 KHz,訓(xùn)練樣本規(guī)模為12 000,根據(jù)上述仿真環(huán)境和參數(shù)設(shè)定,進行社交網(wǎng)絡(luò)的用戶情景模式分布的關(guān)聯(lián)數(shù)據(jù)挖掘,得到挖掘結(jié)果如圖2所示。
根據(jù)圖2的數(shù)據(jù)挖掘結(jié)果進行用戶情景模式預(yù)測,得到預(yù)測輸出如圖3所示。
分析圖3得知,采用本文方法進行社交網(wǎng)絡(luò)的用戶情景模式預(yù)測具有很好的抗干擾能力,特征聚類性較好。采用不同方法進行預(yù)測精度對比,得到對比結(jié)果如圖4所示,分析圖4得知,采用本文方法進行社交網(wǎng)絡(luò)的用戶情景模式預(yù)測的精度較高。
4 結(jié)束語
對用戶的情景模式進行自動預(yù)測,結(jié)合大數(shù)據(jù)分析方法,進行用戶的行為特征分析和用戶的關(guān)系分析,提高社交網(wǎng)絡(luò)的服務(wù)功能,本文提出一種基于模糊分區(qū)聚類的社交網(wǎng)絡(luò)用戶情景模式預(yù)測方法,構(gòu)建社交網(wǎng)絡(luò)用戶情景模式分布的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)模型,采用分段特征提取方法進行社交網(wǎng)絡(luò)用戶情景模式的關(guān)聯(lián)特征提取,采用Parallel Sets變元軸排序方法進行社交網(wǎng)絡(luò)用戶情景模式存儲結(jié)構(gòu)分區(qū)調(diào)度,結(jié)合模糊分區(qū)聚類方法發(fā)現(xiàn)數(shù)據(jù)集中的隱含模式,采用模糊C均值聚類方法進行數(shù)據(jù)挖掘,實現(xiàn)社交網(wǎng)絡(luò)用戶情景模式預(yù)測。研究得知,采用本文方法進行社交網(wǎng)絡(luò)用戶情景模式預(yù)測的準(zhǔn)確性較高,數(shù)據(jù)挖掘精度較高,在社交網(wǎng)絡(luò)用戶情景模式挖掘和行為分析中具有很好的實踐價值。
參考文獻(xiàn)
[1]曹玖新,董丹,徐順,等. 一種基于k-核的社會網(wǎng)絡(luò)影響最大化算法[J]. 計算機學(xué)報,2015,38(2):238-248.
[2]曹玖新, 陳高君, 吳江林, 等. 基于多維特征分析的社交網(wǎng)絡(luò)意見領(lǐng)袖挖掘[J]. 電子學(xué)報, 2016, 44(4): 898-905.
[3]劉亞州, 王靜, 潘曉中, 等. 社交網(wǎng)絡(luò)中考慮節(jié)點度的演化博弈[J]. 計算機應(yīng)用, 2018, 38(4): 1029-1035.
[4]朱冠樺, 蔣國平, 夏玲玲. 社交網(wǎng)絡(luò)上從眾現(xiàn)象對謠言傳播影響的研究[J]. 計算機科學(xué), 2016, 43(2):135-139,143.
[5]張付志,劉賽,李忠華,等. 融合用戶評論和環(huán)境信息的協(xié)同過濾推薦算法[J]. 小型微型計算機系統(tǒng),2014, 35(2):228-232.
[6]郭磊,馬軍,陳竹敏,等. 一種結(jié)合推薦對象間關(guān)聯(lián)關(guān)系的社會化推薦算法[J]. 計算機學(xué)報, 2014, 37(1):219-228.
[7]孟祥武,劉樹棟,張玉潔,等. 社會化推薦系統(tǒng)研究[J]. 軟件學(xué)報, 2015,26(6):1356-1372.
[8]吳錚, 于洪濤, 劉樹新, 等.? 基于信息熵的跨社交網(wǎng)絡(luò)用戶身份識別方法[J]. 計算機應(yīng)用, 2017, 37(8): 2374-2380.