王學軍
(廣州華立學院,廣東 廣州 511325)
隨著網(wǎng)絡信息技術的發(fā)展,采用搜索引擎實現(xiàn)網(wǎng)絡數(shù)據(jù)信息管理和檢索成為常態(tài)。搜索引擎檢索數(shù)據(jù),是在信息化體系構架下,進行搜索引擎粗糙集查詢;結合知識結構圖模型設計,建立搜索引擎粗糙集查詢數(shù)據(jù)的檢索和特征匹配模型,構建搜索引擎粗糙集查詢數(shù)據(jù)信息和文獻資源的數(shù)據(jù)分析模型,能夠提高數(shù)據(jù)檢索的精準度。相關的搜索引擎粗糙集特征檢索方法研究受到了人們的極大關注[1]。
對搜索引擎粗糙集查詢數(shù)據(jù)信息檢索是建立在對大數(shù)據(jù)信息結構特征分析技術上的,采用統(tǒng)計特征分析方法,建立基于大數(shù)據(jù)分析和云計算技術的搜索引擎粗糙集特征檢索模型[2-3]。文獻[4]中提出基于大數(shù)據(jù)分析的搜索引擎粗糙集查詢數(shù)據(jù)融合方法,結合耦合參數(shù)匹配和信息重組方法實現(xiàn)搜索引擎粗糙集特征檢測,但采用該方法進行數(shù)據(jù)檢索的實時性不好。文獻[5]采用聯(lián)合關聯(lián)規(guī)則性挖掘的方法,實現(xiàn)搜索引擎粗糙集查詢數(shù)據(jù)信息檢索的特征分析,建立搜索引擎粗糙集查詢數(shù)據(jù)信息檢索的聯(lián)合特征匹配模型實現(xiàn)引擎檢索,但該方法的計算負載較高。針對上述問題,本文提出基于模板匹配的搜索引擎粗糙集特征檢索方法。首先采用稀疏性字典匹配集存儲機制構建搜索引擎粗糙集查詢數(shù)據(jù)信息的分塊網(wǎng)格化詞義結構模型;然后建立搜索引擎粗糙集查詢的模板匹配參數(shù),采用模板匹配和自適應參數(shù)估計的方法,通過關聯(lián)規(guī)則調(diào)度,建立搜索引擎粗糙集查詢數(shù)據(jù)信息匹配和檢索的尋優(yōu)學習模型;通過粗糙集語義參數(shù)估計,結合特征聚類方法實現(xiàn)搜索引擎數(shù)據(jù)檢索。最后進行仿真測試,結果表明,采用本文方法進行搜索引擎粗糙集檢索的查準率較高,檢索匹配能力較好。
為了實現(xiàn)搜索引擎粗糙集查詢數(shù)據(jù)信息檢索,結合高層語義之間的語義特征分析和密度聚類分析,構建搜索引擎粗糙集查詢數(shù)據(jù)信息檢索的特征匹配模型,采用關聯(lián)規(guī)則融合和相似度特征檢測,進行搜索引擎粗糙集查詢數(shù)據(jù)信息的特征檢測和粗糙集參數(shù)查詢[6]。根據(jù)空間分布狀態(tài)特征得到搜索引擎粗糙集查詢數(shù)據(jù)結構分布如圖1 所示。
圖1 搜索引擎粗糙集查詢數(shù)據(jù)結構分布
根據(jù)圖1 所示的搜索引擎粗糙集查詢數(shù)據(jù)特征分布,采用模糊引擎查詢調(diào)度的方法,得到搜索引擎粗糙集的HOG特征,構建搜索引擎粗糙集查詢數(shù)據(jù)的樣本平均分布集,得到差異度匹配集Ei,j=
式中:PT-elec為搜索引擎粗糙集查詢數(shù)據(jù)的語義屬性;R為語義本體特征;LDATA為用戶的交互項目與被推薦項目的自由度;LACK為描述復雜特征信息的知識圖譜參數(shù)。根據(jù)搜索引擎粗糙集查詢數(shù)據(jù)的樣本構造特點,得到模糊度檢測參數(shù)t,給定一個數(shù)據(jù)集S={x1, ...,xm},用元路徑或元圖向量x=[x1x2...xk]表示搜索引擎粗糙集查詢數(shù)據(jù)信息檢索的統(tǒng)計特征量。根據(jù)M1,M2, ...,MN的聚類性,得到搜索引擎粗糙集查詢數(shù)據(jù)的特征匹配結構式為:
式中:
式中:DIFS 為搜索引擎粗糙集查詢數(shù)據(jù)的描述統(tǒng)計特征量;tDATA為知識圖譜卷積網(wǎng)絡圖譜參數(shù)采樣時間間隔;tslot為用戶與項目之間的細粒度;tT-start為檢索開始時間;SIFS 為差異化概率密度。根據(jù)上述分析,采用稀疏性字典匹配集存儲機制構建搜索引擎粗糙集查詢數(shù)據(jù)信息的分塊網(wǎng)格化詞義結構模型,實現(xiàn)粗糙集特征分配檢索[7]。
在計算學習者嵌入表示的過程中,根據(jù)搜索引擎粗糙集查詢的分組檢測結果,將鄰居節(jié)點信息聚合到當前節(jié)點,得到檢索關鍵詞匹配參數(shù)為,搜索引擎粗糙集查詢數(shù)據(jù)的梯度聚類函數(shù)為:
式中:l為搜索引擎粗糙集的邊緣分布特征;Ecomm為局部的近似結構及特征;pdrop為聯(lián)合自相關統(tǒng)計特征量,給定交互矩陣與知識圖譜,得到搜索引擎粗糙集查詢數(shù)據(jù)信息的模糊集分布為:
式中:v表示聚合鄰居實體;c(v)為學習資源l的拓撲結構信息。學習資源的嵌入聚合實體的權重分量,分單元格表示為:
式中:Pk+1|k為聚合實體的權重分配概率密度;Gk+1為知識圖譜中實體的鄰域分配系數(shù),為其轉置特征量。通過模糊字節(jié)特征匹配方法,建立搜索引擎粗糙集查詢的模板匹配參數(shù)分配模型[8]。
設nz為搜索引擎粗糙集查詢數(shù)據(jù)信息檢索節(jié)點數(shù),引入搜索引擎粗糙集查詢數(shù)據(jù)語義的屬性分類策略,采用分組檢驗,得到搜索引擎粗糙集查詢數(shù)據(jù)信息檢索的粗糙集為:
式中:N為交互數(shù)據(jù)的語義序列長度;x為搜索引擎的知識圖譜分布;τ為時間延遲。由此,建立搜索引擎粗糙集查詢數(shù)據(jù)的語義自動分配目錄,根據(jù)粗糙集特征分配,進行模板匹配和語義檢索[9]。
建立搜索引擎粗糙集查詢的模板匹配參數(shù)分配模型,采用模板匹配和自適應參數(shù)估計的方法,通過關聯(lián)規(guī)則調(diào)度,得到層次聚類中心為Mi和Mj;采用粗糙集特征匹配的方法,得到搜索引擎粗糙集查詢數(shù)據(jù)信息檢索的層次密度聚類輸出為Clustdist(Mi,Mj)。當(i≠j, 1 ≤i≤q, 1 ≤j≤q)時,搜索引擎粗糙集查詢數(shù)據(jù)語義屬性的聚類輸出的時間概率密度函數(shù)表示為:
式中:Xp為搜索引擎粗糙集查詢數(shù)據(jù)信息語義分布的源信息;u為搜索引擎粗糙集查詢數(shù)據(jù)的粗糙度;v為搜索引擎粗糙集匹配度特征量。建立模糊度匹配模型,得到模糊邊緣匹配系數(shù)為的邊緣向量值,用四元組(Ei,Ej,d,t)來表示大數(shù)據(jù)背景下引擎粗糙集的融合度,得到信息融合輸出:
式中:σs為學習狀況和學習滿意度的聯(lián)合匹配泛函;X1為學習者行為參數(shù);H為信息熵。設搜索引擎粗糙集查詢數(shù)據(jù)的采樣周期為Ts,則每個周期包含的搜索引擎粗糙集查詢數(shù)據(jù)信息數(shù)據(jù)點數(shù)m=T/Ts。采用類型化的模板參數(shù)匹配,實現(xiàn)對搜索引擎粗糙集查詢數(shù)據(jù)知識結構圖模型的匹配[10-12]。
通過MATLAB 仿真實驗驗證本文方法在搜索引擎粗糙集特征檢索中的應用性能,實驗中以圖片檢索為例,圖片采樣大小Q設置為4,相似度為0.28,學習率為0.001,待檢索圖像如圖2 所示。
圖2 搜索引擎待檢索圖
以圖2 為研究對象,采用本文方法進行模板匹配和粗糙集特征提取,實現(xiàn)圖像檢索,結果如圖3 所示。
圖3 搜索引擎信息檢索結果
分析圖3 可知,采用本文方法進行搜索引擎粗糙集特征檢索的模板匹配性能較好,匹配精度較高。測試檢索的查準率,對比結果如圖4 所示。分析圖4 可知,本文方法的查準率更高,性能優(yōu)于傳統(tǒng)方法。
圖4 查準率對比
結合知識結構圖模型設計,建立搜索引擎粗糙集查詢數(shù)據(jù)的檢索和特征匹配模型,能夠提高數(shù)據(jù)檢索的精準度。本文提出基于模板匹配的搜索引擎粗糙集特征檢索方法。采用稀疏性字典匹配集存儲機制構建搜索引擎粗糙集查詢數(shù)據(jù)信息的分塊網(wǎng)格化詞義結構模型,實現(xiàn)粗糙集特征分配檢索;采用類型化的模板參數(shù)匹配,實現(xiàn)對搜索引擎粗糙集查詢數(shù)據(jù)知識結構圖模型的匹配。分析得知,本文方法對搜索引擎粗糙集特征檢索的匹配性和查準率較高。