牛玉嶺 恒銀金融科技股份有限公司研究院
隨著計算機網(wǎng)絡(luò)的發(fā)展和普及,網(wǎng)絡(luò)傳感器的應(yīng)用范圍逐步擴大。為了保證嵌入式網(wǎng)絡(luò)傳感器的正常運行,需要收集傳感器的多路觀測數(shù)據(jù)。網(wǎng)絡(luò)傳感器多路觀測數(shù)據(jù)用于描述傳感器的工作狀態(tài)和數(shù)據(jù)采集。目前大多數(shù)檢測方法是檢測數(shù)據(jù)中的異常,并且難以保證測量數(shù)據(jù)的準確性。為了保證嵌入式網(wǎng)絡(luò)傳感器多路觀測數(shù)據(jù)的可靠性,需要對數(shù)據(jù)觀測結(jié)果進行測試。不同的專家學(xué)者從不同角度對多路觀測數(shù)據(jù)進行了測試,但這些探測方法仍存在一些亟待解決的問題?;诿芏鹊臄?shù)據(jù)檢測方法引入了滑動時間窗口和網(wǎng)格的概念,將觀察數(shù)據(jù)細分為滑動時間窗口,并通過信息熵對細分數(shù)據(jù)進行修剪和篩選,去除數(shù)據(jù)中的大部分正常數(shù)據(jù),并通過異常值判斷剩余數(shù)據(jù),以實現(xiàn)觀察數(shù)據(jù)檢測。然而,該方法花費很長時間并且難以實現(xiàn)實時數(shù)據(jù)檢測?;谙伻核惴ǖ亩鄰接^測數(shù)據(jù)檢測方法,將蟻群算法收斂的路徑用作異常路徑。通過計算每個異常路徑中節(jié)點的測量值,并基于該值確定數(shù)據(jù)的異常點,完成數(shù)據(jù)檢測,建立基于邊緣計算的數(shù)據(jù)檢測模型序列來測試數(shù)據(jù)。但是,這種方法在過程中,占用的計算機內(nèi)存很大,這對網(wǎng)絡(luò)運行的速度有很大的影響。
在系統(tǒng)中,數(shù)據(jù)通常表示為用戶行為矩陣。用戶行為矩陣的垂直坐標代表用戶,矩陣的水平坐標代表產(chǎn)品,用戶或網(wǎng)頁。傳統(tǒng)推薦系統(tǒng)主要從矩陣和網(wǎng)絡(luò)的角度分析和預(yù)測用戶的未來行為,典型的建模方法是矩陣分解。此外,啟發(fā)式方法可用于預(yù)測矩陣中具有空值的元素,例如協(xié)作過濾的相關(guān)方法。在社交網(wǎng)絡(luò)中,這兩個圖表退化為簡單網(wǎng)絡(luò)。在這兩個圖中,推薦系統(tǒng)估計在基于網(wǎng)絡(luò)中的現(xiàn)有連接而沒有連接的兩個點之間建立連接的概率,并預(yù)測用戶的未來行為。
當(dāng)網(wǎng)絡(luò)用戶對某種類型的信息感興趣時,他通常會瀏覽該信息的相關(guān)目錄,查看他關(guān)心的信息的詳細情況,并最終可能在線下載或付費。根據(jù)目錄層次結(jié)構(gòu)管理信息。每個頁面信息由查詢語句動態(tài)生成,以達到跟蹤用戶瀏覽過程的目的。隨著電子觀看和下載的普及,通過互聯(lián)網(wǎng)完成電子信息交易具有廣闊的前景。使用UNSPSC 對信息進行編碼使得信息提供者,信息服務(wù)和用戶之間的信息交換更加準確和有效。當(dāng)使用該編碼系統(tǒng)時,信息服務(wù)需要為每個電子信息產(chǎn)品編譯特定代碼,以便信息服務(wù)可以跟蹤信息使用中的各種活動。傳統(tǒng)的商品分類方法不能滿足詳細的產(chǎn)品數(shù)據(jù)要求。 通過研究參考模型并相應(yīng)地進行調(diào)整,構(gòu)建一個更適合網(wǎng)絡(luò)電子信息的信息目錄系統(tǒng)。代碼完全采用分層系統(tǒng),在原有UNSPSC 分類四個層次的基礎(chǔ)上增加信息提供者代碼和信息特定內(nèi)容代碼等信息,便于分類,搜索,匹配,記錄和結(jié)算;同時,它還為計算用戶興趣強度提供了基礎(chǔ)。當(dāng)用戶通過網(wǎng)站上的目錄瀏覽相關(guān)信息時,標識號作為SQL 命令的查詢條件,通過查詢字符串在數(shù)據(jù)庫服務(wù)器中搜索合格產(chǎn)品,并將其寫入用戶的瀏覽記錄。
用戶瀏覽過程記錄在瀏覽索引庫中,包括瀏覽日志表和瀏覽索引表。瀏覽日志表中的每條記錄包括瀏覽信息頁的目錄標識號和訪問時間。由于Internet上的網(wǎng)頁不一定按嚴格的目錄順序鏈接,因此用戶不一定完全遵循樹目錄來訪問它們的命令。因此,在建立模型時,不僅需要記錄用戶直接讀取和下載的信息,還必須通過鏈接記錄信息交易的行為,并采用上述改進的模型算法。不僅可以找到用戶按目錄順序訪問的路徑,還可以使用提供程序代碼記錄未按目錄順序鏈接的信息,從而更準確地記錄最終采用的信息。
預(yù)測模塊通過數(shù)據(jù)訪問端口發(fā)送預(yù)測結(jié)果,并將它們存儲在數(shù)據(jù)存儲模塊中。不同的安全預(yù)測模型使用不同的計算方法,計算方法的有效性反映在大型嵌入式網(wǎng)絡(luò)上節(jié)點信息的傳輸速度上。預(yù)測模型不能一次對大量的數(shù)據(jù)執(zhí)行操作。因此,節(jié)點信息通常被分成若干段,這些段被并行地分配給多個節(jié)點,并且操作的結(jié)果被一起寫入轉(zhuǎn)發(fā)節(jié)點以進行向外傳輸。這個過程需要一些時間,否則傳輸可靠性不高且極易受到網(wǎng)絡(luò)帶寬的影響。在高速傳輸中保持高傳輸和可靠性并不容易。目前,基于博弈論的安全預(yù)測模型可以在不同的采集時間保持較小的浮動和較高的數(shù)值傳輸速度。隨著計算節(jié)點數(shù)量的增加,基于博弈論的安全預(yù)測模型可以最好地利用節(jié)點計算能力的極限值來獲得良好的節(jié)點信息搜索性能。
權(quán)重公式只根據(jù)節(jié)點的統(tǒng)計特性反映用戶對信息節(jié)點的訪問頻率。它并不反映用戶對節(jié)點的關(guān)注受到時間的影響。一般認為,最近的觀察結(jié)果應(yīng)更能表明用戶對最近信息訪問的興趣,對于長期未被訪問的節(jié)點,隨著時間的推移,興趣強度應(yīng)繼續(xù)下降。也就是說,系統(tǒng)應(yīng)該更加關(guān)注用戶最近的興趣,現(xiàn)在使用指數(shù)平滑法來預(yù)測用戶對特定鏈接的興趣。指數(shù)平滑法是一種時間序列分析和預(yù)測方法。它使用移動加權(quán)平均法,根據(jù)過去的實際數(shù)字和預(yù)測來預(yù)測短期行為。這種方法不需要大量的歷史數(shù)據(jù),計算量相對較小,能很好地消除隨機因素的影響,并且很好地反映預(yù)測對象隨時間的變化。因此,可以將每個瀏覽周期的權(quán)值之和作為觀測值,通過指數(shù)平滑的方法得到每個節(jié)點的權(quán)值。即使用戶不按目錄的順序訪問電子信息,他們也是如此可以自動為當(dāng)前節(jié)點上層的所有節(jié)點添加權(quán)重。因此,對于上層節(jié)點,它表示分層目錄結(jié)構(gòu)中的某種類型的信息,并且其權(quán)重總是大于下層節(jié)點。當(dāng)然,上述結(jié)果與臨界值的選擇,信息目錄結(jié)構(gòu)的深度和每層的寬度以及樣本的選擇密切相關(guān)。當(dāng)上述條件發(fā)生變化時,結(jié)果也會發(fā)生變化。根據(jù)預(yù)測算法的實驗值,與強調(diào)不同信息的各種預(yù)測方法(包括時間序列模型,回歸預(yù)測,灰色模型等)相比,更接近實際情況,預(yù)測方法簡單,結(jié)果有較高的可信度。
大型嵌入式網(wǎng)絡(luò)在安全,監(jiān)控,通信等領(lǐng)域具有很高的應(yīng)用價值。它體積小,能耗低,存儲容量大,擴展性能好,性價比高,滿足了人們對各方面信息獲取的要求。隨著信息技術(shù)的不斷創(chuàng)新和發(fā)展,互聯(lián)網(wǎng)用戶數(shù)量顯著增長,網(wǎng)絡(luò)結(jié)構(gòu)出現(xiàn)了大量漏洞。具有大存儲容量的大型嵌入式網(wǎng)絡(luò)的節(jié)點信息面臨安全挑戰(zhàn),安全預(yù)測對于信息安全非常重要[3]。預(yù)測技術(shù)的過程和實現(xiàn)是研究的重點。新的想法已經(jīng)出現(xiàn),新的概念不斷被引入,新技術(shù)層出不窮,新產(chǎn)品已經(jīng)產(chǎn)生,從底層硬件技術(shù)提供的解決方案到頂級軟件的想象力,所有人都在不斷尋求新的技術(shù)。嵌入式互聯(lián)網(wǎng)將比PC 時代產(chǎn)生數(shù)百倍的服務(wù)器和超級嵌入式服務(wù)器,這些服務(wù)器將與各種物理信息和生物相關(guān)聯(lián)。未來的互聯(lián)網(wǎng)技術(shù)將成為嵌入式互聯(lián)網(wǎng)的主導(dǎo)地位。