国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

圖書館海量網絡學術數(shù)據(jù)的關聯(lián)檢索技術研究

2019-06-19 02:33張文晶
現(xiàn)代電子技術 2019年11期
關鍵詞:海量數(shù)據(jù)包關聯(lián)

張文晶

摘 ?要: 為解決傳統(tǒng)PIT圖書館學術數(shù)據(jù)檢索方法存在索引定位數(shù)組數(shù)量有限、檢索承載額度較低等弊端,設計新型圖書館海量網絡學術數(shù)據(jù)的關聯(lián)檢索技術模型。通過定義數(shù)據(jù)包類型的方式,判斷網絡學術數(shù)據(jù)的衍生結構、設置準確的數(shù)據(jù)命名機制,完成圖書館海量網絡學術數(shù)據(jù)的結構分析。在此基礎上,利用關聯(lián)數(shù)據(jù)節(jié)點的空間編碼,確定嚴格的檢索分級法則、完善數(shù)據(jù)的關聯(lián)檢索流程,實現(xiàn)新型技術模型的搭建,完成圖書館海量網絡學術數(shù)據(jù)的關聯(lián)檢索技術研究。對比模型應用結果可知,與傳統(tǒng)PIT檢索方法相比,應用新型關聯(lián)檢索技術模型后,索引定位數(shù)組數(shù)量提升至5.0×1011 TB以上,檢索承載額度也達到預期水平。

關鍵詞: 網絡數(shù)據(jù); 關聯(lián)檢索; 數(shù)據(jù)包定義; 衍生結構; 命名機制; 空間編碼; 分級法則; 技術模型

中圖分類號: TN911?34; TP391 ? ? ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)11?0181?06

Abstract: The traditional PIT library′s academic data retrieval method has some disadvantages, such as the limited number of index positioning arrays and low retrieval load quota. Therefore, a new association retrieval technology model of library′s massive network academic data is designed. By defining the data packet type, the derivative structure of network academic data is judged, and the accurate data naming mechanism is set up to complete the structure analysis of library′s massive network academic data. On this basis, the spatial coding of the associated data nodes is used to determine the strict retrieval grading rules, improve the process of data association retrieval, realize the construction of new technical model, and complete the association retrieval technology research of library′s massive network academic data. The model application results show that, in comparison with the traditional PIT retrieval method, the number of index positioning arrays obtained by the proposed method can reach up to more than 5.0×1011 TB, and the retrieval load quota can reach the expected level.

Keywords: network data; association retrieval; data packet definition; derivative structure; naming mechanism; spatial coding; hierarchical rule; technical model

0 ?引 ?言

關聯(lián)檢索是一項常見的引擎式檢索手段,可以通過輸入的主要關鍵詞得到準確的檢索結果,且在結果頁面中會顯示一到多個不固定數(shù)量的關聯(lián)搜索詞,單擊這些搜索詞,會得到大量的關聯(lián)參考結果。這種關聯(lián)檢索手段既能在一定程度上避免關鍵詞的重復輸入,也能在海量網絡空間中規(guī)劃出關鍵詞的大致存在范圍,對于使用者來說,信息的檢索速率得到大幅提升,大大節(jié)省了有效信息的傳輸消耗時間[1?2]。在現(xiàn)代社會環(huán)境中,大多數(shù)圖書館都利用Bloom filter技術搭建網絡學術信息的檢索數(shù)據(jù)庫,并通過MBF的二叉樹結構,將這些學術信息傳輸至各級定位數(shù)組,再在PIT傳輸結構的促進下,將這些數(shù)組按照關鍵詞的關聯(lián)差異性進行按需分配,完成PIT圖書館學術數(shù)據(jù)檢索方法的搭建。但隨著科學技術手段的進步,這種傳統(tǒng)的數(shù)據(jù)檢索技術開始出現(xiàn)定位數(shù)組數(shù)量有限、檢索承載額度達不到預期水平等問題。為避免上述情況的出現(xiàn),通過數(shù)據(jù)衍生結構判斷、數(shù)據(jù)節(jié)點空間編碼等手段,建立一種新型圖書館海量網絡學術數(shù)據(jù)的關聯(lián)檢索技術模型,并通過對比實驗數(shù)據(jù)的方式,證明該新型技術模型的應用可行性。

1 ?圖書館海量網絡學術數(shù)據(jù)結構分析

圖書館海量網絡學術數(shù)據(jù)結構分析是新型檢測技術模型的搭建基礎。在數(shù)據(jù)包類型定義、數(shù)據(jù)衍生結構判斷等關鍵環(huán)節(jié)的支持下,具體搭建方法按如下步驟進行。

1.1 ?數(shù)據(jù)包類型定義

在圖書館海量學術網絡中,數(shù)據(jù)包定義過程由信息請求端發(fā)起。信息請求端發(fā)送的原始數(shù)據(jù)包具備明顯的Interest名稱標識,且在整個數(shù)據(jù)類型定義過程中,圖書館網絡的輸入結構會對學術信息內容進行基礎判斷。當圖書館學術網絡處理中心收到檢索數(shù)據(jù)庫發(fā)出的連接請求后,在FIB整合裝置的促進下,這些連接請求中的數(shù)據(jù)信息會脫離原結構,進入信息請求端的數(shù)據(jù)定義組織中,并在其中按照一定的物理排列順序生成全新的Interest數(shù)據(jù)包[3?4]。當Interest數(shù)據(jù)包中包含大量的圖書館關聯(lián)數(shù)據(jù)時,各項與學術網絡相關的數(shù)據(jù)內容、數(shù)據(jù)名稱等信息會在信息請求端的促進下形成全新的分級Data包,然后再將所有圖書館學術數(shù)據(jù)按照關聯(lián)檢索要求整合成一條完整的信息鏈,再通過傳輸路徑將完成數(shù)據(jù)包類型定義的信息鏈返回至內容請求端。具體圖書館學術數(shù)據(jù)包類型定義原理如圖1所示。

圖1 ?圖書館學術數(shù)據(jù)包類型定義原理詳解圖

1.2 ?網絡學術數(shù)據(jù)衍生結構判斷

圖書館學術數(shù)據(jù)的衍生結構包含Counting Bloom filter,Dynamic Bloom filter,Spectral Bloom filter,Compressed Bloom filter四種類型。其中,Counting Bloom filter圖書館學術數(shù)據(jù)的衍生結構可以與所有相鄰關聯(lián)檢索節(jié)點進行比特數(shù)組共享,且隸屬于該結構的圖書館學術數(shù)據(jù)不能進行單獨刪除操作,必須始終以集合的形式存在。Dynamic Bloom filter圖書館學術數(shù)據(jù)衍生結構的比特數(shù)組位數(shù)始終固定,且隨著學術網絡中數(shù)據(jù)總量的不斷增加,隸屬于同一集合的圖書館學術數(shù)據(jù)必須保持相同的衍生趨勢[5]。Spectral Bloom filter圖書館學術數(shù)據(jù)衍生結構具備較為固定的比特數(shù)組檢測頻率,在與相鄰關聯(lián)檢索節(jié)點進行信息共享時,這些數(shù)組也只能維持二進制的編程形式。Compressed Bloom filter圖書館學術數(shù)據(jù)衍生結構具備較大的比特數(shù)組共享空間,可滿足數(shù)據(jù)包類型定義過程中的彈性壓縮要求,使各關聯(lián)檢索節(jié)點間的物理距離得到適當縮短。綜上可知,比特數(shù)據(jù)的存在形式是判斷圖書館網絡學術數(shù)據(jù)衍生結構的主要依據(jù)。表1為四種衍生結構的詳細判斷依據(jù)。

表1 ?圖書館網絡學術數(shù)據(jù)衍生結構判斷方法總結表

1.3 ?數(shù)據(jù)命名機制設置

新型關聯(lián)檢索技術模型的數(shù)據(jù)命名機制主要存在于中心網絡層中,且可以在信息傳輸?shù)倪^程中對已完成類型定義的數(shù)據(jù)包進行單元式命名。這種新型的數(shù)據(jù)命名機制采用URL層次處理方式定義數(shù)據(jù)包名稱,并在豐富的詞元組織支持下,界定每個詞元的字符串長度。圖書館學術數(shù)據(jù)在海量傳輸網絡環(huán)境中始終保持分層連接的狀態(tài),而數(shù)據(jù)命名機制主要作用于中心網絡層及協(xié)議流通層[6?7]。當中心網絡層傳出大量的圖書館學術數(shù)據(jù)時,由于受到關聯(lián)檢索網絡不透明特點的影響,這些數(shù)據(jù)中的節(jié)點詞元不能得到清晰顯示。為解決上述問題,數(shù)據(jù)命名機制首先利用詞元自身的名稱前綴完成圖書館學術數(shù)據(jù)的聚合處理,再通過IP分類統(tǒng)籌的形式,將這些數(shù)據(jù)傳輸至協(xié)議流通層進行長久儲存。圖2為新型關聯(lián)檢索技術模型數(shù)據(jù)命名機制的運轉原理。整合上述操作原理,完成圖書館海量網絡學術數(shù)據(jù)的結構分析。

2 ?基于數(shù)據(jù)結構分析的關聯(lián)檢索技術模型搭建

在圖書館海量網絡學術數(shù)據(jù)結構分析的基礎上,通過節(jié)點的空間編碼、分級法則確定等關鍵環(huán)節(jié)的運行,實現(xiàn)新型關聯(lián)檢索技術模型的順利搭建。

圖2 ?數(shù)據(jù)命名機制運轉原理詳解圖

2.1 ?關聯(lián)圖書館海量學術數(shù)據(jù)節(jié)點的空間編碼

關聯(lián)圖書館海量學術數(shù)據(jù)節(jié)點的空間編碼以GeoSOT體系作為程序編寫的主要原則,且所有待編碼的圖書館學術數(shù)據(jù)都具備固定的節(jié)點數(shù)值和空間屬性參數(shù)。在編碼形式恒定的條件下,不同的空間屬性參數(shù)是區(qū)分每個圖書館學術數(shù)據(jù)的唯一法則,參數(shù)值越大代表與該參數(shù)對應圖書館學術數(shù)據(jù)的比特數(shù)組位數(shù)所占存儲空間越大,反之則越小[8?9]。在不發(fā)生數(shù)據(jù)命名紊亂情況的前提下,關聯(lián)圖書館海量學術數(shù)據(jù)空間編碼節(jié)點的排列結構如圖3所示。

圖3 ?圖書館學術數(shù)據(jù)空間編碼節(jié)點排列結構圖、

圖書館學術數(shù)據(jù)命名機制直接影響空間節(jié)點的類型及相關分層秩序。因此,在不發(fā)生數(shù)據(jù)命名紊亂情況的前提下,空間節(jié)點的類型、相關分層秩序兩項始終保持不變。設某固定圖書館學術數(shù)據(jù)的節(jié)點數(shù)值為[l],該節(jié)點的空間屬性參數(shù)為[k],則與該數(shù)據(jù)相關的空間編碼標準可表示為:

式中:[x]代表標準情況下,與該項圖書館學術數(shù)據(jù)相關的編碼因子;[log d]代表編碼執(zhí)行系數(shù);[g]代表空間編碼標準的關聯(lián)項。

2.2 ?檢索分級法則的確定

新型技術模型的檢索分級法則具備元數(shù)據(jù)區(qū)分、網絡映射屬性判斷、編碼節(jié)點創(chuàng)建等主要功能。當關聯(lián)圖書館海量學術數(shù)據(jù)節(jié)點完成空間編碼后,所有數(shù)據(jù)信息中的元成分都會發(fā)生定向改變,且空間屬性參數(shù)不再是判斷圖書館學術數(shù)據(jù)類型的唯一標準[10?11]。比特數(shù)組位數(shù)較大的圖書館學術數(shù)據(jù)會在檢索分級法則的促進下,將元數(shù)據(jù)成分遷移成更加緊湊的結構類型,并以此擴充在單位空間內索引定位數(shù)組的數(shù)量,解決檢索承載額度較低的問題。網絡映射屬性判斷是關聯(lián)檢索技術模型的核心處理功能,隨著檢索分級法則的逐漸完善,圖書館網絡中映射脈絡得到有效劃分,學術數(shù)據(jù)的流通速率得到一定程度的促進。編碼節(jié)點創(chuàng)建是檢索分級法則中的核心環(huán)節(jié),且隨著網絡中圖書館學術數(shù)據(jù)總量的增加,該功能會促進關聯(lián)檢索識別程序的快速運行。圖4為檢索分級法則的確定原理。

猜你喜歡
海量數(shù)據(jù)包關聯(lián)
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
不懼于新,不困于形——一道函數(shù)“關聯(lián)”題的剖析與拓展
“一帶一路”遞進,關聯(lián)民生更緊
海量快遞垃圾正在“圍城”——“綠色快遞”勢在必行
SmartSniff
奇趣搭配
智趣
一個圖形所蘊含的“海量”巧題
基于文件系統(tǒng)的分布式海量空間數(shù)據(jù)高效存儲與組織研究
視覺注意的數(shù)據(jù)包優(yōu)先級排序策略研究
涟源市| 宣威市| 平乡县| 手游| 宜州市| 灌南县| 澳门| 江西省| 玉环县| 永川市| 微博| 青龙| 广平县| 汶上县| 中方县| 三亚市| 商南县| 呈贡县| 石嘴山市| 唐海县| 景谷| 措勤县| 舒城县| 山阳县| 晋江市| 白河县| 怀宁县| 乐东| 江门市| 房山区| 新干县| 岗巴县| 望都县| 夏津县| 博白县| 永胜县| 昌吉市| 屏边| 绿春县| 忻城县| 大余县|