国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種支持語義解析的智能通信服務(wù)網(wǎng)絡(luò)架構(gòu)

2022-07-18 08:57陳曙東李偉煒高昊君張雪婷董奕辰
無線電通信技術(shù) 2022年4期
關(guān)鍵詞:知識(shí)庫分布式語義

陳曙東,李偉煒,杜 蓉,高昊君,張雪婷,董奕辰

(1.中國科學(xué)院微電子研究所,北京 100029;2.中國科學(xué)院大學(xué) 集成電路學(xué)院,北京 100049)

0 引言

隨著5G和人工智能技術(shù)的融合發(fā)展,工業(yè)互聯(lián)網(wǎng)、自動(dòng)駕駛等物聯(lián)網(wǎng)應(yīng)用快速發(fā)展。這些新興應(yīng)用對通信網(wǎng)絡(luò)服務(wù)的智能化和多樣性的需求越來越迫切[1],未來通信網(wǎng)絡(luò)將開始更加注重提供更貼近用戶需求和體驗(yàn)的智能化服務(wù)[2]。

實(shí)現(xiàn)面向萬物互聯(lián)的智能化通信服務(wù),當(dāng)前的通信網(wǎng)絡(luò)面臨以下主要挑戰(zhàn):

① 現(xiàn)有基于標(biāo)識(shí)的通信網(wǎng)絡(luò)內(nèi)沒有語義信息,無法支持基于網(wǎng)絡(luò)語義的路由、緩存等智能服務(wù);

② 物聯(lián)網(wǎng)應(yīng)用需要實(shí)時(shí)感知環(huán)境語義,進(jìn)行快速檢索和內(nèi)容獲取,支持分布式的高并發(fā)請求,現(xiàn)有通信網(wǎng)絡(luò)需要提升分布式查詢效率。

用戶訪問網(wǎng)絡(luò)的主要行為之一是對海量內(nèi)容的獲取,因此未來網(wǎng)絡(luò)應(yīng)該從當(dāng)前以“位置”為中心的體系架構(gòu),演進(jìn)到以“信息”為中心的體系架構(gòu)[3]。2006 年施樂帕克研究中心(Xerox PARC)提出內(nèi)容中心網(wǎng)絡(luò) ( Content Centric Network,CCN)[4],以數(shù)據(jù)為導(dǎo)向,根據(jù)內(nèi)容訪問數(shù)據(jù),放棄了傳統(tǒng)IP網(wǎng)絡(luò)架構(gòu),不再包含顯式的主機(jī)或接口地址等位置信息,從根本上改變了IP包的封裝結(jié)構(gòu)和尋址方式,具有短時(shí)延、低功耗、高可靠等特點(diǎn)。2010年FIA的命名數(shù)據(jù)網(wǎng)絡(luò)(Named Data Networking,NDN)[5]項(xiàng)目也采用類似的架構(gòu),使用沙漏模型結(jié)構(gòu),采用類似 URL 的層次化內(nèi)容命名。由于CCN/NDN構(gòu)建的新型移動(dòng)通信架構(gòu)是一種革命性的解決方案,顛覆了傳統(tǒng)的IP技術(shù)架構(gòu),路由策略、轉(zhuǎn)發(fā)策略、緩存機(jī)制和安全性尚需進(jìn)一步研究,當(dāng)前難以部署和實(shí)施。

目前網(wǎng)絡(luò)層地址統(tǒng)一標(biāo)識(shí)體系的方案主要有HIP(Host Identifier Protocol)[6]、Shim6[7]、MobilityFirst[8]、XIA(eXpressive Internet Architecture)[9]等。HIP在網(wǎng)絡(luò)層和傳輸層之間插入主機(jī)標(biāo)識(shí)層,為上層應(yīng)用提供固定不變的主機(jī)標(biāo)識(shí),屏蔽了IP地址變化,同時(shí)維護(hù)主機(jī)標(biāo)識(shí)與IP地址的綁定關(guān)系;HIP報(bào)文格式采用IPin IP方式,外層為用于路由尋址的IP地址,內(nèi)層為用于標(biāo)識(shí)身份的128位主機(jī)標(biāo)識(shí)。Shim6協(xié)議修改終端網(wǎng)絡(luò)協(xié)議棧,在IP路由子層和終端子層之間插入Shim 層,使標(biāo)識(shí)符( Identifier ) 和定位符(Locator)分離。MobilityFirst的體系架構(gòu)使用ID與Locator分離的機(jī)制、扁平地址結(jié)構(gòu)、利用公鑰基礎(chǔ)設(shè)施實(shí)現(xiàn)標(biāo)識(shí)的驗(yàn)證,支持快速的全局名稱解析、存儲(chǔ)轉(zhuǎn)發(fā)的路由方式、緩存和逐跳的分段數(shù)據(jù)傳輸?shù)取IA使用標(biāo)識(shí)和地址分離的設(shè)計(jì),引入NID代表網(wǎng)絡(luò)域或子網(wǎng),路由時(shí)用來定位網(wǎng)絡(luò)地址。這些工作研究將網(wǎng)絡(luò)標(biāo)識(shí)作為現(xiàn)有網(wǎng)絡(luò)的補(bǔ)充,將標(biāo)識(shí)和地址分離,但是都沒有關(guān)注標(biāo)識(shí)的語義信息,難以支持基于語義的路由、緩存等智能網(wǎng)絡(luò)服務(wù)。

其他一些工作研究構(gòu)建高效的網(wǎng)絡(luò)資源調(diào)度[10]和內(nèi)容分發(fā)[11],雖然實(shí)現(xiàn)了通信感知一體化[12]的體系,但在應(yīng)對不同場景下智能化網(wǎng)絡(luò)服務(wù)供給方面仍然面臨挑戰(zhàn)。

為滿足更貼近應(yīng)用需求網(wǎng)絡(luò)服務(wù),本文提出一種面向萬物互聯(lián)的支持語義解析的智能通信服務(wù)網(wǎng)絡(luò)架構(gòu),基于報(bào)文相關(guān)語義信息構(gòu)建語義標(biāo)識(shí),提供可感知場景語義的智能化通信服務(wù)。本文提出的新型網(wǎng)絡(luò)架構(gòu)沿用現(xiàn)有的IP技術(shù)體系,無需協(xié)議轉(zhuǎn)換即可實(shí)現(xiàn)與網(wǎng)絡(luò)層IP承載的無縫連接,支持簡單便捷的端到端業(yè)務(wù)部署和管理,便于基于TCP/IP協(xié)議棧開發(fā)的相關(guān)應(yīng)用快速移植。

本文詳細(xì)論述所設(shè)計(jì)的智能通信服務(wù)網(wǎng)絡(luò)的整體架構(gòu)和支持語義解析的網(wǎng)絡(luò)報(bào)文構(gòu)建方法;闡述如何利用深度學(xué)習(xí)模型實(shí)現(xiàn)語義信息的編碼和解碼,構(gòu)建通信場景的語義知識(shí)庫;設(shè)計(jì)如何構(gòu)建語義標(biāo)識(shí)倒排索引,以實(shí)現(xiàn)快速語義檢索,賦能智能化應(yīng)用場景;搭建了視頻會(huì)議測試場景,對語義編解碼的精度和語義查詢速度的實(shí)驗(yàn)結(jié)果進(jìn)行了分析和總結(jié)。

1 智能通信服務(wù)網(wǎng)絡(luò)架構(gòu)

1.1 支持語義解析的通信網(wǎng)絡(luò)架構(gòu)

依據(jù)5G的愿景與需求并結(jié)合基于語義網(wǎng)絡(luò)數(shù)據(jù)與位置解耦、強(qiáng)制簽名以及網(wǎng)內(nèi)緩存等特點(diǎn),構(gòu)建一個(gè)支持語義解析、標(biāo)識(shí)與地址分離機(jī)制的新型網(wǎng)絡(luò)架構(gòu),如圖1所示。

圖1 支持語義解析的通信網(wǎng)絡(luò)架構(gòu)

在現(xiàn)有底層通信和上層應(yīng)用之間增加了一個(gè)基礎(chǔ)語義服務(wù)層,首先對上層應(yīng)用中的圖像、文本等信息進(jìn)行語義編碼,并作為唯一且不變的語義編碼標(biāo)識(shí)SID,生成支持語義解析的網(wǎng)絡(luò)報(bào)文;然后在底層通信設(shè)施中構(gòu)建語義標(biāo)識(shí)的倒排索引,以支持語義標(biāo)識(shí)的快速檢索,進(jìn)而實(shí)現(xiàn)基于語義的智能網(wǎng)絡(luò)路由、緩存等服務(wù)。

在語義解析通信服務(wù)網(wǎng)絡(luò)中,語義解析服務(wù)維護(hù)語義標(biāo)識(shí)SID 與它們的網(wǎng)絡(luò)地址 NA 之間的映射關(guān)系。IP 是互聯(lián)網(wǎng)的基本路由協(xié)議,可作為語義解析通信服務(wù)網(wǎng)絡(luò)的網(wǎng)絡(luò)地址,語義解析服務(wù)維護(hù) SID 和 IP 地址之間的映射關(guān)系,用戶面可以通過 IP 進(jìn)行轉(zhuǎn)發(fā)。網(wǎng)絡(luò)層報(bào)文的NA 地址字段包括語義標(biāo)識(shí) SID 對應(yīng)語義內(nèi)容的多個(gè)候選存儲(chǔ)地址集合或其他引用信息。SID為語義標(biāo)識(shí),由語義編碼器輸出的語義標(biāo)識(shí)編碼、位置編碼、實(shí)體關(guān)聯(lián)編碼等構(gòu)建而成。SID根據(jù)語義解析通信服務(wù)網(wǎng)絡(luò)所支持的智能化應(yīng)用的不同需要具有不同的類別與形式,通常包含圖像類數(shù)據(jù)索引、文本關(guān)鍵詞類索引等內(nèi)容。語義解析通信服務(wù)網(wǎng)絡(luò)基于語義標(biāo)識(shí)SID和IP之間的映射關(guān)系進(jìn)行路由和轉(zhuǎn)發(fā),實(shí)現(xiàn)對數(shù)據(jù)語義內(nèi)容的查找和定位,加快路由、轉(zhuǎn)發(fā)和查找的速度,縮短響應(yīng)時(shí)間。

語義解析通信服務(wù)網(wǎng)絡(luò)的報(bào)文組成方式如圖2所示。首先根據(jù)入網(wǎng)實(shí)體的入網(wǎng)信息和相關(guān)場景語義信息生成語義標(biāo)識(shí)SID,然后與報(bào)文Header、網(wǎng)絡(luò)地址NA、數(shù)據(jù)Payload拼接生成網(wǎng)絡(luò)報(bào)文。

圖2 語義解析通信服務(wù)網(wǎng)絡(luò)報(bào)文結(jié)構(gòu)

入網(wǎng)信息生成將數(shù)據(jù)包入網(wǎng)的時(shí)空信息以及其他狀態(tài)信息編碼成入網(wǎng)信息,作為網(wǎng)絡(luò)ID的字段。其中空間信息可使用將經(jīng)度、緯度等信息作為輸入,同時(shí)可以加入其他狀態(tài)信息映射成入網(wǎng)信息,能夠提升ID標(biāo)識(shí)自驗(yàn)證的安全特性。

語義編碼生成融合語義知識(shí)庫的語義標(biāo)識(shí)元素編目以及語義標(biāo)識(shí)屬性(包括入網(wǎng)實(shí)體的位置信息、邏輯及推理關(guān)系等),通過語義編碼器處理,截取形成語義編碼字段,能夠體現(xiàn)語義標(biāo)識(shí)的編碼、位置信息、不同實(shí)體間邏輯關(guān)系和其他相關(guān)屬性特征。

語義標(biāo)識(shí)SID生成將語義編碼和入網(wǎng)信息字段拼接,同時(shí)保留一定的預(yù)留位形成網(wǎng)絡(luò)ID,與Header和網(wǎng)絡(luò)地址NA、Payload共同組成最終的網(wǎng)絡(luò)報(bào)文。

為智能化地支持萬物互聯(lián)場景,所設(shè)計(jì)的語義解析通信服務(wù)網(wǎng)絡(luò)主要包括支持語義的控制面、面向現(xiàn)場的用戶面和語義解析服務(wù),如圖3所示。

圖3 支持語義解析的5G通信服務(wù)

支持語義的控制面提供語義智能網(wǎng)絡(luò)控制服務(wù),包括基于語義的路由選擇、具有彈性的資源控制和計(jì)算能力;面向現(xiàn)場的用戶面主要考慮邊緣端現(xiàn)場計(jì)算和現(xiàn)場存儲(chǔ)的能力,負(fù)責(zé)執(zhí)行一些面向用戶應(yīng)用場景的動(dòng)作和處理邏輯,可以滿足不同應(yīng)用現(xiàn)場的處理需求,支持時(shí)間敏感型的服務(wù);語義解析服務(wù)對文本和視頻進(jìn)行編碼,構(gòu)建支持語義解析的語義網(wǎng)絡(luò)標(biāo)識(shí)和基于語義的倒排索引,支持快速的語義匹配和搜索。

新型通信網(wǎng)絡(luò)架構(gòu)在當(dāng)前底層通信與上層應(yīng)用中間增加了一層基礎(chǔ)語義服務(wù)層,通過對入網(wǎng)實(shí)體的標(biāo)簽、網(wǎng)絡(luò)位置等屬性構(gòu)建語義檢索,建模語義關(guān)系,提供以內(nèi)容為中心的智能化通信服務(wù)。支持執(zhí)行分布式的快速并發(fā)查詢,提升網(wǎng)絡(luò)數(shù)據(jù)查詢以及獲取效率和速度,支持快速的內(nèi)容檢索和分發(fā),從而提升網(wǎng)絡(luò)服務(wù)質(zhì)量。

移動(dòng)性方面構(gòu)建基于語義標(biāo)識(shí)的網(wǎng)絡(luò)服務(wù),使標(biāo)識(shí)與位置解耦,不會(huì)因用戶地址的改變而降低網(wǎng)絡(luò)傳輸效率。由于基于語義標(biāo)識(shí)的網(wǎng)絡(luò)服務(wù)內(nèi)生支持多徑路由與網(wǎng)內(nèi)緩存,可大大減輕因數(shù)據(jù)產(chǎn)生者移動(dòng)而對通信過程產(chǎn)生的影響。因此,在基于語義網(wǎng)絡(luò)移動(dòng)通信架構(gòu)中,不同接口可采用統(tǒng)一的語義標(biāo)識(shí)來支持移動(dòng)性,提高傳輸效率。

數(shù)據(jù)路由方面能夠支撐基于語義的轉(zhuǎn)發(fā)與路由操作,提供快速的語義查詢檢索服務(wù),通過語義標(biāo)識(shí)對數(shù)據(jù)包進(jìn)行檢索,并依據(jù)檢索結(jié)果對存儲(chǔ)在轉(zhuǎn)發(fā)平面中的記錄進(jìn)行更新、插入和刪除。

網(wǎng)絡(luò)緩存方面使用語義知識(shí)庫將數(shù)據(jù)緩存在路由節(jié)點(diǎn)中方便后續(xù)用戶使用,為實(shí)現(xiàn)網(wǎng)絡(luò)資源利用率的最大化,基于語義標(biāo)識(shí)信息可以構(gòu)建智能的緩存替換策略,適應(yīng)不同應(yīng)用場景的數(shù)據(jù)緩存需求。當(dāng)前網(wǎng)絡(luò)中適用于單個(gè)節(jié)點(diǎn)的緩存替換策略為最近最少和最近最多使用策略、最少頻繁使用策略。在加入語義信息后,基于語義特征來支持智能的網(wǎng)絡(luò)數(shù)據(jù)緩存,提升整體網(wǎng)絡(luò)性能。

1.2 視頻會(huì)議場景下的智能通信服務(wù)

本節(jié)以視頻會(huì)議為例,詳細(xì)介紹語義解析服務(wù)的工作原理。如圖4所示,在視頻場景中,語義編碼模塊接收視頻會(huì)議應(yīng)用的相關(guān)圖像和文本標(biāo)簽,結(jié)合應(yīng)用時(shí)間地點(diǎn)形成語義編碼,構(gòu)建支持語義檢索的網(wǎng)絡(luò)報(bào)文,以支持視頻應(yīng)用場景下的智能緩存和路由網(wǎng)絡(luò)服務(wù)。例如:需要檢索前一段視頻流中特定會(huì)議參與者發(fā)言數(shù)據(jù),語義解析接口接收請求,語義檢索語義標(biāo)識(shí)SID中匹配到對應(yīng)會(huì)議參與方發(fā)言的時(shí)空標(biāo)簽和圖像語義標(biāo)識(shí),將對應(yīng)數(shù)據(jù)結(jié)果實(shí)時(shí)反饋。當(dāng)一個(gè)用戶加入會(huì)議時(shí),可以基于語義查詢解析相應(yīng)屬性語義信息,獲取會(huì)議場景下實(shí)體的網(wǎng)絡(luò)位置,包括攝像頭、麥克風(fēng)等設(shè)備信息,語義檢索匹配到相應(yīng)列表,然后進(jìn)行支持語義的相關(guān)操作,例如對特定攝像頭的控制操作、基于語義的圖像數(shù)據(jù)網(wǎng)絡(luò)緩存策略等。

圖4 視頻會(huì)議場景下的智能通信服務(wù)工作流程

語義可能受不同主客觀環(huán)境因素影響,如視頻會(huì)議應(yīng)用標(biāo)簽、圖像特征等信息均可能對語義產(chǎn)生影響。單純依靠單個(gè)或者一類傳感器(如攝像頭)采集的信息難以全面識(shí)別應(yīng)用感興趣的語義信息。因此,將視頻會(huì)議應(yīng)用屬性、圖像特征,以及時(shí)間、地點(diǎn)標(biāo)簽等多信息融合編碼,構(gòu)建語義標(biāo)識(shí),適用于不同的智能應(yīng)用場景。

視頻應(yīng)用中有著大量數(shù)據(jù)和請求,網(wǎng)絡(luò)中的冗余流量占據(jù)大量資源,而且在不同場景之間的內(nèi)容請求差異較大,造成不同語義內(nèi)容的緩存需求差異較大。面對這種情況,現(xiàn)有的緩存放置算法無法很好地應(yīng)對。構(gòu)建基于語義標(biāo)識(shí)的網(wǎng)絡(luò)報(bào)文,使網(wǎng)絡(luò)具備支持語義的路由、網(wǎng)絡(luò)內(nèi)置緩存以及請求聚合等特點(diǎn),能夠有效地減少網(wǎng)絡(luò)冗余、降低網(wǎng)絡(luò)開銷、緩解網(wǎng)絡(luò)壓力。因此,在視頻會(huì)議場景中,適合采用支持語義解析的通信網(wǎng)絡(luò)進(jìn)行視頻的內(nèi)容分發(fā)。利用語義編碼信息,能夠快速捕捉網(wǎng)絡(luò)流量的變化;采用沿路徑緩存放置算法,能夠在內(nèi)容經(jīng)過某節(jié)點(diǎn)時(shí),智能地根據(jù)網(wǎng)絡(luò)中快速變化的流量,實(shí)時(shí)調(diào)整緩存放置。

2 語義解析通信服務(wù)

語義解析通信服務(wù)網(wǎng)絡(luò)在構(gòu)建數(shù)據(jù)源的語義標(biāo)簽并形成相應(yīng)的語義索引時(shí),需要解決如何進(jìn)行知識(shí)和語義表征的問題,即如何從傳輸?shù)臄?shù)據(jù)源中提取出所支持的語義解析服務(wù)需要的語義內(nèi)容并將之轉(zhuǎn)化為可路由、可轉(zhuǎn)發(fā)的語義編碼。語義解析通信服務(wù)網(wǎng)絡(luò)支持計(jì)算和搜索基于文本、圖像、語音等多種數(shù)據(jù)源生成的語義編碼,且能對語義編碼所指代的語義實(shí)體間的邏輯關(guān)系予以表征。

2.1 邊緣計(jì)算與數(shù)據(jù)訓(xùn)練存儲(chǔ)服務(wù)

基于數(shù)據(jù)源中的語義信息形成語義標(biāo)識(shí)需要消耗大量的運(yùn)算和儲(chǔ)存資源,完成語義分析的計(jì)算任務(wù)無法僅僅分?jǐn)偟酵ㄐ虐l(fā)送方和接收方的終端,往往需要利用外部的運(yùn)算與儲(chǔ)存資源,從而實(shí)現(xiàn)數(shù)據(jù)和信息的融合、共享。一種較有效的處理方法是在整個(gè)語義解析通信服務(wù)網(wǎng)絡(luò)中,注冊認(rèn)證大量邊緣計(jì)算服務(wù)器和存儲(chǔ)設(shè)備,分布式地部署在用戶側(cè)形成資源集群,以供輔助完成智能化通信服務(wù)所需要的各種語義解析任務(wù)。用戶側(cè)可以將需要密集計(jì)算的語義提取和語義接收對應(yīng)的編碼、解碼任務(wù)實(shí)時(shí)加載到最近的資源集群服務(wù)器上,并僅在本地執(zhí)行輕量級(jí)的語義標(biāo)識(shí)生成。邊緣計(jì)算服務(wù)器即時(shí)地響應(yīng)用戶側(cè)的語義解析算法需求,迅速進(jìn)行語義編碼器、解碼器的模型訓(xùn)練和數(shù)據(jù)傳輸、存儲(chǔ)等任務(wù)。為了實(shí)現(xiàn)數(shù)據(jù)和信息的融合共享,支持語義解析整體運(yùn)行效率的提升,各邊緣計(jì)算服務(wù)器可以通過聯(lián)邦學(xué)習(xí)、分布式計(jì)算等方式,在數(shù)據(jù)預(yù)處理、訓(xùn)練編碼解碼模型、知識(shí)共享時(shí)相互協(xié)作,以實(shí)現(xiàn)資源集群中的計(jì)算資源和負(fù)載的最優(yōu)分配。

2.2 知識(shí)庫與模型庫

語義知識(shí)庫是構(gòu)建文本、圖像或其他源數(shù)據(jù)的語義標(biāo)識(shí)的基礎(chǔ),其中包括語義標(biāo)識(shí)庫和實(shí)體之間的邏輯及推理關(guān)系。語義解析服務(wù)一般需要依賴于公共的語義知識(shí)庫對知識(shí)表征進(jìn)行協(xié)議化、統(tǒng)一化的規(guī)范與管理。語義模型庫則根據(jù)語義知識(shí)庫定義的不同編碼組成方案的要求,儲(chǔ)存面向各種智能化應(yīng)用場景及圖像、文本等常用的源數(shù)據(jù)中識(shí)別和提取語義的主流AI模型和技術(shù)流程。

語義知識(shí)庫的另一個(gè)作用是依照語義解析通信服務(wù)網(wǎng)絡(luò)所支持的不同類別的語義解析服務(wù),定義每種服務(wù)所需要的語義標(biāo)識(shí)類型、邏輯關(guān)系、實(shí)體位置、屬性等信息,以及相應(yīng)的編碼組成方案。語義知識(shí)庫中的實(shí)體概念和邏輯關(guān)系,在語義知識(shí)庫中被協(xié)議化地定義與規(guī)范,并作為通信發(fā)送與接收方使用語義解析服務(wù)的基礎(chǔ)協(xié)議。

語義隨著應(yīng)用場景的變化而變化,這就要求語義知識(shí)庫必須具有自學(xué)習(xí)和自更新的功能:當(dāng)有新實(shí)體出現(xiàn)時(shí),知識(shí)庫需要識(shí)別、分析該實(shí)體可能的含義和適用場景,然后將該實(shí)體概念和由推理得出的與已有實(shí)體間的邏輯關(guān)系等信息添加到語義知識(shí)庫中[13];同時(shí),知識(shí)庫還應(yīng)當(dāng)能夠?qū)π聦?shí)體的使用熱度進(jìn)行實(shí)時(shí)的冷熱分析與實(shí)時(shí)更新。這部分工作可基于眾包、爬取、多模態(tài)感知融合等多種技術(shù)來完成,將用戶群體在不同背景、語言和場景下積累的普適性知識(shí)和語義信息傳輸給就近的資源集群,識(shí)別、分析完成后,再更新至語義知識(shí)庫中。

2.3 語義編碼器和解碼器

在一般的通信系統(tǒng)中,對源端數(shù)據(jù)編碼主要為了方便信息的存儲(chǔ)和傳輸,并盡可能地保留源數(shù)據(jù)的所有信息。其結(jié)果只含有輸出符號(hào)序列的標(biāo)識(shí),并不包含輸出符號(hào)序列的語義含義。而在本文提出的語義解析通信服務(wù)網(wǎng)絡(luò)中,語義編碼提取源端數(shù)據(jù)中用戶側(cè)需要的語義內(nèi)容,并進(jìn)行智能化任務(wù)導(dǎo)向式編碼。此過程的主要目的是對源端數(shù)據(jù)中與特定智能化應(yīng)用任務(wù)相關(guān)的語義信息通過稠密向量進(jìn)行表示,丟掉與任務(wù)無關(guān)的信息,在知識(shí)庫與模型庫的協(xié)同下,遵照特定智能化應(yīng)用對應(yīng)的語義編碼方案對源端信息中隱含的語義信息進(jìn)行提取與映射獲得語義編碼。因此,語義編碼需要根據(jù)語義解析通信服務(wù)網(wǎng)絡(luò)所支持的智能化應(yīng)用,具有不同的類別與形式。

語義編碼器檢測與抽取源端信息中所涉及的具體語義特征,并同時(shí)壓縮和刪除與語義無關(guān)的信息。語義編碼器通常根據(jù)不同的智能化處理任務(wù)具有不同的模型框架與參數(shù),并支持處理各種形式的源端信息。例如當(dāng)傳輸內(nèi)容為圖像或文本時(shí),編碼器借助語義知識(shí)庫在模型庫中匹配相應(yīng)預(yù)訓(xùn)練好特征提取模型作為編碼器,進(jìn)而提取傳輸內(nèi)容中的語義實(shí)體特征、實(shí)體間關(guān)系特征、實(shí)體位置及其他屬性特征形成高維特征編碼序列,以此作為構(gòu)建語義標(biāo)識(shí)SID的基礎(chǔ)。

當(dāng)傳輸內(nèi)容為文本時(shí),語義編碼器采用語義模型庫中的面向文本類任務(wù)的主要模型(例如LSTM、Transformer模型等)理解與提取語義信息。在預(yù)處理階段,每段待傳輸?shù)奈谋緸閃=[w1,w2,w3,…,wi],其中,wi為待傳輸?shù)奈谋局械牡趇個(gè)詞。編碼器的作用相當(dāng)于函數(shù)f,待傳輸?shù)奈谋網(wǎng)經(jīng)編碼器編碼后得到序列B=f(w)。編碼器先將輸入文本序列t以句子為單位進(jìn)行拆分,并在每個(gè)句子前后添加起始、結(jié)束分隔符,再將每個(gè)句子s的所有詞進(jìn)行高維度的詞嵌入映射,生成高維的表示向量,映射后形成的文本高維嵌入表示序列E=[e1,e2,e3,…,ek],ek指代輸入文本序列中第k個(gè)詞的高維嵌入表示向量,分別包含向量嵌入、關(guān)系嵌入與位置嵌入三部分:向量嵌入是將詞高維映射后得到的詞特征;關(guān)系嵌入是第k個(gè)詞與文本序列的其他詞的關(guān)系表征;位置嵌入用來表征詞的位置編碼,以便表征順序信息。

傳輸內(nèi)容中的文本常用基于Transformer及其衍生出的其他語言模型的編碼塊進(jìn)行編碼,將E通過編碼映射為經(jīng)過Transformer模型提取語義信息后隱含了上下文關(guān)系的抽象語義,再經(jīng)過編碼匹配、哈希映射形成不同語義解析服務(wù)所需要的語義標(biāo)識(shí)SID。Transformer類模型的編碼塊由多頭注意力層(multi-head attention layer)和位置感知的前饋層組成,對于一組查詢向量、鍵值和值,多頭注意力模塊執(zhí)行次注意力計(jì)算:

MultiHead(Q,K,V)=Concat(head1,head2,…,headh)WO,

對于源數(shù)據(jù)中的圖像類內(nèi)容,語義編碼器采用語義模型庫中的面向圖像類任務(wù)的主要模型(例如CNN、Transformer模型等)理解與提取語義信息。本文不再展開詳細(xì)論述。

源數(shù)據(jù)經(jīng)過語義編碼器后形成包含傳輸?shù)脑磾?shù)據(jù)全部語義信息的語義編碼,為得到語義標(biāo)識(shí)SID還需要根據(jù)語義知識(shí)庫定義的不同語義解析服務(wù)所需的語義標(biāo)識(shí)類型、語義標(biāo)識(shí)的邏輯關(guān)系以及實(shí)體位置、屬性等其他信息,對語義編碼進(jìn)行語義編碼匹配與哈希映射,語義編碼匹配模型與哈希映射規(guī)則來自在邊緣計(jì)算服務(wù)器和存儲(chǔ)服務(wù)單元內(nèi)的知識(shí)庫。

語義解碼器將語義編碼中隱含的語義信息還原為按照接收端的需求,或智能化任務(wù)的期望展現(xiàn)的具體形式。例如可以將語義信息解碼為從傳輸文本中提取的關(guān)鍵詞、從2D圖像中重建的三維結(jié)構(gòu)、甚至從多模態(tài)源數(shù)據(jù)中生成的AR全息投影并呈現(xiàn)給接收端用戶。相關(guān)解碼的模型與還原規(guī)則存儲(chǔ)在邊緣計(jì)算服務(wù)器的語義知識(shí)庫。例如,當(dāng)進(jìn)行從傳輸源數(shù)據(jù)的文本中提取作者信息的任務(wù)時(shí),解碼器由雙向LSTM模塊拼接CRF(條件隨機(jī)場)模塊組成。其中,雙向LSTM模塊的輸入來自語義編碼器的輸出,用來獲取傳輸文本中的句子表示;CRF模塊接收上層雙向LSTM模塊的輸出,并對傳輸文本中的命名實(shí)體進(jìn)行序列標(biāo)注。

3 語義查詢通信服務(wù)

3.1 分布式語義索引

由于網(wǎng)絡(luò)服務(wù)需要處理大量數(shù)據(jù)和請求,語義查詢服務(wù)需要滿足高并發(fā)與可靠性。針對這一需求,支持語義的通信服務(wù)網(wǎng)絡(luò)構(gòu)建了語義倒排索引來實(shí)現(xiàn)分布式語義查詢。倒排索引作為典型且高效的信息數(shù)據(jù)檢索結(jié)構(gòu),對各條記錄中所有字段或部分語義編碼字段分析處理,各個(gè)索引項(xiàng)將排列出一系列帶有該索引項(xiàng)的標(biāo)識(shí),利用查找索引項(xiàng),能檢索出相應(yīng)的索引結(jié)果?;诘古潘饕姆植际秸Z義查詢架構(gòu)如圖5所示,包括分布式倒排索引構(gòu)建和在線語義查詢處理兩個(gè)部分。

圖5 基于倒排索引的分布式語義查詢架構(gòu)

① 分布式倒排索引構(gòu)建:根據(jù)時(shí)間、空間、關(guān)聯(lián)關(guān)系等約束條件查詢標(biāo)識(shí),構(gòu)建分布式倒排索引,支持網(wǎng)絡(luò)海量數(shù)據(jù)的語義搜索。

② 在線語義查詢:構(gòu)建支持語義關(guān)聯(lián)的分布式語義查詢處理和相關(guān)性評(píng)分模型,支持網(wǎng)絡(luò)海量數(shù)據(jù)的分布式查詢標(biāo)識(shí)和快速多級(jí)標(biāo)識(shí)解析;支持讀寫權(quán)限分離,保障數(shù)據(jù)安全性,支持節(jié)點(diǎn)自動(dòng)同步更新,保證數(shù)據(jù)一致性。

構(gòu)建屬性數(shù)據(jù)語義知識(shí)融合的倒排索引結(jié)構(gòu),將語義信息封裝到倒排索引中,減少查詢前處理和后處理,提高語義查詢速度和準(zhǔn)確率,分布式倒排索引結(jié)構(gòu)如圖6所示。

圖6 分布式倒排索引構(gòu)建

構(gòu)建支持語義關(guān)聯(lián)的分布式語義查詢處理和相關(guān)性評(píng)分模型,輸出比傳統(tǒng)的倒排索引更具語義相關(guān)性的結(jié)果。支持讀寫權(quán)限分離,保障數(shù)據(jù)安全性,節(jié)點(diǎn)自動(dòng)同步更新,保證數(shù)據(jù)一致性。在查詢處理中,可以引入分布式查詢處理算法,加上在查詢評(píng)估過程中檢索和排序相關(guān)查詢答案所需的專用相關(guān)性評(píng)分措施。此外,可以對索引構(gòu)建和查詢算法的詳細(xì)復(fù)雜性、有效性和效率分析進(jìn)行查詢優(yōu)化。

3.2 分布式語義查詢

將應(yīng)用場景語義信息直接封裝到倒排索引中,根據(jù)時(shí)間、空間、關(guān)聯(lián)關(guān)系等約束條件查詢標(biāo)識(shí),構(gòu)建離線分布式倒排索引,并支持在線快速解析查詢。通信服務(wù)網(wǎng)絡(luò)語義查詢服務(wù)如圖7所示。

圖7 通信服務(wù)網(wǎng)絡(luò)語義查詢服務(wù)

索引模塊按照數(shù)據(jù)信息產(chǎn)生索引文件,并將其存放到索引庫中以實(shí)現(xiàn)檢索功能,數(shù)據(jù)信息的搜索流程一般包括以下幾點(diǎn):

數(shù)據(jù)讀取數(shù)據(jù)采集模塊中所得到的文本和圖像被存放在分布式數(shù)據(jù)庫的各個(gè)數(shù)據(jù)節(jié)點(diǎn)中,并使用分布式處理引擎對文本和圖像進(jìn)行預(yù)處理,完成數(shù)據(jù)的格式化。

數(shù)據(jù)分析對文本數(shù)據(jù)以塊或標(biāo)簽分類,過濾部分非關(guān)鍵字,降低存儲(chǔ)和搜索信息功耗。對于圖像視頻,基于應(yīng)用編碼方式進(jìn)行單幀或多幀采樣,以匹配對應(yīng)的語義匹配模塊輸入。然后,根據(jù)不同的應(yīng)用需求,選擇相應(yīng)的處理模塊進(jìn)行處理。

搜索與存儲(chǔ)基于Lucene實(shí)現(xiàn)索引的創(chuàng)建操作,生成倒排索引文件保存于分布式索引庫中,并定時(shí)對增量數(shù)據(jù)進(jìn)行匯總。

4 實(shí)驗(yàn)

基于語義編碼對網(wǎng)絡(luò)位置的查詢速度,是支撐快速實(shí)時(shí)應(yīng)用的基礎(chǔ)。以視頻會(huì)議場景為例,對視頻會(huì)議相關(guān)圖像和文本標(biāo)簽,結(jié)合應(yīng)用時(shí)間地點(diǎn)形成語義編碼,每個(gè)語義編碼為一個(gè)查詢實(shí)體。系統(tǒng)在5G模擬環(huán)境中運(yùn)行,使用6臺(tái)服務(wù)器在一個(gè)子網(wǎng)中構(gòu)建分布式集群,包括數(shù)據(jù)和網(wǎng)絡(luò)節(jié)點(diǎn)。

在構(gòu)建的模擬環(huán)境中驗(yàn)證了系統(tǒng)語義編碼功能,支持文本和圖片的語義提取,使語義標(biāo)識(shí)與位置解耦,可以支持高移動(dòng)性應(yīng)用;測試驗(yàn)證了語義索引構(gòu)建功能,語義標(biāo)識(shí)分布式倒排索引,支撐快速的語義查詢。同時(shí),測試了不同編碼實(shí)體量下語義檢索的性能,語義查詢的測試流程如圖8所示。在測試用例中,使用目標(biāo)語義查詢匹配的報(bào)文網(wǎng)絡(luò)位置,通過倒排索引從海量的實(shí)體中進(jìn)行語義匹配,從緩存和磁盤中獲取目標(biāo)實(shí)體內(nèi)容,返回結(jié)果,測試所用時(shí)間。測試結(jié)果顯示,語義查詢耗時(shí)隨著實(shí)體增加而增加,在10萬、20萬和30萬實(shí)體下,查詢耗時(shí)分別達(dá)到了12.5 ms、14.5 ms和17.2 ms,能夠?qū)崿F(xiàn)快速的語義檢索,提升內(nèi)容查詢和獲取效率。

圖8 測試用例流程

5 結(jié)束語

本文提出一種支持語義解析的智能通信服務(wù)網(wǎng)絡(luò)架構(gòu),在現(xiàn)有底層通信和上層應(yīng)用之間增加基礎(chǔ)語義服務(wù)層,利用深度學(xué)習(xí)模型實(shí)現(xiàn)語義信息的編碼和解碼,構(gòu)建通信場景的語義知識(shí)庫,設(shè)計(jì)語義標(biāo)識(shí)倒排索引。網(wǎng)絡(luò)在服務(wù)質(zhì)量方面,支持執(zhí)行分布式的快速并發(fā)查詢,提升網(wǎng)絡(luò)數(shù)據(jù)查詢以及獲取效率和速度,支持快速的內(nèi)容檢索和分發(fā),提升網(wǎng)絡(luò)服務(wù)質(zhì)量;在移動(dòng)性方面,將語義標(biāo)識(shí)與位置解耦,支撐高移動(dòng)性應(yīng)用;數(shù)據(jù)路由方面,通過語義標(biāo)識(shí)對數(shù)據(jù)包進(jìn)行檢索,提供語義查詢檢索服務(wù);在網(wǎng)絡(luò)緩存方面,基于語義標(biāo)識(shí)信息可以構(gòu)建智能的緩存替換策略,適應(yīng)不同應(yīng)用場景的數(shù)據(jù)緩存需求。測試結(jié)果表明提出的智能通信服務(wù)網(wǎng)絡(luò)架構(gòu)實(shí)現(xiàn)了語義編碼和解碼,能夠提供語義解析服務(wù),支持快速語義檢索和內(nèi)容獲取,有效支撐面向萬物互聯(lián)場景的通信智能化。

猜你喜歡
知識(shí)庫分布式語義
真實(shí)場景水下語義分割方法及數(shù)據(jù)集
漢語近義詞辨析知識(shí)庫構(gòu)建研究
淺析分布式發(fā)電對電力系統(tǒng)的影響
基于預(yù)處理MUSIC算法的分布式陣列DOA估計(jì)
“吃+NP”的語義生成機(jī)制研究
分布式并聯(lián)逆變器解耦電流下垂控制技術(shù)
情感形容詞‘うっとうしい’、‘わずらわしい’、‘めんどうくさい’的語義分析
漢語依憑介詞的語義范疇
機(jī)構(gòu)知識(shí)庫建設(shè)的動(dòng)力研究
家庭分布式儲(chǔ)能的發(fā)展前景
广灵县| 兴和县| 津南区| 英吉沙县| 科技| 金阳县| 张家港市| 洛川县| 灯塔市| 从化市| 宁明县| 榆中县| 德钦县| 洛川县| 伊吾县| 木里| 阿巴嘎旗| 南雄市| 清流县| 建湖县| 沅陵县| 湘潭县| 建始县| 凤台县| 邳州市| 洛川县| 永泰县| 嘉义市| 吉木萨尔县| 镇宁| 建阳市| 贡嘎县| 扎赉特旗| 乐至县| 禹城市| 仁寿县| 太保市| 扎兰屯市| 新宁县| 南宁市| 田阳县|