国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人工智能技術(shù)在通信工程數(shù)字化設(shè)計(jì)中的應(yīng)用

2021-07-19 02:13竹夢(mèng)圓陳亞峰中訊郵電咨詢?cè)O(shè)計(jì)院有限公司北京00048中訊郵電咨詢?cè)O(shè)計(jì)院有限公司鄭州分公司河南鄭州450007
郵電設(shè)計(jì)技術(shù) 2021年6期
關(guān)鍵詞:位姿機(jī)柜三維重建

王 政,竹夢(mèng)圓,武 歡,陳亞峰(.中訊郵電咨詢?cè)O(shè)計(jì)院有限公司,北京 00048;.中訊郵電咨詢?cè)O(shè)計(jì)院有限公司鄭州分公司,河南鄭州 450007)

1 概述

近年來,為響應(yīng)國資委推進(jìn)國有企業(yè)數(shù)字化轉(zhuǎn)型的工作部署,中國聯(lián)通及其下屬的通信工程設(shè)計(jì)單位針對(duì)自身業(yè)務(wù)開展了數(shù)字化轉(zhuǎn)型工作。通信工程設(shè)計(jì)單位的核心業(yè)務(wù)主要是向通信運(yùn)營商提供通信工程建設(shè)相關(guān)的技術(shù)咨詢、建設(shè)方案規(guī)劃服務(wù)及可行性研究報(bào)告、工程設(shè)計(jì)的編制等工作。以往的工作方式主要是由工程師個(gè)人或團(tuán)隊(duì)配合通信運(yùn)營商以知識(shí)服務(wù)的形式完成;通信工程設(shè)計(jì)的數(shù)字化轉(zhuǎn)型是對(duì)通信工程設(shè)計(jì)工作的一次重大革新,它將通信工程設(shè)計(jì)工作過程中使用到的網(wǎng)絡(luò)資源數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、專家知識(shí)數(shù)據(jù)等以統(tǒng)一的方式集中存儲(chǔ)并管理起來,工程設(shè)計(jì)人員借助信息系統(tǒng)以集中化、結(jié)構(gòu)化的數(shù)據(jù)為基礎(chǔ)來完成通信工程設(shè)計(jì)的大部分工作。

通信機(jī)房及其內(nèi)部的空調(diào)、電源、網(wǎng)絡(luò)和計(jì)算設(shè)備等通信設(shè)施資源的數(shù)字化工作,是通信工程設(shè)計(jì)數(shù)字化的基礎(chǔ)。據(jù)統(tǒng)計(jì),目前中國聯(lián)通在全國范圍內(nèi)擁有大機(jī)房(面積為300~500 m2)約1 萬間,基站局房(面積為20~50 m2)數(shù)十萬間。如何快速、準(zhǔn)確地實(shí)現(xiàn)大量通信機(jī)房及其附屬通信設(shè)施資源的數(shù)字化工作,是通信工程設(shè)計(jì)數(shù)字化轉(zhuǎn)型的重要挑戰(zhàn)。

面對(duì)規(guī)模龐大的現(xiàn)網(wǎng)資源,完全由人工完成局房及其設(shè)施資源的數(shù)字化工作幾乎是不可能的;而通過使用先進(jìn)的人工智能技術(shù),利用三維重建、三維語義分割、目標(biāo)識(shí)別、OCR 文字識(shí)別等基于計(jì)算機(jī)視覺的技術(shù)手段,則可以較好地完成大規(guī)?,F(xiàn)網(wǎng)資源的數(shù)字化工作;從而構(gòu)建起通信工程設(shè)計(jì)數(shù)字化所必需的基礎(chǔ)資源數(shù)據(jù),為通信工程設(shè)計(jì)企業(yè)的數(shù)字化轉(zhuǎn)型打下堅(jiān)實(shí)的基礎(chǔ)。

本文主要對(duì)在通信工程局房及其設(shè)施資源進(jìn)行數(shù)字化的過程中實(shí)際應(yīng)用到的人工智能技術(shù)相關(guān)原理、技術(shù)方案、實(shí)施過程及應(yīng)用效果進(jìn)行探討說明。

2 數(shù)字化勘察作業(yè)流程

為完成通信局房及其設(shè)施數(shù)字化,需建立一套基于人工智能技術(shù)的勘察作業(yè)流程。該作業(yè)流程如圖1所示。

圖1 數(shù)字化勘察作業(yè)流程

a)原始數(shù)據(jù)采集。需要勘察人員在現(xiàn)場以專用相機(jī)拍照方式,采集機(jī)房、機(jī)柜及設(shè)備等的原始圖像數(shù)據(jù)。

b)采用相關(guān)深度學(xué)習(xí)算法工具,生成機(jī)房三維模型,并識(shí)別機(jī)柜內(nèi)部設(shè)備類別、板卡、端口占用等情況,識(shí)別內(nèi)部設(shè)備的相關(guān)銘牌文字信息。

c)根據(jù)機(jī)柜或設(shè)備編號(hào)將采集的圖片與實(shí)際機(jī)房中的機(jī)柜或設(shè)備關(guān)聯(lián)。

d)根據(jù)b)、c)2 步,得到機(jī)房內(nèi)設(shè)施資源的完整矢量模型,并存儲(chǔ)為json格式。

e)人工通過用戶界面對(duì)矢量模型進(jìn)行修正或補(bǔ)充,同時(shí)將補(bǔ)充的新屬性提交至深度學(xué)習(xí)算法訓(xùn)練過程,不斷完善算法識(shí)別種類,形成閉環(huán)。

3 SLAM技術(shù)應(yīng)用

數(shù)字化勘察過程中,勘察人員親臨現(xiàn)場,通過全景相機(jī)拍照方式,對(duì)機(jī)房環(huán)境進(jìn)行數(shù)據(jù)采集。采集到的數(shù)據(jù)是后續(xù)三維重建算法的基礎(chǔ)。首先,為保證重建質(zhì)量、提升重建精度,需確保全景相機(jī)的拍攝場景和采集數(shù)據(jù)覆蓋所有需要重建的區(qū)域,否則重建模型會(huì)產(chǎn)生空洞、空隙,影響重建信息的完整性。為輔助勘察人員及時(shí)發(fā)現(xiàn)采集遺漏之處,我們開發(fā)了實(shí)時(shí)預(yù)覽功能,勘察人員在采集現(xiàn)場可以及時(shí)發(fā)現(xiàn)掃描遺漏的地方,并及時(shí)補(bǔ)掃,避免由于采樣缺失導(dǎo)致二次采集,從而提升數(shù)據(jù)采集效率。其次,三維重建算法同時(shí)需要全景相機(jī)拍攝的視頻關(guān)鍵幀以及全景相機(jī)坐標(biāo)系在世界坐標(biāo)系下的六自由度位姿(包含3 個(gè)平移和3 個(gè)旋轉(zhuǎn))數(shù)據(jù)作為輸入。視頻關(guān)鍵幀在采集過程中即可獲得,為了實(shí)現(xiàn)采集現(xiàn)場的實(shí)時(shí)預(yù)覽及運(yùn)動(dòng)載體(全景相機(jī))的實(shí)時(shí)六自由度位姿計(jì)算,本文基于SLAM(Simultaneous Localization And Mapping)算法進(jìn)行求解。

SLAM,即同步定位與地圖構(gòu)建技術(shù),機(jī)器人從未知環(huán)境的某點(diǎn)出發(fā),在運(yùn)動(dòng)過程中通過重復(fù)觀測到的環(huán)境特征定位自身位置和姿態(tài),再根據(jù)自身位置構(gòu)建周圍環(huán)境的增量式地圖,從而達(dá)到同時(shí)定位和地圖構(gòu)建的目的。典型的視覺SLAM 算法以估計(jì)攝像機(jī)位姿為主要目標(biāo),通過多視幾何理論來重構(gòu)3D地圖。為提高數(shù)據(jù)處理速度,部分視覺SLAM 算法首先提取稀疏的圖像特征,通過特征點(diǎn)之間的匹配實(shí)現(xiàn)幀間估計(jì)和閉環(huán)檢測。目前代表性的工作有ORB-SLAM、VINSMONO等。

這里使用雙目全景相機(jī)作為傳感器,實(shí)時(shí)跟蹤設(shè)備的六自由度位姿。通過對(duì)采集到的全景圖像進(jìn)行圖像處理、提取關(guān)鍵點(diǎn)、追蹤關(guān)鍵點(diǎn),建立關(guān)鍵點(diǎn)之間的關(guān)聯(lián)等一系列操作,可獲取歷史關(guān)鍵點(diǎn)的關(guān)聯(lián)信息,結(jié)合IMU 觀測到的載體(全景相機(jī))的運(yùn)動(dòng)狀態(tài),可進(jìn)行位姿估計(jì),推測物體在地圖上的準(zhǔn)確位置。這里需建立一個(gè)迭代求解的優(yōu)化問題:精準(zhǔn)定位需基于高精度無偏差的地圖,但同時(shí)高精度的地圖需要精準(zhǔn)的位置估計(jì)來描繪。通過迭代優(yōu)化,可精確求解出全景相機(jī)在世界坐標(biāo)系下實(shí)時(shí)的六自由度位姿和環(huán)境中稀疏的關(guān)鍵點(diǎn)的3D坐標(biāo)。在算法后臺(tái),存儲(chǔ)維護(hù)視頻關(guān)鍵幀,用于全景相機(jī)回到之前經(jīng)過的區(qū)域附近后與關(guān)鍵幀進(jìn)行對(duì)比實(shí)現(xiàn)回環(huán),從而對(duì)環(huán)境噪聲在運(yùn)動(dòng)過程中不斷累加引起的累積定位誤差進(jìn)行修正,降低對(duì)定位、導(dǎo)航精度產(chǎn)生的影響。最終生成全景相機(jī)坐標(biāo)系在世界坐標(biāo)系下的實(shí)時(shí)六自由度位姿,作為下一環(huán)節(jié)三維重建算法的輸入,同時(shí)恢復(fù)場景的三維幾何結(jié)構(gòu)。

4 三維重建技術(shù)

隨著信息技術(shù)的發(fā)展,三維重建技術(shù)已日趨成熟,三維技術(shù)成果對(duì)基礎(chǔ)設(shè)施資源的呈現(xiàn)更加直觀、清晰,其所包含的信息量更大、更豐富,結(jié)合AI與三維重建技術(shù)適配網(wǎng)絡(luò)建設(shè)、維護(hù)、運(yùn)營領(lǐng)域應(yīng)用具有較高的技術(shù)研究價(jià)值。為建立和完善通用的機(jī)房三維智能化平臺(tái),機(jī)房三維可視化、三維輔助勘察設(shè)計(jì)、現(xiàn)場環(huán)境AR 再現(xiàn)等業(yè)務(wù)功能,需對(duì)機(jī)房及其內(nèi)部設(shè)施資源進(jìn)行三維重建。

三維重建技術(shù)是一種通過圖像或視頻捕獲的視覺信息、定位信息作為輸入,獲取場景和物體的三維模型的一種技術(shù)方法。它主要通過尋找特征立體匹配來恢復(fù)稠密的三維點(diǎn)云信息,再通過網(wǎng)格構(gòu)建的技術(shù)從三維點(diǎn)云中提取場景或物體的幾何結(jié)構(gòu)?;谌S重建算法可以生成三維點(diǎn)云模型、帶紋理的三維網(wǎng)格模型及全景漫游模型,其中三維模型均包括機(jī)房內(nèi)部布置的實(shí)體對(duì)象的長寬高、基準(zhǔn)點(diǎn)坐標(biāo)、方向等空間定位信息,可與實(shí)際場景進(jìn)行一對(duì)一的對(duì)應(yīng),供網(wǎng)絡(luò)工程師進(jìn)行工程環(huán)境線上AR 漫游和基礎(chǔ)設(shè)施遠(yuǎn)程巡檢。

目前主流的三維重建技術(shù)方案主要包括主動(dòng)光三維重建和被動(dòng)光三維重建。這里引入一個(gè)概念:光學(xué)重建,其分為被動(dòng)光學(xué)和主動(dòng)光學(xué)的重建。主動(dòng)光重建一般由結(jié)構(gòu)光源發(fā)射和接收進(jìn)行成像,主流方法包括激光掃描法、結(jié)構(gòu)光法、陰影法以及TOF(Time of flight)技術(shù)、雷達(dá)技術(shù)、Kinect技術(shù);被動(dòng)光重建則是從多視角獲取圖像信息,基于視差原理來完成,主流的被動(dòng)視覺法包括單目視覺、雙目視覺、多目視覺等方法。

在研發(fā)對(duì)機(jī)房場景下三維重建算法的技術(shù)路線時(shí),本文對(duì)國內(nèi)外較為先進(jìn)的三維重建設(shè)備和技術(shù)方案分別進(jìn)行了測試,發(fā)現(xiàn)通信局房的場景與設(shè)備,特征點(diǎn)少,且表面構(gòu)成多為鏤空和玻璃,會(huì)對(duì)激光的發(fā)射和接收造成很大的影響。圖2展示了對(duì)機(jī)柜進(jìn)行激光三維重建的結(jié)果,從建模結(jié)果可以看到,由于柜門表面鏤空,接收的激光信息中產(chǎn)生特征點(diǎn)的缺失,建模結(jié)果出現(xiàn)較大空洞,嚴(yán)重影響建模效果和精度;另一方面,如果采用被動(dòng)光進(jìn)行建模,雖然數(shù)據(jù)采集相對(duì)全面,但想獲得很好的建模效果,需要對(duì)建模算法進(jìn)行進(jìn)一步的研發(fā)與優(yōu)化。

圖2 機(jī)柜在主動(dòng)光重建下的效果

通過對(duì)多種三維重建設(shè)備及技術(shù)方案進(jìn)行比較測試,最終選定基于全景相機(jī)的被動(dòng)光三維重建技術(shù)方案。具體的,在基于SLAM 算法生成的相機(jī)位姿基礎(chǔ)上,從全景圖片序列中恢復(fù)場景的稠密三維點(diǎn)云結(jié)構(gòu)。重建流程如下。

a)基于SLAM 算法中生成的相機(jī)位姿,利用稠密立體匹配技術(shù)恢復(fù)每張圖像的深度圖。

b)結(jié)合相機(jī)位姿,將圖像序列的深度圖融合成稠密三維點(diǎn)云。

c)采用表面網(wǎng)格提取技術(shù)從稠密三維點(diǎn)云中抽取場景的稠密三維網(wǎng)格。

最終通過全景相機(jī)采集的視頻所抽取的照片序列,以及第3 章SLAM 算法求解得到的相機(jī)位姿作為輸入,通過稠密三維重建,生成場景的稠密三維點(diǎn)云和網(wǎng)格模型,其中點(diǎn)云和網(wǎng)格模型的頂點(diǎn)均帶有顏色,點(diǎn)云和網(wǎng)格模型的坐標(biāo)與運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)算法求解的相機(jī)位姿的坐標(biāo)系一致。然后通過紋理貼圖算法,利用多視角的圖像序列和相機(jī)位姿對(duì)三維模型做紋理映射,最終生成帶無縫隙紋理貼圖的稠密三維網(wǎng)格模型。

在傳輸機(jī)房場景下使用全景相機(jī)采集數(shù)據(jù)并對(duì)本方案進(jìn)行多次測試驗(yàn)證,結(jié)果證明在重建精度及重建完整性方面均優(yōu)于主動(dòng)光三維重建方案,基本能夠滿足通信工程數(shù)字化設(shè)計(jì)的要求,可以較好地完成通信機(jī)房及其附屬設(shè)施的三維數(shù)字化工作(見圖3)。

圖3 機(jī)房三維建模結(jié)果

5 三維語義分割技術(shù)應(yīng)用

在對(duì)機(jī)房及其內(nèi)部設(shè)施完成三維重建后,還需要對(duì)三維模型進(jìn)行語義分類,以將三維空間中的模型與實(shí)際的業(yè)務(wù)邏輯實(shí)體關(guān)聯(lián)起來,實(shí)現(xiàn)后續(xù)預(yù)覽、設(shè)置屬性、圖紙生成等業(yè)務(wù)應(yīng)用。該功能主要通過三維語義分割技術(shù)實(shí)現(xiàn)。

三維語義分割是指將場景中的三維模型基本元素進(jìn)行語義分類,實(shí)現(xiàn)對(duì)場景內(nèi)容信息高緯度的理解。通過三維模型稠密語義分割算法,可輸出三維點(diǎn)云或三維面片每個(gè)單位元素(點(diǎn)云、體素、網(wǎng)格等)所屬的語義類別,從而將無業(yè)務(wù)意義的三維模型與具備意義的業(yè)務(wù)邏輯實(shí)體關(guān)聯(lián)起來。基于語義分割算法,可獲得三維空間模型中各個(gè)業(yè)務(wù)邏輯實(shí)體的類別、屬性等,為三維重建的結(jié)果提供與語義理解與知識(shí)關(guān)聯(lián)能力。

三維語義分割技術(shù)目前主要有2種技術(shù)方案。

a)二維語義分割三維融合。通過識(shí)別多幀二維圖像的語義分割結(jié)果,結(jié)合圖像像素與三維坐標(biāo)的轉(zhuǎn)換關(guān)系,對(duì)三維坐標(biāo)中的點(diǎn)對(duì)應(yīng)的多個(gè)二維語義結(jié)果進(jìn)行投票,融合得到最終三維的語義結(jié)果。

b)對(duì)三維表達(dá)進(jìn)行語義分割。以三維的表達(dá)(如點(diǎn)云、體素、網(wǎng)格等)為輸入,直接在三維空間中進(jìn)行語義分割。

這里采用基于三維表達(dá)語義分割的技術(shù)方案,使用深度學(xué)習(xí)中全卷積的網(wǎng)絡(luò)結(jié)構(gòu),以先編碼再解碼的方式,實(shí)現(xiàn)對(duì)任意大小的圖像輸入的語義分割,網(wǎng)絡(luò)結(jié)構(gòu)中的多尺度信息融合設(shè)計(jì)可以讓網(wǎng)絡(luò)對(duì)于場景中同一個(gè)物體的尺度變化具有更強(qiáng)的魯棒性,特別是機(jī)房場景下,設(shè)備的大小可能差別較大,需要對(duì)設(shè)備尺度具有自適應(yīng)性的三維語義分割方法。通過將三維點(diǎn)云與語義分割能力結(jié)合,可以提供三維場景理解能力。目前已實(shí)現(xiàn)對(duì)天花板、機(jī)柜、柱子、墻面、電源柜等機(jī)房內(nèi)部常見物體的識(shí)別(見圖4)。

圖4 三維語義分割結(jié)果

此外,由于機(jī)房中的設(shè)備在不斷迭代更新,需要持續(xù)增加模型可處理識(shí)別的物體種類。因此為賦予模型在線學(xué)習(xí)的能力,實(shí)現(xiàn)三維語義分割能力的持續(xù)擴(kuò)展,還需構(gòu)建三維語義分割模型的自學(xué)習(xí)能力。主要技術(shù)流程為:

a)前期需要對(duì)設(shè)備的類型和型號(hào)進(jìn)行少量的人工交互來進(jìn)行標(biāo)注和分類,在此過程中積累數(shù)據(jù)。

b)基于半自動(dòng)語義標(biāo)注器,可以在現(xiàn)有模型識(shí)別結(jié)果的基礎(chǔ)上對(duì)新場景進(jìn)行快速標(biāo)注,將標(biāo)注后的新場景擴(kuò)充到現(xiàn)有數(shù)據(jù)庫中。

c)利用擴(kuò)充后的數(shù)據(jù)庫訓(xùn)練和更新深度學(xué)習(xí)網(wǎng)絡(luò)模型,從而獲得更好的識(shí)別性能。

d)基于三維語義分割技術(shù)的機(jī)房及其內(nèi)部設(shè)施的語義理解是通信工程數(shù)字化設(shè)計(jì)中的重點(diǎn),通過在線學(xué)習(xí)的方法,逐步實(shí)現(xiàn)模型自動(dòng)化標(biāo)注和自學(xué)習(xí)功能,實(shí)現(xiàn)整個(gè)三維語義分割流程的閉環(huán)式優(yōu)化,同時(shí)在此過程中不斷積累通信行業(yè)基礎(chǔ)設(shè)施的三維模型數(shù)據(jù)庫,在數(shù)字化設(shè)計(jì)領(lǐng)域保持領(lǐng)先優(yōu)勢。

6 目標(biāo)檢測技術(shù)應(yīng)用(二維)

三維語義分割主要用于完成機(jī)房內(nèi)部設(shè)施在三維重建完成后的識(shí)別。對(duì)于機(jī)柜內(nèi)部放置的設(shè)備識(shí)別,則需使用二維圖像的目標(biāo)檢測技術(shù)完成。通過目標(biāo)檢測技術(shù),可實(shí)現(xiàn)對(duì)機(jī)柜內(nèi)部設(shè)備型號(hào)、板卡型號(hào)及數(shù)量、端口占用情況等的識(shí)別,從而高效地完成機(jī)柜內(nèi)部設(shè)備信息的收集、提取工作。

目標(biāo)檢測算法主要用于找出二維圖像中所有感興趣的目標(biāo),確定它們的位置和類別。該類算法一般包括目標(biāo)檢測和分類2 個(gè)階段,其中檢測階段通常會(huì)在輸入圖像中采樣大量的區(qū)域,然后判斷這些區(qū)域中是否包含感興趣的目標(biāo),并調(diào)整區(qū)域邊緣從而更準(zhǔn)確地預(yù)測目標(biāo)的真實(shí)邊界框;分類階段則根據(jù)目標(biāo)位置信息,在原始圖像中裁剪出相應(yīng)區(qū)域,確定目標(biāo)類別。

常用的目標(biāo)檢測算法有Fast-Rcnn、YOLO、RetinaNet 等,本項(xiàng)目中采用多種算法結(jié)合的方式完成目標(biāo)檢測任務(wù),主要處理流程為:

a)拍攝機(jī)柜內(nèi)設(shè)備照片。

b)對(duì)照片進(jìn)行預(yù)處理,包括去噪、剪切、拼接等。

c)使用YOLO v5 算法檢測設(shè)備、槽位、板卡端口等目標(biāo)所在位置。

d)采用ResNet50網(wǎng)絡(luò)對(duì)此類目標(biāo)進(jìn)行分類。

采用上述處理流程對(duì)機(jī)柜內(nèi)部設(shè)備進(jìn)行識(shí)別的樣例如圖5所示。

圖5 空閑端口識(shí)別效果

通過應(yīng)用目標(biāo)檢測技術(shù),有效提高了機(jī)柜內(nèi)部信息的識(shí)別和統(tǒng)計(jì)速度。值得一提的是,機(jī)柜中線纜較多或布線不規(guī)范導(dǎo)致設(shè)備或端口被遮擋,會(huì)對(duì)識(shí)別效果造成影響,目前我們通過人工交互的方法解決,未來我們將結(jié)合半監(jiān)督學(xué)習(xí)的方法,進(jìn)一步進(jìn)行優(yōu)化。

7 OCR文字識(shí)別技術(shù)應(yīng)用

通信機(jī)房的機(jī)柜、電源、空調(diào)及計(jì)算機(jī)等設(shè)備通常貼有運(yùn)維部門制作的標(biāo)簽或銘牌,通過識(shí)別標(biāo)簽或銘牌上的文字內(nèi)容,使用資源管理、網(wǎng)管等系統(tǒng)的查詢接口,可以準(zhǔn)確地獲取設(shè)備的詳細(xì)信息。銘牌字體一般為通用簡體印刷文字,其識(shí)別難度遠(yuǎn)低于不規(guī)則的手寫字體。采用光學(xué)字符識(shí)別(OCR——Optical Character Recognition)技術(shù)識(shí)別機(jī)房場景內(nèi)的關(guān)鍵文字信息,與目標(biāo)檢測技術(shù)、外部系統(tǒng)查詢接口等配合,可較好地完成設(shè)備信息的識(shí)別、收集任務(wù)。

OCR 是指對(duì)輸入圖像文件進(jìn)行分析處理,識(shí)別出圖像中文字信息的過程。OCR 技術(shù)一般包括2個(gè)核心步驟:文字檢測和識(shí)別?;谏疃葘W(xué)習(xí)的OCR 技術(shù)可利用模型算法能力,自動(dòng)檢測出文字的類別及位置信息,再根據(jù)位置信息,從原圖中裁剪出包含文字內(nèi)容的區(qū)域,并自動(dòng)識(shí)別文字內(nèi)容。主要工作流程為:

a)采集機(jī)房內(nèi)部多種形式的包含文字的圖像。

b)圖像中文本行常存在一定角度的傾斜和透視變換,采用EAST模型檢測文本行對(duì)應(yīng)四邊形的4個(gè)頂點(diǎn)。

c)利用頂點(diǎn)在原圖中裁剪出對(duì)應(yīng)檢測框的位置。

d)采用傾斜矯正和透視變換技術(shù),將裁剪出的不規(guī)則四邊形轉(zhuǎn)換為矩形。

e)采用CRNN+CTC模型識(shí)別文字內(nèi)容。OCR文字識(shí)別效果如圖6所示。

圖6 熔斷器文字識(shí)別效果

采用OCR 技術(shù)識(shí)別文字信息,解決了人工錄入存在的繁瑣、低效、易出差錯(cuò)的問題,有效提高了機(jī)房內(nèi)部文字信息的收集效率。不足之處在于,拍攝存在模糊、散焦以及中英文混合的場景,會(huì)對(duì)識(shí)別效果造成影響,下一步我們將通過增加預(yù)處理模塊、增加采集樣本量進(jìn)行訓(xùn)練、使用業(yè)內(nèi)更先進(jìn)的商用OCR 識(shí)別模型等方法進(jìn)行優(yōu)化。

8 結(jié)束語

借助于三維全景相機(jī)等硬件設(shè)備及三維重建、三維語義分割、目標(biāo)檢測、OCR 等人工智能技術(shù),針對(duì)大規(guī)模的局房及其設(shè)施的數(shù)字化工作,我們已經(jīng)實(shí)現(xiàn)了一套完整的通信局房及其設(shè)施數(shù)字化的技術(shù)方案,并在中國聯(lián)通相關(guān)通信工程設(shè)計(jì)單位得到了落地應(yīng)用。人工智能技術(shù)是實(shí)現(xiàn)通信局房及其設(shè)施數(shù)字化的技術(shù)主導(dǎo),通過人工智能技術(shù),替代了大量原來需要高級(jí)技術(shù)人員才能夠完成的勘察、信息收集、信息提取整理等工作,從而完成了人工手段不可能解決的超大規(guī)模局房資源的數(shù)字化工作;對(duì)我國通信工程設(shè)計(jì)行業(yè)的數(shù)字化轉(zhuǎn)型具有重要的借鑒意義。

猜你喜歡
位姿機(jī)柜三維重建
門檻可拆卸式機(jī)柜車載運(yùn)輸工況的仿真分析
網(wǎng)絡(luò)數(shù)據(jù)中心典型通信機(jī)柜抗震性能擬靜力對(duì)比試驗(yàn)*
三維重建的飛機(jī)機(jī)動(dòng)動(dòng)作庫設(shè)計(jì)與可視化
通訊基站柜內(nèi)空調(diào)的傳熱傳質(zhì)模擬分析
基于PLC的六自由度焊接機(jī)器人手臂設(shè)計(jì)與應(yīng)用
基于位置依賴的密集融合的6D位姿估計(jì)方法
基于Mimics的CT三維重建應(yīng)用分析
曲柄搖桿機(jī)構(gòu)的動(dòng)力學(xué)仿真
基于單目視覺的工件位姿六自由度測量方法研究
鈑金結(jié)構(gòu)機(jī)柜防塵防水設(shè)計(jì)的研究
吐鲁番市| 赫章县| 皋兰县| 湟中县| 万山特区| 沾化县| 乐平市| 石渠县| 清原| 莱州市| 贵州省| 和政县| 巴彦淖尔市| 金沙县| 富民县| 广汉市| 出国| 吉林省| 肥城市| 丰县| 昌黎县| 霸州市| 永和县| 祁阳县| 闵行区| 永昌县| 龙泉市| 大邑县| 宁都县| 临泽县| 北海市| 霍山县| 介休市| 永福县| 灵台县| 固镇县| 曲靖市| 独山县| 施秉县| 慈利县| 南雄市|