国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多層級(jí)地址語義模型構(gòu)建及其在疫情防控中的應(yīng)用

2020-08-03 12:46尹向軍張俊磊崔立新黃華月
測(cè)繪通報(bào) 2020年7期
關(guān)鍵詞:關(guān)聯(lián)語義實(shí)體

尹向軍,陳 陣,張俊磊,崔立新,趙 偉,黃華月

(1.南京市城市規(guī)劃編制研究中心,江蘇 南京 210029; 2.豐圖科技(深圳)有限公司,廣東 深圳 518000;3.察布查爾縣住房和城鄉(xiāng)建設(shè)局,新疆 伊犁 835300)

時(shí)空大數(shù)據(jù)建設(shè)是新型智慧城市的一項(xiàng)基礎(chǔ)性工作,基于精準(zhǔn)地址的地理基座是時(shí)空大數(shù)據(jù)建設(shè)工作最核心的內(nèi)容之一。當(dāng)前,城市各部門匯集了大量的地址數(shù)據(jù),包括測(cè)繪部門采集的大量“所見即所得”地址數(shù)據(jù)、民政部門開展的第二次地名普查數(shù)據(jù)、公安部門發(fā)放的門樓牌地址。此外,水、電、氣等部門建立了專項(xiàng)地址數(shù)據(jù)庫,互聯(lián)網(wǎng)公司基于快遞服務(wù)迅速獲取了大量用戶語義地址數(shù)據(jù)。這充分體現(xiàn)了地址信息對(duì)各行業(yè)管理工作的重要性,但也從側(cè)面反映出地址工作呈現(xiàn)多頭管理和建設(shè)局面。在數(shù)字城市階段,沒有從地理實(shí)體源頭考慮,且在沒有確定地理實(shí)體顆粒度的前提下進(jìn)行的地址建設(shè)無法實(shí)現(xiàn)地址數(shù)據(jù)集約共建和統(tǒng)一共享。

本文面向以應(yīng)用為導(dǎo)向的精細(xì)化管理需求,強(qiáng)化地址標(biāo)準(zhǔn)化管理,建立統(tǒng)一的多層級(jí)地址語義模型和地址唯一編碼。集中開展地址清理采集工作,有效解決地址“重、錯(cuò)、漏”的問題,實(shí)行地址新增、變更、停用、注銷全周期統(tǒng)一管理。將各類政務(wù)數(shù)據(jù)、社會(huì)企業(yè)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化治理,提取地址信息,并與統(tǒng)一標(biāo)準(zhǔn)地址庫進(jìn)行關(guān)聯(lián)融合,形成地址資源庫,最終將地址資源庫地址精確到棟或單元的地理實(shí)體,構(gòu)建智慧城市的統(tǒng)一地理基座,進(jìn)而全面支撐智慧城市的建設(shè)、運(yùn)營、管理及應(yīng)用。

1 多層級(jí)地址語義模型

地址的重要性在于其廣泛的用戶群,包括政府、公眾、組織和商業(yè)行為,城市地址模型要充分地顧及公眾對(duì)城市空間結(jié)構(gòu)的認(rèn)知規(guī)律,并結(jié)合城市規(guī)劃的特點(diǎn),構(gòu)建易于形成公眾城市空間結(jié)構(gòu)知識(shí)的地址模型[1]。地址本質(zhì)上是一組空間地址元素,按照一種地址表示結(jié)構(gòu)組合在一起的字符串。地址模型旨在盡可能完整地把人類在生產(chǎn)生活中對(duì)空間位置的描述細(xì)化成地理實(shí)體顆粒語言,并實(shí)現(xiàn)準(zhǔn)確定位。多層級(jí)地址模型(如圖1所示)通過地理實(shí)體、地址元素、地址3個(gè)層次表達(dá)。地址元素是地址的組成部分,一個(gè)地址元素會(huì)參與多條地址的組成,多個(gè)地址元素組合形成地址。通過元素識(shí)別,把地址中蘊(yùn)含的地址元素及地址表示結(jié)構(gòu)抽取出來,用于融合、關(guān)聯(lián)、標(biāo)準(zhǔn)化處理。建立地址主體元素和行政區(qū)劃、標(biāo)簽及主體內(nèi)部元素之間的上下級(jí)關(guān)系,標(biāo)準(zhǔn)的地址元素按一定規(guī)則、次序排列形成標(biāo)準(zhǔn)地址。

2 統(tǒng)一地址庫建設(shè)

通過對(duì)地址的多層級(jí)語義解析,結(jié)合地址數(shù)據(jù)現(xiàn)狀,對(duì)多源地址數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化融合處理,實(shí)現(xiàn)存量地址數(shù)據(jù)的描述標(biāo)準(zhǔn)化治理,建立地址語義庫,輸出為規(guī)范的統(tǒng)一標(biāo)準(zhǔn)地址庫[2]。建設(shè)流程(如圖2所示)主要包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)檢查、數(shù)據(jù)修復(fù)、數(shù)據(jù)融合及數(shù)據(jù)標(biāo)準(zhǔn)化處理等。

2.1 數(shù)據(jù)預(yù)處理

首先需要解析原始地址數(shù)據(jù)的格式,根據(jù)相關(guān)業(yè)務(wù)說明抽取地址相關(guān)字段并轉(zhuǎn)化為內(nèi)部統(tǒng)一地址規(guī)格,建立原始地址和內(nèi)部地址的關(guān)聯(lián)關(guān)系。根據(jù)數(shù)據(jù)預(yù)處理情況,進(jìn)行數(shù)據(jù)的補(bǔ)充和選取,以提高標(biāo)準(zhǔn)地址庫的覆蓋率,對(duì)數(shù)據(jù)中不規(guī)范地址進(jìn)行標(biāo)準(zhǔn)化和文本排重處理,保證各類地址記錄的唯一性。

2.2 數(shù)據(jù)檢查

數(shù)據(jù)預(yù)處理完成后,需要進(jìn)行數(shù)據(jù)檢查,識(shí)別和挑選出無效地址和垃圾地址,明確數(shù)據(jù)的走向,減少后續(xù)工作流程中的關(guān)聯(lián)及標(biāo)準(zhǔn)化錯(cuò)誤,提升數(shù)據(jù)關(guān)聯(lián)和標(biāo)準(zhǔn)化指標(biāo)。數(shù)據(jù)檢查要確保數(shù)據(jù)的完整性,避免錯(cuò)漏異議記錄入庫,根據(jù)入庫信息正確識(shí)別層級(jí)關(guān)系并將錯(cuò)誤類型進(jìn)行分類標(biāo)識(shí),便于后續(xù)數(shù)據(jù)的修復(fù)。

2.3 數(shù)據(jù)修復(fù)

數(shù)據(jù)修復(fù)使得地址結(jié)構(gòu)完整且正常,不同類別的錯(cuò)誤有不同的修復(fù)手段,如正則表達(dá)式、文本替換等,對(duì)于無法確定的通過標(biāo)記的方式,進(jìn)行逐一確認(rèn)。

2.4 數(shù)據(jù)標(biāo)準(zhǔn)化

地址數(shù)據(jù)標(biāo)準(zhǔn)化處理主要包括要素標(biāo)準(zhǔn)化、標(biāo)準(zhǔn)化檢查、標(biāo)準(zhǔn)化入庫。對(duì)每個(gè)地址元素,都有一個(gè)標(biāo)準(zhǔn)的名稱,從收集的所有名稱中,根據(jù)來源頻次和對(duì)名稱結(jié)構(gòu)的評(píng)估,選出最標(biāo)準(zhǔn)的名稱。對(duì)現(xiàn)實(shí)世界的每一個(gè)地物,都賦予一個(gè)標(biāo)準(zhǔn)地址。對(duì)每一個(gè)要素,都有一個(gè)標(biāo)準(zhǔn)地址結(jié)構(gòu)。在地址結(jié)構(gòu)的要求下,借助標(biāo)準(zhǔn)要素關(guān)系,填充最標(biāo)準(zhǔn)的要素名稱。

2.5 數(shù)據(jù)融合

數(shù)據(jù)融合一方面進(jìn)行同名聚合,將主體元素同名的數(shù)據(jù)聚合,聚合半徑設(shè)定為固定值,通過完全匹配、標(biāo)簽檢查、距離校驗(yàn)等,將聚合半徑范圍內(nèi)的地址數(shù)據(jù)按照主體元素聚合分組。另一方面進(jìn)行語義聚合,即主體元素相似的數(shù)據(jù)聚合,聚合半徑設(shè)置為更大范圍的固定值,通過相似度匹配、標(biāo)簽檢查、距離校驗(yàn)等將聚合半徑范圍內(nèi)的語義地址進(jìn)行語義聚合分組,形成語義聚合壓縮后的統(tǒng)一地址。

3 地理實(shí)體關(guān)聯(lián)技術(shù)

地址數(shù)據(jù)是地理實(shí)體這一核心要素的一類重要信息,所有的地址數(shù)據(jù)都是圍繞地理實(shí)體這一核心要素。地址是地理實(shí)體位置的結(jié)構(gòu)化描述,地理實(shí)體空間位置的表達(dá)[3]。地理實(shí)體的“址”必須依托于一個(gè)客觀存在的地理實(shí)體,依據(jù)與不同層次等級(jí)的顆粒度建立通用的地址數(shù)據(jù)庫,要對(duì)地理實(shí)體進(jìn)行分類梳理,根據(jù)整理所得的地理實(shí)體分類分級(jí)體系開展其地址數(shù)據(jù)的采集、整合、建庫工作。地址數(shù)據(jù)的產(chǎn)生、管理、維護(hù)和應(yīng)用其實(shí)質(zhì)就是對(duì)地理實(shí)體這一核心的認(rèn)識(shí)、理解、分類、編碼、空間定位與管理的問題。

地址與地理實(shí)體通過空間關(guān)聯(lián)和文本關(guān)聯(lián)等技術(shù)手段,實(shí)現(xiàn)地址編碼與地理實(shí)體編碼的一一對(duì)應(yīng)。

3.1 空間關(guān)聯(lián)

地址與地理實(shí)體的空間關(guān)聯(lián)(如圖3所示)是通過地址點(diǎn)數(shù)據(jù)坐標(biāo)屬性值和樓棟數(shù)據(jù)區(qū)域?qū)傩灾颠M(jìn)行疊加分析,檢查點(diǎn)面之間的包含關(guān)系,并建立唯一編碼關(guān)聯(lián)關(guān)系。

圖3 空間數(shù)據(jù)關(guān)聯(lián)方法

3.2 文本關(guān)聯(lián)

地址與地理實(shí)體的文本關(guān)聯(lián)方案是對(duì)空間關(guān)聯(lián)方案的補(bǔ)充。對(duì)空間關(guān)聯(lián)不上或空間關(guān)聯(lián)質(zhì)量不達(dá)標(biāo)的數(shù)據(jù)進(jìn)行文本關(guān)聯(lián),主要有兩種形式。

一是基于緩沖區(qū)的文本關(guān)聯(lián)(如圖4所示):在點(diǎn)數(shù)據(jù)一定緩沖區(qū)范圍內(nèi),通過分詞算法提取點(diǎn)數(shù)據(jù)和樓棟面數(shù)據(jù)的要素名稱,通過完全匹配算法、相似度算法進(jìn)行文本匹配關(guān)聯(lián)。

圖4 緩沖區(qū)文本關(guān)聯(lián)方法

二是基于歸一化的文本關(guān)聯(lián)(如圖5所示):將面數(shù)據(jù)轉(zhuǎn)成點(diǎn)數(shù)據(jù)格式,然后對(duì)點(diǎn)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,利用歸一化后的成果進(jìn)行關(guān)聯(lián)。

圖5 歸一化文本關(guān)聯(lián)方法

3.3 關(guān)聯(lián)成果

本次試驗(yàn)范圍為江蘇省南京市鼓樓、建鄴、秦淮、玄武、棲霞、雨花及江北新區(qū)共計(jì)千余平方千米,基于公安門樓址、調(diào)查采集及商業(yè)地址共計(jì)20余萬條記錄,開展了數(shù)據(jù)清洗和關(guān)聯(lián),建立了標(biāo)準(zhǔn)地址樓棟或單元級(jí)的地理實(shí)體自動(dòng)關(guān)聯(lián)(如圖6所示)。關(guān)聯(lián)結(jié)果顯示標(biāo)準(zhǔn)地址與建筑物實(shí)體整體準(zhǔn)確率在90%以上,尤其新建、規(guī)整建筑物實(shí)體數(shù)據(jù)關(guān)聯(lián)準(zhǔn)確率達(dá)到100%?;诙鄬蛹?jí)地址語義模型構(gòu)建的多源地址數(shù)據(jù)建庫關(guān)聯(lián)技術(shù),較傳統(tǒng)調(diào)查采集方法具有工作效率高和錯(cuò)誤率低的優(yōu)勢(shì),全面提升了數(shù)據(jù)成果規(guī)格的準(zhǔn)確率,明顯改善了社會(huì)治理和管理的能力。

圖6 地址和地理實(shí)體關(guān)聯(lián)

4 地址數(shù)據(jù)在疫情防控中的應(yīng)用

由于現(xiàn)實(shí)世界中超過80%的數(shù)據(jù)與地理位置相關(guān),地理位置主要通過空間坐標(biāo)和語義描述進(jìn)行地址表達(dá)[4],地址成為包括面向疫情防控在內(nèi)的很多大數(shù)據(jù)應(yīng)用和服務(wù)的基礎(chǔ)。借助于地理搜索、智能輸入提示、地理編碼、逆地理編碼及數(shù)據(jù)關(guān)聯(lián)等地址服務(wù),可以實(shí)現(xiàn)“以地址找房、以房找人、以人找企業(yè)”等實(shí)際應(yīng)用。地址數(shù)據(jù)在疫情防控中的應(yīng)用主要體現(xiàn)在疫情監(jiān)測(cè)和疫情信息服務(wù)方面。在COVID-19疫情中,地址數(shù)據(jù)為公共疫情防控提供了疫情統(tǒng)計(jì)、病例分布情況查詢等服務(wù)。利用戶籍地址、企業(yè)注冊(cè)地址與標(biāo)準(zhǔn)地址的匹配服務(wù),可協(xié)助疫情精準(zhǔn)防控和社會(huì)復(fù)工復(fù)產(chǎn)。

4.1 疫情統(tǒng)計(jì)

疫情的監(jiān)測(cè)可以幫助衛(wèi)生防控部門及時(shí)了解疫情擴(kuò)散的狀態(tài)及各地區(qū)疫情的嚴(yán)重程度,協(xié)助使其更加合理地部署和協(xié)調(diào)醫(yī)療資源,幫助公眾了解周邊的感染源分布情況,采取遠(yuǎn)離感染者、居家隔離等方式進(jìn)行科學(xué)的預(yù)防感染?;诮y(tǒng)一的地址服務(wù),可以統(tǒng)計(jì)公共疫情分布情況,如圖7所示。

圖7 疫情統(tǒng)計(jì)分布

4.2 疫情防控

基于標(biāo)準(zhǔn)地址的建筑物實(shí)體可實(shí)現(xiàn)人、房、組織、事件、部件有效融合、自動(dòng)綜合和關(guān)聯(lián)聚類,將確診、疑似病人與社會(huì)管理資源池進(jìn)行比對(duì),獲取人口實(shí)際居住情況(如圖8所示)。通過地址匹配進(jìn)行空間定位,快速實(shí)現(xiàn)人員的網(wǎng)格化管理,以此進(jìn)行密切接觸人員的監(jiān)管,并分析疫情傳播規(guī)律及公共設(shè)施對(duì)疫情傳播造成的影響。

圖8 人口數(shù)據(jù)地址關(guān)聯(lián)應(yīng)用

4.3 企業(yè)復(fù)工

在企業(yè)復(fù)工階段,通過工商地址與標(biāo)準(zhǔn)地址的快速匹配,將企業(yè)名稱落實(shí)到樓宇位置上(如圖9所示),能夠隨時(shí)隨地查看企業(yè)復(fù)工信息,實(shí)現(xiàn)載體、樓宇、企業(yè)人口規(guī)模信息的動(dòng)態(tài)維護(hù),為企業(yè)復(fù)工、疫情防控及醫(yī)療資源配備提供全面的管理和支撐。

圖9 企業(yè)數(shù)據(jù)房屋關(guān)聯(lián)應(yīng)用

標(biāo)準(zhǔn)地址匹配技術(shù)在此次疫情防控過程中為各政府管理部門提供了統(tǒng)一的地址匹配與地圖定位服務(wù),隨著智慧城市建設(shè)的深入,地址服務(wù)尤其在政府宏觀決策、城市規(guī)劃與建設(shè)、城市管理與公共安全方面具有廣闊的應(yīng)用場(chǎng)景和社會(huì)價(jià)值。

5 結(jié) 語

在數(shù)字城市階段,地理信息數(shù)據(jù)服務(wù)方式主要是背景圖。隨著智慧城市建設(shè)的推進(jìn)和深入,用戶逐漸對(duì)地理實(shí)體應(yīng)用需求更加關(guān)注,通過生產(chǎn)統(tǒng)一的地理基座,構(gòu)建全面的、以地址為視角的城市畫像,極大地改善了目前普遍存在的部門業(yè)務(wù)數(shù)據(jù)難以應(yīng)用的現(xiàn)狀,同時(shí)有助于面向各政府部門實(shí)現(xiàn)統(tǒng)一的地址匹配與地理實(shí)體定位服務(wù)?;诙鄬蛹?jí)地址語義模型構(gòu)建的地理實(shí)體庫,在樓棟及單元級(jí)地址應(yīng)用中取得了顯著的效果,但隨著城市治理進(jìn)一步精細(xì)化,對(duì)于非建筑類地理實(shí)體,如模糊的語義地址,某小區(qū)快遞柜、某條道路路燈等,及在應(yīng)急保障上需求也日漸急迫,未來需進(jìn)一步構(gòu)建精細(xì)化的地理實(shí)體細(xì)分類,建立地址和地理實(shí)體動(dòng)態(tài)協(xié)同更新的機(jī)制,全面推進(jìn)智慧城市的建設(shè)。

猜你喜歡
關(guān)聯(lián)語義實(shí)體
真實(shí)場(chǎng)景水下語義分割方法及數(shù)據(jù)集
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
實(shí)體書店步入復(fù)興期?
2017實(shí)體經(jīng)濟(jì)領(lǐng)軍者
奇趣搭配
兩會(huì)進(jìn)行時(shí):緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
智趣
“吃+NP”的語義生成機(jī)制研究
漢語依憑介詞的語義范疇
溆浦县| 新安县| 商城县| 祁东县| 图们市| 金乡县| 荥经县| 义乌市| 腾冲县| 岳普湖县| 江西省| 南澳县| 邛崃市| 耿马| 五台县| 滨海县| 灵寿县| 普兰县| 神木县| 南岸区| 彭山县| 婺源县| 泰宁县| 新竹县| 武胜县| 东宁县| 从化市| 新宾| 桓台县| 双流县| 佛教| 卫辉市| 疏勒县| 德庆县| 大竹县| 治多县| 南开区| 乌恰县| 沙坪坝区| 来凤县| 明水县|