国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

知識圖譜驅(qū)動的多類型城市體檢協(xié)同方法研究

2022-06-08 03:44:38宋知達(dá)姜冬睿崔博庶茅明睿WANGTengSONGZhidaJIANGDongruiCUIBoshuMAOMingrui
上海城市規(guī)劃 2022年1期
關(guān)鍵詞:數(shù)據(jù)源圖譜指標(biāo)體系

王 騰 宋知達(dá) 姜冬睿 崔博庶 茅明睿 WANG Teng,SONG Zhida,JIANG Dongrui,CUI Boshu,MAO Mingrui

0 引言

2017年2月,習(xí)近平總書記視察北京市城市規(guī)劃建設(shè)工作時,提出建立“城市體檢”評估機(jī)制,自此,城市體檢得到中央部委和地方的高度重視。住房和城鄉(xiāng)建設(shè)部(以下簡稱“住建部”)從城市人居視角出發(fā),不斷擴(kuò)大城市體檢試點;自然資源部(以下簡稱“自資部”)則主推國土空間規(guī)劃城市體檢評估,并發(fā)布了《國土空間規(guī)劃城市體檢評估規(guī)程》;各地方也涌現(xiàn)了具有地方特色的城市體檢或體檢類工作,如北京市于2017年發(fā)布的《北京城市總體規(guī)劃(2016年—2035年)》提出“一年一體檢,五年一評估”,并較早開展了地方性體檢評估工作。這些城市體檢實踐都有助于及時發(fā)現(xiàn)“城市病”,為城市治理提供依據(jù),并積累了較多的研究成果[1-3]。但是,不同部門主導(dǎo)的不同類型城市體檢在數(shù)據(jù)、指標(biāo)和算法上存在重合或相似之處,導(dǎo)致地方城市在開展多類型體檢工作中重復(fù)投入人力與物力,工作人員容易對不同體系的相似內(nèi)容產(chǎn)生認(rèn)知困惑,對社會公示的體檢結(jié)果也難以保證口徑一致。目前,國內(nèi)尚無多類型城市體檢問題的討論和回應(yīng)。在此背景下,本文試圖在厘清現(xiàn)有主流城市體檢體系的基礎(chǔ)上,探索利用知識圖譜技術(shù)實現(xiàn)多類型城市體檢體系的協(xié)同。知識圖譜技術(shù)作為一種揭示實體之間關(guān)系的語義網(wǎng)絡(luò),為表達(dá)、組織、管理與利用海量的信息和數(shù)據(jù)提供了一種有效的方式,近年來得到各專業(yè)領(lǐng)域的關(guān)注,有學(xué)者利用知識圖譜開展城市研究的指標(biāo)識別與設(shè)計工作[4-5]。

1 多類型體檢體系的問題與多檢協(xié)同

1.1 當(dāng)前主要城市體檢體系概述

現(xiàn)有的主流城市體檢主要有住建部、自資部和地方3套體系。其中住建部城市體檢體系是住建部為實現(xiàn)城市人居環(huán)境常態(tài)化監(jiān)測,及時發(fā)現(xiàn)、解決城市問題而制定的工作制度和技術(shù)方法,至2021年已在58個城市試點。自資部城市體檢是自資部為“健全國土空間規(guī)劃實時監(jiān)測、定期評估、動態(tài)維護(hù)制度”[6]而開展的城市體檢評估。由于自資部是國土空間規(guī)劃的主管部門,城市體檢評估作為國土空間規(guī)劃的下游政策工具,其針對性十分明確。地方體檢方面,北京市是最早開始城市體檢探索的城市之一。由于首都的特殊性,以及北京市規(guī)劃和自然資源委員會權(quán)責(zé)的獨(dú)特性及探索先行性,其體檢體系與住建部和自資部差異較大,充分體現(xiàn)首都特色,城市體檢成果主要用于評估總體規(guī)劃實施效果,同時支持年度建設(shè)計劃的制定[7]??傮w上看,各類型的城市體檢評估都作為城市問題診斷的參考依據(jù),且都從不同角度挖掘城市發(fā)展中需改善的問題,形成一套完善、自洽的城市治理方案,助力城市健康發(fā)展,在組織流程、原則導(dǎo)向、內(nèi)容成果、指標(biāo)體系、數(shù)據(jù)獲取等方面存在許多共同點。

1.2 多類型城市體檢產(chǎn)生的問題

由于不同類型城市體檢體系的指標(biāo)存在重疊和相似之處,不同的城市體檢體系在解決各自關(guān)注問題的同時,也引發(fā)了重復(fù)性工作和權(quán)威性受質(zhì)疑等問題。首先,城市體檢內(nèi)容覆蓋城市的方方面面,各城市體檢數(shù)據(jù)獲取過程中需要多部門的廣泛參與和支持。但不同體檢在工作內(nèi)容構(gòu)成、組織動員流程、指標(biāo)與數(shù)據(jù)體系等方面存在相同或相似之處,勢必增加重復(fù)工作。尤其是對于來自各政府部門的社會統(tǒng)計數(shù)據(jù)、部門專業(yè)數(shù)據(jù),不同的體檢團(tuán)隊需各自獲取,既浪費(fèi)工作團(tuán)隊的精力,也會給政府部門增加工作量。此外,由于數(shù)據(jù)出口、版本和算法的差異,可能導(dǎo)致相同或類似的體檢指標(biāo)產(chǎn)生不同的結(jié)果,影響城市體檢工作的權(quán)威性。從技術(shù)角度看,重復(fù)性和權(quán)威性問題產(chǎn)生的主要原因源于3方面。

第一,指標(biāo)不打通。不同體檢指標(biāo)體系在制定和運(yùn)行時缺乏溝通協(xié)調(diào),既存在完全相同的指標(biāo),如住建部、自資部和北京市體檢指標(biāo)中均包括“全社會R&D支出占GDP比重”和“人均避難場所面積”等指標(biāo),也包括名稱不同內(nèi)涵相似的指標(biāo)、在數(shù)據(jù)源和算法存在聯(lián)系的指標(biāo)。如果能建立所有指標(biāo)間的相互關(guān)系,那么在某一類型的城市體檢先行開展后,其他類型的城市體檢可直接或間接使用已有成果,甚至不同類型的城市體檢可以統(tǒng)籌安排。

第二,數(shù)據(jù)難共享。數(shù)據(jù)是體檢工作的基礎(chǔ),住建部和自資部的城市體檢數(shù)據(jù)源都包括經(jīng)濟(jì)社會發(fā)展統(tǒng)計數(shù)據(jù)和社會大數(shù)據(jù),其中涵蓋了大量相同的底層數(shù)據(jù)。由于體檢工作的組織方式原因,其開展團(tuán)隊、收集過程、數(shù)據(jù)提供方填報過程一般都是獨(dú)立的,所以可能存在重復(fù)收集、重復(fù)調(diào)研、重復(fù)填報等問題,而通過數(shù)據(jù)共享可以避免很大部分的重復(fù)勞動。

第三,算法不統(tǒng)一。不同指標(biāo)體系制定了各指標(biāo)的算法,名稱或關(guān)注問題相似的指標(biāo)算法存在差異。如住建部的“公園綠地服務(wù)半徑覆蓋率”和自資部的“公園綠地、廣場步行5分鐘覆蓋率”都關(guān)注公園綠地的服務(wù)覆蓋情況,但算法完全不同。雖然不同指標(biāo)關(guān)注點存在區(qū)別,算法和最終結(jié)果可以不同,但為避免混淆導(dǎo)致的錯誤和質(zhì)疑,一方面體檢團(tuán)隊需要深刻理解不同指標(biāo)體系中相似指標(biāo)的差異,另一方面也要在對外收集數(shù)據(jù)和成果發(fā)布時做好說明。

為解決以上問題,需統(tǒng)籌指標(biāo)、數(shù)據(jù)和計算各環(huán)節(jié),探索能否將不同城市體檢體系整合,以提升城市體檢效率,節(jié)約社會資源。

1.3 問題響應(yīng):多檢協(xié)同

基于多類型城市體檢存在的問題,本文借鑒規(guī)劃領(lǐng)域針對多類型規(guī)劃不協(xié)調(diào)而提出的“多規(guī)協(xié)同”[8-10],提出“多檢協(xié)同”概念,即將不同城市體檢體系納入統(tǒng)一框架,通過技術(shù)和機(jī)制的統(tǒng)籌,實現(xiàn)不同類型體檢的協(xié)調(diào)開展?!岸鄼z協(xié)同”不是將所有體檢整合為一個體檢體系,而是通過不同城市體檢體系之間的協(xié)作與合作,實現(xiàn)資源高效利用。協(xié)同的內(nèi)容包括城市體檢的不同環(huán)節(jié),可分為機(jī)制管理協(xié)同和技術(shù)協(xié)同兩大部分,本文僅涉及后者,包括指標(biāo)、數(shù)據(jù)和算法上的協(xié)同。

多類型城市體檢體系問題的解決具有現(xiàn)實緊迫性。多檢協(xié)同既是協(xié)調(diào)技術(shù)沖突和冗余的有效手段,也是形成政策合力、解決政出多門,從而更好地開展城市治理的時代響應(yīng)。通過協(xié)同,可以有效解決當(dāng)下多類型城市體檢評估體系并行導(dǎo)致的問題,減少資源重復(fù)投入,推動更高效的城市治理。

多檢協(xié)同也具有現(xiàn)實可行性。由于各類型的城市體檢根本目的一致,工作原則、組織方式、指標(biāo)體系、數(shù)據(jù)源等具有共同點,本文引入知識圖譜技術(shù),以解決多檢協(xié)同中的知識和語義關(guān)系問題。

2 知識圖譜技術(shù)及其應(yīng)用價值

知識圖譜是一種基于圖模型的方式來描述知識,并通過關(guān)系來構(gòu)建知識之間聯(lián)系的大規(guī)模語義網(wǎng)絡(luò),包括知識構(gòu)建、知識存儲、知識融合、知識表達(dá)、知識挖掘等具體技術(shù)[11]。相較于傳統(tǒng)的大數(shù)據(jù)結(jié)構(gòu),知識圖譜在基于規(guī)則化知識的基礎(chǔ)上能夠覆蓋更加復(fù)雜的知識結(jié)構(gòu),在存儲知識的同時存儲知識之間的各種關(guān)系,使得計算機(jī)能夠更進(jìn)一步理解和解釋具有復(fù)雜關(guān)系的知識體系。

如前文所述,在多檢協(xié)同的工作中最重要的是建立不同城市體檢體系之間的聯(lián)系,將不同城市體檢指標(biāo)、數(shù)據(jù)和計算置于同一框架中。而知識圖譜技術(shù)的核心優(yōu)勢在于對復(fù)雜關(guān)系網(wǎng)絡(luò)的理解能力和對知識關(guān)系更強(qiáng)的構(gòu)建能力,能夠完美對應(yīng)協(xié)同的要求。知識圖譜技術(shù)在多城市體檢協(xié)同工作中具體包括4個方面的應(yīng)用價值:一是通過知識表達(dá)關(guān)系網(wǎng)梳理并全面理解數(shù)據(jù)和指標(biāo),發(fā)現(xiàn)不同類型體檢指標(biāo)的聯(lián)系與共性,打通不同指標(biāo)體系之間的壁壘;二是通過使用知識圖譜的圖數(shù)據(jù)庫存儲,可以建立完整的全數(shù)據(jù)—指標(biāo)庫,實現(xiàn)數(shù)據(jù)和指標(biāo)的全面共享和調(diào)用;三是在構(gòu)建好知識庫后,通過知識融合技術(shù),可以在知識更新過程中避免知識冗余和關(guān)系沖突,保證知識的準(zhǔn)確性和一致性;四是通過圖譜知識問答技術(shù),可以實現(xiàn)城市體檢領(lǐng)域的相關(guān)規(guī)則、知識、標(biāo)準(zhǔn)的快速查詢,大大減少工作人員對經(jīng)驗的依賴性。

綜上所述,基于知識圖譜技術(shù)打通數(shù)據(jù)、指標(biāo)和算法的聯(lián)系,能夠?qū)崿F(xiàn)更有效的體檢知識關(guān)系表達(dá)和更科學(xué)的分析反饋,可以減少資源的重復(fù)投入,高效地實現(xiàn)體檢工作的各項要求。因此,在多檢協(xié)同中引入知識圖譜技術(shù)是可行的。

3 知識圖譜驅(qū)動的多檢協(xié)同方法

基于知識圖譜技術(shù)特性和多檢協(xié)同需解決的問題,本文嘗試從知識圖譜實現(xiàn)多檢協(xié)同的數(shù)據(jù)工作流程角度展開論述。知識圖譜位于整個多檢協(xié)同流程的上層,是加工后城市體檢內(nèi)容的管理工具和多維度信息聚集的輔助決策中心。多檢協(xié)同方法又按照數(shù)據(jù)協(xié)同、指標(biāo)協(xié)同和算法協(xié)同3大類進(jìn)行流程設(shè)計,形成了縱向和橫向的多維關(guān)系網(wǎng)絡(luò)(見圖1)。

圖1 知識圖譜驅(qū)動的多檢協(xié)同方法流程圖Fig.1 Flow chart of multi-type city examination synergy method driven by knowledge graph

3.1 數(shù)據(jù)協(xié)同

數(shù)據(jù)是體檢計算的原料,因而多檢協(xié)同的第一步是實現(xiàn)數(shù)據(jù)協(xié)同。數(shù)據(jù)協(xié)同是指把不同領(lǐng)域(自然空間、城市空間、社會、經(jīng)濟(jì)、政治、文化等)、不同來源(政府部門、互聯(lián)網(wǎng)平臺、實地調(diào)研、物聯(lián)網(wǎng)感知)、通過不同途徑(人工填報錄入、大數(shù)據(jù)批量獲取、部門協(xié)調(diào))獲取的多元異構(gòu)數(shù)據(jù)(結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化),經(jīng)過清洗和整理,以統(tǒng)一標(biāo)準(zhǔn)化的格式錄入數(shù)據(jù)庫中?;趫D關(guān)系技術(shù),將需要實現(xiàn)協(xié)同的體檢指標(biāo)體系中涉及的各類型數(shù)據(jù)進(jìn)行梳理,將其加入城市體檢知識庫,從而實現(xiàn)基于知識圖譜的多源體檢數(shù)據(jù)的有機(jī)統(tǒng)一管理。

在城市體檢實際工作中,一個指標(biāo)可能有一個數(shù)據(jù)來源,也存在一個指標(biāo)需要多個數(shù)據(jù)來源,通過復(fù)雜算法或相互參考校核得出指標(biāo)結(jié)果的情況。為了在滿足體檢合規(guī)要求的同時豐富體檢內(nèi)容,需要從數(shù)據(jù)源入手,了解數(shù)據(jù)的可行性,發(fā)現(xiàn)備選和替代方案,進(jìn)行指標(biāo)所用數(shù)據(jù)的統(tǒng)籌設(shè)計。使用傳統(tǒng)的數(shù)據(jù)庫管理,由于數(shù)據(jù)在時間、空間等各個層級上的可實現(xiàn)性不同,數(shù)據(jù)協(xié)同、打通下沉并統(tǒng)一管理的難度很高。而知識圖譜管理的優(yōu)勢就在于能夠打破傳統(tǒng)數(shù)據(jù)表之間的隔閡,以基本的數(shù)據(jù)類型為抓手,更容易按照需求對體檢可用的數(shù)據(jù)進(jìn)行統(tǒng)一查看和管理。在知識圖譜中,三元組是建立知識之間聯(lián)系的基本單位,其基本形式為“實體—關(guān)系—實體”或“實體—屬性—屬性值”,如“空氣質(zhì)量數(shù)據(jù)—對應(yīng)關(guān)系—空氣優(yōu)良天數(shù)比率指標(biāo)”就建立起了數(shù)據(jù)源和指標(biāo)的對應(yīng)關(guān)系,同理還可以建立特征標(biāo)簽、時空范圍等指標(biāo)屬性與指標(biāo)的對應(yīng)關(guān)系,便于工作人員從數(shù)據(jù)源頭著手,進(jìn)行指標(biāo)的統(tǒng)籌。

3.2 指標(biāo)協(xié)同

3.2.1 底層指標(biāo)抽取

前文多類型城市體檢體系問題的分析中,提及不同體檢指標(biāo)體系之間名稱、內(nèi)涵、算法和數(shù)據(jù)源上的各種聯(lián)系。因此,筆者通過提取出“底層指標(biāo)”,作為搭建指標(biāo)體系最基礎(chǔ)的單元和連接節(jié)點,來實現(xiàn)整個指標(biāo)體系的整合和重建。這里的“底層指標(biāo)”指的是將各指標(biāo)體系中最下面一級的指標(biāo)做進(jìn)一步抽取,得到不需經(jīng)過二次計算的原始數(shù)值。例如,住建部體檢指標(biāo)體系最下級指標(biāo)“城市新增商品住宅與新增人口住房需求比”,實際上是由“城市新增商品住宅量”與“新增人口住房需求量”兩個“底層指標(biāo)”相除計算得出的。

具體操作中,筆者嘗試在知識圖譜中運(yùn)用自然語言處理技術(shù),結(jié)合指標(biāo)名稱特征、算法描述、數(shù)據(jù)源,抽取出“底層指標(biāo)”實體,將加入多檢協(xié)同的所有指標(biāo)體系都打散,構(gòu)建涵蓋全面的綜合指標(biāo)表,并在數(shù)據(jù)庫中進(jìn)行統(tǒng)一存儲。

3.2.2 指標(biāo)屬性管理

傳統(tǒng)的大數(shù)據(jù)方法基于結(jié)構(gòu)化的數(shù)據(jù),通過讀取表格、字段的方式滿足城市體檢的指標(biāo)計算和管理需求。但如果面臨多指標(biāo)體系、復(fù)雜數(shù)據(jù)來源,單一的結(jié)構(gòu)化數(shù)據(jù)無法關(guān)聯(lián)不同來源數(shù)據(jù),很難發(fā)現(xiàn)層級豐富、表達(dá)方式多樣的指標(biāo)間存在的聯(lián)系。知識圖譜中的數(shù)據(jù)和指標(biāo)作為主體都有各自相應(yīng)屬性,以屬性為索引,可以更加深入地了解指標(biāo)的內(nèi)涵,發(fā)現(xiàn)數(shù)據(jù)和指標(biāo)、指標(biāo)和指標(biāo)的聯(lián)系,可為城市體檢工作人員理解體檢指標(biāo)體系、根據(jù)實際需求設(shè)計指標(biāo)體系提供關(guān)鍵依據(jù)。

指標(biāo)屬性通常包括其數(shù)據(jù)來源、歸屬體系、空間顆粒度(市、區(qū)縣、街鄉(xiāng)鎮(zhèn)等)、時間顆粒度(年度、半年度、季度;連續(xù)累計、瞬時截面等)、特征標(biāo)簽(如“環(huán)境”類指標(biāo)、“公共服務(wù)”類指標(biāo)等)。以“城市道路網(wǎng)密度”為例,數(shù)據(jù)來源為互聯(lián)網(wǎng)地圖,其指標(biāo)空間顆粒度為街鄉(xiāng)鎮(zhèn),時間顆粒度為年度,特征標(biāo)簽為交通設(shè)施類。

3.2.3 指標(biāo)關(guān)系管理

在實際應(yīng)用中,對指標(biāo)關(guān)系(包括層級、類型、數(shù)據(jù)源和內(nèi)涵等方面)的全面和深入了解,是體檢參與人員理解和設(shè)計體檢指標(biāo)體系的另一個關(guān)鍵。傳統(tǒng)的數(shù)據(jù)可視化表達(dá)往往采用樹狀圖的模式對結(jié)構(gòu)化數(shù)據(jù)進(jìn)行展示,包含多層級和跨層級的復(fù)雜結(jié)構(gòu),無法對關(guān)系型概念形成良好支撐。而知識圖譜基于三元組的知識構(gòu)建,具有極強(qiáng)的關(guān)系表達(dá)能力,擅長處理多層級的復(fù)雜系統(tǒng),可以通過可視化表達(dá)展示多層級的復(fù)雜關(guān)系。通過城市體檢指標(biāo)網(wǎng)狀關(guān)系圖,既能實現(xiàn)同一指標(biāo)體系內(nèi)的上下級關(guān)系打通,也能按照指標(biāo)內(nèi)涵、指標(biāo)特征建立跨指標(biāo)體系的相互關(guān)系。例如,在“公共服務(wù)”領(lǐng)域下,通過知識圖譜可以管理多指標(biāo)體系下此領(lǐng)域包含的所有指標(biāo),其中包括自資部的“社區(qū)小學(xué)步行10分鐘覆蓋率”“社區(qū)文化活動設(shè)施步行15分鐘覆蓋率”和住建部的“公園綠地服務(wù)半徑覆蓋率”。

3.3 計算協(xié)同

3.3.1 算法一致性設(shè)計

由于專項體檢和不同城市的差異性,實際的城市體檢工作中往往會有深入且具差異性的專項業(yè)務(wù)需求,但算法設(shè)計的一致性是計算協(xié)同的前提。結(jié)合問題分析中發(fā)現(xiàn)的算法關(guān)聯(lián)和計算結(jié)果的判讀需要,本文梳理了指標(biāo)計算類型、參考值/閾值、算法公式、去量綱/歸一化、權(quán)重等5類算法設(shè)計標(biāo)準(zhǔn)和知識,并形成完整的城市體檢算法關(guān)系網(wǎng)絡(luò),可以充分支持不同體檢體系之間計算結(jié)果的互相利用和新增專項分析算法的實現(xiàn)。

(1)計算類型

以計算方法分類,指標(biāo)可分為達(dá)標(biāo)型、引導(dǎo)型和評價型。達(dá)標(biāo)型指標(biāo)結(jié)果只有達(dá)標(biāo)與不達(dá)標(biāo)兩種二元變量,然后直接給予評價或賦予標(biāo)準(zhǔn)指標(biāo)值。例如“空氣質(zhì)量優(yōu)良天數(shù)”指標(biāo),按照國務(wù)院要求,參與評估的城市空氣優(yōu)良天數(shù)不低于292天的,直接給予“達(dá)標(biāo)”的評價,低于292天的則給予“不達(dá)標(biāo)”的評價。引導(dǎo)型指標(biāo)是指在值域內(nèi)的幾個關(guān)鍵特征節(jié)點設(shè)立閾值,通過不同閾值的設(shè)定,為達(dá)到或優(yōu)于關(guān)鍵閾值的結(jié)果賦對應(yīng)的得分。例如“萬人城市文化面積(m2/萬人)”指標(biāo),≥2 500為優(yōu)秀得分即100分,2 000—2 500之間為達(dá)標(biāo)得分即60—100分,<2 000得分則為0—60分。評價型指標(biāo)是指在指標(biāo)結(jié)果值域中不特意設(shè)置節(jié)點,通過數(shù)值高低得出指標(biāo)得分、評價好壞。例如,“實施專業(yè)化物業(yè)管理的住宅小區(qū)占比”,對于0%—100%的指標(biāo)值域,可以直接給予0—100分的評價。

(2)參考值/閾值

達(dá)標(biāo)型、引導(dǎo)型指標(biāo)的節(jié)點可以被稱為參考值或閾值。評價型指標(biāo)則需要考慮使指標(biāo)結(jié)果有意義的最大值和最小值,它們也可以被稱為參考值。例如,北京市的體檢指標(biāo)體系想要設(shè)定“空氣質(zhì)量優(yōu)良天數(shù)”指標(biāo),參考值和閾值包括3類:規(guī)定值,如國務(wù)院《“十三五”生態(tài)環(huán)境保護(hù)規(guī)劃》和《打贏藍(lán)天保衛(wèi)戰(zhàn)三年行動計劃》規(guī)定,2020年地級及以上城市空氣質(zhì)量優(yōu)良天數(shù)比率達(dá)到80%;對標(biāo)值,2020年36個樣本城市的結(jié)果,最低是58%,最高是98%;歷史值,如北京過去10年空氣質(zhì)量優(yōu)良的天數(shù)比例、以往體檢指標(biāo)體系計算的該指標(biāo)結(jié)果。很多時候,在難以找到合適的規(guī)定值和對標(biāo)值的時候,歷史值的作用就特別顯著。

圖2 跨指標(biāo)體系的知識圖譜管理——以“公共服務(wù)”為例Fig.2 Sketch map of multi-index management in knowledge graph focusing on "public service"

(3)算法公式

即指標(biāo)結(jié)果實現(xiàn)的數(shù)學(xué)方法,除了各類具體算法,還有通用性算法,如采用人均統(tǒng)計或地均統(tǒng)計,計算平均值或中值等。

(4)去量綱/歸一化

體檢指標(biāo)體系屬于多層級指標(biāo)體系,往往需要下級指標(biāo)的數(shù)值結(jié)果向上級聚合,得出上級指標(biāo)的得分?jǐn)?shù)值。這就首先需要去量綱/歸一化。去量綱指的是去除數(shù)據(jù)單位之間的不統(tǒng)一,將數(shù)據(jù)統(tǒng)一變換為無單位(統(tǒng)一單位)的數(shù)據(jù)集。數(shù)據(jù)歸一化指的是將數(shù)據(jù)按比例縮放,使之落入一個特定的區(qū)間,便于不同單位或量級的指標(biāo)能夠進(jìn)行比較和加權(quán)。去量綱/歸一化有多種數(shù)學(xué)方法,如線性函數(shù)歸一化、零均值標(biāo)準(zhǔn)化等。在實際體檢應(yīng)用中,還要考慮空間、時間、指標(biāo)特征等因素,就更需要有多方面的知識參照來輔助算法的設(shè)計。

(5)權(quán)重

不同的下級指標(biāo)在一個上級指標(biāo)的框架內(nèi)重要性不同,用來量化這個重要性的數(shù)值即為權(quán)重。權(quán)重設(shè)定是下級指標(biāo)向上級聚合的第二步。常用的權(quán)重設(shè)計方法包括主觀的經(jīng)驗打分和專家打分法,以及客觀的從指標(biāo)的數(shù)值統(tǒng)計特征進(jìn)行權(quán)重設(shè)定的方法,如利用數(shù)據(jù)的信息濃縮原理、通過方差解釋率進(jìn)行權(quán)重設(shè)定的因子分析和主成分法,利用數(shù)字的相對大小信息進(jìn)行權(quán)重設(shè)定的AHP層次法和優(yōu)序圖法,利用數(shù)據(jù)熵值信息即信息量大小進(jìn)行權(quán)重設(shè)定的熵權(quán)法等。不管是主觀的打分法還是客觀的數(shù)值特征設(shè)定方法,都需要盡量多的知識/信息/數(shù)據(jù),而知識圖譜可以極大地擴(kuò)充它們的來源,從而提升其科學(xué)性和全面性。

3.3.2 指標(biāo)自動/關(guān)聯(lián)計算

體檢相關(guān)的知識、指標(biāo)內(nèi)容和算法保存在知識圖譜系統(tǒng)中,數(shù)據(jù)和指標(biāo)計算結(jié)果可以保存在與知識圖譜連接的數(shù)據(jù)庫中。因而可以通過基于知識圖譜開發(fā)的指標(biāo)配置工具,實現(xiàn)指標(biāo)的自動/關(guān)聯(lián)計算,配置城市體檢的指標(biāo)內(nèi)容、算法及完成計算,提高計算效率和成果復(fù)用性。指標(biāo)配置工具以知識圖譜為基礎(chǔ),核心目的是實現(xiàn)具體業(yè)務(wù)指標(biāo)配置和知識圖譜底層知識邏輯之間的解耦。通過指標(biāo)配置工具,可以實現(xiàn)各體檢項目中所有配置的統(tǒng)一管理,把來自知識圖譜的指標(biāo)內(nèi)容、算法、權(quán)重、數(shù)據(jù)源等原料,通過與實際項目背景的結(jié)合,調(diào)整配置,然后調(diào)用數(shù)據(jù)庫的數(shù)據(jù)源,進(jìn)行自動計算。

通過這樣的方式,一方面,已有的指標(biāo)體系可以作為默認(rèn)模板,計算時可以直接套用模板進(jìn)行計算,提升效率。另一方面,由于在實際的城市體檢過程中,設(shè)計良好并在實際應(yīng)用中受到認(rèn)可的指標(biāo)體系往往會被長期重復(fù)使用,可以用配置工具便捷地調(diào)用歷史計算配置,在進(jìn)行簡單的數(shù)據(jù)源重新配置之后可實現(xiàn)快速的再次計算。當(dāng)新一次的體檢結(jié)果生成后,通過參考對比知識圖譜中存儲的歷史版本參考值、臨界值等,指標(biāo)內(nèi)容和算法可以被調(diào)試、優(yōu)化和迭代。除此之外,基于對指標(biāo)間關(guān)系的梳理,利用多檢協(xié)同知識圖譜可以實現(xiàn)不同體檢體系的、但有相同數(shù)據(jù)源指標(biāo)的關(guān)聯(lián)計算,即一次計算實現(xiàn)了所有相關(guān)指標(biāo)的更新,進(jìn)而解決重復(fù)工作的問題。

4 知識圖譜驅(qū)動的多檢協(xié)同實現(xiàn)結(jié)果

基于前文提出的方法和技術(shù),以住建部、自資部和北京市城市體檢為協(xié)同對象,研究構(gòu)建了城市體檢知識圖譜并形成相應(yīng)的可視化應(yīng)用系統(tǒng)。在指標(biāo)層面效果最為直接,知識圖譜驅(qū)動的多檢協(xié)同工作中打通了住建部、自資部和北京市3大體檢指標(biāo)體系(見圖3)。最終構(gòu)建的多檢協(xié)同知識圖譜包含3大體檢指標(biāo)體系300余個不同類型的知識和438種知識之間的關(guān)系。在知識圖譜系統(tǒng)中,能夠查看任何一個城市體檢指標(biāo)體系下的各級指標(biāo),也能夠直觀地看到不同指標(biāo)體系之間是否存在關(guān)系和存在何種關(guān)系,同時支持對指標(biāo)的檢索查看(見圖4-圖5)。

圖3 城市體檢指標(biāo)體系綜合及局部放大Fig.3 Panorama and partial enlarged drawing of city examination indexes in knowledge graph

圖4 檢索“綠色”相關(guān)指標(biāo)圖譜結(jié)果Fig.4 Indicators' result of the retrieval of "green"

圖5 自資部、住建部城市體檢一級指標(biāo)聯(lián)系圖Fig.5 Linkage diagram of level 1 indicators of Ministry of Natural Resources and Ministry of Housing and Urban-Rural Development

如表1顯示,根據(jù)圖譜指標(biāo)、數(shù)據(jù)和算法關(guān)系,可以將所有指標(biāo)歸納為7種類型。據(jù)此,可以直接合并超過20項完全相同或內(nèi)容相同的指標(biāo),并實現(xiàn)其余超過20項指標(biāo)的關(guān)聯(lián)計算,一定程度上解決了重復(fù)投入的問題。

表1 住建部、自資部和北京市城市體檢指標(biāo)體系異同梳理結(jié)果①如果指標(biāo)相同或相似被記為多次,如果有兩個指標(biāo)體系中存在關(guān)系即被考慮和統(tǒng)計。Tab.1 Similarities and differences of MNR,MOHURD and Beijing city examination indicator systems

在數(shù)據(jù)層面,由于構(gòu)建了所有指標(biāo)的指標(biāo)與數(shù)據(jù)關(guān)系,確定了指標(biāo)及其對應(yīng)的數(shù)據(jù)類型、來源、空間尺度、更新頻率、標(biāo)準(zhǔn)值和計算方法等一系列關(guān)系,圖譜網(wǎng)絡(luò)代替了原來城市體檢中的指標(biāo)表、數(shù)據(jù)源表、算法表等多個表(雖然這些表同時也存在)。通過體檢圖譜系統(tǒng),可以查看任一數(shù)據(jù)所關(guān)聯(lián)的指標(biāo)和數(shù)據(jù)獲取方式(見圖6)。

圖6 手機(jī)信令數(shù)據(jù)相關(guān)數(shù)據(jù)來源和底層指標(biāo)Fig.6 Data source and underlying indicators of mobile phone signaling data

在計算層面,得益于指標(biāo)關(guān)系和指標(biāo)與數(shù)據(jù)關(guān)系網(wǎng)絡(luò)的構(gòu)建,通過體檢知識圖譜可以將數(shù)據(jù)源、計算得到的指標(biāo)結(jié)果自動聯(lián)系,在一定條件下數(shù)據(jù)源更新后指標(biāo)可實現(xiàn)自動計算更新,而算法更新后體檢指標(biāo)也可實現(xiàn)半自動計算,以及通過關(guān)聯(lián)計算避免重復(fù)收集數(shù)據(jù)和計算的情況。

最后,城市體檢圖譜的建設(shè)實際上形成了知識庫,即知識共享平臺。平臺支持對城市體檢指標(biāo)、數(shù)據(jù)和算法等所有相關(guān)問題的查詢檢索,平臺利用問題聚類、語義匹配等算法模型,快速定位到問題的答案,并給出問題建議。通過知識圖譜建設(shè),可以實現(xiàn)相關(guān)人員城市體檢知識的高效檢索學(xué)習(xí)、業(yè)務(wù)工作效率的輔助提升、領(lǐng)域規(guī)律的發(fā)掘認(rèn)知和問題解決,讓城市體檢工作不再僅依賴于個體經(jīng)驗,從而進(jìn)一步提升知識遷移速度(見圖7)。

圖7 多檢協(xié)同知識圖譜系統(tǒng)智能問答界面Fig.7 Intelligent question &answer interface of multi-type city examination synergy system

5 總結(jié)和討論

5.1 研究總結(jié)

針對多類型城市體檢并行開展中可能出現(xiàn)的問題,本文創(chuàng)新性地提出多檢協(xié)同的理念。為實現(xiàn)該理念,引入知識圖譜技術(shù),設(shè)計了知識圖譜驅(qū)動的多檢協(xié)同的方法流程和技術(shù)框架,并以住建部、自資部和北京市的城市體檢指標(biāo)體系為案例和素材,搭建了多檢協(xié)同知識圖譜系統(tǒng)。該知識圖譜系統(tǒng)可以形象揭示各體檢體系之間的聯(lián)系和差異,實現(xiàn)多種城市體檢體系之間的協(xié)同數(shù)據(jù)管理、協(xié)同指標(biāo)管理、協(xié)同計算和自動更新,有效避免數(shù)據(jù)重復(fù)收集和重復(fù)計算的問題。綜上,本文在理念、方法和技術(shù)層面均有一定創(chuàng)新,具有較大的研究和應(yīng)用價值。

本文也存在一些不足。一是人工梳理指標(biāo)關(guān)系工作中,由于對不同類型體檢的知識儲備和親身實踐有限,在關(guān)系構(gòu)建中可能存在偏差。二是僅解決了數(shù)據(jù)、指標(biāo)和計算的協(xié)同,不能保證后續(xù)城市病診斷和城市治理的協(xié)同。在今后的研究過程中將繼續(xù)深入相關(guān)工作。

5.2 思考與討論

當(dāng)前,城市體檢研究和實踐仍在不斷進(jìn)行,多類型城市體檢并存現(xiàn)象將長期存在。本文提出的多檢協(xié)同不是城市體檢的權(quán)宜之計,亦非終極形態(tài),而是針對現(xiàn)實問題提出的方法性對策。本文的多檢協(xié)同理念給予各體檢體系同樣的尊重,充分挖掘各體系指標(biāo)的內(nèi)在聯(lián)系和深層次含義,在技術(shù)實現(xiàn)的同時為從業(yè)者提供了一種審視和理解各體系的方法,為目前各城市普遍面臨的多套體檢體系的協(xié)同開展提供了技術(shù)參考,也有助于各體檢體系自身的優(yōu)化和完善。

特別強(qiáng)調(diào)的是,本文主要從技術(shù)層面探討多檢協(xié)同,其真正實現(xiàn)需要強(qiáng)有力的機(jī)制保障。如果部門間采取關(guān)門工作、各成一派的工作模式,各體檢體系就無法從根源實現(xiàn)協(xié)同。希望將來的城市體檢工作無論在技術(shù)上還是機(jī)制上都能有所協(xié)同,甚至如同城市規(guī)劃從“多規(guī)協(xié)同”發(fā)展為“多規(guī)合一”,城市體檢能由“多檢協(xié)同”演化為“多檢合一”,使協(xié)同成為體檢工作的內(nèi)在基因。

猜你喜歡
數(shù)據(jù)源圖譜指標(biāo)體系
繪一張成長圖譜
Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
層次分析法在生態(tài)系統(tǒng)健康評價指標(biāo)體系中的應(yīng)用
補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
供給側(cè)改革指標(biāo)體系初探
基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評價研究
主動對接你思維的知識圖譜
基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評價算法
分布式異構(gòu)數(shù)據(jù)源標(biāo)準(zhǔn)化查詢設(shè)計與實現(xiàn)
雜草圖譜
抚松县| 镇赉县| 西盟| 昔阳县| 嘉荫县| 蓝田县| 诸城市| 张北县| 华蓥市| 扎鲁特旗| 灵宝市| 花莲县| 灵丘县| 无锡市| 东阿县| 雷山县| 昂仁县| 邳州市| 平原县| 蚌埠市| 绵阳市| 苍溪县| 临湘市| 怀宁县| 全椒县| 林西县| 酒泉市| 新营市| 斗六市| 乐昌市| 保定市| 阳东县| 承德市| 芜湖县| 宜君县| 分宜县| 德钦县| 井冈山市| 常德市| 盐边县| 彭水|