陸 娟 石 麗
地名地址,無論是對于政府管理,還是行業(yè)應用以及人們?nèi)粘I?,均有著極其重要的意義。地名地址的規(guī)范性和可理解性,將直接影響其使用的效率和作用。我國政府各級部門歷來都非常重視地名地址管理工作,相關機構先后制定了地名地址的系列規(guī)范、標準及管理條例等,在一定歷史時期對地名地址的規(guī)范化及信息化起到促進作用。但是,由于歷史沿革和區(qū)域差別,目前各地對地名地址的管理方式、數(shù)據(jù)規(guī)范仍然存在較大差異,甚至在不同行業(yè)之間、不同地區(qū)之間對地名地址概念內(nèi)涵的理解也存在不同認識,造成我國在信息化水平及信息共享程度越來越高的今天,對地名地址數(shù)據(jù)的共享與交換仍然存在較大的困惑。
對警務工作而言,地名地址無疑是極其重要的要素之一。在公安信息化進程中,警務信息一般歸納為“五要素”,即“人、地、物、事、組織”,事實上,除了“地”本身外,其他四類警務要素無不與“地”密切相關。各級公安機關也意識到地名地址在公安信息化建設應用中的地位和巨大意義,開始在警務綜合平臺、打防控系統(tǒng)等綜合性警務工作系統(tǒng)中著手建立地名地址庫及相關業(yè)務應用。自PGIS 平臺在全國公安機關強力推進以來,使得以“地”為核心的各類警務信息關聯(lián)應用需求更加迫切。但是,與其他行業(yè)相似,公安機關現(xiàn)有警務信息系統(tǒng)中的“地”要素也存在諸多問題,如概念理解不統(tǒng)一、錄入不規(guī)范、維護不及時等,使得不同的警務業(yè)務系統(tǒng)之間、不同地區(qū)之間對地名地址的關聯(lián)共享顯得尤為困難,各類警務信息在依賴PGIS 空間化過程中,更加意識到建設統(tǒng)一、規(guī)范的地名地址庫對警務工作的重要性和迫切性。①陸娟、蔣平、吳偉:《PGIS 支持下的警務信息地圖位置采集方式探討》,《地理信息世界》,2011年第6期。
根據(jù)新華字典、辭海等典籍解釋,“地名”一詞的含義為“地方(如城市或城鎮(zhèn))的名稱”;“地址”一詞的含義之一為“找到某人或某機關或與其通信的指定地點”。從詞典解釋來看,“地名”一詞似乎更偏向于一個區(qū)域范圍,而“地址”一詞則傾向于一個詳細位置。實際上,“地方的名稱”自然也包括“某一指定地點的名稱”,也就是說,“地址”應該是“地名”的一個子集。根據(jù)我國《地名標志》②《中華人民共和國國家標準GB 17733-2008 地名標志》,中國標準出版社2008年版。、《數(shù)字城市地理信息公共平臺地名/地址編碼規(guī)則》③《中華人民共和國國家標準GB/T 23705-2009 數(shù)字城市地理信息公共平臺地名/地址編碼規(guī)則》,中國標準出版社2009年版。等國家標準,以及相關行業(yè)標準和我國一些省、市地方的地名管理辦法,“地名”是指“表征地理實體的專有名稱”,“地址”的含義為“具有地名的某一特定空間位置上自然或人文地理實體位置的結構化描述”,從這個層面上則可以看出,“地名”包含了“地址”含義,“地址”是對某一特定位置“地名”的“結構化”描述,即“地址”強調(diào)其結構性。事實上,當前我國許多城市的地名辦,也同時負責對“地址”的編制與管理工作。在我們?nèi)粘?,“地名”則偏向于指某個地方的名稱,如城市名稱、街巷名稱、山名、河流名稱等,一般具有歷史、文化內(nèi)涵和濃郁的人文氣息;而“地址”傾向指那種附著于建筑物、院落或獨立門戶標示編號的文字描述,也稱為“門樓牌址”,一般不具特定含義。為了不引起對兩者理解的歧義,當前一般用“地名地址”來統(tǒng)一表達傳統(tǒng)意義上的“地名”和“地址”的含義。
從是否符合特定地址標準的角度分析,一般將那些符合標準命名規(guī)則、包含特定層次關系的地址稱為“標準地址”,而將那些不符合特定層次關系和標準結構的地址稱為“非標準地址”。另外,在實際應用過程中,還可以通過“興趣點”來實現(xiàn)對地名地址的描述?!芭d趣點”是指那些具有一定知名度的建筑物、機構、場所、區(qū)域等名稱。一般而言,“興趣點”應該容易被公眾所熟知,具有相對地理位置不變性,能夠起到定位作用。在當前公安信息化系統(tǒng)中,人員地址、機構地址等可以納入“標準地址”范疇,接處警地址、案發(fā)地址等被認為“非標準地址”,而機構、場所以及橋梁、碼頭、公交站臺等名稱被認為“興趣點”。
根據(jù)上述對地名地址的理解,結合目前公安對警務信息管理流程和實際業(yè)務工作需求,地名地址庫主要有以下幾個部分組成:
(1)標準地址表,存放符合特定規(guī)則的結構化地址,一般包含地址標識、地址名稱、地址生命周期、地址元素、地址類型等信息。
(2)機構表,存放各類機構、場所信息。主要包括機構代碼、機構名稱、標準地址標識以及其他機構本身屬性信息。這里的“機構名稱”具有地名地址中“興趣點”的意義,同樣可以起到定位目的。
(3)興趣點,這里主要是指機構、場所、行政區(qū)劃以外的特定標志性建筑物信息,如橋梁、碼頭、公交站臺、廣場等。具體包括標識碼、興趣點名稱等信息,并以一定的行政區(qū)劃概念進行限定。
(4)地名地址索引表,存放各類地名地址的索引,以滿足公安機關對地名地址的引用、搜索等需求。
(5)字典表,存放特定信息的字典代碼和名稱,如行政區(qū)劃代碼及名稱、街路巷代碼及名稱等,用以規(guī)范地名地址相關要素的錄入和引用。
除了地名地址索引表、字典表外,其余地名地址信息表中,除了自身文字描述信息外,在建立空間地名地址庫時,還需根據(jù)實際需求,存放其空間定位信息。
標準地址表,存儲那些按照一定規(guī)則進行結構化表述的規(guī)范地址。它是其他業(yè)務系統(tǒng)對“地址”要素的最主要和核心的引用和參考依據(jù),在警務工作中起到非常重要的基礎性信息資源作用。標準地址表只記錄最后一次更新后的標準地址狀態(tài),其歷史變更情況可以通過“標準地址歷史表”來記錄并追蹤。
在當前警務信息管理應用中,一方面由于“機構”以及“公交站臺”、“路燈桿”、“橋梁隧道”等都有其自身特定的管理要求和應用場景,一般均作為獨立的業(yè)務信息進行采集管理,而另一方面,由于在日常生活和應用中,除了可以通過標準地址來代指和定位某個特定地方外,也可以通過機構、公交站臺、橋梁等名稱來對某地進行描述與定位。因此,地名地址庫中也應該包含“機構表”和“興趣點表”,當然,這里的“興趣點表”應該是根據(jù)警務工作管理實際而形成的若干類具體的相關信息表,如公交站臺表、橋梁隧道表等。另外,對“機構”而言,它與標準地址之間有其特定的關聯(lián)關系,一個機構的注冊地址、實際辦公地址等一般均可以通過引用某條標準地址來表述。
“地址圖層”是指一系列的空間圖層信息,如根據(jù)標準地址類型,可以分為標準地址的點圖層信息、線圖層信息及面圖層信息,另外也包括了若干類興趣點的圖層信息、機構的圖層信息等。
“其他空間定位資源”主要是指從社會上獲取的一些空間信息資源以及警務工作中一些空間信息,如固定電話、警務分區(qū)等信息。這些信息與“標準地址”、“機構”以及“興趣點”等共同構建總的“地名地址索引”,以供所有警務信息進行地址引用、匹配及位置定位使用。在地名地址索引中,標準地址優(yōu)于其他一切地名地址,機構、興趣點名稱優(yōu)于其他空間定位資源。地名地址的數(shù)據(jù)庫模型總體設計如圖1所示。
(2.標準地址表的描述
在標準地址表中,地址標識是表征、引用某條地址的特定編碼,一般用流水號表示,它不具任何含義,作為地址的主鍵,用以實現(xiàn)標準地址與其他信息的關聯(lián);地址編碼是基于地址元素、空間坐標等信息并根據(jù)一定規(guī)則形成的編碼,具有明確含義,系統(tǒng)能夠根據(jù)地址編碼而直接譯出地址名稱、位置等信息。地址狀態(tài)表示地址的產(chǎn)生、注銷、停用、啟用、變更、消亡等一整套過程。地址更新日期僅記錄該地址最后一次更新的日期,其余維護情況可以通過標準地址歷史表進行記載。標準地址類型應該分為行政區(qū)劃類地址、街路巷地址、小區(qū)地址、門樓址地址以及戶地址等。根據(jù)標準地址類型,其空間特征可以通過面狀、線狀及點狀等空間對象進行描述。
地址元素是構成標準地址的最小語義單元,標準地址正是通過相關地址元素分段組合方式進行描述,按照巴科斯范式(BNF 范式)定義如下:
標準地址::=<行政區(qū)域>[基本區(qū)域][局部位置],其中:
行政區(qū)域::=<省級>[地級]<縣級>[鄉(xiāng)級][村級]
基本區(qū)域::=[開發(fā)區(qū)、工業(yè)園區(qū)]<{[街路巷]|[自然村、組、隊]|[小區(qū)]|}>
局部位置::=[門址][樓址][單元][室]
行政區(qū)域包括了省、市、縣、鄉(xiāng)、村五級,實際使用中可能僅用到其中的幾級。在基本區(qū)域中,開發(fā)區(qū)及工業(yè)園區(qū)是相關政府部門為了行政、經(jīng)濟及其他目的管理需要,設置的一種特定區(qū)劃,它不同于行政區(qū)劃?;緟^(qū)域的所有元素,均可以嵌套使用,如××路××巷、××小區(qū)東一區(qū)等形式。門址是相對封閉空間的一個編號牌,代表了一個小區(qū)、建筑物或戶址。當小區(qū)有名稱時,其門牌就是一種冗余;小區(qū)沒有名稱時,則需通過其所掛門牌來定位,小區(qū)可以嵌套。樓址是建筑物的一種代表,當建筑物有名稱時,可以用其名稱或樓牌號表示,如果建筑物沒有名稱,則只能通過其樓牌號定位,樓址不可嵌套。需要說明的是,在實際應用標準地址時,原則上門址、樓址優(yōu)于小區(qū)、建筑物名稱。
在實際采集標準地址名稱時,應遵循特定的層級關系。為了盡可能避免人工錄入帶來的錯誤信息,針對比較明確、相對固定的一些信息,應該事先制作相應的字典表,如行政區(qū)劃、街路巷、小區(qū)等字典信息,并按照一定規(guī)則進行編碼,供用戶在錄入一條完整的地址信息時選擇使用。一般而言,對標準地址中行政區(qū)域和基本區(qū)域元素,均可以制作字典。局部位置是對門、樓、單元、戶信息的描述,一般由數(shù)字及對應量詞組成,如100號、1幢、1單元、101室等,這里的“號”、“幢”、“單元”及”室”即是局部位置的“量詞”。在采集標準地址時,應該根據(jù)本地區(qū)對地址的描述規(guī)則,制作這些量詞的字典表,如針對樓址,其量詞可能包括了“幢”、“棟”、“樓”等信息。
根據(jù)標準地址名稱的描述及實際采集管理需要,一個完整的標準地址可以由表1所示的相關要素組成。當然,對某一條具體的地址來說,可能僅包含其中的一部分要素。
(表1 標準地址的地址要素組成)
其中,行政區(qū)劃按照省、市、縣、鄉(xiāng)、村五級進行存儲,除了省、市、縣應該按照國家行政區(qū)劃編碼統(tǒng)一存儲外,對鄉(xiāng)、村可以按照一定規(guī)則自行編碼。同樣,對開發(fā)區(qū)、街路巷、小區(qū)以及各類量詞都需要按照某種規(guī)則進行唯一編碼,一般使用純數(shù)字型編碼方式。實質(zhì)上,編碼過程即是制作字典供用戶選擇的過程。由于門址、樓址等號碼本身為數(shù)字型,因此,在實際存儲某一標準地址名稱時,其相關組成要素可以全部以對應的編碼表示。基于此,可以設計出該標注地址名稱的地址編碼(不含空間信息)如下:
標準地址編碼=行政區(qū)劃代碼+開發(fā)區(qū)代碼+街路巷編碼+……+室號號碼+室號量詞編碼
對于具體的某條標準地址而言,大多數(shù)情況下只包含了表1所示要素中一部分,那么在形成該地址編碼時,缺少的部分可以用一定位數(shù)的“0”代替,這里的一定位數(shù)與其對應地址要素的編碼位數(shù)相同,即可保證地址編碼的唯一性和長度確定性。
為了盡可能保證標準地址采集時的準確性,可以指定一系列約束規(guī)則,實現(xiàn)標準地址錄入時的校核,主要包括以下幾個方面。
(1)地址要素是否符合最基本的完整性要求。對城市地名地址而言,如果具備了基本區(qū)域、局部位置中任何要素,那么省、市、縣(區(qū))等行政區(qū)劃要素為必要要素;樓址、戶址類地址,至少必須包含街路巷、小區(qū)或門址要素中一類;門樓址、單元、戶址必須包含對應的量詞,同樣,其量詞前也必須包含對門、樓、單元、戶信息的描述信息;對那些具有分支要素信息,如門址號,不能僅含有門址分支或門址副號信息,而不含門址信息。
(2)地址要素的選擇是否滿足唯一性要求。錄入門、樓、單元、戶信息信息后,選擇對應的量詞時,要保證其一致性,如對同一門址信息,不能既包括××號,又包含××號樓,對同一樓址,標準地址庫中不能既含有××幢,同時又含有××棟信息等;由于門、樓等要素的量詞可能相同,因此標準地址庫中,在其他地址要素一致的情形下,不能包含“門址”與“樓址”等完全一致的地址。
(3)保證同一空間實體位置、不同地址表述的對應性。在公安實際工作中,由于不同的信息應用系統(tǒng)及日常對某一地址的描述,可能會存在同一位置而地址描述不同的情形,如某一位置,可以用“行政區(qū)劃+街路巷+門牌號”的方式描述,也可以用“行政區(qū)劃+街路巷+小區(qū)名稱”等表述,對同一建筑物,也存在“行政區(qū)劃+街路巷+門牌號”及“行政區(qū)劃+街路巷+建筑物名稱”等不同描述,這些描述均符合標準地址結構,為了保證標準地址的一致性,需要通過技術手段,建立上述標準地址之間的對應關系,確保這些不同的標準地址描述實質(zhì)對應同一空間實體,并避免不同信息應用系統(tǒng)、對外證件發(fā)放與登記等方面對標準地址使用方面的歧義。
地名地址數(shù)據(jù)庫建設,是公安信息化建設中基礎工作之一,也是政府“數(shù)字城市”公共地理框架數(shù)據(jù)建設中的重要組成部分,在提供數(shù)據(jù)空間匹配、共享交換、查詢定位等多方面發(fā)揮重要作用。本文對地名地址數(shù)據(jù)庫包含的主要內(nèi)容、數(shù)據(jù)庫建設技術路線特別是標準地址數(shù)據(jù)庫的建設進行了初步研究,以期引起更多專家學者對此領域的關注。同時,我們也認為,地名地址建設內(nèi)容十分廣泛,不同地區(qū)、不同行業(yè)對地名地址的理解、管理及應用也有較大差別,因此,包括數(shù)據(jù)庫建設在內(nèi)的各類地名地址建設研究,其任務依然任重道遠。