?

基于城市資源信息共享交換的地理編碼庫建設
——以太原市為例

2016-07-15 05:10
測繪通報 2016年6期
關鍵詞:太原市編碼基礎

王 琪

(1. 太原理工大學,山西 太原 030024; 2. 太原市基礎地理數據中心,山西 太原 030009)

?

基于城市資源信息共享交換的地理編碼庫建設
——以太原市為例

王琪1,2

(1. 太原理工大學,山西 太原 030024; 2. 太原市基礎地理數據中心,山西 太原 030009)

摘要:以太原市地理編碼基礎庫建設為例,深入分析和探討了地理編碼庫建設中涉及的資料搜集、外業采集、內業整理及標準化編碼入庫工作,并以此為基礎庫將城市各類專題信息進行地理編碼匹配和定位生成各類專題地理數據集,經過整合建庫生成地理編碼擴展庫,二者統稱地理編碼庫。地理編碼庫為城市資源信息“落地”和各類專題信息共享交換提供了空間定位的依據。

關鍵詞:地理編碼庫;共享交換;地名地址;地理編碼對象;地理編碼匹配

地名地址是百姓使用最頻繁的地理空間信息,具有信息量大、類型結構復雜、空間性強、動態變化大等特點。隨著各種類型空間數據的日益豐富,如何對這些異構數據進行有效融合和集成,成為地理信息科學目前迫切需要解決的問題之一[1]。2014年,太原市啟動了地理編碼庫建設,將區劃、地名、樓門牌業務進行管理,將地理編碼數據更新與管理、公共服務一起納入太原市數字地名體系的建設當中。通過業務流程的升級改造,將地理編碼基礎庫查詢與管理系統和業務管理系統串聯起來,建立起數據的常態化更新機制和基于業務驅動的數據動態更新機制,最終為政務和公眾應用提供了一個完整、準確、能及時更新的城市地理編碼基礎庫。

一、地理編碼概念及地理編碼基礎庫用途

地理編碼是指將坐標對、地址或地名等位置描述轉換為地球表面上某位置的過程。進行地理編碼時,只需要輸入一個位置描述,也可以表的形式一次提供多個描述。得到的位置以帶屬性的地理要素形式輸出,可用于制圖或空間分析操作[2]。通過地理編碼可快速查找到各類位置??伤阉鞯奈恢妙愋桶ǎ焊信d趣點或地名詞典中的地名,如山脈、橋梁和店鋪;基于經緯度或其他參考系統的坐標;可通過各種樣式和格式表示的地址,包括街道交叉口、含有街道名稱的門牌號及郵政編碼等[1]。

地理編碼庫從本質上說是一個地理空間數據庫,是一個專題地理信息系統數據庫。地名地址經過地址編碼整理入庫后,各類地理相關信息生成地理編碼基礎庫,應用范圍非常廣泛。從簡單的數據分析,到業務和客戶管理,再到信息發布,可在空間中顯示各地址的位置,還可識別信息中所包含的模式。要實現此目的,只需查看信息或使用GIS軟件提供的某些分析工具即可。此外,也可基于特定參數顯示地址信息。

二、地理編碼對象及分類

地理編碼對象分為地名、地址和興趣點3部分。地名包括自然地名和人文地名[3]。自然地名包括水系、山峰、海島等地名;人文地名包括行政區域、交通、水利附屬設施、單位名稱等地名。

地址是由民政部門確定的使用規范的語言文字描述的地理實體的位置,主要為規范化的門(樓)址信息。地址信息為門樓址信息,主要來源于地名辦所制定的地址標牌,還包括小區的樓棟信息。遇到使用街巷名和小區名描述均可的情況,街巷名優先于小區名;遇到使用門(樓)址和標志物名描述均可的情況,門(樓)址優先于標志物名。在對地址數據進行描述時,“政區”的作用是用來避免第二級地址元素的同名數據,如對“街巷”而言,“政區”的描述程度應保證“街巷”在該“政區”下只有唯一的一個對象[4-5]。

興趣點則主要為各類公眾感興趣的信息,實地通過門牌、招牌、廣告牌、宣傳牌、引導牌等能判定工商戶、單位、設施等興趣點內容需采集。

三、地理編碼庫建設流程

城市地理編碼庫的建設是一個動態的過程,從業務邏輯上分為基礎庫和擴展庫兩部分。初始建設階段,基礎庫的數據主要來源于從各類基礎測繪成果中提取地名、通過民政部門區劃地名處提供門牌地址、人工外業采集等。擴展庫的數據(又名參考數據)主要來源于需要匹配的各類包含地址屬性的地理要素類。擴展庫中的數據經過數據清洗、編碼、匹配、查重及數據融合處理后追加至基礎庫中,形成更新的基礎地理編碼庫版本。通過不斷的數據充實更新,地理編碼基礎庫數據密度增加,提高了參考數據的匹配精確度和準確度。具體建設流程如圖1所示。

1. 外業采集

采集內容見表1。

表1 外業采集內容

2. 內業錄入

外業完成地名地址的采集調查表后,需要通過內業人員在計算機上錄入這些調查表內容和地圖上的地名地址位置信息,進行查漏補缺,最終形成電子化的地理編碼數據成果,為建立地理編碼數據庫準備。

圖1 地理編碼庫建設流程

內業處理工作分為以下4種工作方式:①錄入地理編碼采集表,形成電子化成果;在電子地圖上錄入對應地名地址標號,根據標號ID關聯圖-數。②僅錄入地理編碼采集表,形成電子化成果;軟件系統自動根據已經上圖的標號,關聯圖-數。③僅在電子地圖上錄入對應地名地址標號;軟件系統自動根據已有墊在表格中各地址編號,關聯圖-數。④依據錄入表格信息,憑借對地域范圍的熟悉了解,利用系統在地圖上對地名地址文字信息確定空間位置點。此內業采集方式適合少量數據更新維護和對地域了解熟悉情況下進行。

3. 數據規整

為了達到數據使用要求,參考《國家地理信息公共服務平臺公共地理框架數據地名地址數據規范》,地名地址數據內業規整的具體內容如下:地名地址點位細分、道路名稱層次遞進標明、屬性修改、增加標準地址名稱、增加地理編碼、增加地名地址所在鄉鎮(街辦)、村(社區)、增加坐標信息、增加宗地號掛接編碼、增加地理實體掛接編碼、增加地址命名時間、增加地址停止使用時間。

4. 地理編碼匹配

結合太原市民政部門和公安部門所采取的地理編碼方法,最常用的有3種:定位到道路、定位到區域和兩種相結合。其中,定位到道路主要以道路名和門牌號作為標準來進行匹配;定位到區域則主要以某個城市區域為標準進行匹配;而二者結合的方式則是在以道路名和門牌號作為標準來進行匹配的基礎上,引入區域匹配,從而使定位更加準確。在具體匹配時,需要首先對地理編碼基礎庫對應字段進行解析,道路名稱決定其所處的位置類型,結合編號和類別可以判斷其位置在哪個路段和區域,建筑物數量可以判斷其是否處于建筑物中。建筑名稱則是利用與建筑物相關的信息,給對應的地名和地址進行定位。在匹配中,通過軟件工具對參考數據進行分詞解析再與地理編碼基礎庫進行空間匹配,如果參考數據位于建筑物中,則直接將建筑物地理編碼賦予參考數據,否則以直接定位到區域的方法對參考數據直接定位。最后,對匹配好的參考數據賦坐標值。

通過地理編碼匹配將參考數據與地理編碼基礎庫進行名稱匹配,生成新的地理編碼數據集,經過整理入庫更新擴展庫,通過擴展庫與基礎庫的融合處理進而更新地理編碼基礎庫內容。根據太原市地理編碼基礎庫的結構特點,此項工作采用了分詞匹配和地名、地址的長字符串匹配兩種算法,且對兩種算法的匹配結果進行了權衡性的融合,給出了綜合兩種情況的匹配度值,最終為客戶端返回了結構的排序關鍵字,并根據排序先后加以人工干預,實現了地理編碼擴展庫的更新[6]。

隨著數字太原地理信息公共平臺的推廣應用,目前太原市民政、公安、政法委、房產局、文廣局、移動通信等40個部門建立了基于公共平臺的專業系統,各個系統中也逐步積累了大量的地理信息相關數據。收集其中含有地名地址信息的要素進行提取,并通過標準化、結構化處理形成符合太原市地理編碼規范的地名地址記錄,通過地理編碼匹配入庫至地理編碼擴展庫中,最終通過數據融合處理更新至地理編碼基礎庫中。通過數據交換、地理編碼匹配,實現太原市衛生局、藥監局、教育局、工商局、旅游局等不同行業類別政務資源數據的空間化,內容涵蓋醫院、藥店、學校、農貿市場、注冊企業、旅游專題、賓館酒店、旅行社等。

5. 數據入庫

數據管理系統的數據入庫分為兩大部分:方案化數據入庫更新及平臺數據流程管理。方案化數據入庫更新實現將本地數據導入數據庫,流程有建立監理規則管、數據質檢、方案化數據入庫;平臺數據流程管理實現用戶通過平臺上傳數據入庫的流程管理。

地名地址標準庫共定義了5類34種數據:①門樓址信息:所屬區縣名稱、所屬區縣代碼、鄉鎮(街道辦)名稱、鄉鎮(街道辦)代碼、居(村)委會名稱、居(村)委會代碼、街路巷名稱、街路巷地址代碼、門樓院牌號名稱、門樓院牌號編碼、門樓院附加名稱、門樓院附加編碼、樓(排)號名稱、樓(排)號編號、單元名稱、單元號、房間名稱、房間號。②地名信息:地名類別、標準地名、別名、簡稱、行業類別。③標識信息:標準地址的完整文字信息、用來唯一性標識一條地址記錄的代碼、地址位置標識點的橫縱坐標、地理實體的唯一性標識碼。④時態信息:外業調查收集該地址的日期、主管部門正式建立標準地址標牌的日期、主管部門正式折除對應地址標牌或廢止該標準地址的日期。⑤其他信息:所屬郵局、郵政編碼、該地址是否已在公安部門登記。

四、結束語

城市地理編碼庫作為數字城市和智慧城市建設的基礎設施,對城市信息化建設、信息共享、信息公開起著關鍵的作用,它既是一個技術問題,又是一個標準化問題[7]。本文針對太原市地理編碼庫建設總結了主要技術流程和建設經驗。但地名地址建設內容十分廣泛,不同地區、不同行業對城市地理編碼庫的理解、管理及應用也有較大差差別,其任務依然艱巨。

參考文獻:

[1]趙東保,盛業華.全局尋優的矢量道路網自動匹配方法研究[J].測繪學報,2010,39(4): 416-421.

[2]曾瀾.我國地理空間信息共享的分類方法和地理編碼規則研究[J].地理信息世界,2006,12(6): 21-25.

[3]國家質量監督檢驗檢疫總局. 地名分類與類別代碼編制規則:GB/T18521—2001(2-15)[S].北京:中國標準出版社,2002.

[4]劉洪江,曹玉香.基于ArcGIS的地名數據庫建設若干問題初探[C]∥ArcGIS暨ERDAS中國用戶大會.北京:[s.n.],2004.

[5]章意鋒,吳健平.程怡ArcGIS中地理編碼方法的改進[J].測繪與空間地理信息,2007,6(30):116-119.

[6]馬照亭,李志剛,孫偉,等.一種基于地址分詞的自動地理編碼算法[J].測繪通報,2011(2):59-62.

[7]張鶴,陳倬,聶丹,等.北京市城市地理編碼及可行性應用分析[J].測繪通報,2011(4):65-67.

A Study of Geocoding Base Construction Based on Urban Resources Information Sharing and Exchange——Taking Taiyuan City as an Example

WANG Qi

收稿日期:2015-06-10; 修回日期: 2015-11-02

作者簡介:王琪(1980—),女,博士生,高級工程師,研究方向為測繪地理信息系統。E-mail:12982061@qq.com

中圖分類號:P208

文獻標識碼:B

文章編號:0494-0911(2016)06-0098-03

引文格式: 王琪. 基于城市資源信息共享交換的地理編碼庫建設——以太原市為例[J].測繪通報,2016(6):98-100.DOI:10.13474/j.cnki.11-2246.2016.0200.

猜你喜歡
太原市編碼基礎
太原市為農村寄遞物流補“短板”
“不等式”基礎鞏固
生活中的編碼
太原市61個村要建污水處理設施嚴禁直排入河
“整式”基礎鞏固
太原市園林綠化植物選擇及分析
太原市六家藥茶企業獲省級授權
《全元詩》未編碼疑難字考辨十五則
子帶編碼在圖像壓縮編碼中的應用
Genome and healthcare
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合