?

基于多元數據的省會城市城中村精細提取

2021-09-24 01:08馮東東張志華石浩月
自然資源遙感 2021年3期
關鍵詞:城中村建筑物分類

馮東東,張志華,石浩月

(1.蘭州交通大學測繪與地理信息學院,蘭州 730070;2.地理國情監測技術應用國家地方聯合工程研究中心,蘭州 730070;3.甘肅省地理國情監測工程實驗室,蘭州 730070)

0 引言

改造城中村不但能夠保證村內居民生產生活需要,而且可有效集約土地,提升城市美觀性與協調性[1]。目前有關城中村的研究主要集中在理論和政策層面,易受時空因素制約,缺少數據支撐及定量分析。因此如何從城市結構中精細提取出城中村區域,逐漸成為學者們研究的熱點。

近年來有學者提出利用遙感影像提取城中村,例如劉輝[1]基于深度神經網絡模型和場景語義描述的方法,以深圳和武漢為例提取城中村;Boutell等[2]將地物場景分割為一定數量的子塊,然后計算每個子塊的光譜特征,最后根據子塊特征,使用支持向量機算法實現地物的分類。此外,還有學者提出基于面向對象的城中村提取方法,例如尚春艷[3]利用傳統的面向對象法對研究區的城中村土地利用進行檢測,并提取變化信息;Li等[4]利用高分辨率影像,以非監督深度學習為基礎,建立了多種分割模型,對深圳市城中村進行提取。然而,由于城中村內房屋建筑復雜,特征不一,常用的分割算法難以準確分割出城中村與相鄰地物對象,因此面向像元和對象的提取方法難以有效應用于城中村提取。

鑒于此,本文結合多元空間數據,利用遙感影像提取技術與地理信息系統(geographic information system,GIS)空間分析技術相結合的方法對城中村進行提??;并通過對廣州市主城區的城中村進行定量空間分析,總結出城中村的分布特征,從而為解決城中村改造等問題提供數據支撐和方法參考。

1 研究區概況與數據源

廣州市位于廣東省中南部,瀕臨南海,是國家首批沿海開放城市,屬珠三角地區和粵港澳大灣區經濟中心,截至2019年,廣州市人口總數約1 531萬人,城鎮化率接近90%[5]。選取廣州市的4個中心城區(天河區、越秀區、荔灣區和海珠區)作為研究區域,其在廣州市的地理位置如圖1所示。本項研究數據源主要有:①廣州市高分一號衛星影像數據;②道路網數據,由開源地圖OpenStreetMap (OSM)提供;③建筑物輪廓數據,研究區共計101 453棟建筑物輪廓面數據,其中包含建筑物矢量邊界信息及樓層高度和面積屬性信息;④興趣點(point of interest,POI)數據,研究區共計545 812個點數據,共3大類,18種具體類型。

圖1 研究區概況Fig.1 Overview of the research area

2 研究方法

本文從提取研究區城中村的角度出發,結合了互聯網POI數據、高分辨率遙感影像數據以及建筑物輪廓數據等,實現對研究區城中村提取。首先對原始數據進行空間分析和處理,構造出城中村地塊特征屬性,然后對包含特征屬性的城中村地塊數據進行分類,得到提取結果。本文實驗的主要實驗流程如圖2所示。

圖2 實驗流程圖Fig.2 Experimental flow chart

2.1 基于ENVI深度學習的城中村信息提取

深度學習是指利用分層迭代算法的思想,讓計算機對輸入的各種形式的文件、圖案等內容進行自動的歸納識別[6]。ENVI Deep Learning是基于TensorFlow模型構建的,TensorFlow是一個開源框架,ENVI使用它來執行深度學習任務[7]。利用深度學習提取城中村的步驟如下:

1)影像預處理。主要包括影像的輻射定標、大氣校正、幾何糾正及波段融合等過程。

2)創建標簽圖像。通過裁剪影像子集,繪制標簽數據,并使用模塊工具生成標簽圖像(label raster)。標簽數據需要選擇具有代表性的典型區域進行樣本采集。

3)訓練模型。利用感興趣區和標簽圖像初始化一個新的模型,并在模塊中設置訓練參數,對模型進行訓練。

4)執行分類。使用模塊提供的工具對圖像進行分類,該工具會生成一幅類激活圖像(class activation map,CAM)。CAM是一個灰度圖像,其像元值表示屬于提取目標的概率。對CAM圖像進行分類后處理,可直觀表示出城中村提取結果。

2.2 融合多元數據的城中村識別

由于單方面利用遙感影像提取出的城中村信息存在與老城區、工業廠房等混淆的問題,因此需要進一步的精細提取。城中村其明顯的特征為房屋不高且密集,本文通過統計建筑物高度面積等屬性信息,再結合高分辨率遙感影像的光譜特征,以及各類POI核密度屬性實現對城中村信息的提取。

以詳盡的道路網絡劃分出的區域作為城中村基本地塊單元,根據地塊單元的矢量圖斑,分割研究區高分辨率影像,計算每個地塊單元中影像各波段的均值及亮度值,融合建筑物、POI等空間信息構建地塊單元特征集合。詳細步驟如下:

1)在eCognition中對高分一號影像進行分割,通過計算得到研究區地塊單元的光譜屬性信息,存入對應的地塊單元矢量圖斑下[8]。實現以地塊圖斑為基本單元,將影像分割成地塊影像單元集合,并為每個影像單元賦予唯一的編號ID,便于索引。

2)原始建筑物輪廓數據包含樓層高度信息,利用ArcGIS計算出建筑物面積值,再將地塊單元矢量數據與建筑物數據進行空間關聯,從而統計出每個地塊單元內建筑物的高度、面積等屬性信息[9]。通過計算每個地塊單元內建筑物的平均高度、高度標準差、建筑物面積總和以及平均建筑面積信息,作為建筑物屬性值。

3)使用ArcGIS核密度分析工具,計算每個輸出柵格像元周圍鄰域內輸入POI點的密度[10-11],這在一定程度上可反映城中村與非城中村地區的POI差異性。其中核密度分析中關鍵參數搜索半徑SR的計算方法如式(1)所示:

(1)

式中:SD為要素之間的標準距離;Dm為要素之間的中值距離;n為沒有使用 population 字段的點數,如果提供population字段,則n是population字段值的總和,其中,population字段是指在核密度分析過程中,計算目標位置時的樣本個數。

結合研究區城市POI類型及特點,選取不同的核密度參數得到實驗結果,其中住宅用地POI核密度搜索半徑(帶寬)值設為1 500 m,公共服務用地POI核密度搜索半徑值為3 000 m,而商業服務用地2 000 m。得到各類POI的核密度柵格圖后,利用ArcGIS的分區統計工具和屬性表連接功能,將各類POI的核密度柵格值連接到之前的地塊單元矢量數據中??稍贏rcGIS中查看構建的研究區地塊單元矢量圖斑屬性表,其中包含地塊ID、地塊類別、地塊光譜特征屬性、建筑物特征屬性及各類POI特征屬性。

統計標簽數據中每個對象的光譜信息、建筑物屬性信息以及各類POI核密度屬性后,即完成研究區帶有特征城中村標簽數據的構建,構建的特征類型如表1所示[12]。

表1 構建的地塊單元特征Tab.1 Features of constructed land units

支持向量機(support vector machine,SVM)是一種對已知樣本的特點進行學習,從而預測未知樣本類別的機器學習方法,通常用于數據的二分類問題。利用SVM分類算法進行城中村的精細分類,為了使分類面能將訓練樣本無誤地分類且具有最大的分類間隔,訓練樣本還需要滿足[13-14]:

yi[(w·xi)+b]-1≥0,

(2)

式中:i為樣本集序號;x,y和b均為列向量;w為支持向量對應的樣本點到決策面的距離向量。

(3)

為了便于求解,構造出Lagrange函數,即

(4)

式中:i為樣本集下標,i=1,2,…,l;ai為Lagrange系數,對w和b求偏微分得:

(5)

(6)

將式(2),(5)和(6)作為約束條件,就將原始問題轉成求解二次規劃時的對偶性問題,可得出:

(7)

(8)

式(7)是一個二次函數,在式(8)約束下存在唯一最優解。若ai*為最優解,且b*可由約束條件式(2)求得,b*為最優解下向量b的取值。求解公式得最優分類函數為:

(9)

3 實驗結果與分析

3.1 ENVI深度學習的城中村提取結果

本文選取天河區為樣本集,首先繪制城中村標簽數據[15],共105個及背景地物321個,共計樣本總數426個,其中包含輸入圖像的原始波段和掩模波段,掩模波段中DN值為1的像元代表目標,0代表背景。然后利用感興趣區和標簽圖像初始化一個新模型,在Train TensorFlow Mask Model中設置訓練參數,經多次試驗,選取參數模型如下:PatchSize值為316,Epochs值為20,ClassWeight值為0~2,LossWeight值為1,SolidDistance值為1,BlurDistance值為0~2。最后使用訓練模型對影像分類,其結果會產生一幅CAM圖像,該灰度圖像的像元值表示屬于提取目標的概率,圖像中高亮顯示部分即與目標特征的匹配度較高,如圖3所示。對CAM圖像進行密度分割,使其按照不同顏色進行顯示,如圖4所示。

圖3 CAM類激活圖Fig.3 CAM class activation diagram

圖4 城中村提取結果Fig.4 Extraction results from urban villages

初步提取到的圖像存在圖斑小且邊緣鋸齒明顯的現象,需使用Sieve Classes與Clump Classes工具對圖像進行過濾和聚合[16],將處理后的結果疊加到影像圖上,截取部分影像如圖5所示。

圖5 分類后處理的城中村矢量Fig.5 Urban village vector after classification processing

3.2 提取精度評價

ENVI Deep Learning精度可用以下4個指標來表示:Loss為訓練損失,用于表示模型與驗證訓練數據的匹配程度;Precision為用戶精度,表示正確分類的像元數占該類別像元數的比例;Recall為生產者精度,表示正確分類的像元數占該類別實際像元數的比例;F1為模型精度系數,是Precision和Recall的調和平均值,計算方法為[17-18]:

(10)

精度高低可通過Loss和F1的值來評價,在ENVI深度學習模塊下查看訓練模型精度參數,繪制精度參數折線圖,如圖6所示。

圖6 深度學習模型精度參數Fig.6 Precision parameters of deep learning model

通過圖6可知,隨迭代次數增加,模型的損失值Loss降低,精度F1值上升,表明深度學習工具可以較好地訓練提取模型,實現對城中村的提取,共計識別出城中村423個,發現有272個被正確識別,正確識別率為64.31%。

3.3 基于多元數據的城中村識別結果

原始的OSM數據存在缺失與拓撲錯誤,需進行后處理;然后將道路網絡數據轉化為面狀圖斑,最終得到6 718個地塊單元,如圖7所示。

圖7 研究區地塊單元矢量圖斑Fig.7 Plot unit vector pattern spot in the study area

在棋盤分割算法的基礎上,對地塊單元矢量圖斑添加圖層,將研究區的高分影像進行分割[19],影像局部分割結果如圖8所示。

圖8 影像基于矢量分割結果Fig.8 Image segmentation is based on vector segmentation results

將分割出的矢量圖層與上文利用ENVI Deep Learning提取出的輪廓信息進行疊加,并為各地塊對象添加城中村與非城中村的屬性值,最后進行修正統計,制作一份完整的標簽數據。

利用機器學習軟件包LIBSVM[20]分類器完成地塊單元數據集的分類,通過自定義選取數據集中的特征向量,對光譜特征、建筑物特征和POI特征進行不同的組合疊加[21-22],得出LIBSVM分類器在選取不同特征向量時的城中村分類精度(表2)。

表2 選擇不同特征屬性的分類精度Tab.2 Select the classification accuracy of different feature attributes

由表2可知,使用LIBSVM分類器區分城中村與非城中村地塊,僅利用影像的光譜特征,難以達到較好分類效果,融合POI特征和建筑物特征后,可以取得較好的分類效果。將結果映射到地塊單元矢量文件的屬性表中,得到如圖9所示的識別結果,圖中共計識別出城中村地塊455個,根據統計結果,發現有401個城中村被正確識別,分類精度高達90.19%。圖10為部分識別結果疊加Google Earth影像。

圖9 城中村識別結果Fig.9 Urban village identification results

圖10 在Google Earth上顯示識別結果Fig.10 Display the recognition results in Google Earth

城中村的錯分對象主要為老舊居民區和工業區。三者之間共同特征為綠化率低、樓層較矮,當單個面積較小的建筑物所占該地塊總比例較高時,三者在影像上表現出的特征極為相似,所以LIBSVM分類器很容易誤判。

海珠區中城中村數量最多、密度最大;其次是天河區、荔灣區;最后是越秀區,越秀區為中心商業區,城中村改造完成度高;整體而言,研究區城中村分布較為分散,分布在整個城市區域中。

4 結論

針對目前城中村研究缺少數據支撐和定量分析等問題,將遙感影像提取技術與GIS空間分析技術相結合,提出基于深度學習工具提取城中村和基于多元空間數據識別城中村地塊的方法。實驗結果表明,利用深度學習工具,能夠較好地提取出城中村邊界信息?;诼肪W分割高分辨率遙感影像,結合機器學習分類方法識別城市不同地塊單元,對城中村可精細提取,分類精度高達90%。

本文基于多元數據對城中村提取進行了研究,但提取結果仍存在一定的偏差,進一步研究的問題主要包括:

1)在融合多元空間數據輔助提取城中村時,可考慮添加Sentinel衛星數據,表示出地物的空間高度信息,用于區分城中村建筑和平整的運動場等地物。

2)因訓練模型耗時較長,且模型訓中存在一定的隨機性,對于高分辨率遙感影像復雜的地物環境,提取結果仍存在與老舊居民區、工業區混合現象,可考慮進一步優化模型參數,提升提取效率及精度。

猜你喜歡
城中村建筑物分類
“城中村”改造與規劃的思考
發達地區城中村改造困境與出路
鄰近既有建筑物全套管回轉鉆機拔樁技術
分類算一算
描寫建筑物的詞語
分類討論求坐標
數據分析中的分類討論
特色城中村景觀設計初探——以建榮村為例
教你一招:數的分類
存續與發展:我國城中村治理的路徑探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合