?

基于多源數據的全特征土地覆蓋分類方法研究

2022-09-06 03:14張煜輝
測繪地理信息 2022年4期
關鍵詞:光譜分辨率衛星

張煜輝

1武大吉奧信息技術有限公司,湖北 武漢,430223

衛星遙感技術的發展增強了土地覆蓋及其更新信息的獲取能力。比如,2015年6月歐空局發射的哨兵二號能夠以高于60 m的空間分辨率獲取地面目標12個光譜波段的信息[1];同年12月中國發射的GF-4衛星能夠以50 m的空間分辨率每日獲取地面目標在可見光近紅外4個光譜波段的信息[2,3];未來,中國“高分辨率對地觀測系統”重大專項建設將形成立體的、全方位的對地觀測系統[4]。遙感數據對于地物的識別能力,一方面在于盡可能提供關于目標更全面的特征;另一方面,開發各種分類算法盡可能地提高地物識別精度。光譜特征是遙感技術識別的地物的基礎,也是很多分類算法發展的基礎。然而隨著遙感數據空間分辨率的提高,“同譜異物、同物異譜”現象影響了地物識別精度,分類結果往往存在較多離散的孤立點(椒鹽現象)[5]。學者們考慮同一目標物在空間結構上一致性,將空間特征加入地物分類來提高地物識別精度[6,7];對于植被類型,利用單一時相的影像很難區分不同的植被類型,利用高時間分辨率遙感影像提取的植被指數能夠有效識別不同植被的物候特征,從而大大提高了植被識別精度[8,9]。但是,目前具備植被物候監測能力的傳感器MODIS其空間分辨率僅為500 m,限制了其土地覆蓋的監測能力。關于地物的特征信息,主要是“光譜+空間”或者“光譜+時間”,前者有相當多的工作是針對航空遙感數據[10,11],后者主要是以AVHRR和MODIS這類低空間分辨率影像數據的應用為代表[12,13]。關于地物分類算法,其實質上是一類特殊的空間數據的數據處理和模式識別問題,因此,凡是與數據處理、模式識別相關的思想、方法都可以用來服務于遙感影像數據的分類。非監督分類算法有:C均值聚類[14]、迭代自組織數據分析算法[15]、模糊C均值聚類[16]、自組織映射[17]和人工免疫分類算法[18]等。監督分類算法有:k-NN(k-nearest neighbor)、支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)以及多項邏輯回歸(multinomial logistic regression,MLR)等[19]。但是由于光譜信息的高維性和標記樣本不足,直接分類的效果并不佳,-般情況下會首先對光譜信息作特征降維[20,21]。半監督分類算法,主要針對先驗知識有限的情況下,常用的有:期望最大化(expectation maximization,EM)[22]和隱馬 爾科夫 模型(hidden Markov model,HMM)[23]、直推式支持向量機(transductive SVM,TSVM)[24,25]、基于圖的方法(graph-based methods,GM)[26,27]等??紤]到分類算法淺層學習無法適應復雜自然環境,深度學習用于土地覆蓋分類受到關注,多用于高空間、高光譜影像分類、目標信息提取和變化檢測[28]??偟膩碚f,數據的限制使得“空間+時間+光譜”的全特征地物識別研究還較少。

本研究以甘肅省張掖地區為研究區,獲取2018年3月—10月間該地區的晴天GF-4衛星數據、7月30日的哨兵二號衛星數據以及該地區的SRTM DEM數據,綜合利用研究區包括光譜、時間和空間在內的13個全特征數據開展土地覆蓋分類研究。

1 研究區和數據

1.1 研究區

研究區域位于黑河中游,行政區劃上包括甘州區和臨澤縣。黑河中游區域地勢東高西低,南高北低,中部地區以綠洲為主,夾雜戈壁分布的走廊平原[29]。氣候屬溫帶干旱大陸性氣候,年平均氣溫為6℃,年降水量76.1~287.5 mm[30]。

根據GlobeLand30-2010土地覆蓋分類系統[31],研究區典型土地類型包括:耕地、森林、水體、人造地表和裸地。各個類型定義如下:(1)耕地。用于種植農作物的土地,包括水田、灌溉旱地、雨養旱地、菜地、牧草種植地、大棚用地、果樹及其他經濟喬木用地,以及茶園、咖啡園等灌木類經濟作物用地;(2)森林。喬木覆蓋且樹冠蓋度超過30%的土地,包括落葉闊葉林、常綠闊葉林、落葉針葉林、常綠針葉林、混交林,以及樹冠蓋度為10%~30%的疏林地;(3)水體。陸地范圍液態水覆蓋的區域,包括江河、湖泊、水庫、坑塘等;(4)人造地表。由人工建造活動形成的地表,包括城鎮等各類居民地、工礦、交通設施等,不包括建設用地內部連片綠地和水體;(5)裸地。植被覆蓋度低于10%的自然覆蓋土地,包括荒漠、沙地、礫石地、裸巖、鹽堿地等。

1.2 衛星數據

GF-4衛星于2015年12月29日發射,是我國第一顆地球同步軌道遙感衛星,搭載一臺可見光近紅外50 m/中波紅外400 m分辨率、大于400 km幅寬的凝視相機。本研究利用了50 m分辨率的可見光近紅外4波段的數據;哨兵二號衛星于2015年6月23日發射,搭載的光學儀器可以獲取地物13個波段的信息,其中,4個波段的分辨率為10 m,6個波段的分辨率為20 m,還有3個波段的分辨率為60 m。本研究利用了10 m和20 m分辨率的10個波段的數據。對2017年4月—10月的GF-4衛星數據進行了瀏覽和選擇,其中,4月和5月拍攝影像很少,且有云覆蓋,最終選擇了2017年6月—10月期間21幅云影響小的影像;哨兵二號衛星影像數據,受限于衛星的時間分辨率和云的影響,同時考慮地物的分辨能力,獲取了2017年7月30日一幅晴天影像;此外,研究還利用了30 m分辨率的SRTM DEM地形數據。

1.3 樣本數據

2018年5月,本研究開展了實地調查工作,綜合利用哨兵衛星影像、GF-1衛星影像、谷歌地球影像和實地調查,驗證了土地覆蓋類型樣本數據的選擇(見表1),保證了樣本的純凈性。

表1 研究區樣本數據Tab.1 Sample Data of Study Area

2 特征選擇

時間特征主要利用GF-4較高的觀測頻率,以歸一化植被指數(normalized difference vegetation index,NDVI)為基礎進行構建;光譜特征和空間特征,利用哨兵-2衛星波段多和空間分辨率高的特點進行構建;此外,空間特征還利用了數字高程模型(digital elevation model,DEM)的地形高度信息。本研究總共選取了4個時間特征、3個光譜特征和4個空間特征進行研究區土地覆蓋分類。

1)時間特征?;贕F-4數據構建NDVI時間序列提取時間特征。利用21幅GF-4晴天數據影像進行輻射校正和正射校正,分別計算相應的NDVI??紤]到NDVI數據易受到云和大氣條件的影響而導致在影像中的數值低于正常值,利用HANTS對得到的NDVI時序數據進行重構;再利用21幅重構后的NDVI時序數據計算研究區NDVI的最大值、最小值、平均值和標準差4個時間特征。

2)光譜特征。光譜特征直觀上體現不同地物在顏色上有較好的區分。為了有效地利用影像數據的光譜特征,在時相上選擇地物差異最大的季節,因此選擇2017年7月30日的哨兵二號衛星影像,將10 m和20 m分辨率的10個波段重采樣為20 m,經過主成分分析(principal component analysis,PCA)變換后,選取前3個波段作為地物分類的光譜特征(貢獻>99%)。此外,考慮到研究區的土地覆蓋分布特點,特別是裸地同人造地物難以區別,本研究加入了改進的歸一化水體指數(normalized difference water index,NDWI)[32]和土壤調節植被指數(soil adjusted vegetation index,SAVI)[33]兩個特征指數。

3)空間特征。研究利用光譜特征中哨兵衛星影像數據提取的3個PCA進行紋理特征的提取,在研究區土地覆蓋類型紋理特征差異的基礎上,選擇第一主成分的均值紋理和第二主成分的均值、對比度紋理作為空間特征。此外,在分類試驗中,發現居民地和裸地容易混淆,實地調查中也注意到居民地大部分位于低平地區,因此引入提供高度信息的SRTM DEM作為空間特征參與分類。

本研究構建的空間特征、時間特征和光譜特征如表2所示。

表2 分類特征T ab.2 Classification Feature

3 結果和討論

考慮到研究區地表覆蓋的特點,特別是人造地表覆蓋物(比如居民地)同裸地難以區分,研究利用面向對象分類軟件eCognition,以13個特征作為分類輸入,采用最臨近算法進行地物識別。其中,DEM數據的處理主要包括重采樣、投影變換和剪裁,最后作為分類波段數據,在eCognition中進行分類處理。研究區土地覆蓋分類結果如表3所示。

戈壁和綠洲是西北地區特有的景觀,有河流的地方就孕育了綠洲。由表3可以看出在研究區有大量的湖泊和濕地分布。同時,豐富的水資源得以承載廣闊的耕地,分類結果顯示除了有大量的戈壁,耕地仍占了絕大部分。根據表1采集的驗證樣本,利用混淆矩陣對分類結果進行了評價,總體分類精度為90.22%,如表4所示。

表3 研究區土地覆蓋分類統計結果Tab.3 Statistical Results of Land Cover Classification in Study Area

表4 研究區土地覆蓋分類精度Tab.4 Accuracy of Land Cover Classification in Study Area

從制圖精度看,森林、水體、草地和裸地表現較好。在水體分類時,研究引入MNDWI(modified NDWI),其對于水體信息的增強和識別效果較好,這也體現在用戶精度中。森林和草地,利用NDVI時間序列提取的特征,能有效體現不同其物候特征。但對于耕地,無論是制圖精度,還是用戶精度都是表現最差,這主要和選擇的分類方法有關。面向對象分類首先依據參與分類的特征,綜合其光譜和空間特征,獲取圖像對象;然后再對圖像對象進行分類。在研究區,由于耕地呈大面積地塊,在建立圖像對象過程中,很容易將周邊小面積林地或草地劃分成耕地圖像對象。制圖精度中,濕地表現最差,容易被誤判為耕地。一方面,其面積相較于耕地較小,主要分布于大片耕地之中;另一方面,在過渡區兩者呈相近的長勢和色調特征。人造地表和裸地在制圖精度和用戶精度上表現都較好,在分類實驗中,其他非面向對象分類方法區分人造地表和裸地效果較差,一方面,兩者在光譜特征上相近;另一方面,在張掖市區,有大量土地處于開發狀態或空地。利用面向對象的分類方法,并加入DEM,明顯地提高了分類效果。

本研究在特征選擇時,綜合考慮了研究區土地覆蓋和處理的數據量,從空間、時間和光譜維度建立分類特征,既能更多地捕捉地物特征,也能有效減小數據間的冗余,保證可承受的數據處理量。

此外,本研究還將耕地數據與美國地質勘探局(United States Geological Survey,USGS)生 產 的2015年全球30 m分辨率的耕地數據進行了對比(見圖1)。從空間分布上看,兩個數據的耕地分布具有較好的一致性。但從面積上看,本研究統計的耕地面積為1 826.55 km2,而USGS統計的耕地面積為1 426.28 km2,造成這種差異的原因為:①USGS數據的空間分辨率為30 m,而本研究的為50 m,而且本研究采用了面向對象的分類,對于農村地區,往往將離散的居民地歸為耕地;②張掖地區由于水資源豐富,一直在不斷地將裸地轉化為耕地。因此,這種耕地數量上的差異是可以接收的。

圖1 研究區USGS的耕地面積Fig.1 The Cultivated Land Area of USGS in Study Area

4 結束語

本研究利用GF-4衛星和哨兵2號衛星數據,以張掖地區為例探討綜合利用光譜、時間和空間的全特征數據開展土地覆蓋分類研究。利用面向對象分類軟件eCognition,以13個特征作為分類輸入,采用最臨近算法獲取了研究區土地覆蓋分類,總體分類精度為90.22%。通過與USGS生產的2015年全球30 m分辨率的耕地數據對比,表明本研究的土地覆蓋分類具有較好的可信性。借助GF-4衛星高時相和高空間分辨率的對地觀測能力,配合哨兵2號衛星光譜波段多的特點,能夠提供地物全特征信息,增強了地物的識別能力。但研究中也發現,作為靜止軌道衛星,GF-4并不能夠提供每天的觀測數據,一定程度上限制了地物的識別能力;另外,通過和哨兵2號衛星的比較,也可以明顯看到GF-4衛星在空間分辨率上的差距,影響了地物的識別能力??偟膩碚f,本研究對于后續高分系列衛星的綜合應用提供了重要的參考價值。

猜你喜歡
光譜分辨率衛星
煤炭礦區耕地土壤有機質無人機高光譜遙感估測
我國科學家發明計算超分辨圖像重建算法拓展熒光顯微鏡分辨率極限
郭守敬望遠鏡獲取光譜數破千萬
靜止衛星派
淺析光譜技術在200 nm以上和以下尺度范圍內的不同
Puma" suede shoes with a focus on the Product variables
ARM發布顯示控制器新品重點強化對分辨率的支持
What Would Happen If All Satellites Stopped Working? 假如衛星罷工一天
從600dpi到9600dpi
銳化與顯示器分辨率
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合