?

2020–2022 年三江平原主要農作物種植分布遙感監測數據集

2024-01-11 10:52喬樹亭葉回春劉榮豪郭安廷張冰瑞錢彬祥魏鵬黃文江
關鍵詞:三江平原波段農作物

喬樹亭,葉回春,劉榮豪,郭安廷,張冰瑞,錢彬祥,魏鵬,黃文江

1.可持續發展大數據國際研究中心,北京 100094

2.中國科學院空天信息創新研究院,數字地球重點實驗室,北京 100094

3.海南空天信息研究院,海南省地球觀測重點實驗室,海南三亞 572029

4.太原理工大學,水利科學與工程學院,太原 030024

5.中國礦業大學(北京),地球科學與測繪工程學院,北京 100083

引 言

我國既是糧食生產大國又是消費大國,糧食安全不僅影響社會穩定和經濟發展,更關系國家長治久安[1]。三江平原位于黑龍江省東北部,不僅是我國黑土地寶貴資源的重要組成部分,還是我國糧食安全關鍵地區和優質商品糧基地[2]。然而,伴隨以可持續農業生產和緩解大豆國際貿易壓力為目標的作物輪作實踐,該地區的種植制度逐年發生了顯著變化[3]。缺乏高精度的年度作物分布圖,導致我們對耕地動態和耕作制度變化的潛在驅動因素的理解有一定的欠缺[4]。

目前隨著新獲得的中等分辨率衛星圖像、新算法的發展和云計算基礎設施的融合,作物制圖取得了相當大的進展[5]。金翠等[6]以250 m 空間分辨率MODIS/NDVI 時間序列數據集為數據源,采用“分層非監督分類法”得到三江平原土地覆蓋類型,但MODIS 數據由于其分辨率過低,混合像元的問題很難解決。王楠[7]使用250 m 空間分辨率的MODIS 遙感影像以及30 米空間分辨率的美國陸地資源衛星Landsat 5 TM 影像進行黑龍江省作物種植結構提??;杜國明等[8]使用Landsat TM 以及Landsat OLI 影像為主要數據源,刻畫三江平原農作物種植結構時空演變特征及規律,盡管與之前使用低分辨率MODIS 數據[9]的工作相比,Landsat 圖像可以提供更多的空間細節,但16 天的重訪周期無法輕易地分離不同的作物種類,從而限制了所得影像分類的準確性[10-11]。Sentinel-2 衛星攜帶多光譜成像儀共13 個波段,其中4 個波段的分辨率為10 m,6 個波段分辨率為20 m,3 個波段的分辨率為60 m,光譜覆蓋范圍從可見光到近紅外至短波紅外,并以5 天的間隔提供圖像[12],這為地塊級別的作物特定監測開辟了一條全新的途徑。10 m 至20 m 的空間分辨率可以描述不同地區的各類田塊,相對較短的重訪周期可以提供與各個作物類型相關的更詳細的物候信息[13]。此外,Sentinel-2 衛星包括幾個紅邊波段,已被證明是區分玉米和大豆的有效手段。因此,在東北地區的三江平原主要作物制圖上使用長時序的Sentinel-2 圖像是當前分類研究的重點[14]。

本文以三江平原為研究區,利用時間序列的Sentinel-2 衛星遙感數據,結合三江平原地面實地典型地物調查數據,篩選主要農作物及周邊典型地物的特征波段,采用隨機森林分類算法,提取了2020–2022 年三江平原主要農作物(水稻、玉米和大豆)種植分布遙感監測數據集。本數據集不但在分類像元精度上相較于其他數據集得到了大幅度提升,而且總體分類精度相較于使用MODIS[6,9]與Landsat 系列衛星[7-8]也有明顯進步,通過連續三年的實地樣本考察也保證了作物分類的準確性??梢宰鳛槿皆r作物種植格局時空變化分析的基礎數據,同時也為三江平原農業生產管理決策提供信息支撐,服務區域農業信息化建設以及黑土地保護與利用。

1 數據采集和處理方法

1.1 數據采集

本文所用數據為2020–2022 年Sentinel-2(S2)多光譜衛星(MSI)圖像(2A 級),來自Google Earth Engine(GEE)平臺(https://code.earthengine.google.com/)。根據GEE 平臺上官方發布的Sentinel-2 影像數據說明,Sentinel-2 遙感影像產品等級包括1C 級和2A 級,其中2A 級數據是已經經過大氣校正的大氣底部反射數據可以直接運用到本研究中。

三江平原主要農作物的地面樣本點主要通過2020–2022 年野外現場調查,并結合多時相的Google Earth 高分辨率影像數據獲取。地物類型共分為四類:水稻、玉米、大豆及其他地物,由于除三種作物以外的其他地物(比如水體、山體和建筑)等地物類型一般不會隨著年份產生明顯變化,所以三年樣本點中的其他地物樣本點皆為相同樣本點。其中,2020 年包含水稻樣本點502 個、玉米樣本點300 個、大豆樣本點300 個、其他地物樣本點1308 個;2021 年水稻樣本點470 個、玉米樣本點630 個、大豆樣本點361 個,其他地物樣本點同上;2022 年水稻樣本點585 個、玉米樣本點302個、大豆樣本點311 個,其他地物樣本點同上(圖1 為2020–2022 三年樣本點分布圖)。以上所有樣本點按3:1 的比例分為訓練樣本以及驗證樣本。

圖1 2020–2022 年三江平原典型地物實地調查樣點分布圖Figure 1 Distribution of typical ground objects in Sanjiang Plain from 2020 to 2022.

1.2 數據處理方法

1.2.1 衛星數據處理

本方法選用2020–2022 年Sentinel-2(S2)多光譜衛星(MSI)圖像(2A 級)。以往研究已經證明了2A 級數據在圖像分類上的可靠性,最近多年的許多研究已經證明Sentinel-2 對于水稻、玉米、大豆三種作物的可靠監測[15-16]。以下為對于Sentinel-2 衛星數據預處理過程:

(1)考慮到云在所有可見帶中都是潮濕的,使用四個波段(氣溶膠、藍色、綠色和紅色波段)和兩個光譜指數(歸一化差值水分指數NDMI 和歸一化差雪指數NDSI)計算云含量并檢測S2 數據的云[17]。兩種指數的計算公式如(1)(2)所示:

式中,NIR為近紅外波段,MIR為中紅外波段,GREEN為綠波段,SWIR1為短波紅外波段。

(2)用有效S2 觀測值的中值生成10 天復合數據;

(3)通過線性插值來填補數據缺口,以實現整個時間域的完全覆蓋;

(4)使用Savitzky-Golay(SG)濾波器平滑10 天時間序列數據。在本數據集中,我們使用70天的窗口大小和三階多項式。

最終得到基于整個生長季規則的無云和間隙填充的10 天S2 時間序列影像共18 幅。

1.2.2 特征選取

主要通過前人的研究以及基于Google Earth Engine 對各類地物選取不同特征波段進行分析,最終選取B8[16]、B11[16]、B12[16]、EVI(增強型植被指數)[18]、NDVI(歸一化植被指數)[19]、LSWI(地表水分指數)[20]、NDSI(歸一化雪蓋指數)[21]、NDSVI(歸一化耕種指數)[22]、NDTI(歸一化溫差指數)[23]、NDWI(歸一化差分水體指數)[23]、RENDVI(改進歸一化植被指數)[24]、REP(紅邊位置指數)[24]為每幅影像的特征波段(篩選過程如圖1 所示),計算公式如(3)–(10)所示:

式中,RED為紅波段,GREEN為綠波段,BLUE為藍波段,NIR為近紅波段,SWIR1 是中心波長為1613.7 的短波紅外波段,SWIR2 是中心波長為2202.4 的短波紅外波段,RE1 為中心波長為704.1的紅邊波段,RE2 為中心波長為740.5 的紅邊波段,RE3 為中心波長為782.8 的紅邊波段。

綜上計算共18 幅10 天時間序列合成影像,共計216 個特征,特征過多在分類過程中容易造成冗雜的現象,所以通過Google Earth Engine 中隨機森林分類器自帶的重要性排序功能篩選特征波段,將重要性排名前15 的特征波段保留。將以上篩選得出的特征波段放入隨機森林分類器中進行分類。

1.2.3 分類器參數設置

隨機森林(RF)作為一種自然非線性分類器,可以通過平均每個決策樹的預測來獲得最終預測。先前的研究表明,RF 比許多傳統分類器(如最大似然法、決策樹和單層神經網絡)更準確[25]。在訓練作物分類器時,我們調整了GEE 中RF 的兩個參數:(1)Number Of Trees:決定了用于構建RF模型的二進制決策樹的數量,在本方法中設置為100。(2)Min Leaf Population:葉節點所需的最小樣本數,設置為10,以限制每棵樹的深度以避免過擬合。其他4 個參數在GEE 中默認設置[23]。

1.2.4 平滑影像處理

本研究使用八鄰域空間濾波處理,對于最終分類結果小于0.1 公頃的作物斑塊,通過半徑為100米的基于圓形核的多數過濾器將結果進行更新。大多數斑點通過八領域空間連通性處理算法在生成的分類結果中消失。整體流程圖如圖2 所示。

圖2 分類流程圖Figure 2 Flow chart of classification

2 數據樣本描述

2.1 數據集信息

本數據集為基于Sentinel-2 衛星遙感數據提取得到的2020–2022 年三江平原主要農作物(水稻、玉米和大豆)種植分布數據,其空間分辨率為10 米,坐標系為WGS84,總數據量為5.64 GB。本數據集包含2020 年至2022 年三年的主要作物(水稻、玉米、大豆)的分類結果數據,每個年份數據包含4 個文件:影像文件、金字塔文件、柵格的輔助文件、影像坐標信息的文本文件。

2.2 數據樣本

通過利用Sentinel-2 衛星的10 天時間序列影像數據,提取了2020–2022 年三江平原主要農作物種植分布數據。將數據在ArcGIS 軟件中打開,可以看到數據分成了3 類,分別是1、2 和3,其中1表示水稻,2 表示玉米,3 表示大豆。如圖3 所示為2020–2022 年的三江平原主要農作物分類結果圖。對不同農作物的種植分布面積進行統計分析,可以探究不同時期三江平原農作物種植格局的時空變化規律。也可將提取結果疊加到黑龍江省行政區劃圖上,得到各市縣的作物種植情況分布,為農業生產管理決策提供信息支撐,服務區域農業信息化建設以及黑土地保護與利用。

圖3 2020–2022 年三江平原主要農作物種植空間分布圖Figure 3 Spatial distribution of major crops in Sanjiang Plain from 2020 to 2022

3 數據質量控制和評估

本研究分類結果評價均采用混淆矩陣作為分類精度的評價方法。對于精度評價的指標主要利用了生產者精度、用戶精度、總體精度以及Kappa 系數4 個精度評價指標。其中根據野外調查結果和遙感影像目視解譯結果,用于驗證結果的樣本點分別為:2020 年水稻樣本點125 個,玉米樣本點75個,大豆樣本點75 個,其他地物樣本點327 個;2021 年水稻樣本點146 個,玉米樣本點75 個,大豆樣本點77 個,其他地物樣本點327 個;2022 年水稻樣本點118 個,玉米樣本點158 個,大豆樣本點90 個,其他地物樣本點327 個。最后利用驗證樣本點數據對提取結果進行精度驗證,結果如表1所示。2020 年、2021 年和2022 年三江平原三大農作物提取的總體精度分別為95.18%,95.0%,94.5%,Kappa 系數為0.924、0.925 和0.919。

表1 基于Sentinel-2 衛星數據的2020–2022 年三江平原主要農作物種植分布提取精度評價Table 1 Accuracy evaluation of planting distribution extraction for major crops in Sanjiang Plain from 2020 to 2022 based on Sentinel-2 satellite data

4 數據使用方法和建議

本數據集是一套基于Sentinel-2 衛星數據的2020–2022 年三江平原主要農作物種植分布遙感監測數據產品。數據可以在ArcGIS 等相關軟件中進行讀取、編輯以及后續的一系列分析工作。如果對不同提取結果進行統計,可以得到2020–2022 年的主要農作物種植分布面積變化信息。本數據集凸顯了三江平原農業發展的經濟、生態、社會和文化價值,為順應全面推進鄉村振興新要求,拓展農業多種功能,推動農業高質高效、農民富裕富足,為全面推進鄉村振興、加快農業農村現代化提供有力支撐。不但可以作為三江平原農作物種植格局時空變化分析的基礎數據,同時也為農業生產管理決策提供信息支撐,加快推進農業農村現代化進程。

數據作者分工職責

喬樹亭(1998—),男,山西孝義人,碩士研究生,研究方向為農業遙感研究。主要承擔工作:數據收集、處理與質量控制,數據論文撰寫。

葉回春(1985—),男,浙江杭州人,博士,副研究員,研究方向為植被定量遙感機理及應用研究。主要承擔工作:數據集生產和實地驗證,數據論文撰寫。

劉榮豪(1985—),男,山東臨沂人,博士,副教授,研究方向為農業水利及利用。主要承擔工作:數據集生產和數據論文修改。

郭安廷(1991—),男,山東濱州,博士,博士后,研究方向為植被定量遙感及應用。主要承擔工作:實地考察與數據論文修改。

張冰瑞(1997—),女,河南商丘人,碩士研究生,研究方向為農業遙感研究。主要承擔工作:實地考察、數據論文撰寫與修改。

錢彬祥(1995—),男,河南信陽人,博士研究生,研究方向為3D 作物建模及光譜模擬、參數反演。主要承擔工作:實地考察、模型建立與驗證。

魏鵬(1997—),男,山西大同人,碩士研究生,研究方向位農業遙感研究。主要承擔工作:數據集生產和數據處理。

黃文江(1972—),男,安徽懷寧人,博士,研究員,研究方向為植被定量遙感及應用研究。主要承擔工作:數據質量控制,數據論文修改。

猜你喜歡
三江平原波段農作物
高溫干旱持續 農作物亟須“防護傘”
俄發現保護農作物新方法
夏季農作物如何防熱害
厲害了!農作物“喝”上環保酵素
M87的多波段輻射過程及其能譜擬合
三江平原氣溫變化趨勢及區域差異識別
基于灰色絕對關聯度的三江平原降水量影響因子識別
基于小波變換的三江平原旬降水量主周期識別
基于相關分析的三江平原氣候影響因子關系識別
日常維護對L 波段雷達的重要性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合