?

農作物遙感識別與單產估算研究綜述

2023-03-07 03:29趙龍才李粉玲常慶瑞
農業機械學報 2023年2期
關鍵詞:農作物作物光譜

趙龍才 李粉玲 常慶瑞

(西北農林科技大學資源環境學院,陜西楊凌 712100)

0 引言

糧食安全的首要關注點是糧食播種面積與產量。對農作物生長狀態的實時動態監測與產量信息的快速準確把握,不僅對于國家糧食安全相關政策決策的制定、市場價格宏觀調控、農村經濟發展、以及對外糧食貿易等具有重要價值,同時還對農田生產的智能化管理、農業保險的精準服務等具有現實意義。

遙感技術憑借其快速、宏觀、無損以及客觀等特點,在快速獲取與解析作物類型、種植面積、產量、長勢、災害等信息方面具有獨特優勢。農作物遙感識別是實現農田作物信息提取和解析的前提與基礎,在一定程度上決定和影響其它信息解析的可行性和準確性,因此農作物遙感識別的精度和效率是農業遙感關注的核心問題之一。其次,基于遙感的作物單產估算已經成為獲取大區域尺度糧食產量信息的重要方式,對分析國家糧食安全形勢等具有重要作用,也是農業遙感的重要研究內容之一。本文從農作物遙感識別與農作物單產估算兩方面進行總結,系統分析發展現狀、存在的問題及未來發展方向。

1 農作物遙感識別研究

農作物遙感識別主要以監督學習為主,其基本過程是以遙感影像所表達出的不同作物的特征分布模式為基礎,利用分類算法對特征分布模式進行判別,從而實現作物類型識別(圖1)。因此,分類算法和遙感識別特征是農作物遙感識別的兩個決定性組成部分。其中,識別特征是表達類別間差異的媒介,其決定了不同作物間的可分離性的理論上限,識別算法則是在最大程度上識別這種特征分布差異并逼近該理論上限。因此,對于農作物遙感識別精度而言,識別特征相較于識別算法具有更重要的地位。本文分別從遙感識別特征與識別算法兩方面對農作物遙感識別進行總結。

圖1 農作物遙感識別基本流程圖

1.1 作物遙感識別特征研究

1.1.1光譜特征研究

不同作物的植株形態、冠層結構、生理生化特性等導致其在不同光譜波段上具有不同的光譜反射特性,從而使得光譜特征具備區分不同的農作物的能力,也是農作物遙感分類應用最廣泛和最基本的識別特征。

(1)多光譜特征

利用多光譜特征進行農作遙感識別是農業遙感領域的基礎應用之一,基于光譜特征的植被類型自動分類技術最早可以追溯到1970年。最初的基于多光譜特征的農作物遙感分類以目視解譯為主,即解譯人員憑借影像上所表現出的亮度、色調、空間位置、幾何結構與形狀,亮度明暗變化所形成的紋理等特征識別農作物類別。從參與農作物遙感識別的多光譜特征種類來看,多光譜特征的發展和應用與多光譜衛星傳感器的發展高度相關,最典型的特征組合是3個可見光波段(藍、綠、紅)與近紅外波段的組合;隨著多光譜傳感器加入紅邊波段、短波紅外波段,紅邊及短波紅外特征在農業遙感監測與識別中應用越來越廣泛?;诠庾V特征識別的作物類型基本涵蓋了所有主要糧食作物,例如小麥、水稻、玉米、大豆、棉花、甘蔗及其他經濟作物[1-5]。

由于“同物異譜、異物同譜”現象的廣泛存在,直接使用多光譜特征進行遙感識別的精度越來越不能滿足現實需要。在此背景下,大量由人工知識參與的遙感植被指數特征被設計出來,它們通常是基于兩個或兩個以上的原始光譜特征進行特定的數學變換而得到。遙感植被指數通常綜合兩個及兩個以上的原始光譜特征,可以反映植被在某一方面的特性從而對農作物遙感識別表現出更加重要的作用。例如歸一化植被指數(NDVI)和綠度植被指數(VI green)經常被用于農情遙感監測,即監測農作物長勢和生長過程[6];土壤調整型植被指數(SAVI)可以在緩解土壤背景影響的基礎上有效提高對不同作物的識別精度[7]。目前,常用的遙感植被指數已經發展到了一百多種,是農作物遙感識中多光譜特征的一個重要組成部分[8]。目前,農作物遙感識別常用的多光譜數據源見表1[9-13]。

表1 農作物遙感識別常用的多光譜遙感數據源

(2)微波散射特征

可見光至短波紅外范圍內的光譜特征均是由傳感器被動接收并記錄地表反射的電磁波能量,而該波長范圍的電磁波輻射傳輸過程極易受到大氣狀況影響,從而在一定程度上影響多光譜數據的可用性。合成孔徑雷達(SAR)以微波頻率發射和接收能量,由于其工作波段波長較長,不易受到大氣影響,從而具有了“全天時全天候”可用的特性。SAR傳感器記錄的后向散射電磁波能力很大程度上取決于目標的幾何結構和介電性能。不同作物具有的不同冠層結構、植株形狀、土壤背景等均隨著作物的生長而變化,SAR數據對這些結構差異及具有不同介電性能的土壤背景具有非常好的響應[14],因此微波散射特征也被用于農作物遙感識別[15],并有研究已經證明微波散射特征對作物生物物理參數,如葉面積指數[16]、生物量[17]、冠層高度[18]等,具有良好的敏感性。盡管多光譜遙感特征已經廣泛應用于農業遙感領域,但SAR應用研究的不斷發展以及不同頻率和極化條件下SAR數據的可用性提高了它在農業遙感領域中的地位。目前,在農作物遙感識別領域中,SAR數據多用于識別水稻,常用數據類型見表2。

表2 基于微波散射特征的作物識別

一般情況下,SAR數據在作物生長中后期的識別精度高于作物生長的前期,作物生長前期,冠層覆蓋度較低,雷達后向散射能量中有相當一部分是背景土壤的貢獻。因此,利用SAR數據進行早期作物類型識別存在一定困難。除此之外雷達數據受到噪聲的影響大,數據獲取成本較高,數據處理相對復雜,同時受極化方式的影響,微波遙感在識別農作物方面依然存在著很大的潛能。

(3)高光譜數據特征

高光譜成像儀光譜波段非常窄,輻射分辨可以達到納米數量級,光譜通道數通常多達數十甚至數百個,而且各光譜通道間往往是連續的,成像光譜儀的波段范圍通??梢愿采w紫外、可見光、近紅外和短波紅外(350~2 500 nm)。光譜分辨率的提高大幅增加了對地物的分辨識別能力。在農業應用方面,由于高光譜數據的電磁波波長范圍更廣,光譜分辨率很高,能探測到農作物在光譜特征上的微小差異,從而被廣泛用于作物類型精確識別,葉片或者植株的生物物理及生物化學特性的探測,監測作物脅迫、作物疾病等。在利用高光譜數據進行作物識別方面,有研究基于SDA技術從高光譜數據選擇了最佳頻段區分觀賞植物、豆類和油菜作物,結果表明:在近紅外和中紅外波段,具有鑒別豆類作物的4個最佳波段,即750、800、940、960 nm;在油菜作物的區分過程中主要取決于550、690、740、770、980 nm;而在花朵的區分過程中420、470、480、570、730、740、940、950、970、1 030 nm波段表現出非常良好的區分性[24]。即使在作物種植情況比較復雜的條件下,高光譜數據對于區分作物類型同樣表現出良好的可用性[25]。除作物識別應用外,有研究表明高光譜反射率數據在區分作物品種(基因型)方面同樣有良好表現,充分體現了高光譜特征的光譜分辨率的優勢[26-27]。

高光譜數據雖然具有明顯的光譜優勢,但是其缺點也較為突出。一方面,高光譜數據包含特征波段太多,各波段之間具有明顯相性,信息冗余現象較為嚴重,直接使用全部波段數據會導致模型分類精度出現“不升反降”的現象(特征維數災難)。此外,由于不同作物之間光譜相似性更高,由此可能導致協方差矩陣的奇異性,嚴重影響農作物分類識別的精度[28]。因此,高光譜數據降維方法研究成為必然,典型降維方法包括:主成分分析(PCA)、均勻特征設計(保留光譜形狀信息但減少特征維數)、小波變換以及結合人工神經網絡的特征選擇[29-30]。另一方面,高光譜數據在具有高輻射分辨率的同時,其空間分辨率往往較低,光譜遙感影像上混合像元問題較為突出,難以實現精細空間尺度的農作物類型識別。以上兩點在一定程度上限制了高光譜數據在農作物遙感識別中的廣泛應用。

1.1.2空間紋理特征研究

隨著遙感數據空間分辨率不斷提高,地物幾何細節信息得到越來越充分的表達,不同地物之間的空間細節差異在影像上表現明顯。因此,利用高空間分辨率光學影像或SAR 影像(QuickBird、GeoEye、TerraSAR-X、RADARSAT-2 等)進行農作物遙感識別時,除了光譜特征及微波散射特征外,空間細節信息也是表達不同作物差異的重要特征源。因此,用于表達空間細節差異的空間紋理特征在遙感分類中發揮著越來越重要的作用。

目前,國內外學者發展了多種紋理度量方法,可以總結為4類:基于統計方法的紋理特征、基于結構方法的紋理特征、基于模型的紋理特征、基于數學變換的紋理特征[31-34]。其中,遙感應用中最常用的是基于統計方法的灰度共生矩陣(Grey level co-occurrence matrix,GLCM)紋理特征和基于地統計學的特征紋理。

GLCM可以同時反映圖像的灰度分布特征和相同(相似)灰度像元的空間位置分布特性,是影像灰度變化的二階統計特征[35]?;?GLCM 的紋理特征在遙感分類中被廣泛應用[36-37]。例如,在分析不同紋理特征對遙感分類精度影響的研究中發現:紋理特征和光譜特征的結合可以提高分類精度,相比于僅使用原始光譜特征的分類結果,紋理特征的加入使分類精度提高9%~17%[38]。在基于高分辨率影像的植被類型分類研究中,紋理特征與原始光譜特征的結合使分類精度提升8%以上[39]。地統計學一般用于解釋空間相關性問題,常被用于空間數據插值、空間抽樣方法估計、空間預測模型構建等。在遙感分類領域中也有越來越多的研究利用其作為一種紋理計算方法[40],并將其與原始光譜特征相結合來改善遙感分類精度。相關研究表明基于地統計學的紋理測量方法可以提供比基于GLCM 紋理更好的分類結果[41-42]。除上述兩種常用問題特征外,基于小波變化的紋理特征、Gabbor紋理特征進行農作物遙感分類識別,識別精度同樣得到提升[43-45]。

上述研究多數集中在將紋理特征和原始光譜特征結合使用,證明紋理特征的加入使分類精度提高,但有關紋理特征之間的相關性以及它們各自是如何影響分類結果的研究較少,即這些研究往往不能單獨表明具體紋理特征對遙感分類的精度及對分類精度的改善。由于高空間分辨率遙感數據通常包含較少光譜波段,其空間信息豐富度高于光譜信息豐富度,在地物幾何信息得到加強、“異物同譜”現象得到抑制的同時,“同物異譜”問題變得突出,即相同地物內部差異變大。此外,高空間分辨率遙感影像易受陰影的影響,引起分類精度的降低。另外紋理特征隨著研究目標和遙感影像而變化,紋理特征的提取方法、所使用的基礎波段、滑動窗口尺寸等因素都將影響紋理特征的有效性,因此紋理特征很難標準化并提供穩定的有效性。

1.1.3數據融合特征研究

綜合利用不同類型(平臺)傳感器所獲取的數據是對利用單一數據源進行農作物遙感分類識別的一種補充。多源遙感數據融合可充分利用不同數據的優點,達到提高分類識別精度的目的[46]。典型的多源遙感數據融合應用包括光學數據與雷達數據融合、高空間分辨率數據與低空間分辨率數融合應用[47-49]。有研究表明綜合利用雷達與光學數據對作物類型的識別精度遠高于僅使用雷達數據或者僅使用光學數據[50]。融合使用多波段SAR數據的農作物識別研究表明,利用 X 和 C 兩個波段的 SAR 數據進行農作物分類,取得優于單波段SAR 數據的分類效果,整體精度提高約10%[51]。多極化SAR數據的融合使用同樣被證明可以有效提高農作物遙感識別精度,例如綜合使用PalSAR的水平極化(HH)與交叉極化(HV)數據、ASAR的垂直極化數據(VV)、以及 TM 多光譜數據進行農作物精細分類的研究中,發現雙頻多極化SAR 數據對不同作物間潛在差異的表達能力較強,不同類型作物在該特征上的可分離性較高,有利于提高作物類型的整體識別精度[52]。眾多前人的研究結果都表明雷達數據融合多光譜數據在農作物類型識別中具有較大的優勢[53]。不同多光譜數據的融合使用,可以有效地緩解單一數據源可能面臨的關鍵時相數據缺失的情況,在提高數據可用性的同時,提高農作物遙感識別精度。例如,Sentinel-2數據與Landsat 8數據具備良好的協同使用條件,同時在地塊尺度上的農作物遙感識別應用中取得了良好的精度,驗證了不同多光譜遙感數據協同使用的優勢[54-55]。

數據融合特征的優勢在于可以綜合兩種及以上類型數據的優勢,融合后的特征空間對不同作物間的潛在特征差異表達能力更強,有利于提高農作物遙感識別精度;但同時不同遙感數據融合操作易受到數據融合方法、融合尺度等因素的影響,從而影響融合數據在實際應用中的穩定性。

1.1.4時相變化特征研究

農作物生長是一個緩慢變化的動態過程,其植株形態、冠層結構、生理生化參數都隨著作物生長而緩慢變化,從而導致其冠層反射率隨作物生長過程而緩慢動態變化(如NDVI時間序列曲線,圖2)。不同作物在其生長周期中會表現出不同的變化趨勢,而單一時相的數據只捕捉了地表物體在一瞬間的電磁波反射信息,受“同物異譜,異物同譜”現象影響,單一時相特征對地物的辨別能力有限,在某些情況下分類識別精度不高[56]。隨著在軌衛星及傳感器數量的增加,對于地面同一位置的重復觀測頻率越來越高,因此如何利用時間序列遙感數據來表達作物生長過程中豐富的季節性變化特征并將其用于農作物遙感識別,已經成為一個研究熱點。

圖2 農田NDVI時間序列(2000—2020年)

當前,利用時相變化特征進行農作物遙感識別主要是基于植被指數時間序列數據。即利用不同時相的多光譜遙感數據計算植被指數,然后將植被指數序列作為分類算法的主要輸入來完成作物類型的識別[57-58]。這種直接使用植被指數時間序列的識別方法對于具有明顯的獨特時相特征的作物來說是簡單、有效的,例如利用時間序列數據進行水稻的識別[59-61]。但是此類方法沒有考慮時間序列遙感數據中的相對位置(時間)關系,從而導致時間序列中包含的重要作物生長過程信息沒有被充分利用。為了充分利用植被指數時間序列信息、提高作物識別的精度,最直接的方法是從植被指數序列中提取時相或者物候特征。研究表明,相比于簡單直接利用植被指數時間序列數據,使用基于統計或閾值分割方法提取到的包括植被指數最大值、植被指數峰值時間點、植被變綠(作物返青)時間點等在內的特征可以提高作物識別的精度[62-64]。其次,基于特定的數學變換、預定義的數學模型從時間序列數據中提取時相及物候特征的方法同樣被廣泛應用于多時相數據的分類識別和作物物候研究。其代表性方法包括傅里葉變換[65-66]、小波變換[30,67]、SG濾波[68-69]、卡爾曼濾波[70]、線性回歸[71]、樣條擬合函數[72-73]、隱含馬爾科夫模型[74]以及多種人工定義的曲線形狀特征提取算法等[75-76]。眾多的研究結果已經表明隨著參與作物分類識別的時相數量增加,識別精度總體上呈現上升趨勢,表明不同時相特征可以有效地表現出不同作物生長過程變化趨勢不一致的特點,有利于農作物遙感識別[77-78]。因此,有許多研究使用了完整的時間序列進行作物識別研究,期望用完整的時間序列數據來詳細描述作物生長過程,實現區分作物類型的目的[79-83]。但是,農作物的生長周期較短,再考慮到云霧天氣影響和衛星重訪周期等因素,獲取同一地區的2~3個關鍵時相的高質量遙感數據存在一定困難,使得多時相遙感數據失去了提高農作物遙感識別精度的優勢[84]。盡管時間序列數據可以更加完善地表征不同作物的生長變化過程特征,但是構建完整的時間序列數據通常需要相關重建方法[85-86],導致時間成本更高,時效性相對較低,即不能在作物生長的早期、中期及時地識別作物的類型[87-88]。此外,在地物變化不明顯的區域中,時間序列數據會存在冗余和高度相關的現象,這限制了時間序列數據的應用[89-92]。

目前,在實際應用中如何選擇最適合且最有效的時間序列特征提取方法依舊是技術難題,面臨的主要問題有:①人工設計模型或算法進行時間序列特征提取高度依賴于專家經驗及先驗知識。通用的特征提取方法對于一些特定目標的識別效果一般或無效。②人工特征工程是非常耗時且低效的,通常需要人為干預來應對變化的環境和天氣狀況,而且人類的知識很難同時考慮類內相似性、類間差異性、大氣條件、輻射傳輸機制等多種復雜因素[93]。③固定的數學模型或相關假設在一定程度上限制了特征提取算法的靈活性和可行性[94]。

1.2 農作物遙感識別算法

農作物遙感識別的基本過程是根據遙感數據所表現出的特征差異進行類別屬性信息的判斷與提取,其本質是分類問題。在農作物遙感識別領域中,分類算法的發展可以概括為3個階段(圖3):早期的強學習方法;基于弱學習方式的集成學習方法;以神經網絡為代表的深度學習方法。本文將早期的強學習方法與集成學習方法統一歸納為傳統機器學習方法,以便與當前的研究熱點——深度學習方法形成對照。

圖3 農作物遙感識別算法發展歷程

1.2.1基于傳統機器學習方法的作物遙感識別

早期的強學習方式是基于概率統計方法構建單一分類器完成分類任務的過程,典型算法包括最小距離法、最大似然法、決策樹方法、支持向量機等。最大似然法(Maximum likelihood)是最常使用的監督分類方法之一,它假設數據近似服從正態分布,利用訓練數據集求出均值、方差以及協方差等特征參數,從而建立各類別的先驗概率密度函數,實現待分像元的歸屬概率計算從而完成分類。由于最大似然法簡單易實施,且將貝葉斯理論和先驗知識融入分類過程,在農作物遙感分類識別中應用廣泛[95-96],且與其他傳統分類方法相比,最大似然法綜合表現最優[97]。但是該方法適用于特征波段較少的多光譜數據,在高光譜圖像分類中的效果較差。決策樹(Decision tree)是一種歸納推理的分類方法,通過對遙感圖像光譜、顏色、空間等信息定義和不斷更新規則來完成不同層次節點劃分,直到節點不可再分為止。決策樹類算法采用分層分類的形式,易于理解,可操作性高,能夠處理多輸出問題,從而被廣泛應用于農作物遙感識別[98-101],但其缺點是泛化能力較差,在處理高維數據時表現不佳。支持向量機(SVM)以結構風險理論、二次優化理論、核空間理論為基礎,在高維特征空間中求解最優分類超平面,從而解決復雜數據的分類及回歸問題。SVM在農作物遙感分類中較為穩定、分類精度較高,但其在解決多類目標分類問題、特征空間維度較高時表現較差,且如何正確選擇核函數也沒有相關的理論依據[102-103]。

集成學習算法將一系列獨立或非獨立的弱學習器的結果按照一定策略進行整合得到最終的結果,從而獲得優于單個學習器的學習結果。其構建過程包括:基礎分類器的生成和分類結果合并策略。其中,基礎分類器生成過程中最常用方法是基于不同訓練數據集生成一系列同質分類器,主要方法有 Bagging和Boosting。Bagging方法采用隨機有放回抽樣技術構造不同訓練數據集用于生成分類器;Boosting方法首先為不同的樣本賦予相同的權重,然后在訓練過程中,降低正確分類樣本的權重,增加錯分類樣本的權重,使得學習算法持續聚焦于錯分樣本,最后通過加權組合方式獲得最終模型。集成學習的優勢主要表現為:①統計學方面:多學習器可以獲得一個相對穩定的假設空間,以減少泛化誤差。②計算復雜度方面:集成學習可以有效降低算法陷入局部最優的可能性。③假設空間方面:多學習器可以讓假設空間有所擴大,更有利于學到更好的近似。在農作物遙感分類識別中,應用最為廣泛的機器學習方法是隨機森林[104-107]、Adaboost[108-109]、梯度提升樹[110-111]等。

雖然傳統機器學習方法能夠較好地完成不同地區不同作物的遙感識別,但在識別過程中主要使用淺層的直接觀測特征和人工設計特征,對遙感數據中的深層次特征以及不同類型特征的協同學習能力較差。

1.2.2基于深度學習的作物遙感識別

深度學習(Deep learning)作為機器學習領域中的一個分支,其目標在于建立模擬人腦進行分析學習的神經網絡,采用海量訓練數據驅動深度神經網絡學習更有用的深層次特征,最終提升分類準確性。深度神經網絡模型具有大量的參數,一方面使得模型具有足夠的復雜性,另一方面使得模型具備從端到端的數據中學習特征的能力,替代了基于人類經驗和先驗知識的手動特征工程[112]。近年來,以人工神經網絡為基礎的深度學習在包括遙感在內的機器學習和數據挖掘領域中取得一系列突破性進展,主要是得益于深度學習在特征表示方面的靈活性、不依賴于專家知識的端到端特征學習方式、自動化以及計算效率[113-119]。

卷積神經網絡(CNN)是最成功的深度學習網絡架構之一。CNN的學習過程計算效率高,并且對圖像數據中空間關系敏感,使得CNN網絡成為識別圖像中2維(2D)特征模式的最有效模型[120]。在遙感領域中,2D CNN已被廣泛用于提取空間特征,從而實現基于高分辨率圖像的目標檢測和語義分割[121-125]。CNN的另一個主要應用是高光譜圖像分類,即分別利用1D、2D、3D CNN進行光譜特征、空間特征、“空-譜”特征的提取[115,126-129]。在農作物遙感分類應用中,研究表明空間域中的2維卷積操作比光譜域中的1維卷積操作能取得更好的精度,將不同生長期的多光譜影像拼接起來,然后在光譜域中運用1維卷積操作同樣可以提升地物分類的精度[130-131]。雖然卷積操作可以很好地在空間域、光譜域或同時在“空-譜”域中提取有效特征,但是CNN很少用于時間域特征的提取,即無法有效地提取時間序列遙感數據中的時間變化特征。

循環神經網絡(RNN)是專門用于處理時間序列數據的另一類深度學習網絡模型[132-133],由于可以捕捉長序列數據中的前后依賴關系,已在眾多遙感應用中取得了成功。例如,RNN已經被成功用于多光譜數據中空譜相關性以及波段差異變換趨勢[115];將CNN與RNN進行結合進行圖像分類,即使用CNN生成從淺到深的多級卷積特征圖,然后使用RNN作為解碼器遞歸收集多尺度特征圖并按順序聚合形成高分辨率語義分割圖像[134]。RNN網絡有許多改進的模型用于提高學習效率,其中最著名的改進網絡是長短期記憶網絡(LSTM),主要是為了解決長序列訓練過程中的梯度消失和梯度爆炸問題。相比于普通RNN,LSTM在基于長時間序列的變換檢測[135]、農作物分類[82,136]等方面有更好的表現。此外,將CNN與LSTM相結合,一方面通過使用2D卷積操作提取影像中的空間特征信息,另一方面使用LSTM機制捕捉時間序列數據中的時間依賴關系,取得了比傳統方法更好的結果[137-138]。有研究對比分析了LSTM模型和傳統機器學習之間的表現,結果表明LSTM模型在提取時間序列特征方面全面占據優勢地位。例如,LYU等[135]發現在多個實驗中,LSTM的準確率約95%,而支持向量機(SVM)和決策樹的準確率分別約80%和約70%;MOU等[137]同樣進行了一系列對比試驗發現,將CNN和LSTM聯合使用,準確率可以達到98%,精度優于SVM(約95%)和決策樹(約85%);RUβWURM等[139]通過構建多時相的LSTM模型取得了90.6%的準確度,略高于CNN(89.2%),遠高于SVM(40.9%)。

以長短時記憶網絡(LSTM)為代表的循環神經網絡在處理時間序列遙感數據方面具有較大的優勢,但是以門限機制為基礎的循環神經網絡在處理長時間序列數據或長程依賴問題上容易出現梯度消失,無法捕捉長距離信息依賴的情況。為此,以自注意力機制為基礎的Transformer網絡應運而生。目前,Transformer模型及其變種已經成為處理序列問題的主流方法,在基于時間序列遙感數據的農作物分類識別領域取得了成功[140-142],成為當前研究的熱點。

1.3 討論

目前,對于大區域尺度農作物遙感識別存在的核心問題是:

(1)識別特征方面,當前所使用的主要特征類型以淺層特征為主,且作物生長過程中的時間信息、空間紋理特征、光譜反射特征(“時-空-譜”特征)協同表達不夠充分,且具體作物類型與作物識別特征缺乏知識關聯,導致以監督學習為主的農作物類型識別高度依賴于當季真實樣本,間接影響了農作物遙感識別的時效性和大區域作物類型識別的可用性。

(2)在作物的識別特征與具體作物類型缺乏知識關聯的背景下,通過增加識別模型復雜度提升農作物識別精度,一方面可以提升識別精度,另一方面模型訓練所需的樣本量急劇增加,進一步導致了識別過程對當季已知樣本的依賴、識別結果滯后,制約農作物遙感識別結果服務于現實應用。

在此背景下,應重點研究如何根據歷史的時間序列遙感數據及對應樣本數據,提取面向具體作物的“時-空-譜”特征知識,形成面向作物類型識別的知識圖譜,實現從數據到知識的轉化。一方面擺脫識別過程對當季真實樣本的依賴,另一方面提高識別精度與效率,提升農作物遙感識別的現實服務價值。

2 作物遙感估產

農作物產量的形成過程極為復雜,受到品種、氣候環境、土壤養分和田間管理措施等多種因素的綜合影響。作物遙感估產是農業遙感的基礎應用之一,其大致經歷了經驗模型、半經驗模型、物理估產模型3個階段。早期的經驗模型沒有充分考慮作物產量形成過程中的各種復雜因素,僅利用作物冠層光譜反射特征或氣象條件與地面實測產量數據進行回歸建模,實現作物單產遙感反演。經驗模型缺少機理約束,時空泛化能力差,而作物生長模型則從機理上模擬了作物生長的全過程,機理性更強,但只能模擬點位尺度的情況。不同模型各具特點,在實際應用時各有優劣。

2.1 統計模型

基于統計方法的作物單產估算大體可以分為3類(圖4),其中遙感指數模型和產量三要素模型的總體思路是直接建立遙感數據與作物實測產量或產量形成要素之間的關系模型進而完成單產估算;農業氣象模型則是通過評估農業生產過程中的氣象因素影響,實現作物單產估算。

圖4 基于統計模型的單產估算方法

2.1.1遙感指數模型

農作物冠層光譜反射特性與其地上部生物量/產量之間存在密切聯系,特別是紅色和近紅外波段由于包含超過90%的植被信息[143-144]而被用于監測綠色植被、估算產量[145-146]。早期的作物單產估算統計模型是尋求建立單一遙感波段或多波段反射率數據與地面觀測產量數據之間的線性/非線性回歸模型,是一種比較簡單有效的作物單產統計估算方法。例如在利用Landast TM影像進行水稻單產估算研究中發現,藍波段、近紅外、中外紅外波段的反射率與實際產量之間具有良好的相關性,可通過多元線性回歸模型較好地預測水稻產量[147];在玉米、大豆估產研究中同樣發現各波段反射率數據與大豆和玉米作物產量之間具有良好的相關性,并據此建立了包括線性、對數、指數和冪模型[148]等在內的經驗模型,取得了較好的估產效果。

植被指數通常綜合了兩個及以上的原始波段信息和專家知識,被廣泛應用于研究植被健康和作物生產力[149-152]。其中,歸一化差值植被指數(NDVI)[153]作為最常用的植被指數被大量單產估算研究采用。一種方式是選擇作物生長季內最佳時期的NDVI(如作物生長最旺盛時期)與地面觀測產量數據進行回歸建模,但選擇最佳時相與估產的生態區位、氣候條件、作物類型等多種因素有關,且無定律可循[154-155]。另一種方式是使用作物生長周期內的NDVI時間序列數據進行作物估產,例如建立NDVI時間序列積分與產量的線性關系或者從NDVI時間序列中提取作物活力值、生長峰值、生長率、衰老率、及曲線面積等更高級特征參數與產量進行多元回歸建模來估算[156-158]。除了NDVI之外,不同傳感器數據、不同類型的植被指數被廣泛用于全球不同地區的作物單產估算,作物類型涵蓋了水稻、玉米、大豆等。同時,隨著估產模型中變量類型的增加,單產估算的精度在提高,且多時期復合模式估產精度要優于單一生育期估產[159-161]。

單純基于原始遙感波段或植被指數建立經驗模型進行作物估產,在特定區域特定作物類型上能取得較好的估算精度,但是經驗統計模型缺乏機理約束,導致模型的時空泛化能力差。為此,有研究在回歸模型中加入獨立的氣象變量進行條件約束,用于提高估產精度[162-163]。此類,條件約束變量既可以直接測量,也可以通過遙感反演,例如降雨量、ETa(實際蒸發蒸騰量)或土壤水分等農業氣象參數。研究表明將降雨量、溫度數據與NDVI數據同時用于建立普通最小二乘回歸模型對小麥單產的早期預測精度較好,表明將降雨量和溫度因子納入作物單產估算模型對干旱少雨的地區更為重要[164]。引入額外生物氣候變量的谷物產量回歸模型比僅使用遙感指數的模型具有更高的相關性和預測能力[156];將基于CWSB模型計算出的ETa和土地覆蓋加權NDVI(CNDVI)作為自變量與玉米產量進行多元線性回歸來預測肯尼亞玉米產量,模型精度(R2)達到0.83[165]。但值得注意的是通過遙感反演得到的生物、氣候指標并不獨立于遙感植被指數,因此,將他們和光譜參數協同建模時,應考慮并糾正不同輸入變量的相關關系。

近10年,隨著傳感器的發展,紅邊植被指數、太陽誘導葉綠素熒光(SIF)等新的波段或植被指數在遙感估產方面展現了巨大的潛力[166-167]。在單產估算建模方法方面,除了經典(多元)線性回歸、偏最小二乘回歸(PLSR)或主成分回歸(PCR)等統計方法之外[168],模糊數學和機器學習算法也被用于估產模型構建,例如隨機森林算法(RF)、自適應神經模糊系統(ANFIS)和深度學習[169-172]。

總體而言,基于經驗模型來估算作物產量的方式簡單、易實施,在特定區域針對特定作物的估產可以達到較高的精度。但經驗統計模型一方面缺乏理論機理支撐,另一方面受限于特定地理區域的環境特征、數據集,難以將已校準的估產方法推廣到其他地區或其他尺度,模型的擴展性與移植穩定性差。此外,經驗模型構建時需要大量地面真實產量數據作為支撐,對于大面積估產來說費時費力,經濟性與時效性均不能滿足實際應用的需求。

2.1.2農業氣象模型

農業氣象模型主要思想是將作物產量劃分為趨勢產量(潛在產量)、氣象脅迫產量(脅迫產量)與隨機產量3部分,故又稱潛在-脅迫模型。趨勢產量是由作物生理結構、農田管理措施等非環境因素所形成的產量,即作物在正常生長環境下的產量;氣象脅迫產量則是由于氣溫、降水、日照等氣象條件導致的產量波動部分;隨機產量是由自然或者人為災害導致的不確定部分,一般只能在模型外進行處理。農業氣象模型通過分離趨勢產量與氣象產量、外推趨勢產量、預測波動產量、修正預測誤差等工作來進行作物產量估算。

農業氣象模型在我國應用廣泛,中國科學院開發的全球農情遙感速報系統(Cropwatch)中也運用了農業氣象模型進行產量預測[173],實現了以作物產量預報業務系統為主體,農業氣象情報和遙感應用系統為輔助的作物產量預報綜合技術支持體系,對全球主要糧食產區進行跟蹤監測、評價和產量預測[174]。

2.1.3產量三要素模型

產量構成三要素方法將作物產量表示為單位面積作物株數、每株平均粒數與籽粒質量的乘積。在對產量三要素與作物光譜之間關系的研究中發現小麥的株數與植被綠度相關性非常高;穗粒數主要取決于環境因子, 特別是拔節至灌漿初期溫度因子; 籽粒質量則主要取決于灌漿期的長短,可以使用綠度的變化速率來表征[175],而垂直植被指數(PVI)與單產三要素均具有較強的相關性[176-177]。利用遙感信息反演產量構成三要素進而估算作物單產,思路簡潔明確,在對冬小麥進行估產時精度達到了95%以上[178]。但是,產量三要素模型的空間擴展能力較弱且估產精度不穩定,主要原因是產量三要素的遙感反演模型主要是經驗模型。

總體而言,無論是遙感指數模型、農業氣象模型還是產量三要素模型,其本質均是通過大量地面實測的產量數據與相應遙感數據進行統計分析與建模,所建立的經驗模型在特定空間范圍內對特定作物的單產可以進行高精度估算,且模型運算量小、計算簡單易實行,具有一定的實際應用價值。但是經驗模型一方面缺乏機理約束,另一方面高度受限于氣候條件的制約,在具有不同氣候條件的其他地理區域,模型穩定性與空間外推能力差。

2.2 凈初級生產力模型

作物最終產量的形成是植株光合作用積累干物質以及干物質在不同器官分配的結果,因此可以通過計算植被凈初級生產力(NPP)并結合收獲系數估算作物產量,基于該原理的作物單產估算模型統稱為NPP模型。NPP模型分為統計模型、過程模型、參數模型3種[179]。其中,統計模型是根據光譜指數與作物地上部分干物質量之間的相關關系而建立的估算模型,對遙感數據及實測數據要求較高。過程模型理論嚴謹、精度高,如BEPS模型[180]等。雖然過程模型具有一定的物理意義和理論基礎,但是所需參數種類及數量較多,數據處理過程復雜,且往往難以直接觀測。參數模型又稱遙感光合模型,是對過程模型的簡化。其基本思路是:首先計算植被光合有效輻射吸收比例(FAPAR),即植被吸收的光合有效輻射(APAR)與地球表面的瞬時光合有效輻射(PAR)之比;其次,植被光合有效輻射乘以光能利用率得到NPP;最后,將作物整個生長季的NPP進行累加,然后乘以收獲指數(HI)得到作物最終產量(Y)[181]。其中FAPAR與LAI、植被冠層反射率以及NDVI密切相關。研究表明FAPAR與LAI呈指數關系、與NDVI呈現出良好的線性關系,據此可以對FAPAR進行遙感反演[182]。PAR為入射輻射總量,常用日照百分率結合經驗公式計算得到。εb是指單位面積的土地上植被通過光合作用產生的有機物所包含的能量占對應土地上所接受的太陽能的比例。在理想狀態下,植被所吸收的光合有效輻射轉化為有機物的效率存在理論最高值,即存在最大光能利用率εmax,其主要利用通量觀測數據計算或者根據先驗知識得到[183],每一種植被類型的最大光能利用率是恒定的。然而真實情況下,作物受各種外界因素(水分因素、溫度因素等)脅迫,實際光能利用率會產生波動變化,其實際值的確定通常需要對作物生長環境脅迫因子(如溫度、降水)進行綜合考慮。遙感光合模型具有生態物理學基礎,所需參數較少,估算結果精度較高,在實際生產中得到了廣泛的應用,代表性模型有CASA、GLO-PEM、C-FIX模型等[184]?;谶b感光合模型的單產估算模型在區域尺度上對玉米、小麥等主要糧食作物的估產中取得良好的效果[185-186],憑借較好的時間及空間泛化能力,NPP模型也被成功應用于農田生產力時空變化格局分析[187]。

雖然利用遙感光合模型進行農作物估產的應用越來越多,但是相比于農作物估產,遙感光合模型在計算草地和森林生物量時具有更好的精度,可能原因是遙感光合模型未能考慮人為管理因素對農作物產量的影響。相比于統計模型,遙感光合模型有一定生物物理基礎,模型時空泛化能力強。但利用該模型進行作物單產估算時需要輸入作物生長周期內完整的長時間序列遙感數據,且不同區域不同作物的真實光能利用率以及收獲指數的精確估算還需進一步深入研究,這在一定程度上影響了此類模型的實際應用。

2.3 作物生長模型

自荷蘭瓦赫寧根大學DE WIT于1965年率先提出作物生長模擬理論以來[188],全世界多個研究組開始從事作物生長模擬模型的研究,建立了各種作物的生長模擬模型。隨著計算機科學技術以及作物生長理論的研究深入,作物生長模型的研究也取得了巨大的進展,成長為一門成熟的科學[189]。目前,典型作物生長模型有:美國的DSSAT(Decision support system of agricultural technology transfer)[190],包括針對42種以上作物的模擬模型(自4.7版起)以及輔助工具,其中CERES-Maize和CERES-Wheat模型是作物模型發展的典型代表;澳大利亞的APSIM(Agricultural Production Systems sIMulator)系統[191];荷蘭的WOFOST(World food studies)模型[192]等。

作物生長模型通過初始化模型參數信息(作物參數、土壤參數等)模擬作物一定時間步長內(每日、每旬、每月等)對驅動變量(氣象參數、田間管理等)的響應從而更新模型狀態變量(發育階段、各器官干重、葉面積指數等),再現農作物生長發育及產量形成過程。作物生長模型的優勢主要體現在以下方面:①模型按照固定時間步長對輸入數據進行反映并更新狀態變量,是動態連續的。②模型允許對不同區域、不同作物、不同生長情況進行模擬,機理性強,易于空間外推。③模型是多功能模塊的集成系統,綜合性強,可以進行不同應用的定量分析,如氣候效應對農作物影響的定量研究、土壤水肥模擬、生產力預測預警、農業生態評估等。

作物生長模型可以定量描述作物生長發育和產量形成過程及其與氣候因子、土壤環境、品種類型和技術措施之間的關系,為不同條件下作物生長發育及產量預測、栽培管理、環境評價以及未來氣候變化評估等提供了定量化工具。但是,作物生長模型是對點位尺度的模擬,在區域尺度應用時,由于空間尺度增大而出現的地表、近地表環境非均勻性問題,導致模型中一些宏觀資料的獲取和參數的空間化方面存在困難,從而使得作物生長模型模擬結果存在較大不確定性。遙感信息則憑借其宏觀、快速、連續的觀測特點可以在很大程度上彌補作物生長模型的不足,因此,作物生長模型與遙感數據的結合應運而生,具體結合方式見表3。

表3 遙感數據與作物生長模型的結合方式

數據同化指在考慮數據的時空分布和觀測場、背景場誤差的前提下,在模型的動態運行過程中融合新觀測數據的方法。其主要目標是利用多源觀測數據不斷校正與優化模型的模擬過程,使得模型的估算更加符合客觀生物物理化學狀態,進而改善模擬的估計精度,提高模型的預測能力。遙感耦合作物生長模型進行數據同化的方法主要包括連續數據同化和順序數據同化,具體見表4。

表4 遙感數據與作物生長模型同化方法

早期的遙感數據與作物生長模型的同化主要基于優化算法。對冬小麥單產估算的研究表明,將不同遙感數據源反演得到的LAI分別與CERES-Wheat、EPIC等作物生長模型進行同化,均取得了良好的精度[194-195]。LAUNAY等[196]將甜菜模型SUCROS與SAIL耦合,然后把SPOT影像數據和航空攝影數據同化到耦合后的模型中,通過調整模型中的部分敏感性參數,提高了產量預測的精度,均方根誤差由原來的20%下降到10%?;趦灮惴ǖ耐桨冈趯嶋H應用易于實現,但需要極大的計算量,效率較低?;谧兎址ê蜑V波算法的同化方法則具有更高的效率,在近幾年得到更多研究。例如在冬小麥的單產估算中,利用集合卡爾曼濾波算法(EnKF)將MODIS數據反演LAI和ET與SWAP模型進行同化,顯著提高了小麥單產的預測精度[197]。黃健熙等[198]首先基于S-G濾波算法重構MODIS LAI時間序列;其次,通過構建地面觀測LAI與3個關鍵物候期Landsat TM植被指數構建回歸統計模型計算得到區域尺度的TM LAI數據;然后融合上述兩種不同空間尺度的LAI數據生成尺度轉換LAI。最終利用EnKF算法將這3種不同時空分辨率的LAI數據同化到PyWOFOST模型中,研究結果表明同化尺度轉換LAI獲得最高的同化精度,潛在模式下的模擬產量均方根誤差由602 kg/hm2下降到478 kg/hm2,證明了遙感數據與作物模型的EnKF同化方法在區域作物產量估算中的有效性。王鵬新等[199]將遙感反演的條件植被溫度指數VTCI與CERES-Wheat模型模擬的土壤淺層含水率相結合,運用四維變分同化算法(4D-VAR)實現冬小麥主要生育期旬尺度VTCI的同化,運用多種決策分析方法分別建立了同化前后的VTCI單產估測模型,結果同樣表明應用同化后的VTCI構建的估測模型精度明顯提高。

基于作物生理學建模的定量遙感估產方式是目前的研究熱點。將遙感數據與作物生長模型相結合進行作物單產估算是理論性更完備的方式之一,因為遙感能夠對作物生長狀況進行概括性量化,而作物生長模型能夠描述整個生長季作物的生長過程。隨著作物生長模型的不斷完善,其模擬精度不斷提高,但是所需參數多難以準確獲取,此外作物生長模型需要輸入整個生長期的驅動數據,無法進行產量的提前預測。因此,如何更進一步充分發揮遙感與作物生長模型的各自優勢,提高對作物產量的估算精度和估算的時效性還有待深入研究。

2.4 問題與展望

總體來看,當前的農作物單產遙感估算模型也是形式繁多,在推廣應用中明顯存在泛化能力不足、監測時效滯后、單產制圖不夠精細等問題,難以滿足當前智慧農業對于農作物單產估算時效性和空間精細程度的要求。

隨著高分辨率、高光譜分辨率、高時間分辨率遙感數據的增加,以及深度學習等技術的發展[200],研究如何耦合深度學習與作物生長模型,構建針對大區域范圍的可擴展和高效移植的精細尺度農作物單產遙感動態估算模型是潛在的研究方向之一。充分利用作物生長模型模擬不同點位尺度、不同生境情況下的作物生長情況,捕捉作物生長規律,充分利用深度學習方法對復雜情況的學習與建模能力,完成空間外推,實現用機理做約束,用深度學習做外推。

3 結束語

作物類型遙感識別與產量估算是農業遙感領域中的基礎應用。當前農作物遙感識別特征與具體作物類型缺乏知識關聯,導致識別過程過度依賴于當季樣本、識別結果滯后的問題;單產估算模型則面臨著估算精度較低、時空泛化能力較弱的問題。隨著更高空間分辨率、更高光譜分辨率、更短重訪周期數據的普及,以及深度學習技術的發展,同步學習農作物生長過程中的“時-空-譜”特征知識,并基于與特征知識構建面向作物識別的知識圖譜,實現從數據到知識轉變,從而提高農作物遙感識別的精度和時效性。農作物單產遙感估算的潛在重點是深度協同作物生長模型和深度學習,以作物生長模型模擬的不同生境下作物生長狀況為基礎,驅動深度學習模型完成復雜種植結構、復雜生長環境下的建模學習,最終實現用機理做約束,用深度學習進行空間外推的作物單產估算模式。

猜你喜歡
農作物作物光譜
高溫干旱持續 農作物亟須“防護傘”
俄發現保護農作物新方法
夏季農作物如何防熱害
基于三維Saab變換的高光譜圖像壓縮方法
厲害了!農作物“喝”上環保酵素
作物遭受霜凍該如何補救
四種作物 北方種植有前景
內生微生物和其在作物管理中的潛在應用
無人機遙感在作物監測中的應用與展望
星載近紅外高光譜CO2遙感進展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合