?

基于神經網絡的短期土壤墑情預測模型研究

2024-01-13 07:35楊靖峰劉志良沈艷妍
農業科學研究 2023年4期
關鍵詞:墑情天氣預報步長

楊靖峰, 劉志良, 沈艷妍

(天津市農業發展服務中心,天津 300061)

目前土壤墑情預測模型的研究主要分為2 類。一類是基于土壤水分平衡和土壤水動力學的水理論預測模型,如侯瓊等[2]建立了土壤水分動態預測模型來預測內蒙古地區玉米田的土壤墑情;一類是基于數據統計的預測模型,如白冬妹等[3]應用時間序列自回歸模型預測土壤含水量,尚松浩等[4]建立了BP神經網絡模型預測小麥田墑情。

本研究建立BP 神經網絡和Elman 神經網絡2種預測模型,用2 組維度不同的數據分別對2 種模型進行訓練模擬,旨在找出預測精度更高的短期土壤墑情模型及其有關參數,用于預測1 d(24 h)后的土壤墑情,最終應用于實際農業生產。

1 數據來源與數據處理

1.1 數據來源

研究區域為天津市,該地區主要氣候特征是四季分明,春季多風,干旱少雨;夏季炎熱,雨水集中;秋季氣爽,冷暖適中;冬季寒冷,干燥少雪。2000年以來天津地區的年平均氣溫為13.5 ℃,最高溫度為42.7 ℃,于2017年7月11日出現在靜海區,最低溫度-22.6 ℃,于2021年1月6日出現在薊州區;年平均降水量一般在370~750 mm,降水大部分集中在6—9月,但2021年降水量為979.1 mm,創下1961年有氣象資料以來最高紀錄。

本研究的數據來源于天津市薊州區、靜海區、寧河區、濱海新區的10 個氣象墑情自動監測站(表1)。每個站點均可同時監測氣象數據和墑情數據,其中氣象數據包括空氣溫度、空氣濕度、風速、風向、光照、雨量、蒸發量、大氣壓力、露點溫度、作物蒸騰蒸發量;墑情數據包括土壤體積含水量、相對含水量、溫度、鹽分,均為20、40、60、80 cm 4 個土層深度數據。數據跨越時間為2018 年9 月1 日—2021 年8 月31 日,監測站每15 min 采集1 次數據。本研究的天氣預報數據來源于天津市氣象局發布的各區天氣預報數據,共1 095組數據。

表1 各氣象墑情自動監測站位置

1.2 數據處理

為確保數據有意義且具有可操作性,原始數據在應用前進行完整性檢查,剔除無效數據、異常數據。故處理后,氣象數據剔除蒸發量、大氣壓力、作物蒸騰蒸發量3個數據項,保留空氣溫度、空氣濕度、風速、風向、光照、雨量、露點溫度7個數據項;墑情數據剔除相對含水量的4個數據項,保留體積含水量、土壤溫度、土壤鹽分的12個數據項。剔除原因均為監測數據不完整,各站點監測項設置有別,只有個別“超級站點”有剔除數據項的監測內容。同時剔除由于設備測試、傳感器探頭失靈產生的異常數據組。

本研究采用不包含天氣預報和包含天氣預報2組維度不同的數據分別對2 種模型進行訓練模擬。按照模型要求,2 組數據均分為輸入數據和輸出數據,而2組輸出數據均為土壤墑情狀況,即體積含水量,包括20、40、60、80 cm 土層的體積含水量。原始數據處理過程:第1 步,增加“站點編號”數據項,因原始數據和預測結果分屬各站點,即根據某一站點的數據預測這一站點未來的土壤墑情;第2步,匹配輸出數據,模型將預測1 d(24 h)后的土壤墑情,故每組原始數據要匹配24 h 后的墑情數據,比如2020年8月4日10:30的氣象墑情原始數據,要匹配2020年8 月5 日10:30 的墑情數據;第3 步,匹配24 h 天氣預報數據,對天氣預報數據進行數字化處理,然后匹配到相應原始數據中,比如2020 年8 月4 日靜海區各站點數據要匹配2020年8月4日的24 h天氣預報數據;第4 步,提取測試數據,模擬真實預測場景,從原始數據中隨機提取5 000 組數據作為測試數據,剩余10萬組數據用于模型訓練;最后,將不包含天氣預報和包含天氣預報2組維度不同的數據分別進行存儲。各組數據的輸入輸出數據項如表2所示。

李桂明還主動交代了幾個埋“瓶裝”的細節,說藥瓶是他媽以前吃藥用過的?!拔揖妥隽诉@么點傻事,該咋判咋判吧!”

表2 各組數據的輸入、輸出數據項

2 模型的建立

2.1 BP神經網絡模型

BP 神經網絡模型的基本思想是信號的正向傳播與誤差的反向傳播,根據網絡輸出層實際誤差,從輸出層開始,反過來調整網絡權值,最終使輸出的均方誤差最小[5]。BP 神經網絡的拓撲結構如圖1所示。

圖1 BP神經網絡拓撲結構

2.2 Elman神經網絡模型

Elman 神經網絡是典型的反饋型神經網絡,是一種具有局部記憶單元和局部反饋連接的遞歸神經網絡。它以BP網絡為基礎結構,在隱含層增加一個承接層,作為一步延時算子,達到記憶目的,從而使系統具有適應時變特性的能力,增強了網絡的全局穩定性[6]。Elman神經網絡的拓撲結構如圖2所示[7]。

圖2 Elman神經網絡拓撲結構

2.3 傳遞函數

本研究的BP 神經網絡模型的傳遞函數是Levenberg-Marquardt 算法。Elman 神經網絡模型的傳遞函數采用帶動量的梯度下降法。

2.3.1Levenberg-Marquardt 算法 該算法是使用最廣泛的非線性最小二乘算法,是利用梯度求最大(?。┲档乃惴?,它同時具有梯度法和牛頓法的優點,且算法穩定[8]。當λ很小時,步長等于牛頓法步長;當λ很大時,步長約等于梯度下降法的步長。

2.3.2帶動量的梯度下降法 該方法是在反向傳播的基礎上在每一個權值的變化上附加一項正比于前次權值變化量的值,并根據反向傳播法產生新的權值變化。該方法使網絡在修正權值時,不僅考慮誤差在梯度上的作用,而且還考慮誤差曲面變化趨勢的影響,從而降低網絡對于誤差曲面局部細節的敏感性,有效地抑制網絡陷入局部極小[9]。

本研究初始計劃均采用Levenberg-Marquardt算法,但由于訓練數據量大,該算法占用內存高,導致Elman 神經網絡模型訓練時長增加數倍,故Elman神經網絡模型選擇帶動量的梯度下降法。

3 模型應用評價

本研究模型訓練應用的是Matlab 神經網絡工具箱,該工具箱默認將10 萬組數據按7∶1.5∶1.5 的比例分為訓練集、驗證集和測試集進行模型訓練。各模型的隱藏層節點數量和步長均通過試算確定,經過多次迭代,每次迭代都會按照比例重新分配訓練集、驗證集和測試集數據,最終使網絡訓練誤差逐步收斂,最后應用5 000 組測試數據模擬真實預測場景。

3.1 不含天氣預報的BP神經網絡土壤墑情模型

通過對該模型的隱藏層節點和步長的試算,每個節點或步長試算均連續進行15次,最終確定隱藏層節點23個、步長為0.01時,4個土層的平均土壤墑情誤差最小,為0.052 075(5.21%),如表3所示。

表3 不含天氣預報的BP神經網絡土壤墑情模型平均誤差分析

網絡的訓練性能和總擬合情況如圖3所示。該網絡在迭代225次后實現性能最佳,此時網絡均方誤差為0.004 350 4;網絡的總擬合度為0.988 59,回歸直線對觀測值的擬合程度較好,模型具有良好的準確性和穩定性。模型訓練完成后用5 000 組數據進行測試,測試結果誤差曲線如圖4所示。

圖4 不含天氣預報的BP神經網絡模型測試數據誤差

從誤差曲線看出,該模型測試數據的誤差比較平穩,整體波動較小,其中20、40 cm 土層墑情預測誤差最大達到近400%、750%,60、80 cm 土層墑情預測誤差最大達到80%、140%。

3.2 含天氣預報的BP神經網絡土壤墑情模型

通過對該模型隱藏層節點和步長的試算,每個節點或步長試算均連續進行15次,最終確定隱藏層節點39個、步長為0.01時,4個土層的平均土壤墑情誤差最小,為0.044 55(4.46%),如表4所示。

表4 含天氣預報的BP神經網絡土壤墑情模型平均誤差分析

網絡的訓練性能和總擬合情況如圖5所示。該網絡在迭代131 次后實現性能最佳,此時網絡均方誤差為0.002 661 1;網絡的總擬合度為0.992 83,回歸直線對觀測值的擬合程度較好,模型具有良好的準確性和穩定性。模型訓練完成后用5 000 組數據進行測試,測試結果誤差曲線如圖6所示。

圖5 含天氣預報的BP神經網絡土壤墑情模型訓練性能和總擬合情況

圖6 含天氣預報的BP神經網絡土壤墑情模型測試數據誤差

從誤差曲線看出,該模型測試數據的誤差比較平穩,整體波動較小,其中20、40 cm 土層墑情預測誤差最大達到近500%、1 200%。60 cm 土層墑情預測誤差波動較其他3個土層更多,但幅度較小,最大誤差不及90%。

3.3 不含天氣預報的Elman神經網絡土壤墑情模型

通過對該模型隱藏層節點和步長的試算,每個節點或步長試算均連續進行15次,最終確定隱藏層節點25 個、步長為0.3 時,4 個土層的平均土壤墑情誤差最小,為0.031 45(3.15%),如表5所示。

表5 不含天氣預報的Elman神經網絡土壤墑情模型平均誤差分析

網絡的訓練性能如圖7 所示,經過50 000 次迭代訓練該網絡的均方誤差為0.005 280 2,已達到最佳訓練性能。模型訓練完成后用5 000 組數據進行測試,測試結果誤差曲線如圖8所示。

圖7 不含天氣預報的Elman神經網絡土壤墑情模型訓練性能

圖8 不含天氣預報的Elman神經網絡土壤墑情模型測試數據誤差

從誤差曲線看出,該模型測試數據的誤差整體波動較小,誤差最大值較BP 神經網絡模型小很多,其中20、40 cm 土層墑情預測誤差最大值不到70%、90%,60、80 cm墑情預測誤差最大值不到80%、90%。

3.4 含天氣預報的Elman神經網絡土壤墑情模型

通過對該模型隱藏層節點和步長的試算,每個節點或步長試算均連續進行15次,最終確定隱藏層節點38 個、步長為0.5 時,4 個土層的平均土壤墑情誤差最小,為0.033 575(3.36%),如表6所示。

表6 含天氣預報的Elman神經網絡土壤墑情模型平均誤差分析

網絡的訓練性能如圖9 所示,經過50 000 次訓練該網絡的傳遞誤差大小為0.005 090 1,已達到最佳訓練性能。模型訓練完成后用5 000 組數據進行測試,測試結果誤差曲線如圖10所示。

圖10 含天氣預報的Elman神經網絡土壤墑情模型測試數據誤差

從誤差曲線看出,該模型測試數據的誤差整體波動情況與不含天氣預報的Elman神經網絡模型相似,各土層誤差最大值與不含天氣預報的Elman 神經網絡模型一致,較BP神經網絡模型小很多。

3.5 各模型訓練過程綜合分析

BP、Elman 神經網絡預測模型各土層墑情誤差及方差結果見表7。

表7 各模型各土層墑情誤差和方差結果

4 討論與結論

本研究建立BP、Elman 神經網絡預測模型,采用2 組維度不同的數據分別對這2 種模型進行訓練模擬,預測1 d(24 h)后的土壤墑情,通過對5 000 組測試數據結果及各模型訓練過程進行綜合分析,得出以下結論。

1)從總體看,Elman 神經網絡模型的精度比BP神經網絡模型的更高,輸入的數據不論是含天氣預報還是不含,精度都高于BP神經網絡模型。這是因為Elman 神經網絡是一個反饋型網絡,通過承接層記憶隱含層單元前一時刻的輸出值達到反饋目的;而BP 神經網絡則沒有反饋。由于Elman 神經網絡增加了反饋,所以其訓練時間長于BP 神經網絡,在本研究中,Elman 神經網絡的訓練時間是BP 神經網絡的2~3倍。

2)土壤墑情與天氣狀況密切相關,所以從理論上講,含天氣預報的模型精度比不含天氣預報的模型精度高。但實際發現,BP神經網絡模型基本表現出這一相關性;而Elman 神經網絡模型并沒有表現出這一相關性,含天氣預報模型的誤差略高于不含天氣預報模型的誤差,而其方差在4 個土層上都小于后者,這可能是天氣預報數據精度及農田灌溉操作的影響,因為本研究的天氣預報數據是區縣級數據而非站點區域性數據,而且對各站點的農田灌溉未作考慮和統計。

3)4個土層的土壤墑情誤差差別較大,20、40 cm土層的墑情誤差明顯高于60、80 cm 土層。從模型測試數據誤差圖中也能看出20、40 cm 土層墑情的波動比60、80 cm土層的波動大。這是因為20、40 cm土層墑情受天氣等外界的影響較大,水分要滲入60、80 cm 土層需要較大的雨量,而天津地區較大雨量只集中在每年7、8 月份的某幾天,所以60、80 cm土層墑情誤差的波動較小。

本研究預測1 d(24 h)后的土壤墑情,預測誤差控制在5%以內,說明該模型是可用的。但在實際中,預測獲取1 d 后的土壤墑情,對農業生產的作用和意義不是很大。農作物生長是一個長期過程,土壤墑情的短期或超短期的微小變化對農作物生長的影響不大,所以在農業生產過程中,中長期(5、10、15、30 d)的土壤墑情預測意義深遠。本研究團隊將繼續應用Elman神經網絡或其他神經網絡研究中長期預測模型,以最終實現指導農業生產、提高農作物產量的目的。

猜你喜歡
墑情天氣預報步長
基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
墑情會商,助力備耕春播
土壤墑情監測的意義與技術規范
測不準的天氣預報
天氣預報的前世今生
中期天氣預報
開封市土壤墑情監測系統建設研究
基于逐維改進的自適應步長布谷鳥搜索算法
小小天氣預報員
額爾古納市2013年春季土壤墑情分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合