?

基于BiLSTM-GRU融合網絡的稻蝦養殖溶解氧含量預測

2023-11-23 04:38石慶蘭束金陽李道亮黃凱欣查海涅
農業機械學報 2023年10期
關鍵詞:稻蝦溶解氧神經網絡

石慶蘭 束金陽 李道亮 黃凱欣 查海涅

(1.中國農業大學信息與電氣工程學院, 北京 100083; 2.農業農村部智慧養殖重點實驗室, 北京 100083;3.國家數字漁業創新中心, 北京 100083; 4.北京市農業物聯網工程技術研究中心, 北京 100083;5.安慶師范大學計算機與信息學院, 安慶 246052)

0 引言

近年來,由于稻蝦共作模式在保障糧食產量的前提下還能給農民增加經濟收入[1],因而有著良好的推廣前景。

相較于水稻單作和自然水環境的養殖,稻蝦共作可以提高水體pH值、總溶解固體(TDS)、電導率和氧化還原電位等參數,此外在抑制潛水蒸發、提高水體自凈能力等方面也產生了積極作用[2]。然而,在養殖過程中,由于蝦的日?;顒硬粩鄶嚮焯镩g水體,水中的太陽光穿透率低,抑制水生植物的光合作用,導致水體溶解氧含量降低,不利于水生物的生長和腐敗物質的分解消化[3-4]。水中的溶解氧含量是水質監測的一項重要指標,當稻蝦互作養殖環境中的溶解氧含量不足時,氨和硫化氫不能實現無毒轉化,極易危及小龍蝦的生長發育[5-6]。因此精確預測溶解氧含量是實現智慧稻蝦養殖的關鍵。

關于溶解氧濃度的預測國內外學者采用了多種方法。LIU等[7]在池塘養殖環境下通過閾值處理、小波濾波等方法對溶解氧數據集進行處理,大大提高溶解氧預測模型的準確性。孫龍清等[8]和陳英義等[9]通過改進的天牛須搜索算法和改進粒子群優化算法對參數選擇和特征提取進行優化,進而降低模型預測誤差。在工廠化循環水養殖環境下,頻繁的人為調控使得溶解氧的變化更為復雜[10-11],REN等[12]采用變分模態分解(VMD)算法降低原始數據中的噪聲,有效提高神經網絡輸入數據的質量,后通過深度置信網絡(DBN)實現溶解氧的預測。TA等[13]通過逆向理解卷積神經網絡建立溶解氧預測模型,在收斂速度、預測準確性及穩定性上,模型均滿足實際生產需求。在魚菜共生系統中,溶解氧的變化受到更多動植物生存環境因素的影響[14],精準預測的難度大大增加。這種養殖模式下,REN等[15]通過遺傳算法優化模糊神經網絡溶解氧預測模型,提高了模型效率和預測準確性。

在諸多預測算法當中,以循環神經網絡(RNN)[16]為代表的深度學習適應性好、學習能力強、適合時間序列的參數預測,其預測精度取決于訓練樣本數量。長短期記憶神經網絡(LSTM)[17-18]和門控循環單元(GRU)[19]是在RNN的基礎上引入門控機制,增強了處理長序列信息和記憶能力,防止梯度消失或爆炸,使模型訓練效果更佳。目前稻蝦養殖中影響溶解氧含量變化的因素較多,不僅受養殖水體環境參數影響,還受作物生長及其氣象環境等參數影響[20]。針對稻蝦養殖復雜環境下采用傳統循環神經網絡存在計算效率低下、特征提取能力不足、缺乏對環境變化的適應能力和過擬合風險高等問題[21],本文采用BiLSTM[22]與GRU神經網絡融合的方法對溶解氧含量進行預測,以期為溶解氧的調控提供依據和決策。

1 數據獲取與預處理

1.1 數據獲取

試驗在安徽省全椒縣銀花家庭農場稻蝦養殖基地(31.74°N,116.52°E)完成,養殖總面積為700 hm2,其中一個稻蝦養殖單元面積約為50 hm2,長185 m,寬180 m,蝦渠寬度為6 m,投放幼蝦規格為 160~200尾/kg,投放量為450~600 kg/hm2。水質監測設備包括溶解氧水溫一體化傳感器、pH值傳感器、濁度傳感器、氨氮傳感器,稻蝦養殖田中部署情況如 圖1所示,采集到數據如表1所示。

表1 農場中采集到的水質數據Tab.1 Water quality data collected in farm

圖1 稻蝦田傳感器部署圖Fig.1 Sensor deployment diagram for rice and shrimp fields

1.2 數據預處理

由于傳感器探頭表面容易附著水中的浮游物使得測量誤差增大,因此需對傳感器進行清洗校準 2次,偏差為0.67~1.82 mg/L,對數據集進行校準,計算公式為

式中XMax——校準數據集最大值

XMin——校準數據集最小值

X——某時刻溶解氧含量

Xrevised——同一時刻校準后溶解氧含量

C——校準偏差

校準后溶解氧含量如圖2所示。

圖2 溶解氧含量數據校準結果Fig.2 Correction results of dissolved oxygen content data

2 基于BiLSTM和GRU網絡融合預測模型

采用兩層循環神經網絡模型,如圖3所示,第1層使用BiLSTM神經網絡,將2次得到的LSTM結果進行拼接作為最終輸出。借助LSTM細胞單元的結構來保存較長的依賴關系,通過前向、后向兩個傳播方向的LSTM傳輸序列數據,調整前后的狀態對當前細胞單元狀態的影響,不僅可以保存序列數據中前向輸入對后向輸入的影響,也可以保存后向輸入對前向輸入的影響,大大提高了模型預測精度。第2層使用GRU神經網絡以降低神經網絡的計算復雜度、參數量和計算時間,在第1層得到序列特征的基礎上,保證模型預測精度的同時,大大減少了模型訓練時間。

圖3 BiLSTM-GRU融合神經網絡結構Fig.3 BiLSTM-GRU fusion neural network structure

根據采集的水質數據,模型輸入層設置為前48個時間刻度的水質參數,輸出層為未來12個時間刻度的溶解氧含量,具體預測方法如圖4所示。

圖4 BiLSTM-GRU融合神經網絡流程圖Fig.4 Flow chart of BiLSTM-GRU fusion neural network

3 模型構建與分析

3.1 水質參數相關性分析

計算溶解氧含量校準前后與溫度、pH值、濁度、氨氮含量等參數之間的皮爾遜相關系數[23],如表2所示。由表2可知,pH值與溶解氧含量的相關性最大,故將溶解氧含量和pH值作為模型輸入,按照比例7∶3分為訓練集和測試集后,將訓練集輸入模型中對模型進行訓練。

表2 溶解氧含量與各參數之間的皮爾遜相關系數Tab.2 Pearson correlation coefficient between dissolved oxygen content and various parameters

3.2 模型構建及指標評估

采用均方根誤差(RMSE)、平均絕對誤差(MAE)和決定系數R2[24-25]進行評價。分別在不同隱藏層節點數、每次迭代不同的輸入樣本數量以及不同的訓練輪次下進行運算,同時計算每種參數下的評價指標。如表3所示,對比結果表明隱藏層節點數為48時表現最佳。將隱藏層節點數設置為48時不同輸入樣本數量對比如表4所示,結果表明當每次迭代輸入的樣本數量為24時表現最佳。再將隱藏層節點數設置為48,每次迭代輸入的樣本數量設置為24,如表5所示,當模型訓練輪次為500時表現最佳。

表3 不同隱藏層節點數結果對比Tab.3 Comparison of number of nodes in hidden layer

表4 不同輸入樣本數量結果對比Tab.4 Comparison in different iteration sample numbers

表5 不同訓練輪次結果對比Tab.5 Comparison of number of turns

3.3 模型訓練結果

3.3.1神經網絡模型運行結果

確定模型各個參數后,即隱藏層節點數為48,每次迭代輸入的樣本數量為24,訓練輪次為500,建立BiLSTM-GRU融合神經網絡模型結構如圖5所示。

圖5 BiLSTM-GRU融合神經網絡模型Fig.5 BiLSTM-GRU fusion neural network model

通過構建完成的BiLSTM-GRU融合神經網絡模型以及4個對比模型(LSTM、GRU、BiLSTM、BiGRU)對測試集進行訓練,得到預測值與真實值差值如圖6所示。

圖6 各模型預測值與真實值差值變化曲線Fig.6 Difference between predicted results of each model and actual value

3.3.2不同采樣周期下的模型運行結果

傳感器數據采樣周期小會增加傳感器的耗電量,增加數據采集器及接收平臺的存儲空間,降低模型的運算速度。采樣周期增大又容易漏測溶解氧的變化,合理地設置采樣周期非常重要。

為確定傳感器最佳的采樣周期,模型構建完成后,將不同采樣周期數據集(5、10、15、20、30、40 min)分別進行模型訓練,結果如圖7所示。

3.4 性能分析

3.4.1多種模型性能對比

將5種模型的預測值與真實值進行誤差對比分析,結果如表6所示。從表6可以看出,BiLSTM-GRU模型的表現最優,MAE和RMSE分別為0.275 9、0.616 0 mg/L,相較于LSTM模型提高25.14%和13.25%,相較于GRU模型提高13.02%和6.76%。在引入雙向神經網絡對傳統的兩種循環神經網絡優化后,模型性能有所提升,但相較于融合神經網絡模型在性能表現上稍顯不足,BiLSTM-GRU模型的MAE和RMSE相較于BiLSTM模型提高17.52%和9.90%,相較于BiGRU模型提高11.26%和8.08%。BiLSTM-GRU模型對數據的擬合效果(R2)達到0.954 7,對比另外4種模型依次提高2.22%、1.26%、1.70%和1.44%。因此,BiLSTM-GRU融合神經網絡模型能夠更加充分挖掘到數據之間的隱藏信息,更為精準地預測了稻蝦養殖環境溶解氧含量,為后續低溶解氧含量的預測預警提供了更加可靠的依據。

表6 模型誤差對比Tab.6 Comparison of model performance

3.4.2不同采樣周期對預測的影響

將不同采樣周期下的數據集模型訓練結果分別進行誤差計算,并統計模型運行時間,得到模型運行時間和平均運行時間。根據一個傳感器在一次數據采集時的能耗(平均約為400 mA·s)計算4個傳感器在不同采樣周期下的傳感器總能耗。記錄不同采樣周期下的數據集和文件占用內存量、24 h傳感器采集次數和總能耗、模型運行時間和平均運行時間以及在預測60 min時的MAE、RMSE、R2誤差結果,采樣周期為40 min時,預測60 min時間點溶解氧濃度的誤差為預測40 min誤差和80 min誤差的平均值,得到不同采樣周期下的各項指標如表7所示。

表7 不同采樣周期下各項指標Tab.7 Various indicators in different sampling periods

從表7可以看出,傳感器的能耗以及數據集所占用內存量均隨著采樣周期的增加而減小,當達到一定程度時,能耗雖仍在減小,但幅度較小。同時當采樣周期為30 min時,模型在預測60 min這個公共點的誤差最小,并且模型平均運行時間最短。綜上所述,確定傳感器最佳采樣周期為30 min。

3.5 模型驗證

采集基地稻蝦田7—8月的水質數據并作為輸入數據集對模型的預測效果進行驗證,得到預測結果以及預測誤差如圖8和表8所示。

表8 實際生產中的預測誤差Tab.8 Prediction error in actual production

圖8 實際生產中的預測結果Fig.8 Operation results in actual production

從圖8、表8中可以看出,模型在7—8月實際生產的溶解氧含量預測中,60 min的平均絕對值誤差為0.319 1 mg/L、均方根誤差為0.620 7 mg/L以及R2為0.924 1。綜合來看,模型在實際生產中得到驗證,其預測效果表現良好。

4 結論

(1)為保證預測的精準,對傳感器進行了清洗校準,根據偏移量對傳感器進行了標定,并對歷史數據進行了修正,以減小傳感器漂移出現的測量偏差。 對不同采樣周期下的模型性能與資源消耗綜合分析,確定傳感器最優采樣周期為30 min。

(2)通過皮爾遜相關系數分析確定影響溶解氧含量變化最大的水質參數pH值一同作為輸入數據集對模型進行訓練。采用循環神經網絡模型(LSTM和GRU),在保證模型提取更多的特征因子以達到更加精準的預測同時,減少模型運行時間,大大提高模型性能。

(3)通過與4種傳統循環神經網絡模型對比表明,在最優傳感器采樣周期下,對于校準后的數據,融合神經網絡模型的預測效果更好,其MAE、RMSE、R2分別為0.275 9 mg/L、0.616 0 mg/L和0.954 7,比傳統的LSTM神經網絡模型分別提高25.14%、13.25%和2.22%。

猜你喜歡
稻蝦溶解氧神經網絡
淺析水中溶解氧的測定
神經網絡抑制無線通信干擾探究
2019年第一季稻蝦行情報告新鮮出爐,致敬奮戰在一線的廣大蝦農們
發展稻蝦產業,重振魚米之鄉
污水活性污泥處理過程的溶解氧增益調度控制
城市河道洲灘對水流溶解氧分布的影響
南縣稻蝦產業富民強縣
稻蝦共生高效種養關鍵技術
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合