?

一種基于氣象數據的倉儲糧堆表層溫度預測方法

2020-05-24 06:37段珊珊楊衛東
中國糧油學報 2020年2期
關鍵詞:糧堆平均溫度表層

段珊珊 楊衛東,2 肖 樂 張 元,2

(河南工業大學信息科學與工程學院1,鄭州 450001)(河南工業大學糧食信息處理與控制教育部重點實驗室2,鄭州 450001)

隨著人口和社會流動性的增加,到2050年對糧食的需求將翻一番[1]。全球每年收獲的糧食超過20億t[2]。占全球糧食總產量三分之一的糧食損失于收獲后儲藏管理不善。對糧食水分含量,溫度和害蟲感染缺乏控制是造成這種損失的三個重要因素。糧食的高水分和高糧溫為霉菌生長和儲量害蟲提供了有利條件,而儲糧害蟲和微生物是造成糧堆發熱點的重要因素,糧堆中發熱點的不斷發展,會導致發熱點內糧食的損壞[3]。智能倉儲工作的主要目的是提高糧食儲存能力,如有效控制儲存溫度和水分等。糧食籽粒在儲藏過程中,其生命活動從未停止,仍為活的有機體,它受自身呼吸作用和外界溫度、濕度、氣體成分等環境因子的影響,這些內外因素與糧食安全儲存密切相關。儲糧生態系統中一些生物因素和非生物因素的相互作用會引起糧食變質,但隨著儲糧技術的發展,人類已經能夠對該系統實現有效控制。通過控制環境條件,使糧食儲藏生態系統處于非生態學穩定狀態,是糧食安全儲藏的根本[4-8]。糧食的安全儲存可以通過控制兩個重要的物理因素來實現:溫度和水分含量[2]。楊衛東等[9]提出了一種經濟無損的基于CSI的糧食水分檢測,能有效的檢測糧食的水分范圍,為糧食水分無損檢測提供了新的方法。糧食溫度是糧食狀態的重要指標,其檢測和控制技術是糧情測控的主要技術之一。在糧情檢測系統中,儲糧溫度的檢測是一項比較成熟的技術,已在國家儲備中得到廣泛應用[10]。研究者對于糧情測控的研究都期望通過技術手段預測糧堆在未來儲藏周期中的狀態,以便對糧食儲藏提前做出合理有效的保管方式,減少儲糧損失。尹君[11]采用多場耦合理論構建了小麥糧堆溫度場、濕度場、微氣流場多場耦合數學模型,模擬預測糧堆結露變化過程,為儲糧安全提供了理論基礎。在糧食儲藏過程中,糧堆發生蟲害的主要部位集中在糧堆表層(即糧面以下30~50 cm)等糧溫變化活躍區域[12]。儲藏糧堆溫度隨四季的變化而變化,和外界氣象變化有著密切的聯系,為充分了解高大平房倉儲糧溫度隨氣象的變化規律,提高存儲參數估計的精度,本研究利用國家氣象信息中心(National Meteorological Information Center: NMIC)天氣預報數據,結合機器學習相關算法對糧堆表層平均溫度進行了研究,為智能倉儲提供了參考。

研究中嘗試利用歷史NMIC數據結合機器學習算法開發預測模型,并將它們與來自傳感器的溫度數據相關聯。用歷史訓練數據和傳感器溫度數據推導準確的訓練模型,本研究的預測模型可以使用特定區域的NMIC數據來預測未來的糧堆表面平均溫度。同時,因為本研究根據特定的糧倉歷史溫度數據生成模型,它們固有地結合了地理特征對每個地點的氣象因素的影響,由于當地氣象因素影響糧堆的溫度和濕度,單個糧倉必須根據特定地點調整參數建立預測模型。本研究的目標是自動生成智能溫度預測模型,一個小范圍區域的所有同類型同儲藏品種的糧倉都可以使用這些預測模型預測糧溫,從而提前進行人工干預保障儲糧環境安全。氣象數據和糧食溫度數據收集后,數據處理模塊包括數據預處理,線性回歸預測和不同核函數的支持向量機(SVM)預測。對于數據預處理,本研究采用離群檢測,數據歸一化和噪聲消除來獲得校準的氣象數據和儲藏糧堆溫度數據。

1 儲藏糧堆溫度檢測系統

本研究討論的糧倉為昆明市西山區儲備小麥的高大平房倉。糧堆內布置傳感器的原則為由東向西分為10行,由南向北分為5個區,由糧堆上層到底部分為4層,在一個層面上,溫度傳感器縱向和橫向間距不大于5 m,層間垂直距離不大于2 m,在糧堆中共布置了200個溫度傳感器。圖1顯示了糧倉的縱向截面圖。

圖1 糧倉縱向截面圖

溫度監測系統通常包括溫度傳感器,溫度測量電纜和計算機監控終端。每條線代表一根電纜,每根電纜上放置四個溫度傳感器。圖2是糧情測控系統結構圖。

計算機發送檢測命令到分機,接收分機的檢測數據,進行數據分析等處理。分機接收計算機命令,檢測溫濕度數據,結果傳送到計算機。溫度傳感器采用一線總線通信協議,封裝在電纜內部,敷設在糧堆內部。糧溫記錄時間為每日上午9—10時,溫度采樣頻率為每日1次。

圖2 糧情測控系統結構圖

2 數據收集和分析

本研究收集了云南省昆明市西山區高大平房倉小麥糧堆423 d的糧食溫度數據。數據收集的時間起點為2017年1月1日,然后從中國氣象數據網獲得對應地區和對應時間點的氣象數據。氣象因素包括氣壓,氣溫,相對濕度,降水量,蒸發量,風速,日照時間和0 cm地溫。數據采集過程中,由于傳感器故障等問題導致出現異常值,且各因素數據量級不統一,必須對數據進行預處理。數據預處理模塊包括異常值處理和數據標準化。

2.1 異常值處理

傳感器通常會記錄一些異常值。在數據處理中,異常點的出現會使得函數的梯度出現奇異梯度,這就導致算法的終止,從而影響研究變量之間的函數關系。為了有效的避免這些異常點造成的損失,本研究采用Pauta準則方法和線性趨勢點法來檢測和去除異常值,詳細過程如下。

步驟1:令Xi,i=1,2,…,n,為第i個檢測數據值,計算某特征的樣本均值為

(1)

步驟2:然后計算樣本的殘差ei和樣本標準差σ

(2)

(3)

步驟4:重復步驟1~步驟3,直到遍歷所有值。

2.2 數據標準化

在氣象因素多指標評價體系中,由于各因素具有不同的量綱和數量級,如果直接用元數據對糧堆表層溫度進行預測,就會突出數值較高的指標在綜合分析中的作用,相對削弱數值水平較低指標的作用。因此,為了保證預測結果的準確性,對數據進行標準化處理。

本研究使用 Z標準化,標準化過程如式(4):

(4)

圖3顯示糧堆表層溫度隨氣溫的變化規律??梢钥闯黾Z堆表層溫度和氣溫的變化趨勢一致,但隨氣溫變化有一定的延遲,氣溫的最大值是在6月,而糧堆表層平均溫度的最大值在9月。其原因是糧食籽粒本身的不良導熱性以及儲糧糧倉倉壁具有較好的隔熱性能。

然后,分析糧堆表層平均溫度如何隨氣象因素變化以及這些氣象因素之間的相互作用。數據分析的目的是為了直觀了解糧堆表層溫度是如何依賴多種氣象組合指標變化的,而不是從單一氣象指標去預測。從多個天氣指標預測糧堆表層溫度,以期在研究中使用機器學習方法探索其復雜性,自動生成預測模型。

圖3 溫度隨時間變化趨勢

圖4顯示了不同的氣象因素對糧堆表層溫度的影響,可以看出糧堆表層平均溫度和氣象因素中的氣溫,0 cm地溫,相對濕度呈現較強的正相關關系,分析發現糧堆表層平均溫度和其他因素相關性較弱。圖5顯示了不同氣象因素之間的相互影響,可以看出,氣溫與0 cm地溫呈現較強的正相關性,氣溫和相對濕度、日照時間和相對濕度呈現一定的負相關性。

圖4 不同氣象因素對糧堆表層均溫的影響

圖5 氣象因素之間的相互關系

3 預測模型

把獲取的糧堆表層溫度均值及氣象數據作為隨季節變化的時間序列,通過分析建立時間序列預測模型[13]。模型中探索氣象8個因素和糧堆表層平均溫度之間的函數關系,表示為糧堆表層平均溫度=F(氣壓、氣溫、相對濕度、降水量、蒸發量、風速、日照時間、0 cm地面溫度),F是使用不同回歸方法確定的函數。文中保留每個變量指標的單位:氣壓單位為hPa,氣溫單位為℃,相對濕度百分比介于0%~100%之間,降水量單位為mm,蒸發量單位為mm,風速單位為m/s,日照時間單位為h,0 cm的地溫單位為℃。建立預測模型之前,將所有數據標準化。

3.1 線性最小二乘預測模型

最小二乘是在歐氏距離為誤差度量的情況下,由系數矩陣所張成的向量空間內對于觀測向量的最佳逼近點,擬合函數是光滑函數,因此首先應用線性最小二乘回歸方法來預測糧堆表層溫度,最小二乘回歸使通過氣象因素預測的糧堆表層溫度均值與真實值之間的平方差總和最小[14]。用最小二乘法進行曲線擬合,得到的擬合函數為

糧堆表層平均溫度=0.29氣壓 +1.09氣溫+0.41相對濕度+0.01降水量+0.02日照時間-0.02蒸發量-0.04風速-0.56地溫

把時間序列數據的任意80%作為訓練集,20%作為測試集,預測結果如圖6a所示。在線性最小二乘預測模型中,由于不同氣象因素對糧堆表層均溫的影響程度不同,不同氣象表現出不同的權重,預測結果與圖4相一致,氣溫、0 cm地溫、相對濕度的系數較大,系數較小的氣象因素對糧堆表層均溫的影響程度也較小。

3.2 支持向量預測模型

由圖5可以看出不同氣象因素之間也有相互影響,考慮綜合所有因素的復雜性,一些樣本不能在二維空間中線性劃分,考慮將樣本映射到高維空間,可以實現更好的可分離性表現[15]。SVM回歸的準確性取決于適當的核函數和參數的選擇。本研究采用支持向量機中的線性核函數,多項式核函數和高斯徑向基函數(RBF)核函數,將數據從輸入空間轉換為高維數據特征空間來預測糧堆表層平均溫度[16-20]。這里選擇SVM而非其他監督學習方法是由于其能夠解決小樣本下機器學習的問題及泛化能力較強的優點。對于線性核,特征空間到輸入空間的維度是一樣的,其參數少且速度快。把收集到的423 d的氣象數據及糧堆表層平均溫度做數據樣本,每一天的糧堆表層平均溫度對應同一天的氣象8個因素,隨機選取80%的樣本做訓練集,20%的樣本做測試集,不同核函數的預測結果如圖6b所示。由于糧食儲藏過程中的通風及翻倉作業,收集到一個周期內的樣本量有限,且特征維數較少,多項式核函數可以實現將低維的輸入空間映射到高維的特征空間,相應的計算復雜度也會增加。用多項式核函數得到的對糧堆表層均溫的預測結果如圖6c所示。高斯徑向基核函數是一種局部性強的核函數,其可以將一個樣本映射到一個更高維的空間內,該核函數是應用最廣的一個,無論大樣本還是小樣本都有較好的性能,而且相對于多項式核函數參數要少,利用高斯徑向基核函數對糧堆表層平均溫度進行預測的結果如圖6d所示。

圖6 線性預測及SVM不同核函數預測結果

圖7 線性預測及SVM不同核函數預測結果的均方根誤差

為了定量分析不同核函數所對應模型的有效性,用均方根誤差作為評價指標,均方根誤差是用來衡量觀測值同真值之間的偏差,它對一組測量中的特大或特小誤差反映非常敏感,所以,標準誤差能夠很好地反映出測量的精密度,因此本研究中選用均方根誤差作為評價指標,結果如圖7所示。線性最小二乘預測的均方根誤差與SVM中線性核函數預測的均方根誤差相近,分別為5.243和5.249,SVM中多項式核函數預測和RBF核函數預測的均方根誤差分別為4.69和4.45。由此可知氣象因素與糧堆表層平均溫度之間并非簡單的線性關系,而是綜合多因素的復雜預測問題,由于高斯徑向基核函數相對較好的性能,其預測結果也最優。

4 結論

由于不同區域糧倉結構及儲糧品種差異及氣象因素的小范圍區域性差異,對不同地區的儲藏糧堆表層溫度預測將采用不同參數的同一預測模型,在對多區域糧堆溫度預測的基礎上,提高預測模型的魯棒性和廣泛適用性。在本研究中,結合云南省昆明市西山區氣象多種因素,利用線性最小二乘法及SVM不同核函數機器學習方法來預測該地區高大平房倉儲藏糧堆表層的平均溫度。糧堆表層平均溫度隨氣溫的變化而變化,但由于糧食籽粒的不良導熱性及糧倉墻壁的隔熱性能,糧堆表層平均溫度隨氣溫變化有一定的延遲。氣象8個因素中的氣溫、0 cm地溫、相對濕度與糧堆表層平均溫度具有較強的相關性,結合氣象多種因素利用機器學習不同方法對糧堆表層平均溫度的預測結果中,SVM高斯徑向基核函數的預測性能最強,均方根誤差最小,證明了基于氣象數據的倉儲糧堆表層平均溫度預測模型與方法的有效性,利用這種預測方法,能夠及時發現糧倉中溫度的變化趨勢,從而及時進行人工干預。

猜你喜歡
糧堆平均溫度表層
關于規范中最低日平均溫度定義的探討與建議
蘭州地區區域加權平均溫度模型構建方法研究
南方地區圓拱形和鋸齒形大棚內溫度四季差別探究*
半潛式平臺表層卡套管處理與認識
路基基床表層級配碎石施工技術
基于數字圖像技術的糧堆壓力與孔隙率關系研究
水體表層沉積物對磷的吸收及釋放研究進展
基于COMSOL的靜態倉儲稻谷糧堆溫度場模擬研究
儲料豎向壓力對糧倉中小麥糧堆濕熱傳遞的影響
儲糧壓力對玉米糧堆溫度場影響的實驗與模擬研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合