?

幾種分離方法在區域經濟作物產量預測上的適用性分析:以吳中區枇杷為例*

2023-10-20 06:28陶正達趙靜嫻顧荊奕鄭俊華湯小紅陳洪良楊大強
中國農業氣象 2023年10期
關鍵詞:吳中區氣候因子單產

陶正達,趙靜嫻,顧荊奕,鄭俊華,王 俊,湯小紅,陳洪良,楊大強

幾種分離方法在區域經濟作物產量預測上的適用性分析:以吳中區枇杷為例*

陶正達1,趙靜嫻1**,顧荊奕1,鄭俊華2,王 俊1,湯小紅1,陳洪良1,楊大強3

(1.蘇州市吳中區氣象局,蘇州 215128;2.蘇州市吳中區東山多種經營服務公司,蘇州 215107;3.蘇州市吳中區東山鎮農林服務站,蘇州 215107)

以吳中區枇杷為研究對象,對比分析ARIMA模型、GM模型、線性趨勢和二次指數平滑法在區域性經濟作物上氣象產量分離的適用性,并對在這四種方法的基礎上所構建的基于氣候因子的產量預測模型預測準確度進行分析。結果表明,(1)使用GM和線性趨勢方法分離的枇杷氣象產量的正負性與農業氣象災害年鑒匹配較好。(2)四種方法分離的枇杷氣象產量與9個氣候因子間復相關程度均達到極相關,復相關系數分別為ARIMA方法0.95,線性趨勢和GM方法0.94,二次指數平滑方法0.93。(3)使用GM方法預測的枇杷趨勢單產均方根誤差和絕對百分比誤差最大,在考慮了氣候因子后,均方根誤差降低百分率達到50.1%,其余三種方法中線性趨勢法降低49.3%,ARIMA模型降低6.7%,二次指數平滑降低14.4%。(4)四種方法所構建的基于氣候因子的產量預測模型預測結果,使用GM方法的RMSE和MAPE分別為3.0kg·hm?2和15.2%,線性趨勢方法次之,ARIMA方法最差。整體來看,GM(1,1)和線性趨勢方法分離的枇杷氣象產量與氣象災害記錄更匹配,使用GM方法構建的基于氣候因子的產量預測模型效果最好,表明GM模型更適用于區域性經濟作物的產量分離和預測。

產量預測;產量分離;ARIMA模型;灰色模型;二次指數平滑;枇杷

種植具有地方特色的經濟作物在建設宜居宜業和美麗鄉村中發揮了重要作用,提高區域性經濟作物產量、品質和知名度可以有效帶動農村第三產業的發展[1?2]。蘇州市吳中區是全國枇杷傳統四大產區之一,在宋代已有文字記載[3?4]。近年來,隨著人民生活水平的提高和電商物流的快速發展,素有“果中之皇”之稱的枇杷得到越來越多消費者的喜愛,吳中區枇杷的種植面積和產值逐年增加[5]。2021年吳中區枇杷種植面積超過2660hm2,產值突破6億元,枇杷產業成為吳中區農業經濟的重要組成部分。對吳中區枇杷這種區域性經濟作物的產量進行準確的預測不僅關系到當地果農收入,還對地區農業經濟及相關產業的發展具有重要意義[6?7]。

枇杷等區域性經濟作物的產量易受氣候條件等自然因子以及生產力水平等非自然因子影響,產量的年際變化具有很強的波動性,因此,在經驗統計學的產量預測模型中,考慮氣溫、積溫、降水和日照等氣象觀測資料與作物產量的關系進而構建的基于氣候因子的產量預測模型最為合適[8?9]。唐余學等[10?11]利用5a滑動平均方法分別分離中稻和早稻的氣象產量,進而構建的預測模型準確率分別達到了90%和80%以上;顧雅文等[12]利用二次多項式的方法擬合蘋果的氣象產量,構建的預測模型在3a產量預測結果中準確率達到94.5%。由于氣象產量分離方法在預測模型中的重要作用,國內外很多學者對不同的產量分離方法應用效果進行了對比分析,袁小康等[13]利用33a的油菜單產數據,對比了HP濾波法、Logistic函數擬合法、5a滑動平均法和線性趨勢法所分離的氣象產量的合理性,結果表明HP濾波法和5a滑動平均法的效果最為準確,相關系數皆為0.92;何虹等[14]對比了5a滑動平均法、二次指數平滑法和五點二次平滑法應用于寧夏玉米的氣象產量分離,結果表明五點二次平滑法分離的氣象產量更能合理反映氣候因子;Li等[15]對比了二次指數平滑、HP濾波等6種方法應用于分離稻米氣象產量的效果,結果表明5點二次平滑和3a移動平均方法分離效果最為合適,與氣候因子匹配性較好。由此可見,不同的產量分離方法在不同作物上表現也不同,此外,鮮有研究對不同產量分離方法所構建的產量預測模型的預測效果進行對比分析。因此,本研究使用2003?2018年吳中區枇杷單產數據和對應時段的氣象數據,對比使用自回歸積分滑動平均模型(ARIMA)、灰色預測模型(GM)、線性擬合方法和二次指數平滑方法分離的枇杷氣象產量的合理性,其中ARIMA模型綜合考慮了目標數據的趨勢、周期及隨機干擾等因素,具有實用性強、精度高的優點[16?17];GM模型可將具有隨機性的原始數據轉換為具有規律性的數據,從而弱化不確定性,具有所需數據樣本量少,計算簡單等優點[18?19]。最后再利用2019?2021年吳中區枇杷產量數據對不同產量分離方法所構建的產量預測模型的預測結果進行分析,為準確預測年際變化較大的區域性經濟作物產量提供技術支撐。

1 資料與方法

1.1 資料及其來源

吳中區地處長江三角洲太湖水網平原,屬亞熱帶季風海洋性氣候,四季分明,全年平均氣溫15.7℃,年平均降水量1088.5mm,無霜期240d,適宜的氣候條件有利于枇杷的生長發育[5,7]。吳中區枇杷種植歷史悠久,常年栽種面積在1.3萬hm2以上,且呈逐年攀升趨勢,其中2021年吳中區枇杷種植面積占比60%,產值占2021年上半年區農林牧漁業產值的30%,是吳中區支柱性農業產業。選取2003?2018年共16a的吳中區枇杷單產及與枇杷成熟年份生長期相對應的氣象資料,構建基于氣候因子的產量預測模型,并利用2019?2021年數據對模型的短期預測效果進行評價。

枇杷產量數據由吳中區農業農村局和吳中區東山鎮農林服務中心提供,氣象資料來自東山國家基本氣象觀測站(站號:58358),其中部分氣象災害數據來自吳中區第一次自然災害風險普查工作。氣象要素共14種,包括2002年6月?2021年5月的逐月平均氣溫、降雨日數、降水量、蒸發量、日照時數、最長連陰雨日數,以及逐年極端最高氣溫、最低氣溫、結冰日數、大風日數、雪日、積雪日數、寒潮過程日數和高溫日數,逐年數據由逐月數據計算得來。枇杷逐年遭受的氣象災害情況來源于《中國氣象災害年鑒》。

1.2 氣象產量分離和預測

基于氣候因子的產量預測模型首先需要將農業產量分離為氣象產量與趨勢產量,再通過數學方法對這兩種產量分別進行預測,兩種產量預測結果之和就是目標作物的農業產量預測值。其原理是由于農業產量受自然與非自然因子共同影響,其中非自然因子中生產力水平起主導作用,氣候條件則是自然因子中最不穩定的因素,因此,將作物產量(Y)分為以生產力水平為主導的趨勢產量(Ytrend)、以氣候條件為主導的氣象產量(Ymet)和隨機誤差(e)[20?21],即

式中,Y為枇杷產量,Ytrend為枇杷趨勢產量,Ymet為枇杷氣象產量,隨機誤差項可忽略不計,產量單位均為kg·hm?2。

由式(1)可知,對氣象產量模擬的準確度取決于對趨勢產量的模擬是否準確,研究中使用線性趨勢、二次指數平滑、灰色模型(GM)和自回歸積分滑動平均模型(ARIMA)四種方法對吳中區枇杷的趨勢單產分別進行擬合。

基于氣候因子的產量預測模型建立首先需要挑選合適的氣候因子。通過對14種氣象要素與氣象產量之間進行相關分析來挑選適合用于構建模型的氣候因子,再根據方差膨脹因子(Variance Inflation? Factor, VIF)方法來剔除存在共線性的氣候因子[22],最后利用氣象產量與篩選后的氣候因子,使用多元線性回歸的方法構建氣象產量預測模型[23?24],即

式中,n為氣候因子個數,xi為氣候因子,ai為相應的回歸系數,e為回歸方程的殘差。

1.3 趨勢產量模擬的四種方法

1.3.1 方法一: ARIMA模型

1.3.1.1 模型介紹

ARIMA模型全稱為自回歸積分滑動平均模型(Auto Regressive Integrated Moving Average Model),該模型是將時間序列平穩處理后對時間序列因變量的滯后值和誤差進行回歸所建立的[25]。ARIMA(p,d,q)模型可表達為

式中,yt為預測值,μ為常數項,γi為i階自相關系數,εt為偏差,θi為誤差項系數。

Note: ACF is sort of autocorrelation function,PACF is sort of partial autocorrelation function. The same as below.

計算不同參數組合下的貝葉斯信息準則BIC(Bayesian Information Criterion)判斷模型是否最優,選取使BIC值最小的p、q值作為模型參數[27]。BIC計算式為

式中,K為模型參數個數,n為樣本數量,L為模型的極大似然函數。

1.3.1.2 模型參數確定

(1)參數d值確定。利用差分法對2003?2018年吳中區枇杷單產數據進行平穩化處理。由圖1可知,與原序列相比,經過一階差分處理后枇杷產量的時間序列呈現圍繞零值上下均勻分布的特點,用單位根檢驗方法對一階差分后的時間序列是否平穩進行驗證,結果表明一階差分后的時間序列單位根檢驗P值的顯著性水平為0.000,呈極顯著性,拒絕原假設,說明一階差分后的吳中區枇杷單產時間序列穩定,因此,ARIMA(p,d,q)模型中d取值為1。

圖1 2003?2018年枇杷單產原始序列及其一階差分序列

注:枇杷成熟年份對應的氣象要素時間為上一年6月?當年5月,圖中年份為枇杷成熟的年份。下同。

Note: The time period of meteorological data corresponding to the ripening year of loquat refers to last June to May that year. The year in the figure is the ripening year of the loquat. The same as below.

(2)參數p和q值確定。對一階差分后的吳中區枇杷單產時間序列進行自相關(ACF)和偏自相關分析(PACF),結果表明自相關及偏自相關系數皆呈現明顯拖尾的分布形式(圖2),因此,模型中的p和q值都不為0。

利用貝葉斯信息準則(BIC)對ARIMA模型中的參數p和q進行最優分析,結果見表2。由表可以看出,當p、q取值皆為1時BIC值最小,因此使用ARIMA(1,1,1)模型進行模擬。

1.3.2 方法二:灰色模型

灰色模型(GM, Grey Model)是通過少量的、不完全的已知信息建立數學模型進行預測的方法,適用于處理小樣本預測問題[18?19]。研究中選擇使用該體系的基礎模型GM(1,1),主要是由于GM(2,1)模型更適用于具有指數變化規律數據[28],而吳中區枇杷單產的時間序列并未表現這一特征(圖1),具體算法為:

圖2 一階差分后的枇杷單產序列自相關系數(ACF)和偏自相關系數(PACF)

表2 p和q不同取值時ARIMA(p,1,q)模型的貝葉斯信息準則值

(1)構建原始數據序列

式中,X0為枇杷單產原始數據時間序列。

(2)構建1次累加序列

(3)構建灰色模型

定義X1的導數為

定義由X1臨值生成的數據序列為

由此定義GM(1,1)的微分方程為

由此可得矩陣

(4)預測值x0(t)

1.3.3 方法三:線性回歸模型

線性趨勢法(LT,Linear Trend)也叫線性回歸法,該方法假定樣本時間序列與其對應的時序值具有線性關系,進而構建一元線性回歸方程,即

式中,i=1,2,…,16,xi為第i期的枇杷單產,ti為對應的年份,a為回歸系數,b為回歸常數,e為偏差,由回歸分析的方法求解參數a、b,即可獲得枇杷單產的線性預測方程。

1.3.4 方法四:二次指數平滑模型

指數平滑法是在移動平均法基礎上發展起來的,它具有移動平均法的優點,同時還考慮了不同時期的數據所起的不同作用,相比于一次指數平滑,二次指數平滑(QES, Quadratic Exponential Smoothing)具有更強的適應性和穩定性。因此,選取二次指數平滑法對枇杷趨勢產量進行擬合,具體步驟為

(1)構建一次指數平滑時間序列。

(2)對一次指數平滑進行遞歸。

式中,Dt為二次平滑序列。

(3)對目標進行預測。

式中,T為t期到預測期的間隔數,參數a、b的計算式為

(4)對二次指數進行平滑運算。

由于二次指數平滑方法計算的準確性依賴于初始值的合理估計,因此,研究中使用一種以所有歷史數據加權平均,且權重呈等比變化的平滑初值計算公式[29],算法為

式中,n為樣本量的大小,取值為16。

在進行二次指數平滑運算時,為了使計算結果更加準確、合理,平滑系數α的取值并不是主觀賦值,而是根據樣本量的大小確定的,本研究樣本量為16,故α取值為0.3[29]。

1.4 實驗步驟與評價方法

1.4.1 實驗步驟

第一步,氣象產量獲取。利用2003?2018年吳中區枇杷單產數據使用ARIMA(1,1,1)、GM(1,1)、線性趨勢和二次指數平滑方法分別進行擬合,得到相應的擬合方程及擬合值,形成趨勢產量序列;利用實際產量減去趨勢產量,分離得到2003?2018年枇杷氣象產量序列。

第二步,氣候因子篩選。分析四種分離方法得到的2003?2018年枇杷氣象產量與同期吳中區逐月和逐年氣象要素間的相關性,篩選出與氣象產量相關性較大的氣候因子并利用方差膨脹因子方法來剔除存在共線性的。

第三步,模型構建。利用多元線性回歸方法構建枇杷氣象產量擬合與預測方程,再利用氣象產量與趨勢產量相加即可對枇杷產量進行擬合與預測,預測時效為3a即2019?2021年。

第四步,結果分析。對四種方法的合理性和有效性進行對比分析,具體方法見1.4.2節。

1.4.2 評價方法

首先是趨勢產量與氣象產量的合理性分析,將四種方法擬合的枇杷趨勢產量與實際產量進行對比分析,由于趨勢產量主要受生產力水平影響[20?21],而近年來隨著吳中區枇杷產業的快速發展,生產力水平逐年提高,因此合理的趨勢單產應呈現出增加的趨勢;將分離的枇杷氣象產量正負性與《中國氣象災害年鑒》記錄情況對比,正的氣象產量表明當年氣候條件較好,適宜枇杷生長,而負的氣象產量表明當年氣候條件較差,枇杷遭受了氣象災害。此外,在篩選氣候因子時,對氣象產量與氣候因子間的相關性分析也可以反映出氣象產量的合理性。

其次是對四種方法的有效性進行評價,也就是對所構建的基于氣候因子的產量模型的預測效果進行評價,包括均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)[30?31]兩個指標。

最后使用引入氣象產量前后枇杷產量預測結果的均方根誤差降低率(IRRMSE)來評價四種方法的有效性[32],均方根誤差改進率的大小反映了氣象產量對趨勢產量訂正效果的好壞,同時也反映了四種方法有效性的高低。

1.5 數據處理

ARIMA模型及多元線性回歸方程使用SPSS軟件實現,灰色模型使用MATLAB編程實現,線性回歸方程及二次指數平滑模型由Excel進行擬合。

2 結果與分析

2.1 四種方法擬合的枇杷趨勢產量和氣象產量合理性分析

2.1.1 趨勢產量

按照1.3節所述方法計算后獲得的四種趨勢產量擬合與預測方程為

由圖3可見,從枇杷實際單產的變化趨勢來看,2003?2018年吳中區枇杷單產呈現先減少后波動上升的趨勢且波動幅度較大,表明枇杷這種地方性經濟作物的單產易受地方經濟、地方政策和氣候條件等因素共同影響,具有明顯的脆弱性。四種方法擬合的枇杷趨勢單產中GM(1,1)與線性趨勢方法的擬合結果都呈現遞增的趨勢(圖3b、圖3c),這與生產實際情況相符,科技和果園管理水平的進步,枇杷品種的不斷改良與適應,電商、物流的快速發展以及社會生產力水平的穩步提高,導致吳中區枇杷的趨勢產量也隨時間穩步提高。另一方面,這兩種方法的擬合結果也呈現一定的差異性,GM(1,1)擬合的趨勢單產并不是線性的,與實際單產的相關性也較線性趨勢方法更高,Pearson相關系數分別為0.22和0.13。ARIMA(1,1,1)擬合的趨勢產量除2004年外,其余年份呈現先減后增的變化趨勢,與實際單產的Pearson相關系數為0.38。2004年的趨勢單產不符合整體變化趨勢的原因是ARIMA(1,1,1)擬合枇杷趨勢產量的時間序列存在一定的滯后性,這與該模型考慮了一階的移動平均有關,是計算方法導致的,而2010年后吳中區枇杷單產呈增加趨勢與地方政府的大力支持有關。據統計,1986?2006年蘇州市枇杷種植面積的年平均增長速率不到15hm2·a?1,2007?2015年的年增長率超過210hm2·a?1,增長率擴大了十倍,表明自2007年開始蘇州市枇杷種植業得到了快速的發展,而枇杷種植后3~5a之后才會結果,因此從這個角度來看,ARIMA(1,1,1)模型擬合的吳中區枇杷趨勢產量在2010年之后呈增加趨勢是合理的。二次指數平滑方法擬合的趨勢產量與實際產量變化趨勢最為相似,兩者的Pearson相關系數達到了0.86,達到顯著相關水平。擬合的趨勢產量呈現與實際產量基本一致的波動性,但整體上符合先減后增的變化趨勢。

圖3 四種方法擬合枇杷趨勢產量對比

總體來看,四種趨勢單產擬合方法中二次指數平滑方法的結果與實際單產最為接近,ARIMA(1,1,1)次之,線性趨勢方法表現最差。但趨勢產量是用來表征受果園管理水平、農業生產水平和地方政府支持力度等非自然因子而影響的那部分產量,因此,哪種方法擬合的趨勢單產更合理,還需要對據此分離的氣象產量以及最終構建的預測模型的預測效果進行進一步分析。

2.1.2 氣象產量

使用枇杷實際單產分別減去四種方法擬合的枇杷趨勢單產獲得枇杷氣象產量,由于ARIMA(1,1,1)和GM(1,1)無法對時間序列的初始值進行準確估計,因此這兩種方法獲取的枇杷趨勢單產時間序列缺少2003年,為了使其具有可比性,在分析和構建模型時均使用2004?2018年數據。從圖4可以看,四種枇杷氣象產量時間序列整體表現較為一致的波動性且時正時負(正為增產,負為減產),這符合氣象產量是表示受氣象條件影響的那部分產量的定義。但在個別年份,四種氣象產量表現正負相反的情況,例如2005年和2006年使用ARIMA(1,1,1)和二次指數平滑方法分離的枇杷氣象產量為負值,而使用GM和線性趨勢兩個方法則表現為正值,因此哪種方法分離的氣象產量更合理,需要進一步分析。對四種方法分離的枇杷氣象產量正負性不一致年份2005年、2006年、2013年的氣象災害進行分析,結果顯示,2005年成熟的枇杷遭遇了秋季干旱,其中10月總降水量僅為0.8mm,應為減產年;2006年成熟的枇杷遭遇了花期連陰雨,花期總雨日達到37d,最長連陰雨日數達到8d,應為減產年;2013年成熟的枇杷整體氣象條件較為適宜,應為增產年。四種方法分離的枇杷氣象產量符合以上條件的為GM(1,1)和線性趨勢兩種方法,因此這兩種方法分離的氣象產量更合理。

圖4 四種方法分離的枇杷氣象產量對比

2.2 基于氣候因子的產量預測模型構建

2.2.1 模型中氣候因子篩選

基于氣候因子的產量預測模型中包含預測趨勢產量和氣象產量兩部分,趨勢產量的預測方程已在2.1.1節中給出,氣象產量預測方程的構建是利用氣候因子與氣象產量之間的強相關性,使用多元線性回歸的方法來構建的,因此篩選合適的氣候因子就顯得尤為重要。首先利用逐年的氣候因子,包括總雨日、平均氣溫、總降水量、總蒸發量、總日照時數、高溫日數、極端最高氣溫、最長連陰雨日數、大風日數、降雪日數、積雪日數、≤?3℃日數、≤?3℃極端最低氣溫和≤?3℃冷積溫共14個氣象要素序列,分別與四種方法分離的枇杷氣象產量進行相關性分析,結果見圖5。由圖中可見,除大風日數外,其余13個氣候因子與四種方法分離的氣象產量的相關性皆呈現相同的正負性,表明同一種氣候因子對氣象產量的影響具有同質性,即同時表現為增產或減產。但14個因子中僅逐年總蒸發量、逐年高溫日數和逐年極端最高氣溫三個因子與四種氣象產量的相關系數通過了0.05水平的顯著性檢驗。

三個氣候因子無法完全解釋枇杷氣象產量,為提高預測模型的準確度,對未通過顯著性分析的氣候因子分別進行討論。因未有研究表明降雪量或積雪會導致枇杷減產,且吳中區種植的枇杷未遭受過明顯的大風災害,故逐年降雪日數、積雪日數和大風日數這三個氣候因子可直接剔除。對逐月氣象資料與枇杷氣象產量的相關性分析表明,氣象產量與7月、11月、12月和1月的雨日相關系數較大(表3),其中11月?翌年1月正處于枇杷的花期[25],因此嘗試使用枇杷花期的總雨日作為新的氣候因子。而7月雨日與枇杷氣象單產負相關表明梅雨季過多的降水會導致枇杷遭受澇漬災害,但由于相關性較低,不適合作為單獨的一個氣候因子。另外,逐月平均氣溫中相關系數較大的為7月和8月平均氣溫,且都通過了顯著性檢驗,該時段恰好為枇杷的夏梢期[7],因此選擇使用夏梢期平均氣溫作為新的氣候因子。通過相同方法相繼確立夏梢期降水量、10月降水量、夏梢期總日照時數和花期最長連陰雨四個氣候因子。

注:*、** 表示相關系數分別通過0.05、0.01水平的顯著性檢驗。下同。序號1?14分別代表總雨日、平均氣溫、總降水量、總蒸發量、總日照時數、高溫日數、極端最高氣溫、最長連陰雨日數、大風日數、降雪日數、積雪日數、≤?3℃日數、≤?3℃極端最低氣溫和≤?3℃冷積溫。

Note: * is P<0.05,** is P<0.01. The same as below. No. 1-14 represents annual rainy days, annual average temperature, annual precipitation, annual evaporation, annual sunshine hours, annual high temperature days, annual maximum temperature, annual longest persistent rainy days, annual gale days, annual snow days, annual snow cover days, annual days of the minimum temperature less than -3℃, accumulated the extreme minimum temperature less than -3℃ and accumulated the minimum temperature less than -3℃(cold accumulated temperature), respectively.

表3 逐月的氣象要素與四種方法分離出的氣象產量間的相關系數(以雨日和平均氣溫為例)

由圖6可見,整體來看,篩選的9個氣候因子即花期總雨日、夏梢期平均氣溫、夏梢期降水量、10月降水量、夏梢期總日照時數、花期最長連陰雨日數、年總蒸發量、年高溫日數和年極端最高氣溫與枇杷氣象產量的相關程度皆達到了中等及以上,相關系數皆通過了0.05水平的顯著性檢驗。其中,達到極顯著相關的分別為ARIMA(1,1,1)分離的氣象產量與花期總雨日間(相關系數為?0.80),GM(1,1)、線性趨勢和二次指數平滑方法分離的枇杷氣象產量與高溫日數間(相關系數分別為0.86、0.87和0.84)。此外,四種方法分離的氣象產量與9個氣候因子間復相關程度都達到了極顯著水平,復相關系數從大到小依次為ARIMA(1,1,1)方法0.95,線性趨勢和GM(1,1)方法0.94,二次指數平滑方法0.93。表明這四種方法皆可用于枇杷的氣象產量分離,同時也反映枇杷對氣候條件的依賴性和敏感性。

2.2.2 基于氣候因子的產量預測模型建立

利用氣候因子與氣象產量來建立多元線性回歸方程,為避免構建的回歸模型存在多重共線性問題,研究中選擇方差膨脹因子(Variance Inflation Factor,VIF)方法剔除存在共線性的氣候因子。根據當10≤VIF<100時自變量存在較強的多重共線性,剔除了夏梢期平均氣溫和夏梢期總日照時數兩個氣候因子,其VIF值分別為28.2和11.6。所構建的預測方程如下:

據此,可根據產量等于趨勢產量與實際產量之和的原理,結合式(22)?式(25)獲得基于氣候因子的枇杷產量預測模型。

圖6 四種方法分離的氣象產量與篩選的9種氣候因子間的相關系數

注:氣候因子序號1?9分別代表花期總雨日、夏梢期平均氣溫、夏梢期降水量、10月降水量、夏梢期總日照時數、花期最長連陰雨日數、年總蒸發量、年高溫日數和年極端最高氣溫。

Note: No. 1?9 represents rainy days during the florescence, average temperature during the summer-shoot stage, precipitation during the summer-shoot stage, precipitation in October, sunshine hours during the summer-shoot stage, longest persistent rainy days during the florescence, annual evaporation, annual high temperature days, annual maximum temperature, respectively.

2.3 模型預測效果評價

由表4可以看,使用GM(1,1)方法進而構建的基于氣候因子的產量預測模型預測的枇杷單產與實際單產的均方根誤差和平均絕對百分比誤差最小,RMSE和MAPE分別為3.0kg·hm?2和15.2%,表明GM(1,1)方法來分離氣象產量進而構建的產量預測模型的預測效果最好,方法最有效,更適用于預測枇杷這種區域性經濟作物的產量。

表4 基于氣候因子的產量預測模型對2019?2021年枇杷產量預測效果評價

對比表5中枇杷趨勢單產的預測效果,四種方法預測的趨勢單產的均方根誤差和平均絕對百分比誤差比在表4中更大,也就是氣象產量對趨勢單產的訂正效果皆為正效果,表明了基于氣候因子的產量預測模型的有效性。其中使用GM(1,1)方法RMSE降低百分率最大,達到50.1%,表明該方法的改進效果最佳。此外,使用線性趨勢方法和GM(1,1)方法的均方根誤差降低百分率明顯較另外兩種方法更高,表明這兩種方法分離的枇杷氣象產量更合理,由于氣象產量是利用產量與趨勢產量的差計算出來的,因此這也說明了這兩種方法模擬的趨勢單產更合理。對比圖3可發現,這兩種方法模擬的趨勢單產時間序列具有線性或近線性遞增的變化特征,這一結果從側面反映了氣象條件是導致枇杷單產波動較大的主要原因。

表5 四種方法對2019?2021年枇杷趨勢產量預測效果評價

3 結論與討論

3.1 結論

(1)從ARIMA、GM、線性趨勢和二次指數平滑四種產量分離方法擬合的枇杷趨勢單產與實際單產的相關性來看,使用二次指數平滑方法的Pearson相關系數最大,為0.86,ARIMA(1,1,1)方法次之,為0.38,GM(1,1)與線性趨勢方法接近,分別為0.22和0.13。

(2)從四種產量分離方法的合理性上來看,四種方法分離的枇杷氣象產量的正負性與農業氣象災害年鑒最為一致的是GM(1,1)和線性趨勢兩種方法,另外兩種方法表現稍差。

(3)從四種產量分離方法的有效性來看,考慮了氣候因子對枇杷趨勢單產預測結果訂正效果最好的是GM(1,1)方法,其均方根誤差降低了50.1%,線性趨勢方法次之,為49.3%,ARIMA(1,1,1)與二次指數平滑方法表現較差,分別為16.7%和14.4%。

(4)從預測結果上來看,使用GM(1,1)方法分離枇杷氣象產量進而構建的基于氣候因子的產量預測模型預測效果較其余三種方法更好,預測結果的RMSE為3.0kg·hm?2,MAPE為15.2%,線性趨勢方法次之,其后是二次指數平滑方法,ARIMA(1,1,1)方法最差。

3.2 討論

吳中區枇杷作為當地的特色經濟作物,其產量的準確預測對地方經濟發展尤其是農業經濟以及第三產業具有重要意義。與糧食作物不同的是,像吳中區枇杷這種地方性經濟作物的產量年際變化波動較大,基于氣候因子的產量預測模型可以有效地對其進行預測,但由于這種預測模型的準確度依賴于其中使用的產量分離方法,因此有必要對不同產量分離方法的適用性進行對比分析。研究中發現14種逐年的氣象要素中僅有3種可通過與枇杷氣象產量間相關性顯著性檢驗,通過對逐月氣象要素與枇杷氣象產量進行相關性分析發現,相關系數較高月份多處于枇杷的關鍵生育期,與吳中區栽種枇杷的氣候適應性基本一致。這與陸杰英等[33]在對增城香蕉上的研究結果相似,使用這種方法所獲取的氣候因子具有更好的科學性和針對性,避免了高俊杰等[11]在研究中主觀選取關鍵氣候因子的不確定性。

王秋京等[34]的研究結果表明,GM模型具有將隨機性的原始數據轉換為具有規律性的數據,從而弱化原始數據時間序列不確定性的優點,這在擬合吳中區枇杷趨勢產量上得到了很好的體現,使用GM(1,1)方法分離的枇杷氣象產量更合理、有效,據此構建的產量預測模型預測效果在四種方法中表現最好。此外,從預測效果上來看,四種方法預測的平均絕對百分比誤差皆小于20%,達到了Paudel[35]等對歐洲區域作物產量預測的效果,但與孫少杰等[36]使用神經網絡方法預測冬小麥產量的準確率超過90%的結果相比還有差距,可在下一步研究中予以考慮。

研究中使用張旭暉等[37]關于枇杷低溫凍害的三種氣象指標與氣象產量進行相關性分析,但最高的相關系數僅為0.45,未通過顯著性檢驗。然而陶正達等[7]的研究表明,吳中區枇杷遭受過多次的低溫凍害影響,僅2021年成熟的枇杷就遭受過2次寒潮凍害影響,≤?3℃日數為8d、≤?3℃極端最低氣溫?7.0℃、≤?3℃冷積溫?13.3℃·d。因此,下一步將構建更合適的低溫凍害指標并引入預測模型中,這可以進一步提高基于氣候因子的枇杷單產預測模型的精度。

[1] 王潤紅,茹曉雅,蔣騰聰,等.基于物候模型研究未來氣候情景下陜西蘋果花期的可能變化[J].中國農業氣象,2021, 42(9):729-745.

Wang R H,Ru X Y,Jiang T C,et al.Based on the phenological model to study the possible changes of apple flowering dates under future climate scenarios in Shaanxi province[J].Chinese Journal of Agrometeorology,2021,42 (9):729-745.(in Chinese)

[2] 顧仲陽,常欽,李曉晴,等. 建設宜居宜業和美鄉村[N].人民日報,2022-11-25(001).

Gu Z Y,Chang Q,Li X Q,et al.Build a livable,employable and beautiful countryside[N].People’s Daily,2022-11-25 (001).(in Chinese)

[3] 黃霄,王化坤,薛松,等.大棚栽培對枇杷果實品質和礦質元素吸收與積累的影響[J].果樹學報,2020,37(4):540- 552.

Huang X,Wang H K,Xue S,et al.Effects of greenhouse cultivation on fruit quality and mineral nutrition in loquat fruit[J].Journal of Fruit Science,2020,37(4):540-552.(in Chinese)

[4] Huang X,Wang H K,Qu S C,et al.Using artificial neural network in predicting the key fruit quality of loquat[J]. Food Science & Nutrition,2021,9(3):1780-1791.

[5] 賈文藝, 姚婕.蘇州東山枇杷營銷策略分析[J].中國市場,2021(15):130-131.

Jia W Y,Yao J.Analysis on marketing strategy of Suzhou Dongshan loquat[J].China Market,2021(15):130-131.(in Chinese)

[6] 賀金娜,劉布春,劉園,等.鮮食葡萄天氣指數保險設計:以環渤海主產區瓦房店連陰雨災害為例[J].中國農業氣象,2022,43(10):810-820.

He J N,Liu B C,Liu Y,et al.Insurance design of table grape weather index: taking the continuous rain disaster in Wafangdian,the main production area around the Bohai sea as an example[J].Chinese Journal of Agrometeorology,2022, 43(10):810-820.(in Chinese)

[7] 陶正達,李浩宇,趙靜嫻,等.2019-2021年東山枇杷氣候(氣象)條件評價與對比分析[J].中國農學通報,2022,38(23): 95-101.

Tao Z D,Li H Y,Zhao J X,et al.Analysis report of agrometeorological conditions during growing season of summer harvest crops in 2022[J].Chinese Agricultural Science Bulletin,2022,38(23):95-101.(in Chinese)

[8] Kommareddi L S,Sha L.Machine learning using satellite remote sensing to predict agricultural yield of cash crops in USA[M].Singapore:Springer,2021:585-598.

[9] Das B,Murgaonkar D,Navyashree S,et al.Novel combination artificial neural network models could not outperform individual models for weather-based cashew yield prediction [J].International Journal of Biometeorology,2022 (1):1-12.

[10] 唐余學, 羅孳孳, 范莉,等. 基于關鍵氣候因子的中稻單產動態預報[J].中國農業氣象,2011,32(2):140-143.

Tang Y X,Luo Z Z,Fan L,et al.The dynamic prediction of mid-season rice yield based on key meteorological factors [J].Chinese Journal of Agrometeorology,2011,32(2):140- 143.(in Chinese)

[11] 高俊杰,袁業溶,梁應.高要區早稻產量預測模型的建立[J].廣東氣象,2022,44(2):50-52.

Gao J J,Yuan Y R,Liang Y,et al.Establishment of early rice yield prediction model in Gaoyao district[J].Guangdong Meteorology,2022,44(2):50-52.(in Chinese)

[12] 顧雅文,姚艷麗,傅瑋東.基于關鍵氣候因子的阿克蘇地區蘋果產量預測模型[J].新疆農業科技,2021(2):22-24.

Gu Y W,Yao Y L,Fu W D.Apple yield prediction model based on key meteorological factors in Aksu region[J]. Xinjiang Agricultural Science and Technology,2021(2):22- 24.(in Chinese)

[13] 袁小康,劉富來.油菜氣象產量4種分離方法的效果對比[J].貴州農業科學,2022,50(8):112-118.

Yuan X K,Liu F L.Comparative study on four method forseparating rape meteorological yield[J].Guizhou Agricultural Sciences,2022,50(8):112-118.(in Chinese)

[14] 何虹,王巧娟,李亮,等.寧夏引黃灌區玉米趨勢產量與氣候產量分離方法研究[J].灌溉排水學報,2022,41(4):30-39.

He H,Wang Q J,Li L,et al.Separating the effect of meteorology on maize yield from the impact of other factors in the Yellow River-water irrigated regions in Ningxia of China[J].Journal of Irrigation and Drainage, 2022,41(4):30-39.(in Chinese)

[15] Li X Y,Zhang Y,Zhao Y X,et al.Comparative study on main crop yield separation methods[J].Journal of Applied Meteorological Science,2020,31(1):74-82.

[16] Rahman M M,Islam M A,Mahboob M G,et al.Forecasting of potato production in Bangladesh using ARIMA and Mixed Model approach[J].Sch J Agric Vet Sci,2022,10: 136-145.

[17] 蔡淑芳,林營志,吳寶意,等.利用線性和非線性耦合方式建立溫室溫濕度預測模型[J].中國農業氣象,2022,43(7): 527-537.

Cai S F,Lin Y Z,Wu B Y,et al.Greenhouse temperature and humidity prediction models based on linear and nonlinear coupling methods[J].Chinese Journal of Agrometeorology, 2022,43(7):527-537.(in Chinese)

[18] 李威,顧峰雪.區域作物產量的模型預測研究[J].農業展望,2020,16(3):104-111.

Li W,Gu F X.Prediction of regional crop yield based on model[J].Agricultural Outlook,2020,16(3):104-111.(in Chinese)

[19] 馮敏玉,孔萍,胡萍,等.基于花前物候利用灰色關聯分析法建立油菜花期預報模型[J].中國農業氣象,2021,42 (11):929-938.

Feng M Y,Kong P,Hu P,et al.Prediction model of flowering date of rape established by using grey relational analysis method based on pre-flowering phenology[J].Chinese Journal of Agrometeorology,2021,42(11):929-938.(in Chinese)

[20] Li X Y,Zhang Y,Zhao Y X,et al.Comparative study on main crop yield separation methods[J].Journal of Applied Meteorological Science,2020,31(1):74-82.

[21] Prodhan F A,Zhang J,Sharma T P P,et al.Projection of future drought and its impact on simulated crop yield over South Asia using ensemble machine learning approach[J]. Science of the Total Environment,2022,807(3):151029.

[22] Cheng J,Sun J,Yao K, et al.A variable selection method based on mutual information and variance inflation factor [J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2022,268:120652.

[23] 孫朝鋒,林雯,黃川容,等.華南芒果種植區寒凍害危險性區劃與評估[J].中國農業氣象,2022,43(7):563-575.

Sun C F,Lin W,Huang C R,et al.GIS-based risk zoning and assessment of mongo cold and freezing injury in south China[J].Chinese Journal of Agrometeorology,2022,43(7): 563-575.(in Chinese)

[24] 馬凡.基于氣象數據的安徽省冬小麥產量預測模型研究[D].合肥:安徽農業大學,2020.

Ma F.Research on forecasting model of winter wheat yield in Anhui province based on meteorological data[D]. Anhui:Anhui Agricultural University,2020.(in Chinese)

[25] Zhou Y,Wang L,Qian J.Application of combined models based on empirical mode decomposition,deep learning,and autoregressive integrated moving average model for short-term heating load predictions[J].Sustainability,2022, 14(12):7349.

[26] Ning L,Pei L,Li F.Forecast of China’s carbon emissions based on ARIMA method[J].Discrete Dynamics in Nature and Society,2021:1-12.

[27] Mohamed J.Time series modeling and forecasting of somaliland consumer price index: a comparison of ARIMA and regression with ARIMA errors[J].American Journal of Theoretical and Applied Statistics,2020,9(4):143-153.

[28] 孔令森,閻虎勤.對我國中小板股指預測的可行性研究[J].統計學與應用,2020,9(3):403-411.

Kong L S,Yan H Q.Feasibility study on the forecast of China’s small and medium board stock index[J].Statistics and Application,2020,9(3):403-411.(in Chinese)

[29] 葉德謙,王毅.一種對二次指數平滑預測中參數和初值的研究[J].燕山大學學報,2008(2):173-175.

Ye D Q,Wang Y.A study on parameters and initial values in quadratic exponential smoothing prediction[J].Journal of Yanshan University,2008(2):173-175.(in Chinese)

[30] 馬兆駿,帥艷民,邵聰穎,等.基于WOFOST模型分析不同氣候情景對遼寧典型雨養春玉米產量的影響[J].中國農業氣象,2021,42(11):939-950.

Ma Z J,Shuai Y M,Shao C Y,et al.Effects of various climate scenarios on yield of typical rain-fed spring maize in Liaoning based on WOFOST model[J].Chinese Journal of Agrometeorology,2021,42(11):939-950.(in Chinese)

[31] 程準,魯植雄.拖拉機液壓傳動系統特性模型修正與參數辨識[J].農業工程學報, 2022, 38(19):33-41.

Cheng Z, Lu Z X. Model modification and parameter identification of tractor hydraulic transmission system characteristics[J]. Transactions of the Chinese Society of Agricultural Engineering, 2022, 38(19):33-41.(in Chinese)

[32] 吳柏瑩,智協飛,陳超輝,等.基于復卡爾曼濾波技術的華東區域風的多模式集成預報研究[J].氣象,2022,48(4): 393-405.

Wu B Y,Zhi X F,Chen C H,et al.Multi-Model ensemble forecasts of wind over east China by using augmented complex extended Kalman Filter[J].Meteor Mon,2022,48 (4):393-405.(in Chinese)

[33] 陸杰英,孫麗穎,吳健達,等.增城香蕉產量的氣象預報模型[J].廣東氣象,2022(3):64-67.

Lu Y J,Sun L Y,Wu J D,et al.Meteorological yield forecasting model of banana in Zengcheng[J].Guangdong Meteorology, 2022(3):64-67.(in Chinese)

[34] 王秋京,馬國忠,王晾晾,等.基于灰色模型的黑龍江省水稻生育期熱量指數分析及預測[J].中國農業氣象,2018,39 (3):177-184.

Wang Q J,Ma G Z,Wang L L,et al.Prediction on heat index of rice in Heilongjiang province based on grey model[J]. Chinese Journal of Agrometeorology,2018,39(3):177-184. (in Chinese)

[35] Paudel D,Boogaard H,de Wit A,et al.Machine learning for regional crop yield forecasting in Europe[J].Field Crops Research,2022,276:108377.

[36] 孫少杰,吳門新,莊立偉,等.基于CNN卷積神經網絡和BP神經網絡的冬小麥縣級產量預測[J].農業工程學報,2022, 38(11):151-160.

Sun S J,Wu M X,Zhuang L W,et al.Forecasting winter wheat yield at county level using CNN and BP neural networks[J].Transactions of the CSAE,2022,38(11):151-160. (in Chinese)

[37] 張旭暉,楊建全,王俊,等.江蘇枇杷凍害發生規律及風險區劃[J].江蘇農業科學,2015,43(8):157-160.

Zhang X H,Yang J Q,Wang J,et al.Occurrence law and risk zoning of loquat freezing injury in Jiangsu province[J]. Jiangsu Agricultural Sciences,2015,43(8):157-160.(in Chinese)

Applicability Analysis of Several Separation Methods on Regional Yield Prediction of Cash Crops:Take Loquat in Wuzhong District as an Example

TAO Zheng-da1, ZHAO Jing-xian1, GU Jing-yi1, ZHENG Jun-hua2, WANG Jun1, TANG Xiao-hong1, CHEN Hong-liang1, YANG Da-qiang3

(1. Wuzhong District Meteorological Bureau, Suzhou 215128, China; 2. Dongshan Diversified Service Company of Wuzhong , Suzhou 215107; 3. DongshanAgriculture and Forestry Service Station of Wuzhong, Suzhou 215107)

Four yield separation methods were used in this study to analyze the applicability on meteorological yield separation of regional cash crops, which are the ARIMA model, GM model, linear trend and quadratic exponential smoothing method. With the use of these four methods, the yield forecast models based on meteorological factor are built for analyzing the prediction accuracy. The results showed that the meteorological yield of loquat separated by GM model and linear trend method were well matched with the agrometeorological disaster records. The correlation coefficients between the meteorological yield of loquat separated by four methods and nine meteorological factors were high. The correlation coefficients were 0.95(separated by ARIMA), 0.94(separated by GM model and linear trend method) and 0.93(separated by quadratic exponential smoothing method). The root mean square error(RMSE) and the mean absolute percentage error(MAPE) between the loquat yield predicted by GM model and the actual yield were the largest, which was reduced by 50.1% after taking the meteorological factors into account. RMSE between the loquat yield predicted by linear trends, ARIMA model and secondary exponential smoothing methods and the actual yield was 49.3%, 16.7% and 14.4%. Comparing the four yield separation methods, the GM model significantly outperformed other methods, followed by the linear trend method. Moreover, the ARIMA model was the worst. The RMSE and the MAPE between the loquat yield predicted by GM model and the actual yield were 3.0kg·ha?1and 15.2%. Overall, loquat meteorological yields separated by GM model and the linear trend method matched well with the agrometeorological disaster records. The GM model performed the best on loquat yield prediction, which shows that the GM model is more suitable for yield separation and prediction of regional cash crops.

Loquat production forecast; ARIMA model; GM model; Meteorological output

10.3969/j.issn.1000-6362.2023.10.002

收稿日期:2022?12?19

江蘇現代農業產業技術體系建設項目實施方案[JARS(2021)121];蘇州市吳中區農業干旱識別及危險性評估(SZKJ202007)

通訊作者:趙靜嫻,碩士,工程師,主要研究方向為氣象為農服務,E-mail:1003635781@qq.com

陶正達,E-mail:15996370014@163.com

陶正達,趙靜嫻,顧荊奕,等.幾種分離方法在區域經濟作物產量預測上的適用性分析:以吳中區枇杷為例[J].中國農業氣象,2023,44(10):876-888

猜你喜歡
吳中區氣候因子單產
蘇州吳中區創新七項舉措 提升執法質效
蘇州吳中區創新精準執法工作見成效
蘇州吳中區堅守學訓制度 實現動態夯基強能
農大農企聯手創山西小麥最高單產新紀錄
油菜“不務正業”,單產3.4噸
吳中區水土保持科技示范園
單產948.48千克!“金種子”迸發大能量
我國玉米單產紀錄第七次被刷新
氣候因子對烤煙質量風格特色的影響
四川水稻產量及其構成要素對不同生育期氣候因子的響應分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合