?

超級稻定量供種預測模型研究*

2023-09-11 09:22梁秋艷張曉玲葛宜元遲佳
中國農機化學報 2023年8期
關鍵詞:槽輪供種決策樹

梁秋艷,張曉玲,葛宜元,遲佳

(佳木斯大學機械工程學院,黑龍江佳木斯,154007)

0 引言

在我國水稻面積結構性調減政策下,為兼顧水稻優質與高產,穩定糧食產能,采取的重要措施是種植超級雜交稻[1-3]。超級雜交稻是品質優良、產量高的新型水稻品種,其秧盤育秧精密播種要求(2±1)粒/穴。為達到精密播種要求,需提高超級稻定量供種精度,因此,建立定量供種預測模型,使預測精度達到實際使用要求,運用預測模型為定量供種器確定工作參數提供理論依據,對于提高超級稻的產量具有十分重要的意義[4-5]。

目前,預測模型的研究方法較多,包括灰色預測模型、ARIMA模型、BP神經網絡模型、決策樹模型以及XGboost模型?;疑A測模型通過少量的、不完全的信息,預測事物未來趨勢的變化,然而忽略系統的隨機性,中長期預測精度較差[6]。ARIMA模型通過結合歷史數據預測未來的值,該模型運算效率高,但僅適用于預測短期時間內變化幅度較小的數據[7]?;疑A測模型、ARMIA模型僅適用于線性數據預測,為了實現非線性數據預測,達到中、長期預測的目的,需要引入BP神經網絡模型、決策樹模型、XGboost模型。BP神經網絡模型由輸入層、隱藏層、輸出層組成,實現從輸入到輸出的非線性映射功能[8]。決策樹模型適合處理不相關的特征數據集,具有計算簡單、易于理解等優勢,比較適合處理有缺失值的數據集[9]。XGboost模型求解目標函數時引入正則項,降低模型的復雜性,進一步地提高了算法的效率,適合處理大數據集[10]。

楊萬里等[11]以植株和穗部作為自變量,水稻產量為因變量,建立線性、對數以及冪函數模型,根據決定系數R2數值的大小對模型預測值進行評估。徐強強等[12]運用指數平滑法,得到平滑系數,構建水稻產量趨勢方程。王雨晨[13]構建灰色預測模型GM(1, 1),對未來6年水稻產量進行科學預測。胡紅艷[14]建立ARIMA模型,得到產量預測值,對于指導農作物生產具有重要的現實意義。艾洪福等[15]提出基于BP神經網絡模型的拓撲結構,對于精準農業的推廣提供參考依據。夏玉紅等[16]結合BP神經網絡模型泛化能力強的優勢,對光照強度傳感器、土壤濕度傳感器采集的數據誤差進行校正,滿足農業環境的需要。阮承治等[17]設計5層神經網絡模型,得到預測值滿足實際生產需要。柴春花等[18]搭建BP神經網絡模型,該模型大大地提高了工作效率。賈玉昆[19]結合歷史數據建立決策樹算法,該模型更好地實現資源優化配置。彭牡林等[20]提出基于決策樹算法,將樣本集分為構建決策樹以及驗證決策樹兩部分組成,實現智能預警。胡智輝等[21]提出了基于XGBoost算法的預測模型,該模型能更好地實現實時預測。張艷紅等[22]結合XGBoost算法的多線程、效率高的特點,建立預測模型。趙振國[23]建立XGBoost預測模型,得到的預測結果更貼近真實值。利用模型預測供種量,可準確地把握機器當前的狀態,提高供種精度。

本文針對課題組研制的振動式定量供種裝置,選取千粒重、振幅、排種輪轉數作為影響因子,進行多因素定量供種試驗。通過應用BP神經網絡、決策樹以及XGboost算法模型,結合機器學習算法訓練速度快的優勢,對振動式水稻播種裝置進行性能預測,以決定系數R2和相對誤差為評價指標,對比分析得出最優供種量預測模型。

1 材料與方法

1.1 數據來源

試驗平臺采用2CYL-450型振動式定量供種裝置,選取千粒重、振幅、排種輪轉數作為影響因子,進行多因素定量供種試驗。該試驗利用電子分析天平、電磁振動器以及變頻調速電機分別測量千粒重的重量、振幅強度以及排種輪轉數并連續測量94組數據。

1.2 供種量計算

1.2.1 定量供種機構

如圖1所示,種箱外側加裝調速電機,控制螺旋勺式槽輪的轉速,使種子從種箱中定量排出,減少對稻種的機械損傷。種箱內部加裝電磁振動裝置,調節振幅使種子在槽輪上方的充填區形成勺形流線連續種流,相比常規供種,可緩解堵塞種問題,并提高供種的均勻性[24]。

圖1 定量供種裝置示意圖

如圖2所示,勺式外槽輪的周圍布滿勺形種槽,構成的“勺形流線”,沿著外槽輪滑動集種。外槽輪上部的調節門與中間的調節板形成排種盤面,可調節范圍為-5°~10°,以滿足不同播量的播種要求。

圖2 螺旋勺式槽輪

播種機工作時,變頻調速電機啟動,鏈條帶動螺旋勺式槽輪傳動。經電磁振動器帶動振動板簧,實現充種區域穩定續種,最終種子從氣動振盤均勻排出,實現定量供種。

1.2.2 理論供種量計算模型

單位時間內的理論供種量與種子千粒質量、種子體積、排種輪的轉速以及排種輪每圈內排出的種子體積有關。如圖3所示,螺旋勺式槽輪的播種截面面積fl由圓弧面積fl1、三角形面積fl2、扇形面積fl3以及圓弧面積fl4組成。

圖3 螺旋勺式槽輪播種截面

稻種顆粒模型近似為橢球體,通過計算該模型的體積來計算供種裝置的充種體積,單粒種子的體積計算如式(1)所示。

(1)

式中:a′——修正后的種子長度,mm;

b′——修正后的種子寬度,mm;

c′——修正后的種子高度,mm。

螺旋勺式槽輪單位時間的理論供種量ql可用式(2)表示。

(2)

式中:el——槽輪排種槽的帶動層面積,mm2;

B秧——秧盤的寬度,mm;

n——排種輪轉速,r/min;

g——水稻種子千粒質量,g;

b1、b3——對應的圓心角,(°);

h2——勺形流線直線段長度,mm;

r2——扇形面半徑,mm;

d——螺旋槽輪直徑,mm。

2 定量供種預測模型建立

2.1 BP神經網絡算法

通過深度學習,基于Tensorflow框架,搭建BP神經網絡模型,對供種量進行預測。BP神經網絡由輸入層、隱含層、輸出層組成,輸入層是信息的輸入端,確定神經元的個數,隱藏層是信息的處理端,通過正向傳播,結合激活函數,對信息進行處理,而輸出層是信息的輸出端,與期望信息相差過大時,通過反向傳播修正誤差,得到最終的預測值[25]。如圖4所示,輸入層由千粒重、振幅以及排種輪轉數組成,隱藏層通過Relu作為激活函數,正向傳播訓練模型,而輸出層得到的訓練集預測值與試驗值對比,MAE絕對誤差不在預期范圍內,則通過該模型內部的Adam優化器,進行反向傳播修正誤差,經過多輪迭代訓練模型,最終建立BP神經網絡模型。

圖4 BP神經網絡算法預測流程圖

2.2 決策樹算法

由于決策樹算法本身存在運算速度快、不容易過擬合等優勢,故采用決策樹搭建預測模型。一棵完整的決策樹,本質是樹模型,采用自頂而下的結構,由根部節點、葉子節點以及分支組成,根部節點劃分樣本集,通過Gini系數計算,對決策樹的葉子節點進行剪枝處理得到最優解,而樹的分支主要是存儲預測結果[26]。

樹的左側葉子節點決策結果如式(3)所示。

(3)

N1——樹的左側切分點樣本容量;

j——最優切分變量;

s——最優切分點;

R1(j,s)——左側特征空間;

xi——樣本類別;

yi——樣本值。

樹的右側葉子節點決策結果如式(4)所示。

(4)

N2——樹的右側切分點樣本容量;

R2(j,s)——右側特征空間。

通過葉子節點中的決策結果,計算損失函數值,選擇最優切分變量j與最優切分點s,找到最優切分點,如式(5)所示。

(5)

式中:L(j,s)—計算模型中的損失函數。

在(j,s)劃分區域求解相應的輸出值如式(6)所示。

(6)

將特征空間劃分為M個區域R1,R2,R3,…,RM,生成決策樹,如式(7)所示。

(7)

式中:I——表示指示函數。

通過定量供種試驗,采集周期為94次的數據集,如圖5所示,使用Jupyter Notebook環境中的pandas庫導入文件,然后對其進行劃分,將前80次的數據作為訓練集,后14次的數據作為測試集。根據訓練集準確率調節模型的最佳參數,進行決策樹的算法建模,預測后14次測試集的數據,得出測試集的供種量預測值。結合訓練集數據,對決策樹進行網絡搜索法調參,包括樹的最大深度max_depth、最大特征數max_features以及隨機種子數random_state,其中最大特征數主要是為了防止訓練集建模出現過擬合情況,而隨機種子數是確保每次仿真的運行結果一致,最終建立決策樹預測模型。

2.3 XGboost算法

相比決策樹算法,XGboost算法屬于集成學習模型,具有訓練速度快、預測精度高,由多棵決策樹構成,且每棵決策樹之間是相互關聯的[27]。該算法預測的結果是每棵決策樹預測值相加得到的值,XGboost算法的預測值計算如式(8)所示。

(8)

式中:fk——第k棵樹模型;

K——樹的數量;

F——所有回歸樹的集合。

求出該模型的損失函數,該函數取值為最小時,模型達到最優化的效果,如式(9)所示。

(9)

Ω——第k棵樹的正則項。

正則項主要是用于控制XGboost模型的復雜度,為了降低方差、防止過擬合現象,需要在目標函數中添加正則項,由式(10)求得。

(10)

式中:T——葉子節點數量;

wj——葉子節點權重;

γ、λ——懲罰項的系數。

考慮到XGboost算法是一種加法模型,隨著模型里面樹的棵數增加,前t-1棵樹對第t棵樹影響,通過迭代的方式擬合上一棵樹的預測誤差,該算法得到的最終預測值,由式(11)求得。

(11)

定量供種試驗采集94次數據,將試驗中的前80次作為訓練集,以Python語言為算法框架,結合網絡搜索法對決策樹棵數n_estimators、學習率learning_rate以及樹的最大深度max_depth等參數進行尋優,其中學習率是為了防止上一棵決策樹產生訓練誤差的權重過高,影響下一個決策樹的結果,從而避免訓練集中的模型出現過擬合的現象。如圖6所示,結合訓練集數據,通過多棵決策樹迭代計算訓練誤差,直至得到最后一棵樹的預測結果與每棵樹的訓練誤差總和,最終建立XGboost模型。

圖6 XGboost算法預測流程圖

圖7 各模型預測的擬合圖

3 結果與分析

3.1 模型性能評價指標

通過定量供種試驗獲得樣本數據共94個,將該數據劃分訓練集以及測試集,前80次作為訓練集用作數據建模,而后14次作為測試集,得到供種量的預測值,驗證模型的預測效果。R2為預測模型的判定系數,取值范圍為[0,1],R2的取值越接近1,說明定量供種預測模型的精度越高,即模型的性能越好[28],如式(12)所示。

(12)

為了對比分析各個模型的實際預測效果,以相對誤差為評價指標,數值越小表示預測值更貼近測試集值,如式(13)所示。

誤差=|fi-yi|/yi×100%

(13)

3.2 各模型的預測效果

利用網絡搜索法得出BP神經網絡、決策樹、XGboost模型的最優參數,其中BP神經網絡模型的最優參數為迭代次數為100輪、激活函數為Relu,得出訓練集的準確率為0.70;決策樹的最優參數為最大深度max_depth為10、最大特征數max_features為‘sqrt’,得出訓練集的準確率為1.0;XGboost的最優參數為決策樹棵數n_estimators為50、學習率learning_rate為0.2以及樹的最大深度max_depth為5,得出訓練集的準確率為1.0,為了驗證模型的合理性,預測后14次的效果,將各模型的預測值與測試集值相比,R2分別為0.87、0.91、0.95。

3.3 模型對比分析

為檢驗各模型的實際預測效果,基于上述模型的求解結果,從表1可以看出,BP、決策樹、XGboost模型的相對誤差分別為18%、11%、5%,說明XGboost預測模型在測試集中得到的預測值,相比BP神經網絡模型、決策樹模型,更貼近于測試集值??梢?XGboost算法具有更高的預測精度,預測性能更優,更適用于供種量預測。

表1 模型測試集數據Tab. 1 Model test set data

4 結論

為實現超級稻精密播種,提高水稻產量,降低傷種、堵種的風險,本文以秀優5號超級稻為研究對象,進行供種理論及供種量預測的研究,以Python為算法構架,分別適用BP神經網絡、決策樹、XGboost的預測模型,并將模型驗證結果與相關模型對比,得出以下結論。

1) 通過定量供種試驗,采集周期為94次的數據集,以數據前80次為訓練集,采用BP神經網絡、決策樹以及XGboost進行算法建模,得到訓練集的準確率為0.70、1.0、1.0。

2) 應用BP神經網絡、決策樹、XGboost的供種量預測模型,以R2為衡量模型性能評價指標,分別為0.87、0.91、0.95。相對誤差反映各模型得到的預測值與測試集值擬合效果,分別為18%、11%、5%。結果表明,XGboost模型相比其他兩種模型預測效果更好,進一步地為定量供種器確定工作參數提供理論依據。

猜你喜歡
槽輪供種決策樹
輕載沖壓檢測機槽輪機構的優化設計
油菜旋轉盤式高速集排器螺旋供種裝置設計與試驗
基于振動盤供種的混編景觀種子帶編織機設計
稻麥兼用排種器振動供種裝置性能試驗
一種針對不均衡數據集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
傾斜拋物線型孔輪式小麥供種裝置設計與試驗
非圓齒輪-槽輪機構的運動學分析
棗去核機傳動系統槽輪機構的虛擬樣機分析
基于決策樹的出租車乘客出行目的識別
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合