?

草莓種植環境穩定性優化與成熟期預測的研究

2021-06-28 19:13孫孟孜韓兵韓海仙王森
電腦知識與技術 2021年10期
關鍵詞:線性回歸成熟度人工智能

孫孟孜 韓兵 韓海仙 王森

摘要:針對當前溫室大棚信息化程度較低,種植經驗與知識缺乏,導致無法更好地培養種植管理作物,大幅度地降低了作物收成。通過“人工智能+農業”在大棚種植草莓的生長環境的研究和總結,分析植物生長環境和果蔬的成熟期之間的關系,從而保證穩定高效的生產經濟農作物前提下提升農業經濟的產出。本研究對象為草莓作為標本經濟作物,通過人工智能算法,根據監測大棚環境的數據,給出環境調整的參數建議,同時實現預測草莓種植周期的天數,推測出成熟的日期。實驗證明,通過人工智能算法能夠通過植物生長過程數據準確預測其成熟期,為大棚種植果蔬提供依據,將新技術投入到現代化農業中,讓農業真正實現現代化,智能化,高效化。

關鍵詞:人工智能;生長周期;線性回歸;訓練模型;成熟度

中圖分類號:TP311? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)10-0209-04

鄉村振興戰略是在黨的十九大報告中提出的戰略,十九大報告指出,農業農村農民問題是關系國計民生的根本性問題,必須始終把解決好“三農”問題作為全黨工作的重中之重,實施鄉村振興戰略。

然而,我國的農業智能種植技術使用較晚,直到二十一世紀初期我國的農業科技人員才開始通過國外進口種植大棚設備選型,培育技術等領域深入研究探索[1]。依托部署在農業生產現場的各種傳感節點(環境溫濕度、土壤水分、二氧化碳、圖像等)和無線通信網絡實現農業生產環境的智能感知、智能預警、智能決策、智能分析、專家在線指導,為農業生產提供精準化種植、可視化管理、智能化決策,提高農業水利化、機械化和信息化水平,提升農業競爭力。

1大棚種植草莓的分析

草莓消費大多集中在春節前后,尤其是在春節期間,由于對草莓的大量需求,常常供不應求。華北地區地理和自然資源豐富,具有典型的北溫帶半濕潤大陸性季風氣候,夏季高溫多雨,冬季低溫并偶爾帶有降雪,春秋季節時間短,為了進行自然培植就要利用大棚種植技術來調整草莓的生長環境[2]。

人工智能在農業的應用,能夠讓農業成為科學化和現代化農業。溫室大棚經過技術輔助,更加簡單容易控制掌握,提供一個高效穩定的控制溫室大棚的草莓良好的種植環境,讓從業者擁有穩定可觀的經濟收入[3]。因此,通過當前最新的人工智能算法建立數學模型,對溫室大棚環境給出調整,讓溫室大棚種植全面自動化,從而減少人力物力以及技術的難度,提高產量和收入。

2 草莓生長環境參數研究

草莓生長環境主要包括:二氧化碳濃、度溫度、濕度、光照強度、土壤濕度、土壤酸堿度六個方面。每一項對草莓生長都有一定的影響,需要通過大棚的智能控制單元將其控制在一定的范圍之內[4]。

通過查看文獻,草莓對環境的溫度是尤為重要,草莓會分成萌芽期,生長期,開花期,結果期,旺盛生長期,花芽分化期和休眠期,每個周期對溫度的要求不一樣。例如,發芽期適宜溫度在15℃~20℃時最適合草莓的生長,生長期適宜溫度為 20℃~26℃,開花期為是 25℃~ 30℃。過高或者過低,都會影響草莓的發育,幼芽無法發育或者花粉受精失去活力提高畸形的概率等問題[4]。

此外,光照時長需要在8h~12h,光照的不足會導致花芽的形成,減少養分的獲取降低成活率;二氧化碳濃度和土壤濕度也是影響草莓正常生長的重要因素,經驗表明:二氧化碳都處于800~1800ppm之間會提高草莓的萌芽期和開花期的長勢;土壤濕度控制在60%~80%之間是保證豐產的關鍵;酸堿度范圍在pH5.5~6.5之間,同時也適用于草莓生長適宜的土壤酸堿度,因此把大棚土壤的pH值控制在5.5~6.5最適宜[5]。

3 數學訓練模型研究

圖1是系統使用的數學訓練模型,開始訓練時,從訓練集讀取數據,訓練模型初始化模型,根據線性回歸計算環境參數得出一個標準數值,篩選不符合要求的參數,增減訓練項,重新計算模塊做出模型參數的調整。

系統首先將清洗好的數據輸入到訓練集中,數據聚類重疊,將同一時刻的不同日期的數據疊加一起,通過線性回歸算法計算。線性回歸是利用數理統計中回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法,運用十分廣泛[6]。其表達形式為y = w'x+e,e為誤差服從均值為0的正態分布[7]?;貧w分析中,只包括一個自變量和一個因變量,且二者的關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析[8]。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關系,則稱為多元線性回歸分析。通過公式化簡可以擬合方程為最小二乘法。一般來說,線性回歸都可以通過最小二乘法求出其方程,可以計算出對于y=bx+a的直線[9]。將數據清洗篩選后,增加或減少聚類項,再次重復計算,得出新的數學模型,多個數學模型對比調整參數,得出一個與真實情況最為接近,最可以接受的模型,成為標準模型使用。

3.1 回歸算法的研究

課題使用的模型算法為回歸算法,又分為線性回歸算法,和曲線回歸算法(又稱高斯曲線),假設溫室大棚的環境參數,二氧化碳為θ1,溫度參數為θ2,濕度θ3,光照強度θ4,土壤濕度θ5,土壤pH值θ6。再對每一個影響項拆分,就可以通過線性回歸的最小二乘法進行推導出直線方程。擬合平面公式為式(1):

最終,公式整合為直線方程式(2):

并不是所有的參數都可以用直線表示,例如溫度和光照強度屬于曲線,所以線性回歸就不能適用于這兩個參數。就要使用曲線回歸來完成,曲線回歸又分為指數函數曲線,對數,冪函數,雙曲,S型和多項式曲線,符合本次溫度和光照強度的函數方程是多項式曲線。經過試驗三次多項式就可以更加接近實際溫度和光照情況的走勢,無須再使用更多次多項式方式就可以解決實際問題。三次多項式方程式(3):

3.2成熟度預測

系統每小時將環境參數傳入數學模型中,通過引入偏差值概念,可以保證數據在一定的范圍內波動,同時還有參數上限與下限約束條件。系統可以根據采集到的數據偏差進行計算并做出提示的調整建議[10]。將環境監測數據CO2濃度,溫度,濕度,土壤濕度,土壤pH值,光照強度根據權重占比計算,得出一個當前環境分數設為合格率,大于70%時就可以添加到數據集中,把不符合要求的環境數據篩選掉以保證數據的準確性[11]。

系統在每日凌晨2點對此前24小時的樣本數據進行統計,計算種植草莓的成熟率和預計成熟日期。c成熟周期,r為成熟率,rd當天成熟率,D為待成熟天數。此時,可推算出成熟率公式為式(4):

同時,也可推算出成熟天數公式(5):

4系統設計

系統首先獲得草莓種植的環境數據,并對得到的監控數據進行數據清洗,獲得可以進行計算的數據格式,當符合訓練條件的數據在規定的環境參數要求的范圍內,則放入訓練數據集;不符合直接進入計算草莓種植環境的分數邏輯。根據模型的標準參數和偏差值,得出當前草莓種植環境的分數,同時給出草莓種植環境的調整建議方案,同時預測草莓的成熟度和成熟日期。

系統由以下四個模塊組成:

(1)環境監測模塊:用于連接傳感器監測數據的管理,監測數據是以接口的形式傳入數據,監測數據也支持直接寫入數據庫中,并且可以直接查看監控數據功能。

(2)數據清洗模塊:監控數據的格式和單位,可能出現數據不符的情況,此時就需要進行數據清洗,課題將清洗后的監測數據存入數據庫中。

(3)訓練模型模塊:當系統獲取到準確的訓練數據,包括CO2濃度,溫度,濕度,光照強度,土壤濕度,土壤PH。根據環境的基本訓練數據,對每個參數,計算出一天中每小時的參數的所處的范圍,使用線性回歸算法進行預測。

(4)周期計算模塊:系統將每次采集的環境數據與標準的大棚環境的模型對比,給予建議的同時,計算當前大棚環境的分數值。當一天結束時,根據當天每小時的分數,計算出當天的草莓生長成熟度0~100%,從而實現對草莓成熟度和成熟期的預測。

系統流程圖如圖2所示。

5實驗驗證

系統運用Python中的Numpy科學計算模塊,把數據轉化為二維矩陣放入模型中訓練[12],利用Pandas來分析結構化數據,使用Matplotlib生成出版質量級別的圖形展現[13]。

5.1數據的清洗

數據通過格式化后,并不是可以直接拿來使用,因為數據存在部分的異常情況,不符合人們的認知或者真實的情況,例如:夜晚有光照,光照強度都比白天中午的強度都高,或者夜晚溫度高,白天溫度低,土壤pH值出現強酸強堿情況等等,都不是真實的正常情況,很有可能是監測設備異常。因此,將不符合真實情況的數據導入模型中,必然影響模型的訓練效果,需要提前將有問題的數據篩選清洗出去。

圖 3 中的0-5時刻和18-23時刻都屬于夜晚,存在光照強度數值存在異常情況,尤其0-5時刻的數值,都達到200 lx必然存在問題,還有過高的數值都是需要清洗掉的數據,會存在對模型整體的影響。通過策略將光照強度的數據集清洗,呈現出圖4的效果。溫度,濕度,二氧化碳濃度,土壤濕度,土壤pH值同理,使用符合每一項的篩選策略,清洗出符合預期效果的數據。

5.2線性回歸

以光照強度為例,在圖5中,發現曲線回歸的常量值處在一個負值,不符合實際情況,所以再次對數據進行截?。?-18時的數據即為有效曲線,0-6時和6-23時的數據無效, 對圖5樣本走勢圖截取,得出圖6為參考曲線回歸圖。

5.3模型訓練

通過創建CropModels類中的init_model函數為初始化數學模塊,并且執行CO2,濕度,土壤濕度,土壤pH值,溫度以及光照強度等六項的函數,獲取到相應的線性回歸的k,b參數和曲線回歸的三項式公式[14]。執行init_model初始化模塊后,本對象就擁有6個環境參數的數學模塊,等待傳入某時刻的數據進行計算。調用calc函數,并且傳入7個參數數值,并可返回溫室大棚的環境建議和當前環境種植的分數情況。

當傳入的草莓種植環境符合模型給出的標準參數,并計算與標準參數相似率達到70%以上,就會把本次傳入的環境參數放入到訓練集中,當成符合要求的訓練數據,對模型再次矯正。

5.4 成熟期預測

根據每小時傳入溫室大棚的環境參數,經過一天的數據收集,第二天凌晨2點會對前天的24小時的樣本數據進行統計,計算種植草莓的成熟率和預計成熟日期。通過使用線性回歸算法構建數學模型,預測溫室大棚環境的標準曲線[15],并且監控大棚環境在某一時刻是否能符合一定的范圍之內,根據每天的環境監測情況,計算出當天的成熟率,并且累計以往的數據,推測出草莓的成熟日期。

6 結束語

課題通過線性回歸算法,對草莓生長過程環境參數進行跟蹤,利用擬合函數和最小二乘法進行線性曲線的多項式統計預測,將人工智能運用在實際的項目之中,預測溫室大棚草莓的種植環境的標準曲線,并且監控種植環境在某一時刻是否能符合一定的范圍之內,根據每天的環境監測情況,計算出當天的成熟率,并且累計以往的數據,推測出草莓的成熟日期。實驗證實,該方法能夠有效地預測草莓的成熟期,對草莓的種植有很大的幫助。

參考文獻:

[1] 尹娟.物聯網驅動的智慧農業精細種植系統的設計與開發[J].金陵科技學院學報,2020,36(1):88-92.

[2] 楊會苗,毛清云,劉蘭英.北京和保定地區草莓產業基本情況調研報告[J].北方園藝,2019(6):170-174.

[3] 潘小紅,楊志勇.基于物聯網技術的溫室大棚種植園環境監測系統[J].現代電子技術,2019,42(14):127-130.

[4] 孫亞玲,劉少軍,許念芳,等.山東省草莓產業現狀及發展對策[J].中國果菜,2018,38(9):44-47.

[5] 王艷芳,蘇婉玉,張琳,等.土壤改良劑在設施蔬菜上的應用研究進展[J].貴州農業科學,2018,46(4):102-105.

[6] 王鋼.基于多元線性回歸法的平潭綜合實驗區需水量預測模型研究[J].水利科技,2020(2):48-50.

[7] 冷建飛,高旭,朱嘉平.多元線性回歸統計預測模型的應用[J].統計與決策,2016(7):82-85.

[8] 宋靜,張利益.基于機器學習的線性回歸預測數據庫空間使用情況的應用研究[J].電子測試,2020(15):58-59,62.

[9] 羅博煒,洪智勇,王勁屹.多元線性回歸統計模型在房價預測中的應用[J].計算機時代,2020(6):51-54.

[10] 孫建花.草莓日光溫室種植技術要點分析探討[J].農業開發與裝備,2020(6):159-160.

[11] 劉永紅,倪中應,謝國雄,等.浙西北丘陵區農田土壤微量元素空間變異特征及影響因子[J].植物營養與肥料學報,2016,22(6):1710-1718.

[12] 姚建盛,李淑梅.Python在科學計算中的應用[J].數字技術與應用,2016(11):76.

[13] 吳銘.基于多視圖的霧霾數據分析方法[D].杭州:浙江大學,2017.

[14] 王俊杰,張宇波.基于線性回歸的圖像邊緣處理算法的研究[J].江西師范大學學報(自然科學版),2013,37(1):46-50.

[15] 魏超,代曉航,郭靈安,等.蠟樣芽孢桿菌在草莓中的生長及預測模型的建立[J].現代食品科技,2019,35(9):291-296.

【通聯編輯:光文玲】

猜你喜歡
線性回歸成熟度人工智能
產品制造成熟度在型號批生產風險管理中的應用
整機產品成熟度模型研究與建立
人工智能與就業
不同成熟度野生水茄果實的種子萌發差異研究
剛好夠吃6天的香蕉
數讀人工智能
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合