?

基于U-net神經網絡的煙草種植信息提取

2021-11-30 05:54張雷劉昌華石林峰張鷹
農業與技術 2021年22期
關鍵詞:煙草圖像模型

張雷 劉昌華 石林峰 張鷹

(1.河南理工大學測繪與國土信息工程學院,河南 焦作 454000;2.自然資源部第一大地測量隊,陜西 西安 710054;3.河南省現代農業大數據產業技術研究院,河南 鄭州 450046)

引言

煙草的種植信息在我國的生產管理過程中有著十分重要的作用,可以為我國的煙葉種植以及收購提供重要的決策支持[1,2]。我國煙草的生產和消費在世界上占有重要地位,但由于我國地域面積廣闊,不同地區的地形條件各不相同。傳統的煙草面積提取常采用人工實地調查的方法進行,這樣不僅耗時費力,而且人為產生的因素可能增大測量的誤差[3],很難實現對煙草進行實時監測。

在本原性錯誤中,近20%的錯誤為概念理解性錯誤,近80%的錯誤為數學推理錯誤.就數學推理錯誤進行了訪談,結果發現:職前教師之所以認為昆明空氣質量好,是因為主觀上認為昆明是全國有名的空氣質量好城市,加之計算平均數時發現兩者之間差異不大,所以就忽略這種差異,于是“想當然”地推理出“心中的答案”.

隨著遙感技術的發展,因其監測范圍大、快速成像和多波段的特點,被廣泛應用于作物監測中[4-6]。相比傳統的依靠人工實地測量的方法,運用遙感技術可以大大節省人力,并且可以提高其準確性[7]。劉蕓等[8]采用面向對象方法,根據烤煙的NDVI、光譜、紋理以及形狀等特征,提取烤煙種植信息,總體精度達91%;雷春苗等[9]利用隨機森林、支持向量機、BP神經網絡、SoftMax和最大似然分類器對柴達木地區的枸杞進行提取,幾種分類器都有著不錯的分類精度。

近年來深度學習興起,大量學者通過深度學習的方法進行作物分類和識別。Kussul等[10]利用深度學習方法對不同的數據進行農作物分類,取得了較高的準確率;董秀春等[11]利用開放的Google Earth影像結合U-net網絡模型,對云南省隴川縣甘蔗種植區進行提取,總體精度達92%,面積精度為94%;陳妮等[12]利用U-Net深度學習網絡模型對新昌縣土地利用進行分類,取得了較高的精度;宋曉倩等[13]利用遷移學習方法提取葡萄種植信息,較傳統深度學習方法準確率提高了7%;李濤等[14]在imageNet數據集的基礎上,將模型進行微調,對玉米雄穗進行識別,證明深度學習方法在作物特征識別中的良好表現。

洛寧縣具有良好的生態環境,非常適合煙草的生長,煙草的種植一直處于洛陽市前列,成為當地的支柱性產業,也是當地人民脫貧致富的重要途經之一??焖贉蚀_地掌握煙草的種植分布和面積等情況是政府決策部門的當務之急[15]。

實驗的硬件CPU為英特爾Xeon E5-1620v4@3.20GHz,GPU為NVIDIA Quadro M2000。TensorFlow后端的Keras深度學習框架實現U-net模型的搭建與實驗行每一個特征點的分類。Keras自帶的生成器不支持多波段,所以自己編寫實現,并對U-net網絡添加BN層和Dropout 層,優化器選用Adam,損失函數為交叉嫡函數。

1 材料與方法

1.1 研究區概況

高分二號(GF-2)衛星是我國自主研制的首顆空間分辨率優于1m(星下點全色分辨率0.8m)的民用光學遙感衛星,在作物識別、建筑物識別、礦山遙感監測、林業監測等方面有著廣泛的應用[17]。

1.2 數據來源及預處理

研究區位于河南省洛陽市洛寧縣,全縣面積2306km2,位于E111°08′~111°49′,N34°05′~34°38′。地形地貌總體呈“七山二塬一分川”,生態環境良好,全縣耕地面積約8.67萬hm2,適宜種煙面積達3.73萬hm2。本研究實驗區選擇洛寧縣小界鄉,該鄉連續7a被洛寧縣政府評為“煙葉生產先進鄉鎮”,連續4a被洛陽市政府評為“煙葉生產先進鄉鎮”[16]。

U-net是一個優秀的語義分割模型,如圖1所示。U-net網絡主要分為上采樣和下采樣部分,下采樣也就是主干特征提取網絡,利用主干部分,獲得5個初步有效特征層;在加強特征提取網絡部分,對獲得的特征層進行上采樣,并進行特征融合,進而得到一個融合所有特征的有效特征層;利用預測網絡,對獲得的融合所有特征的有效特征層進行每一個特征點的分類。

結合當地各類作物的物候,7月左右煙草與其它作物最易區分,因此本研究使用高分二號衛星PMS傳感器在2020年7月7日的洛寧縣區域的5景遙感影像,數據來源于中國資源衛星應用中心(www.cresda.com/CN/)[18]。其中,4景用來制作深度學習訓練樣本,1景用來煙草信息的提取。另外,利用無人機拍攝的小范圍高分辨率影像,集思寶實地調查記錄煙草地塊空間位置信息數據,輔助后期樣本標簽的制作。

利用ENVI 5.3對原始影像進行輻射定標、大氣校正、正射校正和影像融合等預處理操作。并通過Arcgis軟件結合無人機、集思寶數據對煙草地塊進行標注。用于制作深度學習訓練標簽。

1.3 數據集構建

通過ENVI 5.3對高分二號原始影像進行數據預處理,將包含較多煙草的區域剪切出來,并利用ARCGIS進行煙草樣本的標注,如果直接將圖像輸入到深度學習網絡中,會導致內存溢出,因此需要將影像剪切成合適的小塊,本研究通過python腳本對影像和標簽圖像進行隨機裁剪,生成大小均為256×256的衛星圖像和標簽圖像。因樣本數量有限,為了避免訓練過程中出現過擬合現象,需要對數據進行數據增強[19]。將裁剪處理后的原始影像和標簽圖像進行水平翻轉、豎直翻轉以及對角翻轉,樣本擴充到2000張。按照7∶3的比例將樣本分類訓練集和驗證集。

1.4 分類方法

由表2可以看出,大學生之所以選擇貸款,絕大部分原因是為了補貼生活費.提前消費是選擇貸款的一個主要推動力,消費欲望則是選擇貸款的另一大推動力.隱藏在校園貸中的一個主要問題是大學生盲目消費,不能合理支配資金.在調查的520個學生中,有123個大學生使用過校園貸.在使用過校園貸的學生中,有56.10%的大學生貸款金額在1 000元以內,貸款金額1 001~5 000元的占20.32%,5 001~10 000元的占10.57%,有13.01%的大學生竟貸款達到了1萬元以上,遠遠超過了他們的承擔能力.這表明當代大學生存在很多不考慮自身情況及后果的個體,缺少前瞻性.

在模型訓練時,為控制網絡的穩定性,初始學習率設置為1×10-4,通過Adam優化器計算損失值相對于網絡參數的梯度,將參數進行反向傳播,進而降低損失值[21]。設置迭代次數50次,給訓練模型設置回調函數,在val_loss連續10輪不下降則訓練停止,當3個epoch過去而val_loss不下降,學習率減半。訓練后繪制的loss和acc曲線如圖2、圖3所示,可以看出,訓練集和驗證集有很好的擬合效果。在進行40個epoch的時候,曲線開始趨于穩定,損失值在0.02左右波動。說明學習率設置較為合理,損失函數實現快速收斂,可見U-net網絡對煙草數據集進行了有效的學習。

圖1 U-net網絡模型

1.5 模型評價指標

為了評價模型在煙草提取中的性能,本研究對測試結果進行準確率(P)、召回率(R)和F1值等評價[20]。計算公式:

(1)

(2)

(3)

從目前的大學生就業形勢來看,就業形勢嚴峻并不是工作崗位少,而是工作崗位的匹配度不高,市場上所需的人員和職業,市場營銷占據了大多數。但大學生的就業觀念還是停留在傳統的觀念上,認為政府機關、國企、銀行、大公司、外資企業的職業是金飯碗,希望到這類地方就業,可是,大學生喜歡的就業部門都存在不同程度的減員增效和機構合并,崗位十分有限,相比之下就顯得就業難度較大。此外,由于大學生剛出校門,沒有技術經驗和資金積累,要想進行創業就要突破許多障礙,但難度較大,成功率較低。即使成功后,由于門檻低、技術性不強等原因也會被市場淘汰。

2 結果與分析

2.1 U-net模型訓練

當前建筑企業管理在工作開展過程中并沒有嚴格按照《企業會計準則》等相關文件的指導來開展壞賬準備工作。建筑企業過度追求產品銷售的利益,在進行賒銷銷售款收回過程中,其清算工作并沒有按時開展,對應的資金收回工作也受到影響。同時,工作人員并沒有及時與供貨方取得聯系,隨著時間的推移,建筑企業收回資金的可能性逐漸下降。在這種情況下,購貨單位對還款工作的重視程度也會逐漸下降,不斷地延遲還款,導致建筑企業的壞賬率逐漸提高。

(2)35歲(含 35歲)以下護理人員,調查中顯示來自學習方面的壓力很少,說明這一年齡段的人員希通過學習來提高自己,針對這個特點,工會可結合自身的“一活動 一工程”等活動開展一系列的職工技能競賽和培訓;

因為網絡上并沒有公開的煙草數據集,本研究使用自己制作的數據集對初始網絡進行訓練,輸入的圖像大小為256×256尺寸,將數據集按7∶3劃分為訓練集和驗證集輸入到訓練網絡中。

式中,TP表示樣本的真實類別是正類,并且模型識別的結果也是正類的數量;FP表示樣本的真實類別是負類,但是模型將其識別為正類的數量;FN表示樣本的真實類別是正類,模型將其預測為負類的數量。

進行基層區隊腐敗治理的過程當中,還需要做好第四步的工作,凸顯出論劍的效果。不斷健全相應的監督管理制度,以達到應有的目的。具體而言,第一,應該對企業員工工資與獎金的分配流程予以優化和嚴格管控,通過組織開展相應的會議,同時將會議的內容予以公開,形成規范化的審批模式,要求員工親自在工資表上簽字,維護好職工的利益。第二,注重基層區隊文書的管控。依靠構建相應的業績考察、溝通互動以及腐敗治理等相關機制,達到一定的約束與管控的效果[4]。

圖2 U-net訓練集和驗證集loss曲線

圖3 U-net訓練集和驗證集acc曲線

2.2 圖像預測結果及驗證

利用訓練好的模型對待分類影像進行預測,在預測過程中,如果直接將影像輸入到模型中會造成內存的溢出。所以,一般將圖像裁剪成較小的圖像分別輸入到模型中進行預測,然后再將預測結果按順序拼接起來。如果采用常規的規則網格裁剪,最后預測拼接的效果并不是很好,會有明顯的拼接痕跡。因此,采用忽略邊緣預測,有重疊地裁剪影像,在拼接時再采用忽略邊緣的方法進行拼接。

將預測結果與標注后的真實煙草標簽圖像進行精度評價,原始圖像和人工目視標注的標簽圖像以及預測結果圖像如圖4~6所示,將預測結果與實際標注的結果進行精度評價,取得了90.68%的精確率和92.87%的召回率。綜合評價指標F1值為91.76%。

圖4 原始圖像

2.3 不同模型煙草提取結果對比

為了進一步驗證本文所使用的U-net網絡模型的有效性,使用其它常用的分類模型進行煙草提取并進行精度對比。從圖7可以看出,KNN、Decision Tree和Random Forset模型的準確率分別為87.68%、83.65%和89.21%,相比之下,U-net網絡模型的準確率比其它模型平均高出3.8%。

圖5 人工目視標簽圖像

圖6 U-net網絡預測圖像

圖7 各分類模型煙草提取準確率

以上結果表明,U-net神經網絡模型在少量訓練樣本的時候,依舊可以取得很好的信息提取效果。

3 結束語

本研究使用U-net神經網絡模型,實現了對煙草種植的提取,對于沒有公開的煙草數據集的情況,通過實地調查結合目視解譯制作深度學習訓練標簽。通過與其它常用分類模型進行精度對比,U-net在少量數據集的情況下,表現出良好的性能。

相關研究還有待深入,需解決面積漏分的問題,需進一步提高訓練樣本的多樣性和優化網絡模型;不同煙葉種植地區地形各不相同,本文只對洛寧縣山區進行煙草面積提取,后續可在擴大數據集的基礎上,開展不同地形情況下煙草種植面積提取研究,并進一步探究U-net網絡模型的普適性。

猜你喜歡
煙草圖像模型
煙草具有輻射性?
改進的LapSRN遙感圖像超分辨重建
重要模型『一線三等角』
有趣的圖像詩
重尾非線性自回歸模型自加權M-估計的漸近分布
煙草依賴的診斷標準
3D打印中的模型分割與打包
煙草中茄酮的富集和應用
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
遙感圖像幾何糾正中GCP選取
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合