?

利用葉片光譜的作物銅鉛污染判別

2021-04-15 10:03楊可明陳改英趙恒謙姚樹一石曉宇
農業工程學報 2021年3期
關鍵詞:鉛含量正確率種類

高 偉,楊可明※,陳改英,趙恒謙,張 超,姚樹一,王 劍,石曉宇

(1.中國礦業大學(北京)地球科學與測繪工程學院,北京 100083; 2. 北京農學院園林學院,北京 102206)

0 引 言

環境中過量的重金屬會污染作物[1-2],對糧食安全產生威脅[3]。重金屬被作物吸收后會經食物鏈向人體富集[4],過量攝入重金屬會對人類健康產生嚴重的威脅[5-6]。不同重金屬對人體的危害存在差異,如銅中毒會引發多種神經系統退行性疾病[7-9],鉛中毒會導致貧血等疾病[10-11]。因此,判別作物所受的銅鉛污染,可為保護人類健康提供重要信息。同時,也可為多種重金屬及混合污染的判別研究提供理論參考。

傳統的化學重金屬污染監測方法費用高昂且流程復雜[12-13],而高光譜技術具有快速、便捷及信息豐富等特點[14]。近年來,基于作物高光譜數據,結合光譜指數[15-16]、頻域變換[17]、導數(Derivative,D)[18]和包絡線去除(Continuum Removal,CR)[19-20]等方法的作物重金屬污染程度監測研究成果豐碩。

關于作物污染種類高光譜監測的研究較少,但仍有一定成果。如利用機器學習方法判別受到鎘、汞和鉛污染的作物[21],利用功率譜密度曲線[22]、空間譜峰數[23]、光譜等值線數量與分布差異[24],直觀的判別受到銅和鉛污染的作物。上述研究中的光譜處理與判別方法較為繁瑣,判別結果的可視化差異較小,不利于進一步拓展到多種重金屬及混合污染的判別中。因此,探尋一種有效且易于推廣的作物重金屬污染種類高光譜判別方法具有重要意義。

本研究基于受到重金屬銅、鉛污染的作物葉片光譜,旨在設計一種銅鉛污染判別特征(Copper and Lead Contamination Discriminating Features,CLCDF),以實現作物銅、鉛污染判別。首先利用常規方法處理葉片光譜,并構建用于表征重金屬污染種類的光譜指數。然后利用光譜指數組成可視化效果更好的CLCDF,并通過CLCDF與判別平面(Discriminating Plane,DP)的位置關系得到明確且直觀的重金屬污染種類判別規則。最后,借助判別距離(Discriminating Distance,DD)量化判別規則,提高推廣的便捷性。

1 材料與方法

1.1 作物培育

以典型作物——玉米為研究對象開展研究。使用CuSO4·5H2O和Pb(NO3)2分別作為銅、鉛污染源,結合《土壤環境質量標準:GB15618-1995》[25],設置土壤的銅、鉛污染程度均分別為0(無污染)、50、100、150、200、300、400、600、800 mg/kg。每種土壤均制備3份重復,每份土壤中各培育1組玉米植株,共計51組。培育場所為條件可控的溫室,水氣環境適宜,氮磷鉀等營養元素充足。

1.2 葉片光譜反射率及銅鉛含量獲取

穗期的玉米葉片面積大,易于識別。因此,使用ASD FieldSpec 4型便攜式地物光譜儀采集穗期葉片光譜反射率數據。數據采集在暗室中進行,葉片樣本置于黑色不反光絨布上,使用白板對傳感器進行校正,以50 W鹵素燈為光源,光纖探頭視場角為25°,并垂直放置于葉片上方5 cm處。各組分別采集3枚不同位置葉片的光譜反射率,每枚葉片的光譜反射率采集3次,以3枚葉片9次光譜反射率的均值表征該組植株的葉片光譜反射率。

銅、鉛污染環境中的葉片光譜反射率如圖1所示。由圖可知,環境中不同種類的重金屬污染對葉片光譜的影響差異較小,并不能直觀判別。

對光譜采集后的葉片進行清洗、烘干、粉碎、微波消解等處理,采用電感耦合等離子發射光譜儀(ICP-OES),依據《硅酸鹽巖石化學分析方法》[26]測定葉片中的銅、鉛含量。玉米葉片的銅或鉛含量測定結果如表1所示,其中銅或鉛含量為各污染程度下植株葉片銅或鉛含量的均值。

表1 玉米葉片的銅、鉛含量Table 1 Copper and lead content of maize leaves

土壤中過量的重金屬對作物有脅迫作用,受作物對重金屬的吸收機制影響,過量的重金屬不一定會作物被吸收。土壤受銅或鉛污染時,若植株葉片的銅或鉛含量高于無污染土壤中植株葉片的銅或鉛含量(均值)時,表明葉片已被銅或鉛污染。由玉米葉片的銅或鉛含量測定結果可知,有42組葉片被污染(24組被銅污染,18組被鉛污染),使用42組被污染葉片的數據進行銅、鉛污染判別試驗。

1.3 訓練集與驗證集劃分

在參與試驗的葉片數據中,隨機選取80%[27](銅污染19組、鉛污染14組)的數據作為訓練集,其余20%(銅污染5組、鉛污染4組)的數據作為驗證集。數據集的劃分由Python中的sklearn庫完成。

1.4 光譜包絡線去除(CR)

CR是一種獨特光譜信號處理方法,能夠對光譜信號的吸收、反射特征產生明顯的增益,凸顯光譜信號中的隱匿信息。CR常依據Clark提出的外殼系數法[28]實現。本研究中,將經CR處理后的原始光譜稱為CR光譜。

1.5 光譜導數(D)處理

光譜進行導數處理可以有效消除基線效應[29],同時獲取到光譜信號中的細節信息[30]。求導窗口的半徑會影響D處理獲取的信息的細致程度,考慮到擬構建的CLCDF是三維坐標,需要3個組成成分,因此本研究選擇3種不同的求導窗口半徑進行D處理。1、2和3 nm是常用的求導窗口半徑,因此本研究選用上述值。

求導窗口半徑為1、2和3 nm時,光譜D處理的計算方法分別為

式中ρ(λi)為波長λi處的光譜值,ρ′(λi)為ρ(λi)的導數。

本研究中,將CR光譜經求導窗口半徑為1、2和3 nm的D處理后獲得的光譜,分別記為CRD1、CRD2和CRD3光譜。

1.6 銅鉛污染判特征(CLCDF)

光譜指數能夠有效利用光譜特征。目前與作物重金屬污染相關的指數多側重于表征污染程度,對重金屬污染種類的表征不足。因此,需要建立一種表征作物重金屬污染種類的光譜指數。歸一化是常用的光譜指數形式之一。歸一化光譜指數[31](Normalized Difference Spectral Index,NDSI)的計算式為

式中ρ(λm)和ρ(λn)分別為波長λm和λn處的光譜值。

本研究提出將與污染種類相關性最強的NDSI作為歸一化銅鉛污染指數(Normalized Difference Copper and Lead Contamination Index,NDCLCI)。分別以CRD1、CRD2和CRD3光譜作為基準光譜,構建不同波段組合的NDSI,進一步提取NDCLCI。分別將基于CRD1、CRD2和CRD3光譜的提取的NDCLCI記作NDCLCI1、NDCLCI2和NDCLCI3,并將它們分別作為一個坐標分量(即NDCLCI1為x、NDCLCI2為y、NDCLCI3為z),組建葉片的的CLCDF。CLCDF表示為

1.7 銅鉛污染判別方法

基于CLCDF的銅鉛污染判別方法的建立可分為5個部分。具體如下:

1)建立多個用于判別的平面(Plane,P)

葉片CLCDF在空間中呈點狀分布,可通過P將CLCDF分割為2類。P可表示為

式中a、b分別表示面在x、y方向的系數,c表示面在z方向的截距。

由于空間中P的數量是無限的,考慮到可操作性與運算量,需對a、b和c進行限制,以控制本部分產生的P的數量。規定a和b的取值范圍均為[arctan(-89π/180),arctan(89π/180)],取值間隔為π/180,即a和b均有179種取值選項。規定P必須過所有全體CLCDF的均值點,結合a和b的值,可確定c。綜上,共建立32 041種P。

2)假設判別規則

P進行分割后,銅污染域和鉛污染域有待確定,因此為每個P假設2種判別規則。

3)計算判別正確率

計算每個P在各假設下的判別正確率,判別正確率是污染種類判別結果與實際情況一致的CLCDF在全部CLCDF中的占比。

4)確定判別平面(DP)與判別規則

統計每個P在各假設下的判別正確率,將判別正確率極大值對應的P和“假設判別規則”分別記作記作DP和“判別規則”。

5)判別規則量化

為提升本方法在像素級數據中的應用可能,提出以CLCDF到DP的距離表征二者的位置關系,記作判別距離(DD),計算式為

使用DD對判別規則進行量化。假設的判別規則“P左、右側分別為銅、鉛污染域”量化后為:DD<0、DD>0時,CLCDF對應的葉片分別受銅、鉛污染。假設的判別規則“P右、左側分別為銅、鉛污染域”量化后為:DD>0、DD<0時,CLCDF對應的葉片分別受銅、鉛污染。

最終,獲得1個或多個DP及對應的判別規則、判別規則(量化),可依此對任意CLCDF對應的葉片進行重金屬銅鉛污染的判別。

2 結果與分析

2.1 光譜處理

對葉片原始光譜進行CR處理,獲得CR光譜;對CR光譜進行求導窗口半徑分別為1、2和3 nm的D處理,獲得CRD1、CRD2和CRD3光譜。由于各葉片光譜直觀差異較小,且同一葉片的CRD1、CRD2和CRD3光譜直觀差異也較小,故以在土壤銅污染程度為50 mg/kg時培育的一組植株葉片的原始、CR和CRD1光譜為例進行展示(圖2)。原始光譜經過CR處理后(即CR光譜),其峰谷特征得到了增強;CR光譜經過求導半徑不同的D處理后(即CRD1、CRD2和CRD3光譜),細節信息得到了有效提取。使用CR和D對原始光譜進行聯合處理,消除了原始光譜信號中背景噪聲的影響,同時使得原信號中包含的光譜特征和細節信息可以被更有效的利用。

計算各類光譜與葉片重金屬污染種類相關系數。各類光譜各波段中,相關系數絕對值的最大值分別為0.15(原始光譜)、0.46(CR光譜)、0.52(CRD1光譜)、0.46(CRD2光譜)和0.42(CRD3光譜);相關系數絕對值的平均值分別為0.08(原始光譜)、0.12(CR光譜)、0.12(CRD1光譜)、0.12(CRD2光譜)和0.12(CRD3光譜)??砂l現,相較于原始光譜,CR、CRD1、CRD2和CRD3光譜各波段光譜值與污染種類相關系數絕對值的平均值有一定上升,最大相關波段的相關系數有大幅提升;說明處理后各類光譜與目標值的整體相關性得到了改善,光譜中與研究目標有關的信息得到了較好的挖掘。

2.2 CLCDF建立與污染種類分析

分別以CRD1、CRD2和CRD3光譜為基準光譜,構建NDSI。計算各基準光譜下每種NDSI與葉片重金屬污染種類的相關系數絕對值。由于NDSI的結構特點,λm和λn對應的波段互換后,所得的相關系數絕對值是相同的,為避免重復,選擇相關系數原值為正時的λm和λn組合用于后續研究。

在NDSI中提取NDCLCI(NDCLCI1、NDCLCI2、NDCLCI3)。NDCLCI1的構成波段為2 080 nm(λm)和1 473 nm(λn),與葉片污染種類的相關系數為0.80;NDCLCI2的構成波段為603 nm(λm)和634 nm(λn),與葉片污染種類的相關系數為0.69;NDCLCI3的構成波段為1 555 nm(λm)和1 542nm(λn),與葉片污染種類的相關系數為0.71。

2.3 判別效果與驗證

在訓練集數據中,依照基于CLCDF的銅鉛污染判別方法進行試驗,共得到32 041種P。其中,判別正確率的極大值為100%,共有189種P達到該精度,即獲得了189種DP(包含對應的規則)。以其中一個DP為例,對DP與葉片CLCDF的位置關系做展示(圖3)。由圖可知,CLCDF分布與葉片所受重金屬污染類型顯著相關,DP有效的分割了受不同重金屬污染的葉片CLCDF。189種DP對應的判別規則均為:DP左側、右側分別為銅、鉛污染域,區域內CLCDF對應的葉片分別受銅、鉛污染。依DD獲得的判別規則(量化)均為:DD<0、DD>0時CLCDF對應的葉片分別受銅、鉛污染。

利用驗證集對獲得的189種DP(包含對應的規則)進行檢驗。結果顯示,88種DP(包含對應的規則)的判別正確率為78.22%,其余101種DP(包含對應的規則)的判別正確率較低。

不同重金屬污染雖會導致作物葉片光譜發生畸變,但變化是極微弱的,表現出的光譜特征仍高度相似,這可能會導致判別存在誤差。此外,DP緊貼一側污染域時,由于葉片CLCDF存在小幅波動,其穩定性可能會有所下降。綜上所述,葉片的CLCDF包含了與其所受銅鉛污染種類的有關信息,基于葉片CLCDF的銅鉛污染判別方法效果良好,并具有較好的可靠性與穩定性。

3 結論與展望

構建的3種歸一化銅鉛污染指數(NDCLCI)與葉片重金屬污染種類的相關系數分別達到0.70、0.67和0.65。在訓練集數據中,基于NDCLCI組建葉片的銅鉛污染判別特征(CLCDF),發現CLCDF的分布與銅鉛污染種類顯著相關,共獲得189種用于判別的判別平面(DP)。對應的判別規則均為:DP左側、右側分別為銅、鉛污染域,區域內CLCDF對應的葉片分別受銅、鉛污染。189種DP達到的判別正確率均為100%。由CLCDF到DP的距離獲得判別距離(DD),依DD獲得的判別規則(量化)均為:DD<0、DD>0時CLCDF對應的葉片分別受銅、鉛污染。使用驗證集數據對進行驗證,其中88種DP取得的判別正確率達到了78.22%,說明基于CLCDF的銅鉛污染判別方法的有效性與可靠性。

CLCDF靈活多變,在其他作物和重金屬的污染判別中可能存在較大價值。使用DD對判別規則進行量化,將復雜的污染種類判別問題轉換為閾值區分問題,使得基于CLCDF的銅鉛污染判別方法結合影像開展大面積作物重金屬污染種類判別變得可行。在實際應用中,考慮到影像與實測數據的光譜分辨率不同,CLCDF的組成應根據實際情況進行調節。

猜你喜歡
鉛含量正確率種類
個性化護理干預對提高住院患者留取痰標本正確率的影響
課程設置對大學生近視認知的影響
MSA鍍液體系下鍍錫板面鉛含量影響因素分析
基于稀疏表示的寵物狗種類識別
基于稀疏表示的寵物狗種類識別
電影
膨化食品中鉛含量的測定
生意
生意
消防車有哪些種類
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合