?

基于支持向量回歸機算法的海水富營養化過程中藻類繁殖狀態軟測量研究

2014-12-06 03:24張穎高倩倩高茂庭
海洋預報 2014年5期
關鍵詞:藻類葉綠素海水

張穎,高倩倩,高茂庭

(上海海事大學信息工程學院,上海201306)

1 引言

近幾年,經濟的快速發展使得工農業生產的規模不斷擴張,導致環境污染日趨嚴重。大量富含氮、磷、鉛的排放物最終流入大海,海水的富營養化程度日益嚴重,導致赤潮等災害頻繁發生[1],使得海洋生態環境日益惡化,給海洋周邊的人類生活帶來嚴重危害。大量的研究結果表明,海水的富營養化與海水中藻類的生長繁殖密切相關,但是問題的復雜性在于:藻類的快速繁殖生長并不是簡單地和某些排放物質含量的增加呈線性遞增的關系,導致藻類爆發性繁殖的條件非常復雜,研究表明,藻類的生長與海水的硝酸鹽含量、海水鹽度、溶解氧含量、溫度、海水渾濁度等十幾個理化因子的變化密切相關[2]。海水中的葉綠素-a濃度是體現水體中生物量含量的綜合指標,目前多數研究人員將葉綠素-a的濃度作為反映海水中藻類繁殖狀態的重要表征指標[3-4]。通過分析葉綠素-a濃度的變化,可以獲取海水中藻類生物量狀況及其變化趨勢,達到對海水富營養化的有效監測[5]。

軟測量是一種以軟件算法為主的測量手段,與傳統意義上的傳感器不同,軟測量所測量的參數一般不是某個特定的物理/化學參量,而是針對具體的應用問題,采用較易直接測得的輔助測量變量,通過數學模型的計算,得到難以測量或者根本無法測量的關鍵變量值。由于影響海水中葉綠素-a 濃度的因素眾多,且相互作用復雜,直接在線測量比較困難,離線測量則需要昂貴的分析儀器,且不能保證測量的實時性。采用軟測量方法間接推斷其在海水中的含量可以較好地解決這一測量技術難題[6]。目前建立軟測量模型的方法主要有:BP神經網絡算法、模糊神經網絡算法、經驗預測法、多元回歸分析方法等。本文采用支持向量回歸機算法(SVR)對海水葉綠素-a濃度進行軟測量,以期達到具有較好穩定性和精確性的軟測量效果。

支持向量回歸機算法(SVR)[7-8]是建立在統計學習理論的VC 理論和結構風險最小化原理之上的,根據有限的樣本信息,在模型的復雜性和學習能力之間尋求最佳折中,以獲得最好的泛化能力——推廣能力。與其他的研究方法相比,該方法能更好地優化各參數,避免局部最優解,具有較好的全局收斂性。

2 支持向量回歸機算法

2.1 算法描述

由于SVR算法具有過擬合現象少、對于特征過多所造成的維數災難不明顯、易收斂于全局解、核函數使用靈活等優點,所以SVR 算法在解決小樣本、非線性、高維模式識別以及函數擬合等問題中得到廣泛的運用[9]。

非線性支持向量機回歸的主要思想是:通過適當的核函數wx+b=0 將低維空間中數據x映射到高維特征空間,并在這個空間進行線性回歸。如圖1所示。

根據結構風險最小化原理,SVR 算法在學習過程中主要是折中考慮降低樣本的經驗風險(訓練誤差)和最小化置信范圍(結構復雜度帶來的風險)。SVR算法學習過程的目的是線性回歸,即對可用的獨立同分布數據進行處理,找到一個函數f(x)可近似為y(x)值,即估計數據:

若在ε 精度下,函數f(x)不能估計所有(xi,yi)數據,則引入松弛變量ξ ,那么尋找最小w 的凸優化問題可以最終歸為解下面二次規劃的問題:

式中,常數C(C>0)作為懲罰因子,用來平衡經驗風險和置信范圍的比例。

非線性回歸函數為:

圖1 原始空間向高維特征空間映射

入拉格朗日函數和對偶變量,如下所示:

在(3)式約束條件下,其中由(4)式得到w,將(6)式最大化求出參數的值,最后將w 的值帶入非線性回歸函數中,可以表示為:

2.2 支持向量回歸機的模型構造

本文對反映海水藻類繁殖狀態的海水葉綠素-a濃度軟測量模型的構造采用如圖2所示的形式。

首先,采用灰色關聯分析法對原始數據進行關聯性分析,提取與葉綠素-a濃度關聯度較大的環境因子作為主控輔助變量。然后選定訓練集和測試集,并使用SVR 算法對訓練集進行訓練,最終用得到的模型對測試集進行預測,并分析預測結果的均方差。

圖2 模型構造流程圖

根據SVR 算法的思想,本文使用如圖3 所示的支持向量回歸機體系結構圖對葉綠素-a 濃度進行軟測量,其中x1,x2,…,xi表示本文采用灰色關聯分析后得到的主控輔助因子,k(x,xi)表示核函數[10],本文采用的核函數為徑向基核函數(RBF),表示為:

式中,xi為核函數中心,σ 為函數的寬度參數,控制函數的徑向作用范圍。

3 主要輔助因子的選擇

3.1 灰色關聯分析法概述

灰色關聯分析(Grey Relational Analysis,GRA)方法是分析系統之間相似或相異的關聯程度,主要用于分析系統各因素之間相關特征,從而挖掘出系統的主要影響因素[11]?;疑P聯度是兩個系統或兩個因素間關聯性大小的量度,它描述系統發展過程中因素間相對變化的情況,在一個系統中的兩種因素,如果在發展過程中相對變化態勢一致性較高,則兩者的灰色關聯度較大;反之,灰色關聯度就較小。本文采用灰色關聯分析方法,分別分析各個輔助影響因子與主因子(葉綠素-a 濃度)之間的關聯程度,選擇與主因子關聯度較大的幾個因子作為輸入變量,從而在保留原始數據大部分信息的情況下,保證預測的有效性。

3.2 數據來源及描述

圖3 支持向量回歸機的體系結構

本文選取的數據是從長江口南匯嘴近海海域布置的采樣點連續采集的觀測數據,時間是從2012年3月15日至2012年5月15日,從中選取300組水環境相關數據作為本次實驗的樣本數據。根據歷年這一海域海洋環境因子觀測資料可知,上述時間段也是這一海域藻類繁殖狀況異常的多發季節。每組數據分別包括:溫度、溶解氧含量、硝酸鹽含量、透光度、酸堿度、葉綠素-a 濃度、傳導率、鹽度8個因子,并采用灰色關聯分析法分別對8 種因子進行相關性分析,從而得到葉綠素-a 濃度與其它7 個影響因子的相關度。根據各個影響因子的相關度,從300 組數據中提取出主控因子,并將其1—200 組數據作為訓練集,對SVR 神經網絡進行訓練,得到訓練模型;將其201—300 組數據作為測試集,并使用訓練得到的模型對其進行預測。

3.3 數據相關度分析

由于葉綠素-a 濃度是表征水體富營養化程度的典型指標之一,所以,本文將葉綠素-a 濃度作為主因子(x0),其余7個因子作為影響因子,包括:溫度TP(x1)、溶解氧DO(x2)、酸堿度PH(x3)、鹽度SA(x4)、傳導率CO(x5)、光強度LI(x6)和硝酸鹽含量NI(x7)。采用灰色關聯分析法進行數據相關度分析,本文將相關度大于0.65的影響因子作為主控因子。這樣做的目的是在保留原始數據大部分信息的情況下,保證預測的有效性。

數據相關度分析步驟如下:

步驟1:由于在實際問題中,不同的影響因子往往具有不同的量綱,而在計算關聯系數時,要求量綱相同,因此,需要對各個影響因子做初始化處理,無量綱化處理方法表示為:

步驟2:選取主因子序列,表示為:

式中,k 表示數據個數,x0表示葉綠素-a濃度,n=300。由于數據是根據時間序列來記錄的,也可以代表時間序列,本文為了方便說明,把k 作為時刻來論述。

步驟3:選取影響因子序列,表示為:

式中,m 代表環境影響因子個數,由于本文研究的影響因子有x1、x2、x3、x4、x5、x6、x7,所以m=7。

步驟4:計算關聯系數,計算公式表示為:

式中,ζi(k)為影響因子序列xi對主因子列x0在k 時刻的關聯系數,ρ 為分辨系數(ρ ∈[0,1]),本文取ρ=0.5。

步驟5:由公式5 可以得到300 個相關系數,由于300個信息過于分散,不便于比較分析,為此本文對關聯系數進行平均化處理,計算公式為:

式中,ri為輔助影響因子序列xi對主因子序列x0的關聯度。根據上述步驟,可計算出輔助影響因子(x1ˉ x7)與主因子葉綠素-a(x0)濃度之間的相關度,結果如圖4所示。

圖4以柱形圖的形式直觀的顯示了個影響因子與主因子之間的相關度,其中1—7 分別代表溫度、溶解氧含量、酸堿度、鹽度、傳導率、光強度和硝酸鹽含量與葉綠素-a濃度的相關度。

由圖4 的結果分析可知:溫度、含鹽量與葉綠素-a 濃度的相關度均在0.2 左右,傳導率與其的相關度只有0.0898,所以可以忽略這3 個子因素對葉綠素-a 濃度的影響。溶解氧含量、酸堿度、光強度和硝酸鹽量與葉綠素-a 濃度相關程度均大于0.65,因此,本文將溶解氧含量、酸堿度、光強度和硝酸鹽含量作為軟測量訓練模型的輸入因子。

圖4 相關度柱形圖

4 基于SVR的葉綠素-a濃度軟測量

根據灰色關聯分析法處理后的結果,將溶解氧、酸堿度、光強度和硝酸鹽量作為訓練模型的輸入因子,選取葉綠素-a 濃度(μg/L)作為模型唯一的輸出因子。

根據上述樣本數據、基于SVR 算法進行葉綠素-a濃度軟測量模型的建模,其結果如圖5和圖6所示。圖5是利用樣本數據進行學習建模的結果,圖6是針對建模結果進行軟測量測試驗證的結果。

針對相同的樣本數據,應用T-S 模糊神經網絡進行軟測量模型建模的結果如圖7 和圖8 所示,其中,圖7 是利用樣本數據進行學習建模的結果;圖8是針對建模結果進行軟測量測試驗證的結果。應用BP 神經網絡進行軟測量模型建模的結果如圖9和圖10 所示,其中,圖9 是利用樣本數據進行學習建模的結果,圖10是針對建模結果進行軟測量測試驗證的結果。

針對三種算法的測試結果進行均方誤差比較如表1所示。

圖5 基于SVR方法的樣本訓練

圖6 針對SVR模型的泛化性測試

圖7 基于T-S模糊神經網絡的樣本訓練

圖8 針對T-S模糊神經網絡的泛化性測試

圖9 基于BP神經網絡的樣本訓練

圖10 針對BP神經網絡的泛化性測試

表1 幾種算法的測試均方誤差比較

從表1 可以看出,SVR 算法的精確度最高,T-S模糊神經網絡雖然也能達到一定精度,但是其算法較SVR 復雜,占用系統資源較大。BP 神經網絡則誤差較大,實際中還存在學習收斂穩定性欠佳的問題。

SVR方法具有較好的樣本學習收斂性,模型穩定可靠,運算量適中,適合于在線辨識學習及模型在線校正。通過實驗可以發現,針對這一海域的觀測數據,上述方法具有較好的軟測量建模及測試驗證效果,它表明在這一海域條件下,上述方法是適合于針對海水藻類繁殖狀態進行軟測量預估的。此方法可對類似狀態下海水環境關鍵理化因子的軟測量提供借鑒。

5 結束語

大量研究表明,海水富營養化過程中大量繁殖的鞭毛藻等藻類植物的主要表征生物量即是葉綠素-a,因此,海水葉綠素-a 濃度可以有效反映海水藻類的繁殖狀態,葉綠素-a濃度越高說明藻類在該水域繁殖越快。本文旨在提供一種用于實時獲取海水葉綠素-a濃度的軟測量方法,它提供了一種間接獲取藻類繁殖狀態信息的途徑。籍于此還需要后續開展針對藻類繁殖狀態評估方法等研究工作。

SVR 的最終決策函數是由其獲得的支持向量所確定的,計算的復雜性取決于這些支持向量的數目,而不是樣本空間的維數。通過融合灰色關聯分析法針對數據樣本進行相關度分析,可以實現針對軟測量模型進行降維的目的。本文將數據預處理與軟測量模型構建相結合,將篩選出的主要輔助變量作為軟測量模型的輸入變量,將反映海水藻類生物量指標的葉綠素-a 濃度作為軟測量模型輸出變量,實現了針對海水藻類繁殖狀態軟測量的目的。

[1]王冬云,黃焱歆.海水富營養化評價的人工神經網絡方法[J].河北建筑科技學院學報,2001,18(4):27-29.

[2]張麗旭,張小偉.用于海洋環境科學的一種新方法—影響因子分析法[J].海洋科學進展,2004,22(1):33-36.

[3]Lee J H W, Huang Y, Dickman M. et al. Neural network modelling of coastal algal blooms [J]. Ecological Modelling, 2003, 159(2):179-201.

[4]Melesse A M, Krishnaswamy J, Zhang K Q. Modeling Coastal Eutrophication at Florida Bay using Neural Networks[J].Journal of Coastal Research,2008,24(2):190-196.

[5]鄭丙輝,張遠,富國,等.三峽水庫營養狀態評價標準研究[J].環境科學學報,2006,26(6):1022-1030.

[6]李雪,劉長發,朱學慧,等.基于BP 人工神經網絡的海水水質綜合評價[J].海洋通報,2010,29(2):225-230.

[7]Vapnik V, Chapelle O. Bounds on error expectation for support vector machines[J].Neural Computation,2000,12(9):2013-2036.

[8]Abe S,Inoue T. Fuzzy support vector machines for multiclass problems[C]. ESANN’2002 Proceedings- European Symposiumon Artificial Neural Networks,Bruges,Belgium,2002:113-118.

[9]Zaiwen L, WANG X, Lifeng C, et al. Research on Water Bloom Prediction Based on Least Squares Support Vector Machine[A].2009 World Congress on Computer Science and Information Engineering[C].LosAngeles,2009:764-768.

[10]李琳,張曉龍.基于RBF 核的SVM 學習算法的優化計算[J].計算機工程與應用,2006,29:190-192,204.

[11]王紅瑞,閆五玖.環境質量的模糊綜合評判—灰色關聯分析復合模型及實例分析[J].北京師范大學學報,1997,20(4):39-43.

猜你喜歡
藻類葉綠素海水
藻類水華控制技術及應用
細菌和藻類先移民火星
提取葉綠素
喝多少杯海水能把人“渴死”?
桃樹葉綠素含量與SPAD值呈極顯著正相關
吃蔬菜有個“321模式” 三兩葉菜類,二兩其他類,一兩菌藻類
海水為什么不能喝?
葉綠素家族概述
海水
浮游藻類在水體PAHs富集與降解中的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合