?

基于ABC—LSSVM的芹菜總黃酮提取量預測

2015-04-17 12:08曾燕王曉成新文
江蘇農業科學 2015年1期
關鍵詞:總黃酮芹菜預測

曾燕 王曉 成新文 等

摘要:針對傳統的芹菜總黃酮含量測定過程復雜、時間長的問題,提出一種基于人工蜂群算法(ABC)優化最小二乘支持向量機(LSSVM)的芹菜總黃酮提取量預測方法。首先對標準人工蜂群算法進行改進,然后利用改進的人工蜂群算法對最小二乘支持向量機的核寬度和正規化參數進行尋優,最后對芹菜總黃酮的提取量進行預測。結果表明,該方法具有預測精度高、性能穩定的特點,有利于實現芹菜總黃酮提取量的網絡在線預估和優化控制。

關鍵詞:人工蜂群算法;最小二乘支持向量機;總黃酮;預測;芹菜

中圖分類號: S126文獻標志碼: A文章編號:1002-1302(2015)01-0298-03

收稿日期:2014-09-25

基金項目:四川理工學院科研項目(編號:2013KY04);釀酒生物技術及應用四川省重點實驗室開放基金(編號:NJ2011-09)。

作者簡介:曾燕(1979—),女,四川自貢人,碩士,講師,研究方向為人工智能。E-mail:zy261365@suse.edu.cn。芹菜是1年生或2年生的傘型花科植物,在15世紀被作為藥食兩用栽培植物引入中國?,F代醫學研究發現,芹菜莖、葉中含有豐富的黃酮類物質,具有清除自由基、抗氧化、抑菌、抗病毒、抗癌、抗腫瘤作用,對心血管疾病和肝病也有一定療效[1-2]。從芹菜中提取黃酮類物質,生產具有抗氧化作用的天然保健產品,已成為農產品資源高效利用的研究熱點[3-4]。

目前測定芹菜總黃酮提取量大多采用分光光度法、光譜法等方法,測定過程復雜、時間長、成本較高[5]。采用軟件方法實現芹菜總黃酮提取量預測,是解決此類生物量參數難以實時在線測量和控制的有效方法[6]。近年來神經網絡、支持向量機等預測技術越來越受到重視[7-8],其中神經網絡技術對樣本數據量要求高,應用受限;支持向量機預測技術雖然適用于非線性小樣本數據,但其泛化能力有限,對異常樣本敏感,在實際應用中容易出現大的預測偏差。最小二乘支持向量機技術提高了泛化能力,具有精度高、性能穩定的優點,可用于農業現代化應用中[9]。影響最小二乘支持向量機預測精度的重要參數指標是正規化參數和核寬度系數,傳統的交叉驗證確定法可保證較高的預測精度,但預測速度慢,限制了其實際應用。本研究采用改進的人工蜂群算法對最小二乘支持向量機的參數指標進行優化選擇[10-11],避免了標準人工蜂群算法過早收斂問題,實現了芹菜總黃酮提取量的快速預測,以期對蔬菜黃酮類物質提取量的在線測量提供參考。

1算法基礎

1.1最小二乘支持向量機

最小二乘支持向量機(LSSVM )對支持向量機(SVM)進行了改進,很好地解決了小樣本、非線性、高維數的問題,提高了問題的求解速度和泛化能力。最小二乘支持向量機通過構建如下回歸函數,將非線性問題轉化為高維特征空間的線性估計問題。

f(x)=ωTφ(x)+b。(1)

式中:φ(x)是核空間映射函數;ω為權值向量;b為偏置量。

最小二乘支持向量回歸算法就是求解如下約束優化問題。

minJ(ωξ)=12ωTω+12γ∑ni=1ξ2i;(2)

s.t. yi=ωTφ(xi)+b+ξi,i=1,2,…,n。(3)

式中:ξi為第i個樣本真實值與預測值的誤差;γ為可以動態調整的正規化參數。

可采用拉格朗日函數求解這個優化問題。

L(ω,β,ξ,α)=12ωTω+12γ∑ni=1ξ2i-∑ni=1αi[ωφ(xi)+b+ξi-yi]。(4)

式中:αi∈R(i=1,2,…,N)為Lagrange乘子。a和b的求解與核函數的選擇有關,常選擇如下形式的徑向基核函數(RBF)。

K(xi,xj)=exp-|xi-xj|22σ2。(5)

式中:σ為核寬度。

由此可見,對于最小二乘支持向量機,核寬度σ和正規化參數γ是2個重要參數,它們的選取直接影響著算法的學習能力和泛化性能。

1.2人工蜂群算法的改進

人工蜂群算法(ABC) 模擬蜜蜂群智能搜索行為,具有控制參數少、算法簡單等優點,受到國內外學者廣泛關注。但是標準ABC算法局部搜索能力較差,容易產生早熟和停滯現象[11]。

改進標準ABC算法的隨機初始化種群生成方式,采用反向學習[12]的初始化策略,確保初始種群的多樣性,可以提高求解效率和改善解的質量。

首先,隨機生成初始解集{xij|xij∈[minj,maxj]}、(i,j分別為解的個數和維度,minj,maxj分別為第j維的下界、上界)。然后,對每個初始解求出對應的反向解,計算方法如下。

xij=minj+maxj-xij。(6)

最后,對隨機種群和反向種群的合集進行排序,選擇適應度較優的解作為初始種群。

在標準ABC算法中,跟隨蜂根據雇傭蜂種群適應度大小,按照輪盤賭策略選擇1個雇傭蜂跟隨,易導致群體多樣性下降,算法過早收斂。采用“信息素-靈敏度”模型代替輪盤賭選擇策略[11]。

信息素反映了解的質量,信息素的大小與目標函數值呈正比,每完成1次搜索過程,信息素進行動態更新。靈敏度確定搜索的區域方向。信息素和靈敏度相結合的方法如下。

p(i)=f(i)-fminfmax-fminfnax≠fmin

0p(k)≤s(i)。(7)

式中: f(i)為個體的適應度值;fmax,fmin為最大適應度值和最小適應度值;p(k)為不等于i的第k個食物源的信息素;s(i)為第i個跟隨蜂的靈敏度:s(i)~U(0,1)。

“信息素-靈敏度”模型在一定程度上避免了算法陷入局部最優,保證了算法快速進化的方向。endprint

2預測建模

2.1芹菜總黃酮成分提取和測量方法

對于芹菜總黃酮的提取,首先將芹菜原料進行低溫烘干,以降低機械粉碎的強度。將其粉碎后,稱取芹菜干粉1 g于50 mL錐形瓶中,加入一定量乙醇浸泡,從而使有效成分充分溶解。然后將浸泡好的溶液投入超聲波提取器提取,之后抽濾、定容,作為測定總黃酮含量的待測液,最后測定總黃酮含量。芹菜總黃酮的提取工藝流程如圖1所示。

采用Al(NO3)3-NaNO2分光光度方法[4] 測定總黃酮含量。取上述樣品液2 mL,用30%乙醇溶液定容至5 mL,加入15% NaNO2溶液0.3 mL,搖勻靜置6 min,再加入10%Al(NO3)3 溶液0.3 mL,搖勻靜置6 min后加入1 mol/L NaOH 溶液4 mL,再用蒸餾水定容,搖勻靜置15 min后測定吸光度,根據吸光度計算樣品液中總黃酮含量。由此可見,芹菜總黃酮提取測定過程復雜、時間長。

2.2基于ABC-LSSVM的芹菜總黃酮提取量預測模型

采用吸光度方法測定芹菜總黃酮提取量,由于測定過程復雜、時間長,制約了其生產應用。因此,構建芹菜總黃酮提取含量的預測模型,減少試驗測量次數,實現在線實時預測尤為必要?;贏BC-LSSVM的芹菜總黃酮預測步驟如下:(1)對芹菜總黃酮提取試驗中的相關數據進行歸一化處理;(2)參數初始化,設置最大迭代次數,按反向學習策略生成初始解,計算適應度函數值;按適應度函數值優劣進行排序,排在前50%的為雇傭蜂,排在后50%的為跟隨蜂;(3)對于第n步的雇傭蜂,記錄最優值并展開鄰域搜索,產生1個新位置;(4)雇傭蜂按貪婪選擇方法,當搜索解優于記憶中的最優解時,替換記憶解,反之保持不變;(5)全部雇傭蜂完成鄰域搜索后,跳擺尾舞與跟隨蜂共享食物源信息;跟隨蜂按公式(7)的選擇機制選擇雇傭蜂;(6)同(3)(4),跟隨蜂記下種群最終更新后達到的最優適應度值以及相應的參數; (7)當跟隨蜂的鄰域搜索次數到達閥值而仍未找到更優位置時,偵察蜂重新初始化食物源位置;(8)如果滿足停止準則,則停止計算,輸出最優適應度值及相應參數,否則轉向(3);(9)根據最優解得到的LSSVM參數對測試數據集進行仿真,用建立的芹菜總黃酮預測模型對總黃酮提取量進行預測。

3結果與分析

根據芹菜總黃酮提取試驗,發現總黃酮提取量主要與提取時間、乙醇濃度、料液比等3個非線性因素的關系最為密切,三者之間的交互作用較小,且容易測量。因此,在5種料液比(1 ∶10、1 ∶20、1 ∶30、1 ∶40、1 ∶50, g ∶mL)、5種乙醇濃度水平(50%、60%、70%、80%、90%)、5種提取時間(10、20、30、40、50 min)條件下進行芹菜總黃酮提取的單因素試驗。

在單因素試驗基礎上,選用L9(33)正交試驗表,考察料液比、提取時間、乙醇濃度對芹菜總黃酮提取的影響。因素水平見表1。

表1芹菜總黃酮提取條件正交試驗因素與水平

水平因素提取時間(min)乙醇濃度(%)料液比(g ∶mL)130701 ∶20240801 ∶30350901 ∶40

將試驗所得的24例數據作為樣本數據,在數據歸一化之后,選取前16例試驗樣本數據作為訓練樣本數據,構建基于ABC-LSSVM的預測模型,再用后11例樣本數據作為測試數據,對該模型進行驗證。作為訓練樣本的16例原始數據如表2所示。

表2芹菜總黃酮預測模型訓練樣本數據

樣品編號提取時間

(min)乙醇濃度

(%)料液比

(g ∶mL)總黃酮含量

(mg/g)140701 ∶106.472240701 ∶206.938340701 ∶307.296440701 ∶406.902540701 ∶506.830610701 ∶306.186720701 ∶306.400830701 ∶306.651940701 ∶306.9731050701 ∶306.9381140501 ∶304.2871240601 ∶305.2901340701 ∶306.5441440801 ∶307.4751540901 ∶307.1531640701 ∶206.207

在預測仿真試驗中,計算機配置為聯想雙核E5800@3.2 GHz、2 G內存、Windows XP 操作系統,測試軟件采用Matlab 7.0。

采用改進的人工蜂群算法優化最小二乘支持向量機得到的最優化參數值為:核寬度σ=262.22,正規化參數 γ=1 969.6。將基于ABC-LSSVM預測模型仿真得到的數據與實際測量數據進行比較,結果見表3。

表3基于ABC-LSSVM的芹菜總黃酮預測結果

樣品

編號提取時間

(min)乙醇濃度

(%)料液比

(g ∶mL)實測含量

(mg/g)預測含量

(mg/g)相對誤差

(%)140801 ∶307.486.95-7.08240901 ∶307.157.180.36330701 ∶206.286.564.50440801 ∶206.496.825.09550901 ∶206.607.087.23630801 ∶306.966.92-0.55740901 ∶307.217.18-0.43850701 ∶306.466.744.28930901 ∶407.077.212.031040701 ∶406.676.771.521150801 ∶407.357.03-4.37

由表3可知,采用ABC-LSSVM的芹菜總黃酮預測模型得到的仿真數據與實測數據的最大相對誤差為7.23%,最小相對誤差為0.36%,平均相對誤差為1.14%,精度較高。實測數據與仿真數據的對比如圖2所示。endprint

圖3更直觀地描述了模型估計值與實測值的相對誤差情況?;贏BC-LSSVM的芹菜總黃酮提取量預測模型的進化曲線如圖4所示,由圖4可見,該預測模型收斂速度快、精度高、性能穩定。

4結論

芹菜總黃酮提取受提取時間、乙醇濃度、料液比等3種非線性因素的影響,可利用改進的人工蜂群算法優化最小二乘支持向量機建立芹菜總黃酮預測模型。在標準人工蜂群算法的種群初始化階段,引入反向學習策略,確保了個體分布的均勻性,并用“信息素-靈敏度”模型作為選擇策略,提高了預

測的精度和收斂速度,性能穩定,對于芹菜總黃酮提取的網絡在線估計、降低測定成本具有重要意義。

參考文獻:

[1]趙進,尤婷婷,林丹英,等. 超聲波提取芹菜總黃酮及鑒別[J]. 時珍國醫國藥,2007,18(6):1454-1455.

[2]文開新,王成章,嚴學兵,等. 黃酮類化合物生物學活性研究進展[J]. 草業科學,2010,27(6):115-122.

[3]包麗芹,韓德權. 芹菜及芹菜黃酮的藥用價值[J]. 黑龍江醫藥,2007,20(4):317-320.

[4]陳欲云,劉春麗,邊名鴻. 芹菜黃酮抗氧化作用的研究[J]. 時珍國醫國藥,2012,23(7):1718-1719.

[5]何書美,喬蘭俠,劉敬蘭. 紅外光譜法測定芹菜葉提取物中總黃酮的含量[J]. 分析科學學報,2008,24(2):201-204.

[6]俞金壽. 軟測量技術及其應用[J]. 自動化儀表,2008,29(1):1-7.

[7]王紅君,張夢,趙輝,等. 基于 BP 神經網絡的溫室黃瓜灌溉預測模型[J]. 江蘇農業科學,2013,41(11):407-409.

[8]趙辰陽,徐明. 基于 FIG -SVM 的農產品價格趨勢預測[J]. 江蘇農業科學,2014,42(5):385-388.

[9]楊瑋,孫紅,鄭立華,等. 基于土壤參數的冬小麥產量預測模型[J]. 農業工程學報,2013,29(23):118-123.

[10]朱林,陸春偉.基于改進蟻群支持向量機的氫含量軟測量建模[J]. 計算機仿真,2014,31(3):384-388.

[11]王慧穎,劉建軍,王全洲. 改進的人工蜂群算法在函數優化問題中的應用[J]. 計算機工程與應用,2012,48(19):36-39.

[12]汪慎文,丁立新,謝大同, 等. 應用反向學習策略的群搜索優化算法[J]. 計算機科學,2012,39(9):183-187. 謝雨杉,李多偉,李銀芳,等. 碘試液比色法測定α-淀粉酶抑制劑活性[J]. 江蘇農業科學,2015,43(1):301-303.endprint

猜你喜歡
總黃酮芹菜預測
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
芹菜也會“變臉”
亦食亦藥話 芹菜
芹菜百合
不同提取方法對骨碎補中總黃酮含量的影響比較
食用芹菜六注意
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合