?

基于改進BP神經網絡的中藥水提液陶瓷膜污染預測研究

2017-03-28 04:27竇鵬偉王珍佘侃侃樊文玲
中國中醫藥信息雜志 2017年4期
關鍵詞:BP神經網絡遺傳算法

?竇鵬偉+王珍+佘侃侃+樊文玲

摘要:目的 為防治中藥水提液陶瓷膜純化過程中的膜污染問題,探索預測污染度的新方法。方法 對BP神經網絡模型進行改進,利用隱含層最佳神經元數目的快速確定方法、BP神經網絡權值和閾值的快速尋優算法,建立中藥水提液陶瓷膜污染預測模型,對207組中藥水提液數據進行網絡訓練和預測。結果 與多元回歸分析、基本BP神經網絡、RBF神經網絡等模型相比,應用改進BP神經網絡模型進行預測實驗的擬合誤差更小,均方誤差僅為0.005 7;此外,改進BP神經網絡模型的性能更加穩定,在20次隨機運行實驗中達到預設目標的成功率高達95%。結論 改進模型具有很好的網絡性能、擬合效果和預測能力,能夠穩定準確地預測膜污染度。

關鍵詞:中藥水提液;膜污染;BP神經網絡;隱含層神經元;遺傳算法

DOI:10.3969/j.issn.1005-5304.2017.04.023

中圖分類號:R2-05;R284.2 文獻標識碼:A 文章編號:1005-5304(2017)04-0092-05

Study on Forecasting Ceramic Membrane Fouling in TCM Extracts Based on Improved BP Neural Network DOU Peng-wei, WANG Zhen, SHE Kan-kan, FAN Wen-ling (Institute of Information Technology, Nanjing University of Chinese Medicine, Nanjing 210023, China)

Abstract: Objective To prevent and treat of ceramic membrane purification of membrane fouling process of TCM extracts; To explore new methods of forecasting membrane fouling degree. Methods BP neural network model was improved. Methods to fast determine the optimal number of neurons in the hidden layer and fast algorithm for optimizing the weight and threshold of BP neural network were studied. Data of 207 groups of TCM extracts were under network training and prediction. Results Compared with the models of multiple regression analysis, basic BP neural network and RBF neural network, the error of the improved BP neural network model was less than that of the BP neural network model, and the mean square error was only 0.005 7. In addition, the improved BP neural network model performance was more stable. In the 20 random running experiments, the goal of the success rate achieved up to 95%. Conclusion The improved model has a good network performance, the fitting effect and prediction ability, and can forecast the fouling degree of membrane stably and accurately.

Key words: TCM extracts; membrane fouling; BP neural network; hidden layer neuron; genetic algorithm

中藥水提液的純化技術是中藥制劑前處理中應用最多的工藝方法之一。陶瓷膜因具有耐高溫、化學性質穩定、抗污染性強、機械強度高等優點[1],被廣泛應用于中藥水提液的純化過程。然而,膜污染是制約陶瓷膜精制中藥的關鍵問題。

膜污染是指由于被過濾液中的微粒、膠體離子、溶質分子與膜存在物理化學作用而引起的各種粒子在膜表面或膜孔內吸附或沉積,造成膜孔堵塞或變小并使膜的透過流量與分離特性產生不可逆變化的一種現象[2]。中藥水提液組成復雜,是一種含有懸浮的固體微粒、膠體粒子和完全溶解溶質分子的復雜混懸體,在分離過濾操作時膜極易被污染,造成膜通量銳減[3-4]。目前,中藥水提液陶瓷膜膜污染機理尚不明確,過濾過程缺乏系統性理論指導及有效的膜污染控制手段。

中藥水提液陶瓷膜膜污染是多種復雜因素綜合作用的結果,具有較強的不確定性,難以采用特定函數模型描述。要實現對膜污染的準確預測,需要建立合理實用的預測模型。BP神經網絡是近年被廣泛應用的一種模擬人腦神經系統結構和功能的人工智能方法,是一種解決非線性、不確定性問題的數學模型,具有連續傳遞函數的多層前饋人工神經網絡,訓練方式為誤差反向傳播算法,并以均方誤差最小化為目標不斷調整網絡的權值和閾值,最終能高精度地擬合數據[5]。BP神經網絡具有較強的學習和適應能力,適合針對中藥水提液復雜系統建模,在處理具有非線性特點的中藥水提液陶瓷膜膜污染預測問題方面,比一般的線性、非線性模型更有優勢。endprint

1 BP神經網絡

1.1 拓撲結構

BP神經網絡是按誤差逆傳播算法訓練的多層前饋網絡,通過訓練樣本來學習和存貯大量輸入-輸出模式映射關系,無需事先揭示及描述映射關系的數學方程。學習規則采用最速下降法,通過誤差反向傳播不斷調整網絡的權值和閾值,使網絡的整體誤差最小[6-8]。

BP神經網絡的拓撲結構包括輸入層、隱含層和輸出層,其中可包含1個或多個隱含層。各層次的神經元之間形成全互連接,同層神經元之間無反饋連接,見圖1。

1.2 基本原理及其缺陷

BP神經網絡由信號的正向傳播和誤差的逆向傳播2部分組成[9]。設輸入層神經元為P=[p1,p2,…pi],隱含層神經元為S=[s1,s2,…sk],輸出層神經元為A=[a1,a2,…,aj], 表示輸入層第i個神經元與隱含層第k個神經元之間的連接權值, 表示隱含層第k個神經元與輸出層第j個神經元之間的連接權值;隱含層的激勵函數為f1,輸出層的激勵函數為f2, 表示隱含層中各神經元的閾值, 表示輸出層中各神經元的閾值。

1.2.1 信息的正向傳遞 輸入層各神經元與隱含層各神經元之間以相應的權重連接,隱含層的第1個神經元 ,從輸入層的每個神經元處得到輸出值,加權求和 ,加上閾值 ,通過激勵函數f1,得到該神經元的輸出值為 。

輸出層第1個神經元a1接收隱含層每個神經元輸出值,并加權求和得 ,加上閾值 ,通過激勵函數f2,得到輸出層該神經元的輸出值為 。

1.2.2 誤差的反向傳播 N個數據樣本進入輸入層正向傳播,經過隱含層各神經元處理,傳向輸出層,得到實際輸出值A,將實際輸出值A與期望輸出值T進行誤差分析,比較并計算實際輸出與期望輸出的均方誤差 。

如果MSE未達到精度要求ε,則進入反向傳播過程,把均方誤差信號MSE以梯度形式,按原來正向傳遞的通路逐層進行反向傳播,并將誤差信號MSE分攤給各層的所有神經元,從而獲得各層神經元的誤差信號MSEj(j=1,2,3),將此誤差信號MSEj作為修正各連接權值和閾值的依據,并對其修改。

重復進行網絡信息的正向傳遞和網絡誤差的反向傳播過程,直至均方誤差MSE達到精度要求或者訓練達到最大迭代次數。

BP神經網絡在實際應用中存在一些缺陷[10],其中在中藥分析領域有2個較明顯的缺陷:第一,BP神經網絡的建模過程必須構造一定的隱含層結構,但尚無合適的方法確定隱含層的神經元數,而隱含層神經元數過少或過多都會造成模型預測結果不準確;第二,BP神經網絡的初始權值和閾值是隨機產生的,權值和閾值的取值情況又決定著數據擬合的效果,因此該模型具有不穩定性。

2 改進的BP神經網絡模型

2.1 隱含層神經元數

利用區間估算方法快速確定BP神經網絡隱含層神經元數。具有單隱層的BP神經網絡模型能夠映射所有連續函數,在不約束隱含層神經元數的情況下,單隱層的BP神經網絡模型能夠實現任意的非線性映射[11]。因此,本研究選用單隱層模型。

隱含層神經元數的確定是BP神經網絡模型中非常關鍵和復雜的問題,目前尚無標準方法來確定最佳隱含層神經元數。如果隱含層神經元數過少,會使得BP神經網絡性能不佳,不能產生足夠的連接權組合來滿足網絡對樣本的學習需求;如果隱含層神經元數過多,極易陷入局部最小值,達不到最優點,出現過擬合現象[12]。許多學者通過試湊法[13-15]歸納出了確定隱含層神經元數目的一些經驗性公式,如 、 、 ,其中k為隱含層神經元數目,n為輸入層神經元數目,m為輸出層神經元數目,a為常數(一般a∈[1,10])。

實踐表明,最佳隱含層神經元數常介于 和 之間,因此本研究采用區間估算來快速確定BP神經網絡隱含層神經元數的方法。具體步驟:①構建一個單隱層的BP神經網絡結構,網絡輸入層神經元數目為n,輸出層神經元數目為m,初始隱含層神經元數目 ;②初始化BP神經網絡,通過權值直接確定法[16]設置網絡各層的連接權值、閾值,并設置精度要求ε;③網絡訓練,計算均方誤差MSE;④若 ,隱含層增加1個神經元數目,返回步驟③,否則停止運算;⑤比較不同隱含層神經元數下的網絡均方誤差,選擇最小均方誤差所對應的隱含層神經元數作為最佳隱含層神經元數。

2.2 初始權值和閾值

針對BP神經網絡存在的“網絡初始權值和閾值隨機性”問題,本研究采用遺傳算法來優化BP神經網絡的初始權值和閾值。遺傳算法[17-18]是模擬達爾文的遺傳選擇和自然淘汰的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優解的方法。遺傳算法從1組隨機產生的初始解(稱為群體)開始搜索過程。群體中的每個個體都是問題的1個解,稱為染色體;染色體在后續迭代中不斷進化,生成下一代染色體。染色體的優劣通過適應度函數衡量。根據適應度的大小從上一代和后代中選擇一定數量的個體作為下一代群體繼續進化,直至發現最好的染色體,即問題的最優解。

遺傳算法的目標是尋找所有進化代中能夠使網絡均方誤差最小的網絡權重,但由于遺傳算法只能朝著使適應度函數值增大的方向進行,所以本研究采用均方誤差的倒數作為適應度函數。當該適應度函數取得最大值時,BP神經網絡獲得最佳權值和閾值。計算公式: 。式中 表示第i條染色體的適應度值;MSEi表示根據第i條染色體確定的BP神經網絡權值和閾值時預測值A與期望值T的均方誤差。

利用遺傳算法進行BP神經網絡模型權值和閾值快速尋優的具體步驟:①通過編碼方式生成初始種群;②設置適應度函數;③計算群體中所有個體的適應值;④選擇適應度高的個體執行遺傳操作;⑤若達到終止條件,則返回最佳個體,即BP神經網絡的初始權值和閾值;若未達到終止條件,則以指定的最大遺傳步數為終止計算準則?;谶z傳算法的BP神經網絡流程圖見圖2。endprint

3 中藥水提液陶瓷膜膜污染預測實驗

3.1 實驗數據

3.1.1 參數體系 根據膜科學原理和經驗規律,中藥水提液中的共性高分子、物理化學性質和阻力分布等情況會對膜過程產生影響,是引起膜污染的重要因素??紤]到實際測量的可行性,選擇測定5種高分子物質(固含含量、果膠含量、淀粉含量、蛋白含量和鞣質含量)、6種物化性質(pH值、電導率、鹽度、濁度、黏度、密度)及3種阻力分布特征量(膜自身阻力、濃差極化阻力和表面沉積阻力),建立中藥水提液膜過程參數體系。

3.1.2 數據樣本 根據中藥水提液膜過程參數體系,通過實驗測定了207組中藥水提液數據,其中145組數據(70%)作為訓練集,62組數據(30%)作為測試集。

本實驗目的為通過對中藥水提液的共性高分子含量、物化性質和阻力分布特征量的分析來預測膜污染度,因此輸入向量為固含含量等14個屬性值,輸出向量為膜污染度,見表1。

3.1.3 數據歸一化 由于輸入向量的數量級相差較大,直接將原始數據輸入BP神經網絡進行網絡訓練將使網絡性能和收斂性較差,因此需要對輸入向量進行歸一化處理,把數據限定在區間[0,1]。而輸出向量的數值符合該區間,故無需進行歸一化處理。數據歸一化處理公式:X=(X0-Xmin)/(Xmax-Xmin)。其中X為歸一化后的數值,X0為歸一化前的原始數據,Xmax和Xmin分別為該屬性原始數據的最大值和最小值。

3.2 預測模型

3.2.1 網絡結構設計 根據BP神經網絡原理,構建單隱層的網絡模型。由于輸入向量有14個屬性元素,輸出向量是1個屬性元素,故設置網絡輸入層的神經元數為14,網絡輸出層的神經元數為1。采用“2.1”項網絡隱含層神經元數的快速確定方法,估算出隱含層神經元數目區間為3~13。為了確定最佳隱含層神經元數目,設計對比實驗比較不同神經元數目的網絡誤差,實驗偽代碼見圖3,其中P、T、S、O分別為訓練輸入值、訓練目標值、預測輸入值和預測目標值。實驗結果見表2。

表2表明,在其他條件相同的情況下,模型的隱含層神經元數目設置為9時,網絡均方誤差最小,模型的預測效果最佳,即最佳網絡結構為14∶9∶1。

根據遺傳算法原理設計優化模型。遺傳算法的編碼采用實數編碼,編碼串由4個部分組成:輸入層與隱含層的連接權值、隱含層與輸出層的連接權值、隱含層閾值和輸出層閾值。設定種群初始規模為50,最大遺傳代數為100,交叉操作采用單點交叉,變異操作采用均勻變異,交叉因子為0.6,變異因子為0.3。

3.2.2 預測結果分析 根據BP神經網絡訓練特點,設置網絡結構的訓練參數:BP神經網絡的隱含層神經元激勵函數采用S型正切函數,輸出層神經元激勵函數采用S型對數函數。應用模型進行網絡訓練和測試,具體預測結果見表3。

實驗均方誤差僅為0.005 7,表明基于改進BP神經網絡的中藥水提液陶瓷膜膜污染預測模型能夠有效地對膜污染度進行預測。也證明中藥水提液中的共性高分子、物理化學性質和阻力分布特征確實是影響膜污染的重要因素。

為分析模型的精度,將本研究實驗結果與近年來中藥水提液膜污染數據建模相關文獻[19-21]進行對比,見表4。結果表明,與多元回歸分析、基本BP神經網絡和RBF神經網絡比較,改進BP神經網絡具有更好的泛化能力,擬合效果和預測精度均有較大提高。

3.2.3 模型性能評價 由于BP神經網絡的初始權值和閾值是隨機產生的,網絡模型性能與其相關,也是隨機變化的,因此為了對模型進行評價,令基本BP神經網絡模型和改進模型均隨機運行20次,分別考察達到預設目標的情況。設定平均相對誤差為10%,即均方誤差MSE為0.01,進行對比分析,見表5。

表5表明,改進的BP神經網絡穩定性更佳,說明改進算法實現了結構、權值和閾值的同步優化,避免了BP神經網絡初始化的隨機性和盲目性,提高了計算精度和效率。

4 小結

本研究表明,基于改進BP神經網絡的中藥水提液陶瓷膜膜污染預測模型能夠適應中藥水提液陶瓷膜純化過程中采集到的多維、非線性數據,能夠穩定準確地預測膜污染度,為中藥水提液陶瓷膜膜污染的預測和防治提供了有效方法。

參考文獻:

[1] SISKENS C A M. Fundamental of inorganic membrane science and technology[M]. Holland:Elsevier Science B V,1996:619-639.

[2] 劉忠洲,續曙光,李鎖定.微濾超濾過程中的膜污染與清洗[J].水處理技術,1997(4):3-9.

[3] 樊文玲,郭立瑋,林瑛.不同預處理方法對陶瓷膜澄清中藥水提液過程的影響研究[J].中成藥,2008,30(11):1709-1710.

[4] 賀立中.藥液超濾過程中的膜污染及其防治[J].膜科學與技術,2000, 20(5):49-54.

[5] 劉春艷,凌建春,寇林元,等.GA-BP神經網絡與BP神經網絡性能比較[J].中國衛生統計,2013,30(2):173-176.

[6] HOLLAND J H. Adaptation in natural and artificial systems:an introductory analysis with applications to biology,control, and artificial intelligence[M]. Cambridge:MIT Press,1992:89.

[7] 王元章,吳春華,周笛青,等.基于BP神經網絡的光伏陣列故障診斷研究[J].電力系統保護與控制,2013(16):108-114.endprint

[8] 張國翊,胡錚.改進BP神經網絡模型及其穩定性分析[J].中南大學學報:自然科學版,2011,42(1):115-124.

[9] 郝曉弘,段曉燕,李恒杰.基于BP神經網絡的迭代學習初始控制策略研究[J].計算機應用,2009,29(4):1025-1027,1031.

[10] 夏玫,陳立潮,王新波.一種提高BP神經網絡泛化能力的改進算法[J].計算機技術與發展,2009,19(9):62-64,68.

[11] CHEN T, CHEN H, LIU R W. Approximation capability in C(Rn) by multilayer feedforward networks and related problems[J].IEEE Transactions on Neural Network,1995,6(1):25-30

[12] 范佳妮,王振雷,錢鋒.BP人工神經網絡隱層結構設計的研究進展[J].控制工程,2005,12(S1):109-113.

[13] 沈花玉,王兆霞,高成耀,等.BP神經網絡隱含層單元數的確定[J].天津理工大學學報,2008,24(5):13-15.

[14] 褚輝,賴惠成.一種改進的BP神經網絡算法及其應用[J].計算機仿真,2007,24(4):75-77.

[15] 張慶慶,賀興時.BP神經網絡結點數選取的改進方法及其應用[J].西安工程大學學報,2008,22(4):502-505.

[16] 張雨濃,李巍,蔡炳煌,等.切比雪夫正交基神經網絡的權值直接確定法[J].計算機仿真,2009,26(1):157-161.

[17] 范青武,王普,高學金.一種基于有向交叉的遺傳算法[J].控制與決策,2009,24(4):542-546.

[18] 莊健,楊清宇,杜海峰,等.一種高效的復雜系統遺傳算法[J].軟件學報,2010,21(11):2790-2801.

[19] 洪弘.數據挖掘技術在中藥水提液膜分離中的應用研究[D].南京:南京中醫藥大學,2012.

[20] 郭立瑋,付廷明,李玲娟.面向中藥復雜體系的陶瓷膜污染機理研究思路與方法[J].膜科學與技術,2009,29(1):1-7.

[21] 李玲娟,郭立瑋.基于特征提取的中藥水提液膜分離預測系統[J].計算機工程與設計,2010,31(9):2023-2026.endprint

猜你喜歡
BP神經網絡遺傳算法
遺傳算法對CMAC與PID并行勵磁控制的優化
基于自適應遺傳算法的CSAMT一維反演
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應用
基于遺傳算法和LS-SVM的財務危機預測
就bp神經網絡銀行選址模型的相關研究
協同進化在遺傳算法中的應用研究
基于DEA—GA—BP的建設工程評標方法研究
復雜背景下的手勢識別方法
BP神經網絡在軟件質量評價中的應用研究 
BP神經網絡算法在數值預報產品釋用中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合