?

RBF神經網絡在河流營養鹽預測中的應用

2019-11-12 11:38黃偉建張麗娜黃遠程瑤
現代電子技術 2019年20期
關鍵詞:仿真模型RBF神經網絡誤差分析

黃偉建 張麗娜 黃遠 程瑤

摘 ?要: 根據已監測到的水質數據進行預測一直是河流水質管理的重要組成部分,其中河流營養鹽濃度是影響水質的根本因素。文中研究RBF神經網絡在河流營養鹽濃度預測中的適用性,并與傳統的時間序列預測模型:ARIMA進行比較。以朱衣河為研究對象,對河流營養鹽主要成分之一的磷酸鹽濃度進行預測。通過采集到的時間序列數據對兩種預測模型進行仿真,并通過平均誤差和均方誤差的比較,證明基于RBF神經網絡的時間序列預測模型具有較強的預測精度和良好的推廣價值能力,在河流營養鹽預測中有較高的實用性。

關鍵詞: RBF神經網絡; 營養鹽濃度; 磷酸鹽濃度預測; ARIMA; 仿真模型; 誤差分析

中圖分類號: TN711?34; TP39 ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)20?0156?04

Application of RBF neural network in river nutritive salt prediction

HUANG Weijian1, ZHANG Lina1, HUANG Yuan1, CHENG Yao2

(1. School of Information and Electrical Engineering, Hebei University of Engineering, Handan 056038, China;

2. School of Water Resources and Hydropower, Hebei University of Engineering, Handan 056038, China)

Abstract: River nutritive salt concentration is a fundamental factor affecting water quality. The applicability of RBF neural network in river nutrient concentration prediction is studied and compared with traditional time series prediction model: ARIMA. Taking Zhuyi River as the research object, the phosphate concentration is predicted, which is one of the main components of river nutritive salt. The simulation test of the two prediction models was carried out with the collected data of time series. By comparing average error with mean square error, it is proved that the time series prediction model based on RBF neural network has high prediction accuracy, high romotional value and better applicability in prediction of river nutritive salt.

Keywords: RBF neural network; nutritive salt concentration; phosphate concentration prediction; ARIMA; simulation model; error analysis

0 ?引 ?言

隨著大數據分析技術的不斷成熟,人們發現時間序列預測方法應用性極強,它不涉及數據產生的背景,任何可用時間序列表示的信息,均可用時間序列分析理論進行預測[1]。因此,有學者將時間序列預測方法中ARIMA預測模型(自回歸積分滑動平均模型)應用到水質預測中,發現該模型既考慮了水質數據的隨機波動的干擾性,又考慮了數據在時間序列上的依存性[2]。由于ARIMA預測模型通常適用于存在線性關系的數據,而河流營養鹽濃度數據雖然有著時間上的依存性,但卻是一種非線性時序數據。因此,ARIMA預測模型得到的預測結果并不理想。

為克服該缺陷,進一步提高預測精度,有學者發現將可以逼近任意非線性函數的人工神經網絡技術與時間序列進行結合的預測模型,可以達到較高的預測精度[3];而且人工神經網絡對任意函數具有自組織、自學習的能力,同時隱含層神經元采用了激活函數,使其具有非線性映射功能,可以逼近任意非線性函數[4]。其中,徑向基函數(RBF)神經網絡除具有極強的非線性映射能力,還有良好的泛化能力,網絡結構簡單,學習速度比一般網絡快等優勢[5],在其他領域也得到了廣泛的應用[6?9]。故本文采用基于RBF神經網絡的時間序列預測模型,對影響朱衣河水質的磷酸鹽濃度數據進行預測,以期得到精確度較高的預測結果,為水質管理決策提供數據依據。

1 ?RBF神經網絡

1.1 ?RBF網絡

徑向基函數(RBF)網絡是一種向前網絡,它以函數逼近理論為基礎,能夠逼近任意非線性的函數,同時具有很好的泛化能力和較快的學習速度。RBF神經網絡由輸入層、隱含層、輸出層組成。輸入層由輸入節點組成,只傳遞輸入信號到隱含層;隱含層由神經元的變換函數,如高斯函數、格林函數等輻射狀作用函數構成,其中隱含層節點數由問題的實際需求來確定;輸出層是對輸入的響應,由輸入節點組成。

RBF網絡的主要思想是:將輸入數據直接映射到隱含層空間,用徑向基函數作為隱單元的“基”構成隱含層的空間,在此空間對輸入數據進行變換,將在低維空間中的非線性數據變換為高維空間內線性可分。這種非線性的映射關系,通過徑向基函數的中心點來確定。輸出層則是通過隱含層的線性映射得到的,即網絡的輸出是隱含層神經單元輸出的線性加權和。具體結構如圖1所示。

圖1 ?RBF神經網絡結構

由上述RBF網絡的原理可知,RBF網絡主要涉及三種可調參數:RBF的中心向量[ci]、偏值[σi]、隱含層到輸出層的權重[wik]。其中,RBF的中心[ci]的選取對網絡性能至關重要,中心太近,會產生近似線性相關;中心太遠,產生的網絡會過大。根據這三種參數的確定,可以將RBF網絡劃分為很多種學習方法,最常見的是:隨機選取中心法、自組織選取中心法、有監督選取中心法和正交最小二乘法(OLS)。本文采用基于OLS算法的RBF神經網絡,OLS算法能夠有效地自動選擇中心,從而避免網絡規模過大和隨機選擇中心帶來的數值病態問題,同時有過程簡單、學習速率高等優點[10]。

1.2 ?時間序列的RBF神經網絡預測

基于RBF神經網絡的時間序列預測模型,最主要的是需要確定好訓練樣本的輸入和輸出。為預測時間序列y(i)的值,以[X(i)=[y(i-n),y(i-n+1),…,y(i-1)]T]作為輸入,n為歷史數據長度,代表過去n天的歷史數據。因此網絡結構[11]可以表示為[y(i)=f(y(i-n),y(i-n+1),…,y(i-1))]。

由于時間序列有一定的復雜性,而且序列數據前后的關聯程度大不相同。因此,采用不同的歷史數據長度的預測模型,結果大相徑庭。本文分別采用不同的歷史數據長度,選取其中預測結果均方誤差最小的歷史數據長度,提高模型的預測性能。

2 ?實驗過程

根據監測到的朱衣河連續325天的磷酸鹽濃度數據,取前300天數據作為訓練樣本,后25天濃度作為預測驗證數據。

2.1 ?ARIMA預測過程

1) 先對數據清洗,錯誤及空缺數據采用前5天均值填補。然后將數據歸一化預處理,并對數據進行平穩性檢驗,得到原始序列的自相關和偏相關圖,如圖2所示。

根據圖2可知,原始序列并不平穩,自我相關性極高,且呈下降趨勢。因此,對原始序列進行一階差分處理,使磷酸鹽濃度序列基本平穩,得到的一階自相關圖和偏相關圖,如圖3所示。

2) 模型定階。ARIMA模型一般需要確定三個參數(p,d,q),p為自回歸項,d為差分階數,q為移動平均項數。由步驟1)可知,d=1時,磷酸鹽濃度時間序列變為平穩。p,q的取值則根據逐步試探法來確定,得到磷酸鹽濃度最有預測模型參數為ARIMA(8,1,9)。

3) 模型檢驗。估計的參數全部通過顯著性檢驗,同時判斷殘差序列為白噪聲,因此認為模型可以較好地擬合數據。

4) 進行預測。將朱衣河前300天的磷酸鹽濃度數據作為訓練樣本,預測300天之后25天的濃度數據。

2.2 ?RBF預測過程

1) 數據預處理。對原始數據進行歸一化處理。

2) 輸入輸出設計。本文經過多次嘗試采用不同的歷史數據長度的預測模型,最終確定選取歷史數據長度為14的預測模型,即由n,n+1,…,n+13天的數據作為輸入,第n+14天的數據作為輸出。

3) 選擇傳遞函數。RBF神經網絡的預測模型需要確定隱含層傳遞函數。由于高斯函數是最常用的傳遞函數,而且具有徑向對稱、形式簡單、光滑性好等優點,故本文選取高斯函數為隱含層傳遞函數,隱含層到輸出層選擇線性函數。

4) 參數設計。本預測模型需要設計的參數主要包括:網絡訓練的目標誤差DF,隱含層神經元的數目MN以及分布系數Spread的大小。RBF神經網絡的目標誤差決定隱含層神經元的數目,目標誤差越小,所需神經元數目越多。分布系數Spread的大小關乎函數近似平滑度,Spread越大越平滑,但Spread太大需要大量的神經元來適應快速變化,從而導致預測誤差過大。本模型先將Spread設置為1,以1為步長依次遞增至50。經過多次試驗,本模型設置DF=0.001,MN=125,Spread=44。

5) 訓練樣本。對樣本進行訓練,具體訓練情況如圖4所示。

圖4 ?樣本訓練情況圖

6) 進行預測。采用步驟5)得到的參數,預測301~325天的濃度數據。由于模型采用的是一步預測法,即每次預測一天的數據,在預測第i天的濃度時,以i-14,i-13,…,i-1作為輸入;在預測第i+1天的濃度時,需將之前預測到的第i天濃度也作為輸入的一部分。

2.3 ?實驗結果

經過兩種預測模型分別得到25天的磷酸鹽濃度預測數據,將兩種預測數據與實際數據進行對比可得到圖5所示的對比圖。

[8] 于巖,陳鴻昶,于洪濤.基于RBF神經網絡的微博用戶興趣預測模型[J].計算機應用研究,2015,32(12):3555?3559.

YU Yan, CHEN Hongchang, YU Hongtao. User interest prediction model based on RBF neural network [J]. Journal of computer applications, 2015, 32(12): 3555?3559.

[9] 李瑞,張悟移.基于RBF神經網絡的物流業能源需求預測[J].資源科學,2016,38(3):450?460.

LI Rui, ZHANG Wuyi. Prediction of energy demand in logistics industry based on RBF neural network [J]. Resources science, 2016, 38(3): 450?460.

[10] 單東,許新征.基于徑向基神經網絡和正則化極限學習機的多標簽學習模型[J].模式識別與人工智能,2017,30(9):833?840.

SHAN Dong, XU Xinzheng. Multi?label learning model based on radial basis neural network and regularized limit learning machine[J]. Pattern recognition & artificial intelligence, 2017, 30(9): 833?840.

[11] 周志青,鄒國防,王磊,等.基于ARIMA/RBF?NN的時間序列水質預測模型研究[J].科技通報,2017,33(9):236?240.

ZHOU Zhiqing, ZOU Guofang, WANG Lei, et al. Time series water quality prediction model based on ARIMA/RBF?NN [J]. Bulletin of science and technology, 2017, 33(9): 236?240.

猜你喜歡
仿真模型RBF神經網絡誤差分析
氣壓高度計的測量誤差分析及修正方法
基于“比值比較法”確定最佳實驗方案的研究
無線Mesh網絡發展
基于RBF神經網絡的PID自校正控制研究
基于RBF神經網絡的一回路核動力裝置典型故障診斷
電學計量的誤差分析及不確定度理論探究分析
管道流體的瞬態仿真模型
RBF神經網絡在創業板新股定價問題上的研究
一種模擬飛行訓練裝置的研究改進
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合