?

基于特征融合并行優化模型的環境γ 輻射劑量率數據分析與預測

2024-05-07 05:22劉君武吳允平林明貴
輻射防護 2024年2期
關鍵詞:時間序列

劉君武 吳允平 林明貴

摘 要:核電輻射環境監測網( ERMS) 能提供實時、連續的監測數據,是核電最重要的外圍監督性設施,為輻射環境評估提供數據依據。為掌握影響輻射數據質量的特征要素與及時發現環境的輻射異常,開展高壓電離室探測器( HPIC) 劑量率數據的特征挖掘與預測研究,提出一種基于奇異譜分析算法( singular spectrum analysis,SSA) 的γ 輻射劑量率數據預處理方法,從其歷史數據中學習漲幅趨勢和拐點細節變化;針對數據的多維度特點,設計一種特征融合并行優化模型預測框架,以福建寧德核電站外圍11 個自動站輻射監測數據、天頂方向總電子含量( VTEC) 數據進行實驗驗證。實驗結果表明,該模型對環境γ 輻射劑量率預測取得了較好的預測性能與精度。

關鍵詞:時間序列;輻射環境;高壓電離室探測器;γ 輻射劑量率;奇異譜分析;特征融合網絡

中圖分類號:TP183 文獻標識碼:A

核電是重要的低碳電力來源,是我國實現雙碳目標的重要途徑。核電輻射環境監測網(environment radiation monitoring system,ERMS)在核電周邊布設自動監測站,用于實時監測氣態流出物和環境γ 輻射空氣吸收劑量率等參數[1] ,以掌握核電周圍輻射環境情況。目前,我國選擇高壓電離室探測器(high pressure ionization chamber,HPIC)用于探測γ 輻射空氣吸收劑量率[2] 。

輻射環境數據具有豐富的分布特征[3] ,而經典統計學是輻射環境數據分析的理論基礎。它在環境影響趨勢研判( 評估本底水平、發現異常值等)、發現影響輻射劑量率數據質量的氣候氣象因子[4-5] 、評估輻射環境影響[6-8] 等,尤其是相關性、趨勢演化分析,發揮了巨大作用。物聯網技術整體提升了ERMS 的監測水平,以秒計上報實時數據、以分計上報5 類統計數據,形成了時空分辨率高的海量ERMS 輻射數據,有利于開展輻射數據的挖掘及應用研究[9] 。2019 年歐盟宣布開放共享近30 年的輻射環境數據庫REMdb[10] ;同年,美國能源部設專項經費資助核數據研究[11] ,力圖推動大數據分析方法在本領域應用與發展。

時序數據預測是數據挖掘領域中的一個重要分支[12] ,它能夠通過挖掘多維時間序列之間的潛在結構關系, 預測未來的趨勢。循環神經網絡(recurrent neural network,RNN)是一種具有優異擬合能力的神經網絡,特別適用于處理價值密度較低、異常數據較少的時間序列數據集。RNN 可以捕捉歷史時間序列中的特征,因此在時序數據預測領域得到了廣泛的應用[13-14] ,尤其近幾年通過優化RNN 網絡或與其他網絡融合的方式進行時序數據的實時預測,在交通流[15] 、海表面溫度[16] 、船舶航跡[17] 等預測方面取得了較好的精度。另外,奇異譜分析(SSA) 算法通過分解與重構時序數據,可以其中的不同信號,如趨勢、周期與噪聲等,并分別對它們進行預測[18] 。因此,SSA 算法在短期風速預測[19] 、風電功率預測[20] 等環境數據預測領域取得了意想不到的進展。

2018 年,Janik 等[21] 應用梯度逼近( gradientboosting,GB)、神經網絡、線性回歸等對遺失數據進行重構,解決了數據不規則和不完整的問題。2019 年,朱武峰等[22] 研究了內隱特征因子,形成20 個維度的特征輸入,基于GB 算法建立了γ 輻射劑量率在線預測模型,預測值與實際值之間具有較好的線性度。此外,林武輝等[23] 研究了自然事件對ERMS 高分辨率、長時間連續觀測數據的影響特征及其調控機制,為精準解釋核設施周邊環境監測中γ 輻射空氣吸收劑量率異常數據提供了研究依據。

基于大數據視角,本文針對海量ERMS 輻射數據的分布多樣性、變化動態性和結構復雜性等,結合太陽活動監測和氣象數據,采用深度學習技術, 設計了一種結合完全卷積網絡( fullyconvolutional networks,FCN)和RNN 兩種不同神經網絡結構的特征融合網絡模型,充分利用了其在局部特征提取和序列數據建模方面的優勢。該研究旨在為輻射環境異常發現和成因分析,以及輻射環境預報提供參考。

1 基于降噪時序的特征融合模型

1. 1 數據集描述

數據資料來源列于表1,分3 部分:(1)2015—2017 年福建寧德核電站外圍11 個自動站的歷史輻射監測數據;(2) 2015—2017 年天頂方向電子含量( vertical total electron content,VTEC) 數據;(3)同期氣象數據。

1. 2 數據集預處理

1. 2. 1 SSA 處理

使用SSA 算法對數據集中的γ 輻射劑量率進行分析處理,以其中一個監測點S 進行分析說明。

通常,在奇異譜分析中,窗口長度L 一般不能大于N / 2,如果原始序列中存在整數周期的周期性分量,L 取與該周期成正比的數(雖然L 的選擇很重要,但是其微小變化對結果的影響微乎其微)。本文的數據采樣周期為一天,采樣間隔為4 min,共有360 個采樣值。經過實驗,將所有實驗的L 都設為36,所得36 個奇異值從大到小順序排列稱為奇異譜。奇異值按從大到小順序排列的曲線如圖1 所示。

圖1 中,第1 個最大奇異值對應著趨勢成分,第2~11 個奇異值對應著振蕩成分,例如(2,3)、(4,5) 和(6,7) 等,因其成對存在,奇異值大小相近,說明它們對應著序列中的振蕩成分,第12 個奇異值開始,下降速度變慢,因此12~36 個奇異值對應著序列中的噪聲部分。

表2 列出了前10 個特征值對應的貢獻率和重構序列,這些特征值的貢獻率之和占原始序列的99. 73%。圖2 為前10 個奇異值對應的重構序列。

圖3 展示了S 點的γ 輻射劑量率序列,包括原始序列和通過SSA 算法處理后的重構序列。

綜合圖2 和圖3,可以得出如下結論:使用SSA 算法可以對γ 輻射劑量率序列進行有效分解,得到趨勢、振蕩和噪聲成分,并且前幾個成分可以很好地描述原始序列的變化。在本研究中,第1 個奇異值的重構序列為趨勢成分,貢獻率最大,達到了98. 67%;第2~11 個奇異值的重構序列為振蕩成分,貢獻率較小,累計為1. 06%;剩下的奇異值對應為重構序列的噪聲成分。將其余各個監測站的γ 輻射劑量率亦采用SSA 方法處理后,作為特征融合網絡模型的訓練數據集。

1. 2. 2 構造輸入輸出數據

本文使用經SSA 處理后的γ 輻射劑量率數據、氣象數據和太陽活動數據作為輸入數據,輸出當前時刻的目標γ 輻射劑量率數值,形成20 個維度的特征輸入,1 個γ 輻射劑量率數值的輸出。

輸入數據格式如圖4 所示,設n _ahead 為單次輸入模型的序列長度,按n_ahead+1 長度的窗口從VT 的首位開始依次向右平移, 由此獲得batch _size 個組輸入數據X 和輸出數據Y。其中,輸入數據X 的具體維度為(batch _size, seq_len,20),輸出數據的具體維度為(total _size,1,1)。

1. 3 特征融合網絡模型框架及結構

1. 3. 1 特征融合網絡模型訓練流程框架

圖5 是基于奇異譜分析和特征融合網絡模型的γ 輻射劑量率預測流程框架,其中子序列1 ~ 子序列11 分別為對應序號監測點的γ 輻射劑量率數值。

首先,使用奇異譜分析對原始γ 輻射劑量率進行預處理,降低其噪聲干擾;其次,將重構降噪后的相關站點輻射參數和目標站點的變化信息,以及氣象參數和VTEC 參數信息通過數據轉換操作,按照8 ∶ 2 形成具有標簽的時序數據訓練集和測試集;然后,將訓練集輸入到特征融合網絡進行預測模型訓練;最終,使用測試集進行γ 輻射劑量率預測,并根據設置的評價指標形成短期γ 輻射劑量率預測的最優模型。

1. 3. 2 特征融合網絡模型結構

本文采用的特征融合網絡模型包括并行長短期記憶完全卷積網絡( parallel long short-termmemory fully convolutional networks, PLSTM-FCN)和并行循環神經網絡完全卷積網絡(parallel gratedrecurrent unit fully convolutional networks,PGRU -FCN)兩種,是由長短時記憶網絡(long short-termmemory networks, LSTM ) / 門控循環單元網絡(grated recurrent unit, GRU)、全卷積層和特征融合層的并行排列組成的一種特征融合網絡模型結構[17] 。具體網絡模型結構如圖6 所示。這種結構可以有效地提取時間序列數據的局部特征和全局特征,并且能夠同時學習和預測數據的時序信息。

2 實驗結果及分析

2. 1 評價指標

采用決定系數(R2 )、均方誤差(MSE) 和均方根誤差(RMSE)作為特征融合網絡模型的評價指標,并以這3 個指標與其他模型方法進行比較。三者計算公式如下:

式中,n 為預測樣本的數量; yi 和y′i 分別表示真實值和預測值。R2 系數是度量預測值與真實值之間關系的指標,數值越大表示預測性能越好。RMSE和MSE 是度量預測值與真實值之間誤差的指標,數值越小表示誤差越小。

2. 2 實驗設置與結果分析

2. 2. 1 特征融合網絡預測模塊參數設計

由于GRU 網絡結構與LSTM 網絡結構相似,GRU 神經網絡神經元的輸入變量只有當前時刻的輸入數據和上一時刻的狀態,故僅需要將PLSTMFCN中的LSTM 神經元換為GRU 神經元即可變換為PGRU-FCN。在這一部分使用PLSTM-FCN 網絡作為實驗搭建網絡示例。

PLSTM-FCN 網絡模塊初始設置如下:FCN 特征提取模塊,一層Conv1D 層,卷積核數為15,大小為3;LSTM 模塊,LSTM 網絡為一層,神經元數為5。在實驗過程中,首先固定FCN 特征提取模塊的參數,分析LSTM 網絡的層數單元數量對模型預測結果的影響,確定LSTM 網絡的最佳參數;然后,固定LSTM 網絡的參數,分析FCN 層數和卷積核數目對預測結果的影響,以確定FCN 特征提取模塊的最佳參數;最終,得出PLSTM-FCN 網絡的參數。實驗學習訓練次數均為20 次,實驗結果列于表3和表4。

由表3、表4 結果可知,PLSTM-FCN 網絡模塊的最佳網絡結構為:FCN 局部特征提取模塊為1層conv1D 層,卷積核數為15,大小為3;LSTM 網絡預測模塊為1 層,神經元數目為10。

將LSTM 網絡神經元換成GRU 神經元,其他網絡超參數不變,設置2 個實驗組對模型進行訓練,在2 種不同神經元結構下得到的實驗結果列于表5。

2. 2. 2 預測結果及分析

將本模型與文獻[22] GB 模型進行比較,以驗證本模型γ 輻射劑量率預測方面的性能。為了提高實驗的可信度并避免偶然性,對測試集進行5次實驗,并計算了平均結果。實驗結果列于表6??梢?,本文特征融合網絡預測模型的性能相較于GB 算法有明顯提高。

圖7 為某日γ 輻射劑量率原始數據與GB 算法預測模型預測數據、特征融合網絡( PLSTM -FCN、PGRU-FCN) 預測模型預測數據的對比圖。從圖中可以看出,在相同的測試樣本,特征融合網絡預測模型在一些峰值處的擬合程度明顯優于GB 算法預測模型,這與實驗結果中評價指標的表現相符。

3 結論

γ 輻射劑量率數據易受多種因素影響,導致輻射異常的數據往往淹沒在本底數據和其他非輻射異常因素引起的異常數據中。本文研究了單一循環神經網絡中LSTM 和GRU 模型對γ 輻射劑量率預測的適配性,并提出了PLSTM-FCN 和PGRUFCN特征融合網絡模型。其中,FCN 網絡模塊負責對切片后的時序數據進行特征提取,捕捉輸入序列中的空間信息和局部結構,而RNN 則用于學習序列中的時間依賴性。通過特征融合,PLSTM-FCN 和PGRU-FCN 模型能夠更好地捕捉γ 輻射劑量率時間序列中的趨勢、周期性和噪聲等特征,從而提高了γ 輻射劑量率時間序列的預測準確性。實驗結果表明,本文模型具有較高的γ 輻射劑量率預測精確度,為后續開展輻射劑量率異常值的發現、乃至輻射環境預報提供了新思路和方法。

海量的ERMS 輻射數據,具有時間序列長、時空分辨率高和數據分布特征多樣等特點,是開展輻射環境變化及相關問題研究的重要科學大數據。未來,可以通過引入注意力機制、增加異常點檢測識別、異常數據特征分類等方法,提高異常數據發現及其可解釋性能力。

[ 1 ] 中國原子能科學研究院. 環境地表γ 輻射劑量率測定規范:GB/ T 14583—1993[S]. 北京:中國標準出版社,1993.

[ 2 ] 朱耀明,林明貴. 寧德核電廠外圍環境γ 輻射連續監測系統[J]. 海峽科學,2015,102(6):75-78+92.

[ 3 ] 沙連茂. 輻射環境監測數據合理性評價中的問題探討[J]. 環境監控與預警,2017,9(3):1-10.

[ 4 ] 陳愛,周睿東,陳文濤,等. 降雨對連續γ 輻射測量影響的數值擬合[J]. 輻射防護, 2017,37(5):361-368.

[ 5 ] 羅敦燁,沙向東,上官志洪,等. 環境γ 輻射劑量率連續監測數據影響因素和特征分析 [J]. 輻射防護, 2018,38(4):308-318.

LUO Dunye, SHA Xiangdong, SHANGGUAN Zhihong, et al. Study on influence factors and characteristics ofcontinuousmonitoring data of environmental γ dose rate[J]. Radiation Protection,2018,38(4):308-318.

[ 6 ] Bossew P, Cinelli G, Hernndez-Ceballos M, et al. Estimating the terrestrial gamma dose rate by decomposition of theambient doseequivalent rate [J]. Journal of Environmental Radioactivity, 2016,166:296-308.

[ 7 ] 王蕾,王曉芬,趙順平. 核電基地周圍輻射環境監督性監測概況[J]. 輻射防護,2019,39(2):118-123.

WANG Lei, WANG Xiaofen, ZHAO Shunping. Study on influence factors and characteristics of continuousmonitoring dataof environmental γ dose rate[J]. Radiation Protection,2019,39(2):118-123.

[ 8 ] FENG W, ZHANG Y, LI Y, et al. Spatial distribution, risk assessment and influence factors of terrestrial gamma radiationdose in China [J]. Journal of Environmental Radioactivity, 2020,222:106325.

[ 9 ] 王明明,張曉妍. 輻射環境監測領域面向大數據的應急監測數據管理與利用的探討[J]. 環境保護與循環經濟,2016,36(4):60-62.

[10] Sangiorgi M, Ceballos M A H, Iurlaro G, et al. 30 years of European Commission Radioactivity Environmental Monitoringdata bank (REMdb)—An open door to boost environmental radioactivity research[J]. Earth System Science Data, 2019(11):589-601.

[11] US DOE. US DOE(Department of Energy) to fund nuclear data research[EB/ OL]. (2019- 04- 25) [2023- 11- 15].https:/ / www. world-nuclear-news. org/ Articles/ US-DOE-to-fund-nuclear-data-research. 2019.

[12] James Douglas Hamilton. Time series analysis[M]. Princeton: Princeton University Press,1994:43-64.

[13] Mejia J, Avelar-Sosa L, Mederos B, et al. Prediction of time series using an analysis filter bank of LSTM units[ J].Computers & Industrial Engineering, 2021, 157: 107371.

[14] Farhi N, Kohen E, Mamane H, et al. Prediction of wastewater treatment quality using LSTM neural network [ J].Environmental Technology & Innovation, 2021, 23: 101632.

[15] 袁華,陳澤濠. 基于時間卷積神經網絡的短時交通流預測算法[J]. 華南理工大學學報(自然科學版),2020,48(11):107-113+122.

[16] 張雪薇,韓震. 基于ConvGRU 深度學習網絡模型的海表面溫度預測[J]. 大連海洋大學學報,2022,37(3):531-538.

[17] 胡丹,孟新,路帥,等. 一種并行LSTM-FCN 模型在船舶航跡預測中的應用[ J]. 控制與決策,2022,37(8):1955-1961.

[18] David H S. Singular spectrum analysis for time series with missing data[J]. Geophysical Research Letters, 2011,28(16):3187-3190.

[19] 李嘉文,盛德仁,李蔚. 基于分解去噪和LSSVM 的短期風速預測[J]. 能源工程,2021(4):17-24.

[20] 吳堅,項頌,閻誠,等. 基于奇異譜分析的超短期風電功率多步預測[J]. 可再生能源,2021,39(11):1548-1555.

[21] Janik M, Bossew P, Kurihara O. Machine learning methods as a tool to analyse incomplete or irregularly sampled radontime series data[J]. Science of the Total Environment,2018,630:1155-1167.

[22] 朱武峰,王廷銀,林明貴,等. 基于Gradient Boosting 算法的ERMS 輻射數據預測[ J]. 計算機系統應用,2019,28(11):37-44.

ZHU Wufeng,WANG Tingyin,LIN Minggui, et al. Prediction of ERMS radiation data based on Gradient Boosting algorithm[J]. Computer System Application,2019,28(11):37-44.

[23] 林武輝,王詩玥,黃亞萍,等. 大氣中γ 輻射空氣吸收劑量率的波動機制[ J]. 中國環境科學,2022,42(3):1097-1103.

LIN Wuhui,WANG Shiyue,HUANG Yaping,et al. Mechanism of the variable γ radiation air absorbed dose rate in theatmosphere[J]. China Environmental Science,2022,42(3):1097-1103.

猜你喜歡
時間序列
基于分布式架構的時間序列局部相似檢測算法
基于嵌入式向量和循環神經網絡的用戶行為預測方法
醫學時間序列中混沌現象的初步研究
基于時間序列分析南京市二手房的定價模型
云南銀行產業集聚與地區經濟增長研究
基于Eviews上證綜合指數預測
上證綜指收益率的影響因素分析
基于指數平滑的電站設備故障時間序列預測研究
基于時間序列的我國人均GDP分析與預測
基于線性散列索引的時間序列查詢方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合