?

基于分位數特征提取的時間序列模式分類

2015-02-20 08:15管河山唐德文
計算機工程 2015年3期
關鍵詞:離心機位數特征提取

管河山,王 謙,唐德文

(南華大學a.經濟管理學院;b.機械工程學院,湖南衡陽421001)

基于分位數特征提取的時間序列模式分類

管河山a,王 謙a,唐德文b

(南華大學a.經濟管理學院;b.機械工程學院,湖南衡陽421001)

高速運行的離心機設備,其振動狀態檢測數據通常呈現出明顯的非線性、正態分布和大樣本的特征,數據波動的隨機性使得其趨勢特征難以捕捉。為此,提出一種新的時間序列模式分類方法。采集離心機設備運行狀態的振動信號時間序列進行分析,根據對稱原理提取序列數據的分位數,構建特征向量,采用歐氏距離函數構建相似性度量,建立模式分類的判定依據,使用k-means分類算法實現狀態模式的自動分類。仿真結果表明,該方法能有效區分離心機設備運行中空載和負載的模式狀態,且比傳統的小波分析模式分類方法更加準確。

分位數;時間序列;模式分類;離心機;振動信號;小波

1 概述

序列模式分類的理論研究和實際應用比較廣泛[1-2]。特別地,時間序列模式分類技術在設備運行狀態檢測及故障診斷中得到了廣泛的應用。比如,文獻[3]從時間序列AR模型入手,建立了旋轉機械的信息距離判別函數,并將其應用在旋轉機械故障診斷專家系統的模式識別規則庫中,可進行故障監測和診斷;文獻[4]采用模糊理論和PrefixSpan算法,得到了按次序排列且有時間間隔的異常參數點對設備故障影響的規則,為企業設備運行的故障監控提供了理論依據;文獻[5]按照時間序列方式提取系統故障信息,提出了一種異常檢測算法,并對微機監測系統2組道岔動作電流進行仿真和實證;文獻[6]根據微機電系統(Microelectro Mechanical System,MEMS)陀螺儀測量數據的自相關函數和偏相關函數特征初步確定自回歸移動平均模型(Autoregressive Integrated Moving Average Model, ARIMA),再引入赤池信息量準則(Akaike Information Criterion,AIC)確定最優模型,并采用最小二乘估計法對模型參數進行估計,以此自回歸移動平均模型作為檢測、識別出車載MEMS陀螺儀的

異常測量數據的標準。上述研究極大地豐富了時間序列模式分類的理論研究和實踐應用。

考慮到不同設備運行狀態的實際情況,其狀態特征的識別方法是有所差異的,這也是設備運行狀態監測及故障診斷技術多樣化的原因之一。小波分析能有效地從信號中提取信息,通過伸縮和平移等運算功能對函數或信號進行多尺度細化分析,解決了Fourier變換不能解決的許多困難問題,基于小波分析的模式識別方法得到了極為廣泛的研究和應用[7-9]。

通常情況下,高速運行離心機設備的振動信號數據呈現出明顯的非線性、正態分布和大樣本的特征,實現該類設備的在線監控需要借助快速的時間序列模式識別技術。為此,本文提出一種基于分位數特征提取的時間序列模式分類方法。對高速運行的離心機設備狀態監測展開分析,通過仿真實驗采集相關振動信號時間序列數據,提取序列數據的分位數,構建特征向量,采用聚類方法實現模式的自動分類,并從分類準確率角度與小波分析方法進行實驗效果的對比。

2 本文方法

2.1 時間序列數據分段

高速運行的離心機設備故障監測和診斷是需要一定采樣時間的。對這類高速運行的設備采集振動信號時間序列數據進行分析,通常單位采樣時間(如1 s)的數據樣本點個數較多(本文每秒鐘采集的振動信號數據樣本超過40 000)。然而設備狀態監測要求有一定的時效性,為了更快速地識別設備運行狀態,采樣時間長度通常較短。所以,在此將所采集到的振動信號時間序列數據進行分段分析,分段的依據是根據模式識別的時效性來決定。如實時監測要求采樣時間長度為0.01 s,0.1 s或1 s等,則可以將1 s內采集到的時間序列數據分別分成100段、10段和1段。給定離心機設備運行狀態的振動信號時間序列數據{Xt,t=1,2,…,T},T為單位時間內采樣的樣本總量。簡單起見,假定模式識別的時效性要求最小采樣時間長度為T0,將時間序列Xt等分為k(k為正整數)個子序列,則T=k×T0。

當然,也可以根據模式識別的時效性要求直接確定采樣時間長度,并采集相應的樣本數據進行模式識別分析。本文之所以進行分段,是為了驗證模式識別方法在單個模式和多個模式組合2種情形下的識別性能。如實驗每秒鐘采集的振動信號數據為40 000個樣本點,模式識別時效性要求為0.1 s,則可以直接采集4 000個樣本構建單個模式,然后進行模式識別分析;然而,設備運行狀態是連續的,人為參與設備運行狀態監測是需要一個時間的,為此,進行必要的模式組合分析也可以為人為決策提供參考價值;如繼續采集下一個0.1 s內的4 000樣本點,結合前0.1 s的4 000樣本點,構建一個模式組合,然后進行識別分析。

綜上所述,假定所采集到的時間序列數據{Xt,t=1,2,…,T},根據時效性要求將其分成k個子序列,對每個子序列提取相應的特征構建特征向量,則整個時間序列{Xt}的特征提取將得到一個特征模式矩陣。

2.2時間序列的分位數特征提取

分位數,亦稱分位點,是指將一個隨機變量的概率分布范圍分為等份的數值點。在不考慮信號時間序列數據的時間維度(橫向)的特征時,分位數能有效地刻畫信號時間序列數據波動(縱向)的特征。隨著離心機的高速運行工作,其重心偏移通常是隨機的,所以,其振動信號數據沒有明顯的周期性。此時,分位數特征提取比較適合此類信號數據的處理。

對分段后的每個子序列,采用分位數來刻畫其數據分布特征。提取的分位數個數越多,則對子序列統計分布特點的刻畫越精細,然而這將增加模式識別的計算量;而且,設備運行狀態所采集到的高頻數據呈現明顯的非線性和隨機性,采取少量分位數更有利于刻畫運行狀態的主要特征。

本文采取對稱原理開展分位數特征提取,即要求所提取的分位數關于中位數對稱,具體做法如下:首先采用了常用的3個四分位數,其次引進常用的置信概率值95%和5%、90%和10%來確定4個分位數,最后結合極大點和極小點來確定2個分位數,共計9個分位數[10],按從大到小的順序排列,即極大值、95%分位數、90%分位數、75%分位數、50%分位數、25%分位數、10%分位數、5%分位數和極小值。此時,每個子序列將對應一個9維的特征模式向量。則對整個時間序列{Xt,t=1,2,…,T}而言,共計有k個9維特征模式向量,將其排列成矩陣的形式,將得到一個特征模式矩陣F,如下:

其中,分段參數k=1時,將得到一個特征模式向量。

特征提取流程所得到的結果如圖1所示。其中,圖1(a)采樣時間長度為4 s;圖1(b)分段參數k=10;圖1(c)分段參數k=10。將該特征模式矩陣在三維空間直觀展示,如圖1(b)所示;并將其進行平滑,如圖1(c)所示;圖形是按照分位數取值大小呈現遞增的趨勢(自右向左)。

圖1 時間序列分段分位數特征的提取示意圖

經過時間序列的分位數特征提取,可以實現設備運行狀態檢測所采集到的信號數據壓縮,提取設備運行狀態檢測的主要特征,以便進行下一步的模式分類研究。

2.3 時間序列模式的無監督分類

采集離心機運行狀態的振動信號時間序列數據,包括正常運行數據(空載)和異常運行數據(偏載)。采用Matlab軟件提取時間序列數據分段分位數特征,每個音頻數據都對應1個特征模式矩陣。然后采用時間序列無監督分類的方法進行設備監測數據的模式分類。

聚類(Cluster)分析是研究分類問題的一種統計分析方法;它是由若干模式(Pattern)組成的,通常,模式是一個度量(Measurement)的向量(或矩陣);聚類分析以相似性為基礎,在一個聚類中的模式之間比不在同一聚類中的模式之間具有更多的相似性。本文采用歐氏距離函數來度量2個特征模式矩陣X和Y之間的相似程度,如下:

繼而采用k-means算法進行時間序列聚類,考慮到設備狀態的正常(空載)和異常(偏載)2種模式,本文研究將所采集到的數據樣本分為2個類,即輸入參數k=2。將數據樣本劃分為2個類,確保同一類中的樣本對象相似度較高,不同類中的樣本相似度較小,達到各類本身盡可能的緊湊、各類之間盡可能的分開的目的。

k-means聚類算法如下:

輸入時間序列

輸出分類結果

Step1選取參數k的值。

Step2初始化k個聚類中心點(可采用隨機方式)。

Step3將N個樣本按照最近原則,進行歸類。

Step4重新估計k個聚類中心點。

Step5如果N的樣本的歸類結果不再改變,則完整,否則返回Step3。

2.4 模式分類結果評價

假定事先知道狀態模式分類的標準,則分類結果可以采用客觀方法進行評價,如采用指標Sim(G,A)來分析結果[11]。假定狀態模式分類的標準為向量G={G1,G2,…,Gm},而采用某種方法得到的模式分類結果為向量A={A1,A2,…,Am},可根據下式計算客觀評價的準確率指標:

其中,指標Sim(G,A)取值范圍為(0,1),取值越大,表明模式分類結果越接近真實情況,分類效果越好。

假定事先不知道狀態模式分類的標準,則分類結果可以采用主觀方法進行判定;如將分類后的2組時間序列數據的折線圖分別繪出,并進行直觀判定分析[12]。

3 仿真實驗和分析

3.1 沉降式離心機的運行狀態模式

沉降式離心機系統是乏燃料后處理中的關鍵設備,可以處理核動力堆中含有一定數量的不溶物。沉降式離心機包括機架、上軸組件、轉鼓等部件。電動機轉動帶動上軸組件,帶動與其相連的轉鼓,加入轉鼓中的懸浮液在離心力作用下形成環狀液層,其中的固體顆粒沉降到轉鼓壁上,形成沉渣;澄清的液體經轉鼓清液口或吸液管排出。沉降式離心機設備故障模式主要包括以下情況:(1)轉鼓的脆性破壞、裂紋,故障原因為轉鼓所用材料晶粒粗大,組織不均勻;(2)沉降式離心機在空載和加水實驗中出現振

動、雜音、振幅偏大現象,故障原因為系統動力不平衡;(3)離心機機架松動,造成離心機系統運行震動加劇,故障原因為高速旋轉造成整個機架筋板疲勞破壞。

考慮到目前能在乏燃料輻射環境下長期工作的傳感器沒有成熟產品,本文對沉降式離心機機采取模擬仿真的方式進行實驗;針對沉降式離心機系統動力不平衡造成的振動和振幅偏大現象進行監測和分析,模擬其在空載運行和偏載運行2種狀態,采集相應的振動信號時間序列數據進行分析。

3.2 數據特征分析

采集沉降式離心機設備運行過程中的振動數據。實驗方案如下:第1步,對沉降式離心機采用空載實驗;第2步,對對沉降式離心機內壁附加鐵塊進行實驗,模擬系統動力不平衡時(偏載)的運行狀態。實驗過程中通過調頻調速器施加轉速(調頻調速器頻率越高,則離心機轉速越快),利用YD9200振動速度傳感器采集相應的振動信號數據。傳感器采樣頻率約44 100次/s,考慮到運行狀態檢測的時效性需求,實驗采樣時間長度定為3 s,實驗數據呈現出明顯的大樣本性質。

對所采集到的設備振動信號時間序列數據進行正態分布檢驗,設定顯著性水平值為0.05,采用SAS(Statistics Analysis System)系統軟件中的KOLMOGOROV統計量進行分析,檢驗結果如表1所示,大部分樣本都服從正態分布;只有調頻調速器調頻調速器頻率為50 Hz時,負載實驗中部分樣本數據呈現非正態分布情形;實樣總體樣本數為325個,服從正態分布的樣本數為313個,占樣本總量的96.3%。繪制出振動信號時間序列數據圖形,如圖1(a)所示,設備運行狀態檢測數據呈現比較明顯的隨機噪聲特征。

表1 正態分布實驗結果

3.3 模式分類

小波分析由于其優越的性能使得其在模式分類得到了廣泛應用,在此采取小波分析來進行實驗對比分析??紤]到模式識別的時效性要求,對所采集到的振動信號時間序列數據截取其第一秒數據,此時時間序列樣本的數據個數為T=44 100。

首先,采用Matlab/Wavread函數進行讀取所采集到的振動信號時間序列數據,并采用Daubechies正交小波提取時間序列數據的特征,得到相應的特征向量;然后按照圖1的流程,采用分位數特征提取方式進行處理,得到特征矩陣向量;最后采用基于kmeans算法的聚類方法進行無監督分類,計算分類的準確率,如表2~表4所示。

表2 模式分類的實驗結果(k=1,T0=44 100)

表3 模式分類的實驗結果(k=1,T0=4 410)

表4 模式分類的實驗結果(k=10,T0=4 410)

3個表包含了3種情況的實驗結果:(1)振動信號時間序列數據長度為4 410時,分段參數k=1,即采用單個模式進行分析,如表2所示;(2)振動信號時間序列數據長度為44 100時,分段參數k=1,即采用單個模式進行分析,如表3所示;(3)振動信號時間序列數據長度為44 100時,分段參數k=10,即采用多個模式進行組合分析,如表4所示。實驗結

果都表明:(1)3種實驗結果都表明,基于分位數特征提取的模式分類技術的準確率都明顯高于小波分析;(2)當調頻調速器取值為1.73 Hz時,基于分位數特征提取的模式分類技術的準確率偏低,但其他6種情形下的分類準確率都超過90%,部分轉速時分類準確率達到100%。這表明基于時間序列分位數特征提取的模式分類方法能對沉降式離心機故障模式進行較好地分類。

4 結束語

本文提出一種基于分位數特征提取的時間序列模式分類方法。針對高速運行離心機設備的狀態監測進行研究,采用分位數特征提取方法建立時間序列的模式特征矩陣,借助k-means算法實現模式的自動分類。仿真結果表明,該方法能有效區分設備運行狀態模式。今后將繼續采集不同負載情況下(負載重量不同)的振動數據,對本文的模式分類技術做進一步分析。同時,在此基礎上建立設備運行狀態的故障診斷技術,形成一套完備的設備運行狀態監控方法。

致謝:感謝南華大學核設施退役與處置研究所為本文研究提供了離心機設備運行狀態的模擬實驗環境。

[1]李正欣,張鳳鳴,李克武.基于DTW的多元時間序列模式匹配方法[J].模式識別與人工智能,2011,24(3): 425-430.

[2]張 勇.時間序列模式匹配技術研究[D].武漢:華中科技大學,2012.

[3]韓秋實,許寶杰,王紅軍,等.旋轉機械故障診斷監測專家系統中的時間序列模式識別技術研究[J].機械工程學報,2002,38(3):104-107.

[4]閆 偉,張 浩,陸劍峰.基于設備故障監控的時間序列模式研究應用[J].計算機應用,2005,25(7): 1587-1590.

[5]亢子云.一種基于時間序列的故障診斷算法[J].數字技術與應用,2011,(2):89-90.

[6]陳 偉,李 旭,張為公.基于時間序列分析的車載MEMS陀螺儀異常測量數據的辨識與修正[J].東南大學學報,2013,29(2):170-174.

[7]吳文兵,黃宜堅,陳文薌.復雙譜耦合性質在故障診斷中的應用[J].北京工業大學學報,2012,38(9): 1287-1292.

[8]胥永剛,孟志鵬,趙國亮.基于雙樹復小波包變換能量泄漏特性分析的齒輪故障診斷[J].農業工程學報, 2014,30(2):72-77.

[9]傅勤毅,熊施園.基于小波分析的齒輪箱故障診斷[J].鐵道科學與工程學報,2013,10(1):112-116.

[10]管河山,姜青山.基于點分布特征的多元時間序列模式匹配方法[J].軟件學報,2009,20(1):67-79.

[11]Gavrilov M,Anguelov D,Indyk P,et al.Mining the Stock Market:Which Measure is Best[C]//Proceedings of KDD’00.Boston,USA:[s.n.],2000:487-496.

[12]Keogh E,Kasetty S.On the Need for Time Series Data MiningBenchmarks:ASurveyandEmpirical Demonstration[J].DataMiningandKnowledge Discovery,2002,7(4):349-371.

編輯 劉 冰

Time Sequence Pattern Classification Based on Quantile Feature Extraction

GUAN Heshana,WANG Qiana,TANG Dewenb
(a.School of Economics Management;b.School of Mechanical Engineering, University of South China,Hengyang 421001,China)

The vibration state detection data from the centrifuge equipment in high-speed operation usually presents obvious nonlinearity,normal distribution and the characteristics of large sample,and random fluctuations in the data make it difficult to capture the trend characteristics.In this paper,time sequence theory is used to analyze the vibration signal data gathered from the running centrifuge equipment.It uses the quantile of the sequence data to build the feature vector according to the symmetrical principle,and introduces the Euclidean distance function to construct similarity measure,and then sets up the decision basis for pattern classification,realizes the pattern classification employing the k-means classification algorithm.Simulation results show that this method can effectively distinguish the partial load state and noload state of the centrifuge equipment,which is more accurate than that of wavelet analysis method.

quantile;time sequence;pattern classification;centrifugal machine;vibration signal;wavelet

管河山,王 謙,唐德文.基于分位數特征提取的時間序列模式分類[J].計算機工程,2015,41(3):167-171.

英文引用格式:Guan Heshan,Wang Qian,Tang Dewen.Time Sequence Pattern Classification Based on Quantile Feature Extraction[J].Computer Engineering,2015,41(3):167-171.

1000-3428(2015)03-0167-05

:A

:TP391.4

10.3969/j.issn.1000-3428.2015.03.032

湖南省博士后基金資助項目(2012RS4026);南華大學校博士啟動基金資助項目(2009XQD03)。

管河山(1981-),男,副教授、博士,主研方向:數據挖掘,模式識別;王 謙,碩士研究生;唐德文,副教授、博士。

2014-03-26

:2014-05-27E-mail:guanheshan@aliyun.com

猜你喜歡
離心機位數特征提取
五次完全冪的少位數三進制展開
LP60型雙級活塞推料離心機的研制與應用
基于Daubechies(dbN)的飛行器音頻特征提取
Bagging RCSP腦電特征提取算法
離心機轉速及相對離心力的正確表示
ZPJ-40型高速轉盤離心機減振技術
土工離心機研制概述
基于MED和循環域解調的多故障特征提取
遙感衛星CCD相機量化位數的選擇
“判斷整數的位數”的算法分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合