?

基于累積差分的飛行測試數據同類段定義

2011-08-21 12:33艾冬生盧一喆
探測與控制學報 2011年6期
關鍵詞:測試數據同類極值

艾冬生,張 珂,張 峰,盧一喆

(1.機電動態控制重點實驗室,陜西 西安 710065;2.西安機電信息研究所,陜西 西安 710065)

0 引言

在現代飛行測試工程應用中,通常使用如遙測、外測等手段從不同的數據源獲取海量數據,并通過專用的數據獲取系統將數據存儲于巨型文件中。飛行測試一般具有科目多、時間長等特點,測試過程中獲取的多為海量數據。目前,針對海量飛行測試數據多采用高速計算機群進行處理。即使如此,在數據分析的過程中,在海量存儲數據中查找滿足特定條件的參數(例如查找參數P1≤13或是參數32≤P2≤40)仍會十分困難。

目前一般采用分段取平均的方法來處理上述問題,但在處理過程中會損失極值點的數據,導致段內有效數據信息的損失。針對上述不足,提出一種可適用于任意被測參數的基于累積差分的方法,用于定義參數P的同類段。

1 累積差分方法與同類段

1.1 累積差分方法

累積差分算法是一種簡單且有效的針對同類數據段劃分方法。它能在段內根據響應值及平均值得到累積差分的最大、最小邊界曲線,其基本思想是:使用高斯分布模型來表征信號的概率分布,使用分段分割的方法將數據分段,在各段內使用一階差分方程求得數據邊界,并使用標準方差來斷定數據的絕對偏移量,用平均值代替段內數據,從而降低數據量[1]。

如圖1(a)所示為沿著x軸的3個獨立段落和其對應的3個不同響應值(ri)。對段落中任意一點累積域Ax的計算,均可通過對響應函數沿著x軸進行積分獲得:

圖1(b)所示為沿著x軸的響應值累積域,其中實線段為響應沿軸方向的累積域曲線,虛線段為響應平均值沿軸方向的累積域曲線。其中,實曲線的斜率變化反映了三個不同段落的響應值,虛線段的斜率反映了被積函數為沿著x軸響應變量累積域平均值時的情況。例如:?x,如圖1(b)所示,被積函數為響應函數的平均值時,累積積分域如下:

式(2)中,As為沿著x軸的累積域,Ls為段落長度。

圖1 累積差分原理示意圖Fig.1 Sketch map of cu mulative difference method

由式(2)可得,沿著x軸?x的累積差分Zx可由式(3)表示:

式(3)中,Zx是實際值與平均值在 ?x點的累積域值之差。如果將段落長度作為x軸,對應的累積差分Zx作為y軸,那么累積差分曲線斜率的正負變化的極值點位置就能夠標識該段落的邊界曲線。

1.2 飛行測試數據中的同類段

飛行測試應用中的被測參數多為緩變量,按照曲線斜率的正負變化極值對數據進行分段,用段內數據的平均值和標準方差作為因數[2]對同類段進行標識,這樣對于原始飛行數據的存儲就轉化為對于包含同類段起始和結束邊界值、范圍內的平均值和標準方差等要素的數據存儲。將這些要素作為索引存儲于數據庫中,會大幅提升數據檢索速度,并且這一開銷僅僅是存儲所有數據開銷的5%[3-4]。

2 基于累積差分的飛行測試數據定義同類數據段方法

在實際的飛行測試過程中,數據以幀為單位進行傳輸,對于等間隔采樣的參數P,用于表征參數的存儲數據可以被格式化為N 個點,記為N(ti,yi)(1≤i≤N),其中ti是數據采樣起始時刻,yi是該時刻對應的值(yi是任意的實型數,如yi為非數據型,則用Na N予以標記),起始時刻t1和結束時刻tN用于標記段落長度。

計算格式化域中任意一點的累積域值Ax,那么基于N個格式化點得到N個累積域值,由此可以得到總區域和A,是累積域值Ax(1≤i≤N)的累加和?;谏鲜隹倕^域和并結合段落長度(這里段落長度被本地化為起始時刻到結束時刻的時間長度),可計算出平均累積域值并代入式(3)可求得累加差分Zx。對于N個格式化點,可得出若干個Zx的值,累積差分曲線Zx隨著斜率的代數符號發生變化時,將產生極大或極小值點,找出其極值點并將極值點所對應的ti時刻記錄,由此可標識出各個段落的邊界。

3 實例驗證

下面以實際飛行測試中的取樣數據來驗證上述同類段定義方法,并對取樣數據以取樣時間進行段落劃分。針對第一間隔距離數據段數據的計算,我們使用相鄰間隔差分的計算方法,并通過將間隔距離起始點(或終止點)到當前點求累加來計算段落外的累積距離。對于間隔域的計算,可以通過式(2)用段落內的平均值乘以段落長度來獲得,過程中采用統計平均的歸一化公式將各段落值進行組合所得的結果作為段落內的平均值。統計量Zx由實測值Ax與其段落統計平均值AVG(Ax)做差得到。以實現線與虛線段中間的差分Zx為例(如圖1(b)所示),其代數值由式(3)得到。

計算過程中將期望值與方差同時考慮,比單獨使用期望值更加易于數據的統計分析,同時方差與標準差表明了數據點的置信水平,能夠提升數據點的置信權重。將方差作為權值因子能夠減小邊界外數據點的影響,并能生成統計一致的歸一化數值。如圖2所示為實際測試數據應用累積差分算法給出的結果??芍?,通過使用取值為2.85的標準差代替原始數據,從而使得在時間點為3.5時的峰值明顯得到削減。

在完成累積差分計算后,采用用戶自定義準則對均值進行運算,以進行統計相似段落的合并。圖2示出了6 s樣值區間中的幾種同類段??梢钥闯?,與使用原始樣值(圖中虛線所示)相比,使用段落劃分能夠有效壓縮數據量,并且不損失原始數據信息。如果需要可將動態段落劃分算法進行迭代使用,經過幾次迭代計算,結果最終收斂于沿著控制域數據點的加權平均。

圖2 實際測試樣值數據的累積差分結果Fig.2 Conclusion of cu mulative difference according actual data

4 結論

本文提出基于累積差分的飛行測試數據中定義同類段的方法。該方法基于累積差分算法找出數據段中的極值點,由此確定同類段的邊界。實例驗證表明所述方法可用于定義飛行測試數據中的同類段。依據定義的同類段,計算出被測參數的統計數據(如平均值、標準方差等),采用統計值對原始存儲數據進行替換,可在不損失數據信息的前提下有效壓縮數據(對于二進制數據,壓縮率為50%左右),并可根據同類段邊界值對相關參數進行快速查找和處理。值得注意的是,在實際應用中,接收數據受傳輸信道誤碼影響會存在野值,可以在應用所述方法定義同類段之前將數據進行濾波處理,將數據中的奇異點去除或對數據進行平滑。

[1]Fridtjof Tho mas.Auto mated Road Seg mentation using a Bayesian Algorith m[J].Journal of Transportation Engineering,2005,131(8):591-598.

[2]Fridtjof Tho mas.Generating homogeneous road sections based on surface measurements:available methods[C]//Proc.2nd European Pavement and Asset Management Conference.Ger many:Berlin,2004:21-23.

[3]Aashto.Guide f or Design of Pavement Str uctures[R].A-merican Association of State Highway and Transportation Offices:Washington,DC,1986.

[4]Espeschit,Ant nio M.L,PENNA Sér gio D.A Web Search Engine to Flight Test Data[C]//Proceedings of the 28th European Telemetry Conference.Ger many:Munique,2008:15-17 .

猜你喜歡
測試數據同類極值
極值(最值)中的分類討論
極值點帶你去“漂移”
極值(最值)中的分類討論
極值點偏移問題的解法
同類色和鄰近色
測試數據管理系統設計與實現
七種吃同類的動物
基于自適應粒子群優化算法的測試數據擴增方法
空間co-location挖掘模式在學生體能測試數據中的應用
同類(共4則)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合