?

基于RS屬性約簡與LS-SVM的裝備研制風險綜合評價

2019-04-23 03:57黃海清甘旭升
火力與指揮控制 2019年3期
關鍵詞:約簡研制裝備

黃海清,甘旭升,曲 虹,董 鑫

(1.西京學院,西安 710123;2.空軍工程大學空管領航學院,西安 710051)

0 引言

在過去20年~30年中,美國在武器裝備研制過程中,由于對風險估計不足或不夠精確,導致實際費用超出預算近四成,并大幅拖延了研制進度。鑒于此,美國國防部將風險評價貫穿于裝備研制全過程,并視其為評審的重要內容。在國內,針對裝備研制風險綜合評價問題也進行了有益的嘗試和探索。張松昌等采用模糊層次分析法對某型陸戰裝備的研制風險進行了綜合評價,以克服人為主觀偏好造成的模糊性[1]。宋春靂等將熵權雙基點法應用于裝備研制風險評價中,解決了傳統評價中依靠主觀經驗確定權重的問題[2]。此外,遲寶山、吳亞雷、陳士濤等也進行了深入分析與研究[3-5]。這些方法雖然部分解決了風險的定量評價問題,但其中的一些邊界參數較難確定,得到的評價結果存在分類不夠精細、區分性不強等問題。此外,還有些方法將問題簡單分解為若干小部分,將復雜風險簡單化,既缺少理論依據,也沒有作數值分析,因此,有必要研究和探尋更為有效可行的裝備研制風險綜合評價方法。

基于以上分析,本文針對裝備研制的特點,構建了風險評價指標體系,并在集對分析(Set Pair Analysis,SPA)法構造評價樣本基礎上,提出基于粗糙集(Rough Set,RS)屬性約簡的最小二乘支持向量機(Least Square Support Vector Machine,LS-SVM)的裝備研制風險綜合評價方法,即RS-LS-SVM,旨在為有效管控新型裝備的研制風險提供新方法。

1 裝備研制風險評價指標體系

武器裝備研制風險評價體系是指由各方面相互聯系、能敏感地反映武器裝備研制的狀態及存在問題的具體指標構成的有機整體。在設計風險評價指標體系時,應該從分析影響因素入手,根據研制中暴露出的問題特點,參照相關研究成果,征求專家的意見,選取具有代表性的評價指標,并兼顧指標測量問題,以客觀地對武器裝備研制風險進行科學評價。通過對武器裝備研制實踐的概括與總結,本文構建了如圖1所示的武器裝備研制風險評價體系,重點研究環境、政府、生產、研發、財務和管理對于研制風險的影響,以期通過風險評價來確認解決方案或建議的正確性和可操作性,使武器裝備研制趨于正規化和標準化。

2 粗糙集屬性約簡

圖1 裝備研制風險評價指標體系

RS理論認為,知識必須以對象的分類能力為基礎,分類過程中差別較小的對象被納入一類,對象與對象之間形成的關系被稱為不可辨識關系。約簡是RS的核心問題之一。對于較復雜問題,通過在約簡中加入啟發式信息,能夠縮小問題的搜索空間。本文研究了可辨識矩陣(可以標識決策屬性和條件屬性之間關系的矩陣)的約簡,并在屬性重要性基礎上,引入一種以屬性頻率作為啟發式信息的屬性約簡算法[6]。

設決策表S=(U,A,V,f),R?C,則任意屬性a∈C-R的重要度可定義為SGF1(a,R,D)。本文采用的屬性頻率約簡算法,是將可辨識矩陣中屬性a出現次數作為判斷屬性重要性的標準,即SGF1(a,R,D)=p(a),并將其視為屬性相對于決策重要性的啟發式信息。該方法按照屬性對分類的影響選擇屬性,當屬性重要性相等而無法選擇屬性時,可引入一種以M值作為標準的屬性重要度方法。

式中,SGF2表示屬性a分類中包含決策屬性分類Yj的最大對象數相對分類Yj的比例。如果條件屬性集決定的等價類中有一個是Yj的子集,雖然不存在決策類的子集,條件屬性集對Yj仍很重要,SGF2就是在此基礎上提出的。對于重要度相同的屬性,可計算它們的M值,并選擇最大M值對應的屬性加入到屬性約簡集中。則基于屬性重要度的約簡算法的流程如下:

輸入:決策表S=(U,C U D);

輸出:S的屬性約簡集。

1)計算可辨識矩陣,將該矩陣中的核屬性(屬性組合數為1的條件屬性)賦給約簡后的屬性集,即red=Core;

2)刪除可辨識矩陣中含有核屬性的屬性組合項;

3)計算可辨識矩陣中所有剩余條件屬性的出現頻率,選出頻率最高的條件屬性a,即red=red U{a}。若屬性的出現頻率相同,則計算屬性M值,并選取最大M值對應的屬性加入red中,刪除可辨識矩陣中包含a的屬性組合項;

4)計算POSred,當POSred(D)≠POSC(D)時,轉入步驟3),當POSred(D)=POSC(D)時,red即為最后約簡集,其中,POSred(D)表示根據約簡集red中條件屬性,一定能歸入決策類D的所有對象集合。

由于數據采集的不完整性和不規范性,在RS屬性約簡前,需要預先對條件屬性中的連續屬性進行離散化。其基本思想是根據需要將連續屬性值劃分為幾個子區間,然后利用這些子區間代替原有的實際值,從而使決策表泛化,能夠用于RS約簡計算。本文采用等距離劃分方法,該方法離散化時在取值域按等距離分割,并不考慮條件屬性與決策屬性之間的依賴關系,當然,也可根據需要,選取考慮條件屬性與決策屬性之間依賴關系的離散化方法,如基于熵的離散化方法。

3 LS-SVM模型

LS-SVM是支持向量(SVM)的一種改進版本,即將二次規劃問題轉化為線性方程組問題來求解[7]。

設訓練集({xi,y)i|i=1,2,…,n},輸入向量xi∈Rd,輸出 yi∈R,n為樣本數,d為輸入維數。通過一個非線性函數將樣本從原空間Rd映射到某個特征空間中,并在該特征空間中引入結構風險函數構造最優函數,其中,b為常數。此過程可描述為如下約束優化問題

式中,正則化參數C用以平衡經驗風險和置信范圍。ξi為非相關隨機誤差。

對于以上約束優化問題,可通過Lagrange乘子法進行處理,其中,Lagrange乘子法是一種尋找變量受一個或多個條件所限制的多元函數的極值方法。則式(2)和式(3)可轉化為

式中,αi為 Lagrange乘子。

考慮到KTT條件是不等式約束的最優化問題的最優性條件(最優解的性質)。利用KTT條件可將上式得轉化為等式形式,并通過最小二乘法求解αi和b,得到線性模型,其中,則有

為保證LS-SVM泛化性能,參數C和σ2需要采用k-折交叉驗證法與網格搜索法優化。k-折交叉驗證法將訓練樣本隨機等分為k個相同子集,取k-1個子集作為訓練集,訓練LS-SVM估計模型式(5),剩余的一個子集作為測試集,將測試集輸入xi代入式(5),得到輸出估計。如此不重復循環k次,直到各子集都作為測試集被驗證一遍,然后計算出均方誤差(Mean Squared Error,MSE)。網格搜索法將C和σ2所在區間等間隔劃分為P個點和Q個點,形成一個網格,其交叉點即為P×Q個參數組合。在k-折交叉驗證法基礎上計算出各參數組合的MSE,最小MSE對應的參數組合即為最優參數。若不滿意,可將上次較小MSE對應的參數組合進行特征分解,提取特征值和特征向量,重新定義更精細的網格進行搜索驗證,直到找出滿意的參數組合。

4 裝備研制風險RS-LS-SVM評價模型

由于裝備研制過程具有動態性、模糊性的特點,各類風險指標之間的作用關系也比較復雜,要理清各指標之間的耦合關系極為困難。在裝備研制風險評價模型中,其評價指標體系是由專家訪談、前人研究經驗所確定的,并不一定完全合理,可能存在一定冗余,進而影響到評價效果。若預先根據采集到樣本進行RS屬性約簡,以消減影響較小的冗余指標?;诖?,本文提出的裝備研制風險的RS-LS-SVM評價過程如下頁圖2所示。該過程大致可分為3部分:首先,在評價指標數據基礎上利用SPA法構造樣本;然后,通過RS前置處理,對評價指標進行屬性約簡;最后,根據RS約簡結果,構建裝備研制風險的LS-SVM評價模型,并完成評價。

在圖2評價流程中,SPA法通過引入聯系度概念統一處理模糊、隨機、中介和信息不完全導致的不確定性。其核心思想是先對不確定性系統中的兩個有關聯的集合構成集對(集對是指具有一定聯系的兩個集合組成一個對子),再對集對的特性進行同一性、差異性和對立性分析,最后建立集對的同、異、反的聯系度[8-9]。根據裝備研制的過程及其風險特點,構造出指標U的風險評價等級對應的聯系度函數,如表1所示。

圖2 裝備研制風險RS-LS-SVM評價過程

表1 裝備研制風險評價等級及其聯系度函數

表中,x為指標的評價分數值;U0~U5為評價指標各等級的界限值。第i個指標的第j個等級的聯系度為μij(j=1,2,3,4,5),若ωi為各指標的權重,即可計算出各指標第j個等級的總聯系度。最大總聯系度對應的等級就是最終風險評價等級。

5 案例分析

確立了裝備研制風險的評價指標體系和評價流程后,就可以結合研制實際進行風險建模與評價。為驗證方法的有效性,本文以空軍某型號雷達研制項目的風險評價為研究對象,該型雷達主要用來搜索、截獲和跟蹤空中目標,并提供武器瞄準、射擊和制導所需要的數據。

5.1 SPA法構造樣本

評價所用到的原始數據,來源于研制單位、使用單位、協作單位以及裝備機關的10位有關專家打出的評價分數,并作了必要的數理與脫密方面的預處理,如表2所示。整個案例分析,更多地從演示角度,闡明所提出方法用于評價裝備研制風險的整個過程。

表2 裝備研制風險各指標的專家評價分數

首先,確定各評價指標的風險等級區間。例如,對于市場意向 E3來說,數值 50,60,70,80,80 分別表示市場意向等級:I介于[0,50]區間,II介于(50,60]區間 ,III介于(60,70]區間,IV介于(70,80]區間,V 介于(80,100]區間,其他評價指標的等級區間都依此過程給出。然后,通過層次分析法確定各評價指標的權重,ω1,ω2,…,ω12分別為:0.042,0.069,0.079,0.093,0.173,0.057,0.087,0.035,0.082,0.092,0.135,0.057。最后,基于 SPA 法計算出各組專家分數的評價結果。將評價指標E1~E12對應的一組專家評價分數代入表1中的聯系度函數,并結合權重計算出這組專家分數的5個總聯系度值,進而由最大值確定這組專家評價分數的風險等級,其他各組評價分數如此類推,得到的SPA評價結果如表3所示。通過以上SPA過程,結合表2及表3的評價結果,通過標準化處理即可構造RS-LS-SVM的輸入輸出樣本,并將編號1~10樣本用于模型訓練,編號11和12樣本用于測試。所涉計算在LS-SVMlab1.5工具箱基礎上通過MATLAB編程語言實現。

表3 裝備研制風險的SPA評價結果

5.2 RS前置處理

在進行RS屬性約簡前,先要通過等距離劃分法對訓練樣本進行離散化。只有完成離散化處理,才能將各評價指標作為條件屬性,將SPA評價結果(評價等級已作數字化處理)作為決策屬性,構建決策表,進而基于屬性重要性對決策表進行屬性約簡,其最小約簡后的決策表如表4所示。從表中可知,最小約簡屬性集為{E1,E3,E5,E6,E7,E10,E12}。也就是說,這7個條件屬性(評價指標)相對于決策屬性為核心屬性,是不可省略的,而條件屬性E2,E4,E8,E9和 E11是冗余的。

5.3 LS-SVM建模與評價

將評價指標 E1,E3,E5,E6,E7,E10和 E12對應的訓練樣本(非離散化)作為輸入輸出,對LS-SVM評價模型進行訓練。

訓練前,采用10-折交叉驗證法和網格搜索法對超參數C與σ2尋優。兩參數的初始值可分別設為不同值,交叉驗證的初始化分組數為5。由于C與σ2數量級相差較大,尋優過程包括粗選和精選兩個步驟:粗選格點數10×10,用“·”表示,搜索步長較大,采用誤差等高線確立最優參數范圍;精選格點數仍為10×10,用“×”表示,在粗選基礎上,以較小步長更加細致地搜索。圖3給出了初始值C=1,σ2=0.5時的尋優過程。

圖3 初始值C=5,σ2=1的尋優過程

將得到的C與σ2最優值用于訓練LS-SVM模型,進而完成對裝備研制風險的綜合評價。將編號11 和 12 的樣本中的指標 E1,E3,E5,E6,E7,E10,E12值輸入LS-SVM模型,并依據表5給出的風險綜合評價等級取值范圍,得到LS-SVM與RS-LS-SVM模型的評價結果對比如下頁表6所示。

表4 最小約簡后的決策表

表5 裝備研制風險綜合評價等級取值范圍

從裝備研制風險評價結果可以看出,經過RS屬性約簡,原來12個屬性中僅剩下7個,將這7個屬性對應的樣本訓練LS-SVM模型,得到評價結果與SPA完全一致。這說明,RS不僅簡化了LS-SVM網絡結構,降低了運算復雜性,而且提高了預測精度,平均絕對誤差(指所有單個觀測值與算術平均值的偏差的絕對值平均)達到0.098,評價結果更接近SPA評價值。而單純LS-SVM模型對編號12樣本的評價結果卻出現了偏差。因此,應用RS-LS-SVM進行裝備研制風險綜合評價是更為可行的。更重要的是,通過對裝備研制風險評價體系中指標的分析與精煉,可極大地減少實際風險評價中信息收集與處理的工作量,使評價過程更為嚴謹、科學,評價結果也更為準確、有效。

表6 LS-SVM與RS-LS-SVM模型評價結果對比

6 結論

本文先構建裝備研制風險評價指標體系,引入SPA法生成訓練樣本和測試樣本,將RS與LS-SVM進行優勢互補,采用RS方法對裝備研制風險LS-SVM評價模型的輸入指標進行了屬性約簡,將12項輸入減少到7項,并進行了相關測試與比較分析。數值分析結果表明,相對于單一LS-SVM評價模型,基于RS約簡的LS-SVM模型既可以消除冗余信息,簡化模型結構,又能夠繼承LS-SVM的自學習與聯想記憶功能,給出更為準確、可信的評價結果。因此,采用RS-LS-SVM進行裝備研制風險評價是可行的,同時,也為裝備研制風險提供了一種有效的管控手段。

猜你喜歡
約簡研制裝備
哪些裝備為太空之旅護航
這些精銳與裝備馳援瀘定
港警新裝備
仿生眼的研制有新突破
面向連續參數的多粒度屬性約簡方法研究
基于差別矩陣的區間值決策系統β分布約簡
帶權決策表的變精度約簡算法
一種新型固定翼無人機的研制
近似邊界精度信息熵的屬性約簡
XV-24A垂直起降驗證機的研制與發展
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合