?

基于改進Apriori 算法與極大不相關法的武器裝備系統效能評估指標精簡方法研究

2022-11-15 07:54程紹馳游光榮
軍事運籌與系統工程 2022年2期
關鍵詞:項集置信度效能

程紹馳 游光榮

(1.軍事科學院 戰略評估咨詢中心,北京100091;2.軍事科學院 戰爭研究院,北京100091)

1 引言

武器裝備系統效能評估是指評估武器裝備系統在特定的環境和規定的時間內,完成指定作戰任務的綜合能力[1]。隨著信息化技術的迅猛發展,武器裝備系統內部各要素之間的關聯關系越來越錯綜復雜,而且可能瞬息萬變,這使得武器裝備系統效能評估指標的關聯關系越來越復雜,評估指標的冗余問題越來越突出,由此可能增加評估數據的收集難度和評估計算的復雜度。因此,挖掘武器裝備系統效能評估指標的關聯關系,找出冗余指標并進行精簡具有重要的現實意義。

當前國內外相關研究中,精簡武器裝備系統效能評估指標通?;趯<抑R和經驗,采用定量方法的并不多見。司光亞等對效能評估指標之間存在的相互依賴與影響關系進行了深度挖掘[2],但是沒有提出剔除冗余指標的方法;薛世欽等針對復雜作戰體系效能評估指標可能存在的關聯和冗余問題,提出了一種基于Apriori 算法剔除冗余指標的方法[3];韓馳等面向航天偵察體系的體系效能和體系貢獻率評估,基于FP-Tree 算法挖掘評估指標的關聯關系[4]。然而,文獻[3]采用的Apriori 算法和文獻[4]采用的FP-Tree 算法,主要基于支持度和置信度來衡量評估指標關聯關系的強弱,易引入冗余關聯關系[5]。本文探索一種基于改進Apriori 算法挖掘武器裝備系統效能評估指標之間關聯關系的方法,再利用極大不相關法減少冗余關聯關系的引入。

2 基于改進Apriori 算法挖掘關聯評估指標

2.1 傳統Apriori 算法簡介

2.1.1 關聯規則

關聯規則是形如X→Y的表達式,其中X,Y均為項集,且X∩Y =?,X被稱為規則前件,Y被稱為規則后件。關聯關系分析算法就是要從數據集中找到一些頻繁出現的關聯規則。

2.1.2 支持度與置信度

關聯規則是否頻繁出現,通常用支持度s與置信度c來度量,公式如下:

式(1)(2)中,σ(X∪Y)和σ(X)分別表示項集X∪Y和X在數據集中的計數,M表示事務總數。

2.1.3 頻繁項集、候選項集與強規則

關聯關系分析算法通常包括兩個步驟:一是確定頻繁項集,即提取滿足最小支持度閾值的所有項集,而需要計算支持度的項集被稱為候選項集;二是確定強規則,即從上一步確定的頻繁項集中,提取滿足最小置信度閾值的所有規則。

2.2 Apriori 算法的不足

Apriori 算法采用的支持度-置信度框架由于存在忽視規則后件支持度的固有缺陷[6~9],容易得到一些規則前件與規則后件互斥的虛假關聯規則,即規則前件的出現會降低規則后件的出現概率,下面舉例說明,見表1。

表1 虛假關聯關系說明表

假設表1 為1 000 次評估實踐中指標1 和指標2取值的分布情況。由表1 中的數據計算可知,關聯規則“指標2(高)→指標1(高)”的支持度s(指標2(高)→指標1(高))=60%,“指標2(高)→指標1(高)” 的置信度c(指標2(高)→指標1(高))=70.6%,按照Apriori 算法進行關聯規則分析,“指標2(高)→指標1(高)”易被確定為強關聯規則。然而,如果僅看指標1(高)的支持度,s(指標1(高))=71%,即s(指標1(高))>c(指標2(高)→指標1(高)),這說明“指標2 高” 的出現反而降低了“指標1 高” 出現的概率,因此“指標2(高)→指標1(高)” 是一個虛假關聯規則。

2.3 引入提升度的改進Apriori 算法

為改進上一節提到的Apriori 算法的不足,引入提升度的概念:

當Lift(X→Y)=1 時,表示X與Y相互獨立;當0<Lift(X→Y)<1 時,表示X出現會降低Y出現的概率;當Lift(X→Y)>1 時,表示X與Y同時出現的概率高。對于表1 的數據,c(指標2(高)→指標1(高))=70.6%,s(指標1(高))=71%,Lift(指標2(高)→指標1(高))=<1,這表明“指標2(高)” 出現會降低“指標1(高)” 出現的概率,“指標2(高)→指標1(高)” 是一個虛假關聯規則,應剔除掉。

3 基于極大不相關法剔除冗余評估指標

極大不相關法的具體計算步驟如下[10,11]:

假設有m個評估樣本,每個評估樣本都包含n個評估指標,則所有評估數據組成m × n的評估數據矩陣:

計算各評估指標的均值:

計算各評估指標的方差以及各評估指標之間的協方差:

式(8)(9)中,sii表示各評估指標的方差,sij表示各評估指標之間的協方差。

計算各評估指標之間的相關系數:

所有相關系數組成n × n的相關矩陣:

令R-i為相關矩陣R去除第i行和第i列后形成的矩陣,為矩陣R-i的逆矩陣,ri =(r1i,r2i,…,ri-1,i,ri+1,i,…,rni),為ri的轉置,則:

式(12)中,ρi被稱為復相關系數,能夠度量評估指標xi與其余n -1 個指標的相關性,且ρi的值越大,表示評估指標xi與其余n -1 個指標的相關性越高,即越容易被其余n -1 個指標替代,是冗余指標的可能性越大。

4 實例驗證

4.1 數據來源

實驗數據來源于文獻[1],其針對地空導彈武器系統效能評估,構建了包括5 個一級指標、18 個二級指標、20 個三級指標,共3 層43 個指標的評估指標體系,各個指標的權重基于層次分析法計算得到,具體數值見表2。

表2 地空導彈武器系統效能評估指標體系權重分布表

為模擬指標之間的強關聯關系,將“道路機動能力” 和“越野機動能力” 兩個二級指標的數據由其下屬的三級指標加權求和得到,且保證“道路機動能力” 下屬三級指標同時為“高” 的支持度大于60%,“越野機動能力” 下屬三級指標同時為“高”的支持度也大于60%;為模擬指標之間的普通關聯關系,“目標指示精度”“目標分辨力”“目標容量”和“可射擊能力” 等4 個二級指標的數據由其下屬的三級指標加權求和得到,其中的三級指標采用隨機模擬數據;為模擬指標之間的虛假關聯關系,借鑒表1 中的數據分布,模擬構建“作用距離” 與“滅火防爆能力”,“毀傷目標概率” 與“探測目標階段抗干擾能力”,“反應時間” 與“三防能力” 三對指標之間的虛假關聯關系。除此之外,其余的二級指標和三級指標都采用隨機模擬數據。

4.2 數據離散化

在挖掘關聯評估指標之前,需要對評估數據進行離散化,原因是不同評估指標的評估內容和計算方式不同,得到的評估數據的分布情況差異很大,且對評估數值高低的判斷標準有較大差異,在不進行離散化的情況下,難以對評估指標之間的高低關聯關系進行挖掘。

本文將所有評估指標都離散化為“高” 和“低”兩種取值,假設評估指標i的所有評估數值中最大值為max(i),最小值為min(i),則評估指標值v(i)為“高” 的標準是:

評估指標值v(i)為“低” 的標準是:

4.3 對比實驗及分析

基于4.1 節的地空導彈武器系統效能評估,根據4.2 節設計的標準完成評估數據離散化,然后分別利用傳統Apriori 算法與改進的Apriori 算法進行關聯評估指標挖掘,支持度閾值設為0.6,置信度閾值設為0.6,改進的Apriori 算法由于有提升度要求,將提升度閾值設為1.6?;趥鹘y和改進的Apriori 算法進行關聯規則挖掘的結果統計情況見表3。

表3 基于Apriori 算法進行關聯規則挖掘的結果統計表

通過比較上述兩種算法的挖掘結果可以發現,傳統Apriori 算法挖掘出的評估指標之間的強關聯規則為552 條,改進Apriori 算法可以有效篩選掉傳統Apriori 算法挖掘出的規則前件與規則后件互斥的虛假關聯規則,以及規則前件和規則后件獨立的關聯規則,當提升度閾值為1.6 時,可將強關聯規則精簡至36 條,精簡比例約為94%。由于篇幅所限,本文僅列出其中5 條強關聯規則進行分析,見表4。

表4 基于改進Apriori 算法挖掘的部分強關聯規則

通過分析改進Apriori 算法挖掘出的強關聯規則可知,二級指標26 與三級指標8,9,10,11 構成強關聯指標集,二級指標31 與三級指標12,13,14,15 構成強關聯指標集。

實際上,在構建模擬數據時,二級指標26 由三級指標8,9,10,11 線性求和得到,二級指標31 由三級指標12,13,14,15 線性求和得到,為排除這種人為引入的相關性,將兩個強關聯指標集內的二級指標去掉,利用極大不相關法計算剩余指標之間的復相關系數,有關三級指標8,9,10,11 的計算結果見表5。

表5 三級指標8,9,10,11 的復相關系數表

由復相關系數值排序可知,指標10 為冗余指標,同理可知指標15 為冗余指標。

5 結束語

本文提出“兩步走”的精簡評估指標體系方法,第一步基于改進Apriori 算法挖掘評估指標之間的強關聯規則,構建強關聯指標集;第二步基于極大不相關法剔除強關聯指標集中的冗余指標。通過地空導彈武器系統效能評估數據集實例驗證,本文提出的方法可以比傳統Apriori 算法更準確地挖掘出冗余指標。后續將在現有研究的基礎上,基于真實評估數據開展進一步研究,完善精簡評估指標的流程和方法。

猜你喜歡
項集置信度效能
基于數據置信度衰減的多傳感器區間估計融合方法
基于哈希表與十字鏈表存儲的Apriori算法優化
一種基于定位置信度預測的二階段目標檢測方法
立足優化設計提高作業效能
紅外空空導彈抗干擾效能評估建模
Sp-IEclat:一種大數據并行關聯規則挖掘算法
含負項top-k高效用項集挖掘算法
提升水域救援裝備應用效能的思考
地方機構改革“+”與“-”——減的是機構,加的是效能
校核、驗證與確認在紅外輻射特性測量中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合