?

基于粗糙集理論的裝備質量基因要素信息篩選?

2022-06-21 07:39戰希臣楊睿英
艦船電子工程 2022年5期
關鍵詞:粗糙集指標體系裝備

戰希臣 楊睿英 郭 聚

(海軍航空大學航空基礎學院 煙臺 264001)

1 引言

裝備是部隊執行各項任務的基本物質保證,其質量情況與部隊作戰能力息息相關。影響裝備質量的因素復雜多樣,其中基因要素對裝備質量特性的形成具有決定性作用。質量基因要素是指在裝備全壽命周期中,對裝備質量產生決定性作用且具有一定遺傳特性的一系列關鍵指標[2]。在對裝備質量進行跟蹤管理的過程中,只要掌握了質量基因要素,也就掌握了裝備的整體質量狀況。所以,在影響裝備質量的眾多因素中篩選出質量基因要素,是非常重要的。比如在某型裝備研制生產階段,可根據該裝備質量特性形成的過程和特點,歸納出裝備質量的影響因素集,并以之構建質量指標體系。在此基礎上,運用基于粗糙集屬性約簡的方法,可將該裝備研制生產階段的質量基因要素指標篩選出來。

2 某型裝備質量指標體系構建

借鑒現代產品質量管理分析理論,從某型裝備研制生產階段的質量特性形成過程來看,其關鍵性影響因素為“5M1E”,即:人(Man)、機器設備(Ma?chine)、材料(Material)、測量(Measurement)、方法(Method)和環境(Environment)6 個方面[1]。結合“5M1E”理論與該裝備實際研制生產的特點,其質量的影響因素可歸納為以下7個方面:人員因素、生產設備因素、產品原材料因素、技術工藝因素、環境因素、資金保障因素和質量信息管理因素。通過在某軍工單位實地調研的情況,對以上質量因素進行細化研究,可得到質量指標因素的二級指標,從而構建較為完整的裝備質量指標體系,如圖1所示。

圖1 裝備研制生產階段質量指標體系

3 基于粗糙集理論的裝備質量基因要素信息篩選模型構建

3.1 粗糙集理論

1982年,波蘭的Z.Pawlak教授在現有關系理論以及集合論的基礎上,提出了粗糙集(Rough Set)的概念,用以處理難以精確計算以及不完整的數據。粗糙集以等價關系(不可分辨關系)將集合中的元素進行分類,并形成與其相對應的劃分。同一劃分被稱為等價類,可用于信息的簡化[5]。

粗糙集基于等價關系,通過構建信息表,利用可準確計算的近似集逼近待定的不精確集合。該集合的邊界區域為上、下近似集之差。通過等價關系可以精確描述上、下近似集,而邊界區域的模糊元素數目可以被計算出來。粗糙集理論的主要應用有兩方面,一是對現有數據集合進行屬性約簡;二是分析分類規則[6]。本文主要是應用粗糙集屬性約簡的方法對裝備質量基因要素指標進行篩選。下面介紹關于粗糙集的幾個重要定義。

1)信息表

稱四元組S=(U,A,V,f)為信息表(也叫決策表)。其中U={x1,x2,…,xn}為非空有限集合(xn為對象),稱為論域;A為對象的屬性集合,分為條件屬性C和決策屬性D,A=C∪D,C∩D=φ;V=∪Va是屬性值的集合,Va表示屬性a∈A的屬性值值域;f:U×A→V是賦值函數,用于給所有對象的屬性賦值,即a∈A,x∈U,fa(x)∈Va。

2)等價關系

對 于 ?a∈R,R?A,x∈U,y∈U,如 果 有fa(x)=fa(y)成立,稱對象x和y是對屬性R的等價關系(也稱不可分辨關系),也就是根據R中的屬性無法區分對象x和y。表示為

3)等價類與劃分

在U中,具有同樣的等價關系IND(R)的集合稱為等價類,有:

由此可知,正域POSR(X)為一定屬于集合X的對象組成的集合;負域NEGR(X)為一定不屬于集合X的對象組成的集合;邊界域BNDR(X)表示不能確定是否屬于集合X的對象組成的集合。

關于上近似、下近似、正域、負域、邊界域的關系如圖2所示。圖中,橢圓區域表示集合X,紅色區域為X的正域(下近似),灰色區域為X的負域,綠色區域為X的邊界域,紅色∪綠色區域為X的上近似。

圖2 近似集、正域、負域、邊界域示意圖

6)粗糙集

若R-(X)=R-(X),即BNDR(X)=φ,稱X為R的可定義集;若R-(X)≠R-(X),即BNDR(X)≠φ,稱X為R的粗糙集(也稱不可定義集)。

R-(X)是包含X的最大R可定義集,R-(X)是包含X的最小R可定義集,若X為粗糙集,則X只能通過R-(X)與R-(X)近似地描述。

7)約簡與核

信息表中的屬性可能存在冗余屬性,冗余屬性對信息表的分類能力沒有作用。屬性約簡也就是保持信息表分類能力不變的前提下,去除冗余屬性。

對信息表S=(U,A,V,f),如果B?A且有IND(B)=IND(A),則B為A的一個約簡,記為RED(A)。

屬性集A的所有約簡的交集稱為A的核,記為

8)相對約簡與相對核

設決策屬性D的劃分為U/D={E1,E2,…En},則條件屬性C相對于決策屬性D的正域為

若c∈C,且POS(C-{c})(D)=POSC(D) ,則 稱c是C中不必要的,即可約簡的;否則,稱c是C中不可約簡的。

若R?C,且R中所有元素都是必要的,如果有POSR(D)=POSC(D),則稱R是C中相對于D的約簡,記為REDD(C),所有這樣的約簡的交集稱為C相對于D的核,記為

約簡后的屬性集稱為屬性約簡集,信息表的屬性約簡集一般不唯一,約簡集中屬性個數最少的叫做最小約簡集。屬性約簡問題一般都是求最小約簡集,最小約簡集不一定唯一,可根據問題實際進行選擇。

3.2 篩選模型構建

基于粗糙集的指標信息篩選,也就是通過粗糙集理論的屬性約簡原理,通過約簡得出屬性集的最小約簡集,從而在最大限度保留原始信息量的前提下,去除冗余指標,達到將指標體系化繁為簡的目的,這也正是裝備質量基因要素信息的本質要求,所以對于裝備質量基因要素信息的篩選可以采用基于粗糙集的屬性約簡方法。

篩選模型的基本步驟如下。

Step 1指標體系初建。根據指標體系建立的一般原則,結合問題對象特點,通過調研,仔細分析問題的影響因素集(屬性集),而后由大到小、由表及里地分層構建指標體系。

Step 2數據離散化。通過實地調研、采集歷史數據或者專家打分等方法,收集指標的相應數據,并根據篩選模型的要求進行數據預處理。由于粗糙集方法不能處理連續屬性問題,所以需要將數據離散化。定量指標一般為連續型數據,可采用等寬離散、等頻離散或者聚類等方法離散化(具體方法見文獻[6~8]);對于定性指標,可采用專家打分法直接得到離散化數據。

Step 3建立信息表。根據指標性質,區分條件屬性C和決策屬性D;根據采集的數據樣本份數確定論域U,而后構建信息表。

Step 4屬性約簡。通過粗糙集屬性約簡理論去除冗余屬性(指標),得到最小約簡集,從而得到篩選后的指標體系。

Step 5指標檢驗。采用KW檢驗、F統計量檢驗等方法檢驗篩選后的指標是否符合預定的數據相關性要求。若不符合要求,則調整指標體系,返回Step 1;若符合要求,則指標信息篩選完成。篩選模型的流程如圖3所示。

圖3 指標信息篩選模型流程圖

4 實例分析

對于某型裝備研制生產階段的質量基因要素信息篩選問題,根據圖1中的質量指標體系展開信息篩選,該指標體系由7個一級指標和25個二級指標構成。質量基因要素指標屬于一級指標,因此主要針對7個一級質量指標收集數據。

4.1 裝備質量指標數據收集和信息表構建

為了準確收集某型裝備研制生產階段質量指標信息,采取在某軍工單位實地調研以及邀請軍工單位和部分院校專家進行專家打分的方式,采集7個指標的相關數據。鑒于粗糙集理論對于離散化數據的要求,將各項指標參數劃分為4個等級,每個等級分別對應1~4分,如表1所示。通過專家打分得到每個指標對應的等級和分數,作為信息表的離散化數據。收集15組樣本,并建立信息表,如表2所示。

表1 指標參數等級表

4.2 裝備質量基因要素指標篩選

1)由表2可直接得到論域U,條件屬性C,決策屬性D:

表2 裝備質量指標信息表

4)根據以上計算,可知C的核CORED(C)={c1,c2,c3,c4,c7},c5和c6是兩個不必要屬性,但不一定能同時約簡。下面計算同時去除c5和c6時C相對于D的正域:

POS(C-c5-c6)(D)=POSC(D),所以,c5和c6可以同時約簡。

所以,C的最小約簡為。經過屬性約簡,環境條件因素c5和資金保障因素c6被篩除。

4.3 篩選指標檢驗

指標篩選完成后,可采用KW檢驗法進行檢驗以驗證篩選指標是否合理。

1)KW檢驗法

KW檢驗即Kruskal-Wallis檢驗,也稱為H檢驗。KW檢驗是一種秩和檢驗,根據所有數據從小到大排列,算出每個數據的秩并計算每組數據的秩和,然后根據下式計算KW值:

其中,Ni為每組的樣本個數,Ri為每組的秩和。n為所有數據總數,k為組數。如果樣本中存在結值(具有相同秩值的數據),則需要在KW值中加入校正系數C:

其中τj是第j個結值的個數。校正后的KW′值為

求出KW′值后,可通過查卡方檢驗表判斷每組數據間是否具有顯著性差異,從而驗證篩選指標是否合理。

2)用SPSS軟件進行篩選指標的KW檢驗

SPSS軟件是IBM設計的一款數據分析與計算軟件,具有實用高效便利的特點。本文使用SPSS Statistics 26版本進行篩選指標的KW檢驗。

在SPSS菜單欄“分析”中下拉菜單“非參數檢驗”、“舊對話框”、“K個相關樣本”中打開KW檢驗功能。分別輸入未篩選的7個指標數據和篩選后的5個指標數據,相關檢驗結果如圖4、5所示。

圖4 篩選指標的KW檢驗結果

圖5 原指標的KW檢驗結果

由圖可知,篩選前7個指標的漸進顯著性為0.143,篩選后5個指標的漸進顯著性為0.101,篩選后的指標集的數據差異性變大了,說明數據的相對獨立性更好,信息載荷量更大。因此,篩選的指標是合理的。至此,將原質量指標體系的7個質量指標成功簡化為5個指標:人員因素、生產設備因素、產品原材料因素、技術工藝因素、質量信息管理因素,此即某型裝備在研制生產階段的質量基因要素。

5 結語

在現階段裝備質量管理中,要提高工作效率、更好地掌握裝備質量動態情況,就勢必要在繁冗復雜的質量指標因素中化繁為簡、提取要素。裝備質量基因要素信息篩選工作正是基于此思路展開的。本文構建的基于粗糙集理論的裝備質量基因要素信息篩選模型,為裝備質量信息的收集和提取提供了實用手段,并為后續的裝備質量動態評估與跟蹤管理以及裝備質量信息系統的構建提供信息來源和數據支撐。

猜你喜歡
粗糙集指標體系裝備
哪些裝備為太空之旅護航
這些精銳與裝備馳援瀘定
2022城市商業魅力指標體系
港警新裝備
交通強國建設評價指標體系
公路工程造價管理績效評價指標體系研究
構建市(區)人才發展管理服務水平評價指標體系
基于粗集決策規則性質的研究
一種基于改進的層次分析法的教師教學質量評價模型
一種改進的ROUSTIDA數據填補方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合