?

基于灰色關聯理論的實例檢索與匹配*

2014-06-29 10:18胡玉蘭劉紅軍
組合機床與自動化加工技術 2014年9期
關鍵詞:庫中關聯度實例

郝 博,宋 陽,胡玉蘭,劉紅軍

(沈陽理工大學a.機械工程學院;b.信息科學與工程學院,沈陽 110159)

0 引言

由于復雜機械產品具有多層次結構特征,設計知識不易總結、難以用規則表達,因而采用基于規則推理的方法對于復雜機械產品是行不通的?;趯嵗评硎窃诨谝巹t推理的基礎上發展起來的?;趯嵗评淼暮诵乃枷胧菍⑦^去的實例存入實例庫中,對需要設計的產品,根據其特征屬性,按照相似度從實例庫中找到最匹配的實例,經修改后,成為能解決當前問題的新方案,將新方案作為新的實例存入到實例庫中[1]?;趯嵗评斫鉀Q了基于規則推理中專家獲取知識的“瓶頸”。然而如何準確、迅速地在實例庫中找到與設計問題最匹配的實例,是基于實例推理能否有效運用的關鍵。數理統計方法中的相關分析法、回歸分析法等都可以應用其中,但是存在一些局限性。因為這些方法都要求大量的數據或要求樣本具有典型的概率分布,而且計算量也較大,有時在實際工作中應用起來會很困難?;疑到y理論中的關聯度分析方法則克服了上述數理統計方法的不足,它對樣本量的大小沒有嚴格要求,不需要典型的分布規律,計算簡單方便易行,而且分析的結果一般與定性分析相吻合,因而實用性很強[2]。

本文以數控機床的主軸為例,將一些已經投入使用的主軸實例存入實例庫,利用灰色關聯分析法計算設計問題與實例間的相似度,從而找到與設計問題相似的5 個實例參與實例修改,為了使實例修改的結果更加貼近設計問題,同時采用其他相似度算法驗證所得結果的準確性。

1 實例的表達與描述

完整、準確地表示實例是進行實例匹配的重要前提,表達的方式與內容直接影響實例匹配的準確度與精確度。設在實例庫中有m個實例,每個實例有n個特征屬性[3],實例在實例庫中的表示如表1所示。

表1 實例表示形式

每個實例都有唯一的實例編號,它是實例庫的主關鍵字。

2 實例的檢索與匹配

2.1 向量的表示

在復雜機械產品的實例匹配中應用灰色關聯分析法,將問題特征屬性向量作為參考數列,實例庫中的實例特征屬性向量作為比較數列,對兩者進行相似度的計算,得到設計問題與實例間的相似度[4]。

設問題特征屬性向量為X0,實例特征屬性向量構成實例特征屬性矩陣X。如下所示:

其中,Xi =(xi(1),xi(2),…,xi(n))T,i=0,1,2,…,m。Xi表示實例編號為i的實例,xi(k)表示第i個實例的第k個特征屬性的量值。

2.2 實例檢索與匹配算法

2.2.1 規一化處理

由于實例的不同特征屬性值具有不同的量綱,在計算時不僅會增加計算的難度,而且會對計算結果產生一定的影響,所以要對向量X0與矩陣X 中的分量xi(k) 進行規一化處理。本文采用的規一化方法為:將每一個分量相應的擴大或者縮小10 的倍數,使得所有分量都具有相同的數量級[5]。

2.2.2 實例檢索與匹配算法

灰色關聯理論的應用比較廣泛,在灰色系統中其理論比較成熟?;驹硎峭ㄟ^對統計序列幾何關系的比較來分清系統中多種因素間的關聯程度,序列曲線的幾何形狀越接近,則表示兩者的關聯度越大[6]。

具體計算方法如下[7]:

步驟一:計算灰色關聯系數。

式(3)中,ε =0.5。βk為實例特征屬性k的權重值實例特征屬性的權重是指該特征屬性在整個實例中的相對重要程度。變異系數法是各個特征屬性向量的標準差與平均數的比值,是一種客觀賦權的方法,避免了主觀因素的影響,所以本文利用變異系數法確定權重向量ω[8]。

經計算得到灰色關聯系數矩陣:

步驟二:因為灰色關聯系數的取值范圍為0 到1 之間,而距離的取值范圍為0 到無窮大,所以需要將灰色關聯系數矩陣中的值進行轉換,便于后面數值的計算。

步驟三:用歐幾里德距離計算相似度,采用以下公式進行轉換:

經過驗證,式(3)~式(7)均滿足灰色關聯理論四公理。

通過計算可以得到設計問題與實例庫中實例之間的灰色關聯度。根據具體情況設定一個閾值,只有當某一實例的灰色關聯度大于該閾值時,才認為設計問題與這一實例相似。如果所有實例的灰色關聯度都低于這一閾值,則采取某種算法對灰色關聯度較高的實例進行修改,然后進行實例評價,直到找到灰色關聯度大于閾值的實例。

3 實例驗證

利用實例庫中的11 個已經開發成功的數控機床的實例驗證本文提出的方法。

本文中的復雜機械產品為數控機床,這里以數控機床的主軸為例,數控機床的其它部分類似。在實例庫中主軸的實例表達形式見表。

表2 主軸實例的表達形式

設計問題特征屬性向量X0=(0.004 2400 37 230 76),對向量X0做規一化處理,例如對回轉精度做規一化處理時,取0.001* mm 為單位,那么x0( 1) =4。對于其它的數值以同樣的方法進行規一化,這樣,通過對向量中的數值適當的擴大或者縮小10 的倍數,使向量中不同的特征屬性值具有相同的數量級。規一化處理后,設計問題特征屬性向量變為X0=(4 2.4 3.7 2.3 7.6)。對實例特征屬性矩陣做相同的規一化處理。

利用實例庫中的11 個實例的數值計算實例特征屬性的權重,得到權重向量ω = (0.3695 0.1391 0.2133 0.1235 0.1546)。

利用灰色關聯度的公式計算設計問題與各個實例間的相似度見表3。

表3 設計問題與各個實例之間的相似度

表格中Xi表示在實例庫中實例編號為i的實例。設定閾值為0.95,故需要進行實例修改,實例修改需要從實例庫中選擇5 個實例,從計算結果可以看出,選取5 個實例編號分別是1、2、3、4、5 的實例。

為了驗證利用加權灰色關聯度公式計算出的結果有效且準確,下面分別利用傳統灰色關聯算法、基于海明(Hamming)距離的以及基于歐拉(Euler)距離的最近鄰相似度算法和統計學中的相關分析計算設計問題與實例的相似度。

利用傳統的灰色關聯分析法計算設計問題與實例間的灰色關聯度,由于僅提取11 個實例中的5 個關聯度較高的實例參與后續的實例修改,所以表4 僅列出5 個關聯度較高的實例的計算結果。

表4 設計問題與實例之間的相似度

從計算結果可以看出,選取編號為1、2、3、4、5 的實例參與實例修改。

利用文獻[9]提出的基于海明(Hamming)距離的以及基于歐拉(Euler)距離的最近鄰相似度算法計算設計問題與實例間的關聯度,提取5 個關聯度較高的實例,見表5,表6。

表5 基于海明距離的相似度算法的結果

表6 基于歐拉距離的相似度算法的結果

綜合兩種算法的結果,選取編號為1、2、3、4、5 的實例參與實例修改。

利用SPSS 軟件計算實例庫中11 個實例與設計問題的相關系數[10],得到的結果如表7 所示。

表7 設計問題與實例間的相關系數

表7 中列出了相關系數較高的前5 個實例。從表7 可以看出,相關分析的結果與前面幾種算法的結果大體上相同,與設計問題相關系數較高的都是實例編號為1、2、3、4、5 的實例,但是在相關系數的排序上卻有很大的不同。進行相關分析時,要求有大量的數據,并且要求樣本服從某一種典型概率分布,各因素數據與系統特征數據之間呈線性關系且各因素之間彼此無關。這很有可能是導致結果出現偏差的主要原因。

綜上所述,選用實例編號為1、2、3、4、5 的實例參與實例修改。

4 結論

運用灰色關聯分析方法進行復雜機械產品的實例檢索與匹配,計算簡單方便,使得設計問題能夠很快的找到實例庫中的相似實例,計算所得到的結果與最近鄰的相似度算法等的分析結果幾乎一致,所以此方法是可行的,并且為實例的檢索與匹配提供了借鑒,為產品的順利開發奠定了堅實的基礎,提高了基于實例推理的復雜機械產品的應用效率。

[1]杜偉明.基于實例推理的齒輪減速機三維CAD 設計系統與實現[D].成都:電子科技大學,2012.

[2]呂翠美,吳澤寧,胡彩虹.用水結構變化主要驅動力因子灰色關聯度分析[J].節水灌溉,2008(2):39 -45.

[3]賀曉,劉景寧,李淑霞.基于灰色關聯理論的案例推理在故障智能診斷系統中的應用[J].中國機械工程,2004,15(22):2022 -2026.

[4]邵民智. 灰色關聯分析法在項目敏感性分析中的應用[J].上海工程技術大學學報,1998,12(4):36 -39.

[5]嚴波. 基于實例推理的車床主軸部件智能CAD 系統的研究[D]. 沈陽:東北大學,2010.

[6]鄧聚龍.灰色系統理論教程[M].武漢:華中理工大學出版社,1990.

[7]汪明天,劉夫云,黃美發.基于加權灰關聯的產品配置相似實例檢索算法研究[J]. 計算機應用研究,2009,26(11):4084 -4086.

[8]趙宏,馬立彥,賈青.基于變異系數法的灰色關聯分析模型及其應用[J].黑龍江水利科技,2007,35(2):26 -27.

[9]崔凱.基于CBR 的發動機智能設計的研究[D].濟南:山東大學,2012.

[10]歐亞波,李澤琴.地下水水質評價中相關性分析方法的應用[J].廣東微量元素科學,2007,14(8):18 -22.

猜你喜歡
庫中關聯度實例
英語專業學士學位論文摘要的元話語特征研究
街頭的人
功能強大的濾鏡庫
中國制造業產業關聯度分析
中國制造業產業關聯度分析
沉香揮發性成分與其抗腫瘤活性的灰色關聯度分析
從今天開始
完形填空Ⅱ
完形填空Ⅰ
廣義區間灰數關聯度模型
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合