?

融合PFS與RS的案例知識供需匹配研究

2020-12-07 08:20張建華李方方
計算機工程與應用 2020年23期
關鍵詞:畢達哥拉斯模糊集粗糙集

張建華,李方方,楊 嵐

1.鄭州大學 管理工程學院,鄭州 450001

2.鄭州大學 機械與動力工程學院,鄭州 450001

1 引言

在知識經濟時代,知識已經成為生產運營活動中必不可少的重要資源。隨著知識管理研究的不斷深入,如何提高知識資源的應用與創新效益,成為業內關注的焦點。知識資源與用戶需求之間的匹配程度制約著知識效能的發揮[1]。知識供需匹配可以有效解決知識傳遞效率低的問題,是實現知識資源有效配置、應用乃至創新的前提。根據知識自身的復雜特性,可將其劃分為多種類型;在完備知識結構中,模糊不確定性知識占有很大比重。探討不確定性知識系統與用戶知識需求之間的匹配問題,是提高知識資源利用率的關鍵。

粗糙集是處理不確定性和模糊性問題的常用數學方法。不過,其只適用于處理知識表達系統中離散型或符號型的屬性值;然而,對連續型的屬性值實施離散化,亦可能導致重要信息損失。于是,有學者將模糊集與粗糙集相結合,用模糊相似關系代替等價關系,以擴展粗糙集理論到模糊粗糙集[2]。近年來,隨著模糊粗糙集理論的發展,越來越多的科研工作者將其與其他數學方法相結合,以研究屬性約簡與決策問題。(1)在屬性約簡方面。路艷麗等將直覺模糊集與模糊粗糙集相結合,將知識約簡概念推廣到直覺模糊環境[3]。王金英等將二型直覺模糊集和粗糙集理論融合,建立了二型直覺模糊粗糙集模型,并對二型直覺模糊關系進行了界定[4]。為了提高處理噪音數據的精確度,李冬梅等提出了基于區間二型模糊粗糙集的屬性約簡算法,該算法可在有限時間內收斂,使計算結果更加合理[5]?;趪栏?、平均、寬松三個視角,Zhang 等引入了三種二類分類方式,并提出了基于模糊粗糙集的多標記屬性約簡算法;由于該方法需要計算多個標記對應的模糊下近似,導致計算復雜度較高[6]。張照星等為了解決對不同參數約簡需重新計算的問題,利用嵌套結構,提出了基于已有約簡的快速約簡算法,有效降低了屬性約簡的時耗[7]。為提高屬性約簡的效率,彌補現有基于模糊粗糙集的多標記特征選擇算法僅能對單一的樣本空間刻畫屬性區分能力的不足,姚二亮等考慮了屬性對標記的區分能力,從標記和樣本兩個空間出發,提出了基于雙空間模糊辨識關系的多標記特征選擇算法,并通過權重融合的方式對兩種多標記屬性重要度進行融合,從而提出多標記屬性約簡算法[8]。針對模糊粗糙集中相交運算可能會導致高維數據空間中模糊決策辨別力低的問題,Wang 等將距離測度引入模糊粗糙集,基于此構建了模糊粗糙集模型,并給出了計算屬性相關性與重要性的迭代公式,設計了一種貪婪收斂的屬性約簡算法,實驗分析驗證了該算法的有效性及比較優勢[9]。(2)在決策研究方面。不少學者將模糊粗糙集與其他理論相結合對決策問題展開了研究。如針對模糊系統中噪聲對相似度計算結果的影響,楊霽琳等通過引入閾值對,建立了基于相似度三支決策的模糊粗糙集模型。該模型保留了模糊信息系統的不確定性,并降低了噪聲的影響[10]。傳統的直覺模糊粗糙集未考慮屬性之間的差別,趙天娜等構造了多伴隨直覺模糊粗糙集模型,并將其運用到三支決策中,研究了基于多伴隨直覺模糊粗糙集的三支決策算法,更符合實踐過程規律[11]。根據數據的模糊性和不可區分性,Vluymans等為解決機器學習方法難以選擇合適加權方案的問題,提出了有序加權平均的模糊粗糙算子,通過實驗分析證明了基于有序加權平均模糊粗糙集的適用性,實現了對加權方案選擇過程的優化[12]。Zhang等基于覆蓋模糊粗糙集模型提出了TOPSIS-WAA 方法用于解決多準則決策問題,并將五種不同的決策方法與該方法進行了比較,并通過實證證明了TOPSIS-WAA 方法解決決策問題的優越性[13]。根據多元化、多屬性的群體決策問題,Sun等將模糊粗糙集與粒計算相結合,構建了多粒度軟模糊粗糙集模型,并通過定義多粒度的上下近似,提出了一種基于多粒度軟模糊粗糙集和TODIM的多元化多屬性群決策方法,該方法可以有效規避損失,并充分考慮了決策者的參考依賴[14]。在多屬性決策系統中,一般的屬性決策方法很難進行有效的決策規則提取和方案排序,劉勇等構建了一種基于優勢直覺模糊粗糙集的決策方法,能很好地處理含有偏好信息和模糊信息的多屬性決策系統[15]。綜上,模糊粗糙集已成為研究不確定性知識獲取的基本方法。

同時,為了能夠更加客觀地描述現實世界的模糊本質,越來越多的學者將直覺模糊集引入模糊粗糙集中。直覺模糊集考慮了隸屬度、非隸屬度和猶豫度信息,研究成果豐碩[16-17]。但直覺模糊集只能描述隸屬度與非隸屬度之和不大于1 的情況,使決策過程受限,影響其適用范圍。為解決這一問題,Yager等提出隸屬度、非隸屬度之和大于1,而平方和不超過1 的畢達哥拉斯模糊集(PFS)[18-19]。Garg 對PFS 的相關系數進行了計算,并考慮不同元素的權重問題,對相關系數的計算方法進行改進,以得到更為準確客觀的計算結果,最后將其應用到多屬性決策過程中[20]。在此基礎上,劉衛鋒等將PFS進一步擴展,提出了畢達哥拉斯猶豫模糊集,并給出其相關測度的計算過程[21]。綜上可知,PFS 是對直覺模糊集的推廣,比直覺模糊集有更強的刻畫模糊現象的能力[22]。隨著信息技術的不斷發展,面對海量的知識,用戶往往會出現“知識迷向”的問題。因此,對知識資源與用戶需求進行匹配是實現知識資源有效配置的關鍵。在既有研究的基礎上,本文將PFS 與模糊粗糙集相結合,發揮其各自優勢,提出畢達哥拉斯模糊粗糙集(PFRS),構建模糊知識表達系統,并將衡量知識供需匹配程度的屬性相似度用PFS相關系數進行表示,同時考慮知識屬性集對應的權重向量(知識視圖)決定了參與匹配計算的屬性數量及各屬性的參與程度[23],將其與視圖相似度結合,確定最終匹配結果。

2 相關知識

現實世界中存在大量的不確定性知識,快速準確地為用戶提供所需要的知識,是提高知識資源利用效益和用戶滿意度的關鍵所在。粗糙集作為一種處理模糊不確定性的計算方法,自提出以來相關學者對其進行不斷完善與改進,并通過與其他模糊理論相結合以突破傳統粗糙集的局限性。

(1)模糊粗糙集

傳統粗糙集采用離散化手段對數值型數據進行處理時,會造成信息損失。針對這一局限性,諸多學者引入模糊理論,提出了模糊粗糙集。其定義為:設U為論域,若R∈F(U×U),則R為一個在U×U上的模糊關系。給定相似關系R,模糊集合中的上、下近似為[24],對于 ?x∈U,

模糊決策系統可用二元組進行表示:(U,A?D),A?D=?,其中,A為條件屬性集,D為決策屬性集。定義為決策屬性集D上的一個等價關系,則由RD產生關于U的分類為:是包含元素xi的等價類,其中,。

(2)直覺模糊集

模糊粗糙集在處理不確定性知識時,只能用隸屬度刻畫完全肯定的程度,而對完全否定則缺乏判斷[25]。為解決這一問題,有學者通過引入直覺模糊數對模糊理論進行了擴充[26]。設X為一個非空論域,稱A={x,μA(x),為論域X上的一個直覺模糊集,其中是X上的模糊集,μA(x)、νA(x)分別為論域X上元素x屬于A的隸屬度和非隸屬度,且?x∈X,μA,νA∈ [0,1],滿足0 ≤μA(x)+νA(x)≤1。

(3)畢達哥拉斯模糊集

與傳統模糊集相比,直覺模糊集更符合決策者對被評估對象表現出肯定、否定和猶豫的思維習慣,在處理模糊性和不確定問題方面更具靈活性和實用性[27]。然而,在直覺模糊決策過程中,Yager等發現專家給出的方案往往會出現屬性的隸屬度與非隸屬度之和大于1 的現象,此時直覺模糊集無法正確地描述專家對信息的偏好,于是提出了畢達哥拉斯模糊集對其進行擴展。畢達哥拉斯模糊集的定義如下[18]:

設X為論域,則稱為畢達哥拉斯模糊集(PFS),其中μA(x)為:X→ [0,1],νA(x):X→[0,1]分別為X上元素x屬于A的隸屬度和非隸屬度。為x屬于A的猶豫度或不確定度。稱為畢達哥拉斯模糊數,為方便表述,將其記為在畢達哥拉斯模糊系統中,A的信息能量可表示為:

A與B的相關系數可表示為:

3 基于PFRS的知識供需匹配

源于客觀世界的復雜性與不確定性,實踐中存在大量模糊的、偏好型知識,如何使其精準滿足用戶需求,是確保知識資源有效配置的前提。傳統的知識供需匹配方法多以模糊粗糙集為理論基礎,但該方法在刻畫不確定性現象時具有一定的局限性。畢達哥拉斯模糊集是近年來被提出的處理模糊現象的有力工具。為彌補模糊粗糙集在描述不確定性知識方面的不足,本文將畢達哥拉斯模糊集與其相結合,提出基于畢達哥拉斯模糊粗糙集的知識供需匹配模型。該模型主要包括兩個部分:(1)建立畢達哥拉斯知識表達系統,通過對原始數據的處理,實現對知識屬性值的畢達哥拉斯模糊數表示;(2)將畢達哥拉斯模糊集的相關測度引入知識供需匹配過程,對知識視圖相似度進行改進,以提高匹配結果的準確性,并根據用戶需求與既有知識之間視圖相似度的計算結果確定匹配對象。

3.1 畢達哥拉斯模糊粗糙集

模糊粗糙集是處理不精確、不確定性問題的重要數學工具。它通過將模糊集中的隸屬度看作粗糙集中的屬性值,可有效進行特征選??;同時,亦可避免對連續屬性值的離散化,減少了信息損失。畢達哥拉斯模糊集是對直覺模糊集的擴展,可描述隸屬度與非隸屬度之和大于1 且平方和小于等于1 的現象,又能體現決策者在二者之間的猶豫程度,是一個對不確定現象進行表達的強有力工具。將畢達哥拉斯模糊集與模糊粗糙集相結合,本文構建畢達哥拉斯模糊粗糙集(PFRS)模型。

定義1設為論域U中的畢達哥拉斯模糊集合,R是論域U上的畢達哥拉斯模糊等價關系,對x∈U,A畢達哥拉斯模糊粗糙集的上、下近似可分別表示為:

其中:

設S=(U,A,V,F)為畢達哥拉斯模糊知識表達系統,U={x1,x2,…,xn} 為論域,且是一個非空有限集合;A為屬性集,可表示為A=C?D,且C?D=? 。其中,C={a1,a2,…,am} 為條件屬性集,對于 ?ai∈A都有一個映射:U→Vai,Vai為ai的屬性值;D={d}為決策屬性集,Vd為決策屬性d的值域,知識i的第j個條件屬性值為vij。在PFRS 中,條件屬性值vij可由一組畢達哥拉斯模糊數進行表示,即ννij分別表示U上知識i的第j個屬性屬于A的隸屬度和非隸屬度;πνij表示U上知識i的第j個屬性屬于A的不確定度,其中πνij=f(μνij,ννij),為方便表述,后文簡記為。

3.2 知識供需匹配算法

傳統的匹配方法一般由用戶知識需求與已有知識之間的視圖相似度來衡量匹配水平。視圖相似度是通過用戶所需知識的各屬性與所提供知識屬性集之間的相近程度確定。本文通過引入PFS 相關系數對視圖相似度進行改進,以提高匹配精度。PFS相關系數是將知識看作一個整體來考慮的,通過各知識與用戶需求之間的相關程度確定匹配結果?;诖?,本文將屬性相似度通過PFS相關系數進行表征,其計算方法為式(2)~(4)。同時,考慮屬性集各成分對知識供需匹配過程的影響差異,引入知識屬性權重向量,對相關系數進行改進,得出視圖相似度,使計算結果更為準確客觀?;谇笆鲇嬎愎娇芍?,確定知識屬性權重是計算知識用戶需求與既有知識之間視圖相似度前提。熵權法根據數據的離散程度確定權重,使計算結果更為客觀可靠、區分度較高,本文選取它計算各知識屬性的權重向量。

該方法的計算過程為:(1)為消除不同量綱對計算結果的影響,對原始屬性數據實現歸一化處理;(2)計算屬性aij的信息熵,;(3)通過信息熵計算各屬性的權重,?;趯傩詸嘀乜梢郧蠼庥脩糁R需求與知識之間的視圖相似度,其計算公式如下:

綜上,在基于畢達哥拉斯模糊粗糙集的知識供需匹配過程中(以案例知識為例),需首先構建知識表達系統S=(U,A,V,F),同時確定各知識屬性的權重,即計算屬性集C對應的權重向量ω=(ω1,ω2,…,ωm)T;進而計算在論域U中,各案例知識的信息量;而后輸入用戶需求C′,并將知識需求進行標準化處理,計算其與案例知識xi的相關指標,從而求出知識供需匹配視圖相似度的計算結果(Simiq):若Simiq=1,則將匹配結果提交用戶。由于在知識供需匹配過程中,視圖相似度的結果為1的可能性很小,因此,本文在供需匹配過程中預設視圖相似度閾值α,將Simiq與該閾值進行比較:若Simiq≠1且滿足Simiq≥α,則將滿足條件的案例提交適配,重構滿足用戶需求的解/決策屬性并形成新案例提交用戶(已另文探討)。后續需計算新案例與系統既有各案例之間的視圖相似度,若其最大值小于系統學習閾值,則案例入庫;否則,系統不予納入、放棄學習。若所有案例視圖相似度Simiq<α,則既有知識庫尚未具備滿足用戶需求的知識,匹配失敗。如此,基于PFRS的知識供需匹配過程如圖1所示。

4 實證分析

為驗證前述基于PFRS 知識供需匹配方法的有效性與可行性,本文選取UCI 數據庫中的“iris”數據集進行實證分析。該數據集記錄了三種鳶尾花的不同生長特點,同一模式下的案例數量為150。每一案例包含4個條件屬性,1 個決策屬性。首先,對案例庫中的原始數據進行標準化處理,即對屬性值vij∈A有:為方便表述,仍用vij標記標準化的條件屬性值。同時,采用熵權法確定知識庫中各條件屬性的權重,得該數據集的屬性權重向量為:ω=(0.243 1,0.155 7,0.191 3,0.409 9)T。而后,建立知識表達系統,對預處理后的數據集中任意標準化的條件屬性a,定義模糊關系:若為符號值的條件屬性c,則定義:由此,該案例庫轉化為一個畢達哥拉斯模糊決策系統。

圖1 知識供需匹配過程

已知某用戶的知識需求表述為C′=(6.8,3.5,4.3,1.7 )。經標準化處理后,該用戶知識需求可轉化為:C′={ 0.482 3,0.093 4, 0.390 6,0.140 6, 0.312 8,0.194 2,0.444 4,0.111 1 }。在此基礎上,將用戶需求與知識庫中的所有案例進行匹配計算。由于在實踐過程中,匹配結果往往無法完全滿足用戶需求,即視圖相似度為1。因此,本文僅得出在既有案例下,與之匹配程度足夠相近的案例。在知識供需匹配過程中,設置視圖相似度的閾值為α=0.95,當視圖相似度Simiq≥0.95 時,返回該匹配案例;重復該過程,直至遍歷知識庫中所有案例知識;若在匹配過程中,視圖相似度滿足Simiq≠1 且Simiq≥0.95,則進行案例適配(適配過程參見文獻[28])。依前文所述的方法確定供需匹配的案例集,經計算可知,滿足Simiq≥0.95 的案例有15 個。為方便表述,將知識庫中的案例按照決策屬性d進行排序,具體的匹配案例結果如表1所示。

表1 匹配案例集

在供需匹配過程中,符合匹配要求的案例集的計算過程如下,首先,基于前文所述,計算案例知識庫中xi的信息能量Eω(xi),其計算結果如表2 所示。繼而,根據知識供需匹配過程,計算用戶知識需求C′與案例知識之間的相關指標Cω(xi,C′ ),其結果如表3 所示。最后,根據式(7),將用戶需求與案例集中各案例進行視圖相似度計算,最終的匹配結果以降序排列選取前15 個視圖相似度所對應的案例作為該用戶知識需求的匹配案例集,計算結果如表4所示。

表2 匹配結果的信息能量

表3 相關指標

表4 視圖相似度

結合以上實證結果分析可知,相較于傳統處理模糊不確定知識的匹配方法,本文所提出的基于PFRS 的知識供需匹配算法具有如下優勢:

(1)模糊不確定性的知識在知識供需匹配過程中大量存在,處理該類知識的匹配問題是以模糊理論為基礎,常用的方法包括經典粗糙集理論、模糊粗糙集理論以及在此基礎上改進的算法。畢達哥拉斯模糊集是一種新興的處理模糊不確定信息的方法,因其既能很好地解釋隸屬度與非隸屬度平方和小于等于1,又能描述隸屬度與非隸屬度之和超過1 的現象,所以在表達不確定現象時更具優勢。與直覺模糊集相比,其刻畫模糊現象的能力如圖2 所示。因此,本文將該方法與模糊粗糙集相結合,提出畢達哥拉斯模糊粗糙集模型,并基于該模型實現知識供需匹配的過程,具備一定的理論優勢。

圖2 模糊現象的描述范圍

(2)傳統的知識供需匹配算法是通過相似度的計算確定最終的匹配結果,本文通過引入畢達哥拉斯模糊集的相關測度,并考慮知識屬性權重,用PFS 的加權相關系數對視圖相似度進行表征?;赑FS 相關系數的視圖相似度考慮了模糊知識在知識表達系統中的不確定性,提高了知識供需匹配精度,使計算結果更加客觀準確。本文算法得出的視圖相似度匹配結果與一般算法得出的相似度的結果如圖3 所示。由圖3 可知,由加權PFS相關系數確定的視圖相似度高于一般算法,可見本文算法具有更好的區分能力。

綜上,本文提出的知識供需匹配算法相較于業內既有的方法,其適用范圍更廣,匹配結果更為客觀。

圖3 視圖相似度算法比較

5 結語

隨著信息技術的迅速發展,知識供需匹配的問題日益凸顯。為提高知識資源的利用效益,本文在前人研究的基礎上,提出了基于畢達哥拉斯模糊粗糙集的知識供需匹配算法。首先將PFS 與模糊粗糙集相結合,給出PFRS 的定義;而后,構建畢達哥拉斯模糊決策系統,并給出知識供需匹配的具體步驟,引入PFS 的相關測度,并通過加權PFS的相關系數對視圖相似度進行表征,以提升匹配精度;最后,將用戶需求與已有案例知識進行匹配,得出匹配結果。文末實證分析驗證了本文所提方法的可行性與比較進步性。在該供需匹配過程中,為得到匹配結果,每次匹配需要遍歷案例庫中的所有案例。為提高匹配過程的效率可引入聚類算法對案例庫中的案例進行聚類,以壓縮匹配空間,這是未來需要進一步研究的內容。

猜你喜歡
畢達哥拉斯模糊集粗糙集
基于Pawlak粗糙集模型的集合運算關系
基于四種截集的粗糙模糊集表現定理的新表示
基于上下截集的粗糙模糊集的運算性質
復圖片模糊集及其在信號處理中的應用
基于二進制鏈表的粗糙集屬性約簡
區間直覺模糊集相似度構造
優勢直覺模糊粗糙集決策方法及其應用
多?;植诩再|的幾個充分條件
畢達哥拉斯
天才畢達哥拉斯
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合