?

粒度模糊規則建模方法研究綜述

2024-04-09 01:41胡星辰李妍陳紫健李文濤申映華劉忠
智能系統學報 2024年1期
關鍵詞:化機制?;?/a>模糊集

胡星辰,李妍,陳紫健,李文濤,申映華,劉忠

(1.國防科技大學 系統工程學院, 湖南 長沙 410073; 2.西南大學 人工智能學院,重慶 400715; 3.重慶大學 經濟與工商管理學院,重慶 400030)

人類處理問題的一個顯著優勢是根據問題的特性在不同抽象程度中進行分析思考[1-3]。隨著人工智能技術的不斷發展,當前智能系統的研究重點關注認知機理的理解、分析和模擬[4],著重分析人類的認知和信息處理方法,包括人類的學習、分析、推理和決策能力等。粒計算(granular computing, GrC)能夠模擬人類思考過程,從抽象角度對問題進行分析推理,并反映人類思考和處理信息的過程。作為計算智能中一種新型信息處理范式,粒計算的研究涵蓋了基于不同粒度解決復雜問題的理論、方法、技術和工具,屬于人工智能認知機理研究的領域。1996年,文獻[5]首次提出粒計算這一概念,一直沿用至今。1997年,Zadeh[5]在模糊集和模糊系統的基礎上,首次創新性地提出了信息粒度化(information granulation)的概念[6]。文章中討論了不同領域中信息粒的不同表現形式,并將模糊邏輯與其他處理不精確性和不確定性的方法區分開來。1985年,Hobbs[7]發表名為“粒度(granularity)”的論文,圍繞信息粒的分解與合并方法進行討論。自此,一些研究人員[8-10]先后圍繞信息粒的結構分析、信息表征以及模型框架等問題進行探索,國內外圍繞粒計算的研究迅速發展。粗糙集理論的引入[11]為不精確、不完備的問題提供了理論方法。1988年,Lin[8]構建了基于鄰域系統的粒度模型。1996年,“詞計算”理論[12]的提出,為基于模糊理論的推理模型奠定基礎。Yao[13]圍繞信息粒的構造和計算等基本問題進行分析討論。王國胤等[14-15]針對不完備信息系統,對于信息粒的規則表示和分解算法進行應用研究?;谏炭臻g理論的模型[16-17]的提出,從多粒度的角度為數據挖掘提供了新的計算方法和工具。隨著粒計算理論[18-20]的不斷發展,與其他機器學習方法相結合的研究不斷涌現。

在粒度神經網絡的概念[21]提出之前,模糊集與神經網絡的協同研究已經不斷發展。Song等[22]圍繞粒度神經網絡的架構、類別和應用進行系統地總結。同時,一些學者開展了粒度神經網絡在分類問題[23]和推薦系統[24]等領域中的應用研究。粒度認知圖[25]是基于圖學習的粒度模型的代表。其目標是利用概念集和彼此之間的因果關系表示問題,已經被廣泛應用于時間序列分析[26]、自然語言處理[27]等領域中。在決策問題研究中,粒計算也受到了學界的廣泛關注,Qin等[28]對粒計算在決策中的應用進行了系統概述。一些學者利用云模型[29-30]、三支決策模型[31]、數據驅動的粒度神經網絡模型[32],以及新型的粒度模型[33]在基于信息粒度優化分配的覆蓋特異性度量、多粒度語言決策等領域開展了相關研究。Pedrycz[34]全面總結信息粒的構建和計算方法,詳細歸納粒計算思想下的數據分析方法。在2022年中國人工智能系列白皮書《粒計算與知識發現》中,將粒計算研究分為基于粒的表征[35-36]、度量[37]、計算[38]和決策[28]4個方面,全面介紹了粒計算框架下理論方法的發展現狀,同時歸納了粒計算在生物醫療、智能控制等領域的應用,討論分析粒計算的后續研究方向。

粒度模型主要圍繞模糊集[38-39]、粗糙集[40-41]、商空間[16-17]和云模型[42-43]等理論分析問題。這些粒度模型都在抽象層次以信息粒作為最小單位構建一個通用框架,根據它們對應研究目標的不同,可以將其分為兩大類[18,24]:將不確定性計算作為研究目標的模糊集理論模型[18]和以多粒度計算為目標的粗糙集理論模型[40]、商空間理論模型[19]和與模型理論模型[20]等3種模型。Zadeh[5,12]在模糊集理論的基礎上定義信息粒的概念,并基于模糊集合論構造以詞為定義域的推理及計算方法,該方法與人類思維方式更為接近。在此基礎上,Pedrycz等[26,44]設計模糊信息粒構建理論框架,進一步發展基于模糊集的粒計算模型。模糊集理論模型通過隸屬度值描述不確定問題,后續研究不斷擴展基于隸屬度函數計算的理論方法,如區間模糊集[27,45]和二型模糊集[46]等。粗糙集理論是由Pawlak[11]提出用于解決集合邊界不確定問題的方法,該理論通過近似空間刻畫了目標概念的不確定性,并探究知識空間中粒的表示、轉換和相互依存等主要問題。大量研究[20,47]對基于粗糙集的粒計算模型進行了優化,并結合實際問題構建了模糊粗糙集[47]、多粒度粗糙集[45,48]等模型。結合人類從不同粒度空間分析問題這一現象,張鈸等[49]結合商級理論,構建了商空間理論模型。商空間理論模型可以由包括問題論域、論域屬性和拓撲結構的三元組表示,并利用“保真原理”和“保假原理”進行模型推理。商空間理論模型通過對商空間之間的關系、綜合、分析和推理進行研究,從而求解復雜問題。張玲等[50]進一步將模糊集思想引入了商空間理論,為商空間理論后續發展提供了有力理論支撐。在概率論的基礎上,李德毅[51]提出云模型理論,該理論模型面向語言值中的隨機性、模糊性、關聯性等問題進行探究,從而能夠實現定性定量轉換的認知模型。相關學者圍繞云模型[43]進行擴展,王國胤等[52]對云模型與粒計算的交叉研究進行分析,并進行了系統的總結。

不同理論體系所構建的粒度模型存在區別,但之間也相互關聯[16,48]。同時,盡管粒度模型構建的方法不同,粒計算的本質都是數據信息的?;?、計算和推理。在模糊集理論模型中,基于模糊方法的粒度規則模型在數據挖掘的基礎上,增強了模型的魯棒性和可解釋性[53]。由于其高效且實用性強的特點和優勢,近年來吸引了越來越多的關注和研究。在圍繞信息粒構建和以此為基礎的粒度模糊規則模型構建的研究中,以加拿大的Witold[34,46,54]、Oscar等[55-56]為代表的研究團隊開展了大量研究。相關論文相繼在IEEE Transactions on Cybernetics、IEEE Transactions on Fuzzy Systems、IEEE Transactions on Systems, Man, and Cybernetics: Systems、Pattern Recognition、Information Sciences、Knowledge-Based Systems和Applied Soft Computing等高水平期刊上發表。然而,在國內從事該方向的研究人員相對較少,在中文文獻中,也缺乏系統地總結粒度模糊規則模型構建方法的研究成果。因此,本文聚焦近年來粒度模糊規則模型的構建方法,歸納總結了當前領域中關鍵問題和重要成果,為相關研究人員在該領域的進一步研究提供參考。

1 粒度模糊規則模型預備知識

在粒度模糊規則模型中,聚類方法和模糊規則模型分別是信息?;徒仆评淼幕A,因此本節圍繞這兩部分進行簡要介紹。

1.1 模糊聚類

聚類方法[57]是近年機器學習與數據挖掘的研究熱點之一。它通過某種相似性度量劃分數據,使得簇內樣本差異盡可能小同時簇間樣本差異盡可能大,從而挖掘數據隱藏的結構信息。聚類的實現依賴數據本身屬性信息,無需標簽信息,是一種有效的無監督數據分析方法。模糊聚類算法[57-58]可以構造能夠描述模糊邊界的隸屬度函數,是一種軟聚類方法,能夠以模糊相似度描述數據的結構和關系方面發揮重要作用。其中,模糊C均值(fuzzy Cmeans, FCM)算法[59-60]是一種常用的數據挖掘方法。

具體而言,FCM通過最小化目標函數J,不斷迭代優化[60]產生聚類中心集合v=[v1,v2,···,vc]和對應的隸屬度矩陣Uki。目標函數表示為

式中:m(m>1)為模糊化系數;c為聚類中簇的個數;uki為隸屬度矩陣中的元素,表示數據xk對第i個聚類中心的隸屬度值;‖xk-vi‖2為數據xk和聚類中心vi之間的歐氏距離。隸屬度函數和聚類中心表示為

一旦滿足終止條件(如設置最大迭代次數)便停止迭代。由于聚類過程中的參數(聚類中心的個數c和模糊系數m)對于聚類的性能具有很大影響,相關的優化算法[61-62]不斷提出以應對不同問題的需求。

FCM的本質特征是將相似的對象組合,整個過程以數據為驅動而無需先驗知識,最終聚合的簇能夠實現對數據的抽象表示。因此FCM是一種形成粒結構的有效工具。在一些研究中,將FCM產生的聚類中心稱作原型。

1.2 模糊規則模型

規則模型能夠捕獲輸入和輸出空間之間的關聯關系,將復雜問題合理劃分為一系列子問題,實現對復雜信息的局部處理?;凇癐F-THEN”(如果…,則…)規則的模型由于其魯棒性和可解釋性,能夠實現復雜非線性系統的建模[37,63]。通過不同的算法和優化方法,基于規則的模型可以多種形式構建。由于模糊建模能夠發現和挖掘隱藏的數據信息,實現以人為中心的知識表征,因此模糊規則系統已成為模糊規則生成的常用框架。在眾多模糊規則模型的擴展方法中,高木關野(takagi-sugeno, TS)模糊規則模型[64]將復雜非線性系統分解為多個局部模型,建模過程簡潔且具有可解釋性,是一種經典的模糊規則模型架構。

給定一組輸入-輸出空間的數據樣本[x,y],其中x=[x1x2···xn],TS模糊模型的規則描述為

式中:i=1,2,···;c為規則的總數;a=[ai0ai1···ain]T為輸入變量的參數向量;Ui(x)為在n維輸入空間Rn中的隸屬度函數,常被看作一種信息粒。在當前的許多研究中采用FCM構建信息粒,并基于該信息粒建立模糊規則模型。規則中結論部分fi(x)的形式多樣,一般采用線性函數表征。一些研究[65]在線性函數fi(x)中引入信息粒,可以表示為

式中:wi和vi分別對應于輸出空間和輸入空間的原型,參數向量a通過最小二乘法實現。

在數值TS模糊模型的設計中,引入了模糊集的思想,通過構建信息粒從原始數據空間中挖掘有效信息,進而實現可解釋的規則推理。值得注意的是,從大量數據中選擇合理的有效信息這一思想,與近些年來發展的原型學習(prototype learning)十分相近。原型學習[65-67]旨在從樣本空間中尋求包含數據信息的原型,有利于減少冗余信息、發掘數據結構,是當前機器學習的研究重點之一。

2 信息粒的構建方法

信息粒是知識表示和學習的關鍵組件。同時,根據問題復雜性的不同,信息粒的大?。ò畔⒘康木唧w程度)也會不同。過細的信息粒(單個元素)無法從抽象層次上表述問題,過粗的信息粒中信息量過于寬泛,無法學習有效信息。因此,信息粒度決定了問題的抽象程度,對于問題的描述和解決至關重要[35,37]。顯然,信息粒的學習和表征由問題驅動,不存在通用的信息粒度滿足所有問題。在這一部分圍繞信息粒的主要形式和?;c解?;瘷C制兩部分分析信息粒的構建。

2.1 信息粒的主要形式

在粒計算中,信息粒有多種形式,其中包括:

1)集合(區間)[68-71]:集合并非通過枚舉法選擇其中的元素,而是通過二分法在區間[0,1]中的特征函數描述抽象概念。簡單來說,信息粒中存在的元素必須是唯一確定的,即元素可以在區間信息粒中或元素不在區間信息粒中,但不允許兩種情況同時發生。則在論域X中,映射函數Φ表示為

2)模糊集[47,54]:由數據空間中的元素映射到區間[0,1]的隸屬度函數實現抽象程度的描述,避免二分法嚴格劃分的要求。隸屬度函數ΦA表示元素x對于模糊集A的隸屬程度:ΦA:x→[0,1],x→ΦA(x),ΦA越大,說明元素屬于集合的程度越高。顯然,區間集合是模糊集的一種特殊情況。

3)粗糙集[47,72-73]:在難以區分的元素關系中,利用近似空間中的近似算子(上近似集和下近似集)描述抽象程度。粗糙集基于分類的思想,根據現有知識將數據劃分。上近似集包括明確可分的元素,下近似包括存在不確定性的元素的最小集合,實現不確定性的數據表征。

4)陰影集[74-76]:根據某些閾值將元素分為完全屬于某一類,完全不屬于某一類和無法確定。與模糊集有些相似,由于不確定性,無法為陰影元素分配明確的隸屬關系,因此使用[0,1]區間中的值進行表征。陰影集的構建是通過原始空間x到空間{0,[0,1],1}的映射實現的。

除上述的幾種理論外,還有公理模糊集[77]、概率集[78-79]等。

2.2 ?;c解?;?/h3>

信號處理問題中存在編碼與解碼過程[80-81],深度學習方法存在編碼解碼機制,這都是信息提取和重建的過程。?;c解?;?granulation and degranulation)的過程類似,目的都是提取信息中的關鍵特征[35]。人類憑借經驗知識將某些接近或相似的元素聚合為實體集合,并以一種合理的抽象層次進行感知、分析和推理,推理的結果用以分析每個具體實體。該過程中的集合便是信息粒,將相似特征的實體聚合的過程為?;瘷C制,解?;窃谝褬嫿ㄐ畔⒘5幕A上,實現原始數據的重建。理想情況下,信息??梢杂成涞皆紨祿臻g[82]。在這一部分,本文主要圍繞基于模糊集的?;c解?;瘷C制進行分析。

假設有一個數據集合x={x1,x2,···,xN},其中,xi位于n維度輸入空間Rn。?;ň幋a)是指信息粒集合Ai表征原始數據集合x的過程,其中i=1,2,···,c??梢詫⑵湟暈閺脑紨祿臻g到定義在[0,1]區間的模糊集空間的映射:G:x→[0,1]c。而解?;ń獯a)在?;:┑幕A上,通過某些評價指標實現原始數據的重建。解?;哪繕丝梢员硎緸镚-1(G(x))=x,但在實際情況中,重建數據集≈x,其中=G-1(G(x))。映射G-1實現抽象程度高的空間到抽象程度低的空間的詳細表征,因此這個過程并不是唯一的。

對于簡單的一維輸入空間,三角模糊函數能夠實現重構誤差為零的?;?解?;瘷C制[82]。但對于多變量數據而言,其他構建函數的方法更為有效。由于實用性和高效的優勢,FCM成為構建模糊函數的一種常用方法。在?;^程中,基于FCM構造的原型和隸屬度矩陣描述原始數據結構,解?;倪^程與聚類的逆問題類似,在已知的原型和隸屬度矩陣的基礎上,重建原始數據。一般而言,解?;ㄟ^重建性能指標(重建數據和原始數據之間的重建誤差)指導該過程,重建誤差越小,表明?;瘷C制越好。此外,一些研究也將聚類性能(如分類精度)指標作為重建誤差衡量?;男阅?。

Pedrycz在文獻[35]中首次基于FCM討論與分析?;?解?;瘷C制的原理,提出重建誤差:并分析模糊系數對于重建機制的影響。為了提高重建的質量,Hu等[83]引入原型增強機制,基于多種群體優化算法實現分區矩陣的優化。Zhang等[36]關注重構誤差的監督機制對于聚類性能的影響,將聚類原型和重構數據的對偶表達式引入FCM從而實現算法增強。Graves等[84]引入核函數思想,比較原型位于不同特征空間的情況,對數據的分類精度和重建誤差進行了綜合研究。針對原型優化的監督機制的研究[37,85-86]不斷發展,有助于增強算法的實用性。Izakian等[87]考慮到時空數據的特殊性,通過增廣距離函數賦予聚類算法更大的靈活性。同時分析重建誤差和預測誤差評價指標指導數據重建的過程,成功將模型應用于時序數據分析。進一步,Izakian等[88]將?;?解?;乃枷胍霑r序數據異常檢測問題的研究,在設計框架中,采用?;瘷C制揭示時序數據的潛在結構信息,并將重建誤差作為異常檢測的評價指標,指導和學習異常數據的形狀信息。

模糊聚類產生的數值型表示方法不能完全表征數據本質,超立方體的信息粒結構作為一種替代的增強方案,可以應對更高層次的數據分析。如Galaviz等[89]以FCM得到的原型為核心,構造一種超矩形信息粒(超盒),并提出2種約束策略避免信息粒的重疊。Zhu等[90]圍繞數值原型進行分配合理的信息粒度,通過參與?;?解?;瘷C制實現信息粒的增強。在合理粒度準則的基礎上,Zhang[91]在?;^程中產生信息粒并利用解?;瘷C制指導信息粒的優化,從而應對非理想條件下的源檢測問題。

除此之外,基于矢量量化概念的數據重建[92],圍繞不確定性原則實現的二型模糊集[93-94]等方法的?;?解?;瘷C制都對于信息粒的構建具有重要意義?;贔CM的?;?解?;瘷C制的分類與相關研究如表1所示。

表1 基于FCM的?;饬;瘷C制的分類與相關研究Table 1 Classification and studies of granulation-degranulation Mechanism based on FCM

3 粒度模糊規則模型的構建

本節通過不同的?;呗詫α6饶:巹t模型的構建進行系統地分析,首先闡述模糊規則模型的整體框架,其次結合現有的理論方法分析不同策略的粒度模型。

3.1 粒度模糊規則模型的基本框架

現有研究已經圍繞模糊規則模型的設計和分析進行了大量的探索與實踐,但數值結構的模型很難與目標輸出的模型完全一致。為了應對這一問題,引入粒計算的思想,構建抽象程度的粒度模型,以彌補模型與目標模型之間的差異。模型的框架設計如圖1所示。

圖1 粒度模糊規則模型的基本框架Fig.1 Basic framework of granular fuzzy rule-based model

在粒度模糊規則模型框架中,對于輸入空間x,通過對c個模糊規則進行聚合實現粒度輸出?;赥S模糊規則,其粒度模型結構設計為

規則可以表現出不同的語義。為了說明基于規則的建模的本質,采用基于聚類的?;瘷C制。利用聚類算法構建信息粒,實現輸入空間數據與區間信息粒的映射G(Ai(x))的關聯,從而通過規則聚合的方式實現粒度輸出:

3.2 ?;呗栽O計方法

本節分析了2類?;呗栽O計方法,并對當前相關的研究進行討論,如表2所示。

表2 不同?;呗韵碌牧6饶:巹t模型Table 2 granular fuzzy rule-based model with different granulation mechanisms

3.2.1 數值型模糊規則模型的?;呗?/p>

在合理的粒度分配策略指導下,數值模型擴展為粒度模糊規則模型。數值型模糊規則模型的?;呗钥梢苑譃榛趨档牧;瘷C制、基于輸入空間的?;瘷C制和基于輸入輸出空間的協同?;瘷C制3種。

1)基于參數的?;瘷C制。

Pedrycz[54]從模糊規則模型出發,討論粒度模型隱含的基本原理和關鍵結構,并從粒度參數空間分析粒度模型的基礎設計過程。圍繞規則參數構建粒度擴展范式,并用符號G(·)描述。隨后,Pedrycz[34]在數值原型的基礎上,引入抽象程度(信息粒度)增強數據關系的描述,利用合理的粒度原則量化信息粒的質量,構建由數據到數值原型到粒度原型的范式。Hu[95]借助數值模糊模型的設計,將粒度概念引入規則中的參數,創新性地提出3種參數空間的?;呗裕壕植烤€性函數的參數(a);規則中的原型(V);將參數(a)和原型(V)結合,通過合理的粒度分配策略,將3種參數空間擴展為粒度形式,實現由數值空間到粒度空間的轉化。值得一提的是,基于FCM算法構建的模糊集通常定義于n維空間中,在?;^程中,將原型視為空間Rn中的元素并將其投影到各個維度的坐標上以便計算。通過對原型分配不同程度的信息粒度,將其構造為一個超矩形,從而模糊集以更為抽象的方式(區間)揭示輸入數據空間中的結構。盡管FCM是描述模糊集的有效工具,但由于其算法本身的限制影響聚類的有效性。從這個角度出發,Zhu[96]利用特征加權的聚類算法構造用于條件部分的模糊集,以降低重構誤差。通過對原型的粒度分配,構建更為有效的粒度模糊模型。同樣,Hanyu[62]從聚類算法的改進入手,使其與規則結論部分中非線性映射的方向性保持一致,通過引入閾值區分規則,從而構建基于區間信息粒的粒度模型。圍繞參數空間的3種?;呗灾?,基于原型的策略使用最為廣泛。在當前研究不斷改進的基礎上,所構建的粒度模糊模型也被用來解決不同復雜環境下的問題。Pedrycz[97]介紹了一種分布式模糊建模方法。在建模過程中采用增廣FCM算法確定粒度參數,引入合理粒度原則指導粒度模糊模型的形成。Li[98]針對大規模多變量數據,將模糊規則與數據縮減和降維方法相結合,通過將原型擴展為區間信息粒形式,構建可解釋的粒度模糊規則框架。

該機制以數值向量的參數為中心,設計結構可以表示為

式中:G(·)為對數值參數向量應用某種粒度分配策略,從而生成相對應的粒度表征(如A是參數a的區間粒度表示)。

2)基于輸入空間的?;瘷C制。

粒度輸入空間往往是圍繞輸入數據構建的。一般而言,建模的過程是尋找輸入屬性到輸出空間的映射關系,粒度輸入空間對于模型起著至關重要的作用。不同的輸入變量對模型的輸出表現出不同的敏感性,基于輸入空間的?;瘷C制將這一表現通過信息粒度的設置進行描述。針對這一點,Hu[99]圍繞輸入空間提出了一種合理的粒度分配策略并進行全局敏感度分析。Song[100]提出了一種層次性粒度分配策略以實現輸入空間的粒度構建。在現實環境下數據存在不確定性(如信息缺失、高噪聲等),導致后續的特征學習與規則推理存在誤差。位于輸入空間的信息粒以抽象層次捕獲信息的同時,在一定程度上避免數據不確定性的影響。針對這一問題,一些研究圍繞粒度輸入空間構建模型。Zhong[101]依賴合理的粒度分配策略,構建將估算的缺失屬性表示為信息粒的方法,并提出粒度量化指標指導該過程。針對粒度輸入空間中信息粒中心學習的這一問題,Hu[102]引入基于概率信息粒度策略的FCM算法進行聚類。由于原型是通過聚類和監督學習方法生成和優化,其包含的數據特征和輸出空間信息能夠近似表示缺失屬性?;诖?,通過信息粒度的分配,將輸入空間的估算值擴展為區間信息粒;盡管完整屬性表示為區間形式,但左右邊界相等,易于區分。從而利用模糊規則進一步構建粒度模糊模型。

該機制以數值輸入向量為中心,設計結構可以表示為

式中:G(x)為對數值輸入應用粒度分配策略,生成輸入信息粒X。

3)基于輸入輸出空間的協同?;瘷C制。

上述信息粒構建策略中存在特定模式,即通過粒度參數實現輸入到輸出映射,得到區間形式的粒度輸出。與基于規則參數的粒度分配策略不同,Li[103]從規則聚合的過程入手,考慮到加權數據在一定程度上表示輸出空間的信息,借助合理的粒度分配策略構建區間信息粒,同時利用權重實現信息粒大小的縮放。構建的粒度模型無需提前進行數值計算,簡化了模型構建和推導過程。為了避免基于模糊規則的回歸模型產生的誤差,Zhu[104]構建誤差模型對回歸模型的數值輸出進行指導,兩者聚合實現區間輸出信息粒的構建??紤]到輸入輸出空間相關聯的特性,Shen[105]使用改進FCM算法提升原型表征性能,并從輸出空間出發,引入知識引導機制指導信息輸入空間學習。Zhang[106]針對分布式環境中的數據特點,將數值模型視為分布式框架的局部表征,以數值誤差均方根誤差(root mean square error, RMSE)作為局部權重參數,在聚合過程中引入合理的粒度分配策略實現區間粒度輸出。

基于輸入輸出空間的協同?;瘷C制的設計結構如圖2所示。G(x)和G(y?)分別對應輸入空間和輸出空間的?;呗?。

圖2 基于輸入輸出空間的協同?;瘷C制結構Fig.2 Diagram of collaborative granulation mechanism based on input-output space

3.2.2 粒度模糊規則模型直接構建策略

比起從數值結構擴展到粒度結構的兩階段過程,一個更簡單的設計思想是如何直接構建信息粒反映原始數值數據的主要特征,實現粒度輸入和輸出空間的直接映射。

Lu[107]在研究中探討了超盒的幾何結構,強調了信息粒以超盒(多維區間)的形式出現對于揭示多維變量的本質和內在關系的重要性。并以此為基礎,在輸入輸出空間直接構建信息粒,利用規則實現兩者之間的聯系建立粒度模型。Reyes-Galaviz[89]按照一定原則將輸出數據劃分為區間信息粒,由于輸入數據與每個區間的輸出數據密切相關,基于改進FCM圍繞數據構造超盒粒。同時利用2種約束策略對其進行優化。Lu[108]在文獻[107]的基礎上,通過優化算法實現輸入空間原型的優化,以此增強輸出區間信息粒和原型信息之間的關聯結構,進一步,在文獻[109]中討論3種不同的輸出區間劃分方法,從而指導具有置信度的輸入超盒粒,圍繞超參數實現粒度模糊模型的優化。

4 粒度模糊規則模型的評估

粒度模型的性能依賴于合理的粒度分配策略,因此本節首先討論常用的2種粒度分配策略方法,其次總結常用的性能評估指標。

4.1 粒度分配策略設計方法

在基于數值模型的?;呗灾?,通過合理的粒度分配策略構建粒度結構。當初始化的隨機信息粒度ε分配給某個參數時,每個參數被賦予不同的抽象程度。信息粒度的值越高,信息粒的靈活性就越大,但信息粒度ε受到單位區間的約束。如何給數值參數的每個特征分配合理的信息粒度,使得所構建的粒度模型具有更高的覆蓋率和特異性是一個核心問題。對于給定的信息粒度ε,粒度分配策略一般有2種形式: 1)均勻對稱的粒度分配策略; 2)非均勻非對稱的粒度分配策略[110]。在這一部分,本文以數值原型的粒度擴展為例,對于2種分配策略進行分析。

均勻對稱的粒度分配策略通過對數值原型分配相同的信息粒度構建區間信息粒:

式中Rix=xmax-xmin。

式中ε0=且Ryi=ymax-ymin。

如圖3(a)所示,針對不同的數據特征,均勻對稱分配策略賦予數值原型同樣的抽象程度,計算復雜度相對較低。這一方法雖然簡單但是沒有考慮到不同特征的信息量不同這一問題,限制了信息粒對于數據的表征能力。

圖3 2種不同的粒度分配策略Fig.3 Two different allocation strategies of information granularity

非均勻非對稱的粒度分配策略認為數值原型中不同特征的每個區間長度是不相等的:

如圖3(b)所示,對于二維數值原型,非均勻非對稱的粒度分配策略針對不同特征空間分配了不同程度的信息粒度,構造了矩形的信息粒。當維度逐漸增加時,信息粒會呈現出不規則的超立方體。其他參數的粒度分配策略采用同樣的思想實現信息粒構建。

4.2 粒度模糊規則模型的評估方法

理想的信息粒應該包含盡可能多的數據信息,同時需要信息描述得盡可能具體。針對這2個需求,現有的研究工作[111-112]常用2種評價指標對于信息粒的性能進行評估。以區間信息粒?=[ω1,ω2]為例進行介紹。

覆蓋率(coverage)[82,112]表示了信息粒包含數據的多少,可以表示為

式中:card{.}為區間?包含元素的個數,N為數據樣本數目。

特異性(specificity)[34,54]量化信息粒包含數據信息的具體程度,如圖4所示,即保證區間長度盡可能的小。簡而言之,Qs(?)應該表示為區間長度的單調遞減函數:Qs(?)=g(length(?))。當區間長度為0時,信息粒退化為數值形式,如圖5所示。此時信息粒專注于細節描述而忽略了高層次的信息表征,Qs=1且Qc=0;當區間長度與論域長度相同時(如圖6所示),信息??梢愿采w所有數據,Qc=1,但由于信息粒過于寬泛,Qs=0,對于數據分析沒有很大幫助。很多研究[54,96]中采用了不同的特異性計算公式,常用的形式計算為

圖5 特異性示意圖:區間長度為0的信息粒?Fig.5 Diagram of specificity: information granule ? with interval length of 0

圖6 特異性示意圖:區間長度最大時的信息粒?Fig.6 Diagram of specificity: information granule ? with the largest interval length

式中R為區間所在論域的長度。

結合上述信息粒度分配策略,進一步討論粒度模糊規則模型的性能評估指標。給定粒度模糊規則模型的區間輸出與實際輸出yk,覆蓋性可以表示為

式中incl(yk,Yk)為區間輸出Yk包含數據樣本yk的數目。同樣,考慮利用區間輸出的長度量化特異性:

顯然,覆蓋率和特異性是相互矛盾的,特異性的增加會降低覆蓋率,覆蓋率較高時特異性會降低。為了綜合評估所構建的區間粒度模糊模型,采用2個指標的乘積[69]量化粒度模糊規則模型的整體性能為

式中:參數β∈[0,1]表示特異性指標的重要程度,通過調整β可以實現不同問題對于2個指標的不同要求。

從式(1)可以看出,由性能指標Q表述的區間粒度模糊模型的性能直接取決于信息粒度ε的值。因此,可以使用以信息粒度ε為變量的曲線下面積(area under curve, AUC)衡量粒度模型的性能[82]:

5 粒度模糊規則模型的優化

針對不同的復雜問題,不同抽象程度的信息粒會影響模型的性能,因此大部分研究[109,113]圍繞面向問題和數據的非均勻非對稱策略進行。盡管非均勻非對稱策略能夠差異化表征不同維度信息,但無法直接確定信息粒度ε的取值。如第4節所述,區間輸出可以用性能指標Q來量化。因此,粒度分配問題可以表示目標函數為Q,且存在約束的信息粒度ε的優化。傳統的數學優化方法在求解這一問題時存在困難,因此,現有的研究主要是借助群體智能優化技術實現粒度分配策略的優化。

群體智能優化技術通過模擬動物的群體行為,利用彼此間交互與合作的方式實現全局問題的優化。在群體智能優化算法中,粒子群優化算法(particle swarm optimization, PSO)、遺傳算法(genetic algorithm, GA)和差分進化算法(differential evolution, DE)被廣泛應用于各種復雜問題的求解。PSO的種群大小對求解時間的影響較小,同時搜索空間的連續性較好,在計算過程中無需解的排序,實現較為簡單。因此,大量研究[110,113]考慮利用PSO實現粒度模型的優化?;跀抵的P偷臉嫿ǖ牧6炔呗?,將性能指標Q作為PSO的目標函數[101,103,108,111],實現合理的粒度分配以構建高效的粒度模型。此外,在直接構建的粒度模糊模型中,如超盒信息粒[89,107],盡管粒度分配策略有所不同,同樣借助了PSO來優化模型??紤]到輸出的特異性和覆蓋率對于不同信息粒的復雜依賴性,一些研究[99]提出了改進的粒子群優化算法。GA通過交叉變異等特定方式生成新的種群,計算過程中需要排序,參數設置相對簡單。DE與GA相似,將變異作為搜索機制,算法穩定性優于PSO,因此在粒度模型構建過程中也常常采用GA和DE作為優化手段[96,112,114]。一些研究[110,114]還采用了多種優化方法并對于不同的優化技術下的模型性能進行分析。此外,部分研究從優化的目標函數出發,將優化過程構造為多目標問題[115]進行求解。

6 結束語

粒計算作為認知智能的新型范式,能夠模仿人類利用已有知識進行高層級的邏輯推理,對于人工智能的研究具有重要意義。粒度模糊規則模型由于其簡潔性、魯棒性和可解釋性等特點,成為計算智能研究的一大熱點。本文著眼于粒度模糊規則模型,梳理了不同設計方法的粒度模型,探討了信息粒的構建方法,歸納了粒度模糊規則模型的設計框架和評估優化方法。由于國內對于粒度模糊規則模型的研究缺少系統總結,本文的主要目的是系統歸納粒度模糊模型研究,對于不同粒度構建方法及其代表性研究工作的基本機制、方法和特點進行總結分析,從而促進粒度模糊規則模型的研究,以及粒計算的理論、技術和應用的廣泛發展。

猜你喜歡
化機制?;?/a>模糊集
基于上下截集的粗糙模糊集的運算性質
琯溪蜜柚汁胞?;绊懸蛩丶胺揽丶夹g綜述
芻議高職共青團社會實踐育人長效化機制
針刺蝶腭神經節治療特發性耳鳴的中樞化機制探討
論國有企業如何構建輿情管理常態化機制
中國古代蛇紋石玉的白化機制研究述要
基于粗糙模糊集的輸電桿塔塔材實際強度精確計算
E-廣義凸直覺模糊集①
粗?;疍NA穿孔行為的分子動力學模擬
再 論 粒 化 思 維
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合