?

基于屬性約簡的應用服務器優化算法改進

2017-05-24 14:45李佳澤王長忠
計算機測量與控制 2017年5期
關鍵詞:約簡粗糙集決策

李佳澤, 王長忠

(1.中國核科技信息與經濟研究院, 北京 100048; 2.渤海大學,遼寧 錦州 121000)

基于屬性約簡的應用服務器優化算法改進

李佳澤1, 王長忠2

(1.中國核科技信息與經濟研究院, 北京 100048; 2.渤海大學,遼寧 錦州 121000)

優化參數配置是優化應用服務器性能的重要方面;基于傳統參數調節的優化策略耗時耗力缺乏系統性和規律性;利用模塊化思想針對目標決策函數對應用服務器參數進行分類,可構建條件屬性約簡模型;基于屬性約簡的應用服務器優化算法,可去除對于目標決策函數相對不重要的參數,并獲得相對重要的參數,從而達到鎖定目標重點調節,快速提高系統性能的目的;現有的約簡模型優化算法多基于經典粗糙集理論,在等價關系的基礎上構造分類,容易造成大量的信息破壞和流失;文章通過拓展等價關系到一般二元關系,利用廣義粗糙集理論改良了基于模塊化思想和屬性約簡模型的應用服務器優化算法,通過定義辨識函數對條件屬性進行約簡,再結合依賴度計算,得到最終目標參數。

服務器優化;參數模塊;一般二元關系;屬性約簡

0 引言

信息化背景下,企業應用系統性能的好壞關系著企業信息化水平的高低。性能良好的應用系統,可在服務器高負載的情況下保持較高的吞吐量。而實現此目標,要求應用服務器能保持較高的可用性。但隨著企業應用系統的增加、應用范圍的擴大以及應用數據和服務時間的增長,應用系統性能會有所下降,系統維護人員需要根據具體情況對應用系統進行適當的優化。傳統的優化方法主要分為兩種。一種是通過對應用程序進行分析,根據程序運行結果分析應用系統性能下降的原因,其方法體現為代碼模式的改進[1-2]。此方法要求維護人員必須充分了解代碼。然而企業應用系統的維護通常并非由開發人員負責,維護人員往往是應用部門的普通人員,不具備相應的專業水平。所以,基于應用程序調節的優化方法比較適用于應用系統的部署和測試階段。另一種優化方法是針對系統硬件,即對服務器進行調節,要么基于對服務器的技術文檔分析,從而對服務器和系統應用平臺進行參數調節[3-4],要么利用成熟的優化工具分析系統性能然后調節[5]。這些優化方法成功與否,很大程度上取決于運行維護人員的經驗,缺乏系統性和規律性。劉巖、王正方等人根據經典的J2EE模型架構分析,利用參數模塊化思想,針對應用服務器的相關參數,提出了一種ARBPMTAS(attributes reduction basingon parameters modulein tuning application server)優化算法[6],但此算法的約簡模型是建立在等價關系的基礎上,在實際計算會帶來一定的信息破壞和流失。

本文通過將等價關系計算拓展到一般二元關系計算,構造廣義粗糙集理論下的決策系統和條件屬性約簡模型,通過定義可辨識域、辨識矩陣和辨識函數對條件屬性集進行約簡,再結合決策屬性對條件屬性的依賴度計算,提出了一種改良的基于模塊化思想和屬性約簡模型的應用服務器優化算法,即基于一般二元關系決策系統屬性約簡模型的應用服務器優化算法。文章最后,用改良后的算法對文獻[6]的實例進行了重新計算,得到了更為精確的計算結果。

1 相關知識

1.1 一般二元關系

二元關系(binary relation)用于討論兩個數學對象的聯系。設R是集合A上的一個二元關系,若R滿足以下特殊性質,

自反性:?a∈A,=>(a,a)∈R

對稱性:(a,b)∈R∧a≠b=>(b,a)∈R

傳遞性:(a,b)∈R,(b,c)∈R=>(a,c)∈R

則稱R是定義在A上的一個等價關系;若R只滿足只自反性和傳遞性,則等價關系拓展為優勢關系。此外,還有偏序關系、相融關系等,這些都是具有一定數學特性的特殊二元關系。如果R沒有任何數學特性的約束,此時的R被稱為一般二元關系。一般二元關系是所有特殊二元關系的拓展。

1.2 一般二元關系下的屬性約簡模型[7]

設U為參數域,R?U×U是U上的二元關系,這時,序對(U,R)稱為廣義近似空間;Rs:U→2U為集值函數。對于參數x∈U,稱集Rs(x)={y∈U:(x,y)∈R}為參數x關于關系R的后繼鄰域。對于U上的一簇二元關系R={R1,R2,...,Rn},引入決策等價關系D,稱U/D={[x]D:x∈U}是參數域U上相對于關系R的決策劃分,這時,我們就構造了一種決策系統,記為(U,R,D)。

對于任意的參數集X?U,P?R,X關于R的下近似可定義為:

?X

且(IntR)s(x)≠φ}

在決策系統(U,R,D)中,對于Ri∈R,當且僅當PosR(D)=Pos{R-{Ri}}(D)且NulR(D)=Nul{R-{Ri}}(D)時,Ri相對于D是R中不必要的。對于設P?R,如果P中每一個元素相對于D都是P中必要的。

稱P相對于D是R的一個約簡。當:

Α={(x,y)|x∈NulR(D),y∈U}∪

{(x,y)|x∈PosR(D),y∈U且d((IntR)s(x))≠d(y)}

稱Α為D關于R的可辨識域。(U,R,D)的辨識矩陣記為(cij),對?xi,xj∈U

對于P?R,如果P是滿足P∩cij≠φ(cij≠φ;i,j≤n)的最小子集,則認為P相對于D是R的一個約簡。

以上描述的屬性約簡模型用于機器故障分析效果良好,通過計算可以約簡掉相對于決策屬性不必要的條件屬性,達到故障排除的目的,也可以通過得到必要屬性,達到鎖定重點目標的目的。下面我們再引入屬性間依賴程度的概念,進一步描述屬性間的關系。

對于屬性集R?CP?D,稱:

為P對R的依賴程度[8]。

2 基于屬性約簡的應用服務器優化改進算法的設計

ARBPMTAS算法選用WebLogic作為WEB容器,結合參數模塊化思想,將每個參數模塊看作條件屬性集R,用戶并發訪問系統時系統的相應時間作為決策系統D,針對目標決策函數對應用服務器的參數進行等價分類,構建了條件屬性集的約簡模型,通過計算決策屬性對每個條件屬性的依賴性,直到正域相等結束計算,得到了屬性約簡集。這種基于屬性約簡的計算方法有效去除了對于目標決策函數相對不重要的參數,并獲得了相對重要的參數,然后鎖定目標參數重點調節,在快速提高系統性能方面得到了良好的實踐效果。但是,由于這種約簡模型建立在等價關系的基礎上,在現實中獲取到的實值連續型數據樣本中,關系的計算只能被離散化描述,會帶來信息破壞和流失,影響計算效果。

把建立在等價關系這種特殊二元關系的計算拓展到一般二元關系定義相應的計算,使計算過程得到了更貼近實際的描述,可以有效減少計算過程中的信息流失。屬性約簡主要通過研究條件屬性與決策屬性的關系,按照一定規則約簡掉相對決策屬性不必要的條件屬性。如1.2介紹的屬性約簡模型是基于一般二元關系的粗糙集理論(也稱廣義粗糙集理論)構建的,首先在傳統粗糙集理論上下近似的概念基礎上引入正域、后繼鄰域等概念,進而描述出什么樣的條件屬性相對于決策屬性是可辨識的,根據辨識性規則實現屬性約簡,杜曉昕、徐慧等人通過定義決策屬性對條件屬性的依賴度,根據依賴度大小來判斷屬性的必要性[8]。

本文以定義的廣義粗糙集理論下的屬性約簡模型[7]作為計算基礎,結合文獻[6]的計算思路,提出改進的基于模塊化思想和屬性約簡模型的應用服務器優化算法如下:

(1)描述樣本數據在條件屬性下的關系,對?xi,xj∈U,xj與xi有關系,記為(xi,xj);

(3)對于可辨識域A,若(xi,xj)?A,結束計算,重復第2步;若(xi,xj)∈A,則記Rs為辨識矩陣cij的第(i,j)元;

(4)若cij=φ;i,j≤n結束計算,重復第3步;若cij≠φ;i,j≤n計算P∩cij≠φ的最小子集P即是R的一個約簡;

(5)計算P對R的依賴度γR(P)取最大值,此時的P為目標參數。

3 實例分析

選取文獻[6]的樣本數據(見表1),用第2節的優化算法重新計算。

表1 自運行端參數決策系統[6]

注:系統狀態表示據系統響應時間判斷是否滿足要求,是Y否N

可見,該數據樣本除了存在等價關系,還存在優勢關系、偏序關系等二元關系,用以一般二元關系為基礎的計算方法能更好的挖掘數據信息。下面我們用本文提出的基于模塊化思想和屬性約簡模型的應用服務器優化改進算法進行計算:

記U={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10},D={Y,N}系統狀態可描述為:

U/D={X1={x1,x4,x5,x8,x10}(滿足要求)

X2={x2,x3,x6,x7,x9}(不滿足要求)}

記關系屬性集R={R1,R2,R3,R4,R5},對?xi,xj∈U,當xi≠xj記作(xi,xj)

可整理二元關系屬性集如下:

R1={(x1,x2),(x1,x3),(x1,x4),(x1,x6),(x1,x7),

(x1,x8),(x1,x9),(x2,x1),(x2,x3),(x2,x5),(x2,x7),

(x2,x10),(x3,x1),(x3,x2),(x3,x4),(x3,x5),(x3,x6),

(x3,x8),(x3,x9),(x3,x10),(x4,x1),(x4,x3),(x4,x5),

(x4,x7),(x4,x10),(x5,x2),(x5,x3),(x5,x4),(x5,x6),

(x5,x7),(x5,x8),(x5,x9),(x6,x1),(x6,x3),(x6,x5),

(x6,x7),(x6,x10),(x7,x1),(x7,x2),(x7,x4),(x7,x5),

(x7,x6),(x7,x8),(x7,x9),(x7,x10),(x8,x1),(x8,x3),

(x8,x5),(x8,x7),(x8,x10),(x9,x1),(x9,x3),(x9,x5),

(x9,x7),(x9,x10),(x10,x2),(x10,x3),(x10,x4),

(x10,x6),(x10,x7),(x10,x8),(x10,x9)}R2={(x1,x4),(x1,x5),(x1,x8),(x2,x4),(x2,x5),

(x2,x8),(x3,x4),(x3,x5),(x3,x8),(x4,x1),(x4,x2),

(x4,x3),(x4,x5),(x4,x6),(x4,x7),(x4,x9),(x4,x10),

(x5,x1),(x5,x2),(x5,x3),(x5,x4),(x5,x6),(x5,x7),

(x5,x8),(x5,x9),(x5,x10),(x6,x4),(x6,x5),(x6,x8),

(x7,x4),(x7,x5),(x7,x8),(x8,x1),(x8,x2),(x8,x3),

(x8,x5),(x8,x6),(x8,x7),(x8,x9),(x8,x10),(x9,x4),

(x9,x5),(x9,x8),(x10,x4),(x10,x5),(x10,x8)}R3={(x1,x2),(x1,x4),(x1,x6),(x1,x7),(x2,x1),

(x2,x3),(x2,x4),(x2,x5),(x2,x6),(x2,x7),(x2,x9),

(x2,x10),(x3,x2),(x3,x4),(x3,x6),(x3,x7),(x4,x1),

(x4,x2),(x4,x3),(x4,x5),(x4,x6),(x4,x8),(x4,x9),

(x4,x10),(x5,x2),(x5,x4),(x5,x6),(x5,x7),(x6,x1),

(x6,x3),(x6,x4),(x6,x5),(x6,x7),(x6,x8),(x6,x9),

(x6,x10),(x7,x1),(x7,x2)(x7,x3),(x7,x5),(x7,x6),

(x7,x8),(x7,x9),(x7,x10),(x8,x2),(x8,x4),(x8,x6),

(x8,x7),(x9,x2),(x9,x4),(x9,x6),(x9,x7),(x10,x2),

(x10,x4),(x10,x6),(x10,x7)}R4={(x1,x2),(x1,x4),(x1,x6),(x1,x8),(x1,x9),

(x2,x1),(x2,x3),(x2,x4),(x2,x5),(x2,x7),(x2,x8),

(x2,x10),(x3,x2),(x3,x4),(x3,x6),(x3,x8),(x3,x9),

(x4,x1),(x4,x2),(x4,x3),(x4,x5),(x4,x6),(x4,x7),

(x4,x9),(x4,x10),(x5,x2),(x5,x4),(x5,x6),(x5,x8),

(x5,x9),(x6,x1),(x6,x3),(x6,x4),(x6,x5),(x6,x7),

(x6,x8),(x6,x10),(x7,x2)(x7,x4),(x7,x6),(x7,x8),

(x7,x9),(x8,x1),(x8,x2),(x8,x3),(x8,x5),(x8,x6),

(x8,x7),(x8,x9),(x8,x10),(x9,x1),(x9,x3),(x9,x4),

(x9,x5),(x9,x7),(x9,x8),(x9,x10),(x10,x2),(x10,x4),

(x10,x6),(x10,x8),(x10,x9)}R5={(x1,x2),(x1,x6),(x1,x9),(x1,x10),(x2,x1),

(x2,x3),(x2,x4),(x2,x5),(x2,x7),(x2,x8),(x2,x9),

(x3,x2),(x3,x6),(x3,x9),(x3,x10),(x4,x2),(x4,x6),

(x4,x9),(x4,x10),(x5,x2),(x5,x6),(x5,x9),(x5,x10),

(x6,x1),(x6,x3),(x6,x4),(x6,x5),(x6,x7),(x6,x8),

(x6,x9),(x7,x2),(x7,x6),(x7,x9),(x7,x10),(x8,x2),

(x8,x6),(x8,x9),(x8,x10),(x9,x1),(x9,x2),(x9,x3),

(x9,x4),(x9,x5),(x9,x6),(x9,x7),(x9,x8),(x9,x10),

(x10,x1),(x10,x3),(x10,x4),(x10,x5),(x10,x7),

(x10,x8)(x10,x9)}得IntR={(x2,x5),(x4,x10),(x5,x2),

(x5,x6),(x6,x5),(x10,x4)}

其中: (IntR)s(x1)=(IntR)s(x3)=(IntR)s(x7)=

(IntR)s(x8)=(IntR)s(x9)=φ

(IntR)s(x2)={x5},(IntR)s(x4)={x10},(IntR)s(x5)={x2,x6},(IntR)s(x6)={x5},

(IntR)s(x10)={x4},則:

PosR(D)={x2,x4,x5,x6,x10}

NulR(D)={x1,x3,x7,x8,x9}

故(U,R,D)的辨識矩陣為:

辨識函數為:

f(U,R,D)=R2∧(R2∨R3∨R4∨R5)∧(R2∨R5)

∧(R1∨R3∨R4∨R5)∧(R2∨R4∨R5)∧(R3∨R5)

∧(R2∨R3)∧(R1∨R2∨R4)∧R5∧(R3∨R4∨R5)

∧(R1∨R2∨R4∨R5)∧(R2∨R3∨R4)∧R1

∧(R1∨R3∨R4)∧(R4∨R5)∧(R4∨R5)∧(R2∨R4)

∧(R1∨R4∨R5)∧(R1∨R3)∧R3∧R

=R1∨R2∨R3∨R5

可見R1R2R3R5分別是R的一個約簡,R4是不必要屬性在參數調節中可忽略。再計算依賴度如下:

可見,該應用系統當前狀態下,決策屬性D(系統響應時間)對R1(套接口讀取器)的依賴程度最大,R1為重要參數,在應用服務器優化時可著重調節。此計算結果較比文獻[6]更加精準的鎖定了影響應用系統響應時間的服務器參數,在應用服務器優化調節中增提高了工作效率。

4 結束語

基于一般二元關系決策系統屬性約簡模型的應用服務器優化算法改進了已有優化方法缺乏系統性、規律性和易信息流失等弊端,通過屬性約簡挖掘出重點參數,達到有效優化應用服務器的目的。然而在本算法中,決策關系依然是等價關系,且屬性集與決策集的從屬關系也都是分明的,對于實際系統架構各模塊間的參數,還存在更為復雜的關聯,需要通過進一步在拓展特殊關系為一般關系、分明關系為模糊關系的基礎上挖掘數據信息。

[1]VictorSafronov,ManishParashar.OptimizingWebServersUsingPageRankPrefetchingforClusteredAccesses[J].WorldWideWeb, 2002, 5(1), 25-40.

[2]ArtigesM.BEAweblogicserver8.1unleashed[M].Beijing:ChinaMachinePress, 2005.

[3]NybergG,PatrickR.MasteringBEAwebLogicserver[M].Beijing:PublishingHouseofElectronicsIndustry, 2004.

[4]OkkyungChoi,SangYongHan.PersonalizationofRule-basedWebServices[J].Sensors, 2008, 8(4).

[5]JiangGuo,LiaoYuehong,BehzadP.AsurveyofJ2EEapplicationperformancemanagementsystems[A].IEEEComputerSocietyProceedingsoftheIEEEInternationalConferenceonUniversity[C].2005, 30(3): 2-54.

[6] 劉 巖,王正方,朱云龍.參數模塊和屬性約簡的應用服務器優化方法[J].小型微型計算機系統,2010(3):441-445.

[7] 李佳澤,包文穎,王長忠.一般二元關系下的關系決策系統屬性約簡[J].模糊系統與數學,2012,26(6):153-158.

[8] 杜曉昕, 徐 慧, 任長偉.基于粗糙集的屬性約簡在數據挖掘中的作用[DB/OL].中國科技論文在線, 2006.

Improved Algorithm in Tuning Application Server Based on Attribute Reduction

Li Jiaze1, Wang Changzhong2

(1.China Institute of Nuclear Information and Economy, Beijing 100048,China; 2.Bohai University, Jinzhou 121000,China)

Optimizing parameter configuration is an important way to optimize the performance of application server. The optimization strategy based on the traditional parameter adjustment is time-consuming and lacks of systematic and regularity. Based on the modular idea, the model of conditional attribute reduction can be constructed by using the target decision function to classify the parameters of the application server. The application server optimization algorithm based on attribute reduction, can remove parameters which are less important for the target decision function, and obtain the parameters of relative importance, so as to achieve the target focus adjustment, rapidly improve the performance of the system. Based on classical rough set theory, the existing reduction model optimization algorithm is constructed on the basis of equivalence relation, which is easy to cause a lot of damage and loss of information. This article through the expansion of equivalence relation to general two elements, using the generalized rough set theory to improve the application server optimization algorithm of modularization and attribute reduction model based on discernibility function are defined by the reduction of condition attributes, combined with the dependence of the calculation, obtain the final target parameters.

server optimization; parameter module; two element relation; attribute reduction

2016-12-27;

2016-12-30。

李佳澤(1986-),女,遼寧人,碩士研究生,工程師,主要從事應用數學,軟件開發系統測評等方向的研究。

1671-4598(2017)05-0255-03DOI:10.16526/j.cnki.11-4762/tp

TP

A

猜你喜歡
約簡粗糙集決策
粗糙集與包絡分析下艦船運行數據聚類算法
為可持續決策提供依據
基于Pawlak粗糙集模型的集合運算關系
基于0-1規劃的最小屬性約簡算法
面向特定類的三支概率屬性約簡算法
多粒度猶豫模糊粗糙集*
直覺模糊序決策系統的部分一致約簡*
決策大數據
決策大數據
諸葛亮隆中決策
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合