?

基于K-means算法的鐵路運輸設備單元劃分方法

2018-06-29 01:22王華偉史天運閆永利
交通運輸系統工程與信息 2018年3期
關鍵詞:運輸設備聚類鐵路

王華偉,史天運*,閆永利

(1.中國鐵道科學研究院電子計算技術研究所,北京100083;2.中國鐵路總公司工電部,北京100844)

0 引 言

鐵路運輸設備是鐵路運輸生產的基礎,是鐵路運輸安全有序的可靠保證,鐵路機務、車輛、供電、工務、電務各專業分別建設了設備管理相關系統,已部分實現運輸設備的專業化管理.然而對于運輸設備的統一管理和綜合評價還存在很大困難.管理單元是鐵路運輸設備監控、維修、管理及分析決策的基礎對象和基本單位,因此運輸設備單元劃分合理與否,不僅會影響設備管理及決策分析的準確性,而且會影響設備的檢修和維護工作效率.

因此,需要結合運輸設備特點和管理需要,將鐵路運輸設備分成顆粒適度、便于管理、易于數據化的設備單元,從而實現運輸設備的統一化、標準化管理,為設備管理及狀態綜合評價提供支撐.

單元化管理思想是來源于精益化管理,是成組技術理論的一個成功應用.王祖錦等[1]把單元化管理思想運用到物流管理行業,為精益物流管理提供了堅實的管理基礎;邵敏華等[2]開展了公路管理單元動態劃分技術研究;何洋等[3]開展鐵路工務維修管理單元劃分方法研究,為鐵路運輸設備單元化管理提供了成功的借鑒.然而,目前對于鐵路運輸設備統一的單元劃分方法尚無相關研究,因此開展鐵路運輸設備單元劃分方法研究,對于運輸設備綜合管理具有一定的創新性,具有非常重要的意義.

本文在分析鐵路運輸設備構成的基礎上,總結提出鐵路運輸設備單元劃分原則,基于K-means聚類算法開展鐵路運輸設備單元劃分方法研究,并經過實踐驗證方法的科學性和合理行.

1 鐵路運輸設備構成

鐵路運輸設備構成按其應用特點可分為固定設備設施、移動設備、安全監測設備等幾大類[4].具體分類如表1所示.

表1 鐵路運輸設備構成Table 1 Railway transportation equipment constituent

2 運輸設備單元劃分原則

充分考慮鐵路各專業運輸設備管理需求,鐵路運輸設備單元劃分要遵循以下6個原則.

(1)單元劃分的唯一性和獨立性.

每個單元的劃分明確區別于其他單元.保證運輸設備單元劃分的唯一性是管理單元的基礎工作,每個獨立的單元標識將是管理單元的“身份證”,直接影響到后續管理單元的管理及技術狀態數據的標準化.應同時符合兩方面的要求:一方面,應在運輸設備綜合管理系統中能準確、迅速地確定其單元身份;另一方面,符合用戶管理習慣,并能在現場應用中準確定位.

(2)單元劃分的完整性和簡化性.

按照運輸設備技術狀態管理全壽命周期綜合管理及狀態評價的需要,各相關專業運輸設備及組件都要包含在單元劃分范圍內,避免漏項,力求所有單元劃分的完整性.同時,通過評價單元的劃分,能夠使運輸設備管理及評價工作簡化便捷,方便運用管理.

(3)生產組織及后期維護的便捷性.

鐵路運輸設備技術狀態管理是一個復雜的系統化工程,涉及到設備從投產應用到報廢全壽命周期的監測、檢修、維護等諸多環節,設備管理單元的劃分必須能夠有效定位到相關設備,反映出問題所在,并能夠把設備單元存在的問題與后期的維修養護進行管理.所以說,設備單元的劃分不僅僅要考慮提高管理和分析的效率,而且要考慮到后期生產組織及后期維護的便捷性.

(4)技術狀態數據采集單元與理論分析模型的統一性.

運輸設備技術狀態管理實質上就是采集運輸設備單元全壽命周期內的履歷數據、檢測監控數據、檢修維護數據等動靜態單元數據,構建設備狀態分析評價模型,對設備性能、健康狀態等進行分析評價.因此,為保證理論分析的連貫性、科學性與一致性,對于設備技術狀態的管理單元的劃分,要與理論分析模型保持一致,保證技術狀態數據采集單元與理論分析模型的統一性.

(5)單元劃分粒度的適應性.

指運輸設備單元劃分粒度要適應各專業不同的運輸設備管理需要及分析需求,分析哪些技術狀態屬性成為單元劃分的依據,應視系統目標的側重點找出影響系統決策分析的主要屬性,對于不同性質的單元,提供靈活的、適宜的、粒度不同的單元劃分標準.

(6)與生產布局和管理決策的一致性.

管理單元的劃分要考慮數據分析后的利用價值,將為運輸設備施工維修作業提供合理的方法和建議,優化檢修作業流程,提高檢修作業效率.因此,運輸設備管理單元的劃分要充分考慮生產布局及管理決策的需要,保持與生產力布局和管理決策的統一性,全面提升運輸設備的管理及智能維修水平.

3 基于K-means的運輸設備單元劃分方法

3.1 K-means聚類算法理論

K-means算法是經典的劃分聚類方法之一,算法效率較高,在大規格數據聚類時得到較為廣泛的應用.K-means算法的基本原理是:首先設定k為參數,確定需要將含有n個對象的數據集劃分成k個類,隨機地選取k個對象作為初始聚類中心;然后,對于剩余的每個對象,根據距離公式計算該對象到每一個初始聚類中心的距離,將計算好的數據對象劃分到最近的類中;最后重新計算每個類中心,不斷重復這個過程,直到準則函數收斂[5-6].K-means通常采用平方誤差準則函數進行收斂,其定義為

式中:E是數據集中所有對象的平方誤差的總和;p是數據集中的點;mi是類Ci的平均值.

K-means聚類算法流程如圖1所示.

圖1 聚類分析算法流程圖Fig.1 Flow chart of cluster analysis algorithm

3.2 運輸設備單元劃分指標

鐵路運輸設備單元劃分的目的就是將各類運輸設備設施分成便于監控管理、易于維護和量化分析的設備設施單元,滿足設備監測、檢修、維護、管理分析的需要.因而對于運輸設備單元的劃分要綜合考慮設備日常監測、檢修維護和管理分析過程中的重點因素,選擇構建完整、科學、客觀的設備單元劃分指標,本文選擇的鐵路運輸設備單元劃分指標如表2所示.

表2 鐵路運輸設備單元劃分指標Table 2 Railway transportation equipment unit division index

3.3 運輸設備單元劃分模型

基于K-means聚類算法的運輸設備單元劃分模型具體實現如圖2所示.

圖2 基于K-means聚類算法的運輸設備單元劃分模型Fig.2 Unit division model of railway transportation equipment based on K-means clustering algorithm

4 運輸設備單元劃分實例

4.1 實驗步驟

按照運輸設備單元劃分原則,結合設備技術狀態屬性信息,現以電務通信設備為例對設備單元劃分算法原理及實現流程進行說明[7-8],基于K-means的通信專業運輸設備單元劃分步驟如下.

Step 1設所有要納入大數據平臺管理的通信設備設施及相關設備組件類別集合為S,S1,S2,…,Sn表示每類通信設備及組件,比如通信機房、通信鐵塔、通信光纜、通信電纜、分插復用設備、交流配電設備等,則有

Step 2準備樣本數據.

①選取通信設備或組件的m個特征指標,若用P1,P2,P3,…,Pm表示,則

②根據管理需求及專家經驗,按照表2選取特征指標,P1,P2,P3,…,P8,分別代表日常監測信息來源、日常檢查周期、中修周期、大修周期、報廢周期、設備所屬類別、安裝位置、設備基礎信息來源等,從不同通信設備類別中按該類別設備所占總設備數量的比重選取48類通信設備單元劃分樣本建立矩陣S,如表3所示.

表3 鐵路通信設備單元劃分樣本Table 3 Railway communication equipment unit division sample

③由于通信設備單元劃分屬性參數中既有定性指標,又有定量指標,且各指標數值的量綱不一致,因此特將樣本矩陣數據做統一的歸一化處理[9],如表4所示.

表4 鐵路通信設備單元劃分歸一化樣本Table 4 Railway communication equipment unit division sample normalization

Step 3根據聚類需要,初始化聚類中相關參數,所選參數在計算迭代過程中可以調整優化.

①確定數據集S需要劃分的聚類個數k;

②設定迭代次數為X,令X=1;

③在數據集S中,隨機選取k個數據對象,將這k個數據對象設定為初始聚類中心,即有C1(X),C2(X),C3(X),…,Ck(X)等k個初始聚類中心點;

④設定與聚類中心的距離參數ξ;

⑤選定數據樣本點與聚類中心的距離計算公式,利用歐幾里得距離公式式(4)進行計算.

式中:i=1,2,…,n;j=1,2,…,k.

Step 4利用式(4)分別計算樣本點與聚類中心的距離,確定樣本數據點歸屬的類.如果滿足,那么

式中:C(z)表示以Cz(X)為中心點的聚類,即數據點Si歸屬于C(z)類.

Step 5若計算完成后,某分類C(z)中的樣本數為零,則k=k-1,去掉該分類.

Step 6令X=X+1,計算新的k個聚類中心點.

式中:Nj為C(j)類中的樣本個數.

Step 7計算平方誤差準則函數E的值為

Step 8判斷是否滿足條件|E(I)-E(I-1) |<ξ,若滿足,則算法結束;否則,返回Step4,繼續執行迭代,直至結束.

4.2 實驗結果

利用Matlab的聚類函數按上述步驟對通信設備樣本進行聚類劃分,設D為各類數據點到其對應的聚類中心的距離平方和,利用D值作為聚類親和程度的衡量指標.隨著聚類數量k的變化,對應的D值變化結果如圖3所示.結果表明,當參數k=4時,D的變化趨于緩和,不再出現大幅的波動,因此最終聚類合適的分類個數為4,如果數量過少,劃分各類中單元關系不緊密,如果數量過多,資源分類過細,造成管理的繁瑣與不便.因此我們將最終的單元劃分數目k值設定為4.當k=4時,通信設備單元劃分結果如表5所示.

圖3 D-k關系對應曲線Fig.3 D-krelation curve

表5 鐵路通信設備單元一級聚類結果Table 5 Railway communication equipment unit first level clustering result

4.3 實驗結論

由表5實驗結果可以看出,基于K-means聚類的運輸設備單元劃分與傳統的按設備類別分類方式存在不同程度的差異:比如通信機房,按照傳統的設備分類方式,應與通信接入點、通信鐵塔、通信桿柱等歸為一類,同屬于通信基礎設施;而利用本文提出的單元劃分方法,通信機房則與電源等動力設備等歸為一類,原因是電源設備幾乎都安裝在通信機房內,且通信機房與電源等技術狀態參數都由動環監測系統進行動態監測,技術狀態分析和管理有著密切的關聯關系,相比之下,通信機房與其他基礎設施在狀態監測與分析評價方面基本沒有太多關聯關系.再如電源設備,在傳統的設備分類中,其與其他通信設備屬于同一類,而本文提出的方法則將電源設備與其他通信設備分開,原因是電源設備無論從狀態監測、檢修維護還是管理分析,本質上跟其他普通通信設備存在差異.

由此可見,本文提出的基于K-means聚類的運輸設備單元劃分比傳統的按設備類別分類,更符合設備技術狀態管理和分析的需求,其與傳統方式設備分類方式的具體對比如表6所示.

表6 本方法與傳統的人工設備劃分方法對比Table 6 The comparison between the proposed method and the traditional manual division method

總之,本文提出的基于K-means聚類的運輸設備單元劃分結合了設備日常監測、檢修維護和管理分析等各類因素,與傳統的單純根據設備類別進行的設備分類方式相比較有明顯的優勢,具有很好的實用價值,更適合于運輸設備生產組織、設備維護技術及狀態分析和管理.

5 結論

本文對鐵路運輸設備構成進行了分析,明確了運輸設備管理及單元劃分的范圍,總結分析了運輸設備單元劃分原則,研究提出基于K-means聚類的鐵路運輸設備單元劃分方法,并選取電務通信專業運輸設備的樣本數據進行了方法驗證,實驗效果良好.今后,要考慮到專業管理的差異性,利用該方法更好地實現對其他專業設備管理單元的劃分.

[1]王祖錦.物流單元化管理及專業單元化器具系列連載之一物流單元化管理的基本思想[J].物流技術與應用,2006,11(4):96-98.[WANG Z J.Logistics management on unit load system(Ⅰ)the basic concept of logistics management on unit load system[J].Logistics&Material Handling,2006,11(4):96-98.]

[2]邵敏華,孫立軍.公路管理單元動態劃分技術與數據模型研究[J].同濟大學學報(自然科學版),2004,32(3):343-347.[SHAO M H,SUN L J.Research on segmentation technique and data modeling in highway management system[J].Journal of Tongji University,2004,32(3):343-347.]

[3]何洋,劉明亮,陳容淮,等.鐵路工務維修管理單元劃分方法研究[J].鐵道標準設計,2016,60(11):14-18.[HE Y,LIU M L,CHEN R H,et al.Research on railway maintenance managementunitdivision method[J].Railway Standard Design,2016,60(11):14-18.]

[4]吳芳.鐵路運輸設備[M].北京:中國鐵道出版社,2007.[WU F.Railway transportation equipment[M].Beijing:China Railway Press,2007.]

[5]楊陽.數據挖掘K-means聚類算法的研究[D].長沙:湖南師范大學,2015.[YANG Y.Research on K-means clustering algorithm in data mining[D].Changsha:Hunan Normal University,2015.]

[6]HONG Y,KWONG S.Learning assignment order of instancesforthe constrained K-meansclustering algorithm[J].IEEE Transactions on Systems Man&Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man&Cybernetics Society,2009,39(2):568-574.

[7]關云鴻.改進K-均值聚類算法在電信客戶分類中的應用[J].計算機仿真,2011,28(8):138-140.[GUAN Y H.Application of improved K-means algorithm in telecom customer segmentation[J]. Computer Simulation,2011,28(8):138-140.]

[8]趙莉,候興哲,胡君,等.基于改進K-means算法的海量智能用電數據分析[J].電網技術,2014,38(10):2715-2720.[ZHAO L,HOU X Z,HU J,et al.Improved K-means algorithm based analysis on massive data of intelligent power utilization[J]. Power System Technology,2014,38(10):2715-2720.]

[9]趙興浩,鄧兵,陶然.分數階傅里葉變換數值計算中的量綱歸一化[J].北京理工大學學報,2005,25(4):360-364.[ZHAO X H,DENG B,TAO R.Dimensional normalization in the digital computation of the fractional fourier transform[J].Transactions of Beijing Institute of Technology,2005,25(4):360-364.]

猜你喜歡
運輸設備聚類鐵路
基于傳感器感知信息的物流運輸設備故障自動識別
單驅動新型燃料水下運輸設備設計與分析
沿著中老鐵路一路向南
金礦提升運輸設備機電控制的關鍵技術探析
運輸設備制造業排污許可管理問題分析
基于K-means聚類的車-地無線通信場強研究
鐵路通信線路維護體制改革探索與實踐
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺的K-means聚類算法改進及并行化實現
無人機在鐵路工程建設中的應用與思考
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合